JP2010015518A - ストレージシステム - Google Patents

ストレージシステム Download PDF

Info

Publication number
JP2010015518A
JP2010015518A JP2008177423A JP2008177423A JP2010015518A JP 2010015518 A JP2010015518 A JP 2010015518A JP 2008177423 A JP2008177423 A JP 2008177423A JP 2008177423 A JP2008177423 A JP 2008177423A JP 2010015518 A JP2010015518 A JP 2010015518A
Authority
JP
Japan
Prior art keywords
storage
data
mode
file server
power saving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008177423A
Other languages
English (en)
Inventor
Masataka Innami
雅隆 印南
Shigeo Honma
繁雄 本間
Akinobu Shimada
朗伸 島田
Hideo Tabuchi
英夫 田渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008177423A priority Critical patent/JP2010015518A/ja
Priority to US12/236,529 priority patent/US8132033B2/en
Priority to EP09150944A priority patent/EP2144153A3/en
Priority to CN2009100028237A priority patent/CN101625626B/zh
Publication of JP2010015518A publication Critical patent/JP2010015518A/ja
Priority to US13/411,663 priority patent/US8375235B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0643Management of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3268Power saving in hard disk drive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0625Power saving in storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0634Configuration or reconfiguration of storage systems by changing the state or mode of one or more devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • G06F3/0649Lifecycle management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

【課題】記憶デバイスを省電力化する機能を備えたストレージシステムであっても、記憶デバイスに対するサーバからのアクセスに対する応答性が低下しないストレージシステム及びその制御方法を提供する。
【解決手段】計算機とネットワークを介して接続するファイルサーバとストレージ装置とを含み、ファイルサーバは第1のコントローラを含み、ストレージ装置は、複数の記憶領域を構成する複数の記憶デバイスと、複数の記憶領域へのアクセスを制御する第2のコントローラと、を含み、複数の記憶領域はそれぞれ、省電力モードからレディモードへの移行時間が異なる複数の省電力モードを備え、第1のコントローラは、計算機からデータを受信するとデータに計算機からのアクセスへの応答性能に関する指標を設定し、データの指標を参照して指標を満たす省電力モードを備える第1の記憶領域を選択し、第2のコントローラは第1の記憶領域にデータを格納する。
【選択図】図1

Description

本発明はストレージシステムに係わり、特に、記憶デバイスに対する省電力化機能を備えたストレージシステム及びその制御方法に関するものである。
従来から、ストレージシステムとして、サーバと、複数のハードディスクドライブ(以下:HDD)をアレイ状に配置し、サーバに対して記憶領域を提供するディスクアレイサブシステムと、を備えたものが知られている。
サーバがディスクアレイサブシステムを利用する用途には複数あり、その1つとして、サーバがアーカイブの用途でディスクアレイサブシステムを利用する形態がある。ところで、ディスクアレイサブシステムにおいて、アクセス頻度が少ないHDDを常時オンしておくと、省電力の観点から好ましくない。そこで、MAID(Massive Array of Inactive Disks)と称される省電力技術がストレージシステムに適用されている。アクセスには、リード要求、ライト要求などが含まれる。
MAIDとは、ディスクアレイの中で、データアクセスが発生していないHDDのディスクの回転、またはHDDの電源を遮断することによって、消費電力を削減するという技術である。MAIDを採用したディスクアレイは、データアクセスに必要なHDDだけが稼働するように制御されるため、消費電力を削減することができる。
一方、MAID機能を用いた省電力モードには、HDDが複数個設置されている筐体への電源供給を遮断するモード、HDDへの電源供給を遮断するモード、HDDのディスクの回転を停止させるモードなど、省電力機能の程度によっていくつかのモードがあることが知られている。そして、省電力機能の程度が階層化された複数の論理ユニットを備え、論理ユニットに対するアクセス要求の頻度に応じて、格納されたデータを、他の省電力モードを適用する論理ユニットに移動するディスクアレイシステムが知られている(特開2008−90352号)。
特開2008−90352号公報
従来のディスクアレイサブシステムは、サーバから書き込まれるアーカイブ用データが、サーバから高いアクセス性能を求められるオンラインデータであるか、サーバから比較的低いアクセス性能を求められるオフラインデータであるか、サーバからオンラインデータとオフラインデータとの間のアクセス性能を求められるニアラインデータであるか、をデータ格納前に判断できないため、適切な省電力機能を持ったHDDにデータを格納することができなかった。
したがって、従来のディスアレイサブシステムは、例えば、オンラインデータを、省電力効果は高いが応答までの時間がかかる省電力モードである、HDDへの電源供給を遮断するモードを適用したHDDに格納してしまう可能性がある。そして、サーバからオンラインデータへのアクセス要求が発生した時、オンラインデータへのアクセスに対する応答性が低下し、サーバからのアクセスがタイムアウトになってしまうおそれがあった。
そこで、本発明は、記憶デバイスを省電力化する機能を備えたストレージシステムであっても、記憶デバイスに対する、サーバからのアクセスに対する応答性が低下しない、ストレージシステム及びその制御方法を提供することを目的とするものである。
本発明にかかるストレージシステムはこの目的を達成するために、計算機とネットワークを介して接続するファイルサーバと、前記ファイルサーバとネットワークを介して接続するストレージ装置とを含み、前記ファイルサーバは、第1のコントローラを含み、前記ストレージ装置は、複数の記憶領域を構成する複数の記憶デバイスと、前記複数の記憶領域へのアクセスを制御する第2のコントローラと、を含み、前記複数の記憶領域はそれぞれ、省電力モードからレディモードへの移行時間が異なる複数の省電力モードのうち、少なくとも1つの省電力モードを備え、前記第1のコントローラは、前記計算機からデータを受信すると、前記データに、前記計算機からのアクセスへの応答性能に関する指標を設定し、前記データの前記指標を参照して、前記指標を満たす省電力モードを備える第1の記憶領域を選択し、前記第2のコントローラは、前記第1の記憶領域に、前記データを格納する、ストレージシステムであることを特徴とする。
さらに本発明に係わるストレージシステムの制御方法は、計算機とネットワークを介して接続するファイルサーバと、前記ファイルサーバとネットワークを介して接続し、複数の記憶領域を構成する複数の記憶デバイスを備え、前記複数の記憶領域へのアクセスを制御するストレージ装置と、を含む、ストレージシステムの制御方法であって、前記ストレージ装置が、前記複数の記憶領域に、それぞれ、省電力モードからレディモードへの移行時間が異なる複数の省電力モードのうち、少なくとも1つの省電力モードを設定し、前記ファイルサーバが、前記計算機から受信したデータに、前記計算機からのアクセスへの応答性能に関する指標を設定し、前記ファイルサーバが、前記データの前記指標を参照して、前記指標を満たす省電力モードを備える第1の記憶領域を選択し、前記ストレージ装置は、前記第1の記憶領域に、前記データを格納する、ことを特徴とするものである。
本発明によれば、記憶デバイスを省電力化する機能を備えたストレージシステムであっても、記憶デバイスに対する、サーバからのアクセスに対する応答性が低下しない、ストレージシステム及びその制御方法を提供することができる。
次に本発明の実施形態について説明する。図1は、本発明に係るストレージシステムの一例を備えた記憶制御システムのブロック図である。記憶制御システムは、ストレージ装置に対して上位として位置づけられる業務サーバ10と、ファイルサーバ16とストレージ装置30とからなるストレージシステムと、を備えている。なお、ファイルサーバ16とストレージ装置30とは同一の筐体内に設置されていてもよい。
業務サーバ10は、CPUやメモリ等の情報処理資源を備えたコンピュータ装置である。業務サーバは、キーボードスイッチやポインティングデバイス、マイクロフォン等の情報入力装置と、モニタやスピーカー等の情報出力装置と、を備えている。
さらに、業務サーバ10は、ファイルサーバ16のファイルシステムによる記憶構造を認識して、ファイルシステムに対してデータのライト及びリードを実行する。業務サーバ10は、例えば、アーカイブ用ソフトウェアを備えることにより、クライアントにアーカイブソリューションを提供する。業務サーバ10は、アーカイブソフトウエア以外の業務アプリケーションを管理クライアントに提供するものでもよい。
ネットワーク12は、複数の業務サーバそれぞれのLANインターフェース制御部のポート14に接続している。また、ファイルサーバ16のLANインターフェースのポート18がネットワーク12に接続している。業務サーバ10は、ネットワーク12を介してファイルサーバ16に接続する。
ファイルサーバ16は、既述のポート18に加えて、マイクロプロセッサ24、キャッシュメモリ21、ローカルメモリ22を備えている。これらの各機器は、接続部20を介して互いに接続されている。キャッシュメモリ21は、業務サーバ10から送られたデータを一時的に保存するメモリである。ローカルメモリ22は、ファイルサーバ16の各種制御機能を実現するプログラムや管理情報を格納する。
図2はファイルサーバ16の各種機能を達成するプログラムの一例である。これらのプログラムは、ローカルメモリ22に格納される。そして、マイクロプロセッサ24は、これプログラムを実行して、ファイルサーバの各機能を実現する。ゲートウエイ(Gateway)は、業務サーバ10との通信に必要な通信プロトコルをマイクロプロセッサ24に提供する。ファイルシステム(File System)は、業務サーバ10からのファイルアクセスを認識して、業務サーバ10からのデータのアクセス先となる記憶領域を決定する。
リクエストマネージャ(Request Manage)は、業務サーバ10からのアクセスを処理し、さらに、メタデータの作成や更新などの処理を実施する。ストレージマネージャ(Storage Manager)はストレージ装置30に対するリード・ライトのための処理を実施する。メタデータマネージャ(Metadata Manager)は、メタデータに対するリード・ライトのための処理を実施する。
ファイルサーバ16はさらに、ファイバーチャネルインターフェース制御部のポート26を備え、ポート26は、ネットワーク28に接続している。ネットワーク28はSANによって構成されている。ファイルサーバ16は、ファイバチャネルプロトコルに従って、HDDが持つ記憶領域の管理単位であるブロックを基準としてデータの入出力をストレージ装置に対して要求する。
ストレージ装置30は、記憶デバイスとして、HDDを備える。そして、複数のHDDを備えた、ディスクアレイサブシステムとして構成される。但し、これに限らず、記憶デバイスの一部を、フラッシュメモリなどの半導体メモリから構成することもできる。
ストレージ装置30は、記憶デバイスとして複数のHDD54A−54Dと、HDDに対するデータの入出力を制御するディスクアダプタ(DKA)40を複数有している。DKAは、HDDが接続されるポート42を有している。ポート40とHDDとの間は、ファイバーチャネルのFC−ALやファブリック、またはSASなどによって接続されている。
ストレージ装置30は、ファイルサーバ16に対するインターフェース制御部となる、複数のチャネルアダプタ(CHA)32を備えている。CHAはポート34を有しており、このポート34がネットワーク28に接続されることにより、ストレージ装置30がファイルサーバ16に接続する。
CHA32とDKA40とは接続部(接続回路)36を介して接続されている。さらに、接続部36には、共有メモリ(SM)38とキャッシュメモリ(CM)34が接続されている。CHA32は、マイクロプロセッサ(MP)と、MPがファイルサーバ16から送られてくるコマンドを処理するためのマイクロプログラムが格納されたローカルメモリ(LM)と、を備えている。DKA40は、MPと、MPが複数のHDDを制御するためのマイクロプログラムを実行するためのLMを備えている。
複数あるCHA32および複数あるDKA40との間で、連携した処理を行うために、それぞれが共有すべき制御情報は共有メモリ38に存在する。CHA32は、ファイルサーバ16からデータの読出しあるいは書き込みコマンドを受信すると、コマンドを共有メモリ38に記憶する。DKA40は、共有メモリ38を随時参照しており、未処理の読み出しコマンドを発見すると、HDDからデータを読み出して、キャッシュメモリ34に記憶させる。
CHA32は、キャッシュメモリ34に移されたデータを読み出し、コマンド発行元のファイルサーバ16に送信する。CHA32が、ファイルサーバからデータの書込み要求を受信すると、書込みコマンドを共有メモリ38に記憶させると共に、受信データをキャッシュメモリ34に記憶させる。DKA40は、共有メモリ38に記憶されたコマンドに従って、キャッシュメモリ34に記憶されたデータをHDDに記憶する。
DKA40は、HDDとの間でデータ入出力を行う際、ファイルサーバからのコマンドに付帯した論理的なアドレスを、HDDの物理的なアドレスへ変換する。各DKAは、HDDのRAID構成に応じたデータアクセスを行う。
各DKAは、HDDの省電力モードを含む各種のモードを随時監視しており、この監視結果は接続部36につながれたLANインターフェース48を介してSVP(サービスプロセッサ)50に送信される。SVP50は、ストレージ装置の管理及び監視を行うコンピュータ装置(管理装置)である。SVPは、接続部36を介して各CHA32及びDKA40等から各種の環境情報や性能情報等を収集する。
共有メモリ38には、ワーク領域が設定されるほか、以下に説明する第1の管理テーブル(図3)、第2の管理テーブル(図4)も格納される。
接続部36は、例えば、高速スイッチング動作によってデータ伝送を行う超高速クロスバスイッチ等のような高速バスとして構成することができる。
ストレージ装置30は、ディスク駆動装置54A−54Dへの電源の供給を制御する電源回路(PDB:Power Distribution Block)52に接続された制御信号44に接続する制御用インターフェースポート46を備えている。電源制御回路52は、複数あるディスク駆動装置54A−54Dそれぞれへの電源をオン・オフするスイッチ51A−51Dを備えている。
各スイッチ51A−51Dは1つのディスク駆動装置54A−54Dと接続されており、各ディスク駆動装置は、複数のHDD60A−60N(62A−62N, 64A−64N,66A−66N)を備えている。電源制御回路52のスイッチが開放されると、このスイッチに接続されたディスク駆動装置に属する全てのHDDへの電源供給が遮断されるため、HDDの電源がオフされる(ディスク駆動装置オフモード)。電源制御回路のスイッチが閉じられている状態では、このスイッチの接続するディスク駆動装置に含まれる複数のHDDに電源を供給することができるため、DKA40によって、各省電力モードに制御される。省電力モードとは、HDDの電源がオフされているモード(HDDオフモード)、HDDのディスクの回転が停止しているモード(スピンダウンモード)、HDDのディスクの回転が低回転速度のモード(低回転数モード)、HDDのヘッドがディスク上から待避しているモード(ヘッドアンロードモード)などがある。電源制御回路のスイッチの制御は、CHAのMP、又はDKAのMPによって行われる。
図1において、HDDの“Active”とは、HDDがオンで高回転速度であるモードであり、ライトコマンドに対して直ちにデータを書き込むことができ、或いはリードコマンドに対して直ちにデータを出力できる、レディモードにあることを示している。“Inactive”とはHDDオフモード、スピンダウンモード、低回転数モード、ヘッドアンロードモード、ディスク駆動装置オフモードなど、HDDが省電力モードにあることを示している。
ストレージ装置のDKA40は、HDDをレディモードから省電力モードにするための電源制御プログラムを、DKA40のローカルメモリに備える。そして、DKAのMPがこのプログラムを実行する。さらに、CHA32及びDKA40は、HDDに対するリード又はライト処理のためのマネージャプログラムを実行する。
HDDが省電力モードであると、ライトコマンドやリードコマンドに応答するために、ストレージ装置は一旦HDDをレディモードに移行しなければならず、ライトコマンド及びリードコマンドに対するHDDの応答性が低下し、タイムアウトになる可能性がある。
そこで、図1に示す業務サーバ10からファイルサーバ30に書込み要求が送信されたデータに、業務サーバ又はファイルサーバは、業務サーバ10からアクセス応答性能の指標としての、許容されるタイムアウト値(Time Out Value)に準拠した指標(以下、この指標をTOV指標、という。)を設定する。一方、少なくとも1つのHDDにより構成される論理ユニットを、この指標に基づいて分類する。例えば、省電力機能としてHDDオフモードを備えているLUは、アクセス性能に関する指標として、比較的長いTOV値として「オフライン」に分類される。そして、ファイルサーバ16は、このデータのTOV指標と、論理ユニットのTOV指標とを比較し、データの指標に合致する論理ユニットのHDDに該データを格納する。
ストレージ装置又はファイルサーバは、各ライトアクセス又はリードアクセスへの応答に対する許容時間としてTOV値を設定しており、TOV値を過ぎてもHDDから応答が無い場合には、ライトエラー又はリードエラーと判定する。
上位装置からアクセスに対して高いアクセス応答性能を求められず、アクセスに対する応答において比較的大きいTOV値(数分程度)が許容されるデータを「オフラインデータ」という。オフラインデータを格納するための記憶デバイスには、省電力モードとして、省電力モードからレディモードへ移行するまでに数分の時間を要する、ディスク駆動装置オフモード、HDDオフモードなどを設定する。これらの記憶デバイスは、TOV指標として、「オフライン」を有する。本実施例では、HDDオフモードを設定する。
一方、上位装置からのアクセスに対して高いアクセス応答性能を求められ、アクセスに対する応答において許容されるTOV値が小さい(数秒程度)データを、「オンラインデータ」という。オンラインデータを格納するための記憶デバイスには、常時レディモードを設定したり、省電力モードの中でも数秒程度の短時間でレディモードに移行できる、ヘッドアンロードモード、低回転モードを設定する。本実施例では、常時レディモードを設定する。これらの記憶デバイスは、TOV指標として、「オンライン」を有する。
また、ストレージ装置は、求められるアクセス応答性能がオンラインデータとオフラインデータとの中間(数十秒程度)のデータであり、「ニアラインデータ」という。ニアラインデータを格納する記憶デバイスには、省電力モードとして、省電力モードからレディモードに変更するのに数十秒の時間を要する、スピンダウンモードを設定する。これらの記憶デバイスは、TOV指標として、「ニアライン」を有する。
なお、オンラインデータ、ニアラインデータ、オフラインデータを格納するための記憶デバイスが備える動作モードは、これに限定されるものではなく、適宜TOV値と、省電力モードからレディモードに移行する時間との関係で適宜変更することができる。
図3は、ディスク駆動装置、HDD、LUの対応関係と、ディスク駆動装置の電源状態、HDDの現在の動作モードと、HDDのサポートする省電力モードとを示す第1の管理テーブルである。図4は、LUの現在の動作モードと、各LUのアクセス応答の性能を示すTOV指標と、各LUがサポートする省電力モードとを示す、第2の管理テーブルである。以下、図面をもとに説明する。
図3において、“ディスク駆動装置#”とは、図1のディスク駆動装置54A−54Dの各々を識別する記号であり、“ディスク駆動装置動作モード”とは、ディスク駆動装置への電源供給がされている(オン)又は電源供給が遮断されている(オフ)モードであり、“HDD♯”とは各ディスク駆動装置に属するHDDの識別番号であり、“HDD動作モード”とは各HDDの現在の動作モード(レディモード又は各省電力モード)を示すものであり、“LU♯”とは論理ユニット(LU)の識別記号であり、“HDDに対する電源制御指定可能モード”とは、各HDDが省電力機能のうち、どの省電力化機能をサポートしているかを示す情報である。“常時ON”とは、HDDの電源が常時オンするモードをサポートしているか否か、“低回転”とは低回転数モードをサポートしているか否か、“スピンダウン”とはスピンダウンモードをサポートしているか否か、“OFF”とはHDDオフモードをサポートしているか否かを示している。
“HDDに対する電源制御指定可能モード”において、“○”はHDDが、各省電力機能をサポートしていることを示し、“×”はHDDが各省電力機能をサポートしていないことを示している。
また、各LUをどのHDDにより構成するかは、SVPから管理クライアントが指定するようにしてもよいし、ストレージ装置がHDDの情報を基に指定してもよい。この時、同一の省電力モードをサポートしている、複数のHDDによりLU構成するように設定するのが好ましい。ここで、同一の省電力モードを備えているかどうかは、必ずしも省電力モードの全項目が完全に同一である必要はないため、少なくとも1つの同一の省電力モードを備えているかにより判断される。
ここで、SVPの管理クライアントは、複数のディスク駆動装置をそれぞれ区別して認識でき、かつ、複数のHDDをそれぞれ区別して認識することができる。さらに、DKA40は、ディスク駆動装置及びHDDからのステイタス情報に基づいて、ディスク駆動装置の動作モードと、HDDの省電力モードを認識することができる。
一方、図4の“LU#”は、LUの識別記号であり、“LU動作モード”は、LUを構成するHDDが、レディモードであるか、いずれかの省電力モードであるか、を示している。通常、LUを構成する複数のHDDは同一の動作モードである。例えばディスクスピンダウンのモードであるLU1を構成するHDDは、図3においてすべてスピンダウンのモードである。“TOV指標”は、省電力モード時に業務サーバよりアクセスコマンドを受領した場合の、アクセス応答性能に関する指標である。“LUに対する電源制御指定可能モード”は、LU#がサポートする省電力化機能の項目である。したがって、LU♯を構成する複数のHDDがサポートしている省電力機能により決定される。各項目の意味は図3と同じである。なお、“ディスク駆動装置OFF”とは、LUに属するディスク駆動装置がディスク駆動装置オフモードをサポートしているか否かを意味する。
ファイルサーバ16が、第2の管理テーブルの“TOV指標”は、LUを構成する複数のHDDの省電力モードの設定により決定される。すなわち、本実施例においては、TOV指標として「オンライン」を設定しようとする際、LUを構成するHDDは、少なくとも常時レディモードを備えていなければならない。同様に、「ニアライン」を設定しようとする際、LUを構成するHDDは、少なくともスピンダウンモードを備えていなければならない。同様に、「オフライン」を設定しようとする際、LUを構成するHDDは、少なくともHDDオフモードを備えていなければならない。
図5はメタデータの構造を示す。メタデータは、ファイル毎で、かつファイルの作成・更新毎に作成或いは更新される。また、更新の契機はこれに限定されるものではなく、管理クライアントにより適宜更新してもよいし、一定期間たつと自動に構成されるようにしてもよい。メタデータは、作成日時、保存期間、TOV指標、最終アクセス日時から構成される。TOV指標としては、TOV(○○秒、○○分等)そのものであってもよいし、或いは、オンライン、オフライン、又はニアラインであってもよい。
図6は、ファイルサーバ16が、ストレージ装置30にデータを格納する際の動作概要の一例を示すブロック図である。サーバ10がネットワーク12を介してファイルサーバ16にファイルに格納すると(S1)、ファイルシステムは、データ領域(キャッシュメモリ等)21Aにファイル60を記憶する。一方、ファイルシステムは、ファイル情報からメタデータを作成或いは決定して、これをメタデータ領域62に格納する。メタデータ領域は、ローカルメモリ22に格納される。ファイルサーバ16のストレージマネージャは、ファイルのデータをメタデータに含まれるTOV指標に基づいて、この指標に合致する指標をもつストレージ装置30の論理ボリューム(LU)を指定する(S2)。また、管理クライアントは、ファイルの属性を変更することができ、このファイルの属性の変更がTOV指標に関係する場合には、この変更に基づいて、ファイルのデータを、格納されている記憶領域から、変更後のTOV指標に合致する記憶領域に移動する(S4)。
ファイルサーバが、業務サーバよりデータのライトコマンド又はリードコマンドを受信した際に、データを格納するLUを決定する。そして、格納先LUが省電力モードで動作している場合には、ファイルサーバの指示に従い、ストレージ装置が省電力モードにあるHDDをレディモードに移行する。そして、図5の最終アクセス日時を参照し、一定時間経過した後に、ファイルサーバの指示に従い、ストレージ装置がレディモードのHDDを省電力モードに変更する。また、管理クライアントの指示によりレディモードのHDDを省電力モードに変更してもよい。
ファイルサーバの指示は、ストレージ装置にコマンドを発行することにより実現される。ファイルサーバが、ストレージ装置に省電力モードへの移行もしくはレディモードへの移行のコマンドを発行する際、記憶領域をLUだけでなく、LUを構成するHDDまで特定し、コマンドを発行する。
一方、後述する変形例では、ファイルサーバが、図4に示す第2の管理テーブルのみを保持し、参照することによって、記憶領域をLUとして特定し、該LU対してコマンドを発行する。コマンドを受領したストレージ装置は、第1の管理テーブルを用いてLUを構成するHDDを決定する。詳細については後述する。
先ず、図3に示す第1の管理テーブル及び図4に示す第2の管理テーブルをファイルサーバに設定する動作について説明する。図7は、第1の管理テーブル及び第2の管理テーブルを設定する動作を説明するフローチャートである。
ファイルサーバ16のリクエストマネージャが、ファイルサーバの管理装置からストレージ装置のLUディスカバリ要求を受領すると、第1の管理テーブル及び第2の管理テーブルをストレージ装置30に要求する(700)。ストレージ装置のCHA32がこの要求を受領すると(702)、共有メモリ38から第1の管理テーブル及び第2の管理テーブルを読み出し、第1の管理テーブル及び第2の管理テーブルをファイルサーバのリクエストマネージャに送信する(704)。リクエストマネージャは、第1の管理テーブル及び第2の管理テーブルを受領すると(706)、ローカルメモリ22に格納する(708)。
なお、ファイルサーバが、ストレージ装置より、第1の管理テーブル及び第2の管理テーブルの各項目に相当する情報を受領し、ファイルサーバにおいて、第1の管理テーブル及び第2の管理テーブルを作成し、格納してもよい。
HDDの省電力モードのサポート情報は、HDDをストレージ装置に導入する際、或いはHDDを交換、あるいはHDDの増設時にDKAがHDDの製品情報を入手しサポート情報を取得する。なお、管理クライアントがSVPから入力してもよい。
次に、ファイルサーバにおける、データのTOV指標を基にしたファイルシステムの設定方法について説明する。業務サーバ10がファイルサーバのファイルシステムにデータを格納すると、図5に示したメタデータにTOV指標が設定される。本実施例でのファイルシステムは、フォルダのディレクトリ構造であるがこれに限定されるものではない。
図8は、ファイルサーバがファイルシステムにフォルダを作成するフローチャートを示す。先ず、業務サーバ10がファイルサーバ16にフォルダ作成のためのコマンドを発行する(800)と、これを受領したリクエストマネージャ(802)は、フォルダ作成コマンドにTOV指標が含まれているか否かをチェックする(804)。
リクエストマネージャがフォルダ作成コマンドにTOV指標が含まれていると判定すると(804:Yの場合)、第2の管理テーブルを確認して、コマンドに含まれているTOV指標に合致するLUが存在するか否かを判定する(806)。合致するLUが存在しない場合(806:Nの場合)には、業務サーバにエラー表示を行うと共に(808)、業務サーバに再度フォルダの作成を促してもよい。また、ファイルサーバがコマンドに含まれるTOV指標に対応する指標を持つLUを作成するようにしてもよい。一方、合致するLUが存在する場合(806:Yの場合)、対応するLUにフォルダを作成(810)し、フォルダのメタデータを作成する(812)。その後、ファイルサーバのリクエスとマネージャが完了報告を発行し(814)、業務サーバがこれを受領すると処理が終了する(815)。
一方、フォルダ作成要求コマンドにTOV指標が含まれていない場合は(804:Nの場合)、作成しようとするフォルダに対して上位のフォルダがあるか否かを判定する(816)。上位のフォルダが存在する場合(816:Yの場合)には、作成しようとしているフォルダのメタデータに、上位のフォルダのメタデータのTOV指標を設定する(818)。一方、作成しようとするフォルダに上位フォルダが存在しない場合(816:Nの場合)には、作成しようとしているフォルダにデフォルトのTOV指標(例えばオンライン)を設定し(820)、フォルダのメタデータを作成する。
業務サーバの管理クライアントが、ファイルを、管理クライアントが目的とするTOV指標を持ったフォルダに格納すると、ファイルサーバは該フォルダのメタデータに設定されたTOV指標をファイルのメタデータのTOV指標に反映する。フォルダとして、例えば、オンラインデータ用フォルダ、ニアライン用フォルダ、又はオフライン用フォルダなどがある。
次に、ファイルサーバがファイルのデータをストレージ装置に格納する動作、そして、ストレージ装置のHDDを省電力化する動作について説明する。図9は、ファイルサーバ16が、業務サーバ10からファイルを受領し、ストレージ装置にファイルを格納する動作のフローチャートである。ファイルサーバ16のリクエストマネージャが、業務サーバからファイルを受領する(900)と、データをキャッシュメモリ21に格納して(902)、業務サーバからのライトコマンドに対して完了を報告する(904)。
リクエストマネージャは、ファイルが格納された、ファイルシステムのフォルダのメタデータを参照して、TOV指標をファイルのメタデータに設定し(906)、このメタデータをメタデータフォルダに保存する。
次に、リクエストマネージャは、ファイルのメタデータのTOV指標を参照し、このTOV指標に合致する指標を持ったLU♯を第2の管理テーブルから選択する(908)。次いで、当該LU♯の動作モードを参照して、当該LUの動作モードが、データを直ちに格納できるレディモードであるか否かを判定する(910)。レディモードの場合には、ストレージマネージャは、LUを構成するHDDを第1の管理テーブルから決定して、ストレージ装置に対して、データと、データの格納先であるHDDの識別情報を送信する。その後、ストレージ装置のDKAは、HDDに対してデータを格納する(914)。
一方、LUがレディモードでない場合は、ストレージマネージャは、これをレディモードにするためのHDDの電源制御動作(912)に移行する。図10は、電源制御動作のフローチャートである。リクエストマネージャは、第1の管理テーブルより、該LUを構成するHDDと、HDDに含まれるディスク駆動装置とを特定する。
リクエストマネージャは、第1の管理テーブルのディスク駆動装置の動作モードを参照し、動作モードがオンの場合にはディスク駆動装置がレディと判定し、動作モードがオフの場合にはレディでないと判定する(1000)。レディでないと判定する場合、リクエストマネージャは、ディスク駆動装置をレディモードにするコマンドをストレージ装置の電源制御プログラムに要求する(1002)。この要求を受け取ったストレージ装置は、ディスク駆動装置をレディモードにする処理を実行する回数の上限値を超えたか否かを判定するための制御記号(X)に0を設定し(1004,1006)、ディスク駆動装置に接続されるスイッチをオンする指示を電源制御回路52に出力する(1008)。
電源制御プログラムは、ディスク駆動装置の電源がオンされたか否かを判定し(1000)、オンされていない場合には、制御記号(X)をインクリメントし(1006)、次いでインクリメント後の制御記号が最大値Yを以上か否かを判定する(1008)。この判定を否定する場合は、再度ディスク駆動装置の電源をオンする。インクリメント後の制御記号がYを越える場合は、ディスク駆動装置のレディモードにする処理の上限値を超えたため、ファイルサーバに障害通知を行う(1020)。
LUに対応するディスク駆動装置が複数存在する場合(例えば、第1の管理テーブル中のLU1のような場合)は、リクエストマネージャ及び電源管理プログラムは、全てのディスク駆動装置の電源がオンであるかを判定し、電源がオンでない場合には、ディスク駆動装置の電源をオンする動作を行う。
ストレージ装置の電源制御プログラムが、ディスク駆動装置の電源のオン処理が成功したと判定する場合には、電源制御プログラムは、第1の管理テーブルのディスク駆動装置の動作モードをオフからオンに更新し(1012)、完了報告(1014)をリクエストマネージャに送信する。リクエストマネージャは完了報告を受領した後、同様にローカルメモリに格納されている第1の管理テーブル及び第2の管理テーブルを更新する(1022,1024)。
リクエストマネージャが、ディスク駆動装置がレディモードであると判定する場合(1000)、もしくはディスク駆動装置の電源オン処理を完了した場合、LUを構成する全てのHDDについて、アクセス要求への応答が可能なモードであるレディモードであるかを判定する(1026)。この判定を否定した場合には、少なくともレディモードに無いHDDをレディモードに移行する要求(1028)をストレージ装置の電源制御プログラムに送信する。この要求を受領したストレージ装置の電源制御プログラムは(1030)、ディスク駆動装置の電源をオンする動作と同様にして、複数の全てのHDDをレディモードにした後、管理テーブルを更新し、これをリクエストマネージャに送信する(1030−1046)。リクエストマネージャは第1の管理テーブルを更新した後(1048,1050)、図9のデータ格納処理(914)に移行する。
図9と図10のフローチャートによって、ファイルサーバが、業務サーバから受領したデータのTOV指標に応じて、当該指標のアクセス応答性能を満たしつつ、十分な省電力モードを備えるLUにデータを格納することができる。即ち、オンラインデータは、常時レディモードが設定されたLUに格納され、ニアラインデータは、スピンダウンモードが設定されたLUに格納され、オフラインデータは、HDDオフモードが設定されたLUに格納される。
したがって、ファイルサーバは業務サーバから高いアクセス応答性能(小さいTOV指標)を求められるオンラインデータのリード要求があった場合でも、オンラインデータが格納されているLUを構成するHDDは数秒以内にアクセス応答することができ、オンラインデータを素早く業務サーバに送ることができる。一方、ファイルサーバは業務サーバからニアラインデータ或いはオフラインデータのリード要求があっても、比較的長いTOVの範囲内で、これらデータを業務サーバに確実に送ることができる。したがって、TOV値などのデータのアクセス応答性能に応じて、適当な省電力機能を備えたLUにデータを格納することができるため、業務サーバから求められるアクセス性能を満足しつつ、十分な省電力効果を得ることのできる省電力モードを使用し消費電力の削減を図ることができる。
次に、図11は、ストレージ装置のHDDをレディモードから省電力モードにするためのフローチャートである。ファイルサーバのリクエストマネージャは、このフローチャートを所定の時間間隔で繰り返し実行する。リクエストマネージャはメタデータフォルダを走査して、ファイルへの最終アクセス時間が所定時間を越えるメタデータがあるか否かをチェックする(1100)。
ファイルへの最終アクセス時間から所定時間を越えるメタデータが存在すると判定した場合、メタデータのTOV指標がオンラインか否かを判定する(1102)。TOV指標がオンラインの場合は、ディスク駆動装置の電源や、HDDの電源や回転数を制御する必要がないので処理を終了する。
TOV指標がオンラインでない場合には、TOV指標がニアラインか否かを判定する。ニアラインでない場合には、リクエストマネージャは、HDDへの電源供給を遮断させるために、ファイルが格納されたフォルダに対応するLUを特定し、第1の管理テーブルを参照して、LUに対応する複数のHDDをへの電源供給を遮断する要求(1106)を、ストレージ装置の電源制御プログラムに対して送信する。
ストレージ装置の電源制御プログラムは、HDDへの電源供給を遮断する要求を受けると(1110)、DKAは、HDDの電源をオフするために、HDDのモードを変更し(1114)、第1の管理テーブル及び第2の管理テーブルの動作モードを更新し(1114)、完了報告をリクエストマネージャに対して行う(1116)。完了報告を受領した、リクエストマネージャは第1の管理テーブル及び第2の管理テーブルの動作モードを更新して処理を終了する(1118.1120)。
一方、メタデータのTOV指標がニアラインの場合には、ストレージマネージャは、複数のHDDをスピンダウンモードにするための要求(1108)を電源管理プログラムに送信する。この要求を受けた電源管理プログラムは(1110)、HDDの回転速度を下げるべく、DKAを介してHDDに対して省電力モードを変更するコマンドを発行する。このコマンドを受けることにより、スピンダウンモードでないHDDはスピンダウンモードに変更し(1112)、電源制御プログラムは第1の管理テーブル及び第2の管理テーブルの動作モードをスピンダウンモードに更新する(1114)。ファイルサーバも同様にして管理1の管理テーブル及び第2の管理テーブルの動作モードを更新する(1116−1120)。
以上のように、ファイルサーバ及びストレージ装置は、一定期間アクセスがない場合には、レディモードから、設定された省電力モードに変更することができる。
次に、メタデータのTOV指標が変更された場合での、ファイルサーバの処理動作について、図12に基づいて説明する。LUに格納されているデータに対応するメタデータのTOV指標が変更された場合、業務サーバがファイルサーバにファイル移動要求を発行する。なお、メタデータのTOV指標が変更された場合にファイルサーバが自動的に1200以降の処理をするようにしてもよい。
ファイルサーバがファイルを格納されているフォルダから他のフォルダに移動する要求を受領すると(1200)、移動元フォルダと移動先フォルダの情報から、移動元LUの特定情報(1202)と、移動先LUの特定情報(1204)と、を認識する。ここで、ファイルの移動は、例えば、ニアライン・オフライン用のフォルダからオンライン用のフォルダに移動する場合であるか、又はその逆であり、それに伴って格納先LUを変更する処理である。
次いで、リクエストマネージャは、第2の管理テーブルを用いて、移動元LUと移動先LUのそれぞれがレディモードか否かを判定し(1206,1208)、レディモードでない場合には、LUを構成する全てのHDDをレディモードになるように既述の電源制御フロー(図10)を実行する(1210,1212)。
次いで、リクエストマネージャの要求に基づいて、ストレージ装置のDKAは、移動元LUのデータをHDDから読み出して、キャッシュメモリ34に一時記憶し(1214)、一時記憶したデータを移動先LUの記憶領域に格納し(1216)、移動元LUの記憶領域に格納されたデータを削除する(1218)。そして、リクエストマネージャは、移動元データのメタデータをフォルダから削除する(1220)。
既述の実施形態は、ファイルサーバが、第1の管理テーブル及び第2の管理テーブルを保持しているため、ストレージ装置のLUと、このLUに対応するHDDを認識することができる。そして、業務サーバがデータにアクセスする傾向をデータに対して設定し、この傾向に最適な省電力特性を持ったHDDにデータを格納する。
上記の実施例に対して以下に述べる変形例では、ファイルサーバは、第1の管理テーブルを保持せず、第2の管理テーブルを保持するため、記憶領域としてLUを特定することはできるが、LUを構成するHDDを特定することはできない。ファイルサーバは、LUに対してレディモードへの移行や省電力モードへの移行を要求すれば、ストレージ装置がLUを構成するHDDを特定して制御する。この構成により、ファイルサーバの負荷を低減することができる。また、複数のストレージ装置がファイルサーバに接続する場合には、処理を分散できるため、よりストレージシステム全体の性能を向上させることができる。以下に、具体的に処理を説明する。
まず、ファイルサーバが、第2の管理テーブルを設定する動作を説明する。図7のフローと異なる点は、ファイルサーバとストレージ装置間で送受信するデータに、第1の管理テーブルは含まれず、第2の管理テーブルである点である。
具体的には、ファイルサーバ16のリクエストマネージャが、ファイルサーバの管理装置からストレージ装置のLUディスカバリ要求を受領すると、第2の管理テーブルをストレージ装置30に要求する(700)。ストレージ装置のCHA32がこの要求を受領すると(702)、共有メモリ38から第2の管理テーブルを読み出し、第2の管理テーブルをファイルサーバのリクエストマネージャに送信する(704)。リクエストマネージャは、第2の管理テーブルを受領すると(706)、ローカルメモリ22に格納する(708)。
なお、ファイルサーバが、ストレージ装置より、第2の管理テーブルの各項目に相当する情報を受領し、ファイルサーバにおいて、第2の管理テーブルを作成し、格納してもよい。
フォルダの作成処理は、図8のフローと同様である。ファイルサーバがファイルシステムにフォルダを作成するフローチャートは、図9と同様である。ただし、電源制御処理(912)は、下記の図13の電源制御処理を用いる。また、データ格納(914)時には、ファイルサーバのリクエストマネージャは、格納先LUを指定し、ストレージ装置においてLUを構成するHDDを特定する。
図13は、電源制御処理のフローチャートであり、既述の図10の変形例である。既述の実施形態では、LUが含まれるディスク駆動装置と、LUを構成するHDDとをファイルサーバ側で認識して、ストレージ装置がファイルサーバから指示に基づいてディスク駆動装置やHDDの動作モードを制御する。これに対して、図13では、ファイルサーバは電源制御を行うLUを指定してストレージ装置にコマンドを発行する(1300)。そして、コマンドを受領したストレージ装置は、ストレージ装置が保持する第1の管理テーブルに従い、LUが属するディスク駆動装置を特定する。そして、ストレージ装置のDKAは、ディスク駆動装置がレディモードであるかを判定する(1000)。判定後の処理は、図10と同様である(1006−1018)。次に、ストレージ装置が保持する第1の管理テーブルに従い、LUを構成するHDDを特定する。そして、ストレージ装置は、LUを構成するHDDがレディモードであるかを判定する(1026)。判定後の処理は、図10と同様である(1032‐1046)。そして、ファイルサーバが、ストレージ装置から完了報告を受信すると、ファイルサーバは第2の管理テーブルの動作モードを更新する(1050)。
図14は図11で示されているストレージ装置のHDDを省電力モードに移行するフローチャートの変形例である。図11では、ファイルサーバのリクエストマネージャが、データの格納先であるLUと、LUを構成するHDDを特定して、ストレージ装置に省電力モードへの移行要求をする。一方、図15では、ファイルサーバのリクエストマネージャが、データの格納先であるLUを特定し、ストレージ装置に対してして省電力モードへの移行要求をする。
1100、1102、1104の処理は図11と同様である。
次に、ファイルサーバのリクエストマネージャが、ストレージ装置のDKAに対し、LUの動作モードをオフする要求を送信する(1400)。DKAがLUの動作モードをオフする要求を受領すると(1402)、第1の管理テーブルに従いLUを構成するHDDを特定し、該HDDの電源をオフする要求を行う(1404)。そして、ファイルサーバに完了を報告する(1418)。この完了を受けて、ファイルサーバのリクエストマネージャは、第2の管理テーブルの動作モードを更新する(1420,1422)。一方、ストレージ装置は、HDDのモードをHDDオフモードに変更し(1408)、第1の管理テーブル及び第2の管理テーブルを更新した後(1410)、HDDが搭載されているディスク駆動装置の全てのHDDがオフされたか否かを判定し(1412)、これを肯定した場合、これらHDDを有するディスク駆動装置の電源をオフし、これを第1の管理テーブルに更新登録する(1414,1416)。
また、ファイルサーバのリクエストマネージャがデータを格納するLUに、HDDのスピンダウンモードに変更する要求(1424)をストレージ装置に送信すると、ストレージ装置のDKAがこの要求を受領する(1426)。受領後に、DKAはファイルサーバに対し完了報告を送信し、ファイルサーバは、第2の管理テーブルを更新登録する(1430)。ストレージ装置のDKAがLUに対するスピンモードへの移行要求を受けると、第1の管理テーブルをもちいてLUを構成するHDDを特定し、LUを構成するHDDをスピンダウンモードにする要求を行う(1434)。HDDをスピンダウンモードへ変更させた(1438)後、共有メモリの第1の管理テーブルと第2の管理テーブルを更新登録する(1440)。
次に、データ格納の方法の変形例について以下に説明する。これらの変形例は、上記2つの実施形態のいずれにも適用可能である。
図15は、図9の変形例であって、業務サーバからファイルサーバに送られたファイルデータを目的のHDDに格納するためのフローチャートである。
ステップ900−906までは図9と同じであるので、同一の符号を付した。ステップ908において、ファイルサーバのリクエストマネージャは、第2の管理テーブルを参照し、LUに対するTOV指標がオンラインか否かをチェックする(1500)。
リクエストマネージャが、TOV指標がオンラインであると判定すると、データ格納処理(1502)に移行する。データ格納処理においては、ファイルサーバのローカルメモリが第1の管理テーブル及び第2の管理テーブルを格納している場合、ファイルサーバが格納先HDDを特定して、ストレージ装置に指示を出す。ファイルサーバのローカルメモリに第2の管理テーブルが格納されている場合、ファイルサーバが格納先LUを特定して、ストレージ装置に指示を出し、ストレージ装置のDKAがLUのHDDを特定しデータを格納する。
ステップ1500において、マネージャプログラムは、TOV指標がオンラインでない場合には、LUがレディモードか否かを判定し(1504)、レディモードである場合には、上記のデータ格納処理(1502)に移行する。一方、レディモードでないと判定された場合には、HDD電源制御処理(1506)に移行する。HDD電源制御処理においては、ファイルサーバのローカルメモリが第1の管理テーブル及び第2の管理テーブルを格納している場合、図10の電源制御処理を実行する。ファイルサーバのローカルメモリに第2の管理テーブルが格納されている場合、図13の電源制御処理を実行する。その後、上記のデータ格納処理(1502)に移行する。このように、LUに対するTOV指標がオンラインデータであるかを判断することにより、既にレディモードであるかをチェックすることができ、効率的なデータ格納を実行できる。
図16は、図9の変形例として、さらに他の実施形態を示すものである。ステップ900−908までは図9と同じであるので、同一の符号を付した。その後の処理を、ファイルサーバのローカルメモリが第1の管理テーブル及び第2の管理テーブルを格納している場合、とファイルサーバのローカルメモリが第2の管理テーブルを格納している場合、とに分けて以下に説明する。
ファイルサーバのローカルメモリが第1の管理テーブル及び第2の管理テーブルを格納している場合には、ファイルサーバのリクエストマネージャが、データを格納するLUが属するディスク起動装置がレディモードであるかどうかを判断する(1600)。レディモードでない場合には、他のディスク駆動装置に他のレディモードのLUがあるかを判定する(1606)。レディモードのLUがない場合には、図15の1506以降の処理をして、格納先LUを構成するHDDをレディモードに移行する。レディモードの他のLUがある場合には、他のLUに格納するため、ファイルサーバが第1の管理テーブルを用いて格納先HDDを特定して、ストレージ装置にデータ格納指示を出す(1608)。その後、データ格納とは非同期に、ファイルの格納先であるLUをレディモードに移行し、ファイルを他のLUから格納先のLUへと移行する(1610)。
データを格納するLUが属するディスク起動装置がレディモードの場合(1600)、ファイルサーバのリクエストマネージャが、第1の管理テーブルを用いて格納先LUを構成するHDDがレディ状態であるかを確認する。レディ状態でない場合には、上記の1606の処理に移行する。レディ状態である場合には、格納先LUにデータを格納するため、ファイルサーバが第1の管理テーブルを用いて格納先HDDを特定して、ストレージ装置にデータ格納指示を出す。
次に、ファイルサーバのローカルメモリが第2の管理テーブルを格納している場合について説明する。ストレージ装置のDKAが、データを格納するLUが属するディスク起動装置がレディモードであるかどうかを判断する(1600)。レディモードでない場合には、他のディスク駆動装置に他のレディモードのLUがあるかを判定する(1606)。レディモードのLUがない場合には、図15の1506以降の処理をして、格納先LUを構成するHDDをレディモードに移行する。レディモードの他のLUがある場合には、他のLUに格納するため、ストレージ装置が第1の管理テーブルを用いて格納先HDDを特定してデータ格納する(1608)。その後、データ格納とは非同期に、ファイルの格納先であるLUをレディモードに移行し、ファイルを他のLUから格納先のLUへと移行する(1610)。
データを格納するLUが属するディスク起動装置がレディモードの場合(1600)、ストレージ装置のDKAが、第1の管理テーブルを用いて格納先LUを構成するHDDがレディ状態であるかを確認する。レディ状態でない場合には、上記の1606の処理に移行する。レディ状態である場合には、格納先LUにデータを格納するため、ストレージ装置のDKAが第1の管理テーブルを用いて格納先HDDを特定して、ストレージ装置にデータ格納指示を出す。
上記の1610におけるファイル移行処理には、図17のファイル管理テーブルを用いる。ファイル管理テーブルは、図17に示すように、ファイル名と、ニアラインデータ・オフラインデータが本来格納されるべき、ニアライン又はオフライン用のフォルダ1の情報(或いは、このフォルダに対応するLU♯とその論理アドレス)、及び、これらデータが仮に格納されているオンライン用のフォルダ2の情報(或いは、このフォルダに対応するLU♯とその論理アドレス)から構成される。
ファイル管理テーブルはファイルサーバのLM(22)に格納されている。ファイルサーバのストレージマネージャは、ファイル管理テーブルを定期的にレビューし、例えば、ファイル名が所定値以上になった際に、オンライン用のLUからニアライン又はオフライン用のLUにデータを移動させる。或いは所定時間経過後にこの処理を行ってもよい。
本発明に係るストレージシステムを備える記憶制御システムのブロック図である。 ファイルサーバの各種プログラムを説明するブロック図である。 第1の管理テーブルである。 第2の管理テーブルである。 メタデータの構造を示すブロック図である。 ファイルサーバがストレージ装置にデータを格納する際の動作の概要を説明するブロック図である。 管理テーブルのファイルサーバへの設定を説明するブロック図である。 ファイルサーバがフォルダをファイルシステムに作成する際のフローチャートである。 業務サーバから受信したデータをファイルサーバがストレージ装置に格納する動作を説明するフローチャートである。 電源制御動作を説明するフローチャートである。 ストレージ装置の記憶デバイスを省電力モードにするためのフローチャートである。 メタデータのTOV指標が変更された場合での、ファイルサーバの処理動作を説明するフローチャートである。 図10の変形例であって電源制御動作を説明するフローチャートである。 図11の変形例であって、ストレージ装置の記憶デバイスを省電力モードにするためのフローチャートである。 図9の変形例であって、業務サーバから受信したデータをファイルサーバがストレージ装置に格納する動作を説明するフローチャートである 図9の変形例であって、業務サーバから受信したデータをファイルサーバがストレージ装置に格納する動作を説明するフローチャートである ファイルの移動を管理するテーブルである。
符号の説明
10 計算機、12 ネットワーク、16 ファイルサーバ、20 接続部、21 キャッシュメモリ、22 ローカルメモリ、24 マイクロプロセッサ、30 ストレージ装置、32チャネルアダプタ、34 キャッシュメモリ、36 接続部、40 ディスクアダプタ、52 Power Distribution Block、54A−54D ディスク駆動装置、60 ハードディスクドライブ。

Claims (18)

  1. 計算機とネットワークを介して接続するファイルサーバと、
    前記ファイルサーバとネットワークを介して接続するストレージ装置とを含み、
    前記ファイルサーバは、第1のコントローラを含み、
    前記ストレージ装置は、複数の記憶領域を構成する複数の記憶デバイスと、前記複数の記憶領域へのアクセスを制御する第2のコントローラと、を含み、
    前記複数の記憶領域はそれぞれ、省電力モードからレディモードへの移行時間が異なる複数の省電力モードのうち、少なくとも1つの省電力モードを備え、
    前記第1のコントローラは、
    前記計算機からデータを受信すると、前記データに、前記計算機からのアクセスへの応答性能に関する指標を設定し、
    前記データの前記指標を参照して、前記指標を満たす省電力モードを備える第1の記憶領域を選択し、
    前記第2のコントローラは、
    前記第1の記憶領域に、前記データを格納する、
    ストレージシステム。
  2. 前記指標とは、計算機がアクセス要求を送信してから完了報告を受けるまでの時間に関連する指標である、
    請求項1に記載のストレージシステム。
  3. 前記複数の省電力モードとは、少なくとも前記記憶デバイスの電源を遮断するモードを含む、
    請求項2に記載のストレージシステム。
  4. 前記ファイルサーバは、さらに計算機から送信されたデータにメタデータを格納するメモリを含み、
    前記第1のコントローラは、前記メタデータに前記指標を設定する、
    請求項3に記載のストレージシステム。
  5. 前記ファイルサーバは、さらにデータが格納されるフォルダを設定するファイルシステムを含み、
    前記フォルダには、前記指標が設定され、
    前記計算機から送信されたデータを前記フォルダに格納すると、前記フォルダに設定された指標が、前記データの前記メタデータに設定される、
    請求項4に記載のストレージシステム。
  6. 前記第2のコントローラは、最終アクセス時間から、一定の時間が経過した後、前記レディモードになった記憶領域を省電力モードへ移行する、
    請求項3に記載のストレージシステム。
  7. 前記第1のコントローラは、前記第1の記憶領域が、省電力モードである場合、レディモードである第2の記憶領域を選択し、
    前記第2のコントローラは、前記第2の記憶領域に前記データを格納し、
    前記第2のコントローラは、前記第1の記憶領域を省電力モードから、レディモードへ移行し、
    前記第2のコントローラは、前記第2の記憶領域から、前記第1の記憶領域にデータを移動する、
    請求項1に記載のストレージシステム。
  8. 前記ファイルサーバは、さらに記憶領域と記憶デバイスとの関係を示すテーブルを格納するメモリを有し、
    前記第1のコントローラは、前記第1の領域を構成する第1の記憶デバイスを特定し、前記ストレージ装置に第1の記憶デバイスへの前記データの格納指示を送信する、
    請求項1に記載のストレージシステム。
  9. 前記テーブルは、記憶デバイスの現在の動作モードを管理し、
    前記第1のコントローラは、前記第1の記憶デバイスが省電力モードである場合には、前記ストレージ装置へ前記第1の記憶デバイスをレディモードに移行する指示を送信する、
    請求項8に記載のストレージシステム。
  10. 計算機とネットワークを介して接続するファイルサーバと、
    前記ファイルサーバとネットワークを介して接続し、
    複数の記憶領域を構成する複数の記憶デバイスを備え、
    前記複数の記憶領域へのアクセスを制御するストレージ装置と、
    を含む、ストレージシステムの制御方法であって、
    前記ストレージ装置が、前記複数の記憶領域に、それぞれ、省電力モードからレディモードへの移行時間が異なる複数の省電力モードのうち、少なくとも1つの省電力モードを設定し、
    前記ファイルサーバが、前記計算機から受信したデータに、前記計算機からのアクセスへの応答性能に関する指標を設定し、
    前記ファイルサーバが、前記データの前記指標を参照して、前記指標を満たす省電力モードを備える第1の記憶領域を選択し、
    前記ストレージ装置は、前記第1の記憶領域に、前記データを格納する、ストレージシステムの制御方法。
  11. 前記指標とは、計算機がアクセス要求を送信してから完了報告を受けるまでの時間に関連する指標である、
    請求項10に記載のストレージシステムの制御方法。
  12. 前記ストレージ装置は、前記複数の記憶領域の少なくとも1つに、前記記憶デバイスの電源を遮断するモードを設定する、請求項11記載のストレージシステムの制御方法。
  13. 前記ファイルサーバは、前記計算機から送信されたデータにメタデータを設定し、前記メタデータに前記指標を設定する、請求項12記載のストレージシステムの制御方法。
  14. 前記ファイルサーバのファイルシステムの前記データが格納されるフォルダに前記指標を設定し、前記計算機から送信されたデータを前記フォルダに格納すると、前記フォルダに設定された指標を前記データの前記メタデータに設定する、
    請求項13に記載のストレージシステムの制御方法。
  15. 前記ストレージ装置は、最終にアクセスされた時間から、一定の時間が経過した後、前記レディモードになった記憶領域を省電力モードへ移行させる、請求項12記載のストレージシステムの制御方法。
  16. 前記ファイルサーバは、前記第1の記憶領域が、前記省電力モードである場合、前記レディモードである第2の記憶領域を選択し、
    前記ストレージ装置は、前記第2の記憶領域に前記データを格納し、前記第1の記憶領域を前記省電力モードから、前記レディモードへ移行し、次いで、前記第2の記憶領域から、前記第1の記憶領域にデータを移動する、
    請求項10に記載のストレージシステムの制御方法。
  17. 前記ファイルサーバは、前記複数の記憶領域と前記複数の記憶デバイスとの関係を示すテーブルに基づいて、前記第1の記憶領域を構成する第1の記憶デバイスを特定し、前記ストレージ装置に当該第1の記憶デバイスへの前記データの格納指示を送信する、
    請求項10に記載のストレージシステムの制御方法。
  18. 前記ファイルサーバは、前記テーブルに基づいて、前記第1の記憶デバイスの現在の動作モードを認識し、前記第1の記憶デバイスが前記省電力モードである場合には、前記ストレージ装置へ前記第1の記憶デバイスを前記レディモードに移行する指示を送信する、請求項17記載のストレージシステムの制御方法。
JP2008177423A 2008-07-07 2008-07-07 ストレージシステム Pending JP2010015518A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008177423A JP2010015518A (ja) 2008-07-07 2008-07-07 ストレージシステム
US12/236,529 US8132033B2 (en) 2008-07-07 2008-09-24 Storage system
EP09150944A EP2144153A3 (en) 2008-07-07 2009-01-20 Storage system having a power saving function
CN2009100028237A CN101625626B (zh) 2008-07-07 2009-01-24 存储系统及其控制方法
US13/411,663 US8375235B2 (en) 2008-07-07 2012-03-05 Storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008177423A JP2010015518A (ja) 2008-07-07 2008-07-07 ストレージシステム

Publications (1)

Publication Number Publication Date
JP2010015518A true JP2010015518A (ja) 2010-01-21

Family

ID=41210846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008177423A Pending JP2010015518A (ja) 2008-07-07 2008-07-07 ストレージシステム

Country Status (4)

Country Link
US (2) US8132033B2 (ja)
EP (1) EP2144153A3 (ja)
JP (1) JP2010015518A (ja)
CN (1) CN101625626B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4838832B2 (ja) * 2008-08-29 2011-12-14 富士通株式会社 ストレージシステムの制御方法、ストレージシステム、及びストレージ装置
WO2010137180A1 (en) * 2009-05-25 2010-12-02 Hitachi,Ltd. Storage system and its power control method
US20100313044A1 (en) * 2009-06-03 2010-12-09 Microsoft Corporation Storage array power management through i/o redirection
US20110047316A1 (en) * 2009-08-19 2011-02-24 Dell Products L.P. Solid state memory device power optimization
JP5438495B2 (ja) * 2009-12-22 2014-03-12 キヤノン株式会社 情報処理装置及びその制御方法
KR20110080583A (ko) * 2010-01-06 2011-07-13 삼성전자주식회사 원격 운영체제 복구 가능한 컴퓨터 시스템 및 그 방법
CN103514931B (zh) * 2012-06-29 2017-04-12 赛恩倍吉科技顾问(深圳)有限公司 硬盘供电电路
CN103777725A (zh) * 2012-10-18 2014-05-07 鸿富锦精密工业(深圳)有限公司 存储装置电源管理系统及方法
US9223388B2 (en) 2013-01-29 2015-12-29 Hewlett Packard Enterprise Development Lp Power state transition saving session information
TW201614412A (en) * 2014-10-02 2016-04-16 Wistron Corp Server system and controlling method thereof
US20160357435A1 (en) * 2015-06-08 2016-12-08 Alibaba Group Holding Limited High density high throughput low power consumption data storage system with dynamic provisioning
US10346044B2 (en) * 2016-04-14 2019-07-09 Western Digital Technologies, Inc. Preloading of directory data in data storage devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293314A (ja) * 1999-04-05 2000-10-20 Hitachi Ltd ディスクアレイ装置
WO2004049147A1 (ja) * 2002-11-25 2004-06-10 Fujitsu Limited 省電力制御システムおよび省電力制御方法
JP2004246770A (ja) * 2003-02-17 2004-09-02 Hitachi Ltd データ移行方法
JP2005302233A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 情報記憶装置、情報格納方法及び情報記憶処理プログラム
JP2007286897A (ja) * 2006-04-17 2007-11-01 Hitachi Ltd 記憶システム及びデータ管理装置並びにその管理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4518541B2 (ja) * 2004-01-16 2010-08-04 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の制御方法
CN1674538A (zh) 2004-03-25 2005-09-28 联想(北京)有限公司 一种基于局域网的网络存储系统及其读写数据方法
US7383382B2 (en) * 2004-04-14 2008-06-03 Microsoft Corporation System and method for storage power, thermal and acoustic management in server systems
US20060059172A1 (en) * 2004-09-10 2006-03-16 International Business Machines Corporation Method and system for developing data life cycle policies
CN1869880A (zh) 2005-05-25 2006-11-29 儒园系统股份有限公司 安全省电的硬盘存储系统及其方法
JP4897387B2 (ja) * 2006-08-10 2012-03-14 株式会社日立製作所 ストレージ装置およびこれを用いたデータの管理方法
JP4919752B2 (ja) 2006-09-29 2012-04-18 株式会社日立製作所 記憶制御装置
JP2008134830A (ja) * 2006-11-28 2008-06-12 Hitachi Ltd 節電機能と診断機能の両方を備えたストレージシステム
JP5008955B2 (ja) * 2006-11-28 2012-08-22 株式会社日立製作所 節電機能を備えたストレージシステム
JP2008177423A (ja) 2007-01-19 2008-07-31 Toshiba Microelectronics Corp 半導体装置
JP2009080603A (ja) * 2007-09-26 2009-04-16 Hitachi Ltd ストレージ装置及びその省電力方法
US8037332B2 (en) * 2008-04-30 2011-10-11 International Business Machines Corporation Quad-state power-saving virtual storage controller

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293314A (ja) * 1999-04-05 2000-10-20 Hitachi Ltd ディスクアレイ装置
WO2004049147A1 (ja) * 2002-11-25 2004-06-10 Fujitsu Limited 省電力制御システムおよび省電力制御方法
JP2004246770A (ja) * 2003-02-17 2004-09-02 Hitachi Ltd データ移行方法
JP2005302233A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 情報記憶装置、情報格納方法及び情報記憶処理プログラム
JP2007286897A (ja) * 2006-04-17 2007-11-01 Hitachi Ltd 記憶システム及びデータ管理装置並びにその管理方法

Also Published As

Publication number Publication date
US20120179925A1 (en) 2012-07-12
US8375235B2 (en) 2013-02-12
CN101625626B (zh) 2012-07-11
CN101625626A (zh) 2010-01-13
US20100005329A1 (en) 2010-01-07
US8132033B2 (en) 2012-03-06
EP2144153A2 (en) 2010-01-13
EP2144153A3 (en) 2011-05-18

Similar Documents

Publication Publication Date Title
JP2010015518A (ja) ストレージシステム
US9965011B2 (en) Controller interface for operation of multiple storage drives
US8301852B2 (en) Virtual storage migration technique to minimize spinning disks
US8161317B2 (en) Storage system and control method thereof
US9720606B2 (en) Methods and structure for online migration of data in storage systems comprising a plurality of storage devices
JP2007293442A (ja) ストレージシステム及びその制御方法
JP2006330895A (ja) ストレージシステム及びストレージシステムの運用方法
JP2009009194A (ja) 消費電力を削減する機能を備えたストレージシステム
JP5238407B2 (ja) 省電力バックアップ管理方法
US8352766B2 (en) Power control of target secondary copy storage based on journal storage usage and accumulation speed rate
CN102215268A (zh) 一种迁移文件数据的方法和装置
US9653110B2 (en) Speed control of data storage device using service controller
JP2010015446A (ja) ストレージ装置及び電源の制御方法
JP2005267111A (ja) 記憶制御システム及び記憶制御システムの制御方法
US8001163B2 (en) Database management system for controlling power consumption of storage system
US8429344B2 (en) Storage apparatus, relay device, and method of controlling operating state
US10635154B2 (en) Intelligent SAS phy power management
US8036076B2 (en) Method of reducing storage power consumption by use of prefetch and computer system using the same
CN114860154A (zh) 使用缓存状态改变的数据迁移
JP2016184371A (ja) ストレージ制御装置,ストレージ装置およびストレージ制御プログラム
JP2013206009A (ja) ドライブ制御装置及びストレージシステム及びドライブ制御方法
JP5807942B2 (ja) ディスクアレイ装置及びその制御方法
JP2006113826A (ja) 外部の装置に接続される制御装置
TWI799283B (zh) 具有智慧電源管理之資料儲存系統
JP2002023960A (ja) ディスク装置及び同装置を複数備えた計算機システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130108