JP2010250476A - ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法 - Google Patents

ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法 Download PDF

Info

Publication number
JP2010250476A
JP2010250476A JP2009097916A JP2009097916A JP2010250476A JP 2010250476 A JP2010250476 A JP 2010250476A JP 2009097916 A JP2009097916 A JP 2009097916A JP 2009097916 A JP2009097916 A JP 2009097916A JP 2010250476 A JP2010250476 A JP 2010250476A
Authority
JP
Japan
Prior art keywords
storage
free
area
partition
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009097916A
Other languages
English (en)
Other versions
JP5182201B2 (ja
Inventor
Kosuke Uchida
考介 内田
Yasuo Noguchi
泰生 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009097916A priority Critical patent/JP5182201B2/ja
Priority to US12/751,566 priority patent/US8856485B2/en
Priority to GB1005490.6A priority patent/GB2469555B/en
Publication of JP2010250476A publication Critical patent/JP2010250476A/ja
Application granted granted Critical
Publication of JP5182201B2 publication Critical patent/JP5182201B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Abstract

【課題】ストレージシステムにおけるストレージの有効活用を図ること。
【解決手段】業務サーバSが保有する物理ディスクDbについても空き領域がある場合には、データセンタ101内の物理ディスクDaと同様、空き領域について仮想領域Vに含める。これにより、業務サーバSの物理ディスクDbの空き領域も、データセンタ101内の物理ディスクDaと同様、各業務サーバSが利用可能な仮想領域Vとなり、リソースの有効活用を図ることができる。
【選択図】図1

Description

本開示技術は、ストレージを制御するストレージ制御プログラム、ストレージシステム、およびストレージ制御方法に関する。
従来、ストレージ群を仮想領域として業務サーバで共有するストレージシステムが開示されている(たとえば、下記特許文献1を参照。)。
図12は、従来のストレージシステムのシステム構成図である。ストレージシステム100は、データセンタ101と業務システム102群とを含む構成である。ストレージシステム100内では、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワーク103により通信可能に接続されている。
データセンタ101は、業務システム102群にストレージサービスを提供するシステムである。ストレージサービスとは、各業務システム102に対してデータの読み出しや書き込みを提供するコンピュータ処理である。データセンタ101は、管理ノードMPと制御ノードCPと複数のストレージ装置STとを含む構成である。管理ノードMPは、サービス提供先の業務サーバSを管理するコンピュータである。制御ノードCPは、全物理ディスクDaのディスク領域を一元管理するコンピュータである。
ストレージ装置STは、ディスクノードDPと物理ディスクDaとで構成されている。ディスクノードDPは、制御ノードCPからの制御により物理ディスクDaからデータを読み出したり、物理ディスクDaにデータを書き込んだりするコンピュータである。物理ディスクDaは、ハードディスクや不揮発性メモリ、磁気テープにより構成されている。
物理ディスクDaは、スライスと呼ばれる単位で各業務サーバSにディスク領域を割り当てている。ある業務サーバSに割り当てられるスライスは、複数の物理ディスクDaにまたがっているが、それぞれの業務サーバSから見た場合、単一の物理ディスクであるかのように見える。このことから、全物理ディスクDaのディスク領域は仮想領域V(または仮想ディスク)と称される。
業務システム102は、各種業務(たとえば、Webサービス、検索サービス、ストレージサービスなど)を提供するシステムであり、業務サーバSとその業務サーバS専用の物理ディスクDbとを有する。業務サーバSは、データセンタ101からストレージの割当サービスを受けるコンピュータである。各業務サーバSは、仮想領域Vに保存されたデータを読み出したり、仮想領域Vにデータを書き込むことができる。実際には、業務サーバSに割り当てられたディスクノードDPの物理ディスクDa内のスライスにアクセスして、データの読み出し/書込みをおこなう。
業務サーバSの物理ディスクDbは、その業務サーバSが利用する。各業務サーバSの物理ディスクDbに空き領域があると、空き領域が分散していることとなり、ストレージシステム100として非効率な状態である。
特開2005−4681号公報
本開示技術では、業務サーバ自身が保有するストレージの空き領域が増加した場合に仮想領域Vに組み込むことで、ストレージシステム100におけるストレージの有効活用を図ることを課題とする。また、業務サーバS自身が保有するストレージの空き領域が減少した場合に仮想領域Vから切り離すことで、業務サーバSにおけるストレージの有効活用を図ることを課題とする。
上述した課題を解決し、目的を達成するため、本開示技術は、複数のサーバで共有可能なストレージ群を制御する制御サーバにより前記ストレージ群の記憶領域の中から前記各サーバが使用できる記憶領域を設定するストレージシステムにおいて、前記複数のサーバの中から選ばれた特定のサーバのみ使用する前記ストレージ群以外の特定のストレージの空き容量を検出し、前記特定のストレージの中から、検出された空き容量に応じた空き領域を特定し、特定された空き領域を、前記サーバ群で共有可能な共有記憶領域に設定することを要件とする。
本開示技術によれば、ストレージの有効活用を図ることができるという効果を奏する。
本開示技術のストレージシステムのシステム構成図である。 コンピュータのハードウェア構成を示すブロック図である。 業務サーバ一覧テーブルの記憶内容を示す説明図である。 論理ディスク構成テーブルの記憶内容を示す説明図である。 ディスクノード一覧テーブルの記憶内容を示す説明図である。 仮想領域自動組込処理のシーケンスを示すシーケンス図である。 空きパーティション数特定処理(ステップS604)およびデータ退避処理(ステップS605)の具体例を示す説明図である。 変更後の論理ディスク構成テーブルの記憶内容を示す説明図である。 更新後のディスクノード一覧テーブルを示す説明図である。 仮想領域自動退避処理のシーケンスを示すシーケンス図である。 業務サーバ/ストレージシステムの機能的構成を示すブロック図である。 従来のストレージシステムのシステム構成図である。
以下に添付図面を参照して、本開示技術のストレージ制御プログラム、ストレージシステム、およびストレージ制御方法の好適な実施の形態を詳細に説明する。
(システム構成)
図1は、本開示技術のストレージシステムのシステム構成図である。図12に示した構成と同一構成には同一符号を付し、その説明を省略する。本開示技術では、業務サーバSが保有する物理ディスクDbについても空き領域がある場合には、データセンタ101内の物理ディスクDaと同様、空き領域について仮想領域Vに含める。これにより、業務サーバSの物理ディスクDbの空き領域も、データセンタ101内の物理ディスクDaと同様、仮想領域Vとなり、リソースの有効活用を図ることができる。たとえば、ある業務システム102(たとえば、A社の業務システム)の業務サーバSの物理ディスクDbに空き領域を仮想領域Vに含める。これにより、他の業務システム102(たとえば、B社の業務システム。図示しないC社、D社…の業務システムでもよい。)の業務サーバSは、増加した仮想領域Vを利用することができる。
(コンピュータのハードウェア構成)
図2は、コンピュータのハードウェア構成を示すブロック図である。図2において、コンピュータは、CPU(Central Processing Unit)201と、ROM(Read‐Only Memory)202と、RAM(Random Access Memory)203と、磁気ディスクドライブ204と、磁気ディスク205と、光ディスクドライブ206と、光ディスク207と、ディスプレイ208と、I/F(Interface)209と、キーボード210と、マウス211と、スキャナ212と、プリンタ213と、を備えている。また、各構成部はバス200によってそれぞれ接続されている。
ここで、CPU201は、コンピュータの全体の制御を司る。ROM202は、ブートプログラムなどのプログラムを記憶している。RAM203は、CPU201のワークエリアとして使用される。磁気ディスクドライブ204は、CPU201の制御にしたがって磁気ディスク205に対するデータのリード/ライトを制御する。磁気ディスク205は、磁気ディスクドライブ204の制御で書き込まれたデータを記憶する。
光ディスクドライブ206は、CPU201の制御にしたがって光ディスク207に対するデータのリード/ライトを制御する。光ディスク207は、光ディスクドライブ206の制御で書き込まれたデータを記憶したり、光ディスク207に記憶されたデータをコンピュータに読み取らせたりする。
ディスプレイ208は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。このディスプレイ208は、たとえば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを採用することができる。
インターフェース(以下、「I/F」と略する。)209は、通信回線を通じてLAN、WAN、インターネットなどのネットワーク103に接続され、ネットワーク103を介して他の装置に接続される。そして、I/F209は、ネットワーク103と内部のインターフェースを司り、外部装置からのデータの入出力を制御する。I/F209には、たとえばモデムやLANアダプタなどを採用することができる。
キーボード210は、文字、数字、各種指示などの入力のためのキーを備え、データの入力をおこなう。また、タッチパネル式の入力パッドやテンキーなどであってもよい。マウス211は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などをおこなう。ポインティングデバイスとして同様に機能を備えるものであれば、トラックボールやジョイスティックなどであってもよい。
スキャナ212は、画像を光学的に読み取り、コンピュータ内に画像データを取り込む。なお、スキャナ212は、OCR(Optical Character Reader)機能を持たせてもよい。また、プリンタ213は、画像データや文書データを印刷する。プリンタ213には、たとえば、レーザプリンタやインクジェットプリンタを採用することができる。
(各種テーブルの記憶内容)
つぎに、本開示技術で使用する各種テーブルについて説明する。以下に示すテーブルは、具体的には、たとえば、図2に示したROM202、RAM203、磁気ディスク205などの記憶媒体によりその機能を実現する。
図3は、業務サーバ一覧テーブルの記憶内容を示す説明図である。業務サーバ一覧テーブル300は、業務サーバSの所在(本例ではIP(Internet Protocol)アドレス)を登録するテーブルである。業務サーバ一覧テーブル300は、管理ノードMPが保有する。
図4は、論理ディスク構成テーブルの記憶内容を示す説明図である。論理ディスク構成テーブル400とは、ストレージシステム100で定義された論理ディスクの内容を記憶するテーブルである。論理ディスク構成テーブル400は、各業務サーバSが保有するテーブルである。論理ディスク構成テーブル400は、ディスク番号と、パーティション番号と、割り当て状態と、容量とを、論理ディスクごとに記憶する。すなわち、各レコードはパーティションの情報を示している。ディスク番号とは、その業務サーバSが保有する物理ディスクDbを特定する識別情報である。
パーティション番号とは、物理ディスクDb内のパーティションを特定する識別情報である。パーティションとは、物理ディスクDbを分割した部分的な記憶領域である。図4の例では、物理ディスクDb番号:1番の物理ディスクDbは、パーティション番号:1番〜4番の4つのパーティションに分割されている。
割り当て状態とは、パーティションの割当先を示す情報である。図4において、「業務」である場合は、その業務サーバSに割り当てられており、「仮想」である場合は、仮想領域Vとして割り当てられている。容量とは、論理ディスクであるパーティションの記憶容量(サイズ)である。本例では、各パーティションの記憶容量は同一(図4では、100[GB])とする。
図5は、ディスクノード一覧テーブルの記憶内容を示す説明図である。ディスクノード一覧テーブル500は、制御ノードCPが保有するテーブルである。ディスクノード一覧テーブル500は、あらたにディスクノードDPとなる業務サーバSの物理ディスクDbに関する情報を記憶するテーブルである。
具体的には、業務サーバSごとに、業務サーバSのIPアドレスと、業務サーバSの物理ディスクDbのディスク番号と、そのディスク番号で特定される物理ディスクDb内のパーティション番号を記憶する。すなわち、ディスクノード一覧テーブル500のレコードは、仮想領域Vに組み込まれた業務サーバSの物理ディスクDbのパーティションを示している。
たとえば、図5のレコードは、IPアドレス:10.77.205.57で特定される業務サーバSが保有するディスク番号:1番の物理ディスクDb内のパーティション番号:4番のパーティションが仮想領域Vに組み込まれたことを示している。他のパーティションがあらたに仮想領域Vに組み込まれるとそのレコードが追加され、仮想領域Vから解放されるとそのレコードは削除されることとなる。
(仮想領域自動組込処理)
図6は、仮想領域自動組込処理のシーケンスを示すシーケンス図である。まず、管理ノードMPが、所定のタイミングで自動的にまたは管理者の操作指示により、バッチジョブである組込プログラムを対象となる業務サーバS(以下、「対象業務サーバS」)に送信する(ステップS601)。具体的には、たとえば、リナックスのsshコマンドを実行する。
対象業務サーバSは組込プログラムを受信すると、組込プログラムにより、使用パーティション特定処理(ステップS602)、使用量測定処理(ステップS603)、空きパーティション数特定処理(ステップS604)、データ退避処理(ステップS605)を実行する。
使用パーティション特定処理(ステップS602)とは、業務サーバSが使用できるパーティション、換言すれば、仮想領域Vに割り当てられていないパーティションを特定する処理である。具体的には、論理ディスク構成テーブル400にアクセスして、割り当て状態が「業務」であるパーティションを特定する。図4の例では、パーティション番号:1番〜3番のパーティションが特定される。
使用量測定処理(ステップS603)とは、使用パーティション特定処理(ステップS602)で特定されたパーティションの現在の使用量を測定する処理である。具体的には、たとえば、リナックスのdfコマンドを実行する。
空きパーティション数特定処理(ステップS604)では、空きパーティションの数を特定する処理である。空きパーティション数の特定に際し、使用パーティション特定処理(ステップS602)で特定されたパーティションの総記憶容量から、使用量測定処理(ステップS603)で測定された使用量を引く。この計算結果が空き容量となる。つぎに、計算された空き容量がパーティションサイズ以上か否かを判断する。
パーティションサイズとは、1パーティションの記憶容量(図4の例では、100[GB])である。空き容量が1パーティションサイズ以上である場合、1パーティションサイズの空き容量があることとなる。同様に、空き容量が2パーティションサイズ以上である場合、1パーティションサイズ以上の空き容量があることとなる。このように、最大でいくつのパーティションサイズ分の空き容量があるか特定されるまで判断を続ける。
データ退避処理(ステップS605)は、パーティション内でデータを集約し、空きパーティション数特定処理(ステップS604)により特定された空きパーティション数分の空きパーティションを作る。ここで具体例を説明する。
図7は、空きパーティション数特定処理(ステップS604)およびデータ退避処理(ステップS605)の具体例を示す説明図である。図7中、P1〜P3は、図4に示したパーティション番号1〜3のパーティションである。本例では、パーティションP1の使用量が70[GB]、パーティションP2の使用量が60[GB]、パーティションP3の使用量が50[GB]とする。(A)において、パーティションP1〜P3の総記憶容量は300[GB]、総使用量は180[GB]であるため、パーティションP1〜P3の空き容量は、120[GB]となる。
そして、空き容量120[GB]が1パーティションサイズである100[GB]以上か否かを判断する。この場合は100[GB]以上であるため、1パーティションサイズ分の空き容量があることがわかる。つぎに、空き容量120[GB]が2パーティションサイズである200[GB]以上か否かを判断する。この場合は200[GB]以上でないため、2パーティションサイズ分の空き容量まではなく、1パーティションサイズ分の空き容量で確定する。
(B)では、パーティションP3に格納されている50[GB]分のデータを、パーティションP1,P2に移行する。これにより、パーティションP3は空となり、仮想領域Vとして組み込むことができる。
図6に戻って、データ退避処理(ステップS605)が完了すると、組込プログラムにより組込指示をおこなう(ステップS606)。組込指示には、空きパーティションのパーティション番号が含まれる。このあと、論理ディスク制御プログラムを起動する。論理ディスク制御プログラムは、組込処理を実行する(ステップS607)。組込処理(ステップS607)とは、図4に示した論理ディスク構成テーブル400にアクセスして、組込指示に含まれているパーティション番号の割り当て状態の項目を「仮想」に変更する。
図8は、変更後の論理ディスク構成テーブル400の記憶内容を示す説明図である。図8では、図4に示した状態から、パーティション番号:3番のパーティションP3の割り当て状態を「仮想」に変更する。
図6に戻って、組込処理(ステップS607)のあと、組込プログラムは、ディスクノードプログラムにパーティション情報(「仮想」に変更されたパーティション番号)を与え(ステップS608)、組込対象(本例ではパーティションP3)のフォーマット処理を実行する(ステップS609)。具体的には、たとえば、パーティションP3の全域にオールゼロの値を書き込む。これにより、物理ディスクDbのパーティションP3に仮想領域Vが生成されることとなる(ステップS610)。
仮想領域Vが生成されると、ディスクノードプログラムは、制御ノードCPに対し仮想領域情報を送信する(ステップS611)。仮想領域情報とは、仮想領域Vが設定された業務サーバSのIPアドレス、仮想領域Vが設定されたディスク番号、仮想領域Vが設定された物理ディスクDb内のパーティション番号である。制御ノードCPでは、ディスクノード一覧テーブル更新処理(ステップS612)を実行する。具体的には、ステップS611で送信されてきた仮想領域情報をディスクノード一覧テーブル500の新規レコードとして追加する。
図9は、更新後のディスクノード一覧テーブル500を示す説明図である。図5と比較すると、レコードが新たに追加されていることがわかる。
(仮想領域自動退避処理)
図10は、仮想領域自動退避処理のシーケンスを示すシーケンス図である。まず、対象業務サーバSが、所定のタイミングで自動的にまたは操作指示により、使用パーティション特定処理(ステップS1001)、使用量測定処理(ステップS1002)、パーティション返却判断処理(ステップS1003)を実行する。
使用パーティション特定処理(ステップS1001)は、図6に示した使用パーティション特定処理(ステップS602)と同一処理内容であり、使用量測定処理(ステップS1002)は、使用量測定処理(ステップS603)と同一処理内容である。
パーティション返却判断処理(ステップS1003)では、仮想領域Vに設定されたパーティションを返却すべきか否か、すなわち、仮想領域Vから解放して対象業務サーバSにのみ割り当てるか否かを判断する。具体的には、使用パーティション特定処理(ステップS1001)で特定されたパーティションの総記憶容量から、使用量測定処理(ステップS1002)で測定された使用量を引く。この計算結果が空き容量となる。
つぎに、計算された空き容量がしきい値となる空き容量より大きいか否かを判断する。大きければ、対象業務サーバSの容量不足となるため、制御ノードCPに対し仮想領域Vに設定されたパーティションの返却要求を送信する(ステップS1004)。返却要求には、対象業務サーバSのIPアドレス、仮想領域Vに設定されたパーティションのパーティション番号とそのパーティションを含む物理ディスクDbのディスク番号が含まれている。計算された空き容量がしきい値となる空き容量以下である場合、まだ余裕があるとして、返却要求をしない。
制御ノードCPは、返却要求を受信すると、ディスクノードプログラムに対し、返却指示をおこなう(ステップS1005)。返却指示には、返却要求と同一の情報(対象業務サーバSのIPアドレス、仮想領域Vに設定されたパーティションのパーティション番号とそのパーティションを含む物理ディスクDbのディスク番号)が含まれている。ディスクノードプログラムは、返却指示を制御ノードCPから受けると、解放処理を実行する(ステップS1006)。
具体的には、返却指示に埋め込まれている仮想領域Vに設定されたパーティション番号により、ディスクノード一覧テーブル500内の該当するレコードを特定し、特定されたレコードをディスクノード一覧テーブル500から削除する。これにより、制御ノードCPからは、該当するパーティションが仮想領域Vであると認識できず、解放されることとなる(ステップS1007)。このあと、ディスクノードプログラムは、解放情報を制御ノードCPに送信する(ステップS1008)。解放情報とは、仮想領域Vから開放されたパーティション情報(「業務」に変更されたパーティション番号)である。
制御ノードCPでは、解放情報を受けると、仮想領域Vの減少により、データの2重保存処理を実行する(ステップS1009)。2重保存処理については、上述した特許文献1の技術であるため、詳細な説明を省略する。制御ノードCPは、このあと、解放情報に含まれているパーティション情報を組込プログラムに与える(ステップS1010)。組込プログラムは、パーティション情報を受けると、論理ディスク制御プログラムに対し、パーティション情報により特定されるパーティションの仮想領域Vからの切離し指示を与える(ステップS1011)。
このあと、論理ディスク制御プログラムを起動する。論理ディスク制御プログラムは、切離し処理を実行する(ステップS1012)。切離し処理(ステップS1012)とは、図4に示した論理ディスク構成テーブル400にアクセスして、パーティション情報(ステップS1010)に含まれているパーティション番号の割り当て状態の項目を「業務」に変更する。
パーティションP3が仮想領域Vから解放されたとすると、論理ディスク構成テーブル400のパーティション番号:3番のパーティションP3の割り当て状態を、図8に示した「仮想」から「業務」に変更する。この場合、図4に示した割り当て状態に戻る。これにより、仮想領域Vから解放されたパーティションが業務領域として対象業務サーバSのみが使用する記憶領域となる(ステップS1013)。
(業務サーバS/ストレージシステム100の機能的構成)
図11は、業務サーバS/ストレージシステム100の機能的構成を示すブロック図である。図11において、業務サーバS/ストレージシステム100は、検出部1101と、空き容量判断部1102と、特定部1103と、使用率判断部1104と、設定部1105とを備える。この制御部となる機能(検出部1101〜設定部1105)は、具体的には、たとえば、図2に示したROM202、RAM203、磁気ディスク205、光ディスク207などの記憶装置に記憶されたプログラムをCPU201に実行させることにより、または、I/F209により、その機能を実現する。
検出部1101は、複数のサーバの中から選ばれた特定のサーバのみ使用するストレージ群以外の特定のストレージの空き容量を検出する機能を有する。具体的には、たとえば、業務サーバS群の中から選ばれた対象業務サーバS専用の物理ディスクDbの空き容量を検出する。より具体的には、図6に示した仮想領域自動組込処理では、使用パーティション特定処理(ステップS602)および使用量測定処理(ステップS603)に相当する。また、図10に示した仮想領域自動退避処理では、使用パーティション特定処理(ステップS1001)および使用量測定処理(ステップS1002)に相当する。
空き容量判断部1102は、検出部1101によって検出された空き容量が所定の空き容量以上であるか否かを判断する機能を有する。具体的には、たとえば、空き容量が、1パーティションサイズ以上であるか否か、2パーティションサイズ以上であるか否か、…、nパーティションサイズ以上であるか否かを判断する。より具体的には、図6に示した仮想領域自動組込処理では、空きパーティション数特定処理(ステップS604)に相当する。
特定部1103は、特定のストレージの中から検出部1101によって検出された空き容量に応じた空き領域を特定する機能を有する。具体的には、たとえば、対象業務サーバS専用の物理ディスクDbの中から、検出された空き容量に応じた空き領域を特定する。より具体的には、nパーティションサイズ以上でないと判断された場合、パーティション数を(n−1)個であると特定する。パーティションサイズをm[GB]とすると、空き容量は(n−1)×mとなる。図6に示した仮想領域自動組込処理では、空きパーティション数特定処理(ステップS604)に相当する。
使用率判断部1104は、特定のストレージのうち共有記憶領域を除く残余の記憶領域の使用率が所定の使用率以上であるか否かを判断する機能を有する。具体的には、たとえば、対象業務サーバS専用の物理ディスクDbのうち仮想領域Vを除く残余のパーティションの使用率が所定の使用率以上であるか否かを判断する。たとえば、残余のパーティションの総記憶容量のうち使用量が所定のしきい値以上であるか否かを判断する。図10に示した仮想領域自動退避処理では、パーティション返却判断処理(ステップS1003)に相当する。
設定部1105は、特定部1103によって特定された空き領域を、サーバ群で共有可能な共有記憶領域に設定する機能を有する。具体的には、たとえば、空き領域に相当するパーティションを業務サーバS群で共有可能な仮想領域Vに設定する。図6に示した仮想領域自動組込処理では、組込処理(ステップS607)、ディスクノード一覧テーブル更新処理(ステップS612)に相当する。
また、設定部1105は、使用率判断部1104によって所定の使用率以上であると判断された場合、共有記憶領域を、特定のサーバのみ使用する記憶領域に設定する機能を有する。具体的には、たとえば、残余のパーティションの総記憶容量のうち使用量が所定のしきい値以上である場合、仮想領域Vである対象業務サーバS専用の物理ディスクDb内のパーティションを、対象業務サーバSにのみ使用されるパーティションに設定する。図10に示した仮想領域自動退避処理では、解放処理(ステップS1006)および切離し処理(ステップS1012)に相当する。
以上説明したように、本開示技術によれば、業務サーバS自身が保有するストレージの空き領域が増加した場合に仮想領域Vに組み込むことで、ストレージシステム100におけるストレージの有効活用を図ることができる。
また、空き容量を判断することで、空き容量に応じたパーティションを空き領域として特定することができるため、業務サーバSの物理ディスクDb内において、仮想領域Vとなるパーティションと業務サーバSが専有するパーティションが混在していても問題はなく、リソースの効率的な活用を実現することができる。
さらに、業務サーバS自身が保有するストレージの空き領域が減少した場合に仮想領域Vから切り離すことで、業務サーバSの空き容量が逼迫した場合にも対処することができる。したがって、業務サーバSにおけるストレージの有効活用を図ることができる。
なお、本実施の形態で説明したストレージ制御方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。ストレージ制御プログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またストレージ制御プログラムは、インターネット等のネットワークを介して配布してもよい。
CP 制御ノード
DP ディスクノード
Da,Db 物理ディスク
MP 管理ノード
S 業務サーバ
V 仮想領域
100 ストレージシステム
101 データセンタ
102 業務システム
300 業務サーバ一覧テーブル
400 論理ディスク構成テーブル
500 ディスクノード一覧テーブル
1101 検出部
1102 空き容量判断部
1103 特定部
1104 使用率判断部
1105 設定部

Claims (5)

  1. 複数のサーバで共有可能なストレージ群を制御する制御サーバにより前記ストレージ群の記憶領域の中から前記各サーバが使用できる記憶領域を設定するストレージシステムを構成するコンピュータを、
    前記複数のサーバの中から選ばれた特定のサーバのみ使用する前記ストレージ群以外の特定のストレージの空き容量を検出する検出手段、
    前記特定のストレージの中から前記検出手段によって検出された空き容量に応じた空き領域を特定する特定手段、
    前記特定手段によって特定された空き領域を、前記サーバ群で共有可能な共有記憶領域に設定する設定手段、
    として機能させることを特徴とするストレージ制御プログラム。
  2. 前記コンピュータを、
    前記検出手段によって検出された空き容量が所定の空き容量以上であるか否かを判断する空き容量判断手段として機能させ、
    前記特定手段は、
    前記空き容量判断手段によって前記所定の空き容量以上であると判断された場合、前記特定のストレージの中から前記検出手段によって検出された空き容量に応じた空き領域を特定することを特徴とする請求項1に記載のストレージ制御プログラム。
  3. 前記コンピュータを、
    前記特定のストレージのうち前記設定手段によって設定された共有記憶領域を除く残余の記憶領域の使用率が所定の使用率以上であるか否かを判断する使用率判断手段として機能させ、
    前記設定手段は、
    前記使用率判断手段によって前記所定の使用率以上であると判断された場合、前記共有記憶領域を、前記特定のサーバのみ使用する記憶領域に設定することを特徴とすることを特徴とする請求項1または2に記載のストレージ制御プログラム。
  4. 複数のサーバで共有可能なストレージ群を制御する制御サーバにより前記ストレージ群の記憶領域の中から前記各サーバが使用できる記憶領域を設定するストレージシステムにおいて、
    前記複数のサーバの中から選ばれた特定のサーバのみ使用する前記ストレージ群以外の特定のストレージの空き容量を検出する検出手段と、
    前記特定のストレージの中から前記検出手段によって検出された空き容量に応じた空き領域を特定する特定手段と、
    前記特定手段によって特定された空き領域を、前記サーバ群で共有可能な共有記憶領域に設定する設定手段と、
    を備えることを特徴とするストレージシステム。
  5. 複数のサーバで共有可能なストレージ群を制御する制御サーバにより前記ストレージ群の記憶領域の中から前記各サーバが使用できる記憶領域を設定するストレージシステムを構成するコンピュータが、
    前記複数のサーバの中から選ばれた特定のサーバのみ使用する前記ストレージ群以外の特定のストレージの空き容量を検出する検出工程と、
    前記特定のストレージの中から前記検出工程によって検出された空き容量に応じた空き領域を特定する特定工程と、
    前記特定工程によって特定された空き領域を、前記サーバ群で共有可能な共有記憶領域に設定する設定工程と、
    を実行することを特徴とするストレージ制御方法。
JP2009097916A 2009-04-14 2009-04-14 ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法 Expired - Fee Related JP5182201B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009097916A JP5182201B2 (ja) 2009-04-14 2009-04-14 ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法
US12/751,566 US8856485B2 (en) 2009-04-14 2010-03-31 Storage system and storage control method
GB1005490.6A GB2469555B (en) 2009-04-14 2010-04-01 Storage system and storage control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009097916A JP5182201B2 (ja) 2009-04-14 2009-04-14 ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法

Publications (2)

Publication Number Publication Date
JP2010250476A true JP2010250476A (ja) 2010-11-04
JP5182201B2 JP5182201B2 (ja) 2013-04-17

Family

ID=42935266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009097916A Expired - Fee Related JP5182201B2 (ja) 2009-04-14 2009-04-14 ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法

Country Status (3)

Country Link
US (1) US8856485B2 (ja)
JP (1) JP5182201B2 (ja)
GB (1) GB2469555B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538926B2 (en) * 2011-03-08 2013-09-17 Rackspace Us, Inc. Massively scalable object storage system for storing object replicas
US9143410B1 (en) * 2011-12-21 2015-09-22 Symantec Corporation Techniques for monitoring guest domains configured with alternate I/O domains

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334006A (ja) * 1992-06-04 1993-12-17 Mitsubishi Electric Corp 論理ボリュームシステム
JP2001318905A (ja) * 2000-05-02 2001-11-16 Matsushita Electric Ind Co Ltd ディスク共有型分散サーバシステム
JP2003323329A (ja) * 2002-05-07 2003-11-14 Fujitsu Ltd 分散ファイル管理方法及びプログラム
JP2004139200A (ja) * 2002-10-16 2004-05-13 Fujitsu Ltd ファイル管理プログラム及びファイル管理装置
JP2005107645A (ja) * 2003-09-29 2005-04-21 Hitachi Ltd 記憶システム及び記憶制御装置
JP2006106901A (ja) * 2004-09-30 2006-04-20 Nippon Digital Kenkyusho:Kk 仮想サーバ、そのコンピュータ、およびコンピュータが実行するためのプログラム
JP2006235751A (ja) * 2005-02-22 2006-09-07 Yamaha Corp 仮想ストレージ装置、仮想ストレージ方法およびプログラム
JP2007087083A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 情報処理装置および記憶デバイス共有方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09223047A (ja) 1996-02-16 1997-08-26 Hitachi Ltd コンピュータネットワークの制御方法
WO2002065329A1 (en) * 2001-02-14 2002-08-22 The Escher Group, Ltd. Peer-to peer enterprise storage
US6898634B2 (en) * 2001-03-06 2005-05-24 Hewlett-Packard Development Company, L.P. Apparatus and method for configuring storage capacity on a network for common use
US7136981B2 (en) * 2001-09-13 2006-11-14 Conocophillips Company Method and apparatus for creating a virtual storage volume with a file size independent of a file size limitation
US7269630B2 (en) * 2001-10-17 2007-09-11 International Business Machines Corporation Automatically switching shared remote devices in a dense server environment thereby allowing the remote devices to function as a local device
US7139809B2 (en) * 2001-11-21 2006-11-21 Clearcube Technology, Inc. System and method for providing virtual network attached storage using excess distributed storage capacity
US7000088B1 (en) * 2002-12-27 2006-02-14 Storage Technology Corporation System and method for quality of service management in a partitioned storage device or subsystem
US20040153481A1 (en) * 2003-01-21 2004-08-05 Srikrishna Talluri Method and system for effective utilization of data storage capacity
JP2004234058A (ja) 2003-01-28 2004-08-19 Mitsubishi Electric Corp ストレージ管理システム
JP4404292B2 (ja) 2003-06-16 2010-01-27 富士通株式会社 データ割当方法、プログラム及びストレージシステム
US7499980B2 (en) * 2004-08-19 2009-03-03 International Business Machines Corporation System and method for an on-demand peer-to-peer storage virtualization infrastructure
WO2007026380A2 (en) 2005-08-29 2007-03-08 Hewlett-Packard Development Company, L.P. A method or apparatus for providing storage in a network
US8713127B2 (en) * 2008-02-05 2014-04-29 Novell, Inc. Techniques for distributed storage aggregation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334006A (ja) * 1992-06-04 1993-12-17 Mitsubishi Electric Corp 論理ボリュームシステム
JP2001318905A (ja) * 2000-05-02 2001-11-16 Matsushita Electric Ind Co Ltd ディスク共有型分散サーバシステム
JP2003323329A (ja) * 2002-05-07 2003-11-14 Fujitsu Ltd 分散ファイル管理方法及びプログラム
JP2004139200A (ja) * 2002-10-16 2004-05-13 Fujitsu Ltd ファイル管理プログラム及びファイル管理装置
JP2005107645A (ja) * 2003-09-29 2005-04-21 Hitachi Ltd 記憶システム及び記憶制御装置
JP2006106901A (ja) * 2004-09-30 2006-04-20 Nippon Digital Kenkyusho:Kk 仮想サーバ、そのコンピュータ、およびコンピュータが実行するためのプログラム
JP2006235751A (ja) * 2005-02-22 2006-09-07 Yamaha Corp 仮想ストレージ装置、仮想ストレージ方法およびプログラム
JP2007087083A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 情報処理装置および記憶デバイス共有方法

Also Published As

Publication number Publication date
GB2469555A (en) 2010-10-20
GB201005490D0 (en) 2010-05-19
GB2469555B (en) 2014-01-29
JP5182201B2 (ja) 2013-04-17
US20100262803A1 (en) 2010-10-14
US8856485B2 (en) 2014-10-07

Similar Documents

Publication Publication Date Title
JP4438807B2 (ja) 仮想マシンシステム、管理サーバ、仮想マシン移行方法及びプログラム
US7966470B2 (en) Apparatus and method for managing logical volume in distributed storage systems
US8103826B2 (en) Volume management for network-type storage devices
JP4733461B2 (ja) 計算機システム、管理計算機及び論理記憶領域の管理方法
JP4841632B2 (ja) ロジカル・パーティションにプロセッサを割り当てるための方法、装置、およびプログラム
JP5931196B2 (ja) I/oノード及び複数の計算ノードに備えられたキャッシュメモリの制御方法
US20100251255A1 (en) Server device, computer system, recording medium and virtual computer moving method
US8386707B2 (en) Virtual disk management program, storage device management program, multinode storage system, and virtual disk managing method
JP2007066259A (ja) 計算機システムとストレージシステム並びにボリューム容量拡張方法
JP2010108409A (ja) ストレージ管理方法及び管理サーバ
US20180046509A1 (en) Management system for computer system
JP2008059353A (ja) 仮想化システム及び領域割当て制御方法
JP2006215868A (ja) バックアップ生成装置、リカバリ処理装置、バックアップ生成方法、リカバリ処理方法、及びプログラム
JP2006293459A (ja) 負荷分散コンピュータシステム、経路設定プログラム及びその方法
JP5104855B2 (ja) 負荷分散プログラム、負荷分散方法、及びストレージ管理装置
JP2010191524A (ja) 管理計算機及び処理管理方法
JP2012514778A (ja) ストレージシステム及びストレージシステムの処理効率向上方法
US10552224B2 (en) Computer system including server storage system
JP2005321913A (ja) ファイル共有装置を有する計算機システム、および、ファイル共有装置の移行方法
JP5182201B2 (ja) ストレージ制御プログラム、ストレージシステム、およびストレージ制御方法
JP2010113587A (ja) ストレージシステムおよびストレージシステムによるファイルシステムの管理方法
JP2012073825A (ja) 計算機システム及び計算機システムの管理方法
JP2011070464A (ja) 計算機システム及び計算機システムの性能管理方法
JP5250368B2 (ja) 計算機システムおよび計算機システムにおける容量管理方法
JP2006252202A (ja) データ記録方法、データ記録プログラム、記録媒体、およびデータ記録装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121231

R150 Certificate of patent or registration of utility model

Ref document number: 5182201

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees