JP2010009476A - コンピュータシステム - Google Patents
コンピュータシステム Download PDFInfo
- Publication number
- JP2010009476A JP2010009476A JP2008170634A JP2008170634A JP2010009476A JP 2010009476 A JP2010009476 A JP 2010009476A JP 2008170634 A JP2008170634 A JP 2008170634A JP 2008170634 A JP2008170634 A JP 2008170634A JP 2010009476 A JP2010009476 A JP 2010009476A
- Authority
- JP
- Japan
- Prior art keywords
- disk
- server
- spare
- controller
- spare disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】
サーバが使用するRAIDの予備ディスクの運用を効率的に行い、かつシステム運用上使用可能な、サーバに内臓されたディスクの総容量を十分に確保する。
【解決手段】
それぞれディスクを内蔵する複数のサーバを含むコンピュータシステムにおいて、情報を記憶するディスクと、ディスクにパーティションを作成して、サーバによって使用される予備ディスクを形成するコントローラとを持つ、複数のサーバに共通に接続されるディスク共用システムを有する。コントローラは、複数のいずれかのサーバからの予備ディスクの割り当ての要求に従って予備ディスクを自動的に作成し、要求元のサーバに対してその予備ディスクを割り当てる。
【選択図】図1
サーバが使用するRAIDの予備ディスクの運用を効率的に行い、かつシステム運用上使用可能な、サーバに内臓されたディスクの総容量を十分に確保する。
【解決手段】
それぞれディスクを内蔵する複数のサーバを含むコンピュータシステムにおいて、情報を記憶するディスクと、ディスクにパーティションを作成して、サーバによって使用される予備ディスクを形成するコントローラとを持つ、複数のサーバに共通に接続されるディスク共用システムを有する。コントローラは、複数のいずれかのサーバからの予備ディスクの割り当ての要求に従って予備ディスクを自動的に作成し、要求元のサーバに対してその予備ディスクを割り当てる。
【選択図】図1
Description
本発明は、コンピュータシステムに係り、特にコンピュータシステムを構成するサーバに内蔵されるディスクに対する予備ディスクを効率的に運用するため管理技術に関するものである。
コンピュータシステムを構成するサーバには、ディスク故障に対する信頼性を確保するために、RAIDが広く用いられている。RAIDには幾つかの方式があるが、耐故障性のあるRAID1、或いはRAID5もしくはこれらの複数を組み合わせたRAIDは、構成されるディスクの1つあるいは複数が故障しても、ディスク内のシステムのデータは故障していないディスクに全て保持されているため、システムの運用を継続することが可能である。
しかし、故障したディスクが存在するときに、更に他のディスクが故障した場合には、システムが停止してしまうので、システム運用上大きなリスクを伴う。
RAIDを構成するディスクが故障している時間を最小限に抑えるための方式として、ホットスタンバイの機能がある。ホットスタンバイとは、RAIDを構成するディスクが故障した場合を想定して、予め交換用の予備ディスクをサーバに内蔵しておき、ディスクの故障が発生した時に、故障したディスクを予備ディスクに切り替えて使用することで、本来のRAID構成に即座に復旧開始する機能である。
RAIDを構成するディスクが故障している時間を最小限に抑えるための方式として、ホットスタンバイの機能がある。ホットスタンバイとは、RAIDを構成するディスクが故障した場合を想定して、予め交換用の予備ディスクをサーバに内蔵しておき、ディスクの故障が発生した時に、故障したディスクを予備ディスクに切り替えて使用することで、本来のRAID構成に即座に復旧開始する機能である。
通常、サーバはディスクを内蔵するために、複数のスロット(ディスクの挿入口)を用意しているが、筐体の設置領域の制限により、ディスク用スロットの数には限りがある。ホットスタンバイ機能は、この内蔵ディスクスロットの1スロットもしくは、複数のスロットを予備ディスク用として使用する。
また、予備ディスクの管理技術に関して、特許文献1には、稼動系及び待機系コンピュータシステムにおいて共有の代替ディスクをプールして管理しておき、ディスク障害発生時に自動的に予備ディスクを選定できる予備ディスクの管理方式が開示されている。
従来、ホットスタンバイはサーバの内蔵ディスクの一つあるいは複数を予備ディスクとして使用しているため、サーバの内蔵ディスクの最大搭載数(全てのスロット)をシステムの構成領域に利用できない、という欠点がある。
一方、サーバの高密度化のためサーバの筐体は小型化しており、内蔵ディスクの数も限られているため、総ディスク容量を可能な限り多く必要とするシステムでは、ホットスタンバイ用のディスクをサーバ筐体内に内蔵することは、その分総ディスク容量を減らしてしまうことにつながる。
一方、サーバの高密度化のためサーバの筐体は小型化しており、内蔵ディスクの数も限られているため、総ディスク容量を可能な限り多く必要とするシステムでは、ホットスタンバイ用のディスクをサーバ筐体内に内蔵することは、その分総ディスク容量を減らしてしまうことにつながる。
また、複数のサーバから構成されるシステムでは、各サーバが予備ディスクを保有することは、実際の故障率を考えた場合、構成されるサーバの台数が多くなるほど過剰な予備ディスクを用意することになる。更に、各サーバごとにRAIDを構成するディスク1台の容量が異なる場合は、複数の種類の保守用ディスクを用意する必要があり、ディスクコストの無駄となる。
本発明の目的は、サーバが使用するRAIDの予備ディスクの運用を効率的に行い、かつシステム運用上使用可能な、サーバに内臓されたディスクの総容量を十分に確保することにある。
本発明は、好ましくは、それぞれディスクを内蔵する複数のサーバを含むコンピュータシステムにおいて、情報を記憶するディスクと、該ディスクにパーティションを作成して、該サーバによって使用される予備ディスクを形成するコントローラとを持つ、該複数のサーバに共通に接続されるディスク共用システムを有し、
該コントローラは、該複数のいずれかのサーバからの予備ディスクの割り当ての要求に従って、予備ディスクを自動的に作成し、該要求元の該サーバに対して該予備ディスクを割り当てること特徴とするコンピュータシステムとして構成される。
該コントローラは、該複数のいずれかのサーバからの予備ディスクの割り当ての要求に従って、予備ディスクを自動的に作成し、該要求元の該サーバに対して該予備ディスクを割り当てること特徴とするコンピュータシステムとして構成される。
本発明の好ましい例によれば、複数のサーバによって構成されるコンピュータシステムであって、該各サーバと通信路を介して接続されるディスク共用システムを有し、
各サーバは、複数のディスクから成る第1のRAIDと、該RAIDを制御する第1のRAIDコントローラと、該第1のRAIDを構成する複数のディスクの内あるディスクが故障したときに、その故障ディスクの代替となる予備ディスクを作成するように該ディスク共用システムに要求すると共に、該ディスク共用システム内に作成された予備ディスクを該第1のRAIDの該故障ディスクの代替として割当てて管理する第1の予備ディスクコントローラと、を有し、
該ディスク共用システムは、複数のディスクから成る第2のRAIDと、該第2のRAIDを制御する第2のRAIDコントローラと、あるサーバの該第1の予備ディスクコントローラからの要求に応じて、該第2のRAIDのディスク領域に、代替となる予備ディスクを作成して管理する第2の予備ディスクコントローラと、を有する、ことを特徴とするコンピュータシステムとして構成される。
各サーバは、複数のディスクから成る第1のRAIDと、該RAIDを制御する第1のRAIDコントローラと、該第1のRAIDを構成する複数のディスクの内あるディスクが故障したときに、その故障ディスクの代替となる予備ディスクを作成するように該ディスク共用システムに要求すると共に、該ディスク共用システム内に作成された予備ディスクを該第1のRAIDの該故障ディスクの代替として割当てて管理する第1の予備ディスクコントローラと、を有し、
該ディスク共用システムは、複数のディスクから成る第2のRAIDと、該第2のRAIDを制御する第2のRAIDコントローラと、あるサーバの該第1の予備ディスクコントローラからの要求に応じて、該第2のRAIDのディスク領域に、代替となる予備ディスクを作成して管理する第2の予備ディスクコントローラと、を有する、ことを特徴とするコンピュータシステムとして構成される。
また、好ましくは、前記第2の予備ディスクコントローラは、前記サーバに対応して、該サーバのIPアドレス、該サーバが有する該第1のRAIDに関する情報、及び作成した前記予備ディスクに関する情報を管理する管理テーブルを有する。
また、好ましくは、前記サーバの前記故障ディスクが正常になったとき、前記第1の予備ディスクコントローラは前記第2の予備ディスクコントローラに対して、該サーバに割当てられた前記予備ディスクの切断を要求し、該第2の予備ディスクコントローラは、該サーバ用として作成した、前記第2のRAID上の前記予備ディスクを削除する。
本発明によれば、複数のサーバが有するRAIDを構成する予備ディスクを、サーバ外の所定の装置に共用化して集約することにより、各サーバ内のディスク全てをそのシステム運用に利用することが可能となる。また、サーバの外部に予備ディスクを接続してホットスタンバイの信頼性を確保することができ、かつその予備ディスクを効率的に運用することが可能である。
以下、図面を参照して、本発明の一実施例について説明する。
図1を参照するに、コンピュータシステムは、複数のサーバ1〜3と予備ディスク共用システムユニット5がスイッチングハブ4に接続して構成される。これら複数の処理ユニットは、例えばギガビットLANポート及びギガビットLANケーブルを介してスイッチングハブ4に接続される。
図1を参照するに、コンピュータシステムは、複数のサーバ1〜3と予備ディスク共用システムユニット5がスイッチングハブ4に接続して構成される。これら複数の処理ユニットは、例えばギガビットLANポート及びギガビットLANケーブルを介してスイッチングハブ4に接続される。
各サーバ1,3は同様の構成を成し、RAIDを構成する複数の内蔵ディスク101〜10nと、RAID10を制御するRAIDコントローラ12と、予備ディスクコントローラ13と、を有する。RADIコントローラ12はRAIDディスクポート14を有し、予備ディスクコントローラ13はiSCSIコントローラ15及び予備ディスクポート16を有する。
例えば、サーバ1において、RAIDコントローラ14にはn+m個のディスクポート14を有し、このうちn個のポートはサーバ1のディスク1からディスクnに接続されており、予備ディスク用のm個のポートは予備ディスクコントローラ13のm個の予備ディスクポートに接続されている。RAIDコントローラ12と予備ディスクコントローラ13は管理信号線で接続されており、RAID10の構成情報やディスク障害等の管理情報がこの管理信号線を通して転送される。本実施例で有用な管理情報としては、図2或いは図4に示す管理テーブルに含まれる情報である。
予備ディスク共用化システムユニット5は、複数p個のディスクから成るRAID50、RAID50を制御するRAIDコントローラ52、予備ディスクコントローラ53、p個のディスクポート54、及びiSCSIコントローラ55より構成される。
RAID構成されたp個のディスク領域は、必要な予備ディスクの容量の要求に応じて、予備ディスクコントローラ53の制御によりパーティションに区切ることが可能である。
予備ディスク共用化システムユニット5の予備ディスクコントローラ53は、各サーバ1、3の予備ディスクコントローラ13に対してマネージャであり、各サーバ1〜3の予備ディスクコントローラ13はクライアントとして機能する。
予備ディスク共用化システムユニット5の予備ディスクコントローラ53は、各サーバ1、3の予備ディスクコントローラ13に対してマネージャであり、各サーバ1〜3の予備ディスクコントローラ13はクライアントとして機能する。
予備ディスク共用化システムユニット5は、予備ディスクを必要とするサーバ1〜3が接続されたギガビットLANポートに接続される。予備ディスクコントローラ53は、ギガビットLANポートを介して各サーバ1〜3の予備ディスクコントローラ13との間でそのサーバのディスク管理情報を通信する。この管理情報は、図2又は図4に示した管理テーブルの情報と同様である。
また、予備ディスクコントローラ53と予備ディスク共用化システムユニット5のiSCSIコントローラ55により、予備ディスク使用時のディスクに読み書きするデータの通信を、iSCSIプロトコルを用いて行う。
また、予備ディスクコントローラ53と予備ディスク共用化システムユニット5のiSCSIコントローラ55により、予備ディスク使用時のディスクに読み書きするデータの通信を、iSCSIプロトコルを用いて行う。
予備ディスクコントローラ13は、サーバ1に内蔵されるディスクが故障したときに、管理信号線を通してサーバ1上のRAIDコントローラ12からディスク故障の情報を受け取り、予備ディスク共用化システムユニット5の予備ディスクコントローラ53に対して、予備ディスク用のディスク領域割り当てを要求する。この要求に対して、予備ディスクコントローラ53は予備ディスク共用化システムユニット5のRAID50内のディスク領域に、要求された予備ディスクと同じ容量のパーティションを自動的に作成し、このパーティションを予備ディスクコントローラ13に対して予備ディスクとして割り当てる。
予備ディスクコントローラ13は、予備ディスク共用化システムユニット5から割り当てられた予備ディスク領域を、RAIDコントローラ12上のディスクポート(n+1)からディスクポート(n+m)のいずれかに対して接続する。これにより、サーバ1のRAIDコントローラ12は予備ディスク共用化システムユニット5の割り当てられた領域に対してリビルドを開始する。
上述の手順は、サーバ1のRAIDコントローラ12、予備ディスクコントローラ13、及び予備ディスクコントローラ53が、サーバ1上のディスク故障時に自動的に行う。この方法によりサーバ1に内蔵のディスクを最大限に使用し、かつホットスタンバイの信頼性を有したRAID構成を実現することができる。
なお、他のサーバ3についても、サーバ1と同様に、各サーバに内蔵されている全てのディスクがRAID構成され、ギガビットLANポートを介して予備ディスク共用化システムユニット5に接続して、RAID50構成の予備ディスクを共用することができる。
各サーバ1〜3から予備ディスク共用化システムユニット5に共通にアクセス可能とすることで、システム全体で用意すべき予備ディスクは全て予備ディスク共用化システムユニット5に集約される。この場合、予備ディスク共用化システムユニット5で用意すべきディスクの数は、サーバ1〜サーバ3が個々に予備ディスクを保有する場合よりも少なくて済む。これは、サーバ1〜サーバ3の内蔵ディスクが同時に故障する確立が低いためである。
予備ディスクコントローラ53は、予備ディスクを提供する対象のサーバを新たに接続する際に、そのサーバからディスクの管理情報を取得する。
予備ディスクコントローラ53は、予備ディスクを提供する対象のサーバを新たに接続する際に、そのサーバからディスクの管理情報を取得する。
図2は、予備ディスクコントローラ53が有する、予備ディスクが接続された全サーバのディスク管理テーブルの例である。管理テーブル20は、各サーバに関する、サーバ名、IPアドレス、RAID種別、RAIDを構成する複数のディスク及びその容量、予備ディスクに関する情報を登録する。このように、管理テーブル20に所定の情報を登録して管理することで、予備ディスクコントローラ53は予備ディスクを管理することができる。
なお、サーバ上のディスクが故障した時、予備ディスク共用化システム5の予備ディスク領域に対してリビルドが行われるが、システムの運用管理者は必要なときに、故障した当該サーバ内のディスクを新しいものに交換する。このタイミングはリビルド中或いはリビルド完了後、何れでも実行可能である。サーバ上のRAIDコントローラ12は、当該サーバ内のディスクが新しいディスクに交換されたときに、予備ディスク共用化システム5内の予備ディスク領域を切断して、その新しいディスクに対してリビルドを実行する。
図3及び図4は具体的な構成例を示す。
図3に示すコンピュータシステムの基本的な構成は、図1のコンピュータシステムと同じである。20台のサーバ1〜3は、それぞれギガビットLANポートのスイッチングハブ4を介して予備ディスク共用化システムユニット5に接続している。各サーバ1〜3が有するRAID10は、6台のディスク(各ディスクの容量146GB)から成るRAID5(ファイブ)を構成している。
図3に示すコンピュータシステムの基本的な構成は、図1のコンピュータシステムと同じである。20台のサーバ1〜3は、それぞれギガビットLANポートのスイッチングハブ4を介して予備ディスク共用化システムユニット5に接続している。各サーバ1〜3が有するRAID10は、6台のディスク(各ディスクの容量146GB)から成るRAID5(ファイブ)を構成している。
RAIDコントローラ12は7つのRAIDディスクポート14を有し、#1−6までのポートにはRAID10を構成する6台のディスクが接続され、#7のポートには予備ディスクコントローラ13の予備ディスクポート16からの、1台分の予備ディスクの信号線が接続される。1台の予備ディスクは、予備ディスク共用システムユニット5に確保される。他の19台のサーバ2〜3も同様の構成である。
一方、予備ディスク共用化システムユニット5において、RAID50は4個のディスク(各ディスクの容量300GB)を有し、RAIDコントローラ52の制御の下、RAID5(ファイブ)を構成している。RAID構成される各ディスク領域は、必要な予備ディスクの容量の要求に応じて、予備ディスクコントローラ53の制御に従って、パーティションを区切ることが可能である。予備ディスクコントローラ53は、予備ディスクとして作成したパーティションを管理するためのパーティション管理テーブル(図示せず)も有している。
予備ディスクコントローラ53が持つディスク管理テーブル20は、図4に示すように、20台の各サーバのRAIDのディスク1〜6は、固有のIPアドレスを持つ各サーバに確保され、各サーバの予備ディスク(ディスク#7)は、予備ディスク共用システムユニット5内に確保されることを示している。
ここで、もし従来のように各サーバが1台の予備ディスクを有するとした場合、20台分の予備ディスクとして、総容量146×20=2920GBが必要になる。しかし、本実施例のように、各サーバが持つ予備ディスクを外部の予備ディスク共用化システムユニット5に集約することにより、4台の容量300GBのディスク、総容量1200GB(RAID5(ファイブ)構成なので利用可能な容量は300×3=900GB)で各サーバのRAID5(ファイブ)構成にホットスタンバイ機能をもたせることを可能である。
さらに予備ディスク共用化システム5のシステム(OSを含む)領域として4GBを使用するため、予備ディスク用パーティションを作成可能な実効的な容量は886GBで各サーバのRAID5(ファイブ)構成にホットスタンバイ機能をもたせることを可能としている。
実効的な容量は886GBしかないので、6台分(886÷146=6(余り10GB))の予備ディスク用パーティションを作成可能である。これは、全20台のサーバで同時にディスク故障が発生した場合は予備ディスクが不足することを意味するが、同時に故障が発生する可能性は極めて低いためこのような運用が可能である。
本実施例では、最悪6台のサーバのディスクが同時に故障する場合を想定した運用としているが、運用管理者は各サーバが内蔵するディスクの故障率を考慮して、適切なパーティション作成可能領域の大きさを決定し、それに必要な容量のディスクを予備ディスク共用化システムユニット5に用意する。
このように、本実施例によれば、予備ディスク共用化システムユニット5内に、各サーバの全て予備ディスクを集約したので、各サーバ内の6台のディスク全てを、そのサーバのシステム構成に利用することが可能となる。
従来は、各サーバの有するディスクの1台のディスク容量がサーバ毎に異なる場合、各種容量のディスクを用意する必要があったが、本実施例によれば予備ディスク共用化システムユニット5に搭載するディスクの1台の容量は1種類だけでよい。これは、予備ディスク共用化システムユニット5が自身のディスクをRAID構成し、その一部をパーティションで区切って予備ディスクとして使用するためで、システム設計者は各サーバが使用しているディスク1台の容量を意識することなく、システム全体で必要とする全ディスク容量に対して何割の容量の予備ディスクを確保しておくかを考慮すればよい。
次に、図5、図6を参照して、図3のコンピュータシステムのあるサーバにディスク故障が発生した場合における予備ディスク割り当て処理動作について説明する。なお、説明に際しては、図7〜図10に示す、管理テーブル及び予備ディスク用領域パーティションの管理テーブルの遷移についても併せて参照する。
システムの運用開始時には、例えばサーバ1のRAIDコントローラ12のディスク管理情報20、予備ディスクコントローラ53のディスク管理情報20、予備ディスク共用化システムユニット5の予備ディスク用領域パーティションの様子は、図7の(A1)、(B1)、(C1)のようになっている。即ち、サーバ1内には予備ディスクの領域は無いが、予備ディスク共用システムユニット5には予備ディスクとしてディスク7が確保されることを予定している。そこで、予備ディスクコントローラ53のディスク管理情報20には、ディスク7は予備ディスクとして確保されるが、この段階では予備ディスク用のパーティションが割当てられていない(B1)。なお、この段階では予備ディスクは形成されておらず、予備ディスク用領域パーティション1には、システム領域のOSや管理情報を保管しているのみである(C1)。
この状態で、例えばサーバ1のディスク1で故障が発生した場合(S501)、RAIDコントローラ12はその故障を検知し、管理信号線を通して予備ディスクコントローラ13に対して、ディスク1の故障の情報と146GBの予備ディスク領域の割り当てを要求する(S502)。図7(A2)は、ディスク1に故障が発生したときの管理テーブルの状態を示す。この段階では、図7(B2)に示すように、予備ディスクコントローラ53側の管理テーブル20には未だ変化は無い。
この要求を受信した予備ディスクコントローラ13は、ギガビットLANポート及びスイッチングハブ4を介して、予備ディスクコントローラ53に対して、サーバ1のディスク1が故障し、146GBの予備ディスク領域を割り当てることを要求する(S503)。
予備ディスクコントローラ53は、予備ディスク割り当て要求を受信すると、RAID50のディスク領域に146GBの予備ディスク領域のパーティションを作成する(S504)。
予備ディスクコントローラ53は、パーティションの作成を完了すると、その作成したパーティションを、サーバ1の予備ディスクコントローラ13に対して割り当てる処理を行い、自身が管理するディスク管理テーブルを更新する(S505)。即ち、図7(C2)のように、サーバ1のディスク7(予備ディスク)用としてパーティション2が形成されたことを示す。また、図7(B3)のように、予備ディスクコントローラ53のディスク管理テーブル20には、サーバ1のディスク7に146GBの予備ディスク割り当てたことを登録する。
予備ディスクコントローラ53は、パーティションの作成を完了すると、その作成したパーティションを、サーバ1の予備ディスクコントローラ13に対して割り当てる処理を行い、自身が管理するディスク管理テーブルを更新する(S505)。即ち、図7(C2)のように、サーバ1のディスク7(予備ディスク)用としてパーティション2が形成されたことを示す。また、図7(B3)のように、予備ディスクコントローラ53のディスク管理テーブル20には、サーバ1のディスク7に146GBの予備ディスク割り当てたことを登録する。
予備ディスクコントローラ53から予備ディスクを割り当てられた、サーバ1の予備ディスクコントローラ13は、RAIDコントローラ12に対して、予備ディスク共用化システムユニット5から割り当てられた146GBの領域を、ディスク7のポートに対してマウントする(S506)。
この時点で初めて、サーバ1のRAIDコントローラ12はディスク7をホットスタンバイディスクとして認識し(図7(A3))、リビルドを開始する(S507)。
以上の処理が予備ディスク共用化システムユニットを利用した、予備ディスク割り当ての処理動作である。その後は、故障ディスクの交換、及び予備ディスクの切断処理に移る。
以上の処理が予備ディスク共用化システムユニットを利用した、予備ディスク割り当ての処理動作である。その後は、故障ディスクの交換、及び予備ディスクの切断処理に移る。
次に、図6を参照して、上述の処理によってサーバ1がリビルドを開始した後に、ディスク1を正常なディスク(新しいディスク)に交換し、ディスク1が故障する前の状態に復旧する処理動作について説明する。
これは、サーバ1が予備ディスク共用化システムユニット5の予備ディスク領域を使用している状態から、予備ディスク領域を使用していない状態に戻すために必要な処理である。この処理も、上述の予備ディスク割り当て処理と同様に、システムが自動的に行う。
これは、サーバ1が予備ディスク共用化システムユニット5の予備ディスク領域を使用している状態から、予備ディスク領域を使用していない状態に戻すために必要な処理である。この処理も、上述の予備ディスク割り当て処理と同様に、システムが自動的に行う。
まず、サーバ1は予備ディスク共用化システムユニット1のRAID50の予備ディスク領域に対してリビルドしている途中、あるいはリビルド完了後に(S601)、システム運用管理者は故障したサーバ1のディスク1を新しいディスク(146GB)に交換する(S602)。この時の、サーバ1のRAIDコントローラ12のディスク管理情報は、図8(A4)の通りである。なお、予備ディスクコントローラのサーバ1のディスク管理情報(B4)及び予備ディスク用領域パーティション(C4)は、(B3)、(C2)と同じ状態である。
サーバ1のRAIDコントローラ12は予備ディスク用のディスク7よりも、サーバ内蔵のディスク1からディスク6を用いた運用を優先するように設計されており、これにより、RAIDコントローラ12は、新しいディスクがディスク1に挿入されたことを認識して、ディスク7に対するデータ読み書きを停止し、さらに予備ディスクコントローラ13に対して、ディスク7の切断を要求する(S603)。
予備ディスクコントローラ13はこの切断要求を受け、予備ディスク共用システムユニット5の予備ディスクコントローラ53に対して、サーバ1に割り当てていた容量146GBの予備ディスク切断を要求する(S604)。
予備ディスクコントローラ13はこの切断要求を受け、予備ディスク共用システムユニット5の予備ディスクコントローラ53に対して、サーバ1に割り当てていた容量146GBの予備ディスク切断を要求する(S604)。
予備ディスクコントローラ53は予備ディスク切断の要求を受け、サーバ1に対するディスク割り当てを解除して、サーバ1が使用していたパーティションを削除する(S605)。更に、予備ディスクコントローラ53は、サーバ1の予備ディスクコントローラ13に対して、予備ディスク割り当て解除完了を報告する(S606)。この時の、予備ディスクコントローラのサーバ1のディスク管理情報及び予備ディスク用領域パーティションは、図8(B5)、(C5)の通りである。予備ディスク(ディスク7)は開放され、パーティション2は削除されて空き領域となる。なお、サーバ1のRAIDコントローラ12のディスク管理情報は、(A4)と同じ状態である。
予備ディスクコントローラ53から予備ディスク割り当てを解除された後、サーバ1の予備ディスクコントローラ13は、RAIDコントローラ12に対して、ディスク7の切断を行う(S607)。これにより、RAIDコントローラ12のRAIDディスクポートのうち、ディスク7のディスクは「なし」(接続なし)の状態になる。この時の、サーバ1のRAIDコントローラ12のディスク管理情報はディスク7が無しの状態となり(A6)、予備ディスクコントローラのサーバ1のディスク管理情報はディスク7の割当てが無しの状態となる(B6)。
サーバ1が認識していたディスク7が切断された後、サーバ1のRAIDコントローラは、交換された新しいディスク1を利用可能なディスクとして認識し、リビルドを開始する(S608)。
以上の処理が実行された後、リビルド完了によりサーバシステムはディスク故障前の運用状態に戻る(S609)。
以上の処理が実行された後、リビルド完了によりサーバシステムはディスク故障前の運用状態に戻る(S609)。
上記の例では、1台のサーバ(サーバ1)のディスクが故障した場合について説明したが、2台以上のサーバのディスクが故障した場合の予備ディスク割り当て、切断の流れも同様である。
ただし、前述のように本実施例では、最悪6台のサーバのディスクが同時に故障する場合を想定した運用としているため、6台のサーバでディスクが故障し、予備ディスク共用化システムの予備ディスク用パーティション作成領域に空きがない時は、7台目のサーバでディスク故障が発生しても、予備ディスク用パーティションは作成できない。このため、システム運用管理者は、このような問題が発生しないよう、予備ディスク共用化システムに用意するディスク容量を適切に定めることが重要がある。
ただし、前述のように本実施例では、最悪6台のサーバのディスクが同時に故障する場合を想定した運用としているため、6台のサーバでディスクが故障し、予備ディスク共用化システムの予備ディスク用パーティション作成領域に空きがない時は、7台目のサーバでディスク故障が発生しても、予備ディスク用パーティションは作成できない。このため、システム運用管理者は、このような問題が発生しないよう、予備ディスク共用化システムに用意するディスク容量を適切に定めることが重要がある。
また、システム運用管理者は、予備ディスク共用化システムの予備ディスク用パーティション作成領域が全て予備ディスク用パーティションで占領される前に、サーバシステムの故障したディスクを、新しいディスクに交換し、予備ディスク用パーティションを速やかに開放(パーティション削除)するように運用することが重要である。この運用の一例として、サーバシステムのディスク故障を監視したり、予備ディスク共用化システムの予備ディスク用パーティション作成領域使用量を監視することが上げられる。
1,3:サーバ 4:スイッチングハブ 5:予備ディスク共用システムユニット
10:RAID 101〜10n:内蔵ディスク
12:RAIDコントローラ 13:予備ディスクコントローラ
14:RAIDディスクポート 15:iSCSIコントローラ
16:予備ディスクポート
50:RAID 501〜50n:内蔵ディスク 52:RAIDコントローラ
53:予備ディスクコントローラ 54:RAIDディスクポート
55:iSCSIコントローラ。
10:RAID 101〜10n:内蔵ディスク
12:RAIDコントローラ 13:予備ディスクコントローラ
14:RAIDディスクポート 15:iSCSIコントローラ
16:予備ディスクポート
50:RAID 501〜50n:内蔵ディスク 52:RAIDコントローラ
53:予備ディスクコントローラ 54:RAIDディスクポート
55:iSCSIコントローラ。
Claims (4)
- それぞれディスクを内蔵する複数のサーバを含むコンピュータシステムにおいて、
情報を記憶するディスクと、該ディスクにパーティションを作成して、該サーバによって使用される予備ディスクを形成するコントローラとを持つ、該複数のサーバに共通に接続されるディスク共用システムを有し、
該コントローラは、該複数のいずれかのサーバからの予備ディスクの割り当ての要求に従って、予備ディスクを自動的に作成し、該要求元の該サーバに対して該予備ディスクを割り当てること特徴とするコンピュータシステム。 - 複数のサーバによって構成されるコンピュータシステムであって、
該各サーバと通信路を介して接続されるディスク共用システムを有し、
各サーバは、複数のディスクから成る第1のRAIDと、該RAIDを制御する第1のRAIDコントローラと、該第1のRAIDを構成する複数のディスクの内あるディスクが故障したときに、その故障ディスクの代替となる予備ディスクを作成するように該ディスク共用システムに要求すると共に、該ディスク共用システム内に作成された予備ディスクを該第1のRAIDの該故障ディスクの代替として割当てて管理する第1の予備ディスクコントローラと、を有し、
該ディスク共用システムは、複数のディスクから成る第2のRAIDと、該第2のRAIDを制御する第2のRAIDコントローラと、あるサーバの該第1の予備ディスクコントローラからの要求に応じて、該第2のRAIDのディスク領域に、代替となる予備ディスクを作成して管理する第2の予備ディスクコントローラと、を有する、ことを特徴とするコンピュータシステム。 - 前記第2の予備ディスクコントローラは、前記サーバに対応して、該サーバのIPアドレス、該サーバが有する該第1のRAIDに関する情報、及び作成した前記予備ディスクに関する情報を管理する管理テーブルを有することを特徴とする請求項2のコンピュータシステム。
- 前記サーバの前記故障ディスクが正常になったとき、前記第1の予備ディスクコントローラは前記第2の予備ディスクコントローラに対して、該サーバに割当てられた前記予備ディスクの切断を要求し、該第2の予備ディスクコントローラは、該サーバ用として作成した、前記第2のRAID上の前記予備ディスクを削除することを特徴とする請求項2又は3のコンピュータシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008170634A JP2010009476A (ja) | 2008-06-30 | 2008-06-30 | コンピュータシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008170634A JP2010009476A (ja) | 2008-06-30 | 2008-06-30 | コンピュータシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010009476A true JP2010009476A (ja) | 2010-01-14 |
Family
ID=41589854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008170634A Pending JP2010009476A (ja) | 2008-06-30 | 2008-06-30 | コンピュータシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010009476A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014106811A (ja) * | 2012-11-28 | 2014-06-09 | Nec System Technologies Ltd | 記憶装置、冗長性回復方法、およびプログラム |
JP2016189140A (ja) * | 2015-03-30 | 2016-11-04 | 日本電気株式会社 | 管理装置、ストレージ復旧システム、ストレージ復旧方法、及び管理プログラム |
-
2008
- 2008-06-30 JP JP2008170634A patent/JP2010009476A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014106811A (ja) * | 2012-11-28 | 2014-06-09 | Nec System Technologies Ltd | 記憶装置、冗長性回復方法、およびプログラム |
JP2016189140A (ja) * | 2015-03-30 | 2016-11-04 | 日本電気株式会社 | 管理装置、ストレージ復旧システム、ストレージ復旧方法、及び管理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9348724B2 (en) | Method and apparatus for maintaining a workload service level on a converged platform | |
US11137940B2 (en) | Storage system and control method thereof | |
US8151080B2 (en) | Storage system and management method thereof | |
US6598174B1 (en) | Method and apparatus for storage unit replacement in non-redundant array | |
US8234467B2 (en) | Storage management device, storage system control device, storage medium storing storage management program, and storage system | |
US8209505B2 (en) | Storage system and method of taking over logical unit in storage system | |
US20080201458A1 (en) | Method and apparatus for flexible access to storage facilities | |
US8010753B2 (en) | Systems and methods for temporarily transferring use of portions of partitioned memory between host computers | |
JP6212934B2 (ja) | ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法 | |
US20220413976A1 (en) | Method and System for Maintaining Storage Device Failure Tolerance in a Composable Infrastructure | |
US20150347047A1 (en) | Multilayered data storage methods and apparatus | |
WO2012112308A1 (en) | Power failure management in components of storage area network | |
JP2007328468A (ja) | ストレージシステム及びストレージシステムのボリューム管理方法 | |
CN110912991A (zh) | 一种基于超融合双节点高可用的实现方法 | |
CN104994168A (zh) | 分布式存储方法及分布式存储系统 | |
JP2010271808A (ja) | ストレージ装置及びデータコピー方法 | |
CN110674539B (zh) | 一种硬盘保护设备、方法及系统 | |
JP2010009476A (ja) | コンピュータシステム | |
JP6149205B2 (ja) | データ記憶装置 | |
US10768834B2 (en) | Methods for managing group objects with different service level objectives for an application and devices thereof | |
KR20160101705A (ko) | 공정 관리 장치, 이와 연동하는 데이터 서버를 포함하는 반도체 공정 관리 시스템 및 이를 이용한 반도체 공정 관리 방법 | |
US11366618B2 (en) | All flash array server and control method thereof | |
JP6905611B2 (ja) | 記憶システム及びその制御方法 | |
TW201432473A (zh) | 雲端網路硬碟陣列供應系統及其建構方法 | |
CN117271205A (zh) | 数据处理系统、数据处理方法、装置及相关设备 |