JP2014164431A - Redundant system, redundant method, storage device, and program - Google Patents
Redundant system, redundant method, storage device, and program Download PDFInfo
- Publication number
- JP2014164431A JP2014164431A JP2013033537A JP2013033537A JP2014164431A JP 2014164431 A JP2014164431 A JP 2014164431A JP 2013033537 A JP2013033537 A JP 2013033537A JP 2013033537 A JP2013033537 A JP 2013033537A JP 2014164431 A JP2014164431 A JP 2014164431A
- Authority
- JP
- Japan
- Prior art keywords
- path
- paths
- controller
- connection information
- host
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
Description
本発明は、冗長化システム、冗長化方法、記憶装置、及びプログラムに関する。 The present invention relates to a redundancy system, a redundancy method, a storage device, and a program.
従来、RAID(Redundant Arrays of Inexpensive Disks)に代表されるディスクアレイのようにHDD(Hard Disk Drive)などの磁気ディスクの集合からディスクプールを構成する記憶装置が知られている。また、例えば、特許文献1のように、記憶装置のディスクプール上の領域を論理的に分割した論理ディスクをネットワーク(例えばSAN(Storage Area Network))で接続された業務ホストから利用するシステムも存在する。
2. Description of the Related Art Conventionally, storage devices that make up a disk pool from a set of magnetic disks such as HDD (Hard Disk Drive) such as a disk array represented by RAID (Redundant Arrays of Inexpensive Disks) are known. Further, for example, as in
一般的に、ディスクアレイ装置にはRAIDを制御する複数のコントローラが搭載されており、業務ホストからディスクアレイ装置上の複数のコントローラに対して、それぞれ冗長化されたパスで接続する冗長構成が取られている。 Generally, a plurality of controllers that control RAID are installed in a disk array device, and a redundant configuration is adopted in which a business host connects to a plurality of controllers on the disk array device through redundant paths. It has been.
一方で、消費電力の上限が決められたシステムが近年増えてきている。サーバの場合ではラック単位で上限が設けられている例などがあり、ディスクアレイ装置にも消費電力を抑える要求が出てきている。例えば、特許文献2には、冗長性を考慮して、プロセッサアレイやハードディスクを停止させる技術が開示されている。また、特許文献3には、CPU(Central Processing Unit)のビジィ率に基づいて、CPUのクロック数を低下させる技術が開示されている。
On the other hand, the number of systems for which the upper limit of power consumption is determined has increased in recent years. In the case of a server, there is an example in which an upper limit is provided for each rack, and there is a demand for reducing the power consumption of the disk array device. For example,
しかしながら、ディスクアレイ装置と業務ホスト間に正常に接続されていない(例えば障害状態)パスが存在する場合、障害に関係のない正常なコントローラを停止してしまうと、冗長性が維持できず、業務に影響を与えてしまう恐れがある。 However, if there is a path that is not normally connected between the disk array device and the business host (for example, a failure status), if a normal controller not related to the failure is stopped, redundancy cannot be maintained and May be affected.
本発明は、このような問題を解決するためになされたものであり、パスに障害が発生した場合であっても、冗長性を維持したまま省電力化を実現することができる冗長化システム、冗長化方法、記憶装置、及びプログラムを提供することを目的としている。 The present invention has been made to solve such a problem, and even when a failure occurs in a path, a redundancy system capable of realizing power saving while maintaining redundancy, An object is to provide a redundancy method, a storage device, and a program.
本発明にかかる冗長化システムは、メモリと、当該メモリに対するデータの入出力を制御し、複数の第1のパスに接続された複数のコントローラと、を有する記憶装置と、複数の前記第1のパスを介して前記記憶装置と接続されたホスト装置と、複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得する第1の接続情報取得手段と、 前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記記憶装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させるコントローラ制御手段と、を備えるものである。 The redundancy system according to the present invention includes a memory, a storage device that controls input / output of data to / from the memory and is connected to a plurality of first paths, and a plurality of the first devices. A first connection information acquisition means for acquiring first path connection information indicating whether or not a plurality of the first paths can communicate with a host device connected to the storage device via a path; A controller that stops the operation of the controller based on one path connection information so as to maintain the connection between the storage device and the host device using the first communicable first path. And a control means.
本発明にかかる冗長化方法は、メモリと、当該メモリに対するデータの入出力を制御し、複数の第1のパスに接続された複数のコントローラと、を有する記憶装置と、複数の前記第1のパスを介して前記記憶装置と接続されたホスト装置と、を備えるシステムの冗長化方法であって、複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得するステップと、前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記記憶装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させるステップと、を備えるものである。 A redundancy method according to the present invention includes a memory, a storage device that controls input / output of data to / from the memory and is connected to a plurality of first paths, and a plurality of the first devices. A system redundancy method comprising: a host device connected to the storage device via a path, wherein first path connection information indicating whether or not a plurality of the first paths can communicate is acquired And at least two or more communicable first paths based on the first path connection information, so that the connection between the storage device and the host device is maintained. And a step of stopping the operation.
本発明にかかる記憶装置は、メモリと、前記メモリに対するデータの入出力を制御し、複数の第1のパスを介してホスト装置に接続された複数のコントローラと、複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得する第1の接続情報取得手段と、前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記コントローラとホスト装置との接続が維持されるように、前記コントローラの動作を停止させるコントローラ制御手段と、を備えるものである。 A storage device according to the present invention controls a memory, input / output of data to / from the memory, a plurality of controllers connected to a host device via a plurality of first paths, and a plurality of the first paths. First connection information acquisition means for acquiring first path connection information indicating whether or not communication is possible, and at least two or more first paths capable of communication based on the first path connection information. Controller control means for stopping the operation of the controller so as to maintain the connection between the used controller and the host device.
本発明にかかるプログラムは、メモリと、当該メモリに対するデータの入出力を制御し、複数の第1のパスに接続された複数のコントローラと、を有する記憶装置と、複数の前記第1のパスを介して前記記憶装置と接続されたホスト装置と、を備えるシステムを制御するプログラムであって、コンピュータに、複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得させるステップと、前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記記憶装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させるステップと、を実行させるものである。 A program according to the present invention controls a memory, a storage device that controls input / output of data to / from the memory, and is connected to a plurality of first paths, and a plurality of the first paths. A computer program for controlling a system including a host device connected to the storage device via the computer, and acquiring to the computer first path connection information indicating whether or not the plurality of first paths are communicable And the controller so as to maintain the connection between the storage device and the host device using at least two or more communicable first paths based on the first path connection information. The step of stopping the operation is executed.
本発明により、パスに障害が発生した場合であっても、冗長性を維持したまま省電力化を実現することができる冗長化システム、冗長化方法、記憶装置、及びプログラムを提供することができる。 According to the present invention, it is possible to provide a redundancy system, a redundancy method, a storage device, and a program capable of realizing power saving while maintaining redundancy even when a failure occurs in a path. .
以下、図面を参照して本発明の実施の形態について説明する。本実施の形態にかかる冗長化システムの構成を図1に示す。冗長化システムは、ディスクアレイ装置1(記憶装置)と、FC(ファイバチャネル)スイッチ41、42(中継装置)と、業務ホスト5、6(ホスト装置)と、を備える。ディスクアレイ装置1は、FCスイッチ41、42を介して、SANのネットワークを用いて業務ホスト5、6と接続されている。なお、業務ホストとは、図示しないクライアント端末からの要求に応じて、サービス提供や演算処理等を行うコンピュータである。
Embodiments of the present invention will be described below with reference to the drawings. The configuration of the redundant system according to this embodiment is shown in FIG. The redundant system includes a disk array device 1 (storage device), FC (fiber channel)
ディスクアレイ装置1は、性能管理手段11と、ポート制御手段12と、パス状態監視手段13と、コントローラ制御手段14と、性能管理テーブル15と、ポート状態管理テーブル16と、パス状態管理テーブル17と、ホスト情報管理テーブル18と、コントローラ21〜24と、論理ディスク3と、を備える。なお、性能管理手段11、ポート制御手段12、パス状態監視手段13、及びコントローラ制御手段14は、例えば、図示しないCPU(Central Processing Unit)が予め記憶された処理プログラムを実行することにより実現される。また、性能管理テーブル15、ポート状態管理テーブル16、パス状態管理テーブル17、及びホスト情報管理テーブル18は、図示しないメモリに格納される。
The
性能管理手段11(負荷情報取得手段)は、定期的に動作し、各コントローラ21〜24の負荷情報の統計的な計測を行う。なお、負荷情報とは、各コントローラ21〜24にかかる負荷を示す情報である。また、性能管理手段11は、計測した値、及び、計測した値の合計値を性能管理テーブル15に登録する。
The performance management means 11 (load information acquisition means) operates periodically and statistically measures the load information of the
性能管理手段11の動作について詳細に説明する。性能管理手段11は、ディスクアレイ装置1上において定期的に動作し、各コントローラ21〜24の負荷情報を取得して性能管理テーブル15を更新する。具体的には、性能管理手段11は、任意の時刻における各コントローラ21〜24の負荷情報として単位時間当たりのI/O数(IOPS(Input/Output Per Second))を取得する。IOPSの計測方法としては、I/O回数のカウンタを保持しておき、前回計測時と今回計測時の差分値をインターバルの時間で割った値を当該時刻のIOPSとして算出することができる。性能管理手段11は、各コントローラ21〜24において計測したIOPSを取得し、それらの値をIOPS統計値として性能管理テーブル15に登録する。また、性能管理手段11は、各コントローラ21〜24のIOPS統計値の総和を算出し、ディスクアレイ装置1全体のIOPS統計値(合計値)として性能管理テーブル15に登録する。
The operation of the
図2に性能管理テーブル15の一例を示す。性能管理テーブル15は、各コントローラ21〜24のI/O負荷の統計値とI/O負荷の限界値を格納する。また、性能管理テーブル15は、ディスクアレイ装置1全体に対するI/O負荷の統計値とI/O負荷の限界値を格納する。各コントローラ21〜24におけるI/O負荷の統計値には、過去24時間のIOPS値の平均値が記録される。また、IOPS限界値には、各コントローラ21〜24の性能限界IOPS値が記録される。また、ディスクアレイ装置1全体の統計値と限界値(合計値)には、全コントローラ21〜24の値の総和が記録される。
FIG. 2 shows an example of the performance management table 15. The performance management table 15 stores I / O load statistical values and I / O load limit values of the
なお、本実施例では、各コントローラ21〜24及びディスクアレイ装置1全体のIOPS限界値は、ベンダまたはユーザによって事前に値が登録されているものとする。なお、コントローラの変更などにより限界値が変動する可能性を考慮すると、手動または自動でIOPS限界値を更新してもよい。また、本実施例では、コントローラ21〜24の負情報の一例として、上記のようなIOPS値を用いているがこれに限られるものではない。例えば、より長い期間の平均を統計値として採用することや、性能保証限界値を限界値として採用するなどが考えられる。また、性能を計る指標もIOPSの他に、コントローラのCPU負荷(使用率など)や、キャッシュメモリの使用率を使う方法、それら全てを組み合わせて総合的に計測する方法などが考えられる。
In the present embodiment, it is assumed that the IOPS limit values of the
ポート制御手段12(第1の接続情報取得手段)は、定期的に動作し、各コントローラ21〜24の各ポートに接続されたパスが通信可能か否かを示すパス接続情報(第1のパス接続情報)を取得する。また、ポート制御手段12は、取得したパス接続情報をポート状態管理テーブル16に登録する。
The port control means 12 (first connection information acquisition means) operates periodically, and path connection information (first path) indicating whether or not the paths connected to the ports of the
ポート制御手段12の動作について詳細に説明する。ポート制御手段12は、ディスクアレイ装置1上において定期的に動作し、ディスクアレイ装置1上の各コントローラ21〜24の全ポートの接続状態(リンク状態)をポート状態管理テーブル16に登録する。ポート制御手段12は、コントローラ21〜24から、各コントローラが持つ全ポートの接続情報や障害情報を取得する。ポート制御手段12は、ポートがリンクアップ状態の場合は"UP"を、ポートが未使用またはパスの障害などによりポートがリンクダウン状態の場合は"DOWN"を、該当ポートのリンク状態としてポート状態管理テーブル16に登録する。つまり、ポート制御手段12は、各コントローラの全ポートについて、当該ポートに接続されたパスが通信可能(正常)であるか、通信不可能(異常)であるかを示す情報をポートの識別情報に対応づけてポート状態管理テーブル16に格納する。
The operation of the port control means 12 will be described in detail. The
図3にポート状態管理テーブル16の一例を示す。ポート状態管理テーブル16は、各コントローラ21〜24の各ポートの接続状態を管理するテーブルである。本実施例では、コントローラ21のポートのうち、FCスイッチ41と接続されているポートはコントローラ21−00というポート名(識別情報)を用いて登録され、FCスイッチ42と接続されているポートはコントローラ21−01というポート名を用いて登録されている。また、各ポートの接続状態は、ポート名と対応付けて格納されている。各ポートの接続(リンク)状態は、正常に接続されている場合はリンクアップ状態として"UP"、接続されていないか障害が発生している場合はリンクダウン状態として"DOWN"が登録される。
FIG. 3 shows an example of the port state management table 16. The port status management table 16 is a table for managing the connection status of each port of each
パス状態監視手段13(第2の接続情報取得手段)は、定期的に動作し、全ての業務ホスト5、6に接続された各パスのパス接続情報(第2のパス接続情報)を取得する。つまり、パス状態監視手段13は、業務ホスト5、6とFCスイッチ41、42との間を接続するパスのパス接続情報を取得する。また、パス状態監視手段13は、取得したパス接続情報をパス状態管理テーブル17に登録する。
The path status monitoring unit 13 (second connection information acquisition unit) operates periodically and acquires path connection information (second path connection information) of each path connected to all the business hosts 5 and 6. . That is, the path
パス状態監視手段13の動作について詳細に説明する。パス状態監視手段13は、ディスクアレイ装置1上において定期的に動作し、各業務ホスト5、6の全パスの接続状態(リンク状態)をパス状態管理テーブル17に登録する。パス状態監視手段13は、各業務ホスト5、6の全てのパスに対してFCプロトコルのプロセスログインが行われているかどうかを確認する。そして、パス状態監視手段13は、ログインが行われている場合はリンクアップ状態として"UP"を、ログインが行われていない場合はリンクダウン状態として"DOWN"をリンク状態としてパス状態管理テーブル17に登録する。つまり、パス状態監視手段13は、各業務ホスト5、6に接続された全パスについて、当該パスが通信可能(正常)であるか、通信不可能(異常)であるかを示す情報を業務ホストの識別情報(ホスト名)に対応づけてパス状態管理テーブル17に格納する。
The operation of the path
図4にパス状態管理テーブル17の一例を示す。パス状態管理テーブル17は、業務ホスト5、6を識別するためのホスト名と、業務ホスト5、6上からディスクアレイ装置1上の論理ディスク3を認識できるパスのパス名と、そのパスの接続(リンク)状態を表す情報と、が含まれる。ホスト名には、各業務ホスト5、6を識別できる名前が格納される。パス名には、HBAのWWPN(World Wide Port Name)値が登録される。
FIG. 4 shows an example of the path state management table 17. The path status management table 17 includes a host name for identifying the business hosts 5 and 6, a path name of a path that can recognize the
本実施例では、ホスト名とパス(WWNP)はユーザによって事前に登録されているものとする。また、各パスの接続状態には、正常に接続されている場合はリンクアップ状態として"UP"、接続されていないか障害が発生している場合はリンクダウン状態として"DOWN"が登録される。 In this embodiment, it is assumed that the host name and path (WWNP) are registered in advance by the user. As the connection status of each path, “UP” is registered as a link-up status when it is normally connected, and “DOWN” is registered as a link-down status when it is not connected or a failure has occurred. .
コントローラ制御手段14は、定期的あるいはコントローラ21〜24の省電力化を指示されたときに動作し、各コントローラ21〜24の負荷状態に基づいて、業務性能に影響を与えずに電源を停止できるコントローラの台数を判断する。また、コントローラ制御手段14は、コントローラ21〜24の各ポートの接続状態と各パスの接続状態に基づいて、どのコントローラを停止すればパスの冗長性を維持できるかを判断する。そして、コントローラ制御手段14は、上記の判断結果に基づいて、電源停止可能なコントローラの電源を停止する。なお、コントローラ制御手段14の動作の詳細は後述する。
The controller control means 14 operates periodically or when instructed to save the power of the
コントローラ21〜24は、ディスクアレイ装置1上においてデータのI/Oを制御する。本実施の形態においては、1つのコントローラには、2本のパスが接続されている(図1参照)。そのため、ディスクアレイ装置1全体として、8本のパスが接続されている。論理ディスク3は、例えば複数のHDD等のメモリから構成される記録媒体である。コントローラ21〜24の制御に応じて、論理ディスク3に対してデータの入出力が行われる。
The
FCスイッチ41、42は、冗長化されたSANのネットワークを構成するため、ネットワーク上にある全てのホストバスアダプタ(HBA)とFC接続される。FCスイッチ41は、コントローラ21〜24のそれぞれと接続されると共に、業務ホスト5、6のそれぞれと接続される。同様に、FCスイッチ42は、コントローラ21〜24のそれぞれと接続されると共に、業務ホスト5、6のそれぞれと接続される。なお。コントローラ21〜24と、FCスイッチ41、42と、の間を接続するパスが第1のパスであり、FCスイッチ41、42と、業務ホスト5、6と、の間を接続するパスが第2のパスである。
The FC switches 41 and 42 are FC-connected to all host bus adapters (HBAs) on the network in order to form a redundant SAN network. The
次に、業務ホスト5、6について説明する。業務ホスト5は、パス情報管理手段51と、パス制御手段52と、ホスト情報管理テーブル53と、を備える。同様に、業務ホスト6は、パス情報管理手段61と、パス制御手段62と、ホスト情報管理テーブル63と、を備える。なお、パス情報管理手段51、61と、パス制御手段52、62とは、例えば、図示しないCPUが予め記憶された処理プログラムを実行することにより実現される。また、ホスト情報管理テーブル53、63は、図示しないメモリに格納される。
Next, the business hosts 5 and 6 will be described. The
パス情報管理手段51は、定期的に動作し、ディスクアレイ装置1との通信に利用できるパスの数と、現在通信に使用しているパスを確認する。そして、パス情報管理手段51は、通信に利用できるパスの数と、使用パスのパス名と、をホスト情報管理テーブル53に登録する。また、ディスクアレイ装置1もホスト情報管理テーブル18を有する。業務ホスト5が有するホスト情報管理テーブル53は、業務ホスト5の情報のみが格納される。同様に、業務ホスト6が有するホスト情報管理テーブル63は、業務ホスト6の情報のみが格納される。一方、ディスクアレイ装置1が有するホスト情報管理テーブル18は、全業務ホスト5、6の情報が格納される。
The path information management means 51 operates periodically and confirms the number of paths that can be used for communication with the
図5にホスト情報管理テーブル18の一例を示す。ホスト情報管理テーブル18は、業務ホストを識別する情報であるホスト名と、そのホスト上でディスクアレイ装置1とのI/Oに使用できるパスの数と、現在使用しているパスの情報(業務ホスト側のHBAのWWPN値など)と、が含まれる。本実施例では、業務ホスト2台(5、6)がディスクアレイ装置1上のコントローラ4台(21〜24)に対して、FCスイッチ2台(41、42)を経由した冗長的なパスで接続されている。また、業務ホスト5に接続されたパスのうち、FCスイッチ41と接続されているHBAのWWNP(パス名)を"A0"とし、FCスイッチ42と接続されているHBAのWWNPを"A1"としている。業務ホスト6についても同様に、FCスイッチ41と接続されているHBAのWWNPを"B0"とし、FCスイッチ42と接続されているHBAのWWNPを"B1"としている(図1参照)。
FIG. 5 shows an example of the host information management table 18. The host information management table 18 includes a host name that is information for identifying a business host, the number of paths that can be used for I / O with the
パス制御手段52(パス切替手段)は、定期的あるいは現在使用しているパスの状態が使用不可状態になったときに動作し、業務ホスト5が使用するパスを切り替える。具体的には、パス制御手段52は、パスの切り替えが必要で、切り替えるパスが存在し、かつそのパスが正常に接続されている条件のときに、使用するパスを切り替える。
The path control means 52 (path switching means) operates periodically or when the currently used path becomes unavailable, and switches the path used by the
続いて、本実施の形態にかかるディスクアレイ装置1の動作について、図6に示すフローチャートを参照して説明する。はじめに、性能管理手段11が、各コントローラ21〜24の負荷情報を取得して性能管理テーブル15を更新する(ステップS101)。
Next, the operation of the
次に、ポート制御手段12が、各コントローラ21〜24の各ポートに接続されたパスが通信可能か否かを示すパス接続情報(第1のパス接続情報)を取得し、ポート状態管理テーブル16を更新する(ステップS102)。
Next, the
次に、パス状態監視手段13が、全ての業務ホスト5、6に接続された各パスのパス接続情報(第2のパス接続情報)を取得し、パス状態管理テーブル17を更新する(ステップS103)。
Next, the path
ステップS101〜S103においてディスクアレイ装置1の各テーブルが更新されると、コントローラ制御手段14は、各テーブルの情報に基づいて、コントローラの動作を停止させる。まず、コントローラ制御手段14は、性能管理テーブル15を参照して、各コントローラ21〜24の負荷状態を確認する(ステップS104)。そして、コントローラ制御手段14は、コントローラを停止したときに、業務性能への影響があるかどうかを判定する(ステップS105)。
When each table of the
具体的には、コントローラ制御手段14は、あるコントローラを停止させた場合に、残りのコントローラのIOPS限界値の総和が、その時点におけるディスクアレイ全体のIOPS統計値を上回っているか否かを判定する。例えば、本実施例の場合、コントローラ23を停止したときのIOPS限界値の総和は900となり、その時点のIOPS統計値の総和である700を上回っている。このため、コントローラ制御手段14は、コントローラ23を停止しても業務性能への影響が無いと判断できる。
Specifically, when a certain controller is stopped, the
業務性能への影響が無い場合(ステップS105:Yes)、コントローラ制御手段14は、ポート状態管理テーブル16とパス状態管理テーブル17とを参照して、ディスクアレイ装置1と業務ホスト5、6間の接続状態を確認する(ステップS106)。一方、業務性能への影響がある場合(ステップS105:No)、コントローラ制御手段14は、動作を終了する。
When there is no influence on the business performance (step S105: Yes), the controller control means 14 refers to the port status management table 16 and the path status management table 17 to establish a connection between the
次に、コントローラ制御手段14は、ポート状態管理テーブル16とパス状態管理テーブル17とに基づいて、ステップS105において特定したコントローラ(業務性能に影響が出ないコントローラ)を停止しても冗長性が維持されるか否かを判定する(ステップS107)。具体的には、コントローラ制御手段14は、コントローラ21〜24とFCスイッチ41、42との間に通信可能なパスが2本以上存在し、かつ、FCスイッチ41、42と業務ホスト5(または業務ホスト6)との間に通信可能なパスが2本以上存在するか否かを判定する。
Next, the
例えば、本実施例の場合、ポート状態管理テーブル16を参照すると、コントローラ23のポートの接続がなくなっても、他のコントローラ21、22、24とFCスイッチ41、42との間にはパスが2本ずつ存在している。このため、コントローラ制御手段14は、ディスクアレイ装置1とFCスイッチ41、42との間では冗長性が維持できていると判定できる。
For example, in the case of this embodiment, referring to the port state management table 16, there are two paths between the
また、パス状態管理テーブル17参照すると、業務ホスト5、6とFCスイッチ41、42と間においても、パスが2本ずつ存在している。このとき、コントローラ制御手段14は、業務ホストとFCスイッチとの間のパス数と、FCスイッチとコントローラとの間のパス数と、のうち数の少ない方が、そのコントローラと業務ホスト間のパスの数と判断できる。
Further, referring to the path status management table 17, two paths exist between the business hosts 5 and 6 and the FC switches 41 and 42. At this time, the
例えば、コントローラ21に注目してみると、コントローラ21とFCスイッチ41、42と間にも、業務ホスト5とFCスイッチ41、42との間にも、パスが2本ずつ存在している。このため、コントローラ制御手段14は、コントローラ21と業務ホスト5との間には2本以上のパスが存在していると判定できる。また、他のコントローラ22〜24についても同様に判断できる。本実施例では、コントローラ23が停止状態になっても、コントローラ21、22、24とFCスイッチ41、42との間に通信可能なパスが2本以上存在する。また、FCスイッチ41、42と業務ホスト5との間に通信可能なパスが2本以上存在する。そのため、コントローラ制御手段14は、業務ホスト5とディスクアレイ装置1との間の冗長性が維持できると判断できる。
For example, when attention is paid to the
一方、コントローラ21とFCスイッチ41、42との間か、業務ホスト5とFCスイッチ41、42との間のパスのどちらかが1本しかない場合や、どちらも1本の場合は、コントローラ制御手段14は、コントローラ21と業務ホスト5との間のパスは1本しかないと判断できる。
On the other hand, if there is only one path between the
コントローラ制御手段14は、ステップS105、S107において、業務の性能要件を満たし、冗長性を維持できると判断できた場合は、ステップS105において特定したコントローラを停止させる(ステップS108)。
If it is determined in steps S105 and S107 that the business performance requirements are satisfied and the redundancy can be maintained, the
なお、性能管理テーブル15、ポート状態管理テーブル16、及びパス状態管理テーブル17の更新順序(ステップS101〜S103)は、上記の順番に限られるものではない。また、これらのテーブルを参照して、コントローラ制御手段14が判断する順序も上記の順番に限られるものではなく、異なる順番で参照・判断しても、全ての条件が満たされれば良い。
Note that the update order of the performance management table 15, the port state management table 16, and the path state management table 17 (steps S101 to S103) is not limited to the above order. In addition, the order in which the
次に、業務ホスト5のパス制御手段52の動作について、図7に示すフローチャートを参照して説明する。まず、パス情報管理手段51が、業務ホスト5に接続されたパスのうち、ディスクアレイ装置1との通信に利用できるパスの数と、現在通信に使用しているパスを確認し、ホスト情報管理テーブル53を更新する。同様に、パス情報管理手段51が、業務ホスト6に接続されたパスのうち、ディスクアレイ装置1との通信に利用できるパスの数と、現在通信に使用しているパスを確認し、ホスト情報管理テーブル63を更新する。また、ディスクアレイ装置1は、それぞれの業務ホスト5、6のホスト情報管理テーブル53、63に格納された情報を取得し、ホスト情報管理テーブル18を更新する(ステップS201)。
Next, the operation of the path control means 52 of the
次に、パス制御手段52は、現在業務ホスト5が使用しているパスが使用不可状態になったときか、ホスト情報管理テーブル53が更新されたときに動作し、パスの切り替えが必要で切り替えるパスが存在する場合に、使用するパスを切り替える。具体的には、パス制御手段52は、現在使用しているパスが正常に接続されているか否かを判定する(ステップS202)。例えば、ディスクアレイ装置1へのI/Oが継続できない(失敗する)状態が検出された場合や、パス状態管理テーブル17のリンク状態が"DOWN"になっている場合に、パス制御手段52は、現在使用しているパスが正常に接続されていない状態であると判定できる。
Next, the path control
現在使用しているパスが正常に接続されていない場合(ステップS202:Yes)、パス制御手段52は、パスの切り替えが必要であると判断し、他に正常なパスがあるかどうかを判定する(ステップS203)。
If the currently used path is not normally connected (step S202: Yes), the path control
具体的には、パス制御手段52は、ホスト情報管理テーブル53を参照して、利用できるパスの数が2以上として登録されているか確認する。利用できるパス数が2以上ある場合、パス制御手段52は、パス状態管理テーブル17を参照して、他に正常なパスがあるかどうかを確認する(ステップS203)。他に正常なパスが存在する場合(ステップS203:Yes)、パス制御手段52は、業務ホスト5が使用するパスを、正常なパスのいずれかに切り替える(ステップS204)。切り替えるパスが存在しない場合(ステップS202:NoまたはステップS203:No)、パス制御手段52は、パスの切り替えを行わない。なお、上記の説明では、パス制御手段52について説明したが、業務ホスト6のパス制御手段62も同様に動作する。
Specifically, the path control
以上のように、本実施の形態にかかる冗長化システムの構成によれば、ポート制御手段12が、コントローラ21〜24とFCスイッチ41、42との間のパス(第1のパス)のパス接続情報(第1のパス接続情報)を取得する。また、パス情報管理手段51、61が、業務ホスト5、6とFCスイッチ41、42との間のパス(第2のパス)のパス接続情報(第2のパス接続情報)を取得する。そして、コントローラ制御手段14は、ポート状態管理テーブル16とパス状態管理テーブル17とを参照して、少なくとも2つ以上の通信可能なパスを用いたディスクアレイ装置1と業務ホスト5(または業務ホスト6)との接続が維持されるように、コントローラの動作を停止させる。これにより、パスに障害が発生した場合であっても、冗長性を維持したまま省電力化を実現することができる。
As described above, according to the configuration of the redundant system according to the present embodiment, the
また、性能管理手段11が、コントローラ21〜24の負荷情報を取得する。そして、コントローラ制御手段は、現在のコントローラ21〜24の負荷の合計と、現在のコントローラ21〜24それぞれの負荷とに基づいて、停止可能なコントローラを決定し、コントローラを停止させる。これにより、業務性能を低下させることなく省電力を図ることができる。
Further, the
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、業務ホストの数、パスの本数、コントローラの数などは、図1に示した構成に限られない。また、第1及び第2のパス接続情報として、リンクアップ及びリンクダウンの情報を用いたが、パスが通信可能か否かを示す情報であれば、これに限られるものではない。例えば、任意のデータを各パス経由で送受信し、その送受信の結果に基づいて通信の可否を調べてもよい。 Note that the present invention is not limited to the above-described embodiment, and can be changed as appropriate without departing from the spirit of the present invention. For example, the number of business hosts, the number of paths, the number of controllers, etc. are not limited to the configuration shown in FIG. In addition, link up and link down information is used as the first and second path connection information, but the information is not limited to this as long as the information indicates whether the path is communicable. For example, arbitrary data may be transmitted / received via each path, and the availability of communication may be checked based on the result of the transmission / reception.
また、上述の実施の形態においては、FCスイッチ41、42を中継して、業務ホスト5、6とディスクアレイ装置1とを接続していたが、これに限られるものではない。業務ホスト5、6と、コントローラ21〜24とが直接接続されていてもよい。この場合、各パス(第1のパス)のパス接続情報(第1のパス接続情報)のみを用いて、通信可能なパスを特定し、冗長化を図ることができる。つまり、図8に示すように、ディスクアレイ装置は、少なくとも、各コントローラ21〜24に接続されたパスのパス接続情報を取得するポート制御手段12と、当該パス接続情報を格納するパス状態管理テーブル17と、パス接続情報に基づいて、冗長化が維持されるようにコントローラを停止するコントローラ制御手段14と、を備えていればよい。このような構成により、パスに障害が発生した場合であっても、冗長化を維持したまま省電力化を実現することができる。
In the above embodiment, the business hosts 5 and 6 and the
さらに、上述の冗長化システムの任意の処理は、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュメモリ、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 Furthermore, arbitrary processing of the above-described redundancy system can be realized by causing a CPU (Central Processing Unit) to execute a computer program. In this case, the computer program can be stored using various types of non-transitory computer readable media and supplied to the computer. Non-transitory computer readable media include various types of tangible storage media. Examples of non-transitory computer-readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD-Rs, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash memory, RAM (random access memory)) are included. The program may also be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
また、コンピュータが上述の実施の形態の機能を実現するプログラムを実行することにより、上述の実施の形態の機能が実現される場合だけでなく、このプログラムが、コンピュータ上で稼動しているOS(Operating System)もしくはアプリケーションソフトウェアと共同して、上述の実施の形態の機能を実現する場合も、本発明の実施の形態に含まれる。さらに、このプログラムの処理の全てもしくは一部がコンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットによって行われて、上述の実施の形態の機能が実現される場合も、本発明の実施の形態に含まれる。 In addition to the case where the function of the above-described embodiment is realized by the computer executing the program that realizes the function of the above-described embodiment, this program is not limited to the OS ( A case where the functions of the above-described embodiment are realized in cooperation with an operating system or application software is also included in the embodiment of the present invention. Furthermore, the present invention is also applicable to the case where the functions of the above-described embodiment are realized by performing all or part of the processing of the program by a function expansion board inserted into the computer or a function expansion unit connected to the computer. It is included in the embodiment.
1 ディスクアレイ装置
3 論理ディスク
5、6 業務ホスト
11 性能管理手段
12 ポート制御手段
13 パス状態監視手段
14 コントローラ制御手段
15 性能管理テーブル
16 ポート状態管理テーブル
17 パス状態管理テーブル
18 ホスト情報管理テーブル
21〜24 コントローラ
41、42 FCスイッチ
51、61 パス情報管理手段
52、62 パス制御手段
53、63 ホスト情報管理テーブル
DESCRIPTION OF
Claims (8)
複数の前記第1のパスを介して前記記憶装置と接続されたホスト装置と、
複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得する第1の接続情報取得手段と、
前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記記憶装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させるコントローラ制御手段と、
を備える冗長化システム。 A storage device having a memory and a plurality of controllers that control input / output of data to / from the memory and are connected to a plurality of first paths;
A host device connected to the storage device via a plurality of the first paths;
First connection information acquisition means for acquiring first path connection information indicating whether or not a plurality of the first paths can communicate;
Based on the first path connection information, the operation of the controller is stopped so that the connection between the storage device and the host device using the first communicable first path is maintained. Controller control means for causing
Redundant system with
複数の前記第2のパスが通信可能か否かを示す第2のパス接続情報を取得する第2の接続情報取得手段と、をさらに備え、
前記コントローラ制御手段は、前記第1のパス接続情報及び前記第2のパス接続情報に基づいて、少なくとも2以上の通信可能な前記第1のパスを用いた前記記憶装置と前記中継装置との接続が維持され、かつ、少なくとも2以上の通信可能な前記第2のパスを用いた前記中継装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させる請求項1に記載の冗長化システム。 A plurality of relay devices connected to the plurality of controllers via the plurality of first paths and connected to the host device via a plurality of second paths;
A second connection information acquisition means for acquiring second path connection information indicating whether or not a plurality of the second paths can communicate with each other;
The controller control means connects the storage device and the relay device using at least two or more communicable first paths based on the first path connection information and the second path connection information. The operation of the controller is stopped so that the connection between the relay apparatus and the host apparatus using the second path capable of communicating at least two or more is maintained. Redundancy system.
前記パス切替手段は、前記ホスト装置が使用している前記第2のパスが通信不可能となった場合、前記第2のパス接続情報に基づいて、通信可能な前記第2のパスに切り替える請求項2に記載の冗長化システム。 Path switching means for switching the second path used by the host device;
The path switching unit switches to the communicable second path based on the second path connection information when the second path used by the host device becomes incommunicable. Item 3. The redundant system according to item 2.
前記コントローラ制御手段は、前記負荷情報に基づいて、停止させる前記コントローラを決定する請求項1〜3のいずれか一項に記載の冗長化システム。 Load information acquisition means for acquiring load information indicating the load of the controller;
The redundancy system according to any one of claims 1 to 3, wherein the controller control means determines the controller to be stopped based on the load information.
複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得するステップと、
前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記記憶装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させるステップと、
を備える冗長化方法。 A storage device that includes a memory and a plurality of controllers that are connected to the plurality of first paths and controls input / output of data to / from the memory, and is connected to the storage devices via the plurality of first paths A redundant method of a system comprising:
Obtaining first path connection information indicating whether or not a plurality of the first paths are communicable;
Based on the first path connection information, the operation of the controller is stopped so that the connection between the storage device and the host device using the first communicable first path is maintained. Step to
A redundancy method comprising:
前記メモリに対するデータの入出力を制御し、複数の第1のパスを介してホスト装置に接続された複数のコントローラと、
複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得する第1の接続情報取得手段と、
前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記コントローラとホスト装置との接続が維持されるように、前記コントローラの動作を停止させるコントローラ制御手段と、
を備える記憶装置。 Memory,
A plurality of controllers for controlling input / output of data to / from the memory and connected to a host device via a plurality of first paths;
First connection information acquisition means for acquiring first path connection information indicating whether or not a plurality of the first paths can communicate;
A controller that stops the operation of the controller based on the first path connection information so that the connection between the controller and the host device using the first path capable of at least two or more communication is maintained. Control means;
A storage device.
コンピュータに、
複数の前記第1のパスが通信可能か否かを示す第1のパス接続情報を取得させるステップと、
前記第1のパス接続情報に基づいて、少なくとも2つ以上の通信可能な前記第1のパスを用いた前記記憶装置と前記ホスト装置との接続が維持されるように、前記コントローラの動作を停止させるステップと、
を実行させるプログラム。 A storage device that includes a memory and a plurality of controllers that are connected to the plurality of first paths and controls input / output of data to / from the memory, and is connected to the storage devices via the plurality of first paths A program for controlling a system comprising:
On the computer,
Obtaining first path connection information indicating whether or not a plurality of the first paths are communicable;
Based on the first path connection information, the operation of the controller is stopped so that the connection between the storage device and the host device using the first communicable first path is maintained. Step to
A program that executes
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013033537A JP6194593B2 (en) | 2013-02-22 | 2013-02-22 | Redundant system, redundant method, storage device, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013033537A JP6194593B2 (en) | 2013-02-22 | 2013-02-22 | Redundant system, redundant method, storage device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014164431A true JP2014164431A (en) | 2014-09-08 |
JP6194593B2 JP6194593B2 (en) | 2017-09-13 |
Family
ID=51614996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013033537A Active JP6194593B2 (en) | 2013-02-22 | 2013-02-22 | Redundant system, redundant method, storage device, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6194593B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016117008A1 (en) * | 2015-01-19 | 2016-07-28 | 株式会社日立製作所 | Storage system, computer system, and fault site estimation method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007102409A (en) * | 2005-10-03 | 2007-04-19 | Hitachi Ltd | Power saving method for storage system, and storage system |
JP2008041050A (en) * | 2006-08-10 | 2008-02-21 | Hitachi Ltd | Storage device and data management method using the same |
JP2009176033A (en) * | 2008-01-24 | 2009-08-06 | Hitachi Ltd | Storage system and power consumption reduction method for the same |
JP2009282859A (en) * | 2008-05-23 | 2009-12-03 | Hitachi Ltd | Device for managing electronic device constituting storage system |
JP2012181656A (en) * | 2011-03-01 | 2012-09-20 | Nec Corp | Power consumption control device, power consumption control method and power consumption control program |
-
2013
- 2013-02-22 JP JP2013033537A patent/JP6194593B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007102409A (en) * | 2005-10-03 | 2007-04-19 | Hitachi Ltd | Power saving method for storage system, and storage system |
JP2008041050A (en) * | 2006-08-10 | 2008-02-21 | Hitachi Ltd | Storage device and data management method using the same |
JP2009176033A (en) * | 2008-01-24 | 2009-08-06 | Hitachi Ltd | Storage system and power consumption reduction method for the same |
JP2009282859A (en) * | 2008-05-23 | 2009-12-03 | Hitachi Ltd | Device for managing electronic device constituting storage system |
JP2012181656A (en) * | 2011-03-01 | 2012-09-20 | Nec Corp | Power consumption control device, power consumption control method and power consumption control program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016117008A1 (en) * | 2015-01-19 | 2016-07-28 | 株式会社日立製作所 | Storage system, computer system, and fault site estimation method |
Also Published As
Publication number | Publication date |
---|---|
JP6194593B2 (en) | 2017-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9137148B2 (en) | Information processing system and information processing apparatus | |
US9348724B2 (en) | Method and apparatus for maintaining a workload service level on a converged platform | |
US8825851B2 (en) | Management of a virtual machine in a storage area network environment | |
US8402189B2 (en) | Information processing apparatus and data transfer method | |
US8321622B2 (en) | Storage system with multiple controllers and multiple processing paths | |
JP2007072571A (en) | Computer system, management computer and access path management method | |
WO2014064756A1 (en) | Method for assigning real storage areas from storage pool to virtual volume and computer system | |
JP2018173949A (en) | Ssd data replication system and method | |
US7953952B2 (en) | Computer and method for controlling whether or not to release all real storage areas assigned to virtual volume | |
US8943258B2 (en) | Server direct attached storage shared through virtual SAS expanders | |
JP2008269462A (en) | Management device and method for node | |
EP3319258B1 (en) | Service take-over method and storage device, and service take-over apparatus | |
WO2018121456A1 (en) | Data storage method, server and storage system | |
US20120047327A1 (en) | Disk array device and control method for the same | |
JP4551947B2 (en) | Device that manages the electronic devices that make up the storage system | |
US20130132766A1 (en) | Method and apparatus for failover and recovery in storage cluster solutions using embedded storage controller | |
KR20190058992A (en) | Server for distributed file system based on torus network and method using the same | |
US8095820B2 (en) | Storage system and control methods for the same | |
JP2012194892A (en) | Software update device, software update method, and software update program | |
US20140052845A1 (en) | Discovery of storage area network devices for a virtual machine | |
US9300530B2 (en) | Management device, management method, and medium | |
US20170052709A1 (en) | Storage system, storage control apparatus, and storage control method | |
JP6194593B2 (en) | Redundant system, redundant method, storage device, and program | |
US20110231674A1 (en) | Independent drive power control | |
JP2016167213A (en) | Blade apparatus and blade apparatus management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6194593 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |