JP2014010710A - ストレージシステムおよびストレージシステムの制御方法 - Google Patents
ストレージシステムおよびストレージシステムの制御方法 Download PDFInfo
- Publication number
- JP2014010710A JP2014010710A JP2012147887A JP2012147887A JP2014010710A JP 2014010710 A JP2014010710 A JP 2014010710A JP 2012147887 A JP2012147887 A JP 2012147887A JP 2012147887 A JP2012147887 A JP 2012147887A JP 2014010710 A JP2014010710 A JP 2014010710A
- Authority
- JP
- Japan
- Prior art keywords
- siphoning
- cpu
- storage
- arithmetic processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】ストレージシステムは、データを記憶する記憶装置へのデータの入出力を制御する複数の制御装置を備える。各制御装置は、記憶装置へのデータの入出力に関わる命令が入力されるインタフェース部と、インタフェース部から命令を受け取って実行する演算処理部とを有する。演算処理部は、インタフェース部に異常が生じた場合、演算処理部を複数選択して選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する。
【選択図】図1
Description
図1は、実施例1に係るストレージシステム2の構成を示す機能ブロック図である。図1に示すように、実施例1に係るストレージシステム2は、コントローラモジュール(Controller Module:以下CMと記す)3と、ディスク4と、フロントエンドルータ(Front-End Router:以下FRTと記す)5とを有する。また、実施例1に係るストレージシステム2は、バックエンドルータ(Back-End Router:以下BRTと記す)6と、ドライブエンクロージャー(Drive Enclosure:以下DEと記す)7とを有する。なお、ストレージシステム2が有するCMの数は、3以上であれば図1に示した数に限定されるものではない。また、ストレージシステム2が有するディスク4の数は、図1に示した数に限定されるものではない。
各CM3は、複数のチャンネルアダプタ(Channel Adapter:以下CAと記す)31とI/Oコントローラ(Input/Output Controller:以下IOCと記す)32とを有する。また、各CM3は、BUD(Bootup and Utility Device)33とメイン制御部34とサブ制御部35とCM間通信ドライバ36と記憶部37とを有する。なお、メイン制御部34とサブ制御部35とを区別しない場合には、制御部と記載する。また、CAと当該CAが存在するCM間通信を行うパスは1パスである。また、各CM3が有する制御部の数は、図1に示した数に限定されるものではない。例えば、各CM3は、制御部を一つ有するようにしてもよい。
図2は、実施例2に係るストレージシステム2Aの構成を示す機能ブロック図である。図2に示すように、ストレージシステム2Aは、CM3Aと、CM3Bと、ディスク4と、FRT5と、BRT6と、DE7とを有する。また、ストレージシステム2Aは、上位装置であるホストコンピュータ1と接続する。なお、実施例2に係るストレージシステム2Aにおいて、図1に示したストレージシステム2の構成と同様の機能を有する各部については、同一の符号を付与し、詳細な説明を省略する。また、図2に示す例では、ストレージシステム2Aが有するCMの数はCM3Aが1であり、CM3Bが7であり、計8とするが、3以上であれば図2に示した数に限定されるものではない。なお、7つのCM3Bのうち4つのみを図示する。また、ストレージシステム2Aが有するディスク4の数は、図2に示した数に限定されるものではない。
CM3Aは、ディスク4へのデータの入出力を制御する装置であり、複数のCA31とIOC32とBUD33とメイン制御部34Aとサブ制御部35AとCM間通信ドライバ36と記憶部37Aとを有する。なお、実施例2に係るCM3Aにおいて、図1に示したCM3の構成と同様の機能を有する各部については、同一の符号を付与し、詳細な説明を省略する。また、CM3Aが有する制御部の数は、図2に示した数に限定されるものではない。例えば、CM3Aは、制御部を一つ有するようにしてもよい。
「CAダンプ吸い上げ時間」={(CM/CA間通信時間)+(CM/CM間通信時間)+(データ圧縮時間)+(BUD格納時間)}×(データサイズ)・・・式(1)
「CAダンプ吸い上げ実行時間」=(CAダンプ吸い上げ時間)÷{1−(制御部の使用率)}・・・式(2)
「I/O処理時間」=(クロスアクセスのI/Oコマンド数)×(クロスアクセスのI/Oコマンド処理時間)+(ストレートアクセスのI/Oコマンド数)×(ストレートアクセスのI/Oコマンド処理時間)・・・式(3)
CM3Bは、ディスク4へのデータの入出力を制御する装置であり、複数のCA31とIOC32とBUD33とメイン制御部34Bとサブ制御部35AとCM間通信ドライバ36と記憶部37Bとを有する。なお、実施例2に係るCM3Bにおいて、図2に示したCM3Aの構成と同様の機能を有する各部については、同一の符号を付与し、詳細な説明を省略する。また、CM3Bが有する制御部の数は、図2に示した数に限定されるものではない。例えば、CM3Bは、制御部を一つ有するようにしてもよい。
次に、吸い上げ制御テーブル371のデータ構造について、図3を参照して説明する。図3は、実施例2に係る吸い上げ制御テーブルのデータ構造の一例を示す図である。図3に示すように、吸い上げ制御テーブル371は、実行中フラグ371b、吸い上げ対象CA371c、CAダンプ吸い上げ時間371d、CPU使用率371eおよびCAダンプ吸い上げ実行時間371fをCPU371aに対応付けて記憶する。さらに、吸い上げ制御テーブル371は、I/Oコマンド数371gおよびI/O処理時間371hをCPU371aに対応付けて記憶する。
次に、図4A〜図4Cおよび図5A〜5Eを用いて、ストレージシステムによる処理動作を説明する。ここでは、図4A〜図4Cを用いて、ダンプデータの格納処理の処理動作を説明し、図5A〜5Eを用いて、コピー処理の処理動作を説明する。
図4A〜図4Cは、ダンプデータの格納処理の処理動作の一例を示す図である。図4Aに示すように、CM#1のCA#1にデグレードが発生した場合、マスターCMであるCM#0において、吸い上げ先決定部52は、制御部をそれぞれ別のCMから2つ選択する。図4Aに示す例では、吸い上げ先決定部52は、CM#5のメイン制御部34Bと、CM#6のメイン制御部34Bとを選択する場合を示す。
図5Aは、CAダンプの格納先であるCM#5にデグレードが発生し、CM#7を新たな格納先に選択した後に各CMのBUD33に格納されるダンプデータの一例を示す図である。図5Bは、CM#6のBUD33からCM#7のBUD33にダンプデータをコピーする処理の一例を示す図である。図5Cは、CM#6のBUD33からダンプデータがコピーされた後に、CM#7のBUD33に格納されるダンプデータの一例を示す図である。図5Dは、CAダンプの格納先であるCM#5のデグレードが発生した後、更に、CAダンプの格納先であるCM#6のデグレードが発生する場合の一例を示す図である。図5Eは、CM#5のデグレードが発生した後に、CM#6にもデグレードが発生した場合、CM#7のBUD33に格納されるダンプデータの一例を示す図である。
次に、図6A〜図6Bおよび図7A〜図7Bを用いて、ストレージシステムによる処理の処理手順を説明する。図6A〜図6Bを用いて、ストレージシステムによるCAダンプの吸い上げ処理の処理手順を説明し、図7A〜図7Bを用いて、吸い上げ先決定部52による吸い上げ先決定処理の手順を説明する。なお、以下の説明では、各CMが有するメイン制御部のことをCPU#0と記載し、各CMが有するサブ制御部のことをCPU#1と記載する。
図6Aおよび図6Bは、ストレージシステム2AによるCAダンプの吸い上げ処理を示すシーケンス図である。なお、図6Aおよび図6Bは、CM#1のCPU#1において、CA#1のデグレードが発生し、マスターCMであるCM#0のCPU#0が、CM#5のCPU#1とCM#6のCPU#0とを格納先として選択する場合を示す。さらに、図6Aおよび図6Bは、CM#5のデグレードが発生し、マスターCMであるCM#0のCPU#0が、CM#7のCPU#1を新たな格納先として選択する場合を示す。
図7Aおよび図7Bは、実施例2に係る吸い上げ先決定処理の処理手順を示すフローチャートである。なお、吸い上げ先の対象となる各CPUには、あらかじめインデックスが振られているものとする。例えば、CM#0のメインCPUに「0」、CM#0のサブCPUに「1」、CM#1のメインCPUに「2」、CM#1のサブCPUに「3」がそれぞれ振られている。
上述してきたように、実施例2に係るストレージシステム2Aは、各CPUで処理しているI/Oコマンド数を利用することにより、I/Oコマンドを最も処理していないCPUを選択して、CAダンプの吸い上げを実施する。すなわち、実施例2に係るストレージシステム2Aは、吸い上げCMと格納CMとを分離させる。この結果、実施例2に係るストレージシステム2Aは、CAのダンプデータを吸い上げる処理がストレージシステム2Aの性能に及ぼす影響を小さくすることが可能となる。
本実施例において説明した各処理のうち自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、制御手順、具体的名称については、特記する場合を除いて任意に変更することができる。
各制御装置は、
前記記憶装置へのデータの入出力に関わる命令が入力されるインタフェース部と、前記インタフェース部から前記命令を受け取って実行する演算処理部とを有し、
各演算処理部は、
前記インタフェース部に異常が生じた場合、演算処理部を複数選択して前記選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する
ことを特徴とするストレージシステム。
前記インタフェース部に異常が生じた場合、複数選択する演算処理装置の一つに自演算処理部を選択する
ことを特徴とする付記1に記載のストレージシステム。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、演算処理部を新たに選択し、前記インタフェース部のダンプデータの格納処理の実行を前記新たに選択された演算処理部に依頼することを特徴とする付記1または2に記載のストレージシステム。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、正常な前記演算処理部により格納されるダンプデータのうち、新たに選択された前記演算処理部により格納されていないダンプデータを、該新たに選択された演算処理装置に格納させることを特徴とする付記3に記載のストレージシステム。
各演算処理部が、
前記インタフェース部に異常が生じた場合、演算処理部を複数選択して前記選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する
処理を含んだことを特徴とするストレージシステムの制御方法。
前記インタフェース部に異常が生じた場合、複数選択する演算処理装置の一つに自演算処理部を選択する
ことを特徴とする付記6に記載のストレージシステムの制御方法。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、演算処理部を新たに選択し、前記インタフェース部のダンプデータの格納処理の実行を前記新たに選択された演算処理部に依頼することを特徴とする付記6または7に記載のストレージシステムの制御方法。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、正常な前記演算処理部により格納されるダンプデータのうち、新たに選択された前記演算処理部により格納されていないダンプデータを、該新たに選択された演算処理装置に格納させることを特徴とする付記8に記載のストレージシステムの制御方法。
2、2A ストレージシステム
3、3A、3B CM
4 ディスク
5 FRT
6 BRT
7 DE
31 CA
32 IOC
33 BUD
34、34A、34B メイン制御部
35、35A サブ制御部
36 CM間通信ドライバ
37、37A、37B 記憶部
51 吸い上げ処理部
52 吸い上げ先決定部
53 情報取得部
371 吸い上げ制御テーブル
372 CPU使用率情報
373 コマンド数情報
Claims (6)
- データを記憶する記憶装置へのデータの入出力を制御する複数の制御装置を備えたストレージシステムにおいて、
各制御装置は、
前記記憶装置へのデータの入出力に関わる命令が入力されるインタフェース部と、前記インタフェース部から前記命令を受け取って実行する演算処理部とを有し、
各演算処理部は、
前記インタフェース部に異常が生じた場合、演算処理部を複数選択して前記選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する
ことを特徴とするストレージシステム。 - 各演算処理部は、
前記インタフェース部に異常が生じた場合、複数選択する演算処理装置の一つに自演算処理部を選択する
ことを特徴とする請求項1に記載のストレージシステム。 - 各演算処理部は、更に、
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、演算処理部を新たに選択し、前記インタフェース部のダンプデータの格納処理の実行を前記新たに選択された演算処理部に依頼することを特徴とする請求項1または2に記載のストレージシステム。 - 各演算処理部は、更に、
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、正常な前記演算処理部により格納されるダンプデータのうち、新たに選択された前記演算処理部により格納されていないダンプデータを、該新たに選択された演算処理装置に格納させることを特徴とする請求項3に記載のストレージシステム。 - 各演算処理部は、前記複数の制御装置が有する演算処理部の使用率に基づいて算出するダンプデータの格納処理の時間が所定の時間より短く、且つ前記命令の数から算出される格納処理の時間が短いものから順に、格納処理の実行を依頼する演算処理部を選択することを特徴とする請求項1−4のいずれか一つに記載のストレージシステム。
- 記憶装置へのデータの入出力に関わる命令が入力されるインタフェース部と、該インタフェース部から前記命令を受け取って実行する演算処理部とを備えた制御装置を複数有するストレージシステムの制御方法において、
各演算処理部が、
前記インタフェース部に異常が生じた場合、演算処理部を複数選択して前記選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する
処理を含んだことを特徴とするストレージシステムの制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012147887A JP6035908B2 (ja) | 2012-06-29 | 2012-06-29 | ストレージシステム |
US13/870,508 US20140006876A1 (en) | 2012-06-29 | 2013-04-25 | Storage system and method for controlling storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012147887A JP6035908B2 (ja) | 2012-06-29 | 2012-06-29 | ストレージシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014010710A true JP2014010710A (ja) | 2014-01-20 |
JP6035908B2 JP6035908B2 (ja) | 2016-11-30 |
Family
ID=49779556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012147887A Expired - Fee Related JP6035908B2 (ja) | 2012-06-29 | 2012-06-29 | ストレージシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140006876A1 (ja) |
JP (1) | JP6035908B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016224832A (ja) * | 2015-06-03 | 2016-12-28 | 富士通株式会社 | ダンプ管理装置、ダンプ管理プログラム及びダンプ管理方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843698A (zh) * | 2016-04-22 | 2016-08-10 | 浪潮电子信息产业股份有限公司 | 一种自动调节bios选项值的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004234555A (ja) * | 2003-01-31 | 2004-08-19 | Hitachi Ltd | ストレージシステムの制御方法、ストレージシステム、及びプログラム |
US20050283672A1 (en) * | 2004-06-22 | 2005-12-22 | Andrew Brown | Management device configured to perform a data dump |
JP2006268403A (ja) * | 2005-03-24 | 2006-10-05 | Fujitsu Ltd | データストレージシステム及びストレージ制御装置のログデータの等価制御方法 |
JP2011008460A (ja) * | 2009-06-25 | 2011-01-13 | Fujitsu Ltd | ダンプ出力制御装置、ダンプ出力制御プログラム、ダンプ出力制御方法 |
WO2012004854A1 (ja) * | 2010-07-06 | 2012-01-12 | 三菱電機株式会社 | プロセッサ装置及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0214669D0 (en) * | 2002-06-26 | 2002-08-07 | Ibm | Method for maintaining data access during failure of a controller |
US7085958B2 (en) * | 2003-01-17 | 2006-08-01 | International Business Machines Corporation | System and method for isolating a faulty switch, storage device or SFP in a daisy-chained configuration |
JP4927339B2 (ja) * | 2005-02-23 | 2012-05-09 | 株式会社日立製作所 | 記憶制御装置及びその制御方法 |
US7882393B2 (en) * | 2007-03-28 | 2011-02-01 | International Business Machines Corporation | In-band problem log data collection between a host system and a storage system |
US8448013B2 (en) * | 2009-01-19 | 2013-05-21 | International Business Machines Corporation | Failure-specific data collection and recovery for enterprise storage controllers |
-
2012
- 2012-06-29 JP JP2012147887A patent/JP6035908B2/ja not_active Expired - Fee Related
-
2013
- 2013-04-25 US US13/870,508 patent/US20140006876A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004234555A (ja) * | 2003-01-31 | 2004-08-19 | Hitachi Ltd | ストレージシステムの制御方法、ストレージシステム、及びプログラム |
US20050283672A1 (en) * | 2004-06-22 | 2005-12-22 | Andrew Brown | Management device configured to perform a data dump |
JP2006268403A (ja) * | 2005-03-24 | 2006-10-05 | Fujitsu Ltd | データストレージシステム及びストレージ制御装置のログデータの等価制御方法 |
JP2011008460A (ja) * | 2009-06-25 | 2011-01-13 | Fujitsu Ltd | ダンプ出力制御装置、ダンプ出力制御プログラム、ダンプ出力制御方法 |
WO2012004854A1 (ja) * | 2010-07-06 | 2012-01-12 | 三菱電機株式会社 | プロセッサ装置及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016224832A (ja) * | 2015-06-03 | 2016-12-28 | 富士通株式会社 | ダンプ管理装置、ダンプ管理プログラム及びダンプ管理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6035908B2 (ja) | 2016-11-30 |
US20140006876A1 (en) | 2014-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10877682B2 (en) | Non-disruptive cross-protocol live data migration | |
US9619311B2 (en) | Error identification and handling in storage area networks | |
US20080281959A1 (en) | Managing addition and removal of nodes in a network | |
US8732520B2 (en) | Clustered array controller for global redundancy in a SAN | |
EP1662392A2 (en) | Identifying the extent that a fault on a storage device has to a replication process involving said device | |
CN1794206A (zh) | 虚拟存储结构的管理系统、信息处理设备、生成方法及存储介质 | |
US20190155922A1 (en) | Server for torus network-based distributed file system and method using the same | |
US20080270697A1 (en) | Storage system and information transfer method for the same | |
CN110865835A (zh) | 配置文件更新方法、装置、计算机设备和存储介质 | |
CN1278254C (zh) | 确定高可用性集群之活跃度的方法和系统 | |
JP6035909B2 (ja) | ストレージシステムおよびストレージシステムの制御方法 | |
US8806081B2 (en) | Open host issued statesave to attached storage | |
JP6035908B2 (ja) | ストレージシステム | |
JP2005251188A (ja) | 冗長パス制御装置及び冗長パス制御方法 | |
EP2866136A1 (en) | Storage apparatus, method of controlling storage apparatus, and storage apparatus control program | |
US9417942B1 (en) | Event-based in-band host registration | |
JP6940761B2 (ja) | 情報処理装置、仮想マシン監視プログラム、および情報処理システム | |
JP6451308B2 (ja) | ストレージ装置およびストレージ装置制御プログラム | |
JP5751156B2 (ja) | ストレージシステム、制御装置およびストレージシステムの制御方法 | |
JP6035905B2 (ja) | ストレージシステムおよびストレージシステムの制御方法 | |
US8812916B2 (en) | Failure data management for a distributed computer system | |
US11030010B2 (en) | Processing storage management request based on current and threshold processor load using request information | |
JP6127754B2 (ja) | プログラム、排他制御要求振り分け方法およびシステム | |
JP7057178B2 (ja) | 管理ノード、ノード、クラスタシステムおよびノード制御方法 | |
JP7312878B1 (ja) | 管理システム、情報処理装置、プログラム、及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6035908 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |