JP6035908B2 - ストレージシステム - Google Patents
ストレージシステム Download PDFInfo
- Publication number
- JP6035908B2 JP6035908B2 JP2012147887A JP2012147887A JP6035908B2 JP 6035908 B2 JP6035908 B2 JP 6035908B2 JP 2012147887 A JP2012147887 A JP 2012147887A JP 2012147887 A JP2012147887 A JP 2012147887A JP 6035908 B2 JP6035908 B2 JP 6035908B2
- Authority
- JP
- Japan
- Prior art keywords
- siphoning
- control unit
- cpu
- storage
- dump
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
Description
図1は、実施例1に係るストレージシステム2の構成を示す機能ブロック図である。図1に示すように、実施例1に係るストレージシステム2は、コントローラモジュール(Controller Module:以下CMと記す)3と、ディスク4と、フロントエンドルータ(Front-End Router:以下FRTと記す)5とを有する。また、実施例1に係るストレージシステム2は、バックエンドルータ(Back-End Router:以下BRTと記す)6と、ドライブエンクロージャー(Drive Enclosure:以下DEと記す)7とを有する。なお、ストレージシステム2が有するCMの数は、3以上であれば図1に示した数に限定されるものではない。また、ストレージシステム2が有するディスク4の数は、図1に示した数に限定されるものではない。
各CM3は、複数のチャンネルアダプタ(Channel Adapter:以下CAと記す)31とI/Oコントローラ(Input/Output Controller:以下IOCと記す)32とを有する。また、各CM3は、BUD(Bootup and Utility Device)33とメイン制御部34とサブ制御部35とCM間通信ドライバ36と記憶部37とを有する。なお、メイン制御部34とサブ制御部35とを区別しない場合には、制御部と記載する。また、CAと当該CAが存在するCM間通信を行うパスは1パスである。また、各CM3が有する制御部の数は、図1に示した数に限定されるものではない。例えば、各CM3は、制御部を一つ有するようにしてもよい。
図2は、実施例2に係るストレージシステム2Aの構成を示す機能ブロック図である。図2に示すように、ストレージシステム2Aは、CM3Aと、CM3Bと、ディスク4と、FRT5と、BRT6と、DE7とを有する。また、ストレージシステム2Aは、上位装置であるホストコンピュータ1と接続する。なお、実施例2に係るストレージシステム2Aにおいて、図1に示したストレージシステム2の構成と同様の機能を有する各部については、同一の符号を付与し、詳細な説明を省略する。また、図2に示す例では、ストレージシステム2Aが有するCMの数はCM3Aが1であり、CM3Bが7であり、計8とするが、3以上であれば図2に示した数に限定されるものではない。なお、7つのCM3Bのうち4つのみを図示する。また、ストレージシステム2Aが有するディスク4の数は、図2に示した数に限定されるものではない。
CM3Aは、ディスク4へのデータの入出力を制御する装置であり、複数のCA31とIOC32とBUD33とメイン制御部34Aとサブ制御部35AとCM間通信ドライバ36と記憶部37Aとを有する。なお、実施例2に係るCM3Aにおいて、図1に示したCM3の構成と同様の機能を有する各部については、同一の符号を付与し、詳細な説明を省略する。また、CM3Aが有する制御部の数は、図2に示した数に限定されるものではない。例えば、CM3Aは、制御部を一つ有するようにしてもよい。
「CAダンプ吸い上げ時間」={(CM/CA間通信時間)+(CM/CM間通信時間)+(データ圧縮時間)+(BUD格納時間)}×(データサイズ)・・・式(1)
「CAダンプ吸い上げ実行時間」=(CAダンプ吸い上げ時間)÷{1−(制御部の使用率)}・・・式(2)
「I/O処理時間」=(クロスアクセスのI/Oコマンド数)×(クロスアクセスのI/Oコマンド処理時間)+(ストレートアクセスのI/Oコマンド数)×(ストレートアクセスのI/Oコマンド処理時間)・・・式(3)
CM3Bは、ディスク4へのデータの入出力を制御する装置であり、複数のCA31とIOC32とBUD33とメイン制御部34Bとサブ制御部35AとCM間通信ドライバ36と記憶部37Bとを有する。なお、実施例2に係るCM3Bにおいて、図2に示したCM3Aの構成と同様の機能を有する各部については、同一の符号を付与し、詳細な説明を省略する。また、CM3Bが有する制御部の数は、図2に示した数に限定されるものではない。例えば、CM3Bは、制御部を一つ有するようにしてもよい。
次に、吸い上げ制御テーブル371のデータ構造について、図3を参照して説明する。図3は、実施例2に係る吸い上げ制御テーブルのデータ構造の一例を示す図である。図3に示すように、吸い上げ制御テーブル371は、実行中フラグ371b、吸い上げ対象CA371c、CAダンプ吸い上げ時間371d、CPU使用率371eおよびCAダンプ吸い上げ実行時間371fをCPU371aに対応付けて記憶する。さらに、吸い上げ制御テーブル371は、I/Oコマンド数371gおよびI/O処理時間371hをCPU371aに対応付けて記憶する。
次に、図4A〜図4Cおよび図5A〜5Eを用いて、ストレージシステムによる処理動作を説明する。ここでは、図4A〜図4Cを用いて、ダンプデータの格納処理の処理動作を説明し、図5A〜5Eを用いて、コピー処理の処理動作を説明する。
図4A〜図4Cは、ダンプデータの格納処理の処理動作の一例を示す図である。図4Aに示すように、CM#1のCA#1にデグレードが発生した場合、マスターCMであるCM#0において、吸い上げ先決定部52は、制御部をそれぞれ別のCMから2つ選択する。図4Aに示す例では、吸い上げ先決定部52は、CM#5のメイン制御部34Bと、CM#6のメイン制御部34Bとを選択する場合を示す。
図5Aは、CAダンプの格納先であるCM#5にデグレードが発生し、CM#7を新たな格納先に選択した後に各CMのBUD33に格納されるダンプデータの一例を示す図である。図5Bは、CM#6のBUD33からCM#7のBUD33にダンプデータをコピーする処理の一例を示す図である。図5Cは、CM#6のBUD33からダンプデータがコピーされた後に、CM#7のBUD33に格納されるダンプデータの一例を示す図である。図5Dは、CAダンプの格納先であるCM#5のデグレードが発生した後、更に、CAダンプの格納先であるCM#6のデグレードが発生する場合の一例を示す図である。図5Eは、CM#5のデグレードが発生した後に、CM#6にもデグレードが発生した場合、CM#7のBUD33に格納されるダンプデータの一例を示す図である。
次に、図6A〜図6Bおよび図7A〜図7Bを用いて、ストレージシステムによる処理の処理手順を説明する。図6A〜図6Bを用いて、ストレージシステムによるCAダンプの吸い上げ処理の処理手順を説明し、図7A〜図7Bを用いて、吸い上げ先決定部52による吸い上げ先決定処理の手順を説明する。なお、以下の説明では、各CMが有するメイン制御部のことをCPU#0と記載し、各CMが有するサブ制御部のことをCPU#1と記載する。
図6Aおよび図6Bは、ストレージシステム2AによるCAダンプの吸い上げ処理を示すシーケンス図である。なお、図6Aおよび図6Bは、CM#1のCPU#1において、CA#1のデグレードが発生し、マスターCMであるCM#0のCPU#0が、CM#5のCPU#1とCM#6のCPU#0とを格納先として選択する場合を示す。さらに、図6Aおよび図6Bは、CM#5のデグレードが発生し、マスターCMであるCM#0のCPU#0が、CM#7のCPU#1を新たな格納先として選択する場合を示す。
図7Aおよび図7Bは、実施例2に係る吸い上げ先決定処理の処理手順を示すフローチャートである。なお、吸い上げ先の対象となる各CPUには、あらかじめインデックスが振られているものとする。例えば、CM#0のメインCPUに「0」、CM#0のサブCPUに「1」、CM#1のメインCPUに「2」、CM#1のサブCPUに「3」がそれぞれ振られている。
上述してきたように、実施例2に係るストレージシステム2Aは、各CPUで処理しているI/Oコマンド数を利用することにより、I/Oコマンドを最も処理していないCPUを選択して、CAダンプの吸い上げを実施する。すなわち、実施例2に係るストレージシステム2Aは、吸い上げCMと格納CMとを分離させる。この結果、実施例2に係るストレージシステム2Aは、CAのダンプデータを吸い上げる処理がストレージシステム2Aの性能に及ぼす影響を小さくすることが可能となる。
本実施例において説明した各処理のうち自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、制御手順、具体的名称については、特記する場合を除いて任意に変更することができる。
各制御装置は、
前記記憶装置へのデータの入出力に関わる命令が入力されるインタフェース部と、前記インタフェース部から前記命令を受け取って実行する演算処理部とを有し、
各演算処理部は、
前記インタフェース部に異常が生じた場合、演算処理部を複数選択して前記選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する
ことを特徴とするストレージシステム。
前記インタフェース部に異常が生じた場合、複数選択する演算処理装置の一つに自演算処理部を選択する
ことを特徴とする付記1に記載のストレージシステム。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、演算処理部を新たに選択し、前記インタフェース部のダンプデータの格納処理の実行を前記新たに選択された演算処理部に依頼することを特徴とする付記1または2に記載のストレージシステム。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、正常な前記演算処理部により格納されるダンプデータのうち、新たに選択された前記演算処理部により格納されていないダンプデータを、該新たに選択された演算処理装置に格納させることを特徴とする付記3に記載のストレージシステム。
各演算処理部が、
前記インタフェース部に異常が生じた場合、演算処理部を複数選択して前記選択された演算処理部に当該インタフェース部のダンプデータの格納処理の実行を依頼する
処理を含んだことを特徴とするストレージシステムの制御方法。
前記インタフェース部に異常が生じた場合、複数選択する演算処理装置の一つに自演算処理部を選択する
ことを特徴とする付記6に記載のストレージシステムの制御方法。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、演算処理部を新たに選択し、前記インタフェース部のダンプデータの格納処理の実行を前記新たに選択された演算処理部に依頼することを特徴とする付記6または7に記載のストレージシステムの制御方法。
格納処理の実行を依頼した他の演算処理部のいずれかが格納処理を実行できなくなる場合、正常な前記演算処理部により格納されるダンプデータのうち、新たに選択された前記演算処理部により格納されていないダンプデータを、該新たに選択された演算処理装置に格納させることを特徴とする付記8に記載のストレージシステムの制御方法。
2、2A ストレージシステム
3、3A、3B CM
4 ディスク
5 FRT
6 BRT
7 DE
31 CA
32 IOC
33 BUD
34、34A、34B メイン制御部
35、35A サブ制御部
36 CM間通信ドライバ
37、37A、37B 記憶部
51 吸い上げ処理部
52 吸い上げ先決定部
53 情報取得部
371 吸い上げ制御テーブル
372 CPU使用率情報
373 コマンド数情報
Claims (6)
- データを記憶する記憶装置へのデータの入出力を制御する複数のコントローラモジュールを備えたストレージシステムにおいて、
各コントローラモジュールは、
前記記憶装置へのデータの入出力に関わる命令が入力されるチャネルアダプタと、前記チャネルアダプタから前記命令を受け取って実行する制御部とを有し、
各制御部は、
前記チャネルアダプタに異常が生じた場合、ダンプデータの格納処理時間に基づいて制御部を複数選択して前記選択された制御部に当該チャネルアダプタのダンプデータをブート用記憶装置に格納する処理の実行を依頼する
ことを特徴とするストレージシステム。 - 各制御部は、更に、
格納処理の実行を依頼した他の制御部のいずれかが格納処理を実行できなくなる場合、制御部を新たに選択し、前記チャネルアダプタのダンプデータの格納処理の実行を前記新たに選択された制御部に依頼することを特徴とする請求項1に記載のストレージシステム。 - 各制御部は、更に、
格納処理の実行を依頼した他の制御部のいずれかが格納処理を実行できなくなる場合、正常な前記制御部により格納されるダンプデータのうち、新たに選択された前記制御部により格納されていないダンプデータを、該新たに選択された制御部に格納させることを特徴とする請求項2に記載のストレージシステム。 - 各制御部は、前記複数のコントローラモジュールが有する制御部の使用率に基づいて算出するダンプデータの格納処理の時間が所定の時間より短く、且つ前記チャネルアダプタに入力された命令の数から算出される格納処理の時間が短いものから順に、格納処理の実行を依頼する制御部を選択することを特徴とする請求項1−3のいずれか一つに記載のストレージシステム。
- 各制御部は、
前記チャネルアダプタに異常が生じた場合、入出力処理時間及びダンプデータの格納処理時間に基づいて制御部を複数選択することを特徴とする請求項1−3のいずれか一つに記載のストレージシステム。 - データを記憶する記憶装置へのデータの入出力を制御する複数のコントローラモジュールを備えたストレージシステムにおいて、
各コントローラモジュールは、
前記記憶装置へのデータの入出力に関わる命令が入力されるチャネルアダプタと、前記チャネルアダプタから前記命令を受け取って実行する制御部とを有し、
各制御部は、
前記チャネルアダプタに異常が生じた場合、入出力処理時間に基づいて制御部を複数選択して前記選択された制御部に当該チャネルアダプタのダンプデータをブート用記憶装置に格納する処理の実行を依頼する
ことを特徴とするストレージシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012147887A JP6035908B2 (ja) | 2012-06-29 | 2012-06-29 | ストレージシステム |
US13/870,508 US20140006876A1 (en) | 2012-06-29 | 2013-04-25 | Storage system and method for controlling storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012147887A JP6035908B2 (ja) | 2012-06-29 | 2012-06-29 | ストレージシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014010710A JP2014010710A (ja) | 2014-01-20 |
JP6035908B2 true JP6035908B2 (ja) | 2016-11-30 |
Family
ID=49779556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012147887A Expired - Fee Related JP6035908B2 (ja) | 2012-06-29 | 2012-06-29 | ストレージシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140006876A1 (ja) |
JP (1) | JP6035908B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6477266B2 (ja) * | 2015-06-03 | 2019-03-06 | 富士通株式会社 | ダンプ管理装置、ダンプ管理プログラム及びダンプ管理方法 |
CN105843698A (zh) * | 2016-04-22 | 2016-08-10 | 浪潮电子信息产业股份有限公司 | 一种自动调节bios选项值的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0214669D0 (en) * | 2002-06-26 | 2002-08-07 | Ibm | Method for maintaining data access during failure of a controller |
US7085958B2 (en) * | 2003-01-17 | 2006-08-01 | International Business Machines Corporation | System and method for isolating a faulty switch, storage device or SFP in a daisy-chained configuration |
JP2004234555A (ja) * | 2003-01-31 | 2004-08-19 | Hitachi Ltd | ストレージシステムの制御方法、ストレージシステム、及びプログラム |
US7281163B2 (en) * | 2004-06-22 | 2007-10-09 | Hewlett-Packard Development Company, L.P. | Management device configured to perform a data dump |
JP4927339B2 (ja) * | 2005-02-23 | 2012-05-09 | 株式会社日立製作所 | 記憶制御装置及びその制御方法 |
JP2006268403A (ja) * | 2005-03-24 | 2006-10-05 | Fujitsu Ltd | データストレージシステム及びストレージ制御装置のログデータの等価制御方法 |
US7882393B2 (en) * | 2007-03-28 | 2011-02-01 | International Business Machines Corporation | In-band problem log data collection between a host system and a storage system |
US8448013B2 (en) * | 2009-01-19 | 2013-05-21 | International Business Machines Corporation | Failure-specific data collection and recovery for enterprise storage controllers |
JP5359601B2 (ja) * | 2009-06-25 | 2013-12-04 | 富士通株式会社 | ダンプ出力制御装置、ダンプ出力制御プログラム、ダンプ出力制御方法 |
JP5225515B2 (ja) * | 2010-07-06 | 2013-07-03 | 三菱電機株式会社 | プロセッサ装置及びプログラム |
-
2012
- 2012-06-29 JP JP2012147887A patent/JP6035908B2/ja not_active Expired - Fee Related
-
2013
- 2013-04-25 US US13/870,508 patent/US20140006876A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2014010710A (ja) | 2014-01-20 |
US20140006876A1 (en) | 2014-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10877682B2 (en) | Non-disruptive cross-protocol live data migration | |
US9619311B2 (en) | Error identification and handling in storage area networks | |
US11102299B2 (en) | Data processing system | |
US20080281959A1 (en) | Managing addition and removal of nodes in a network | |
US8046392B2 (en) | Storage system and information transfer method for the same | |
CN1794206A (zh) | 虚拟存储结构的管理系统、信息处理设备、生成方法及存储介质 | |
US20190155922A1 (en) | Server for torus network-based distributed file system and method using the same | |
JP6035909B2 (ja) | ストレージシステムおよびストレージシステムの制御方法 | |
CN110865835A (zh) | 配置文件更新方法、装置、计算机设备和存储介质 | |
JP2010044635A (ja) | ファイルサーバシステム及びファイルサーバシステム起動方法 | |
WO2015072026A1 (ja) | 計算機システム | |
CN1278254C (zh) | 确定高可用性集群之活跃度的方法和系统 | |
CN110989923A (zh) | 一种分布式存储系统的部署方法及装置 | |
JP6035908B2 (ja) | ストレージシステム | |
EP2866136B1 (en) | Storage apparatus, method of controlling storage apparatus, and storage apparatus control program | |
JP2005251188A (ja) | 冗長パス制御装置及び冗長パス制御方法 | |
JP6451308B2 (ja) | ストレージ装置およびストレージ装置制御プログラム | |
JP6940761B2 (ja) | 情報処理装置、仮想マシン監視プログラム、および情報処理システム | |
US9417942B1 (en) | Event-based in-band host registration | |
JP2016119020A (ja) | ストレージ装置、ストレージ装置の制御方法およびストレージ装置制御プログラム | |
JP6035905B2 (ja) | ストレージシステムおよびストレージシステムの制御方法 | |
KR101460408B1 (ko) | 스토리지 시스템, 제어 장치 및 스토리지 시스템의 제어 방법 | |
US8677363B2 (en) | Method for managing, tracking and distributing job programs for processing to a plurality of execution computers | |
US20220374256A1 (en) | Information processing system, information processing apparatus, method of controlling the same, and storage medium | |
JP6127754B2 (ja) | プログラム、排他制御要求振り分け方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6035908 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |