JP6622273B2 - リソース管理装置、リソース管理方法、及びリソース管理プログラム - Google Patents
リソース管理装置、リソース管理方法、及びリソース管理プログラム Download PDFInfo
- Publication number
- JP6622273B2 JP6622273B2 JP2017198588A JP2017198588A JP6622273B2 JP 6622273 B2 JP6622273 B2 JP 6622273B2 JP 2017198588 A JP2017198588 A JP 2017198588A JP 2017198588 A JP2017198588 A JP 2017198588A JP 6622273 B2 JP6622273 B2 JP 6622273B2
- Authority
- JP
- Japan
- Prior art keywords
- resource
- abnormality
- input
- surplus
- drive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3034—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3442—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for planning or managing the needed capacity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3485—Performance evaluation by tracing or monitoring for I/O devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/805—Real-time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/81—Threshold
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/82—Solving problems relating to consistency
Description
h=1+(d(1)−d(T/t))/d(T/t) ・・・(1)
ここで、Tは、変動率[短期]を算出する周期(間隔)であり、tは、稼動情報の取得間隔である。また、d(n)は、時点nの稼動情報を示し、n=1は、稼動情報を取得した最新の時点を示し、n=2,3,・・・は、稼動情報を取得した1周期前の時点,2周期前の時点,・・・を示している。したがって、d(T/t)は、変動率[短期]の算出周期の1周期前の時点における稼動情報を示している。
ここで、Sは、障害が発生しているリソースのしきい値[異常]であり、例えば、プール404の障害に対する処理であれば、プール監視テーブル85の障害が検出されたプール404の行におけるしきい値[異常]85fの値であり、例えば、ドライブ401の障害(稼動率に対する障害)に対する処理であれば、ドライブ監視テーブル86の障害が検出されたドライブ401の行におけるしきい値[異常]86eの値である。また、F(n)=d(1)×hnであり、例えば、F(1)=d(1)×h、F(2)=d(1)×h×h,F(3)=d(1)×h×h×hである。F(n)は、n周期(周期は、変動率[短期]の演算周期)後における稼動情報の推定値を示している。
必要な容量[GB]=F(x)×物理容量[GB]−d(1)×物理容量[GB] ・・・(2)
ここで、xは、予め設定されている定数であり、例えば、容量により余裕を持たせる場合には、xの値を大きくすればよい。
増加量[Mbps]=(物理容量[GB]×F(1)−物理容量[GB]×d(1))×1024×8)÷(T×60) ・・・(3)
ここで、推定稼動率は、例えば、以下の式(4)により算出することができる。
推定稼動率=(F(x)×該当物理ボリュームが所属するTierのドライブ数)÷(該当物理ボリュームが所属するTierのドライブ数+組み合わせでの追加するドライブ数) ・・・(4)
ここで、上位Tier推定稼動率は、例えば、以下の式(5)により算出することができる。
上位Tier推定稼動率=(F(x)×該当物理ボリュームが所属するTierのドライブ数×該当物理ボリュームのドライブの性能比)÷((該当物理ボリュームが所属するTierの上位のtierのドライブ数+組み合わせでの追加するドライブ数)×追加する物理ボリュームのドライブの性能比) ・・・(5)
なお、物理ボリュームのドライブの性能比は、ドライブ種別テーブル91のドライブに対応する行の性能比91eの値から取得することができる。
・SSD:RAID5(2D+1P)×1
・SSD:RAID5(3D+1P)×1
・SAS:RAID5(2D+1P)×1
・SSD:RAID5(2D+1P)×2
・SSD:RAID5(3D+1P)×2
・SSD:RAID5(2D+1P)×1、SSD:RAID5(3D+1P)×1
・SSD:RAID5(2D+1P)×2、SAS:RAID5(2D+1P)×1
・SSD:RAID5(3D+1P)×2、SAS:RAID5(2D+1P)×1
・SSD:RAID5(2D+1P)×1、SSD:RAID5(3D+1P)×1、SAS:RAID5(2D+1P)×1
・E(1)[1],E(2)[1]
・E(1)[1],E(2)[2]
・E(1)[1],E(3)[1]
・E(1)[1],E(3)[2]
・E(1)[2],E(2)[1]
・E(1)[2],E(2)[2]
・E(1)[2],E(3)[1]
・E(1)[2],E(3)[2]
・E(2)[1],E(1)[1]
・E(2)[2],E(1)[1]
・E(3)[1],E(1)[1]
・E(3)[2],E(1)[1]
・E(2)[1],E(1)[2]
・E(2)[2],E(1)[2]
・E(3)[1],E(1)[2]
・E(3)[2],E(1)[2]
・E(1)[1],E(2)[1],E(3)[1]
・E(1)[1],E(3)[1],E(2)[1]
・E(2)[1],E(1)[1],E(3)[1]
・E(2)[1],E(3)[1],E(1)[1]
・E(3)[1],E(1)[1],E(2)[1]
・E(3)[1],E(2)[1],E(1)[1]
・E(2)[1],E(1)[1],E(3)[1]については、N=1、・E(2)[1],E(3)[1],E(1)[1]については、N=2、・E(3)[1],E(1)[1],E(2)[1]については、N=1、・E(3)[1],E(2)[1],E(1)[1]については、N=2と算出され、ステップS96においては、E(0)[x]のMが2と算出される。
Claims (12)
- 複数の種類の余剰リソースを含む複数のリソースを備えるストレージ装置における異常の対処に用いる、前記余剰リソースの投入案を決定し、決定した投入案に従って前記余剰リソースの割当を制御するリソース管理装置であって、
前記リソース管理装置は、プロセッサ部を備え、
前記プロセッサ部は、
前記ストレージ装置における前記リソースに関わる異常を検出し、
前記異常を検出した場合に、前記ストレージ装置における前記リソースの運用情報に基づいて、異常を対処することのできる前記余剰リソースの投入案を1以上算出し、
前記投入案が複数ある場合に、それぞれの前記投入案を実行する際に残存する余剰リソースによる、前記異常と同時に発生する可能性のある他の異常に対する対処可能状況に基づいて、前記異常の対処に用いる投入案を決定し、
前記プロセッサ部は、
前記投入案が複数ある場合に、前記残存する余剰リソースによる、対処可能な前記他の異常の数が多い投入案を、対処に用いる投入案として決定する
リソース管理装置。 - 前記リソースの運用情報は、前記ストレージ装置における前記リソースの構成情報と、前記リソースの稼動情報とを含む
請求項1に記載のリソース管理装置。 - 前記プロセッサ部は、
前記リソースの稼動情報に基づいて、前記リソースに関わる状態が、第1段階の異常状態からさらに深刻な第2段階の異常状態になるまでの猶予時間を特定し、
前記猶予時間未満で実行可能な投入案を算出する
請求項2に記載のリソース管理装置。 - 前記リソースは、ストレージデバイスであり、
前記ストレージ装置は、1以上のストレージデバイスの記憶領域に基づく記憶領域により構成される物理ボリュームと、1以上の前記物理ボリュームの記憶領域に基づく容量プールと、前記容量プールの記憶領域が割り当てられる仮想ボリュームとを有し、
前記リソースに関わる異常は、前記容量プールの記憶領域の容量不足を含み、
前記プロセッサ部は、
前記容量プールの記憶領域の容量不足を検出した場合に、異常に対処することのできる前記余剰リソースの投入案として、前記容量プールの容量不足に対応する物理ボリュームを構成するリソースに対して、同等以上の信頼性と、同等以上の性能評価とを有する余剰リソースにより構成される物理ボリュームを追加する投入案を算出する
請求項1から請求項3のいずれか一項に記載のリソース管理装置。 - 前記プロセッサ部は、
前記容量プールの記憶領域の容量不足を検出した場合に、異常の対処に用いる前記余剰リソースの投入案として、前記容量プールの容量不足に対応する物理ボリュームを構成するリソースに対して、同等以上の信頼性を有する余剰リソースにより構成される物理ボリュームを追加する投入案を算出する
請求項4に記載のリソース管理装置。 - 前記プロセッサ部は、
前記異常の対処に用いる投入案として、前記容量プールの容量不足に対応する物理ボリュームを構成するリソースに対して、同等以上の信頼性を有する余剰リソースにより構成される物理ボリュームを追加する投入案に決定した場合に、前記容量不足に対応する前記物理ボリュームの記憶領域が割り当てられている仮想ボリュームのページを、追加された物理ボリュームの記憶領域に再配置させる
請求項5に記載のリソース管理装置。 - 前記リソースは、ストレージデバイスであり、
前記ストレージ装置は、1以上のストレージデバイスの記憶領域に基づく記憶領域により構成される物理ボリュームと、1以上の前記物理ボリュームの記憶領域に基づく容量プールと、前記容量プールの記憶領域が割り当てられる仮想ボリュームとを有し、
前記リソースに関わる異常は、前記仮想ボリュームのアクセス性能の低下を含み、
前記プロセッサ部は、前記仮想ボリュームのアクセス性能の低下を検出した場合に、異常を対処することのできる前記余剰リソースの投入案として、前記容量プールの容量不足に対応する物理ボリュームを構成するリソースに対して、同等以上の信頼性と、同等以上の性能評価とを有する余剰リソースにより構成される物理ボリュームを追加する投入案を算出する
請求項1から請求項3のいずれか1項に記載のリソース管理装置。 - 前記プロセッサ部は、
前記ストレージ装置における前記リソースに関わる異常が解消されたか否かを判定し、
前記異常が解消された場合において、前記異常に対処するために実行された投入案に係る複数の余剰リソースについて、各余剰リソースを回収することによる、前記異常と同時に発生する可能性がある他の異常に対する対処可能状況に基づいて回収する
請求項1から請求項7のいずれか1項に記載のリソース管理装置。 - 前記プロセッサ部は、
前記ストレージ装置において発生する可能性のある異常が発生した場合における異常に対処することのできる1以上の前記余剰リソースの投入案と、前記異常と同時に発生する可能性がある他の異常に対処することのできる1以上の前記余剰リソースの投入案と、前記余剰リソースとに基づいて、前記異常及び前記他の異常の全てに対処可能であるか否かを判定し、
前記異常及び前記他の異常の全てに対処可能である場合には、前記異常及び前記他の異常の全てに対処した場合において必要最低限のリソースの種類及び数を特定し、
前記余剰リソースの種類及び数と、前記必要最低限のリソースの種類及び数とに基づいて、不要なリソースの種類及び数のリソース減設するように提案するメッセージを表示させる
請求項1から請求項8のいずれか一項に記載のリソース管理装置。 - 前記プロセッサ部は、
前記異常及び前記他の異常の全てに対処可能でない場合には、前記異常及び前記他の異常の全てに対処した場合において必要最低限のリソースの種類及び数を特定し、
前記余剰リソースの種類及び数と、前記必要最低限のリソースの種類及び数とに基づいて、不足しているリソースの種類及び数のリソースを増設するように提案するメッセージを表示させる
請求項9に記載のリソース管理装置。 - 複数の種類の余剰リソースを含む複数のリソースを備えるストレージ装置における異常の対処に用いる、前記余剰リソースの投入案を決定し、決定した投入案に従って前記余剰リソースの割当を制御するリソース管理装置によるリソース管理方法であって、
前記リソース管理装置は、
前記ストレージ装置における前記リソースに関わる異常を検出し、
前記異常を検出した場合に、前記ストレージ装置における前記リソースの運用情報に基づいて、異常を対処することのできる前記余剰リソースの投入案を1以上算出し、
前記投入案が複数ある場合に、それぞれの前記投入案を実行する際に残存する余剰リソースによる、前記異常と同時に発生する可能性のある他の異常に対する対処可能状況に基づいて、前記異常の対処に用いる投入案を決定し、
前記投入案が複数ある場合に、前記残存する余剰リソースによる、対処可能な前記他の異常の数が多い投入案を、対処に用いる投入案として決定する
リソース管理方法。 - 複数の種類の余剰リソースを含む複数のリソースを備えるストレージ装置における異常の対処に用いる、前記余剰リソースの投入案を決定し、決定した投入案に従って前記余剰リソースの割当を制御するリソース管理装置を構成するコンピュータに実行させるためのリソース管理プログラムであって、
前記コンピュータを、
前記ストレージ装置における前記リソースに関わる異常を検出する手段と、
前記異常を検出した場合に、前記ストレージ装置における前記リソースの運用情報に基づいて、異常を対処することのできる前記余剰リソースの投入案を1以上算出する手段と、
前記投入案が複数ある場合に、それぞれの前記投入案を実行する際に残存する余剰リソースによる、前記異常と同時に発生する可能性のある他の異常に対する対処可能状況に基づいて、前記異常の対処に用いる投入案を決定する手段と、して機能させ、
前記投入案を決定する手段は、前記投入案が複数ある場合に、前記残存する余剰リソースによる、対処可能な前記他の異常の数が多い投入案を、対処に用いる投入案として決定するリソース管理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017198588A JP6622273B2 (ja) | 2017-10-12 | 2017-10-12 | リソース管理装置、リソース管理方法、及びリソース管理プログラム |
US16/118,933 US10725879B2 (en) | 2017-10-12 | 2018-08-31 | Resource management apparatus, resource management method, and nonvolatile recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017198588A JP6622273B2 (ja) | 2017-10-12 | 2017-10-12 | リソース管理装置、リソース管理方法、及びリソース管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019074798A JP2019074798A (ja) | 2019-05-16 |
JP6622273B2 true JP6622273B2 (ja) | 2019-12-18 |
Family
ID=66095796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017198588A Active JP6622273B2 (ja) | 2017-10-12 | 2017-10-12 | リソース管理装置、リソース管理方法、及びリソース管理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10725879B2 (ja) |
JP (1) | JP6622273B2 (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041304A (ja) * | 2000-07-28 | 2002-02-08 | Hitachi Ltd | 論理区画の予備リソース自動付与方法及び論理区画式計算機システム |
US7146522B1 (en) * | 2001-12-21 | 2006-12-05 | Network Appliance, Inc. | System and method for allocating spare disks in networked storage |
JP2005216151A (ja) | 2004-01-30 | 2005-08-11 | Hitachi Ltd | 資源運用管理システム及び資源運用管理方法 |
US7941628B2 (en) * | 2007-09-04 | 2011-05-10 | International Business Machines Corporation | Allocation of heterogeneous storage devices to spares and storage arrays |
JP4842334B2 (ja) * | 2009-02-12 | 2011-12-21 | 富士通株式会社 | ディスクアレイ制御装置 |
JP5719974B2 (ja) * | 2012-09-03 | 2015-05-20 | 株式会社日立製作所 | 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム |
JP6051228B2 (ja) * | 2012-11-07 | 2016-12-27 | 株式会社日立製作所 | 計算機システム、ストレージ管理計算機及びストレージ管理方法 |
WO2015068299A1 (ja) * | 2013-11-11 | 2015-05-14 | 株式会社日立製作所 | 管理計算機および計算機システムの管理方法 |
US9519556B2 (en) * | 2014-09-09 | 2016-12-13 | Dell Products, Lp | Member replacement in an array of information storage devices |
WO2017026017A1 (ja) * | 2015-08-07 | 2017-02-16 | 株式会社日立製作所 | 管理計算機および計算機システムの管理方法 |
-
2017
- 2017-10-12 JP JP2017198588A patent/JP6622273B2/ja active Active
-
2018
- 2018-08-31 US US16/118,933 patent/US10725879B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10725879B2 (en) | 2020-07-28 |
US20190114240A1 (en) | 2019-04-18 |
JP2019074798A (ja) | 2019-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6373482B2 (ja) | コンピュータ環境を統制し分析するためのインターフェース | |
JP4723925B2 (ja) | ボリューム活動に従ってストレージポリシーをコントロールするための方法 | |
US10095418B1 (en) | Automatic tiering of storage using dynamic grouping | |
US8914598B2 (en) | Distributed storage resource scheduler and load balancer | |
JP6842440B2 (ja) | 性能分析方法および管理計算機 | |
JP4896593B2 (ja) | 性能監視方法、計算機及び計算機システム | |
US8880801B1 (en) | Techniques for reliability and availability assessment of data storage configurations | |
US10082965B1 (en) | Intelligent sparing of flash drives in data storage systems | |
US10825477B2 (en) | RAID storage system with logical data group priority | |
US20160004475A1 (en) | Management system and method of dynamic storage service level monitoring | |
US9747156B2 (en) | Management system, plan generation method, plan generation program | |
WO2007140260A2 (en) | System and method for raid management, reallocation, and restriping | |
CN109213428B (zh) | 用于管理存储系统的方法和设备 | |
US8024542B1 (en) | Allocating background workflows in a data storage system using historical data | |
US8904144B1 (en) | Methods and systems for determining at risk index for storage capacity | |
JP2019053474A (ja) | クラウドベースサービスのデータ保護方法 | |
JP6622273B2 (ja) | リソース管理装置、リソース管理方法、及びリソース管理プログラム | |
WO2018089647A1 (en) | Apparatus and method of behavior forecasting in a computer infrastructure | |
US11113163B2 (en) | Storage array drive recovery | |
US20210303177A1 (en) | Prediction of maintenance window of a storage system | |
JP6622808B2 (ja) | 管理計算機および計算機システムの管理方法 | |
CN103577334A (zh) | 分配数据存储物理实体镜像对的方法和镜像数据存储系统 | |
US8005014B2 (en) | Method of choosing nodes in a multi-network | |
JP6636656B2 (ja) | 管理システム、管理装置、および管理方法 | |
US11494081B2 (en) | System and method for using telemetry data to change operation of storage middleware client of a data center |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6622273 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |