WO2014118874A1

WO2014118874A1 - ストレージシステム

Info

Publication number: WO2014118874A1
Application number: PCT/JP2013/051834
Authority: WO
Inventors: 和宏安原
Original assignee: 株式会社日立製作所
Priority date: 2013-01-29
Filing date: 2013-01-29
Publication date: 2014-08-07
Also published as: US20140215151A1; US8886888B2

Abstract

　ディスクサブシステムでの問題解析の精度を向上させるために、本発明では問題発生のタイミングでシステムトレースとシステムトレース情報の格納領域への書き込みを停止する。そして、システムトレースとシステムトレース情報の格納領域への書き込みの停止は、問題障害が発生したディスクサブシステムだけでなく、接続されている他のディスクサブシステム全てに対して行う。そして、保守端末によりシステムトレース情報を含むダンプ情報を採取する。

Description

ストレージシステム

　本発明は、ストレージシステムに関する。

　これまでのディスクサブシステムでは、障害情報（ダンプ情報）の採取は１台毎に実施していた。ディスクサブシステム単体での使用環境や、１対１で接続されるようなディスクサブシステム間のリモートコピー環境では、１台毎のダンプ情報の採取でも障害解析において大きな問題は発生しない。

　しかしながら、近年のリモートコピー環境では、複数のディスクサブシステムに跨る構成が多い。例えば、コピー元の正サイトとコピー先の副サイト間でディスクサブシステム４台ずつのリモートコピーを実施する環境（Ｕｎｉｖｅｒｓａｌ　Ｒｅｐｌｉｃａｔｏｒ　４対４）では、８台のディスクサブシステムに跨った順序性を保ったデータのレプリケーションを実施している。

　そのため、何らかの障害が発生した場合に迅速な障害回復アクションを実施するためには、同じ時間帯に採取した障害情報、例えば、システム制御プログラム（マイクロプログラム）の処理経過情報であるダンプ情報が揃うことが望ましい。更に、ディスクサブシステム間だけの問題ではなく、ホスト計算機とディスクサブシステム間の処理遅延問題が発生した場合でも、複数台のディスクサブシステムが連携して処理を実行していることから、全てのサブシステムからのダンプ情報の採取が望ましい。

　そのため、特許文献１のように、ディスクサブシステムで障害が発生した場合、その障害情報であるダンプ情報をホスト計算機に送信する技術が提案されている。

日本公表特許２０１０－５２４０５３号公報　　　　　　　　　　　　　　（米国公開特許２００８／０２４４３３１号公報）

　ディスクサブシステムにおいて問題が発生した場合、問題の原因を解析するために、ディスクサブシステムの情報を保守端末より採取する。この採取した情報をダンプ情報ないし単にダンプと読んでおり、ディスクサブシステム内のメモリ情報やマイクロプログラムが残すエラーコード、更にマイクロプログラムの詳細な動作履歴が記録されているシステムトレース情報、ユーザ操作ログ情報などが含まれている。

　この中でも、マイクロプログラムの動きを解析するに当たり重要となるのはシステムトレースである。システムトレース領域は、マイクロプログラムの処理の順番に従い、情報が記録されている。しかし、この記録するための領域は有限であるため、古い情報は上書きされる。

　つまり、ダンプ情報の採取が遅れた場合、その後のディスクサブシステム上の処理により、解析に必要な問題発生時の情報が、上書きされてしまう可能性がある。また、リモートコピー環境では、ディザスタリカバリの観点から、各ディスクサブシステムは遠隔地に点在して配置されていることがほとんどであり、保守員が出向いて保守を実行するまでに時間を要する。そのため、全てのディスクサブシステムのダンプ情報を同じ時間帯に採取することは困難な場合が多い。

　本発明の目的は、リモートコピー環境に限らず、ホスト計算機とディスクサブシステム間の障害等の問題発生直後のダンプ情報を、全てのディスクサブシステムから同時に採取して、迅速な問題解析と障害対応を実現することにある。

　上記課題を解決するために、本発明では、問題発生のタイミングでシステムトレースとシステムトレース情報の格納領域への書き込みを停止する。システムトレースとシステムトレース情報の格納領域への書き込みの停止は、問題障害が発生したディスクサブシステムだけでなく、接続されている他のディスクサブシステム全てに対して行う。そして、システムトレース情報を含むダンプ情報を採取し、システムトレース情報の格納領域以外の格納領域に保存する。

　本発明では、問題発生のタイミングで全ディスクサブシステムのシステムトレースとシステムトレース情報の格納領域への書き込みの停止が可能となるので、問題解析に必要なダンプ情報を確実に採取でき、問題を短時間で容易に解析ができる。前述以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

図１は、本発明の概念を示す図である。図２は、本発明でのディスクサブシステムのディスクコントローラ部を示すブロック図である。図３は、１対１リモートコピー環境でのディスクサブシステムの接続構成を示す図である。図４は、外部ストレージ使用環境でのディスクサブシステムの接続構成を示す図である。図５は、Ｍ対Ｎリモートコピー環境でのディスクサブシステムの接続構成を示す図である。図６は、３データセンタのマルチターゲットリモートコピー環境でのディスクサブシステムの接続構成を示す図である。図７は、３データセンタのカスケードリモートコピー環境でのディスクサブシステムの接続構成を示す図である。図８は、複数の異なる外部ストレージを使用する環境でのディスクサブシステムの接続構成を示す図である。図９は、実施例１でのシステム応答とハードウェアリソースの負荷状態による問題発生の検知を説明する図である。図１０は、実施例１でのシステム応答とハードウェアリソースの負荷状態による問題発生の検知を説明する図である。図１１は、問題発生を検知するための監視動作を説明する図である。図１２は、システムトレース情報記憶領域へのデータ更新の停止動作を説明する図である。図１３は、システムトレース停止指示の発行動作を説明する図である。図１４は、ダンプ情報の転送動作を説明する図である。図１５は、ダンプ情報の採取処理を説明する図である。図１６は、ＳＶＰへのダンプ情報の転送処理を説明する図である。図１７は、実施例２でのディスクサブシステム稼働状況による問題発生の検知を説明する図である。図１８は、ダンプ情報採取の処理を説明する図である。

　以下、図面を参照しながら本発明の実施の形態を説明する。なお、以下の説明では、「ｘｘｘ情報」等の表現にて各種情報を説明することがあるが、各種情報は、テーブルなどのデータ構造で表現されていてもよい。

　また、「プログラム」を主語として処理を説明する場合がある。そのプログラムは、プロセッサ、例えば、ＭＰ（Ｍｉｃｒｏ　Ｐｒｏｃｅｓｓｏｒ）やＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）によって実行されるもので、定められた処理をするものである。なお、適宜に記憶資源（例えば、メモリ）及び通信インタフェース装置（例えば、通信ポート）を用いながら行うため、処理の主語がプロセッサとされてもよい。プロセッサは、ＣＰＵの他に専用ハードウェアを有していても良い。コンピュータプログラムは、プログラムソースから各コンピュータにインストールされても良い。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアなどで提供されるものであっても良い。

　また、各要素、例えば、コントローラは番号などで識別可能であるが、識別可能な情報であれば、名前など他種の識別情報が用いられても良い。本発明の図及び説明において同一部分には同一符号を付与しているが、本発明が本実施例に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。

＜発明の概念＞
　本発明の概念を図１で説明する。

　図１は、本発明の概念を示す図である。ディスクサブシステムには、システム全体を制御するコントローラ部であるＤＫＣ（Ｄｉｓｋ　Ｃｏｎｔｒｏｌｌｅｒ）１がある。また、ＤＫＣ１内部には、システム全体の制御を実行するマイクロプログラム１０と、そのマイクロプログラム１０の実行結果（システムトレース情報）を保存するシステムトレース情報記憶領域１１がある。

　システムトレース情報記憶領域１１には、最初の処理Ａの実行結果から順に格納され、処理Ｆまでの格納が完了した時点で満杯となる。次の処理Ｇのシステムトレース情報は、一番古い情報となる領域先頭の処理Ａの情報を上書きして保存する。なお、このシステムトレースとは、プログラムが処理される順序を追跡することである。

　障害等の問題発生後、迅速なダンプ情報の採取が実施できない場合、障害発生時の重要な情報がその後の処理実行により、上書きされてしまい原因究明が困難となる。つまり、障害発生１４以降に、処理Ｈのシステムトレース情報１３が処理Ｂに上書きされてしまう。このような上書きが、保守員によるシステムトレース情報記憶領域１１への格納停止１５まで継続されてしまい、障害の解析に必要な情報が消失してしまう。ちなみに、ダンプ情報とはシステムトレース情報記憶領域１１などのメモリ上に保存されたプログラムでの処理内容、警告などの履歴、ファイルやメモリの内容などの情報で、ログとも呼ばれる。

　そこで、本発明では、ＤＫＣ１内部のマイクロプロセッサなどが、障害が発生した時点（障害発生１４）で、システムトレース情報記憶領域１１への格納を停止する（格納停止１５）。すなわち、符号１３に示すように処理Ｈ以降の実行結果をシステムトレース情報記憶領域１１に格納しない。そして、符号１６に示すように処理Ｂから処理Ｇのダンプ情報を採取し、後述するＳＶＰ（Ｓｅｒｖｉｃｅ　Ｐｒｏｃｅｓｓｏｒ）と呼ばれる保守端末に転送し保存する。更に、ＤＫＣ１に接続されている他のＤＫＣ、図１ではＤＫＣ２に対しシステムトレース停止指示１７を送り、ＤＫＣ２でのシステムトレース情報記憶領域１１への格納停止、ダンプ情報の採取と採取したダンプ情報のＳＶＰへの転送を実行させる。つまり、障害発生時点でそれぞれのＤＫＣで同時にダンプ情報を採取しＳＶＰへ保存する。

　以上のように、複数のＤＫＣが接続されて使用される環境、例えば、リモートコピー環境（正ＤＫＣから正ＤＫＣと異なる場所に設置された副ＤＫＣへリモートでデータ複製を実行する環境）などでも、ディスクサブシステムの設置場所による問題からタイムリーな情報採取ができないという課題を解決でき、また、原因究明に必要な情報を迅速にかつ的確に採取できるので、問題現象の再発を待って再度ダンプ情報の採取を試みる必要もなくなる。

＜ディスクサブシステム内部構成＞
　図２は、本発明でのディスクサブシステムのディスクコントローラ部を示すブロック図である。

　ディスクサブシステムは、ＤＫＣ２１とＳＶＰ２９を備え、ターゲットポート２８を介して、ホスト計算機（以下、ホスト）２０と接続され、ホスト２０からのデータはユーザボリューム２５に格納される。イニシエータポート／外部ポート２６、ＲＣＵ（Ｒｅｍｏｔｅ　Ｃｏｎｔｒｏｌｌ　Ｕｎｉｔ）ターゲットポート２７は、他のＤＫＣとファイバチャネル経由で接続されるポートである。複数のディスクサブシステムを接続してストレージシステムを構成しリモートコピー環境を構築する。

　ＤＫＣ２１内には、フラッシュメモリなどの不揮発性メモリ２２１に格納されたリアルタイムＯＳであるマイクロプログラム２２１１やＳＶＰ通信プログラム２２２などの各種プログラムを動作させるためのマイクロプロセッサ（図示せず、以下、ＭＰ）を複数搭載したマイクロプロセッサ部（以下、ＭＰ部）２２が複数存在する。各ＭＰ部２２上には、ローカルメモリ（以下、ＬＭ）２２３が存在し、このＬＭ２２３上に後述するシステムトレース停止を制御するために使用される性能データ２２３１が記憶される。

　また、停止させるシステムトレースでのシステムトレース情報は、ＬＭ２２３上の専用エリアであるシステムトレース情報記憶領域２２３３に記憶される。更にＬＭ２２３には、これ以外にも、マイクロプログラム２２１１がプログラムの制御用に使用しているメモリエリアであるダンプ領域２２３２が存在する。このダンプ領域２２３２には、ＭＰ部２２単体のシステムトレース情報が格納され、ダンプ情報の採取時にこの領域のシステムトレース情報も採取される。

　また、共有メモリ（以下、ＳＭ）２３は、複数のＭＰないしＭＰ部２２でシステムの制御情報やデータを共有するメモリである。このＳＭ２３上にＤＫＣ２１全体に関するシステムトレース情報を格納するためのダンプ領域２３１がある。また、ＳＭ２３には、ホスト２０からのデータないしホスト２０へのデータを一時的に格納しておくキャッシュ領域２３２がある。マイクロプログラム２２１１によりダンプが実行されると、ＭＰがＳＶＰ通信プログラム２２２を用いて、システムトレース情報記憶領域２２３３、ＬＭ２２３のダンプ領域２２３２、ＳＭ２３のダンプ領域２３１それぞれに格納されたシステムトレース情報をダンプ情報としてＳＶＰ２９に転送する。

　ＳＶＰ２９は、図示していないがシステム全体を制御するＣＰＵと、情報を入力する入力装置（例えば、キーボード、マウスなどのポインティングデバイス）と、情報を出力する出力装置（例えば、ディスプレイやプリンタ）と、情報を記録するメモリやＨＤＤなどの記憶媒体である記憶デバイと、他のシステムとの間で情報の送受信を行う通信ポート（例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）ポート）を備える。入力装置により後述する性能閾値や性能閾値の超過時間範囲などを設定し、ハードウェアリソースの性能データや取得したダンプ情報などを出力装置に表示させる。

　ＤＫＣ２１からのシステムトレース情報を受信したＳＶＰ２９は、そのシステムトレース情報をダンプ情報２９１として内部に保存する。また、ＤＫＣ２１には、マイクロプログラム２２１１からの命令を受信することが出来る特殊ボリューム２４があり、コマンドデバイスと呼ばれる。この特殊ボリューム２４で他のＤＫＣからのシステムトレース停止指示の受信や他のＤＫＣへのシステムトレース停止指示の送信を行う。詳細は後述する。

＜ダンプ情報採取の適用環境＞
　問題が発生したディスクサブシステム以外の接続しているディスクサブシステムにトレース停止命令を伝達する方法として、リモートコピー環境や外部ストレージ接続環境では、ディスクサブシステム同士が、ファイバチャネル経由で接続され情報のやり取りを実施している。そこで、本発明では、このファイバチャネル接続パス（リモートコピー接続パス／外部ストレージ接続パス）経由で接続されるＤＫＣにシステムトレースの停止を指示する。本発明におけるダンプ情報採取の適用環境について、図３から図８で説明する。

　図３は、１対１リモートコピー環境でのディスクサブシステムの接続構成を示す図である。図４は、外部ストレージ使用環境でのディスクサブシステムの接続構成を示す図である。図５は、Ｍ対Ｎリモートコピー環境でのディスクサブシステムの接続構成を示す図である。図６は、３データセンタ（以下、３ＤＣ）マルチターゲットリモートコピー環境でのディスクサブシステムの接続構成を示す図である。図７は、３ＤＣカスケードリモートコピー環境でのディスクサブシステムの接続構成を示す図である。図８は、複数の異なる外部ストレージを使用する環境でのディスクサブシステムの接続構成を示す図である。ここでは、ディスクサブシステムをＤＫＣとして説明する。

　図３のリモートコピー環境は、正ＤＫＣ３０のボリューム３０３と副ＤＫＣ３１のボリューム３１３の間でリモートコピー３４を実行する環境である。正ＤＫＣ３０と副ＤＫＣ３１とは、リモートコピー接続パス３３で接続されている。すなわち、イニシエータポート３０１とＲＣＵターゲットポート３１２とがリモートコピー接続パス３２で接続されている。同じく、イニシエータポート３１１とＲＣＵターゲットポート３０２とでリモートコピー接続パス３３で接続されている。本発明では、このリモートコピー接続パス３２／３３でシステムトレースの停止指示の送受信を行う。

　図４の外部ストレージ使用環境では、ＤＫＣ４０と外部ＤＫＣ４１が、外部ポート４０１とターゲットポート４１１を外部ストレージ接続パス４２で接続することで、外部ボリューム４１２を仮想ボリューム４０２として、仮想ボリュームマッピング４３とするものである。図３と同じく、外部ストレージ接続パス４２でシステムトレースの停止指示の送受信を行う。

　図５の複数筐体でのリモートコピー環境では、正サイト５ａの正ＤＫＣ１　５１と副サイト５ｂの副ＤＫＣ１　５４とを接続し正ボリューム５１１と副ボリューム５４１とのリモートコピーを実現する。また、同じく、正ＤＫＣ２　５２と副ＤＫＣ２　５５とを接続し正ボリューム５２１と副ボリューム５５１とのリモートコピーを行う。このような接続をＭ台の正ＤＫＣとＮ台の副ＤＫＣまで行い、複数の筐体（（Ｍ＋Ｎ）台）に跨るリモートコピー環境（これを、Ｍ×Ｎユニバーサルリプリケータと呼ぶ）を実現する。

　このような複数の筐体に跨るリモートコピー環境でも、図３で説明したリモートコピー接続パスによりシステムトレースの停止指示の送受信を行う。なお、Ｎ台の副ＤＫＣの後段にＰ台の副ＤＫＣを接続した構成もあり、（Ｍ＋Ｎ＋Ｐ）台という多数のＤＫＣからダンプ情報を採取し問題を解析するケースもある。

　図６の３ＤＣマルチターゲットでのリモートコピー環境では、正ＤＫＣ１　６１と、副ＤＫＣ１　６２及び副ＤＫＣ２　６３とを接続し、正ボリューム６１１と、副ボリューム６２１及び副ボリューム６３１との間でリモートコピーを行う。図７の３ＤＣカスケードでのリモートコピー環境では、正ＤＫＣ１　６１と副ＤＫＣ１　６２とを接続し、更に副ＤＫＣ１　６２を正ＤＫＣ１として副ＤＫＣ２　６３と接続する。

　そして、正ボリューム６１１と副ボリューム６２１とのリモートコピー及び副ボリューム６２１を正ボリュームとして副ボリューム６３１とのリモートコピーを行う。このような３ＤＣでのリモートコピー環境でも、図３で説明したリモートコピー接続パスによりシステムトレースの停止指示の送受信を行う。

　図８の外部ストレージの接続環境では、Ａ社（自社製）のディスクサブシステム（ＤＫＣ）に、Ａ社の外部ストレージ（ＤＫＣ）７２とＢ社（他社製）の外部ストレージ（ＤＫＣ）７３が接続されている。この外部ストレージの接続環境では、符号７４で示すように外部ボリューム７２１が仮想ボリューム７１１に仮想ボリュームマッピングされ、符号７５で示すように外部ボリューム７３１が仮想ボリューム７１２に仮想ボリュームマッピングされる。なお、本発明のシステムトレースの停止指示の送受信及びダンプ情報採取・転送については、自社製のＤＫＣ７１及びＤＫＣ７２を対象とし、他社製のＤＫＣ７３は対象外とする。

　また、本発明では、前述のような複数のＤＫＣ環境でなくとも、ＤＫＣ１台の環境でも適用可能である。更に、ファイバチャネルなどの専用線ではなくＳＶＰに接続できるインターネットなどの一般公衆回線を用いて、システムトレースの停止指示の送受信及びダンプ情報採取などを行うことも可能である。

＜実施例１＞
＜ダンプ情報の採取契機１＞
　図９及び図１０は、実施例１でのシステム応答とハードウェアリソースの負荷状態による問題発生の検知を説明する図である。

　障害解析において、ホスト２０とディスクサブシステム（ＤＫＣ）２１間の性能劣化問題が最も難しい部類に含まれる。この問題の原因解析と解決策検討のためには、問題発生直後のダンプ情報の採取が非常に重要となる。そこで、本発明では、ＤＫＣ自身及び接続しているＤＫＣでのシステムトレースを停止させ、各ＳＶＰで担当するＤＫＣのシステムトレース情報をダンプ情報（障害情報）として採取し、ＳＶＰ内部のボリュームにダンプ情報を保存する。

　また、ダンプ情報の採取は一度だけではなく、ダンプ情報の採取契機となる条件に合致した場合には、毎回ダンプ情報の採取を行い、複数世代に亘るダンプ情報をＳＶＰに保存する。このように複数世代に亘るダンプ情報を解析することにより、障害の原因究明の精度が向上し解析時間を短縮することができる。

　次にシステムトレース停止とダンプ情報の採取契機について、図９及び図１０で説明する。ＤＫＣ２１のマイクロプログラム２２１１が定期的に採取している性能データ（ＬＭ２２３上の性能データ２２３１）をシステムトレース停止の条件として使用する。使用する性能データの種類は以下に示すものである。
　（ｐ１）ホスト２０に接続されているポートの応答時間
　（ｐ２）リモートコピーＩＯで使用するポートの応答時間
　（ｐ３）ＬＤＥＶ（論理デバイス）応答時間
　（ｐ４）ＭＰ稼働率
　（ｐ５）ＰＧ（Ｐａｒｉｔｙ　Ｇｒｏｕｐ：パリティグループ）稼働率
　（ｐ６）キャッシュ書き込み待ち率

　ホスト２０に接続されているポートの応答時間は、ホスト２０と接続されるターゲットポート２８において、ホスト２０からの命令を受領してからターゲットポート２８が応答するまでの平均時間である。なお、ターゲットポート２８の単位時間当たり転送量でもよい。

　リモートコピーＩＯで使用するポートの応答時間は、リモートコピー対象ディスクサブシステムと接続されるポート（イニシエータ／外部ポート２６ないしＲＣＵターゲットポート２７）において、ホストからの命令に対してポートが応答するまでの平均時間である。なお、イニシエータ／外部ポート２６ないしＲＣＵターゲットポート２７の単位時間当たり転送量でもよい。

　ＬＤＥＶ応答時間は、ディスクサブシステム（ＤＫＣ２１）が、あるＬＤＥＶ（例えば、ユーザボリューム２５）に対する命令をホスト２０から受領したあと、その処理の応答を返信するまでの処理時間を示す。

　ＭＰ稼働率は、マイクロプロセッサが単位時間あたり、どれだけ稼動していたかを示す割合である。

　ＰＧ稼働率は、複数の記憶媒体（例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ））で構成されるパリティグループが単位時間あたり、どれだけ稼動していたかを示す割合である。

　キャッシュ書き込み待ち率は、ディスクサブシステム（ＤＫＣ２１）がホスト２０から記憶媒体に書き込むデータを受け取った後、ＳＭ２３上のキャッシュメモリ領域に保存したが、記憶媒体に未反映なデータ量のキャッシュ領域２３２の総記憶容量に対する割合である。

　前述のハードウェア性能情報以外に、リモートコピー時に使用するジャーナルボリュームの利用率やＨＤＤ稼働率などの指標を用いてもよい。

　次に、システムトレース停止の契機となる条件について説明する。

　まず、（ｐ１）のホスト２０に接続されるポートの応答時間、（ｐ２）のリモートコピーＩＯで使用するポートの応答時間、（ｐ３）のＬＤＥＶ応答時間、それぞれに設定された性能閾値を、（ｐ１）から（ｐ３）のいずれかが超過した場合を“条件Ａ”とする。

　次に、ハードウェアリソースが過負荷でない場合を条件Ｂとする。このハードウェアリソースとは、前述の（ｐ４）のＭＰ稼働率、（ｐ５）のＰＧ稼働率、（ｐ６）のキャッシュ書き込み待ち率とし、（ｐ４）から（ｐ６）それぞれに設定された性能閾値に対し（ｐ４）から（ｐ６）の負荷（稼働率や書き込み待ち率）全てが超えていない場合を“条件Ｂ”とする。この条件Ａと条件Ｂの両方を満足する場合を、システムトレース停止の契機とする。

　逆に、（ｐ１）から（ｐ３）の応答時間が性能閾値を超過しない場合か、図９のようにハードウェアリソースが過負荷である場合には、システムトレース停止の契機としない。これは、通常のハードウェアリソースに過負荷状態が確認できた場合、その部位がボトルネックとなり、性能問題につながる可能性が高い。そこで、このようにボトルネックの部位が明らかな場合には、障害が発生していると思われる被疑部位を特定し易いため、ダンプ情報の自動採取の対象から除く。これにより不要なダンプ情報の採取を低減でき、問題解析の時間を短縮でき解析効率を向上できる。

　図９の２つのグラフは、それぞれ経過時間９２に対するポート応答時間９１と、経過時間９２に対するハードウェア使用率９３を示す。ハードウェア使用率９３は、前述の（ｐ４）から（ｐ６）の負荷である。経過時間９２がＴ１時点で、ポート応答時間９１が性能閾値９１１を超え、符号９１２で示すように閾値超えが発生している。同じく、経過時間９２がＴ１時点で、ハードウェア使用率９３が性能閾値９３１を超え、符号９３２で示すように閾値超えが発生している。この場合は、前述のようにハードウェアリソースの過負荷（高使用率）により、ポートの応答時間が大きくなっていると直ぐに解明できる。そのため、システムトレースの停止とダンプ情報の採取処理を行わない。

　一方、図１０では、経過時間９２がＴ１時点で、ポート応答時間９１が閾値９１１を超え、符号９１２で示すように閾値超えが発生している。ところが、マイクロプログラム２２１１で監視しているハードウェアリソース使用率９３は、Ｔ１時点からＴ２時点までの監視時間９１３においては過負荷状態ではなく定常状態（性能閾値９３１を下回る状態）となっている（閾値超なし９３３）。そのため、ディスクサブシステム（ＤＫＣ２１）内において何らかの予期せぬ問題が発生している可能性が高いため、システムトレースの停止とダンプ情報の採取処理を行う。

　ポート応答時間９１が瞬間的に上昇するような場合、問題が顕在化している時間が短く、システムトレース情報記憶領域２２３３へのシステムトレース情報（処理結果）の上書きも早い。また、必要以上のダンプ情報の採取を防ぐために、図１０に示す一時的な応答時間の上昇のみを監視対象とする。つまり、ポート応答時間９１が性能閾値９１１を超えている時間が予め定めた監視時間９１３の範囲に収まっている場合のみ、監視対象としダンプ情報の採取を行う。なお、監視時間９１３は任意の値に設定可能とし、マイクロプログラム２２１１で予め設定しておくか、ＳＶＰ２９から設定できる構成とする。また、ポート応答時間ではなくＬＤＥＶ応答時間でも、システムトレース停止とダンプ情報採取の契機を判断できる。

＜ダンプ情報の採取動作＞
　次に、システムトレース停止からダンプ情報の採取・転送までの一連の動作を図１１から図１４で説明する。なお、動作の主体をＭＰ部２２のＭＰ上で動作するマイクロプログラム２２１１とするが、ＭＰや他のコントローラなどのハードウェア資源でもよい。

　図１１は、問題発生を検知するための監視動作を説明する図である。図１２は、システムトレース情報記憶領域へのデータ更新の停止動作を説明する図である。図１３は、システムトレース停止指示の発行動作を説明する図である。図１４は、ダンプ情報の転送動作を説明する図である。

＜動作１＞
　まず、図１１のようにマイクロプログラム２２１１が、システムトレース停止の契機となる下記の２つの動作及び状態を監視する。
　（１ａ）接続されているＤＫＣからのシステムトレース停止指示（符号１２１）
　（１ｂ）閾値管理するメモリ上の性能データ（符号１２２）

　なお、他のＤＫＣからのシステムトレース停止指示１２３は、ＲＣＵターゲットポート２７に接続される特殊ボリューム２４に対して発行される。また、上記のように２つの状態及び動作を監視している状況では、マイクロプログラム２２１１が、常にシステムトレース情報記憶領域２２３３へシステムトレース情報を更新している。

＜動作２＞
　次に、図１２のようにマイクロプログラム２２１１によるＤＫＣ内部の監視中に、下記の２つの条件（２ａ）または（２ｂ）のいずれか１つに合致したときに、マイクロプログラム２２１１はシステムトレース情報記憶領域２２３３へのシステムトレース情報の更新を停止する。なお、ＬＭ２２３のダンプ領域２２３２及びＳＭ２３のダンプ領域２３１へのシステムトレース情報の更新は停止しない。
　（２ａ）監視対象の性能データが閾値の判定条件に合致した場合
　（２ｂ）他のＤＫＣが発行したシステムトレース停止信号を受信した場合

　（２ａ）の条件を満足する場合は、前述の（ｐ１）及び（ｐ２）のポート応答時間や（ｐ３）のＬＤＥＶ応答時間が設定した性能閾値を超過し、（ｐ４）のＭＰ稼働率、（ｐ５）のＰＧ稼働率、（ｐ６）のキャッシュ書き込み待ち率の全てが性能閾値を超過していない場合である。具体的な判定処理については、図１５で詳述する。

＜動作３＞
　次に、前述の（２ａ）の条件に合致してシステムトレースが停止した場合、マイクロプログラム２２１１は、ＤＫＣ２１に接続されるリモートコピー対象のＤＫＣや外部ストレージが存在するかを確認する。ＤＫＣ２１に接続されるリモートコピー対象のＤＫＣや外部ストレージが存在する場合、マイクロプログラム２２１１は、図１３のようにファイバチャネルプロトコルのリモートコピー接続パスや外部ストレージ接続パス経由で、接続相手のＤＫＣに対しシステムトレース停止信号を発行する。

＜動作４＞
　次に、図１４のようにマイクロプログラム２２１１は、ＬＭ２２３上のダンプ領域２２３２とシステムトレース情報記憶領域２２３３に格納されているシステムトレース情報（ダンプ情報）と、ＳＭ２３のダンプ領域２３１に格納されているダンプ情報とを採取して、採取したダンプ情報をＳＶＰ２９へ転送する。ＳＶＰ２９は、受信したダンプ情報をダンプ情報２９１として内部のボリュームに保存する。なお、ＳＶＰ２９は、Ｗｉｎｄｏｗｓ（登録商標）などのＯＳで動作するＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）であり、“ＸＹＺ．ｌｏｇ”などの名称でファイルとしてダンプ情報が保存される。なお、このダンプ情報２９１には、ホスト２０でユーザがＤＫＣ２１に操作した結果である操作ログも含まれる。

　また、ＳＶＰ２９に転送されたダンプ情報２９１を更に保守センタ１４１１に送り、問題の解析を行うこともできる。また、ＤＫＣ２１に接続されている遠隔地に点在する他のＤＫＣ１４０１からＳＶＰ１４０９に転送されたダンプ情報も保守センタ１４１１に送り、２つのダンプ情報で総合的な問題解析を実施し、解決策をリモートで各ＤＫＣに講じることも可能である。

　＜ダンプ情報の採取処理フロー１＞
　図１５は、ダンプ情報の採取処理を説明する図である。次に、システムトレース停止からダンプ情報の採取・転送までの一連の処理フローを図１５で説明する。なお、動作の主体をＭＰ部２２のＭＰ上で動作するマイクロプログラム２２１１とするが、ＭＰや他のコントローラなどのハードウェア資源でもよい。

　最初に、Ｓ１５０１で、マイクロプログラム２２１１は、他のＤＫＣ（例えば、図３の副ＤＫＣ３１）からのシステムトレース停止指示があるかを判断する。指示があれば、マイクロプログラム２２１１は、Ｓ１５０８を実行し、無い場合はＳ１５０２を実行する。

　次に、Ｓ１５０２で、マイクロプログラム２２１１は、ＤＫＣ２１のポート応答時間またはＬＤＥＶ応答時間が性能閾値を超えているかを判断する。両方とも超えていない場合、マイクロプログラム２２１１は、再びＳ１５０１を実行し、超えている場合はＳ１５０３を実行する。このＳ１５０２の処理が、前述の条件Ａを満足するかの判断に相当する。

　Ｓ１５０３で、マイクロプログラム２２１１は、ＰＧ稼働率が性能閾値を超えているかを判断する。超えている場合、マイクロプログラム２２１１は、再びＳ１５０１を実行し、超えていない場合はＳ１５０４を実行する。

　Ｓ１５０４で、マイクロプログラム２２１１は、キャッシュ書き込み待ち率が性能閾値を超えているかを判断する。超えている場合、マイクロプログラム２２１１は、再びＳ１５０１を実行し、超えていない場合はＳ１５０５を実行する。

　Ｓ１５０５で、マイクロプログラム２２１１は、ＭＰ稼働率が性能閾値を超えているかを判断する。超えている場合、マイクロプログラム２２１１は、再びＳ１５０１を実行し、超えていない場合はＳ１５０６を実行する。Ｓ１５０３からＳ１５０５までの処理が、前述の条件Ｂを満足するかの判断に相当する。

　Ｓ１５０６で、マイクロプログラム２２１１は、ＤＫＣ２１に接続している他のＤＫＣが存在するかを判断する。存在する場合、マイクロプログラム２２１１は、Ｓ１５０７を実行し、存在しない場合はＳ１５０８を実行する。

　Ｓ１５０７で、マイクロプログラム２２１１は、他のＤＫＣへのシステムトレース停止指示を発行する。この処理により、他のＤＫＣでのシステムトレースの停止とダンプ情報の採取が可能となる。

　Ｓ１５０８で、マイクロプログラム２２１１は、ＤＫＣ２１でのシステムトレースを停止する。

　Ｓ１５０９で、マイクロプログラム２２１１は、ＳＶＰ２９へトレース停止報告を実行する。

　Ｓ１５１０で、マイクロプログラム２２１１は、ＤＫＣ２１のダンプ情報の採取を行い、採取したダンプ情報をＳＶＰ２９へ転送する。

　Ｓ１５１１で、マイクロプログラム２２１１は、採取したダンプ情報のＳＶＰ２９への転送完了後に、システムトレースを再開する。システムトレースの再開後、マイクロプログラム２２１１は、処理をＳ１５０１に戻す。

　図１６は、ＳＶＰへのダンプ情報の転送処理を説明する図である。次に、ＳＶＰ２９での処理フローを図１６で説明する。処理の主体をＳＶＰ２９のＣＰＵ（図示せず）とする。

　Ｓ１６０１で、ＣＰＵは、ＤＫＣ２１からのシステムトレース停止の報告があったかを判断する。報告が無い場合、ＣＰＵは、再びＳ１６０１の処理を実行しシステムトレース停止の報告を待つ。報告があった場合、ＣＰＵは、Ｓ１６０２を実行する。

　Ｓ１６０２で、ＣＰＵは、ＤＫＣ２１からダンプ情報を収集する。

　Ｓ１６０３で、ＣＰＵは、収集したダンプ情報を内蔵ＨＤＤへ格納する。内蔵ＨＤＤへの格納後に、ＣＰＵは処理をＳ１６０１に戻す。

　以上の説明したように、本発明では問題解析に必要なダンプ情報を的確に採取できる。また、複数のＤＫＣから問題発生時点のダンプ情報も的確かつ同時に採取できる。そのため、問題解析の精度を向上でき、保守時間の短縮が図れる。

＜実施例２＞
＜ダンプ情報の採取契機２＞
　次に、ディスクサブシステムの稼働状況によりダンプ情報を採取する方法を説明する。図１７は、実施例２でのディスクサブシステム稼働状況による問題発生の検知を説明する図である。

　実施例２では、ディスクサブシステムの平均稼働率との偏差が設定値を超えたときを契機にシステムトレースを停止しダンプ情報を採取する。これは、ユーザの業務形態により、一日中のサブディスクシステムに対する業務量には周期性があることが多い。そのため、ディスクサブシステムに対する入出力が一定のパターンとなる可能性が高い。

　そこで、稼動状況をある一定期間監視し、一日中のポートの平均応答時間の指標で平均稼働率の性能閾値をディスクサブシステム内で作成する。そして、実際のポート応答時間が設定した割合ないしは時間分を超過した場合にシステムトレースを停止しダンプ情報を採取する。

　ダンプ情報の採取契機の条件として、平均稼働率の性能閾値からの乖離の度合い（割合ないし時間）があるが、その度合いは任意の値に設定可能とする。同じく、性能閾値を超過した時間も任意の値に設定可能とする。また、必要以上のダンプ情報の採取を防ぐため、前述のダンプ情報の採取契機１と同様に、一時的なポートないしはＬＤＥＶ応答時間の上昇のみを監視対象とする。

　具体的には、図１７のポート応答時間１７１と時刻１７２とで、一日全体の平均応答時間の指標である平均稼働率の性能閾値１７１１を設定する。なお、ポート応答時間ではなくＬＤＥＶ応答時間で平均稼働率の性能閾値１７１１を設定できる。そして、実際のポート応答時間からポート応答時間曲線１７１２を作成し、性能閾値１７１１と比較する。

　性能閾値１７１１に対し超過しているポート応答時間曲線１７１２の超過割合（Ｒ１）ないし超過時間（Ｔ５）が予め設定した基準値１７１３を超え（基準値超発生１７１４、条件Ｃ）、基準値超過の継続時間（Ｔ３からＴ４まで）が予め設定した時間の範囲である時間閾値以内の場合（条件Ｄ）にダンプ情報の採取契機とする。

＜ダンプ情報の採取処理フロー２＞
　図１８は、ダンプ情報の採取処理を説明する図である。次に、実施例２でのシステムトレース停止からダンプ情報の採取・転送までの一連の処理フローを図１８で説明する。なお、動作の主体をＭＰ部２２のＭＰ上で動作するマイクロプログラム２２１１とするが、ＭＰや他のコントローラなどのハードウェア資源でもよい。

　Ｓ１８０１で、マイクロプログラム２２１１は、ＬＭ２２３上の性能データ２２３１をチェックする。

　Ｓ１８０２で、マイクロプログラム２２１１は、実際のポート応答時間曲線１７１２と性能閾値１７１１を比較し、基準値から乖離はあるかを判断する。つまり、前述のように条件Ｃ及び条件Ｄを満足するシステム状態であるかを判断する。両方の条件を満足しない場合（Ｓ１８０２でＮｏ）、マイクロプログラム２２１１は、Ｓ１８０９を実行する。両方の条件を満足する場合（Ｓ１８０２でＹｅｓ）、マイクロプログラム２２１１は、Ｓ１８０３を実行する。

　Ｓ１８０３からＳ１８０８までの処理は、前述のＳ１５０６からＳ１５１１までの処理と同じである。また、Ｓ１８０９の処理は、Ｓ１５０１の処理と同じである。

　以上のように、実施例２でも実施例１と同様に、１日のポート応答時間ないしＬＤＥＶ応答時間を計測して性能閾値１７１１を求め、実際のポート応答時間曲線１７１２との乖離度によりダンプ採取の契機を判断し、問題解析に必要なダンプ情報を的確に採取できる。また、複数のＤＫＣから問題発生時点のダンプ情報も的確かつ同時に採取できる。そのため、問題解析の精度の向上と保守時間の短縮が図れる。

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。　　また、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。

　各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記録装置、または、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置いてもよい。また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

　１、２　ＤＫＣ
　１０　マイクロプログラム
　１１　システムトレース情報記憶領域
　２０　ホスト
　２１　ＤＫＣ
　２２　マイクロプロセッサ
　２３　共有メモリ
　２４　特殊ボリューム
　２９　ＳＶＰ
　２２１　リアルタイムＯＳ
　２２２　ＳＶＰ通信プログラム
　２２３　ローカルメモリ
　２３１　ダンプ領域
　２９１　ダンプ情報
　２２１１　マイクロプログラム
　２２３１　性能データ
　２２３２　ダンプ領域
　２２３３　システムトレース情報記憶領域

Claims

　複数のディスクサブシステムを含むストレージシステムであって、
　前記ディスクサブシステムは、
　前記ディスクサブシステムを制御する制御プログラムを実行するプロセッサと、
　前記ディスクサブシステムのハードウェアリソースの性能データを格納する性能データ領域と前記制御プログラムの実行結果である第１システムトレース情報を格納する第１システムトレース情報記憶領域を有する第１メモリと、
　ホスト計算機から前記ディスクサブシステムへのデータを一時的に格納するキャッシュ領域と、前記第１システムトレース情報以外の第２システムトレース情報を格納する第２システムトレース情報記憶領域とを有する第２メモリと、
　前記ディスクサブシステムと異なるディスクサブシステムと接続する第１ポートと、
　前記ホスト計算機と接続する第２ポートと、
　前記ホスト計算機から第２ポートを経由して受信したデータを格納する複数の記憶媒体からパリティグループを１つ以上構成する第１ボリュームと、
　を備え、
　前記ハードウェアリソースの性能データが予め定められた性能閾値を超えた場合、前記複数のディスクサブシステムのプロセッサそれぞれが、前記複数のディスクサブシステムそれぞれの前記第１システムトレース情報を取得する
　ことを特徴とするストレージシステム。
　請求項１記載のストレージシステムであって、
　前記プロセッサが、前記他のディスクサブシステムからのシステムトレース停止命令の受信により前記第１システムトレース情報を取得する
　ことを特徴とするストレージシステム。
　請求項１記載のストレージシステムであって、
　前記プロセッサは、前記システムトレース情報記憶領域への第１システムトレース情報の格納を停止して、前記システムトレース情報記憶領域に格納された第１システムトレース情報を取得する
　ことを特徴とするストレージシステム。
　請求項３記載のストレージシステムであって、
　前記ディスクサブシステムは、
　更に他のディスクサブシステムとのコマンドを格納する複数の記憶媒体から構成された第２ボリュームを備え、
　前記プロセッサが、
　前記他のディスクサブシステムに、第２ボリュームと第１ポート経由でシステムトレース停止命令を送信し、
　前記他のディスクサブシステムでのシステムトレース情報記憶領域への第１システムトレース情報の格納を停止させ、前記システムトレース情報記憶領域に格納された第１システムトレース情報を取得させる
　ことを特徴とするストレージシステム。
　請求項１記載のストレージシステムであって、
　前記ハードウェアリソースの性能データは、
　（ｐ１）前記ホスト計算機からの入出力命令に対する前記第１ポートの応答時間
　（ｐ２）前記ホスト計算機からの入出力命令に対する前記第２ポートの応答時間
　（ｐ３）前記記憶媒体への入出力命令が完了するまでの処理時間である論理デバイス応答時間
　（ｐ４）前記プロセッサの単位時間あたりの稼動割合であるプロセッサ稼働率
　（ｐ５）前記パリティグループが単位時間あたり稼動割合であるパリティグループ稼働率
　（ｐ６）前記キャッシュ領域に保存中で前記記憶媒体に未反映なデータ量のキャッシュ領域の総記憶容量に対する割合であるキャッシュ書き込み待ち率
　（ｐ７）１日の時刻毎の前記第１ポートの平均応答時間
　（ｐ８）１日の時刻毎の前記第２ポートの平均応答時間
　（ｐ９）１日の時刻毎の前記論理デバイスの平均応答時間
のいずれか１つ以上である
　ことを特徴とするストレージシステム。
　請求項５記載のストレージシステムであって、
　前記ディスクサブシステムに、前記性能データに対し性能閾値が予め設定されている
　ことを特徴とするストレージシステム。
　請求項６記載のストレージシステムであって、
　前記（ｐ１）から（ｐ３）の性能データのいずれかが前記性能閾値を超え、超過時間が予め設定された時間範囲内で、かつ前記（ｐ４）から（ｐ６）の性能データ全てが前記性能閾値以下である場合に、前記プロセッサは前記第１システムトレース情報を取得する
　ことを特徴とするストレージシステム。
　請求項６記載のストレージシステムであって、
　前記（ｐ７）から（ｐ９）の前記性能閾値に対する実際の応答時間の乖離度が予め設定された値を超え、超過時間が予め設定された時間範囲内の場合に、前記プロセッサは前記第１システムトレース情報を取得する
　ことを特徴とするストレージシステム。
　請求項１記載のストレージシステムであって、
　前記ディスクサブシステムの稼働状況を監視する保守端末を更に備え、
　前記保守端末は、
　コントローラと、
　情報を入力する入力装置と、
　情報を出力する出力装置と、
　情報を記録する１つ以上の記憶デバイスと、
　他の外部システムとの間で情報の送受信を行う通信ポートとを備える
　ことを特徴とするストレージシステム。
　請求項９記載のストレージシステムであって、
　前記プロセッサは、前記取得したシステムトレース情報を前記保守端末に送信する
　ことを特徴とするストレージシステム。
　請求項１０記載のストレージシステムであって、
　前記保守端末は、前記通信ポートで外部システムと接続し、
　前記コントローラが、前記受信したシステムトレース情報を前記外部システムに送信する
　ことを特徴とするストレージシステム。
　請求項９記載のストレージシステムであって、
　前記ハードウェアリソースの性能データが予め定められた性能閾値を超えた場合、前記複数のディスクサブシステムのプロセッサそれぞれが、前記複数のディスクサブシステム内部の前記第２システムトレース情報を取得し、前記保守端末へ送信する
　ことを特徴とするストレージシステム。
　請求項１記載のストレージシステムであって、
　前記第１ポートはファイバチャネルプロトコルでの通信を行うポートである
　ことを特徴とするストレージシステム。
　複数のディスクサブシステムを含むストレージシステムであって、
　前記ディスクサブシステムは、
　前記ディスクサブシステムを制御する制御プログラムを実行するプロセッサと、
　前記ディスクサブシステムのハードウェアリソースの性能データを格納する性能データ領域と、前記制御プログラムの実行結果である第１システムトレース情報を格納する第１システムトレース情報記憶領域を有し前記プロセッサに接続される第１メモリと、
　ホスト計算機から前記ディスクサブシステムへのデータを一時的に格納するキャッシュ領域と、前記第１システムトレース情報以外の第２システムトレース情報を格納する第２システムトレース情報記憶領域とを有する第２メモリと、
　前記ディスクサブシステムと異なる第２ディスクサブシステムと接続するファイバチャネルプロトコルの第１ポートと、
　前記ホスト計算機と接続する第２ポートと、
　前記ホスト計算機から第２ポートを経由して受信したデータを格納する複数の記憶媒体からパリティグループを１つ以上構成する第１ボリュームと、
　前記第２ディスクサブシステムとのコマンドを格納する複数の記憶媒体から構成された第２ボリュームと、
　前記ディスクサブシステムの稼働状況を監視する保守端末と
を備え、
　前記保守端末は、
　前記保守端末全体を制御するコントローラと、
　情報を入力する入力装置と、
　情報を出力する出力装置と、
　情報を記録する１つ以上の記憶デバイスと、
　外部システムとの間で情報の送受信を行う通信ポートと
を備え、
　　前記ハードウェアリソースの性能データは、
　（ｐ１）前記ホスト計算機からの入出力命令に対する前記第１ポートの応答時間
　（ｐ２）前記ホスト計算機からの入出力命令に対する前記第２ポートの応答時間
　（ｐ３）前記記憶媒体への入出力命令が完了するまでの処理時間である論理デバイス応答時間
　（ｐ４）前記プロセッサの単位時間あたりの稼動割合であるプロセッサ稼働率
　（ｐ５）前記パリティグループが単位時間あたり稼動割合であるパリティグループ稼働率
　（ｐ６）前記キャッシュ領域に保存中で前記記憶媒体に未反映なデータ量のキャッシュ領域の総記憶容量に対する割合であるキャッシュ書き込み待ち率
　（ｐ７）１日の時刻毎の前記第１ポートの平均応答時間
　（ｐ８）１日の時刻毎の前記第２ポートの平均応答時間
　（ｐ９）１日の時刻毎の前記論理デバイスの平均応答時間
であり、前記（ｐ１）から（ｐ９）の性能データそれぞれに対する性能閾値が設定され、
　前記（ｐ１）から（ｐ３）の性能データのいずれかが前記性能閾値を超え、超過時間が予め設定された時間範囲内で、かつ前記（ｐ４）から（ｐ６）の性能データ全てが前記性能閾値以下である場合、または、
　前記（ｐ７）から（ｐ９）の前記性能閾値に対する実際の応答時間の乖離度が予め設定された値を超え、超過時間が予め設定された時間範囲内の場合、
　前記プロセッサは、
　接続しているディスクサブシステムにシステムトレース停止指示を発行し、
　前記第１システムトレース情報の前記第１システムトレース情報記憶領域への格納を停止し、
　前記保守端末へのシステムトレース停止報告を送信し、
　前記第１システムトレース情報及び第２システムトレース情報を前記保守端末へ送信し、
　前記送信完了後に、前記第１システムトレース情報記憶領域への前記第１システムトレース情報の格納を再開し、
　前記保守端末のコントローラは、
　受信した第１システムトレース情報及び第２システムトレース情報を前記記憶デバイスへの格納し、前記通信ポート経由で外部システムへの第１システムトレース情報及び第２システムトレース情報を転送し、
　前記入力装置は前記性能閾値及び時間範囲の入力を受け付け、前記出力装置で前記性能閾値、前記時間範囲及び前記性能データを出力する
　ことを特徴とするストレージシステム。