JP2008027240A - ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム - Google Patents

ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム Download PDF

Info

Publication number
JP2008027240A
JP2008027240A JP2006199798A JP2006199798A JP2008027240A JP 2008027240 A JP2008027240 A JP 2008027240A JP 2006199798 A JP2006199798 A JP 2006199798A JP 2006199798 A JP2006199798 A JP 2006199798A JP 2008027240 A JP2008027240 A JP 2008027240A
Authority
JP
Japan
Prior art keywords
disk array
diagnosis
patrol
diagnostic
patrol diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006199798A
Other languages
English (en)
Other versions
JP4807172B2 (ja
Inventor
Tomonori Suzuki
友憲 鈴木
Hironori Tajima
宏規 田嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006199798A priority Critical patent/JP4807172B2/ja
Publication of JP2008027240A publication Critical patent/JP2008027240A/ja
Application granted granted Critical
Publication of JP4807172B2 publication Critical patent/JP4807172B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】本発明は、ディスクアレイ装置に関し、ディスクアレイ装置のパトロール診断実行に伴うユーザデータのアクセス性能低下を低減する。
【解決手段】ディスクアレイ装置2は、複数のHDD3a〜3nを備えるディスクアレイ記憶部5と、サーバ1およびディスクアレイ記憶部5に対する制御を行うディスクアレイ制御部4とがFCインタフェース6aにて接続され、HDD3a〜3nのパトロール診断を定期的に行う機能を有し、ディスクアレイ記憶部5は、保持されたパトロール診断条件に基づきパトロール診断の開始指示を発生するパトロール診断起動手段31と、開始指示を切っ掛けとして前記診断条件に基づきHDD3a〜3nそれぞれに順次に診断実行命令を発行する診断命令発行手段32と、該命令実行による診断結果応答をHDD3a〜3nから受け取る診断応答受領手段33と、受け取った該診断結果応答を判断してHDD3a〜3nの異常を検出する診断異常検出手段34とを有する。
【選択図】図1

Description

本発明は、複数のハードディスク装置を備えるディスクアレイ装置に関し、特にハードディスク装置のパトロール診断を行う技術に関する。
複数のハードディスク装置(以下、HDDと称す)を備え、一般にRAID(Redundant Arrays of Independent Disks)装置とも呼ばれるディスクアレイ装置では、サーバなどの上位装置からのデータアクセス時にHDDの異常が検出されることを避けるために、稼働中のHDDの異常を事前に早期検出することが行われており、その一般的な方法としてパトロール診断がある。
パトロール診断は例えば、HDDのデータ領域内に診断領域などを確保し、その診断領域に対して定期的にライト/リードアクセスなどを行うことにより、HDDの媒体エラーや書込み不良などの異常を早期に検出するものである。
ディスクアレイ装置の構成は一般に大きく2つに分かれており、複数のHDDを備えるデバイスエンクロージャ部(以下、DEと称す)と、サーバおよびDEに関わる制御全般を司るコントローラエンクロージャ部(以下、CEと称す)とから構成されて、パトロール診断は、サーバからの要求によりHDDに対してユーザデータのライトアクセスやリードアクセスを実行するCE内のデバイスアダプタ部(以下、DAと称す)が、DEに対してパトロール診断のための命令等を発行することにより実施されている。
従来では、CEに相当する磁気ディスク制御装置がパトロール診断の起動タイミングを生成する手段と、DEへパトロール診断命令を発行する手段と、該命令に基づくDE内のHDDへのアクセス時の異常を検出して上位装置(ソフトウェアを含む)へ報告する手段などを有して、磁気ディスク制御装置が一定時間ごとにパトロール診断を開始し、DEへパトロール診断命令(パトロールリード)を発行してHDDのパトロール診断を実施し、その実施によってHDDの異常を検出した場合には上位装置へその旨の異常報告を行うことにより、HDDの異常の早期発見を可能とするものがある(例えば、特許文献1参照)。なお、この場合の前記各手段はDAの一部に相当するものである。
また、CEとDE間のパトロール診断のための具体的な処理の一例として、先ずCE内に予め設定されたパトロール診断条件(診断種別、LBA:Logical Block Address、診断実行ブロック数、パトロールインターバル時間など)に基づき、CE内のDAがパトロール診断処理を開始する。
診断処理を開始したDAは、DE内の1つのHDDに対してパトロール診断命令を送出し、パトロール診断を実施したHDDからその診断結果の応答を受け取る。その応答がHDDに異常の無い正常応答ならば、次に他のHDDに対して同様にパトロール診断を実施させることを順次繰り返すことによって、稼働中にあるDE内全てのHDDに対してパトロール診断を実施させる。
もしも、その診断途中にてあるHDDから異常応答があった場合、DAがHDDの異常を認識してCEにエラー報告することによりCEは、認識された異常状態の内容に応じてHDDの所定の切り離しやリカバリ処理などを行う。DAは、CEにエラー報告を行なった後、次の他のHDDに移行するなどしてHDD全てに対するパトロール診断処理を続行するなどとする以上の一連の処理が、パトロール診断のために行われるCEとDE間の周知の処理の一例である。
特開平5−158628号公報
しかしながら、従来の技術は、DAは上位装置からの要求に応じてDE内のHDDに対してユーザデータのアクセスを実行しながら、HDDそれぞれに対するパトロール診断も実行、即ちパトロール診断命令を発行し、その診断応答を判断してHDDの異常を検出する処理も並行して実行していることから、パトロール診断実行時にDAに負担が掛かり、本来の機能である上位装置からの要求によるHDDへのユーザデータのアクセスが阻害され、ユーザデータに対するアクセス性能に低下が生じるという問題がある。
そこで本発明は、ディスクアレイ装置のパトロール診断実行に伴うユーザデータのアクセス性能低下を低減するディスクアレイ装置およびパトロール診断方法ならびに制御プログラムを提供することを目的とする。
第1の発明のディスクアレイ装置は、上位装置(サーバなど)からアクセスされる複数のハードディスク装置を備えるディスクアレイ記憶部と、前記上位装置および前記ディスクアレイ記憶部に対する制御を行うディスクアレイ制御部とを有して相互が内部インタフェース(例えば、Fibre Channelインタフェースまたは Serial Attached SCSIインタフェースなど)で接続される構成であって、前記ハードディスク装置の正常性の診断を定期的に行うパトロール診断の機能を有するディスクアレイ装置において、前記ディスクアレイ記憶部は、保持されたパトロール診断条件に基づいて前記パトロール診断の開始指示を発生するパトロール診断起動手段と、該開始指示を切っ掛けとして前記パトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行する診断命令発行手段と、該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取る診断応答受領手段と、受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する診断異常検出手段と、を備える構成とする。
第2の発明のディスクアレイ装置は、前記第1の発明のディスクアレイ装置において、前記ディスクアレイ制御部は、当該ディスクアレイ制御部に予め設定された前記パトロール診断条件を前記パトロール診断起動手段へ通知する診断条件通知手段を有し、前記パトロール診断起動手段は、前記診断条件通知手段から通知された前記パトロール診断条件を保持する構成とする。
前記第1の発明によれば、ディスクアレイ記憶部が、保持されたパトロール診断条件に基づいて発生する開始指示を切っ掛けとし、パトロール診断条件に基づいてハードディスク装置それぞれに順次に診断実行命令を発行し、診断実行命令の実行による診断結果応答を判断してハードディスク装置の異常を検出できることから、パトロール診断条件がディスクアレイ記憶部内に一旦保持されれば、保持されたパトロール診断条件に基づいてディスクアレイ記憶部だけでパトロール診断が実行できる。
前記第2の発明によれば、ディスクアレイ記憶部はディスクアレイ制御部から通知されるパトロール診断条件を保持できることから、ディスクアレイ記憶部で実行するパトロール診断のためのパトロール診断条件を適宜に設定変更し、その後のパトロール診断の実行に反映させることができる。
本発明によれば、ディスクアレイ記憶部内に保持されたパトロール診断条件に基づいて、ディスクアレイ制御部から独立してディスクアレイ記憶部にてHDDそれぞれのパトロール診断が実行できることから、ディスクアレイ装置のパトロール診断実行に伴うユーザデータのアクセス性能低下を低減できる。
(実施例1)
以下、本発明の実施の形態について、図面を参照しつつ説明する。図1は、本発明に係る第一の実施の形態のディスクアレイ装置を示すブロック図である。なお、図1は、ディスクアレイ装置の構成を示す図ではあるが、ディスクアレイ装置として機能するに必要な構成部分を網羅したものではなく、説明の都合上、本発明に関わる構成部分に限定したブロック図である。
図1において、サーバ1などの上位装置に接続されるディスクアレイ装置2は、複数のHDD3a〜3nを備えるディスクアレイ記憶部5(デバイスエンクロージャ部に相当)と、サーバ1およびディスクアレイ記憶部5に対する制御を行うディスクアレイ制御部4(コントローラエンクロージャ部に相当)とを有し、相互およびHDD3a〜3nそれぞれとを所定の Fibre Channel(以下、FCと称す)インタフェース6aで接続する構成である。
ディスクアレイ記憶部5は、ディスクアレイ記憶部5内の状態(内部温度、HDD使用電圧等)監視などを行う周知の SCSI Enclosure Service(以下、SESと称す)デバイス30aを有し、このSESデバイス30a内に、FCインタフェース6aを介してディスクアレイ制御部4から通知されるパトロール診断条件を保持するとともに、保持されたパトロール診断条件に基づいてパトロール診断の開始指示を発生するパトロール診断起動部31を備える。
パトロール診断起動部31に保存されるパトロール診断条件は、ディスクアレイ制御部4から通知されるものに限らず、手動入力によりディスクアレイ記憶部5内の図示しないいずれかからパトロール診断起動部31に直接設定されるもの、または出荷設定時あるいは保守設定時等での予めの固定設定によるものなどであっても構わない。
パトロール診断起動部31での開始指示の発生は、例えば、パトロール診断条件の1つである診断起動(パトロール診断条件とは独立させたその都度のパトロール診断起動指令とすることでも良い)、またはパトロール診断条件の他の1つであるパトロールインターバル時間(以下、診断周期時間と称す)に基づく周期、例えば図示しない診断周期タイマを利用しての計時監視などによるものである。
説明の便宜上、ここでは後者の方法により開始指示を発生するものとする。後者による方が、後述のデバイスアダプタ部20とディスクアレイ記憶部5との間のやり取りが少ないことからデバイスアダプタ部20の負荷が軽くなり、ユーザデータのアクセス性能低下の改善に繋がることは言うまでもない。
なお、パトロール診断起動部31がパトロール診断条件を保持する機能は、物理的にパトロール診断起動部31内に存在する必要はなく、例えばディスクアレイ記憶部5内に備えるいずれかの情報格納手段(HDDや図示しない不揮発性RAMなど)内に存在していても良い。その場合、パトロール診断起動部31は、情報格納手段に保持されたパトロール診断条件をコマンドなどによるアクセスにて間接的に受け取ることで構わない。
SESデバイス30aは更に、パトロール診断起動部31が発生した開始指示を切っ掛けとし、パトロール診断起動部31に保持されたパトロール診断条件に基づいてFCインタフェース6aを介してHDD3a〜3nそれぞれに順次に所定の診断実行命令を発行する診断命令発行部32を備える。
またSESデバイス30aは、診断命令発行部32が発行した診断実行命令の実行による診断結果を伴う所定の診断結果応答をFCインタフェース6aを介してHDD3a〜3nから受け取る診断応答受領部33と、診断応答受領部33が受け取った診断結果応答に伴う診断結果を判断してHDD3a〜3nの診断異常を検出するとともに、検出した診断異常をFCインタフェース6aを介してディスクアレイ制御部4へ報告する診断異常検出部34とを備える。
上記したパトロール診断起動部31、診断命令発行部32、診断応答受領部33および診断異常検出部34の各部は、必ずしもSESデバイス30a内に備える必要はなく、都合に応じてディスクアレイ記憶部5内のいずれかに備えても良い。
一方、ディスクアレイ制御部4は、ディスクアレイ記憶部5に対してアクセスを実行するデバイスアダプタ部20と、サーバ1およびデバイスアダプタ部20などに対する制御を行う処理制御部10とから構成され、このデバイスアダプタ部20内に、処理制御部10とのやり取りに基づきデバイスアダプタ部20全体の管理や制御を行うデバイスアダプタ制御部21を備える。
デバイスアダプタ部20は更に、デバイスアダプタ制御部21からの指令などによって、ディスクアレイ制御部4内に予め設定されたパトロール診断条件をFCインタフェース6aを介してパトロール診断起動部31へ通知する診断条件通知部22と、FCインタフェース6aを介して診断異常検出部34から報告される診断異常を受領してデバイスアダプタ制御部21へ通知する診断異常受領部23とを備える。
なお、ディスクアレイ記憶部5内のパトロール診断起動部31にてパトロール診断の開始指示発生の基とされる前述した一例のパトロール診断起動指令またはパトロール診断条件内の診断起動は、ディスクアレイ制御部4内のいずれかに図示しない診断起動タイマを設けることにより発生される周期的な計時トリガに基づき生成して、診断条件通知部22から発行させれば良い。勿論、ディスクアレイ制御部4内の診断起動タイマなどによらず、サーバ1からのパトロール診断起動などのコマンドにより生成しても良いことは言うまでもない。
ディスクアレイ制御部4内に設定されるパトロール診断条件は、処理制御部10またはデバイスアダプタ部20のいずれに保存されても良く、更に、パトロール診断条件として保存される設定は、手動入力による設定またはサーバ1からのコマンド設定などのいずれの設定によっても構わない。
FCインタフェース6aを通じてのデバイスアダプタ部20とSESデバイス30aとの間、およびSESデバイス30aとHDD3a〜3nとの間の通信情報(コマンド、データなど)のやり取りは、FCインタフェース6aに則した所定のコマンド形態や手順に基づき定義して行うようにすれば良い。特に、SESデバイス30a(ここでは診断命令発行部32)がHDD3a〜3nへ発行する診断実行命令は、従来のデバイスアダプタ部20がHDD3a〜3nへ発行していたパトロール診断命令に同様であれば良い。
また、FCインタフェース6aを通じてのデバイスアダプタ部20とHDD3a〜3nとの間の通信情報のやり取り、特にサーバ1からの要求に基づくHDD3a〜3nへのデータアクセス(ユーザデータのライトアクセスやリードアクセスなど)とそれに対する応答などのやり取りについては、従来のデバイスアダプタ部20がHDD3a〜3nへ発行していた所定のコマンドとその応答などによる手順に同一で構わない。
パトロール診断が実施されるHDD3a〜3n上の診断領域は、説明の便宜上、ここではユーザデータ領域から領域分離されたパトロール診断領域とし、パトロール診断条件の1つであるLBA(論理ブロックアドレス)の設定時に考慮される。このような分離形態では、デバイスアダプタ部20からのユーザデータのためのアクセスとSESデバイス30aからのパトロール診断のためのアクセスとが同一領域をアクセスすることが無いため、パトロール診断実行のためのユーザデータの退避や復帰動作などを行う必要が無く、ユーザデータの整合性を維持させることが容易である。
なお、上述したパトロール診断に関するディスクアレイ制御部4とディスクアレイ記憶部5との通信情報のやり取りは、それぞれに有するデバイスアダプタ部20とSESデバイス30aとがFCインタフェース6aを介して行うものとして説明しているが、他の方法として例えば、ディスクアレイ制御部4とディスクアレイ記憶部5との間に一般に設けられている周知のサイドバンドインタフェース(例えば Ethernet(登録商標)など)を介して行うことでも構わない。
その場合、ディスクアレイ制御部4内の処理制御部10と、ディスクアレイ記憶部5内のディスクアレイ記憶部5全体の制御を司る図示しない記憶処理制御部とが、相互に例えば Ethernet(登録商標)で接続され、双方のやり取りについては Ethernet(登録商標)に則した所定のコマンド形態や手順に基づくものとする。
次に、本発明の第一の実施の形態の動作について、図面を参照しつつ説明する。図2は、本発明のディスクアレイ装置の動作を説明するフローチャートである。
図2において、ディスクアレイ制御部4では、ディスクアレイ装置2の電源投入時や再起動時に、デバイスアダプタ制御部21からの指令により診断条件通知部22は、ディスクアレイ制御部4内に予め設定されたパトロール診断条件をFCインタフェース6aを介してSESデバイス30a内のパトロール診断起動部31へ通知する(S11)。
ディスクアレイ記憶部5のSESデバイス30aでは、パトロール診断起動部31は通知されたパトロール診断条件を保持し(S21)、保持されたパトロール診断条件の診断周期時間に基づきタイマ起動された診断周期タイマの計時が診断周期時間に到達(例えば、タイマ割込み発生)することを監視する(S22)。この監視により診断周期時間への到達が確認(Yes判定)されたならば、パトロール診断起動部31はパトロール診断のための開始指示を発生する(S23)。
診断命令発行部32は、この開始指示を切っ掛けとし、パトロール診断起動部31で保持されたパトロール診断条件に基づきFCインタフェース6aを介してHDD3a〜3nのいずれか1つのHDDに対して所定の診断実行命令を発行する(S24)。ここでの1つのHDDが初回の診断対象であり、LBAやHDD搭載位置などによって自由に設定して構わない。いずれにしても、診断対象のHDDが順次に選択されてHDD3a〜3n全てのパトロール診断が実施できれば良い。説明の便宜上、ここではHDD3a、HDD3b、・・・HDD3nの順とする。
HDD3a〜3nでは、診断対象であるHDD3aが、SESデバイス30aから発行された診断実行命令を受け取り(S31)、その診断実行命令に基づいてHDD3a内の診断領域を対象に所定のパトロール診断を実行し(S32)、その診断結果を所定の診断結果応答としてFCインタフェース6aを介してSESデバイス30aへ報告する(S33)。
なお、HDD3a〜3nにて実行される所定のパトロール診断とは、例えば、LBAで指定の診断領域に対して診断用データを書き込み、その後にその診断用データを読み出すライト/リード診断を実施し、そのライト/リード診断での結果から媒体エラーや書込み不良などを検出するものである。
ディスクアレイ記憶部5のSESデバイス30aでは、HDD3aからの診断結果応答を診断応答受領部33が受け取り(S25)、受け取った診断結果応答の診断結果が正常か否かを診断異常検出部34が判断する(S26)。
前記ステップS26にて診断結果が異常と判定(No判定)された場合、診断異常検出部34はHDD3aでのパトロール診断にて診断異常が有ったものと認識し、その診断異常をFCインタフェース6aを介してディスクアレイ制御部4へ報告するとともに、後述のステップS28へ処理を移行する(S27)。
ディスクアレイ制御部4では、HDD3aから報告された診断異常を診断異常受領部23が受け取り、デバイスアダプタ制御部21へ通知する(S12)。診断異常が通知されたデバイスアダプタ制御部21および処理制御部10では、パトロール診断異常が発生した際の所定のエラー処理を実行する(S13)。エラー処理としては例えば、認識された診断異常の内容に応じて該当するHDDの所定の切り離しやリカバリ処理などを行う。また、必要に応じて、サーバ1へのエラー報告などを行う。
一方、前記ステップS26にて診断結果が正常と判定(Yes判定)された場合は次に、診断命令発行部32にてHDD3a〜3n全てのパトロール診断が終了したか否かを判定する(S28)。この判定にてHDD3a〜3n全てが終了していないと判定(No判定)された場合には前記ステップS24へ戻り、パトロール診断が未終了のHDDのいずれか1つのHDD(ここではHDD3b)に対し、上述した前記ステップS24以降前記ステップS28までの一連の処理を繰り返す。
この一連の処理を実行した後の前記ステップS28での再度の判定によって、HDD3a〜3n全てのパトロール診断が終了したと判定(Yes判定)された場合、前記ステップS23により発生された開始指示に対する一連のパトロール診断が終了したものとして、HDD3a〜3nに対するパトロール診断処理(1回目)を終了する。
しかしながら、図2中の記号Aでの処理接続にて示すように、前記ステップS22の常時の監視によって、診断周期タイマの診断周期時間への新たな到達が確認(Yes判定)された場合、パトロール診断起動部31は再度(2回目以降)のパトロール診断のための開始指示を発生し(S23)、上述した前記ステップS24以降前記ステップS28までの一連の処理を再度実行することを繰り返すこととなる。
なお、パトロール診断を無効化させる情報、あるいは診断周期タイマを停止させる情報などをパトロール診断条件に付加してHDD3a〜3nへ通知させれば、無効化またはタイマ停止の通知以降は、パトロール診断の上述した一連の処理を前記ステップS28の終了判定(Yes判定)により停止させることができることは言うまでもない。
以上、図2のフローチャートを参照しながら動作を説明したが、図示したフローチャートは一例であって、本発明はそれらに限定されるものではない。例えば、図2中のステップの順序を入れ替えたとしても同様の処理結果が得られる場合、都合に合わせて入れ替えることは構わない。
次に、本発明の他の実施の形態について、図面を参照しつつ説明する。図3は、本発明に係る第二の実施の形態のディスクアレイ装置を示すブロック図である。なお、図3も図1に図示した内容と同様、説明の都合上、本発明に関わる構成部分に限定したブロック図である。
図3において、サーバ1などの上位装置に接続されるディスクアレイ装置2は、複数のHDD3a〜3nを備えるディスクアレイ記憶部5と、サーバ1およびディスクアレイ記憶部5に対する制御を行うディスクアレイ制御部4とを有し、相互を所定の Serial Attached SCSI(以下、SASと称す)インタフェース6bで接続する構成である。
ディスクアレイ記憶部5には、SASインタフェース6b接続のディスクアレイ制御部4とSASインタフェース6ba〜6bn接続のHDD3a〜3nとの間に位置して双方に接続され、ディスクアレイ制御部4に対するHDD3a〜3nの接続拡張性を持たせる周知のエクスパンダデバイス(以下、エクスパンダと称す)30bを有する。
エクスパンダ30bには、図1の説明で前述したパトロール診断起動部31、診断命令発行部32、診断応答受領部33および診断異常検出部34を備える。エクスパンダ30bには更に、ディスクアレイ制御部4側のSASインタフェース6b接続部に周知の物理ポート(通称記号phy)35と、HDD3a〜3n側のSASインタフェース6ba〜6bn接続部に同様の物理ポート36a〜36nとを有する。なお、SASインタフェース6bとSASインタフェース6ba〜6bnは共に、所定のSASインタフェースである。
一方、ディスクアレイ制御部4は、図1の説明で前述したデバイスアダプタ部20と処理制御部10とから構成され、同様にデバイスアダプタ部20は、デバイスアダプタ制御部21、診断条件通知部22および診断異常受領部23を備える。
図3は、図1中に示すFCインタフェース6aに代わってSASインタフェース6b、6ba〜6bnに、更にSESデバイス30aに代わってエクスパンダ30bとなることを除いて基本的に図1に同じである。そのため、図3中の上記各部についての説明は、前述した図1中の各部についての説明にて、FCインタフェース6aをSASインタフェース6b、6ba〜6bnに、更にSESデバイス30aをエクスパンダ30bにそれぞれ置き替えれば良いことから、ここでの説明は省略する。但し、SASインタフェース6b、6ba〜6bn関わる固有の説明について、以下に説明する。
SASインタフェース6bでは、ディスクアレイ制御部4とエクスパンダ30bとのやり取りを行うためのプロトコルとして、周知の Serial Management Protocol(以下、SMPと称す)がサポートされている。ディスクアレイ制御部4はこのSMPを使用して、SASインタフェース6b、6ba〜6bn上に接続されているデバイスのSASアドレスやphy-IDなどの情報の取得や、エクスパンダ30bへのオペレーション指示などを行なう。
エクスパンダ30bは、サーバ1からの要求に基づくディスクアレイ制御部4からのあるHDD(例えばHDD3aとする)へのデータアクセス要求があった場合、該当するHDD(HDD3a)が接続されている物理ポート(物理ポート36a)を選択し、その物理ポート(物理ポート36a)に対してアクセスのためのデータ等の送出を行う。
その逆方向も同様に、あるHDD(HDD3a)からディスクアレイ制御部4への報告要求があった場合、ディスクアレイ制御部4が接続されている物理ポート(物理ポート35)に対して報告のためのデータ等の送出を行う。
ディスクアレイ制御部4(ここではデバイスアダプタ部20)とエクスパンダ30bとの間はSMPにより、上述したデータアクセスに関する本来のやり取りだけでなく、パトロール診断に関する指令や応答通知などのやり取りも行われることから、SMPは、ディスクアレイ制御部4からエクスパンダ30bへ発行されるパトロール診断条件設定およびパトロール診断起動などのためのSMPに則した指令を有し、またエクスパンダ30bからディスクアレイ制御部4へ発行される診断異常報告などのためのSMPに則した応答通知を有する。
また、エクスパンダ30bは、SMPのターゲットデバイスとして設定されるだけでなく、エクスパンダ30b主導にてディスクアレイ制御部4へアクセスすることも可能にさせるため、エクスパンダ30b内のSMPに関する周知のデバイス対応設定をイニシエータデバイスおよびターゲットデバイスのいずれも可能な設定とする。
本発明の第二の実施の形態の動作についての説明も同様であり、前述した図2のフローチャートを参照しながらの説明にて、FCインタフェース6aをSASインタフェース6b、6ba〜6bnに、更にSESデバイス30aをエクスパンダ30bにそれぞれ置き替えれば良いことから、動作についての説明はここでは省略する。
本発明に係る第一の実施の形態のディスクアレイ装置を示すブロック図 本発明のディスクアレイ装置の動作を説明するフローチャート 本発明に係る第二の実施の形態のディスクアレイ装置を示すブロック図
符号の説明
1 サーバ
2 ディスクアレイ装置
3a〜3n HDD
4 ディスクアレイ制御部
5 ディスクアレイ記憶部
6a FCインタフェース
6b,6ba〜6bn SASインタフェース
10 処理制御部
20 デバイスアダプタ部
21 デバイスアダプタ制御部
22 診断条件通知部
23 診断異常受領部
30a SESデバイス
30b エクスパンダ
31 パトロール診断起動部
32 診断命令発行部
33 診断応答受領部
34 診断異常検出部
35,36a〜36n 物理ポート

Claims (5)

  1. 上位装置からアクセスされる複数のハードディスク装置を備えるディスクアレイ記憶部と、前記上位装置および前記ディスクアレイ記憶部に対する制御を行うディスクアレイ制御部とを有して相互が内部インタフェースで接続される構成であって、前記ハードディスク装置の正常性の診断を定期的に行うパトロール診断の機能を有するディスクアレイ装置において、
    前記ディスクアレイ記憶部は、
    保持されたパトロール診断条件に基づいて前記パトロール診断の開始指示を発生するパトロール診断起動手段と、
    該開始指示を切っ掛けとして前記パトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行する診断命令発行手段と、
    該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取る診断応答受領手段と、
    受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する診断異常検出手段と、
    を有することを特徴とするディスクアレイ装置。
  2. 前記ディスクアレイ制御部は、
    当該ディスクアレイ制御部に予め設定された前記パトロール診断条件を前記パトロール診断起動手段へ通知する診断条件通知手段を有し、
    前記パトロール診断起動手段は、
    前記診断条件通知手段から通知された前記パトロール診断条件を保持する
    ことを特徴とする請求項1記載のディスクアレイ装置。
  3. 前記内部インタフェースは、
    所定の Fibre Channelインタフェースまたは Serial Attached SCSIインタフェースであって、
    前記診断条件通知手段は、
    前記パトロール診断起動手段への前記パトロール診断条件の通知には該インタフェースに則した所定の通信手順を用いる
    ことを特徴とする請求項2記載のディスクアレイ装置。
  4. 上位装置からアクセスされる複数のハードディスク装置を備えるディスクアレイ記憶部と、前記上位装置および前記ディスクアレイ記憶部に対する制御を行うディスクアレイ制御部とを有して相互が内部インタフェースで接続される構成であって、前記ハードディスク装置の正常性の診断を定期的に行うパトロール診断の機能を有するディスクアレイ装置のパトロール診断方法であって、
    前記ディスクアレイ記憶部は、
    パトロール診断起動手段が、 保持されたパトロール診断条件に基づいて前記パトロール診断の開始指示を発生するステップと、
    診断命令発行手段が、
    該開始指示を切っ掛けとして前記パトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行するステップと、
    診断応答受領手段が、
    該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取るステップと、
    診断異常検出手段が、
    受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出するステップと、
    を含むことを特徴とするパトロール診断方法。
  5. 上位装置からアクセスされる複数のハードディスク装置を備えるディスクアレイ記憶部と、前記上位装置および前記ディスクアレイ記憶部に対する制御を行うディスクアレイ制御部とを有して相互が内部インタフェースで接続される構成であって、前記ハードディスク装置の正常性の診断を定期的に行うパトロール診断の機能を有するディスクアレイ装置において、
    前記ディスクアレイ記憶部のコンピュータに、
    保持されたパトロール診断条件に基づいて前記パトロール診断の開始指示を発生するパトロール診断起動機能と、
    該開始指示を切っ掛けとして前記パトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行する診断命令発行機能と、
    該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取る診断応答受領機能と、
    受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する診断異常検出機能と、
    を実現させるためのパトロール診断制御プログラム。
JP2006199798A 2006-07-21 2006-07-21 ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム Expired - Fee Related JP4807172B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006199798A JP4807172B2 (ja) 2006-07-21 2006-07-21 ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006199798A JP4807172B2 (ja) 2006-07-21 2006-07-21 ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム

Publications (2)

Publication Number Publication Date
JP2008027240A true JP2008027240A (ja) 2008-02-07
JP4807172B2 JP4807172B2 (ja) 2011-11-02

Family

ID=39117806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006199798A Expired - Fee Related JP4807172B2 (ja) 2006-07-21 2006-07-21 ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム

Country Status (1)

Country Link
JP (1) JP4807172B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049779A (ja) * 2008-08-25 2010-03-04 Teac Corp 記録再生装置
JP2012504808A (ja) * 2008-10-02 2012-02-23 インターナショナル・ビジネス・マシーンズ・コーポレーション 1つまたは複数の交換ユニットのテストを管理するために1つまたは複数の交換可能ユニットを含むコンピュータ化ストレージ・システムで使用するための方法、装置、およびプログラム(交換ユニットのテストを管理するために交換可能ユニットを含むコンピュータ化ストレージ・システム)
US8788752B2 (en) 2010-02-08 2014-07-22 Fujitsu Limited Storage apparatus, patrolling method and storage system
US9160498B2 (en) 2012-09-19 2015-10-13 Fujitsu Limited Transmission unit and diagnosis method
JP2016200995A (ja) * 2015-04-10 2016-12-01 東芝テック株式会社 制御回路及び電子機器
JP2016212511A (ja) * 2015-04-30 2016-12-15 富士通株式会社 ストレージ制御装置、ストレージ制御方法、及びプログラム
WO2022007415A1 (zh) * 2020-07-09 2022-01-13 苏州浪潮智能科技有限公司 一种硬盘状态检测装置及方法
JP7512136B2 (ja) 2020-09-10 2024-07-08 キオクシア株式会社 メモリシステム及び情報処理システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0574039A (ja) * 1991-09-13 1993-03-26 Nec Corp 磁気デイスク装置のパトロールシーク起動制御方法
JPH05158628A (ja) * 1991-12-05 1993-06-25 Nec Ibaraki Ltd 磁気ディスク制御装置
JPH05325395A (ja) * 1992-03-05 1993-12-10 Nec Corp 磁気ディスク装置のパトロールシーク起動制御方法および磁気ディスク装置
JPH06162689A (ja) * 1992-11-18 1994-06-10 Nec Ibaraki Ltd 磁気ディスク制御装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0574039A (ja) * 1991-09-13 1993-03-26 Nec Corp 磁気デイスク装置のパトロールシーク起動制御方法
JPH05158628A (ja) * 1991-12-05 1993-06-25 Nec Ibaraki Ltd 磁気ディスク制御装置
JPH05325395A (ja) * 1992-03-05 1993-12-10 Nec Corp 磁気ディスク装置のパトロールシーク起動制御方法および磁気ディスク装置
JPH06162689A (ja) * 1992-11-18 1994-06-10 Nec Ibaraki Ltd 磁気ディスク制御装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049779A (ja) * 2008-08-25 2010-03-04 Teac Corp 記録再生装置
US8156258B2 (en) 2008-08-25 2012-04-10 Teac Corporation Recording and replaying device
JP2012504808A (ja) * 2008-10-02 2012-02-23 インターナショナル・ビジネス・マシーンズ・コーポレーション 1つまたは複数の交換ユニットのテストを管理するために1つまたは複数の交換可能ユニットを含むコンピュータ化ストレージ・システムで使用するための方法、装置、およびプログラム(交換ユニットのテストを管理するために交換可能ユニットを含むコンピュータ化ストレージ・システム)
US8639466B2 (en) 2008-10-02 2014-01-28 International Business Machines Corporation Computerised storage system comprising one or more replaceable units for managing testing of one or more replacement units
US9286151B2 (en) 2008-10-02 2016-03-15 International Business Machines Corporation Computerised storage system comprising replaceable units for managing testing of replacement units
US9298527B2 (en) 2008-10-02 2016-03-29 International Business Machines Corporation Computerized storage system comprising replaceable units for managing testing of replacement units
US8788752B2 (en) 2010-02-08 2014-07-22 Fujitsu Limited Storage apparatus, patrolling method and storage system
US9160498B2 (en) 2012-09-19 2015-10-13 Fujitsu Limited Transmission unit and diagnosis method
JP2016200995A (ja) * 2015-04-10 2016-12-01 東芝テック株式会社 制御回路及び電子機器
JP2016212511A (ja) * 2015-04-30 2016-12-15 富士通株式会社 ストレージ制御装置、ストレージ制御方法、及びプログラム
WO2022007415A1 (zh) * 2020-07-09 2022-01-13 苏州浪潮智能科技有限公司 一种硬盘状态检测装置及方法
JP7512136B2 (ja) 2020-09-10 2024-07-08 キオクシア株式会社 メモリシステム及び情報処理システム

Also Published As

Publication number Publication date
JP4807172B2 (ja) 2011-11-02

Similar Documents

Publication Publication Date Title
JP4807172B2 (ja) ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム
US7953909B2 (en) Storage system comprising power saving function
US8824261B1 (en) Peer to peer vibration mitigation
US8219748B2 (en) Storage system comprising both power saving and diagnostic functions
EP1788482B1 (en) Storage control device, and error information management method for storage control device
US7836268B2 (en) Method, apparatus, and system for controlling data storage
TW201324130A (zh) 複數個磁碟陣列系統之資料儲存方法及資料儲存系統
US6754853B1 (en) Testing components of a computerized storage network system having a storage unit with multiple controllers
JP2007128437A (ja) ディスクアレイ装置及びその経路障害検出方法
US8095820B2 (en) Storage system and control methods for the same
US10198307B2 (en) Techniques for dynamic selection of solutions to storage cluster system trouble events
US8099634B2 (en) Autonomic component service state management for a multiple function component
JP2015114873A (ja) 情報処理装置および監視方法
US10031822B2 (en) Techniques for estimating ability of nodes to support high availability functionality in a storage cluster system
JP5488709B2 (ja) ストレージ制御装置における基準時間設定方法
JP2006313410A (ja) ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア
JP4775843B2 (ja) ストレージシステム及び記憶制御方法
JP6996602B1 (ja) Bmc、サーバシステム、装置安定度判定方法及びプログラム
JP5849491B2 (ja) ディスク制御装置、ディスク装置異常検出方法、及びプログラム
JP2011076344A (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
JP5823755B2 (ja) 記憶装置、およびプログラム
US7962781B2 (en) Control method for information storage apparatus, information storage apparatus and computer readable information recording medium
CN118277154A (zh) 一种硬盘的故障恢复方法及计算设备
JP2011215664A (ja) ハードディスク装置の障害予兆診断方式
JP2011129039A (ja) Raidシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110719

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110801

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140826

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4807172

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees