JP2007018034A - 制御装置及び制御方法 - Google Patents

制御装置及び制御方法 Download PDF

Info

Publication number
JP2007018034A
JP2007018034A JP2005195775A JP2005195775A JP2007018034A JP 2007018034 A JP2007018034 A JP 2007018034A JP 2005195775 A JP2005195775 A JP 2005195775A JP 2005195775 A JP2005195775 A JP 2005195775A JP 2007018034 A JP2007018034 A JP 2007018034A
Authority
JP
Japan
Prior art keywords
data processing
controller
processing unit
control
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005195775A
Other languages
English (en)
Inventor
Kenichi Ozaki
賢一 尾▲崎▼
Taro Takahashi
太郎 高橋
Shiyoumei Kyo
小明 姜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005195775A priority Critical patent/JP2007018034A/ja
Priority to US11/215,034 priority patent/US7373208B2/en
Publication of JP2007018034A publication Critical patent/JP2007018034A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B9/00Safety arrangements
    • G05B9/02Safety arrangements electric
    • G05B9/03Safety arrangements electric with multiple-channel loop, i.e. redundant control systems

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】
複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する場合における制御対象の動作異常に対する修理作業を容易化し得る制御装置及び方法を提案する。
【解決手段】
各コントローラに、トランジスタと、所定のデータ処理を実行し、当該データ処理結果に応じてトランジスタをオン・オフさせるデータ処理部と、トランジスタの出力端に接続されたプルアップ抵抗と、トランジスタの出力端に接続されたレベル分離抵抗とを設け、各コントローラのデータ処理部が、トランジスタの出力端から出力される制御信号の信号レベルを検出し、当該検出結果に基づいて自コントローラの故障の有無を判定するようにした。
【選択図】 図4

Description

本発明は、制御装置及び方法に関し、例えば2重化されたコントローラからそれぞれ出力される制御信号の論理和によって冷却ファンの回転制御を行うようになされたディスクアレイ装置に適用して好適なものである。
従来、ディスクアレイ装置においては、筐体内部を冷却するための冷却ファンが複数設けられており、これら冷却ファンを状況に応じて低速回転駆動又は高速回転駆動することによって、筐体内部に配設されたハードディスクドライブや各種回路基板等において発生する熱を効率良く外部に排出し得るようになされている。
この場合における冷却ファンの回転制御は、2重化されたコントローラの各出力ラインを配線量低減のためにワイヤードオア接続し、各コントローラからそれぞれ出力される制御信号としての回転指示信号(例えば高速回転指示のときにはハイレベル、低速回転指示のときにはローレベル)の論理和を1本の信号線を通じて冷却ファンに与えることにより行っている。
この際、冷却ファンの回転状態(回転数)は、当該冷却ファンに設けられた回転センサにより検出されて各コントローラにフィードバックされる。従って、各コントローラは、この回転センサのセンサ出力に基づいて、例えばコントローラが高速回転を指示しているにも係わらず、冷却ファンが動作停止又は低速回転しているなどの冷却ファンの回転異常を検出することができる。
なお、下記特許文献1には、ワイヤーオアにマルチドロップ接続された複数のスレーブ側装置に、基底帯域の送信データを時分割送信データに処理して出力する送信回路と、時分割送信データを監視して異常のときに出力断制御信号を出力する監視回路と、監視回路から出力断制御信号が供給されたときに送信回路から入力される時分割送信データの送出を物理的に断にする出力断回路とをそれぞれ設けることで、ワイヤーオアにマルチドロップ接続された複数のスレーブ側装置の故障を互いのスレーブ側装置に与える影響を最小限にして特定する方式が開示されている。
特開平8−195760号公報
しかしながら、かかる従来のディスクアレイ装置における故障検出方式によると、上述のように2つのコントローラから出力される回転指示信号の論理和を1本の信号線を通じて冷却ファンに与える構成となっているために、例えばコントローラが回転センサの出力に基づき冷却ファンの回転異常を検出できたとしても、自コントローラ、他方のコントローラ及び冷却ファンのいずれが故障しているのかを特定することができない問題があった。
このため従来のディスクアレイ装置では、冷却ファンに回転異常が発生した場合、修理作業を行う作業者はこれら2つのコントローラ及び冷却ファンのそれぞれについて検査を行わなければならず、修理作業が煩雑となる問題があった。
かかる問題を解決するための手法として、上記特開平8−195760号公報に開示された故障監視方式の機能をディスクアレイ装置の各コントローラに搭載することも考えられるものの、この方法によると、どちらのコントローラに故障が発生したかを検出することはできても、その故障が具体的にどの部位に発生したかの具体的な故障部位の特定が困難であり、また冷却ファン自体の異常時には対応できない問題があった。従って、このディスクアレイ装置の上記コントローラに特開平8−195760号公報に開示された故障監視方式を適用したとしても、依然として冷却ファンの回転異常に対する修理作業が煩雑な問題があった。
本発明は以上の点を考慮してなされたもので、かかる修理作業を容易化し得る制御装置及び方法を提案しようとするものである。
かかる課題を解決するため本発明においては、複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する制御装置において、各前記コントローラは、出力段に設けられたトランジスタと、所定のデータ処理を実行し、当該データ処理結果に応じて前記トランジスタをオン・オフさせるデータ処理部と、前記トランジスタの出力端に接続されたプルアップ抵抗と、前記トランジスタの前記出力端に接続されたレベル分離抵抗と、前記トランジスタの前記出力端から出力される前記制御信号の信号レベルを検出する信号レベル検出部とを備え、各前記データ処理部は、前記信号レベル検出部の検出結果に基づいて自コントローラの故障の有無を判定することを特徴とする。
また本発明においては、複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する制御方法において、各前記コントローラは、出力段に設けられたトランジスタと、所定のデータ処理を実行し、当該データ処理結果に応じて前記トランジスタをオン・オフさせるデータ処理部と、前記トランジスタの出力端に接続されたプルアップ抵抗と、前記トランジスタの前記出力端に接続されたレベル分離抵抗とを有し、各前記コントローラの前記データ処理部が、前記トランジスタの前記出力端から出力される前記制御信号の信号レベルを検出する第1のステップと、当該検出結果に基づいて自コントローラの故障の有無を判定する第2のステップとを備えることを特徴とする。
本発明によれば、制御対象に動作異常が発生したときに、どのコントローラが故障したかの切り分けが可能となり、故障したコントローラを容易に特定することができる。よって、かかる故障の修理作業を従来に比べて格段的に容易化することができる。
以下図面について、本発明の一実施の形態を詳述する。
(1)本実施の形態によるディスクアレイ装置の外観構成
図1(A)及び(B)は、本実施の形態によるディスクアレイ装置1を示す。このディスクアレイ装置1は、ラックフレーム2をベースとして構成される。ラックフレーム2の内側には、上下方向に複数段にわたってマウントフレーム3が形成されており、このマウントフレーム3に沿って基本筐体4及び増設筐体5が引き出し式に装着される。なお、このディスクアレイ装置1の場合には、下段に1つの基本筐体4が装着され、上段に複数の増設筐体5が装着されている。
基本筐体4の正面上段側には、図1(A)からも明らかなように、それぞれハードディスクドライブ6A(図2)が収納された複数のディスクドライブユニット6が交換自在に並べて装着されている。ハードディスクドライブ6Aとしては、例えばSCSI(Small Computer System Interface)規格に準拠したディスクドライブのほか、ATA(AT Attachment)規格やSATA(Serial AT Attachment)規格などに準拠したディスクドライブなどが用いられる。
また基本筐体4の正面下段には、バッテリユニット7、表示パネル8、フレキシブルディスクドライブ9が装着されている。バッテリユニット7は、二次電池を内蔵しており、停電などによりAC/DC電源からの電力供給が途絶えた場合に、ディスクドライブユニット6や後述のコントローラボード14等に電力を供給するバックアップ電源として機能する。表示パネル8には、各ディスクドライブユニット6内のハードディスクドライブ6Aの稼動状態等を表示するための表示デバイスが設けられている。フレキシブルディスクドライブ9は、フレキシブルディスクに記録されたメンテナンス用プログラムをロードする場合などに用いられる。
基本筐体4の背面上段には、図1(B)に示すように、電源コントローラボード10が左右両側に1枚ずつ装着されている。電源コントローラボード10には、ファイバチャネルケーブル用のコネクタ(図示せず)が設けられており、このコネクタ及び隣接する増設筐体5の対応するコネクタ間がファイバチャネルケーブル11を介して通信可能な状態に接続されている。これと同様に、隣接する増幅筐体5同士はファイバチャネルケーブル11を介して通信可能な状態に接続されており、かくしてこれらファイバチャネルケーブル11によって後述のループ状の通信経路が形成され、この通信経路を通じて電源コントローラボード10が基本筐体4内及び増設筐体5内の各ディスクドライブユニット6内のハードディスクドライブ6AとFC−ALの方式(トポロジー)で通信を行うことができるようになされている。
また基本筐体4の背面上段における2枚の電源コントローラボード10に挟まれた空間には、AC/DC電源12が2台並べて装着されている。これらAC/DC電源12は、電源コントローラボード10と図示しないバックボードを介して電気的に接続されており、この電源コントローラボード10を介して各ディスクドライブユニット6内のハードディスクドライブ6Aや、各種ボード及び各種ユニットなどに電力を供給できるようになされている。
さらに各AC/DC電源12の背面側にはそれぞれ冷却ファン13が配設されており、この冷却ファン13を駆動することによって基本筐体4内に空気を流入させると共に基本筐体4内の空気を排出させることができる。これによりディスクアレイ装置1では、各ハードディスクドライブや各AC/DC電源12などから発生する熱を基本筐体4の外部に排出することができるようになされている。
さらに基本筐体4の背面下段側には、冗長性をもたせて2枚のコントローラボード14が装着されている。これらコントローラボード14には、基本筐体4内及び増設筐体5にそれぞれ装着された各ディスクドライブユニット6内のハードディスクドライブ6Aとの間の通信インタフェースと、これらハードディスクドライブ6Aの動作制御(例えばRAID方式による制御)やこれらハードディスクドライブ6Aの状態監視を行う回路となどが実装されている。
またコントローラボード14には、冷却ファン13による冷却能力の制御や、表示パネル8に設けられた表示デバイスの制御などを行う回路なども実装されている。なお、これらの回路を電源コントローラボード10に設けるようにしても良い。
コントローラボード14には、上位装置と接続するためのSAN(Storage Area Network)やLAN(Local Area Network)などの所定のインタフェース規格に準拠した外部コネクタ15が設けられている。これによりこのディスクアレイ装置1は、この外部コネクタ15に通信ケーブル16を繋ぐことで、当該通信ケーブル16を介して上位装置と通信を行うことができるようになされている。
一方、増設筐体5の正面側には、図1(A)に示すように、それぞれハードディスクドライブが収納された複数のディスクドライブユニット6が並べて配置されている。また増設筐体5の背面側には、図1(B)に示すように、電源コントローラボード10が左右両側に1枚ずつ装着されており、これら2枚の電源コントローラボード10に挟まれた空間内にAC/DC電源12が2台並べて収納されている。
さらにAC/DC電源12の背面側にはそれぞれ冷却ファン13が配設されており、この冷却ファン13を駆動することによって増設筐体5内に空気を流入させると共に増設筐体5内部の空気を排出させることができる。これによりこのディスクアレイ装置1では、増設筐体5内に装填された各ディスクドライブユニット6内のハードディスクドライブ6A(図2)や各AC/DC電源12などから発生する熱を増設筐体5の外部に排出することができる。
(2)ディスクアレイ装置1の内部構成
図2は、かかるディスクアレイ装置1の内部構成を示すものである。このディスクアレイ装置1の場合、基本筐体4側には、2重化のため上述した2台のコントローラボード14にそれぞれ同じ構成の2つのメインコントロール部20が形成されている。
各メインコントロール部20は、それぞれ個別にこのディスクアレイ装置1全体の動作制御を司る機能を有しており、それぞれ第1のインタフェース部21、キャッシュメモリ22、データコントローラ23、MPU(Micro Processing Unit)24、第2のインタフェース部25及び路線切替え部26を備えて構成される。
このうち第1のインタフェース部21は、上位装置との間で通信を行う際の通信インタフェースとして機能するもので、上位装置からファイバーチャネルプロトコルに従って送信されてくるデータや各種コマンドのフォーマットを、メインコントロール部20内で取り扱うPCIPeripheral Component Interconnect)規格に準拠したフォーマットに変換する一方、PCIフォーマットのデータや各種コマンド等をファイバーチャネルフォーマットに準拠したフォーマットに変換してファイバーチャネルプロトコルで上位装置に送信する。
キャッシュメモリ22は、例えば揮発性メモリから構成され、基本筐体4や増設筐体5に装填された各ディスクドライブユニット6内のハードディスクドライブ6Aに読み書きするデータを一時的に保持するために用いられる。
データコントローラ23は、メインコントロール部20の内部におけるデータの転送処理を行う機能を有し、MPU24の制御のもとに、第1のインタフェース部21及びキャッシュメモリ22間、キャッシュメモリ22及び第2のインタフェース部25間、キャッシュメモリ22及びMPU24間においてデータを転送する。
なお、2つのメインコントロール部20のデータコントローラ23間は高速バス27を介して接続されている。そして各データコントローラ23は、MPU24の制御のもとに、この高速バス27を介してデータのやり取りを行うようになされている。このようにしてこのディスクアレイ装置1では、2つのメインコントロール部20間においてデータを共有化し、これにより一方のメインコントロール部20が故障した場合においても、データの破損を未然に防止し得るようになされている。
MPU24は、図示しない内部メモリに格納された各種制御プログラムに基づいて第1及び第2のインタフェース部21,25や、データコントローラ23及び線路切替え部26を制御する。この場合、2つのメインコントロール部20の各MPU24は、データコントローラ23及び高速バス27を介して常時通信し合うことにより、同期して各種処理を実行する。
第2のインタフェース部25は、ファイバーケーブル11(図1)を介して接続される各増設筐体との間で通信を行うための通信インタフェースとして機能するもので、メインコントロール部20内においてPCI規格に準拠したデータフォーマットで取り扱われるデータや各種コマンド等をファイバーチャネルプロトコルに従って増設筐体5に送信する一方、増設筐体5からファイバーチャネルプロトコルで送信されるデータや各種コマンドを受信し、これをPCI規格に準拠したデータフォーマットに変換する。
線路切替え部26は、スイッチ回路から構成されており、基本筐体4及びこれと隣接する増設筐体5間や、隣接する増設筐体5同士間を接続する上述のファイバチャネルケーブル11を介して基本筐体4及び各増設筐体5にそれぞれ装着されたすべてのディスクドライブユニット6内のハードディスクドライブ6Aとループ状の通信経路(以下、これらをループ状通信経路LOOP♯0,LOOP♯1と呼ぶ)を通じて接続されている。これによりディスクアレイ装置1においては、いずれか一方のループ状通信経路LOOP♯0,LOOP♯1が切断した場合においても、他方のループ状通信経路LOOP♯1,LOOP♯0を通じて所望のハードディスクドライブ6Aにアクセスできるようになされている。
また2つのメインコントロール部20の各線路切替え部26は、信号線28を介して相互に通信可能に接続されると共に、他方のメインコントロール部20の第2のインタフェース部25とも通信可能に接続されている。これによりこのディスクアレイ装置1では、切替え部26の接続を切り替えることによって、一方のメインコントロール部20の線路切替え部26が故障した場合においても、そのメインコントロール部20が他方のメインコントロール部20の線路切替え部26を介して基本筐体4及び各増設筐体5内のすべてのハードディスクドライブ6Aにアクセスすることができるようになされている。
一方、各増設筐体5内には、複数のハードディスクドライブ6Aのほか、2重化された資源管理コントローラ(以下、これらを資源管理コントローラと呼ぶ)29がそれぞれ各ループ状通信経路LOOP♯0,LOOP♯1上に設けられている。
各資源管理コントローラ29は、後述のようにマイクロコンピュータ34(図3)やSRAM33(図3)を内蔵し、それぞれ独立に自増設筐体5内の各冷却ファン13の回転状態を管理する。例えば、各資源管理コントローラ29は、それぞれ自増設筐体5内の各冷却ファン13の回転状態を常時監視し、冷却ファン13の回転異常を検出したときには、これを基本筐体4内の対応するメインコントロール部20に通報する。また各資源管理コントローラ29は、この結果としてそのメインコントロール部20から与えられるコマンドに基づいて、自増設筐体5内の電源コントロールボード10(図1)に配設された冷却ファン異常通報用のLED(図示せず)を点灯させる。
ここで、このディスクアレイ装置1におけるデータの入出力の流れについて説明する。このディスクアレイ装置1では、上位装置から送信されたデータ書込み要求やデータ読出し要求が第1のインタフェース部21及びデータコントローラ23を順次介してMPU24に与えられる。
MPU24は、上位装置からデータ書込み要求が与えられた場合、データコントローラ23を制御することにより、その後その上位装置から送信される書込み対象のデータを第1のインタフェース部21及びデータコントローラ23を順次介してキャッシュメモリ22に順次格納させる。またMPU24は、この後データコントローラ23を制御することにより、キャッシュメモリ22に格納された書込み対象のデータを読み出させ、これをかかるデータ書込み要求に応じた書込みコマンドと共に第2のインタフェース部25、線路切替え部26及びループ状通信経路LOOP♯0,LOOP♯1を順次介して対応するハードディスクドライブ6Aに送信する。これにより、書込み対象のデータが、かかる書込みコマンドに従って、基本筐体4内又は増設筐体5内の対応するハードディスクドライブ6A内の対応するアドレス位置に書き込まれる。
一方、MPU24は、データ読出し要求が与えられた場合、これに応じた読出しコマンドを生成し、これをデータコントローラ23、第2のインタフェース部25、線路切替え部26及びループ状通信経路LOOP♯0,LOOP♯1を順次介して対応するハードディスクドライブ6Aに送信する。この結果、この読出しコマンドに基づいて、読出し対象のデータがかかるハードディスクドライブ6Aから読み出され、これがループ状通信経路LOOP♯0,LOOP♯1、線路切替え部26、第2のインタフェース部及びデータコントローラ23を順次介してキャッシュメモリ22に格納される。またこのキャッシュメモリ22に格納された読出し対象のデータは、この後MPU21の制御のもとに、データコントローラ23によりキャッシュメモリ22から読み出され、第1のインタフェース部21を介して対応する上位装置に送信される。
(3)資源管理コントローラ29の具体的構成
図3は、各増設筐体5内に配設される上述の資源管理コントローラ29の具体的な構成を示している。この図3からも明らかなように、資源管理コントローラ29は、第1及び第2の線路切替え部30,31、フラッシュメモリ32、SRAM(Static Random Access Memory)33、マイクロコンピュータ34、エンクロージャコントローラ35並びに信号出力部36を備えて構成される。
第1及び第2の線路切替え部30,31は、スイッチ回路から構成されており、それぞれマイクロコンピュータ34の制御のもとに、図2について上述したループ状通信経路(LOOP♯0,LOOP♯1)を閉じ又は開放するように接続を切り替える。例えば、第2の線路切替え部31は、自増設筐体5に次段の増設筐体5を接続する場合には、ループ状通信経路を開放するように接続を切り替え、これに対して第2の線路切替え部31に次段の増幅筐体5を接続しない場合には、ループ状通信経路を閉じるように接続を切り替える。
フラッシュメモリ32は、主として各種制御プログラムを保持するために用いられる。またSRAM33は、マイクロコンピュータ34のワークメモリとして用いられる。マイクロコンピュータ34の動作時、SRAM33にはプログラム動作領域33A、リード領域33B及びライト領域33Cが設定される。そしてプログラム動作領域33A内にはマイクロコンピュータ34によりフラッシュメモリ32から読み出された制御プログラムが展開される。またリード領域33Bには自資源管理コントローラ29又は冷却ファン13が故障しているか否かなどの資源管理情報が格納され、ライト領域33Cにはメインコントロール部20(図2)のMPU24(図2)により設定された冷却ファン13の回転数等の各種設定情報が格納される。
マイクロコンピュータ34は、SRAM33のプログラム領域33Aに展開した制御プログラムに基づいて、自増設筐体5内に配設された各冷却ファン13の回転制御などの各種制御処理を実行する。実際上、マイクロコンピュータ34は、かかる制御プログラムと、自増設筐体5内に配設された図示しない温度センサのセンサ出力となどに基づいて、冷却ファン13を低速又は高速で回転させるように制御する。なお、マイクロコンピュータ34は、図4に示すように、信号線を通じて他の資源管理コントローラ29のマイクロコンピュータ34と通信可能に接続されており、当該他の資源管理コントローラ29のマイクロコンピュータ34と通信しながら、当該マイクロコンピュータ34と同期して冷却ファン13を制御する。
エンクロージャコントローラ35は、マイクロコンピュータ34と、冷却ファン13やハードディスクドライブ6Aなどのハードウェアとの間で送受される各種情報を一時的に記憶するためのレジスタ35Aを有し、マイクロコンピュータ34及び対応するハードウェアがこのレジスタ35Aを介して各種情報をやり取りするための各種制御処理を行う。
信号出力部36は、資源管理コントローラの出力段に設けられており、後述のようにマイクロコンピュータ34から出力される回転指示信号に基づく信号を冷却ファン13に送出する際の出力処理を行う。また信号出力部36は、回転指示信号に基づき当該信号出力部16から出力される出力信号がハイレベル(低速回転指示)及びローレベル(高速回転指示)のいずれであるかを検出し、検出結果をマイクロコンピュータ34に通知する処理を行う。
図4は、信号出力部36の具体的構成を示すものである。この図4に示すように、各信号出力部36には、NPNオープンコレクタ型のトランジスタTRが設けられている。このトランジスタTRは、エミッタが接地され、出力端としてのコレクタがプルアップ抵抗R1を介して電源Vccと接続されている。
またトランジスタTRのコレクタは、レベル分離用抵抗R2を介してバックプレーン40上においてワイヤードオア(Wired-OR)接続され、電源Vccと接続されたプルアップ抵抗R3によりプルアップされた後に、バックプレーン40上に形成されたバッファ41を介して冷却ファン13の回転を制御する制御部42と接続されている。
さらにトランジスタTRのコレクタには比較器44も接続されており、この比較器44の出力がマイクロコンピュータ34に与えられる。マイクロコンピュータ34は、エンクロージャコントローラ35を介してトランジスタTRのベースとも接続されている。
次に、このようなハードウェア構成を有する資源管理コントローラ29における冷却ファン13の管理手法について図3〜図6を参照して説明する。
資源管理コントローラ29において、マイクロコンピュータ34は、通常時、自増設筐体5の内部に配設された図示しない温度センサから通知される自増設筐体5内部の温度と、起動時にフラッシュメモリ32(図3)から読み出してSRAM33(図3)のプログラム領域33A(図3)に展開した制御プログラムと、後述のようにして取得した冷却ファン13の回転異常情報となどに基づいて、自増設筐体5内に配設された各冷却ファン13の回転状態(低速回転又は高速回転)を制御する。
例えばマイクロコンピュータ34は、冷却ファン13を低速回転させたいときは、ロー(Low)レベルの回転指示信号S1を出力する。この低速回転を指示する回転指示信号S1は、エンクロージャコントローラ35のレジスタ35Aを介して信号出力部36のトランジスタTRのベースに与えられる。
この結果、信号出力部36では、トランジスタTRがオフすることにより当該トランジスタTRのコレクタ電圧がハイ(High)レベルとなり、これがバックボード40において他方の資源管理コントローラ29における信号出力部36のトランジスタTRのコレクタ電圧とワイヤードオアされる。このとき他方の資源管理コントローラ29においても同様の処理によって信号出力部36のトランジスタTRのコレクタ電圧がハイレベルとなる。
そして、これらワイヤードオアされた2つのトランジスタTRのコレクタ電圧の論理和でなる論理和信号S2は、この後バッファ41を介してバックボード40上に形成された制御部42に与えられる。かくして制御部42は、この論理和信号S2に従って、その増設筐体5内の各冷却ファン13を、低速回転速度として予め設定されている所定の第1の回転数で回転させるように制御する。
これに対してマイクロコンピュータ34は、例えば冷却ファン13を高速回転させたいときは、ハイレベルの回転指示信号S1を出力する。この高速回転を指示する回転指示信号S1は、エンクロージャコントローラ35のレジスタ35Aを介して信号出力部36のトランジスタTRのベースに与えられる。
この結果、信号出力部36では、トランジスタTRがオンすることにより当該トランジスタTRのコレクタ電圧がローレベルとなり、これがバックボード40においてもう一方のトランジスタTRのコレクタ電圧とワイヤードオアされる。このとき他方の資源管理コントローラ29においても同様の処理によって信号出力部36のトランジスタTRのコレクタ電圧がローレベルとなる。そして、これらワイヤードオアされた2つのトランジスタTRのコレクタ電圧の論理和でなる論理和信号S2は、この後バッファ41を介して制御部42に与えられる。また制御部42は、この論理和信号S2に従って、その増設筐体5内の各冷却ファン13を、高速回転速度として予め設定されている所定の第2の回転数で回転させるように制御する。
このとき、これら各冷却ファン13の動作状態(回転状態)は、それぞれその冷却ファン13と一体に設けられた回転センサ43により検出され、それぞれ回転状態検出信号S3として各資源管理コントローラ29のエンクロージャコントローラ35に与えられる。エンクロージャコントローラ35は、これら回転状態検出信号S3に基づいて各冷却ファン13の回転数を一定時間毎に検出し、検出結果を当該エンクロージャコントローラ35内のレジスタ35Aに格納する。
一方、比較器44には、トランジスタTRがオンしているときのコレクタ電圧(Low)よりも高く、かつトランジスタTRがオフしているときのコレクタ電圧(High)よりも低い予め設定された所定の電圧が基準電圧VREFとして与えられる。そして比較器44は、この基準電圧VREFと、そのときのコレクタ電圧とを常時比較し、比較結果を比較信号S4としてマイクロコンピュータ34に出力する。
マイクロコンピュータ34は、基本筐体4(図2)のメインコントロール部20(図2)のMPU24(図2)から送信される資源情報取得コマンドに応じて、自資源管理コントローラ29や冷却ファン13に異常が発生していないか否かを判定する。
すなわち、メインコントロール部20のMPU24は、冷却ファン13の回転異常の有無などの資源管理情報を取得するため、一定時間毎(例えば2秒毎)にファイバーチャネルプロトコルに従って、資源情報取得のための資源情報取得コマンドを、図3に示す各増設筐体5内のSESドライブと呼ばれるハードディスクドライブ6Aに送信する。
このSESドライブは、資源管理情報が読み出し及び書き込み可能なハードディスクドライブであり、図3の例では、図中「HDD♯00」〜「HDD♯04」で表されたハードディスクドライブ6AがSESドライブに該当する。そして、SESドライブは、資源管理情報取得コマンドを受信すると、その旨をエンクロージャコントローラ35を介してマイクロコンピュータ34に通知する。
マイクロコンピュータ34は、電源が投入された直後の初期時、資源管理用の制御プログラム(以下、これを資源管理プログラムと呼ぶ)をフラッシュメモリ32から読み出し、これをSRAM33のプログラム動作領域33Aに展開するようにして起動する。そしてマイクロコンピュータ34は、起動後、いずれかのSESドライブから資源情報取得コマンドを受信した旨の通知が与えられると、比較器44から与えられる比較信号S4とエンクロージャコントローラ35内のレジスタに格納された各冷却ファン13の回転数とに基づき、図5に示す判断基準に従って、自資源管理コントローラ29及び冷却ファン13の異常の有無(自資源管理コントローラ29や冷却ファン13が故障しているか否か)を判定する。
例えば、マイクロコンピュータ34がローレベルの回転指示信号S1を出力している場合、トランジスタTRのコレクタ電圧はハイレベルであることが期待される。しかしながら、このとき例えばこのトランジスタTRにショートモード(短絡)の故障が発生している場合には、このトランジスタTRのコレクタ電圧が比較器44における基準電圧VREFよりも低いグランドレベルになるため、マイクロコンピュータ34が比較信号S4に基づいて認識するトランジスタTRのコレクタ電圧がローレベルとなる。かくして、このときマイクロコンピュータ34は、自系が異常である(故障している)と判定することになる。
なお、このとき他方の資源管理コントローラ29では、レベル分離用抵抗R2の存在によりトランジスタTRのコレクタ電圧がグランドレベルにはならない。そして比較器44における基準電圧VREFはこの状態のコレクタ電圧よりも低く設定されているため、比較信号S4に基づいてマイクロコンピュータ34が認識するトランジスタTRのコレクタ電圧がハイレベルとなる。かくして、このときマイクロコンピュータ34は、自系が正常である(故障していない)と判定することになる。
また、例えば各資源管理コントローラ29のマイクロコンピュータ34が共にハイレベルの回転指示信号S1を出力している場合、トランジスタTRのコレクタ電圧は共にローレベルであることが期待される。
このとき一方の資源管理コントローラ29のトランジスタTRに例えばオープンモード(断線)などの結果的にコレクタ電圧がハイ・インピーダンスとなるような故障が発生している場合には、他方の資源管理コントローラ29では、トランジスタTRがオンしているために、そのコレクタ電圧がコンパレータにおける基準電圧VREFよりも低いグラントレベルになって、比較信号S4に基づきマイクロコンピュータ34が認識するトランジスタTRのコレクタ電圧がローレベルとなる。かくして、このときマイクロコンピュータ34は、自系が正常である(故障していない)と判定することになる。
これに対して、トランジスタTRに故障が発生している側の資源管理コントローラ29では、レベル分離用抵抗R2の存在によりコレクタ電圧がグランドレベルにはならず、比較器44における基準電圧VREFよりも高いハイレベルになるため、このとき比較信号S4に基づいてマイクロコンピュータ34が認識するトランジスタTRのコレクタ電圧がハイレベルとなる。かくして、このときマイクロコンピュータ34は、自系が異常である(故障している)と判定することになる。
さらに、例えばマイクロコンピュータ34がローレベル(高速回転)の回転指示信号S1を出力した場合において、比較器44からマイクロコンピュータ34に与えられる比較信号S4に基づいて認識されるトランジスタTRのコレクタ電圧がハイレベルであるにもかかわらず、エンクロージャコントローラ35のレジスタ35Aに格納されているいずれかの冷却ファン13の回転数が低速回転時の回転数であった場合には、マイクロコンピュータ34は、その冷却ファン13が異常である(故障している)と判定することになる。
そして、マイクロコンピュータ34は、このようにして得られた自資源管理コントローラ29や冷却ファン13の故障の有無の判定結果を他のマイクロコンピュータ34との間で相互にやり取りすることにより情報の共有化を図る一方、この判定結果をSRAM33のリード領域33Bに格納する。
かくして、かかる判定結果がこの後SRAM33のリード領域33Bから読み出され、資源管理情報としてエンクロージャエンコーダ35を経由してSESドライブに格納される。そしてこのSESドライブに格納されたかかる資源管理情報が読み出されて基本筐体4内のメインコントロール部20のMPU24に与えられる。
MPU24は、この資源管理情報に基づいて、いずれかの増設筐体5内の資源管理コントローラ29や各冷却ファン13に故障が発生していないか否かを判定する。またMPU24は、この判定によりいずれかの増設筐体5内の資源管理コントローラ29又は冷却ファン13の故障を検出したときにはその故障部位を特定し、図6に示すように、この特定結果に基づいて、その資源管理コントローラ29又は冷却ファン13に設けられた警告用のLEDを点灯すべき旨の設定情報を対応する増設筐体5内のSESドライブに送信し、記憶させる。またMPU24は、いずれかの冷却ファン13に回転異常が発生している(冷却ファン13が故障している)と判定したときには、例えばその冷却ファン13の駆動を停止させて、他の冷却ファン13を高速回転させるべき旨の設定情報を対応する増設筐体5内のSESドライブに送信し、記憶させる。
そして、この設定情報を受信したSESドライブは、エンクロージャコントローラ35を経由してマイクロコンピュータ34にアクセスし、かかる設定情報を受信した旨をマイクロコンピュータ34に通知する。かくしてマイクロコンピュータ34は、この通知を受けて、エンクロージャコントローラ35を経由して対応するSESドライブからかかる設定情報を読み出し、これをSRAM33のライト領域33Cに書き込む。
またマイクロコンピュータ34は、この後SRAM33のライト領域33Cに書き込んだ設定情報をエンクロージャコントローラ35のレジスタ35Aに書き込む。そしてエンクロージャコントローラ35は、このレジスタ35Aに書き込まれた設定情報に基づいて、各資源管理コントローラ29にそれぞれ対応させて電源コントローラボード10(図1)に設けられた表示パネル(図示せず)や、各冷却ファン13にそれぞれ設けられた表示パネル(図示せず)のうちの対応する表示パネル上の警告用のLEDを点灯させる。さらにエンクロージャコントローラ35は、冷却ファン13を高速回転させるべき旨の設定情報がレジスタ35Aに書き込まれたときには、これを対応する各冷却ファン13に送信することにより、これら冷却ファン13を高速回転させる。
このようにしてこのディスクアレイ装置1では、冷却ファン13の回転異常が発生した場合に対処する。
ここで、従来のディスクアレイ装置における資源管理コントローラでは、本ディスクアレイ装置1の信号出力部36に対応する部位が、当該信号出力部36からプルアップ抵抗R1、レベル分離用抵抗R2及び比較器44を取り除いた構成となっていた。このため従来のディスクアレイ装置では、冷却ファン13に回転異常が発生した場合に、当該回転異常の発生を認識できても、いずれの資源管理コントローラ29が故障したのかを特定できない問題があった。
これに対して、本ディスクアレイ装置1では、各増設筐体5内の資源管理コントローラ29が、それぞれ自己内部の信号出力部36から出力される回転指示信号S1の信号レベルを検出し、この検出結果に基づいて自資源用コントローラ29(特にトランジスタTR)の故障の有無を判定すると共に、各冷却ファン13とそれぞれ一体に設けられた回転センサ43から回転状態検出信号S3に基づきエンクロージャコントローラ35のレジスタ35Aに格納される各冷却ファン13の回転数に基づいて冷却ファン13の故障の有無を判定するようにしているため、冷却ファン13に回転異常が発生したときにも故障箇所の特定が容易であり、かかる冷却ファン13の回転異常に対する修理作業を容易化させることができる。
また、このディスクアレイ装置1では、資源管理コントローラ29の信号出力部36におけるエンクロージャコントローラ35又はトランジスタTRが故障した場合には、エンクロージャコントローラ35の出力及びトランジスタTRの出力信号レベルを測定することによって、これらエンクロージャコントローラ35及びトランジスタTRのいずれが故障しているかの特定が可能であり、その分より一層と冷却ファン13の回転異常に対する修理作業を容易化させることができる。
(4)他の実施の形態
なお、上述の実施の形態においては、増設筐体5内において資源管理コントローラ29が2重化されている場合について述べたが、本発明はこれに限らず、資源管理コントローラ29が3重化又はそれ以上に多重化されている(すなわち増設筐体5内に資源管理コントローラ29が3つ以上設けられている)場合にも適用することができる。
また上述の実施の形態においては、制御対象が冷却ファン13である場合について述べたが、本発明はこれに限らず、要は、複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する制御装置に広く適用することができる。
さらに上述の実施の形態においては、トランジスタTRの出力端であるコレクタから出力される制御信号としてのコレクタ電圧のレベルを検出する信号レベル検出部として比較器44を適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の手段を広く適用することができる。
さらに上述の実施の形態においては、故障箇所(資源管理コントローラ29又は冷却ファン13)を特定した後の処置として、特定した故障箇所をユーザや保守員に通知する方法として警告用のLEDを点灯するようにした場合について述べたが、本発明はこれに限らず、例えば特定した故障箇所をネットワーク等を介して管理サーバに通知し、これを管理サーバに表示させるようにしたり、又は故障箇所の履歴を記録しておくようにしても良い。
本発明は、ディスクアレイ装置のほか、複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する制御装置が搭載された種々の装置に広く適用することができる。
(A)は本実施の形態によるディスクアレイ装置の外観構成を示す正面図であり、(B)はその背面図である。 ディスクアレイ装置の内部構成を示すブロック図である。 資源管理コントローラの構成を示すブロック図である。 信号出力部の具体的構成を示すブロック図である。 資源管理コントローラにおける故障の有無の判定方法の説明に供する図表である。 MPUにおける故障の有無の判定方法の説明に供する図表である。
符号の説明
1……ディスクアレイ装置、4……基本筐体、5……増設筐体、6A……ハードディスクドライブ、13……冷却ファン、20……メインコントロール部、24……MPU、29……資源管理コントローラ、33……SRAM、34……マイクロコンピュータ、35……エンクロージャコントローラ、36……信号出力部、40……バックボード、42……制御部、43……回転センサ、44……比較器、TR……トランジスタ、R1,R3……プルアップ抵抗、R2……レベル分離用抵抗。

Claims (16)

  1. 複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する制御装置において、
    各前記コントローラは、
    出力段に設けられたトランジスタと、
    所定のデータ処理を実行し、当該データ処理結果に応じて前記トランジスタをオン・オフさせるデータ処理部と、
    前記トランジスタの出力端に接続されたプルアップ抵抗と、
    前記トランジスタの前記出力端に接続されたレベル分離抵抗と、
    前記トランジスタの前記出力端から出力される前記制御信号の信号レベルを検出する信号レベル検出部と
    を備え、
    各前記データ処理部は、
    前記信号レベル検出部の検出結果に基づいて自コントローラの故障の有無を判定する
    ことを特徴とする制御装置。
  2. 前記制御対象の動作状態を検出するセンサを備え、
    各前記データ処理部は、
    前記センサの出力及び前記信号レベル検出部の出力に基づいて前記制御対象の故障の有無を判定する
    ことを特徴とする請求項1に記載の制御装置。
  3. 前記データ処理部は、
    他の前記コントローラの前記データ処理部と通信可能に接続され、当該データ処理部と通信しながら、当該データ処理部と同期して前記制御対象を制御する
    ことを特徴とする請求項1に記載の制御装置。
  4. 前記データ処理部は、
    他の前記コントローラの前記データ処理部と通信可能に接続され、当該データ処理部との間で相互に前記自コントローラの故障の有無の判定結果をやり取りする
    ことを特徴とする請求項1に記載の制御装置。
  5. 各前記コントローラの前記データ処理部から前記自コントローラの故障の有無の判定結果をそれぞれ取得し、各前記判定結果に基づいて、故障している前記コントローラを特定するプロセッサを備える
    ことを特徴とする請求項4に記載の制御装置。
  6. 前記プロセッサの特定結果を表示する表示部を備える
    ことを特徴とする請求項5に記載の制御装置。
  7. 前記制御対象の動作状態を検出するセンサを備え、
    前記データ処理部は、
    前記センサの出力及び前記信号レベル検出部の出力に基づいて前記制御対象の故障の有無を判定し、
    前記プロセッサは、
    各前記コントローラの前記データ処理部から前記制御対象の故障の有無の判定結果をそれぞれ取得し、当該判定結果に基づいて、故障している前記コントローラ及び又は前記制御対象を特定する
    ことを特徴とする請求項5に記載の制御装置。
  8. 前記プロセッサの特定結果を表示する表示部を備える
    ことを特徴とする請求項7に記載の制御装置。
  9. 複数のコントローラからそれぞれ出力される各制御信号のワイヤードオア結果に基づいて制御対象を制御する制御方法において、
    各前記コントローラは、
    出力段に設けられたトランジスタと、
    所定のデータ処理を実行し、当該データ処理結果に応じて前記トランジスタをオン・オフさせるデータ処理部と、
    前記トランジスタの出力端に接続されたプルアップ抵抗と、
    前記トランジスタの前記出力端に接続されたレベル分離抵抗とを有し、
    各前記コントローラの前記データ処理部が、
    前記トランジスタの前記出力端から出力される前記制御信号の信号レベルを検出する第1のステップと、
    当該検出結果に基づいて自コントローラの故障の有無を判定する第2のステップと
    を備えることを特徴とする制御方法。
  10. 上記第1のステップでは、
    センサにより前記制御対象の動作状態を検出し、
    上記第2のステップでは、
    前記センサの出力及び前記信号レベル検出部の出力に基づいて前記制御対象の故障の有無を判定する
    ことを特徴とする請求項9に記載の制御方法。
  11. 前記データ処理部は、
    他の前記コントローラの前記データ処理部と通信可能に接続され、当該データ処理部と通信しながら、当該データ処理部と同期して前記制御対象を制御する
    ことを特徴とする請求項9に記載の制御方法。
  12. 前記データ処理部は、
    他の前記コントローラの前記データ処理部と通信可能に接続され、
    前記データ処理部が、当該データ処理部との間で相互に前記自コントローラの故障の有無の判定結果をやり取りする第3のステップを備える
    ことを特徴とする請求項9に記載の制御方法。
  13. プロセッサが、
    各前記コントローラの前記データ処理部から前記自コントローラの故障の有無の判定結果をそれぞれ取得し、各前記判定結果に基づいて、故障している前記コントローラを特定する第3のステップを備える
    ことを特徴とする請求項12に記載の制御方法。
  14. 前記プロセッサの特定結果を表示する第4のステップを備える
    ことを特徴とする請求項13に記載の制御方法。
  15. 前記制御対象の動作状態を検出するセンサを備え、
    前記第2のステップにおいて、
    前記データ処理部は、前記センサの出力及び前記信号レベル検出部の出力に基づいて前記制御対象の故障の有無を判定し、
    前記第3のステップにおいて、前記プロセッサは、
    各前記コントローラの前記データ処理部から前記制御対象の故障の有無の判定結果をそれぞれ取得し、当該判定結果に基づいて、故障している前記コントローラ及び又は前記制御対象を特定する
    ことを特徴とする請求項13に記載の制御方法。
  16. 前記プロセッサの特定結果を表示する第4のステップを備える
    ことを特徴とする請求項15に記載の制御方法。
JP2005195775A 2005-07-05 2005-07-05 制御装置及び制御方法 Pending JP2007018034A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005195775A JP2007018034A (ja) 2005-07-05 2005-07-05 制御装置及び制御方法
US11/215,034 US7373208B2 (en) 2005-07-05 2005-08-31 Control apparatus and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005195775A JP2007018034A (ja) 2005-07-05 2005-07-05 制御装置及び制御方法

Publications (1)

Publication Number Publication Date
JP2007018034A true JP2007018034A (ja) 2007-01-25

Family

ID=37619229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005195775A Pending JP2007018034A (ja) 2005-07-05 2005-07-05 制御装置及び制御方法

Country Status (2)

Country Link
US (1) US7373208B2 (ja)
JP (1) JP2007018034A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276734A (ja) * 2007-03-30 2008-11-13 Hitachi Ltd ディスクアレイ装置
JP2010117848A (ja) * 2008-11-12 2010-05-27 Hitachi Ltd 記憶制御装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7757015B2 (en) * 2005-09-13 2010-07-13 International Business Machines Corporation Device, method and computer program product readable medium for determining the identity of a component
TW200715099A (en) * 2005-10-07 2007-04-16 Delta Electronics Inc Heat dissipation system
DE102008046681B4 (de) * 2008-09-10 2011-04-14 Atmel Automotive Gmbh Schaltung, Verfahren und Verwendung eines Speichers zum Senden und/oder Empfangen in einem Funknetz
US11193481B2 (en) * 2018-10-31 2021-12-07 Charles E. Rupp Sump pump system and control methodology therefor

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651193A (en) * 1994-02-09 1997-07-29 The Gsi Group, Inc. Grain dryer and control system therefor
JP2690278B2 (ja) 1995-01-13 1997-12-10 日本電気テレコムシステム株式会社 故障監視方式
US6135718A (en) * 1999-03-25 2000-10-24 System General Corporation Interface apparatus for fan monitoring and control
JP2001255961A (ja) * 2000-03-01 2001-09-21 Internatl Business Mach Corp <Ibm> コンピュータ及び冷却ファンの制御方法
US6563284B2 (en) * 2000-11-21 2003-05-13 Texas Instruments Incorporated Single wire digital width modulation for fan control with tachometer feedback

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276734A (ja) * 2007-03-30 2008-11-13 Hitachi Ltd ディスクアレイ装置
JP2010117848A (ja) * 2008-11-12 2010-05-27 Hitachi Ltd 記憶制御装置
US7911788B2 (en) 2008-11-12 2011-03-22 Hitachi, Ltd. Storage control device
JP4727709B2 (ja) * 2008-11-12 2011-07-20 株式会社日立製作所 記憶制御装置

Also Published As

Publication number Publication date
US7373208B2 (en) 2008-05-13
US20070010899A1 (en) 2007-01-11

Similar Documents

Publication Publication Date Title
US7194655B2 (en) Method and system for autonomously rebuilding a failed server and a computer system utilizing the same
US7487372B2 (en) Remote power sensing for hard disk bridge controller
US7917664B2 (en) Storage apparatus, storage apparatus control method, and recording medium of storage apparatus control program
US7650532B2 (en) Storage system
US20070214318A1 (en) Disk array system and fault-tolerant control method for the same
US9594641B2 (en) Techniques for updating memory of a chassis management module
JP2007286937A (ja) ストレージ装置及びストレージ装置の電源障害管理方法
JP2007018034A (ja) 制御装置及び制御方法
JP2003150280A (ja) バックアップ管理システムおよび方法
US10073504B2 (en) Optimization of fan control for storage device
JP2009015584A (ja) 記憶制御装置及び筐体単位の電源制御方法
CN107179804B (zh) 机柜装置
US20220019561A1 (en) Event-based generation of context-aware telemetry reports
JP2007025933A (ja) ストレージシステム及びそのファームウェア自動更新方法
US7421596B2 (en) Disk array system
JP6996602B1 (ja) Bmc、サーバシステム、装置安定度判定方法及びプログラム
TW201729097A (zh) 機櫃裝置
US7461132B2 (en) System and method for managing devices
TWI439856B (zh) 具故障備援以管理共享資源之方法與多電腦系統
US8364990B2 (en) Remote controlled power supply system
JP3627380B2 (ja) ディスクきょう体管理方式
US9842070B2 (en) Storage apparatus, control apparatus and computer-readable recording medium having stored therein control program
JP2007018049A (ja) 記憶制御システム
CN114356824B (zh) vpx刀片节点、状态监测方法、装置及存储介质
TW201421467A (zh) 電腦系統