JP2008090354A - 電源障害監視方法及びその装置 - Google Patents

電源障害監視方法及びその装置 Download PDF

Info

Publication number
JP2008090354A
JP2008090354A JP2006267218A JP2006267218A JP2008090354A JP 2008090354 A JP2008090354 A JP 2008090354A JP 2006267218 A JP2006267218 A JP 2006267218A JP 2006267218 A JP2006267218 A JP 2006267218A JP 2008090354 A JP2008090354 A JP 2008090354A
Authority
JP
Japan
Prior art keywords
fault
monitoring circuit
failure
information
fault monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006267218A
Other languages
English (en)
Inventor
Hideaki Takahashi
秀明 高橋
Manabu Yamagata
学 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006267218A priority Critical patent/JP2008090354A/ja
Priority to US11/634,069 priority patent/US7825799B2/en
Publication of JP2008090354A publication Critical patent/JP2008090354A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/263Arrangements for using multiple switchable power supplies, e.g. battery and AC
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • G06F11/326Display of status information by lamps or LED's for error or online/offline status

Abstract

【課題】障害情報を識別するコントローラの交換を無くすこと。
【解決手段】電源10、12の障害監視部24、26をパス38、40を介して互いに接続し、電源10、12の障害監視部24、26とコントローラ14、16の障害監視部30、32をパス34、36を介して互いに接続し、パス34、36にLED1、LED2を接続する。電源10に障害が生じたときに、障害監視部24から電源12の障害監視部26にパス38を介して障害情報を転送するとともに、障害監視部24によってLED1を点灯させるとともに、障害監視部26によってもLED1を点灯させ、電源10で障害が発生した障害情報を障害監視部24と障害監視部26からそれぞれパス34を介してコントローラ14、16の障害監視部30、32に転送し、障害監視部30、32から、保守PCに対して電源10で障害が生じたことを通知する。
【選択図】図1

Description

本発明は、通信ネットワークに接続されたストレージシステムや通信システムなどに設置されて、冗長化された複数の電源の状態を監視し、各電源から障害情報を収集し、収集した障害情報を通信ネットワークを介して、上位ホストなどの監視元に送信する技術に関する。
通信システムとして、例えば、複数の機能ブロックにそれぞれ電源装置を搭載し、各機能ブロックと制御装置とをシステムバスを介して接続したものが知られている(特許文献1参照)。この通信システムにおいては、各電源装置の障害を監視するに際して、機能ブロックごとに、障害が発生した電源装置から発報される電源障害情報を検出手段で検出して電源障害検出情報を作成し、作成した電源障害検出情報を障害情報通知用バスインターフェイス手段および障害情報通知用バスを介して制御装置に転送し、制御装置においてどの機能ブロックに搭載された電源装置に障害が発生したかを識別する構成が採用されている。このような構成を採用すると、機能ブロックの修理指示を保守者へ迅速に通知して、早期回復のための措置を取らせることができる。
また、電源に障害が発生したときに、障害が発生したことをランプの点灯によって知らせるようにしたものが提案されている(特許文献2参照)。この装置においては、電源の障害を監視するに際して、電源装置内で電源の障害に関する障害情報を収集し、収集した障害情報を監視用パッケージに転送し、監視用パッケージからランプを点灯するための命令を出力するとともに、監視用パッケージ内の電源からランプに電源を供給し、ランプを点灯させる構成が採用されている。すなわち、電源の障害によってランプに電力が供給されず、電源の障害によってランプが点灯しなくなるのを防止するために、電源装置とは異なる監視用パッケージ内の電源から電源装置内のランプに電力を供給する構成が採用されている。
一方、ストレージシステムにおいては、各ディスクに、冗長化された複数の電源から電力を供給するとともに、各電源に、各電源の状態を監視して、各電源から障害情報を収集し、収集した障害情報を複数のコントローラに転送する障害監視部を設け、いずれかの電源で障害が発生したときに、各コントローラの障害監視部から、障害の発生した電源に設置されたLEDに点灯指令を出力するとともに、通信ネットワークを介して上位ホストや障害監視センタなどに障害情報を転送することが試みられている。
特開平7−7868号公報 特開平6−133007号公報
電源の障害情報を通信ネットワークを介して上位ホストなどの監視元に送信するに際して、各電源に、電源の障害情報を収集するための障害監視部を設けるとともに障害発生時に点灯するLEDを設け、各コントローラには各電源の障害監視部から出力される障害情報を識別する障害監視部を設け、各コントローラの障害監視部から通信ネットワークを介して上位ホストなどに識別結果を送信するとともに、各コントローラの障害監視部によってLEDの点灯を制御する構成を採用した場合、電源に障害が生じても、障害発生時にはLEDを点灯させることができる。
しかし、各コントローラの障害監視部のうち電源の障害情報の収集やLED制御を行う部位にハードウエア/ソフトウエア上の障害が発生した場合、例えば、コントローラが障害情報を誤検出した場合、LEDが点灯しなくなるので、コントローラを交換する必要がある。特に、ワーストケースでは、ユーザ/保守員がコントローラの障害を認識することができなくなる。コントローラを交換した場合、コントローラは上位ホストやユーザ端末などに接続されているため、コントローラを交換すると、このコントローラに接続されているインターフェイスは全て閉塞され、限定的な範囲ながらもシステムの停止を引き起こすことが懸念される。しかも、コントローラが2重化されていない構成では、システム全体を停止することが余儀なくされる。さらに交換されたコントローラに対して、障害情報の収集、LEDを制御するためのハードウエア/ソフトウエア上の作りこみが必要となる。
本発明は、前記従来技術の課題に鑑みて為されたものであり、その目的は、各電源が電源自身の状態を監視するとともに他の電源の状態を把握し、各電源間で監視結果の授受を行うことで、障害情報を識別するコントローラの交換を無くすことにある。
前記目的を解決するために、本発明は、冗長化された複数の電源の状態をそれぞれ複数の障害監視回路で監視して、各電源からそれぞれ障害情報を収集し、各障害監視回路の出力による障害情報を各コントローラで識別し、各コントローラの識別結果を通信ネットワークを介して、上位ホストなどの監視元に送信するに際して、各電源に設置された各障害監視回路において、監視対象の電源の状態を監視するとともに他の電源の状態を把握し、監視対象の電源から収集した障害情報を各コントローラと他の障害監視回路に転送し、さらに他の障害監視回路から入力された障害情報を各コントローラに転送するようにしたため、障害情報を収集したり、発光素子の点灯を制御したりする機能に伴う障害が生じた場合でも、電源交換するだけで、障害を回復することができ、コントローラの交換が不要になるとともに、システム停止を回避できる。また各電源の各障害監視回路に対応して配置された発光素子に対して、自己の障害監視回路の収集による障害情報または他の障害監視回路の収集による障害情報に従ってその点灯を制御することで、障害電源に設置された発光素子の点灯を確実に制御することができる。
本発明によれば、各電源が電源自身の状態を監視するとともに他の電源の状態を把握し、各電源間で監視結果の授受を行うことで、障害情報を識別するコントローラの交換を無くすことが可能な電源監視方法およびその電源監視装置、並びにストレージシステムを提供することができる。
以下、本発明の実施の形態を図面に基づいて説明する。図1は本発明に係る電源障害監視装置が適用された通信システムのブロック図である。図1において、通信システムは、#1の電源(PS;Power Supply)10、#2の電源12を備えているとともに、#1のコントローラ(CTL;Controller)14、#2のコントローラ16を備えて構成されている。コントローラ14、16は、基板上に実装されて、LAN(Lacal Area Network)18を介して保守PC(Personal Computer)20に接続されているとともに、通信ネットワークとしての障害通報用専用回線22を介して障害監視センタに接続され、さらに他の通信ネットワークを介して上位ホスト/ユーザ端末などの監視元に接続されている。
電源10、12は冗長化されており、冗長化された電源10、12の状態を監視するために、電源回路10、12には、障害監視回路としての障害監視部24、26が設けられているとともに、発光素子として、障害発生時点灯するALARM用LED1、LED2と正常時点灯するREADY用LED3、LED4が設けられ、整流素子として、ダイオードD1、D2が設けられている。ダイオードD1のアノード側は電源10の電源出力に接続され、ダイオードD2のアノード側は電源12の電源出力に接続され、ダイオードD1、D2のカソード側は各電源共通の電源ライン28に接続されている。電源ライン28は、冗長化された電源10、12の電源出力としてコントローラ14、16に接続されているとともに、LED1〜LED4のアノード側に接続されている。
コントローラ14、16には障害情報を識別するための障害監視部30、32が設けられており、障害監視部30、32はパス34、36を介して互いに接続されているとともに、電源10、12の障害監視部24、26に接続されている。電源10、12の障害監視部24、26はパス38、40を介して互いに接続されている。
障害監視部24は、電源10の状態を監視し、電源10から障害情報として、例えば、電源の過電圧、過電流などの情報を収集し、収集した障害情報を、ALARMLED11信号としてパス34を介して障害監視部30、32に出力するとともに、ALARMLED11信号によってLED1を点灯させ、さらに、障害情報をPSALARM1信号としてパス38を介して、障害監視部26に出力するようになっている。一方、障害監視部26は、電源12の状態を監視し、電源12から障害情報として、電源12の過電圧、過電流などの障害情報を収集し、収集した障害情報をパス36を介して、ALARMLED22信号として障害監視部30、32に出力するとともに、LED2を点灯し、さらに、収集した障害情報をパス40を介してPSALARM2信号として、パス40を介して障害監視部24に出力するようになっている。この場合、障害監視部24は、パス40から入力された障害情報に応答して、パス36を介して、障害情報としてALARMLED12信号を障害監視部30、32に出力するとともに、LED2を点灯するための制御を行うようになっている。さらに、障害監視部26は、パス38から入力された障害情報に応答して、この障害情報を、ALARMLED21信号として、パス34を介して障害監視部30、32に出力するとともに、ALARMLED21信号により、LED1を点灯制御するようになっている。
コントローラ14、16の障害監視部30、32は、電源10、12の障害監視部24、26から出力された障害情報をそれぞれ識別し、識別結果を保守PC20に送信するとともに、障害監視センタあるいは上位ホスト/ユーザ端末に送信するようになっている。
具体的には、図2に示すように、障害監視部24は、MPU(Microprocessing Unit)42、NPNトランジスタ44、46、48、50、抵抗R13〜R20を備えて構成されている。MPU42は、電源10の正常時には、端子T1からレベル“H”の信号を出力し、端子T12、T13、T14からはレベル“L”の信号を障害情報として出力するようになっている。一方、MPU42は、電源10または電源12に障害が発生したときの障害情報として、端子T12、T13、T14からレベル“H”の信号を出力するようになっている。端子T12のレベルが“H”となると、トランジスタ46がオンとなって、LED1が点灯するとともに、レベル“L”の障害情報がパス34を介して、コントローラ14、16の障害監視部30、32に出力されるようになっている。端子T12の出力レベルが“H”となったときには、端子14の出力レベルも“H”となり、トランジスタ50がオンになって、レベル“L”の信号が障害情報として、電源12の障害監視部26に転送されるようになっている。端子T13は、電源12に障害が生じたとの障害情報がMPU42に入力されたときにそのレベルが“H”となり、端子T13のレベルが“H”となると、トランジスタ48がオンになってLED3を点灯させるとともに、レベル“L”の信号が障害情報としてコントローラ14、16の障害監視部30、32に転送されるようになっている。なお、LED1と直列に抵抗R1が接続され、LED2と直列に抵抗R2が接続されている。また端子T15には、パス40を介して電源12の障害監視部26からの障害情報が入力されるようになっている。
一方、障害監視部26は、MPU52、NPNトランジスタ54、56、58、60、抵抗R21〜R28を備えて構成されている。MPU52は、電源12の正常時には、端子T21からレベル“H”の信号を出力し、端子T22、T24からはレベル“L”の信号を出力するようになっている。端子T21のレベルが“H”となったときにはLED4が点灯し、電源12が正常である旨が知らされる。一方、電源12に障害が発生したときには、MPU52は、端子T21のレベルを“L”にするとともに、端子T22、T24のレベルを“H”に反転するようになっている。T21のレベルが“H”となると、トランジスタ56がオンになってLED3が点灯するとともに、障害情報として、レベル“L”の信号がパス36を介してコントローラ14、16の障害監視部30、32に転送される。また端子T24のレベルが“H”となると、トランジスタ60がオンになって、レベル“L”の信号が障害情報として、パス40を介して電源10の障害監視部24に転送される。また端子T25には、パス38を介して障害監視部24から電源10の障害情報が入力されるようになっており、端子T25にレベル“L”の障害情報が入力されたときには、MPU52によって端子T23のレベル“H”に反転される。端子T23のレベルが“H”になると、トランジスタ58がオンになってLED1が点灯するとともに、レベル“L”の障害情報がパス34を介してコントローラ14、16の障害監視部30、32に転送される。なお、LED3には抵抗R3が直列に接続され、LED4には、抵抗R4が直列に接続されている。
コントローラ14の障害監視部30は、LANドライバ62、メインマイクロ64、LSI(Large Scale Integrated Circuit)66に実装されたレジスタ68、シュミットトリガとして機能するバッファ70、72、抵抗R5〜R8、ダイオードD3、D4、コンデンサC1、C2を備えて構成されており、コントローラ14の障害監視部32は、LANドライバ74、メインマイクロ76、LSI78に実装されたレジスタ80、シュミットトリガとして機能するバッファ82、84、抵抗R9〜R12、ダイオードD5、D6、コンデンサC3、C4を備えて構成されている。コントローラ14におけるダイオードD3は、パス34のレベルが“L”となったときに導通し、ダイオードD4は、パス36のレベルが“L”になったときに導通するようになっている。ダイオードD3が導通すると、バッファ70からハイレベルのパルスが出力され、このパルスがレジスタ68にラッチされる。トランジスタD4が導通したときには、バッファ72からハイレベルのパルスが出力され、このパルスがレジスタ68にラッチされる。すなわち、電源10に障害が生じたときには、バッファ70の出力パルスがレジスタ68にラッチされ、電源12に障害が生じたときにはバッファ72の出力パルスがレジスタ68にラッチされるようになっている。メインマイクロ64は、レジスタポーリングによってレジスタ68の内容を識別し、電源10、12の障害の有無を含む傷害情報を、LANドライバ62を介して保守PC20に送信するとともに、監視センタ22や上位ホスト/ユーザ端末に送信するようになっている。
一方、コントローラ16におけるダイオードD5は、パス36のレベルが“L”になったときに導通し、ダイオードD6はパス34のレベルが“L”となったときに導通するようになっている。ダイオードD5が導通すると、バッファ82からハイレベルのトリガパルスが出力され、このパルスがレジスタ80にラッチされるようになっている。一方、ダイオードD6が導通したときには、バッファ84からハイレベルのトリガパルスが出力され、このパルスがレジスタ80にラッチされるようになっている。すなわち、電源12で障害が生じたときには、バッファ82の出力パルスがレジスタ80にラッチされ、電源10に障害が生じたときにはバッファ84の出力パルスがレジスタ80にラッチされるようになっている。メインマイクロ76は、レジスタポーリングにしたがってレジスタ80の内容(ラッチの内容)を識別し、識別結果として、電源10、12の障害の有無を含む障害情報をLANドライバ74を介して保守PC20、障害監視センタ22に送信するとともに、上位ホスト/ユーザ端末に送信するようになっている。
次に、障害発生時の作用を図3のフローチャートにしたがって説明する。まず、電源10で障害が発生した場合(S1)、電源10の障害監視部24は、電源10から収集した障害情報を基に電源10内部で障害が発生したことを認識する(S2)。これにより、MPU42は、端子T12のレベルを“H”とし、レベル“L”の障害情報として、ALARMLED11信号をパス34に出力する(S3)。さらに、MPU42は、端子T14のレベルを“H”とし、レベル“L”の障害情報として、PSALARM1信号をパス38に送出する(S4)。この信号はパス38を介してMPU52の端子T25に入力される(S5)。これにより、MPU52は、電源10内部で障害が生じたことを認識し(S6)、端子T23のレベルを“H”に反転し、レベル“L”の障害情報として、パス34にALARMLED21信号を送出する(S7)。パス34のレベルが“L”になったことに伴って、LED1が点灯する(S8)。
一方、パス34のレベルが“L”になると、コントローラ14の障害監視部30は、ALARMLED11/21信号を受信し(S9)、バッファ70の出力パルスがレジスタ78にラッチされる(S9)。これにより、メインマイクロ64は、電源10で障害が生じたことを認識し(S10)、LANドライバ62を介して保守PC20に電源10で障害が生じた旨を通知する(S11)。さらに、パス34のレベルが“L”となったときには、コントローラ16の障害監視部32は、障害情報として、ALARMLED11/21信号を受信し、レジスタ80は、バッファ84の出力パルスをラッチする(S12)。これにより、メインマイクロ76は、電源10で障害が生じたことを認識し(S13)、LANドライバ74を介して保守PC20に電源10で障害(異常)が生じたことを通知する(S14)。
保守PC20に電源10で障害が生じたことが通知されると、ユーザ/保守員は、電源10の交換が必要であると判断し(S15)、電源10を交換する(S16)。電源10が交換されたあとは正常状態に復帰し(S17)、このルーチンでの処理を終了する。
本実施形態によれば、電源10、12の障害情報を収集したり、LED1、LED2の点灯を制御したりするための機能が電源10、12の障害監視部24、26に付加されているため、電源10、12の障害情報を収集したり、LED1、LED2の点灯を制御したりするための機能に伴う障害が生じた場合、電源10を交換するだけで障害を回復することができ、コントローラ14、16の交換が不要になるととともに、障害情報を上位ホストや保守PC20などに通知することができる。さらに、コントローラ14、16の交換が不要になることから、システム停止を回避することができる。
次に、PSALARM信号誤検出における回復操作手順を図4のフローチャートにしたがって説明する。まず、パス38を介して障害情報として、PSALARM1信号が電源12の障害監視部26に入力されたとして、MPU52がPSALARM1信号を誤検出すると(S21)、MPU52は、電源10で障害が生じたと認識し(S22)、端子T23のレベルを“H”とし、パス34にレベル“L”の障害情報として、ALARMLED21信号を送出する(S23)。パス34のレベルが“L”となると、LED21が点灯する(S24)。一方、パス34のレベルが“L”となると、コントローラ14、16の障害監視部30、32はALARMLED21信号を検出し、バッファ70、84から出力されたパルスがレジスタ68、80にラッチされる(S25)。メインマイクロ64、76はそれぞれレジスタ68、80に対してレジスタポーリングを行うことで、電源10に障害が生じたことを認識し(S26)、LANドライバ62、74を介して保守PC20に対して電源10が異常である旨の通知を行う(S27)。
保守PC20に対して異常が通知されると、ユーザ/保守員は、電源10の交換が必要と判断し(S28)、電源10を交換する(S29)。電源10を交換しても正常状態に復帰しないときには、ユーザ又は保守員は電源12の交換が必要と判断し(S30)、電源12を交換する(S31)。電源12全体を交換すると、障害監視部26がPSALARM1信号を誤検出した場合でも、新たな障害監視部26が電源12に設置されるので、電源10、12は共に正常状態に復帰し(S32)、このルーチンでの処理を終了する。
本実施形態によれば、障害監視部26がPSALARM1信号を誤検出しても、電源10、12を交換することで、システムを正常状態に復帰させることができる。
次に、ALARMLED信号誤検出における回復操作手順を図5のフローチャートにしたがって説明する。まず、電源12の障害監視部26が、電源10の異常として、パス34にALARMLED21信号を誤送出すると(S41)、パス34のレベルが“L”となって、LED1が点灯する(S42)。さらにパス34のレベルが“L”となると、コントローラ14、16の障害監視部30、32はALARMLED21信号を検出し、バッファ70、84の出力パルスがそれぞれレジスタ68、80にラッチされる(S43)。このあと、メインマイクロ64、76は、それぞれレジスタポーリングによってレジスタ68、80の内容を識別し、電源10が異常であると認識し(S44)、LANドライバ62、74を介して保守PC20に対して電源10が異常である旨の通知を行う(S45)。
保守PC20に対して電源10が異常である旨の通知が行われると、ユーザ又は保守員は、電源10の交換が必要と判断し(S46)、電源10を交換する(S47)。電源10を交換しても正常状態に復帰しないときには、ユーザ又は保守員は電源12の交換が必要と判断し(S48)、電源12全体を交換する(S49)。電源12全体を交換すると、新たな障害監視部26によって電源12の監視が行われるため、電源10、12全体が共に正常状態に復帰し(S50)、このルーチンでの処理を終了する。
上述した障害が発生した場合、従来技術では、ユーザ又は保守員がLEDの点灯を発見するまでは、障害が発見されることはなく、また、たとえ、障害が発見された場合でも、コントローラの交換が必要である。これに対して、本実施形態によれば、コントローラ14、16を交換することなく、電源10、12を交換するだけで障害を回復することができるとともに、障害情報を上位ホストや保守PC20に確実に通報することができる。
ここで、図6に示すように、パス34、36を障害監視部24、26間で接続し、パス38、40を障害監視部24、26間に接続する他に、障害監視部30、32に接続する構成を採用すると、電源12の障害監視部26がPSALARM信号を誤検出した場合、障害監視部26が電源10が異常であると認識しているにも関わらず、コントローラ14、16の障害監視部30、32では、PSALARM1信号は正常であると検出しているので、コントローラ14、16の障害監視部30、32は電源10が異常であるとは認識しなくなる。このため障害監視部26はLED1を点灯させるが、障害監視部30、32から保守PC20に対しては、異常の旨が通知されない。このため、ユーザ又は保守員は、LED1の点灯を発見するまで、障害監視部26がPSALARM信号を誤検出していることを認識することができなくなる。よって、本発明では、ALARMLED信号を電源の障害情報を収集する信号としても使用し、PSALARM信号は障害監視部24、26間で用いることとしている。
また、各障害パターンにおける障害回復手順を従来技術と比較すると、図7に示すように、PSALARM信号受信に関する障害では、PSALARM信号誤検出時には、回復操作において、従来技術ではコントローラを交換しなければ回復しないのに対して、本発明では、電源を交換することで回復することができる。またPSALARM信号送出時に、PSALARM信号が検出されないときには、従来技術では、コントローラのいずれか一方が検出していれば上位ホストへの通知は可能である。これに対して本発明では、障害監視部24、26のいずれか一方が検出していれば可能となる。この場合、従来技術と本発明とも回復操作は電源を交換することで可能である。
一方、ALARMLED信号送出に関する障害では、ALARMLED誤送出時には、従来技術では上位への報告が不可能であるとともに、電源とコントローラを交換しなければ回復することができない。これに対して、本発明では、上位への報告が可能であるとともに、少なくとも障害が生じた電源を交換することで回復することができる。またLEDを点灯する必要があるのにALARMLED信号を送出できない場合、従来技術では、いずれか一方のコントローラが検出すれば上位への報告は可能であるのに対して、本発明では、障害監視部24、26のいずれか一方が検出すれば、上位への報告は可能である。なお回復操作については、従来技術と本発明ではともに電源を交換することで回復が可能である。
本実施形態においては、電源10、12の障害情報の収集およびLED1、LED2の点灯を制御する機能を電源10、12の障害監視部24、26に付加するようにしたため、図8に示すように、電源障害情報の共有および電源10、12におけるLED1、LED2の駆動制御時の動作は、電源10、12の2台間でのみ完結する。また電源10、12のコントローラ14、16との間には、電源10、12からコントローラ14、16に対しての障害情報の通知を行うためのインターフェイスしか存在しないので、各コントローラ14、16としては、障害情報受信のみの単純なインターフェイス「a」となる。このため、従来技術では必要とされた特殊な作りこみは、本実施形態では必要とされることはない。したがって、電源10、12と同一の電源10A、12Aに対しても本発明を適用し、コントローラ14A、16Aを各電源10A、12Aに対応して設けた場合でも、コントローラ14A、14Aには、特殊な作りこみは必要とせず、コントローラ14A、16Aには、障害の受信のみ必要となる単純なインターフェイス「b」を用意すればよいことになる。このため、本発明に係る構成を採用することで、コントローラ14、16、14A、16Aにおける部品点数を削減でき、且つ1つの電源を複数のコントローラ14、16で使用する場合には、設計工数を削減できることを意味する。
また、本実施形態によれば、電源10、12とコントローラ14、16間のインターフェイスが簡素化されるため、コントローラ14、16におけるコネクタピン数およびコントローラ14、16と電源10、12間の配線数を削減することができる。すなわち、コントローラ14、16は、他のコントローラ、ハードディスク、電源10、12など他の構成物とデータや障害情報などのやり取りを行うため、コントローラ14、16とバックボード基板間のコネクタには多数のピンを有するコネクタが要求されるが、コネクタピン数を削減することにより、コネクタネックを回避することができる。またコントローラ14、16と電源10、12間の配線数は、コントローラ14、16と電源10、12間が同一基板上で接続されている場合は、パターンを削減することができ、コントローラ14、16と電源10、12間にケーブルが存在する場合には、ケーブルの芯数を削減することができる。
次に、電源の数を3台以上にしたときの実施形態を図9にしたがって説明する。電源10、12の他に、n(nは3以上の整数)番目の電源90を設けた場合、電源10、12、90は、PSALARM1〜n信号を伝送するためのパス92〜102で接続され、コントローラ14、16と電源10、12、90間は、ALARMLED12〜n1、21〜n2、n1〜2nを伝送するためのパス104〜114を介して接続される。
次に、本実施形態において、PSALARM信号を誤検出したときの処理を図10のフローチャートに従って説明する。まず、電源90における障害監視部がPSALARMy信号を誤検出すると(S61)、電源90の障害監視部は#yの電源に異常がると認識し(S62)、ALARMLEDxy信号を送出する(S63)。これにより、#yの電源に対応して設けられたLEDyが点灯する(S64)。さらにコントローラ14、16は、ALARMLEDxy信号を検出し(S65)、#yに対応したバッファの出力パルスがレジスタ68、80にラッチされる。この結果、コントローラ14、16のメインマイクロ64、76は、#yの電源が異常と認識し(S66)、保守PC20に対して#yの電源が異常である旨の通知を行う(S67)。
保守PC20に異常が通知されると、ユーザ又は保守員は、#yの電源の交換が必要と判断し(S68)、#yの電源を交換する(S69)。このあと、#yの電源を交換しても復帰しないときには、ユーザ又は保守員は、他の電源に障害があると判断し(S70)、#y以外の他の電源の交換を行う(S71)。このあと、ユーザ又は保守員は、電源を交換するごとに正常に復帰したか否かを判断し(S72)、正常状態に復帰するまで、残りの電源を順次交換する。ユーザ又は保守員が、残りの電源を順次交換したときに正常状態に復帰したときには、このルーチンでの処理を終了する。
本実施形態によれば、電源の数nを3以上とした場合、コントローラ14、16における1台当たりのインターフェイス数は、従来技術では2nになるのに対して、n(n−1)となる。また電源10、12、90における1台当たりのインターフェイス数は、従来技術では3になるのに対して、本実施形態によれば、4(n−1)となる。
次に、本発明をストレージシステムに適用したときの実施形態を図11に示す。ストレージシステムは、#1のクラスタ120と#2のクラスタ122に分けられており、#1のクラスタ120には、電源10、コントローラ14が設けられているとともに、#1のFAN124が設けられている。一方、#2のクラスタ122には電源12、コントローラ14が設けられているとともに、#2のFAN126が設けられている。電源10、12の出力となる電源ライン28はバックボード基板128を介して、#1〜#15のハードディスクドライブ(HDD)130に接続されている。電源10、12の障害監視部24、26とコントローラ14、16の障害監視部30、32は障害情報を転送するためのパス32を介して#1〜#15のハードディスクドライブ130に接続されている。#1〜#15のハードディスクドライブ130はユーザデータを転送するためのパス134を介して互いに接続されているとともに、パス134を介して障害監視部30、32に接続されている。パス132、134は電源ライン28とともにバックボード基板28上に実装されている。
本実施形態によれば、電源10、12の障害情報を収集したり、LED1、LED2の点灯を制御したりするための機能が電源10、12の障害監視部24、26に付加されているため、電源10、12の障害情報を収集したり、LED1、LED2の点灯を制御したりするための機能に伴う障害が生じた場合でも、電源10、12を交換するだけで障害を回復することができ、コントローラ14、16の交換が不要になるとともに、障害情報を上位ホストや保守PC20などに通知することができる。
次に、本発明をサーバに適用したときの実施形態を図12にしたがって説明する。サーバは、2台の電源10、12、1台のコントローラ14、#1のFAN124、#2のFAN126、#1〜#nのハードディスクドライブ130、バックボード基板128、CD−ROM/DVDドライブ136を備えて構成されており、電源10、12の共通出力となる電源ライン28がバックボード基板128を介して、FAN124、126、#1〜#2のハードディスクドライブ130、CD−ROM/DVDドライブ136に接続されている。障害情報を転送するためのパス132は障害監視部24、26、30に接続されているとともにFAN124、126、#1〜#nのハードディスクドライブ130、CD−ROM/DVDドライブ136に接続されている。さらにユーザデータを転送するためのパス134は#1〜#nのハードディスクドライブ130に接続されているとともにコントローラ14に接続されている。
本実施形態によれば、電源10、12の障害情報を収集したり、LED1、LED2の点灯を制御したりするための機能が電源10、12の障害監視部24、26に付加されているため、電源10、12の障害情報を収集したり、LED1、LED2の点灯を制御したりするための機能に伴う障害が生じた場合でも、電源10、12を交換するだけで障害を回復することができるとともに、障害情報を上位ホストや保守PC20などに通知することができる。
本発明が適用された通信システムのブロック図である。 本発明が適用された通信システムの詳細ブロック図である。 電源障害監視装置の通常時の作用を説明するためのフローチャートである。 PSALARM信号誤検出における回復操作手順を説明するためのフローチャートである。 ALARMLED信号誤検出における回復操作手順を説明するためのフローチャートである。 コントローラがPSALARM信号を受信した場合の構成を説明するためのブロック図である。 従来技術と本発明における障害回復手順に伴う効果を説明するための図である。 電源障害に伴うインターフェイスの機能を説明するための図である。 電源が3台以上のときのコントローラと電源との関係を説明するためのブロック図である。 電源が3台以上のときにいずれかの電源においてPSALARMy信号を誤検出したときの作用を説明するためのフローチャートである。 本発明をストレージシステムに適用したときのブロック図である。 本発明をサーバに適用したときのブロック図である。
符号の説明
10、12 電源
14、16 コントローラ
20 保守PC
24、26、30、32 障害監視部
34、36、38、40 パス
42、52 MPU
64、76 メインマイクロ

Claims (13)

  1. 冗長化された複数の電源の状態をそれぞれ複数の障害監視回路で監視して、前記各電源からそれぞれ障害情報を収集し、前記各障害監視回路の出力による障害情報をそれぞれ単一または複数のコントローラで識別し、前記コントローラの識別結果を通信ネットワークを介して監視元に送信する電源障害監視方法において、前記各障害監視回路は、前記収集した障害情報を前記コントローラと他の障害監視回路に転送する第1のステップと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力し、入力した障害情報を前記コントローラに転送する第2のステップと、を含むことを特徴とする電源障害監視方法。
  2. 前記各障害監視回路は、前記収集した障害情報を前記コントローラに転送するときに、前記各障害監視回路に対応して配置された発光素子の点灯を制御する第3のステップと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力したときに、前記他の障害監視回路に対応して配置された発光素子の点灯を制御する第4のステップを含むことを特徴とする請求項1に記載の電源障害監視方法。
  3. 前記各電源に対応して、前記冗長化された複数の電源から電力の供給を受けて発光する複数の発光素子を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラに転送するときに、前記各障害監視回路に対応して配置された発光素子の点灯を制御する第3のステップと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力したときに、前記他の障害監視回路に対応して配置された発光素子の点灯を制御する第4のステップを含むことを特徴とする請求項1に記載の電源障害監視方法。
  4. 冗長化された複数の電源の状態を監視して、前記各電源からそれぞれ障害情報を収集する複数の障害監視回路と、前記各障害監視回路の出力による障害情報を識別し、当該識別結果を通信ネットワークを介して監視元に送信する単一または複数のコントローラと、を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラと他の障害監視回路に転送するとともに、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力し、入力した障害情報を前記コントローラに転送してなる電源障害監視装置。
  5. 前記各障害監視回路に対応して配置された複数の発光素子を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラに転送するときに、前記各障害監視回路に対応して配置された発光素子の点灯を制御するとともに、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力したときに、前記他の障害監視回路に対応して配置された発光素子の点灯を制御してなることを特徴とする請求項4に記載の電源障害監視装置。
  6. 前記各障害監視回路は、前記収集した障害情報を他の障害監視回路に転送する第1のパスと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力する第2のパスと、前記収集した障害情報を前記各コントローラに転送する第3のパスおよび前記第2のパスから入力した障害情報を前記各コントローラに転送する第4のパスに接続されてなることを特徴とする請求項4に記載の電源障害監視装置。
  7. 前記各障害監視回路は、前記収集した障害情報を他の障害監視回路に転送する第1のパスと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力する第2のパスと、前記収集した障害情報を前記各コントローラに転送する第3のパスおよび前記第2のパスから入力した障害情報を前記各コントローラに転送する第4のパスに接続され、前記第1のパスから第4のパスは、前記各電源と前記コントローラとを結ぶ電源ラインとともに基板上に形成されてなることを特徴とする請求項4に記載の電源障害監視装置。
  8. 前記各電源に対応して、前記冗長化された複数の電源から電力の供給を受けて発光する複数の発光素子を備え、前記各障害監視回路に対応して配置された複数の発光素子を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラに転送するときに、前記各障害監視回路に対応して配置された発光素子の点灯を制御するとともに、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力したときに、前記他の障害監視回路に対応して配置された発光素子の点灯を制御してなることを特徴とする請求項4に記載の電源障害監視装置。
  9. 冗長化された複数の電源と、前記各電源から電力の供給を受けてデータを記憶する複数のストレージと、冗長化された複数の電源の状態を監視して、前記各電源からそれぞれ障害情報を収集する複数の障害監視回路と、前記各障害監視回路の出力による障害情報を識別し、当該識別結果を通信ネットワークを介して、上位ホストを含む監視元に送信する単一または複数のコントローラと、を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラと他の障害監視回路に転送するとともに、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力し、入力した障害情報を前記コントローラに転送してなるストレージシステム。
  10. 前記各障害監視回路に対応して配置された複数の発光素子を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラに転送するときに、前記各障害監視回路に対応して配置された発光素子の点灯を制御するとともに、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力したときに、前記他の障害監視回路に対応して配置された発光素子の点灯を制御してなることを特徴とする請求項9に記載のストレージシステム。
  11. 前記各障害監視回路は、前記収集した障害情報を他の障害監視回路に転送する第1のパスと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力する第2のパスと、前記収集した障害情報を前記各コントローラに転送する第3のパスおよび前記第2のパスから入力した障害情報を前記各コントローラに転送する第4のパスに接続されてなることを特徴とする請求項9に記載のストレージシステム。
  12. 前記各障害監視回路は、前記収集した障害情報を他の障害監視回路に転送する第1のパスと、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力する第2のパスと、前記収集した障害情報を前記各コントローラに転送する第3のパスおよび前記第2のパスから入力した障害情報を前記各コントローラに転送する第4のパスに接続され、前記第1のパスから第4のパスは、前記各電源と前記コントローラとを結ぶ電源ラインとともに基板上に形成されてなることを特徴とする請求項9に記載のストレージシステム。
  13. 前記各電源に対応して、前記冗長化された複数の電源から電力の供給を受けて発光する複数の発光素子を備え、前記各障害監視回路に対応して配置された複数の発光素子を備え、前記各障害監視回路は、前記収集した障害情報を前記コントローラに転送するときに、前記各障害監視回路に対応して配置された発光素子の点灯を制御するとともに、前記他の障害監視回路で収集した障害情報を前記他の障害監視回路から入力したときに、前記他の障害監視回路に対応して配置された発光素子の点灯を制御してなることを特徴とする請求項9に記載のストレージシステム。
JP2006267218A 2006-09-29 2006-09-29 電源障害監視方法及びその装置 Pending JP2008090354A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006267218A JP2008090354A (ja) 2006-09-29 2006-09-29 電源障害監視方法及びその装置
US11/634,069 US7825799B2 (en) 2006-09-29 2006-12-06 Method and apparatus for monitoring power supply failure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006267218A JP2008090354A (ja) 2006-09-29 2006-09-29 電源障害監視方法及びその装置

Publications (1)

Publication Number Publication Date
JP2008090354A true JP2008090354A (ja) 2008-04-17

Family

ID=39262424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006267218A Pending JP2008090354A (ja) 2006-09-29 2006-09-29 電源障害監視方法及びその装置

Country Status (2)

Country Link
US (1) US7825799B2 (ja)
JP (1) JP2008090354A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008943A (ja) * 2010-06-28 2012-01-12 Ricoh Co Ltd 電子機器および画像形成装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414211B (zh) * 2007-10-18 2012-07-18 鸿富锦精密工业(深圳)有限公司 电源侦测电路
US20100332922A1 (en) * 2009-06-30 2010-12-30 Mediatek Inc. Method for managing device and solid state disk drive utilizing the same
JP4973703B2 (ja) * 2009-07-30 2012-07-11 富士通株式会社 故障検出方法及び監視装置
US9991703B1 (en) * 2012-03-31 2018-06-05 Western Digital Technologies, Inc. Dual wall input for network attached storage device
US20160147590A1 (en) * 2013-07-17 2016-05-26 Hewlett-Packard Development Company, L.P. Determine malfunction state of power supply module
CN103984620B (zh) * 2014-05-30 2017-07-14 浪潮电子信息产业股份有限公司 一种背板硬盘上电指示灯亮灯的电路动态实现方法
CN105094267A (zh) * 2015-07-29 2015-11-25 英业达科技有限公司 供电装置
US20190261530A1 (en) * 2018-02-22 2019-08-22 ASIM Holding Limited Sensor Mount Using Security Fins

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5254930A (en) * 1992-06-10 1993-10-19 Digital Equipment Corporation Fault detector for a plurality of batteries in battery backup systems
JP3079805B2 (ja) 1992-10-22 2000-08-21 富士通株式会社 障害監視方法
JPH077868A (ja) 1993-06-16 1995-01-10 Nec Corp 電源障害通知装置
JPH08140202A (ja) * 1994-11-07 1996-05-31 Hitachi Ltd 電気車用保護装置及び保護方法
JPH08140204A (ja) * 1994-11-08 1996-05-31 Matsushita Electric Ind Co Ltd 組電池の監視装置
DE19503917C2 (de) * 1995-02-07 1996-11-21 Mc Micro Compact Car Ag Elektronische Batterieüberwachungseinrichtung
US5611380A (en) * 1995-11-30 1997-03-18 Auto-Shade, L.L.C. Collapsible sunshade awning
JPH11355904A (ja) * 1998-06-08 1999-12-24 Honda Motor Co Ltd バッテリ状態検出装置およびバッテリ状態検出ユニット
DE19921675A1 (de) * 1999-05-11 2000-11-16 Hornung Hans Georg Methode zur Erfassung von Kenn- und Meßgrößen von Batteriesätzen und dergleichen
US6281684B1 (en) * 1999-12-27 2001-08-28 Plug Power Inc. Technique and apparatus to measure cell voltages of a fuel cell stack using different ground references
JP4500121B2 (ja) * 2004-07-14 2010-07-14 株式会社ルネサステクノロジ 電池電圧監視システム
US7521896B2 (en) * 2004-07-20 2009-04-21 Panasonic Ev Energy Co., Ltd. Abnormal voltage detector apparatus for detecting voltage abnormality in assembled battery

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008943A (ja) * 2010-06-28 2012-01-12 Ricoh Co Ltd 電子機器および画像形成装置
US8922383B2 (en) 2010-06-28 2014-12-30 Ricoh Company, Limited Electronic equipment and image forming apparatus

Also Published As

Publication number Publication date
US20080082849A1 (en) 2008-04-03
US7825799B2 (en) 2010-11-02

Similar Documents

Publication Publication Date Title
JP2008090354A (ja) 電源障害監視方法及びその装置
JP4982304B2 (ja) 電源障害の発生を把握するストレージシステム
JP5115272B2 (ja) 多数の電子機器をラック搭載した電子機器システム及び電子機器システムの電子機器の特定処理方法。
US7861110B2 (en) System, method, and adapter for creating fault-tolerant communication busses from standard components
JP2007141185A (ja) 記憶制御装置及び記憶制御装置のエラー情報管理方法
JP2007282407A (ja) 記憶装置の駆動方法およびこの記憶装置を備えたディスクサブシステム
EP3244319B1 (en) Flexible nvme drive management solution
CN109857614A (zh) 一种机架服务器的容灾装置和方法
JP2006072717A (ja) ディスクサブシステム
CN107870846B (zh) 故障元件指示方法、设备和系统
JP2016100843A (ja) 中継装置
JP2006139634A (ja) 設備管理装置、通信路診断装置及び設備管理方法
CN111628944B (zh) 交换机及交换机系统
US7627774B2 (en) Redundant manager modules to perform management tasks with respect to an interconnect structure and power supplies
US7464257B2 (en) Mis-configuration detection methods and devices for blade systems
TW202008165A (zh) 備援方法及備援系統
JP2002136000A (ja) 無停電電源システム
TWI546682B (zh) 藉助於混和管理路徑來管理一儲存系統之方法與裝置
JP6762032B2 (ja) 受電装置および制御方法
TW201344403A (zh) 電源管理方法
US8639967B2 (en) Controlling apparatus, method for controlling apparatus and information processing apparatus
US10454757B2 (en) Control apparatus, storage apparatus, and non-transitory computer-readable recording medium having stored therein control program
US9858135B2 (en) Method and associated apparatus for managing a storage system
JP6361202B2 (ja) 情報処理装置、診断方法、及び、プログラム
JP4779948B2 (ja) サーバシステム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090220