JP2005025325A - 冗長装置交換機構 - Google Patents

冗長装置交換機構 Download PDF

Info

Publication number
JP2005025325A
JP2005025325A JP2003187912A JP2003187912A JP2005025325A JP 2005025325 A JP2005025325 A JP 2005025325A JP 2003187912 A JP2003187912 A JP 2003187912A JP 2003187912 A JP2003187912 A JP 2003187912A JP 2005025325 A JP2005025325 A JP 2005025325A
Authority
JP
Japan
Prior art keywords
redundant
lock
unlocked
hdd
devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003187912A
Other languages
English (en)
Inventor
Jinichi Nakamura
仁一 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2003187912A priority Critical patent/JP2005025325A/ja
Publication of JP2005025325A publication Critical patent/JP2005025325A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】耐障害性が求められる装置や部品は、2重3重に冗長化して信頼性を高めているが、交換時での安全確保の機構は十分ではなかった。例えば2重化されている装置の故障装置を交換しようとして誤って正常の装置を抜いてしまえば復旧することが不能となってしまう場合もある。
【解決手段】2つ以上の冗長機能を持つ機構において、排他的に安全に交換するためのロックする機構で構成する。夫々の装置に付けるロック機構31について、装置のロック部分34と、他の装置のロック機構へ開閉状態を伝える状態信号33と、装置のロック部分34の開閉を制御する制御信号32により、ある装置のロックを解除すると、再びロックするまで、その装置以外のいかなる装置のロックは解除されない。冗長化装置の信頼性を障害発生時の対処時においても確保することができるようにする。
【選択図】 図3

Description

【0001】
【発明の属する技術分野】
信頼性と耐障害性能が要求される情報処理システムにおいて、記憶装置や電源や冷却機構など、障害が発生するとシステムの稼動を停止させてしまうような重要装置や部品を冗長化させることで、万一の障害発生に備え、かつ装置の稼動を停止させることなく障害から復旧させることができるような装置やシステムに関する技術分野に属する。
【0002】
【従来の技術】
重要な装置や耐障害性が求められる装置や部品は、万一の障害や故障に備え2重3重に装置を冗長化して、単独装置の故障であれば、装置全体の稼動が継続できるようにして信頼性を高めている。例えばハードディスク(以下HDD)は、複数台を冗長させることでディスクアレイにして、HDDの故障や障害にも稼動を停止させることがないようにする技術(以下RAID)は広く普及している。RAIDの構成や方式も様々な考案がなされている。HDDの交換においてもRAID制御装置から、故障したHDDのみ交換できるようにかんがえられたものもある(例えば、特許文献1参照。)。しかしながらそうしたものはHDDにインテリジェンスを持たせなければならない。
【0003】
【特許文献1】
特開平07−219715(第1−3頁、第1図)
【0004】
【発明が解決しようとする課題】
冗長化することで装置の信頼性を確保することはできていても、障害発生時の対処時において、ヒューマンエラーや不測の事態に対する信頼性確保の機構は十分ではなかった。例えば2重化されている装置の故障装置を交換しようとして誤って正常の装置を抜いてしまえば復旧することが不能となってしまう場合もある。HDD等の記憶装置を3台でディスクアレイとしたRAID5の方式の場合も、故障していない装置を交換している場合に、正常の装置を1つ抜いてしまえば、その時点でRAID5の機能が保てなくなりデータが失われるという課題がある。
【0005】
【課題を解決するための手段】
2つ以上の冗長機能を持つ機構において、装置のロック機構を安全確実に機能するようにする。そのために各装置のロック機構は、自らのロックを他の装置へ通知し、他の装置のロック機構の状態を認識できる機構を持たせる。ロック解除は排他的に許可される仕様とする。
【0006】
【発明の実施の形態】
以下に本発明の一実施例を示す。図1では最も一般化した冗長化装置の構成例として3台のHDDによるRAID5の構成で説明する。RAID5はデータとパリティを各HDDに分散させて扱うもので、仮に1台のHDDが故障しても、パリティからデータを計算して、RAID5システムを停止させることなく稼動継続することができる技術である。ミラーリングであるRAID1などとは異なり、複数台のHDDからRAID5を構成できるため総記憶容量と耐障害の面で有利なRAID方式である。1台のHDDが故障しても、該当HDDを交換することで、装置を停止させることなく正常状態へ復旧できる。しかしながら2台目も故障した場合は、RAID5で記録されていたデータの旧は不可能となる。
【0007】
各HDDは脱着可能な個別筐体に収められて、装置全体の筐体に格納される。説明を明確にするため、以下では各装置を収めた筐体をそのまま各HDDと記載し、筐体と記載した場合はRAID5システム全体の筐体を示すこととする。各HDDのロック機構は、筐体側にあっても、各HDD側にあっても良いが、筐体側にあったほうが製造しやすく部品コストを抑えることができるため通常は筐体側にある。図1でも筐体側にあることとして説明する。なお、RAID5システム全体の電源スイッチや、電源ユニット、各HDDの通電したままの挿抜を可能とする回路やバックプレーン基板などはわかりやすくするために図1から省略している。また、RAID5の筐体が独立していても、コンピュータ全体の筐体内部に組み込まれていても本発明の効果としては違いがない。
【0008】
RAID5を構成している筐体11に、警告音を発生するスピーカ12が組み込まれている。これはRAID5の制御装置がいずれかのHDDに異常があった場合に、警告を発するものである。しかしながら実際の運用にあたっては、音を出すか出さないかは運用管理する側の判断で設定されるべきものである。また筐体11の前面の見やすいところにLCDなどを用いた表示装置13がある。これはシステムの稼動状況のモニタとして、情報を表示している。異常がある場合はLCDであれば、表示色を赤系統の色に変えたり、バックライトを最大輝度に上げるなどして異常状態を警告表現をする。もちろん表示装置の配置や形状などは、機器の構成や環境、設置などの条件により、適切な判断をすればよい。
【0009】
図1ではHDDを3台でRAID5を構成している。HDDが内蔵されたHDD1 14とLEDやLCDによる簡易表示装置15、ロック機構16、HDDが内蔵されたHDD2 17とLEDやLCDによる簡易表示装置18、ロック機構19、HDDが内蔵されたHDD3 1AとLEDやLCDによる簡易表示装置1B、ロック機構1Cで構成されている。なお、各ロック機構のロックと解除の方式は、鍵であっても、レバーであっても、あるいは他の方式であってもよく、施錠と開錠ができるものであればよい。各HDDはシステムの電源が入って稼動中であっても挿抜が可能である。RAID5のシステム制御装置はCPUボードであってRAID5システム筐体11に内蔵されていても、あるいは接続先のホストコンピュータによりソフトウェアで処理されていても良いが、HDDの異常を検出すると、スピーカ12と表示装置13により、警告状態となる。場合によっては操作者の操作画面にメッセージを表示したり、ネットワーク接続によりメールを送信したり、電話へボイスメッセージを発信したりすることもおこなわれている。同時に障害を検出されている該当HDDがいずれであるかわかりやすいように、各HDDの側に組み込まれている簡易表示装置が発色または点滅して作業者へ通知するようになっている。これは誤って正常なHDDを抜いてしまい、障害とヒューマンエラーにより最悪の事態とならないようにするために必須である。
【0010】
異常となった該当HDDは、早急に正常なHDDと交換し、RAIDの再構築と称する作業により、障害発生前と同じような正常稼動状態としなければならない。そのためには該当HDDを交換するためロックを解除する。仮にHDD1 14が異常であったとすると、HDD1 14のロック16を解除すると、HDD2 17のロック19およびHDD3 1Aのロック1Cに状態が通知され、ロック状態が強制的に維持され、意図的にロックを解除しようとしてもできなくなる。再びHDD1 14のロック16をロックすると、HDD2 17のロック19およびHDD3 1Aのロック1Cに状態が通知され、その後いずれかのHDDに障害が発生した場合に、該当HDDのロックを解除することができる。このようにロックを解除できるのは排他的に一つのHDDだけである。
しかしRAID5装置全体11の設置導入時や、電源を切って停止している時などは、上記制御をしなければならない必然性はないため、任意のHDDを任意の数だけロック解除してもよい。
【0011】
また、本発明の交換機構を発展させ、各HDDの異常検出とロックの制御を管理するアルゴリズムにおいて、通常稼動時は全装置のロックを解除不可とし、異常を検出すると、該当HDDのロックのみを解除可能とし、ヒューマンエラーや不測の事態でも、正常なHDDのロックが外され引き抜かれることがないようにすることも可能である。これはフェイルセーフを最も厳重に適用する場合である。
【0012】
図2は本発明の冗長化した装置のロック機構を示す論理図である。一般化するためにHDDのRAIDなどのように限定せず、n台の装置により冗長化装置システムが構成されている場合を例としている。図での記号は、「○」は該当番号の装置のロックが解除されている状態を示す。「×」は該当番号の装置がロックされている状態を示す。装置に電源が投入されシステム全体が通常状態で稼動している状態では、各装置ともロックされている。また設置導入時やメンテナンス時、あるいはシステムを停止している場合には、電源も投入されておらず、各装置のロックは全て解除されている。この状態でもロックを個別排他的にしても良いが、作業性が必ずしもよいとはいえず、安全を確保できる条件さえ定義できれば、各装置全てロック解除の状態を用意しておくことは問題がない。障害対応時という状態は、いずれかの装置が故障したり、障害が見込まれる場合など、装置システム全体は稼動継続させながら、個別の装置を交換などする場合である。この状態では該当装置以外のロックは解除してはならず、作業終了後に再度該当装置をロックすると、前述の通常状態となり、全ての装置にロックがかかる。
【0013】
この論理図から、実際の冗長化装置システムのロック機構を構成すれば良い。構成の手段も、機械的にバネや歯車や板金により構成しても良く、電気的にロジック素子と半導体スイッチやリレーで構成しても良い。あるいは別の構成手段であってもかまわない。
【0014】
図3は本発明のロック機構の例である。ロック機構31は実際に鍵の施錠と開錠にあたる部品34と、入力信号である制御信号32と、出力信号である状態信号33より構成されている。制御信号32は、他の装置からの状態信号を反映している信号だが、冗長化装置の制御管理装置から直接入力する場合もある。信号レベルがハイの状態、すならち電圧レベルが回路設計上のスレッシホルド電圧より高い状態(以下「H」)が、ロック開放不可を表している。したがって「H」であればロックを開放しようとしてもできない。信号レベルがローの状態、すならち電圧レベルが回路設計上のスレッシホルド電圧より低い状態(以下「L」)が、ロック開放可能を表している。「L」であればロックを開放しようとすればできる。部品34は回転機構の部品で、ロックする場合は突起部分が右側水平3時方向となり、図3には記載していないがフレーム側の凹部分にはまることでロックがかかる。その際、電源電圧に接続されている導電性接点に接触し、部品34はロック状態の時に「H」の状態をあらわすこととなる。ロックを開放する場合は突起部分が下側6時方向となり、ロックが外れて開放可能となる。その際、グランド信号に接続されている導電性接点に接触し、部品34はロック開放の時に「L」の状態をあらわすこととなる。部品34の状態は状態信号33としてロック機構31から出力される。なお、図3では3時方向と6時方向の間でロックの施錠、開錠を表したが、別の位置でもよいし、水平方向や垂直方向に移動するスライダのようなものでもよい。施錠、開錠を実現する機構部品と、制御する入力信号と、状態を示す出力信号で構成されるということであればよい。
【0015】
図4は本発明のロック機構により冗長化した装置を構成した例である。n台の装置にそれぞれロック機構がついているが、図4では装置1、装置2と装置nの3台のみ記載している。装置1のロック機構1 41には、入力信号4Aと出力信号4Bがあるが、各装置の出力信号と、リセット信号等を反映した信号48のNAND素子47を入力とするAND素子42の出力が、入力信号4Aとなっている。以下同様に装置2のロック機構2 43には、入力信号4Cと出力信号4D、装置nのロック機構n 45には、入力信号4Eと出力信号4Fがある。制御信号4A、4C、4Eの状態が「H」であればロックを開放することができないことを示し、「L」であればロックを開放することができることを示している。また出力である状態信号4B、4D、4Fは、「H」であればロックされている状態、「L」であればロックが開放されている状態を示している。各装置の状態信号はNAND素子47の入力となり、その出力は制御信号のAND素子42、44、46の入力となっている。さらに電源が入っていない状態やリセットがかかっている状態、または初期の設置導入時にも、制御信号を「L」としてNAND素子47の入力し、ロック開放可能となるように構成している。
【0016】
この回路構成の動作としては、任意の装置のロックをすると、残り他の装置ではロックの開放ができなくなるように、排他的にロック解除を実現するというものである。
【0017】
【発明の効果】
冗長化することで装置の信頼性を確保し、障害発生時の対処時においても、例えヒューマンエラーや不測の事態が生じたとしてもその信頼性を確実に確保することができるようにする。
【図面の簡単な説明】
【図1】本発明の冗長化した装置の構成例。
【図2】本発明の冗長化した装置のロック機構を示す論理図。
【図3】本発明のロック機構の例。
【図4】本発明のロック機構による装置の構成例。
【符号の説明】
11:本発明の冗長化した装置の例でRAID5のHDD装置
12:異常が検出された場合に警告音を発するスピーカ
13:装置の稼動状況を表示するモニタ用の表示装置
14:HDD1
15:HDD1用の簡易表示装置
16:HDD1用のロック機構
17:HDD2
18:HDD2用の簡易表示装置
19:HDD2用のロック機構
1A:HDD3
1B:HDD3用の簡易表示装置
1C:HDD3用のロック機構
31:ロック機構部分
32:ロック機構への制御信号
33:ロック機構の状態を示す信号
34:実際にロックの施錠、開錠の役割をする部品
35:ロック状態の時に「H」の状態となるように電源電圧に接続されている導電性接点
36:ロック開放状態の時に「L」の状態となるようにグランド信号に接続されている導電性接点
41:装置1のロック機構部分
42:AND素子
43:装置2のロック機構部分
44:AND素子
45:装置nのロック機構部分
46:AND素子
47:NAND素子
48:システムのリセットや接地時に「L」となる制御信号
4A:装置1のロック機構部分に入力される制御信号
4B:装置1のロック機構部分から出力される状態信号
4C:装置2のロック機構部分に入力される制御信号
4D:装置2のロック機構部分から出力される状態信号
4E:装置nのロック機構部分に入力される制御信号
4F:装置nのロック機構部分から出力される状態信号

Claims (4)

  1. 信頼性を確保するために重要装置や部品を冗長化させたシステムにおいて、障害発生時に、障害が発生した該当装置を切り離す機構と、冗長化している装置により稼動を継続させる機構と、障害発生装置のみを交換できる機構と、音や発光やメッセージの表示する機構を有する冗長装置交換機構。
  2. 上記冗長化した装置において、脱着や開閉ができないような鍵(以下ロック)を付けてある冗長装置交換機構。
  3. 複数ある冗長化装置のうち、ロックを解除できるのは排他的に一つだけである冗長化装置の交換機構。すなわち、任意の装置のロックを解除すると、他の装置のロックが解除されなくなるように状態通知機能を有し、ロックを解除した装置を障害復旧後に再びロックすると、他の冗長化装置に通知されされ、再び任意の装置のロックを解除することができる冗長装置交換機構。
  4. 複数ある冗長化装置をもつシステムで、各装置の異常検出とロックの制御を管理するアルゴリズムにより、通常稼動時は全装置のロックを解除不可とし、異常を検出すると、該当装置のロックのみを解除可能とする冗長化装置交換機構。
JP2003187912A 2003-06-30 2003-06-30 冗長装置交換機構 Withdrawn JP2005025325A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003187912A JP2005025325A (ja) 2003-06-30 2003-06-30 冗長装置交換機構

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003187912A JP2005025325A (ja) 2003-06-30 2003-06-30 冗長装置交換機構

Publications (1)

Publication Number Publication Date
JP2005025325A true JP2005025325A (ja) 2005-01-27

Family

ID=34186606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003187912A Withdrawn JP2005025325A (ja) 2003-06-30 2003-06-30 冗長装置交換機構

Country Status (1)

Country Link
JP (1) JP2005025325A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015177722A1 (en) * 2014-05-23 2015-11-26 International Business Machines Corporation Locking power supplies

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015177722A1 (en) * 2014-05-23 2015-11-26 International Business Machines Corporation Locking power supplies
US20150338891A1 (en) * 2014-05-23 2015-11-26 International Business Machines Corporation Locking power supplies
GB2541333A (en) * 2014-05-23 2017-02-15 Ibm Locking power supplies
CN106415429A (zh) * 2014-05-23 2017-02-15 国际商业机器公司 锁定电源
JP2017519283A (ja) * 2014-05-23 2017-07-13 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 電子機械の1つまたは複数のコンポーネントを管理するための方法および装置ならびにコンピュータ・プログラム
US9760133B2 (en) * 2014-05-23 2017-09-12 International Business Machines Corporation Locking power supplies
CN106415429B (zh) * 2014-05-23 2019-08-23 国际商业机器公司 用于管理多个电源的方法和装置
GB2541333B (en) * 2014-05-23 2019-10-09 Ibm Locking power supplies
DE112015001903B4 (de) * 2014-05-23 2019-11-28 International Business Machines Corporation Verriegeln von Stromversorgungseinheiten

Similar Documents

Publication Publication Date Title
US5848230A (en) Continuously available computer memory systems
US5781767A (en) Package blocking method for a storage system having a bus common to a plurality of kinds of groups of packages
US5664089A (en) Multiple power domain power loss detection and interface disable
JP5052193B2 (ja) 記憶制御装置および記憶制御方法
CN100517250C (zh) 控制raid阵列重建的装置和方法
US20110043323A1 (en) Fault monitoring circuit, semiconductor integrated circuit, and faulty part locating method
TW454128B (en) Shared disk type multiple system
US6839866B2 (en) System and method for the use of reset logic in high availability systems
US20090006902A1 (en) Methods, systems, and computer program products for reporting fru failures in storage device enclosures
JP5966181B2 (ja) 二重化装置および電源停止方法
CN112650620B (zh) 一种存在主从关系的双机冷备份自主冗余方法
JP2005025325A (ja) 冗長装置交換機構
CN101699389B (zh) 磁盘热拔除的处理方法及装置
US6801973B2 (en) Hot swap circuit module
JPH09331170A (ja) 活栓挿抜の誤操作防止方法及び電子装置
JP2978622B2 (ja) 無停止型コンピュータ
US20150058669A1 (en) Method and Apparatus for Error Management of an Integrated Circuit System
JP3661665B2 (ja) パッケージの閉塞方法
JP3376853B2 (ja) パッケージの閉塞方法
US20180041381A1 (en) Control apparatus, storage apparatus, and non-transitory computer-readable recording medium having stored therein control program
JP2834083B2 (ja) データディスクアレイ装置
JP2011028481A (ja) フォールトトレラントサーバ、プロセッサ切り替え方法およびプロセッサ切り替えプログラム
JPH11238031A (ja) データ処理装置
KR101625637B1 (ko) 메모리 사중화를 통한 데이터 복구 장애 방지 시스템
US7962781B2 (en) Control method for information storage apparatus, information storage apparatus and computer readable information recording medium

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060905