JP4761978B2 - ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム - Google Patents

ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム Download PDF

Info

Publication number
JP4761978B2
JP4761978B2 JP2006013251A JP2006013251A JP4761978B2 JP 4761978 B2 JP4761978 B2 JP 4761978B2 JP 2006013251 A JP2006013251 A JP 2006013251A JP 2006013251 A JP2006013251 A JP 2006013251A JP 4761978 B2 JP4761978 B2 JP 4761978B2
Authority
JP
Japan
Prior art keywords
hard disk
operating
power
failure
spare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006013251A
Other languages
English (en)
Other versions
JP2007193711A (ja
Inventor
義明 伊達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chugoku Electric Power Co Inc
Original Assignee
Chugoku Electric Power Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chugoku Electric Power Co Inc filed Critical Chugoku Electric Power Co Inc
Priority to JP2006013251A priority Critical patent/JP4761978B2/ja
Publication of JP2007193711A publication Critical patent/JP2007193711A/ja
Application granted granted Critical
Publication of JP4761978B2 publication Critical patent/JP4761978B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)

Description

本発明は、複数のハードディスクを冗長化して動作させ、管理しているハードディスク冗長管理装置、方法、およびプログラムに関し、特に稼動中のハードディスクの故障を検出した際には電源が切断状態である予備ディスクの電源を投入し、稼動中のハードディスクの内容を複製することを可能とするハードディスク冗長管理装置、方法、プログラムおよび監視制御システムに関する。
従来、ミッションクリティカルな業務においては、業務にて使用するさまざまは情報を例えばデータベースとして複数のハードディスクに同じ内容を書き込むことで情報を保存するためのリソースであるハードディスクの故障に備えている。この場合は少なくとも2台以上ハードディスクを稼動状態とし、1台をマスタまたは動作中とし、他をスレーブまたは待機中として使用して同時に書き込んだり、もしくは予め定めた時刻などにマスタからスレーブへのデータベースの複製(レプリケーション)を行ったりして対応している。ハードディスクの故障した際には保守の担当者などに連絡が入り、連絡を受けた担当者などが現地に赴きハードディスクの交換と新たなハードディスクへの内容の複製などを行っていた。
また、これまで複数のハードディスクを冗長化して管理する技術として、例えばRAID1もしくはRAID5(Redundant Arrays of Inexpensive Disks 5)などのハードディスクのディスクの冗長化技術も存在する。また、特許文献1では、データを複数のハードディスクを冗長化して保存するに際して、冗長データの生成及び格納に関し互いに論理的に関連付けられている冗長のハードディスク上に保存し、ハードディスクの故障発生を検出した際には、上記冗長のハードディスク上にあるデータ及び冗長データを用いて故障が発生した当該ハードディスク上のデータを再構成し予備のハードディスクへバックアップ処理を開始し、一方、アクセス要求がその障害ハードディスク上に配置されているデータに対してあった場合は、冗長データを用いて当該データを再構成することでそのアクセス要求に応答する方法が提案されている。
また特許文献2は、特許文献1において予備のハードディスクの効率的な使用が出来なくなることに注目し、故障発生の際にバックアップ処理を自動的に開始する装置において、ユーザが相対的に重要度が高いと判断するデータの格納された冗長の部分に対し予備のハードディスクを優先的に割当てるということと、与えられた予備ディスクドライブを効率良く使用することの両立を図る技術の提案を行っている。
特3269552号公報 特3213799号公報
しかし、これまでの技術では電源が切断状態にあるハードディスクの管理は行っていなかった。また、上記特許文献2で提案されている技術では、データは複数のハードディスクに分散して冗長化されて保存されていること、および、予備のハードディスクは電源投入状態であることが記載されており、ハードディスクに障害が発生した際には、上記複数のハードディスクに分散して冗長化されたデータを再構築する作業が必要となるので作業が複雑であること、データの再構築を行っていた時にそのハードディスクにアクセスが有った場合はデータの再構築作業は延伸されてしまうこと、また予備のハードディスクも電源投入状態のままであるので電力を消費することおよびハードディスクの実質の稼動可能時間も短くなってしまうこと、さらに通電中であることによる故障の発生も考えられること、などの懸念が有る。
特許文献1では、冗長用の予備のハードディスクとして使用しないその他のハードディスクを電源切断して設置しておく手段または方法についての記載はあるが、故障発生時に予備のハードディスクの電源投入を行い冗長用のハードディスクとして使用する方法についての記載はない。
本発明は、上述のかかる事情に鑑みてなされたものであり、複数のハードディスクを収容し冗長化処理を行う装置において、予備のハードディスクは電源が切断状態として接続され、稼動中の故障を検出した際に予備のハードディスクの電源を自動的に投入し、容易に稼動中のハードディスクの内容を複製し、故障が発生したハードディスクの電源を切断するハードディスク冗長管理装置、方法、プログラム、および監視制御システムを提供することを目的とする。
本発明によれば、
複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを管理するハードディスク冗長管理装置であって、
稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出手段と、
前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時は、電源切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動手段と、
前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するHD内容複製手段と、
を備えたことを特徴とするハードディスク冗長管理装置が提供される。
本発明によれば、稼動中のハードディスクの故障を検出した際に、電源が切断状態にある予備のハードディスクの電源を自動的に投入し、稼動中のハードディスクの内容を自動的に複製することができるので、故障発生の際に担当者が現地に赴くことなく予備のハードディスクを稼動できる状態にすることができるので運用コストの削減を行うことができる。また、本発明によれば、ハードディスクの故障が発生した際にも2台以上の稼動中のハードディスクが存在する場合に、予備のハードディスクに内容を複製する際に、稼動中の1台を稼動中状態から切り離してハードディスクへの書き込みが無い状態とした上で内容の複製に使用することができ、複製作業を素早く行い正常状態に遷移させることができる。
好ましくは、前記稼動中のハードディスクの故障発生を検出した時に、故障が検出されたハードディスクの電源を切断するHD電源切断手段と、を備えるように構成する。
本発明によれば、故障が発生したハードディスクの電源を自動的に切断することができるので、省エネルギー対策を現地に赴くことなく行うことができ、更に電源が投入されたままであることによる2次的な故障もしくは災害の発生を事前に防ぐことができる。
さらに好ましくは、前記故障発生監視検出手段は、故障を検出した際には、故障が発生したことを予め定めた通知手段を用いて、予め定めた宛先に通知するように構成するもの良い。
本発明によれば、ハードディスクに故障が発生したことを即時に予め定めた宛先に通知することができるので、保守管理者などは直ちに故障を知ることができ、素早い対応を行うことができる。
また、前記故障が発生したことを通知する予め定めた通知手段は、電子メール、電話、FAX、装置に直接接続されている警報装置の少なくとも1つであるように構成するのも好ましい。
本発明によれば、ハードディスクの故障内容を、電子メール/電話/FAXなどで入手することができるので、保守管理者などは故障発生の詳細な内容も知ることができ、素早く対応でき、行き届いたサービスを提供することができる。
さらに、稼動中のハードディスクのI/Oエラー発生回数またはハードディスクのアクセス回数の少なくとも一方を監視し、どちらかが予め定めた閾値を超過した場合は故障発生を検出したとみなす稼動状況監視手段を備えるように構成するのも好ましい。
本発明によれば、ハードディスクのI/Oエラーの発生回数やハードディスクのアクセス回数などを監視し、ハードディスク製造業者が定めた値もしくは本装置を使用する使用者が予め定めた閾値を超過した場合は故障が発生したと検出することができるので、ハードディスクの取替え時期を正確に知ることができ、効率的にハードディスクを使用することができる。
本発明のハードディスク冗長管理装置において、前記HD内容複製手段は、前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、1台しか存在していない場合に、当該正常稼動中のハードディスクの稼働状況を示す値を計測し、当該正常稼動中のハードディスクの稼働状況を示す値が予め定めた値よりも低い場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することができる。
好ましくは、前記HD内容複製手段は、稼動中のハードディスクの内容から新たに電源が投入されたハードディスクへのコピーを、前記計測したハードディスクのアクセス回数が予め定めた値より小さい時に行うように構成する。
本発明によれば、稼動中のハードディスクの稼動状況に従って内容の複製の行い方を変更することができるので、運用中の装置の影響が少ない時に内容の複製を行うことができる。
さらにまた、前記稼動状況監視手段は、前記収容している複数のハードディスクの電源の入り切り情報、前記複数のドライブが正ドライブ/副ドライブ/故障中/予備ドライブのいずれとして動作しているのかを示す情報、I/Oエラー発生回数、ハードディスクのアクセス回数、総稼働時間などの稼動状況に関する情報の少なくとも一つを定期的にもしくは要求があった時に情報収集し、保存するように構成するのも好ましい。
本発明によれば、稼動中および予備として接続されているハードディスクの状態を取得して予め定めた、例えば保守管理者などに取得し保存することができるので、例えば保守管理者などが状況を入手したい時に直ちに装置の情報を与えることができる。
さらに、前記収集した複数のハードディスクの稼動状況の少なくとも一つを予め定めた日時、定期的に、もしくは要求がある時に、予め定めた宛先に通知する稼動状況通知手段を備えるように構成するのも好ましい。
本発明によれば、稼動中および予備として接続されているハードディスクの状態を取得して予め定めた、例えば保守管理者などに取得した状態を通知することができるので、例えば、保守管理者はハードディスクの状況を随時取得することができ、ハードディスクの取替え時期の推定を行うことができるなど予定を立てることができる。
さらに好ましくは、前記外部に通知する方法として、電子メール、FAX、もしくは、特定のサービスプロトコルを使用して外部に対し閲覧情報として提供の少なくとも一を行うように構成するのも好ましい。
本発明によれば、稼動状況の通知として、電子メール/FAX/特定のサービスプロトコルを使用することができるので、さまざまなニーズに対応することができる。
より好ましくは、前記外部に通知する場合に使用する特定のサービスプロトコルはHTTPであり、閲覧情報としてWEB閲覧画面を提供するように構成する。
本発明によれば、WEB画面を用いて稼動状況を通知することができるのでインターネットに接続できる環境であれば、いつでもどこでも稼動状況を入手することができる。
また、前記故障発生監視検出手段は、予め定めた日時に電源が切断状態にある予備のハードディスクの電源を投入し、予め定めた内容もしくは稼動中の最新の内容を書き込むことでハードディスクの点検を行うように構成するのも好ましい。
本発明によれば、予備のハードディスクのチェックを必要な時に行うことができるので、故障を未然に発見することが可能となる。
本発明によれば、
複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを備えた監視制御システムであって、
稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出手段と、
前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時は、電源切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動手段と、
前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するHD内容複製手段と、
を備えたことを特徴とする監視制御システムが提供される。
本発明によれば、冗長化されたハードディスクと、電源切断状態の予備のハードディスクとを用いてハードディスクの故障耐性の高い監視制御システムとして電力システムの監視を行うことができるので、信頼性が要求される電力の監視制御システムとして機能することができる。
本発明によれば、
複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを管理するハードディスクの冗長管理方法であって、
稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出ステップと、
前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時は、電源切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動ステップと、
前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を複製するHD内容複製ステップと、
を含むことを特徴とするハードディスク冗長管理方法が提供される。
本発明のハードディスク冗長管理方法において、前記HD内容複製ステップは、前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、1台しか存在していない場合に、当該正常稼動中のハードディスクの稼働状況を示す値を計測し、当該正常稼動中のハードディスクの稼働状況を示す値が予め定めた値よりも低い場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するステップを含むことができる。
また、本発明のハードディスク冗長管理方法において、前記正常稼動中のハードディスクの稼働状況を示す値は、当該ハードディスクへのアクセス回数とすることができ、前記HD内容複製ステップの前記正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するステップにおいて、前記正常稼動中のハードディスクへのアクセス回数が予め定めた値より小さい場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することができる。
また、本発明のハードディスク冗長管理方法において、前記稼動中のハードディスクの故障発生を検出した時に、故障が検出されたハードディスクの電源を切断するHD電源切断ステップを含むことができ、前記故障発生監視検出ステップは、稼動中のハードディスクのI/Oエラー発生回数またはハードディスクのアクセス回数の少なくとも一方を監視し、どちらかが予め定めた閾値を超過した場合は故障発生を検出したとみなすステップを含むことができる。
また、本発明のハードディスク冗長管理方法は、前記稼動中のハードディスクの故障発生を検出した時に、故障が検出されたハードディスクの電源を切断するHD電源切断ステップをさらに含むことができる。
本発明によれば、
複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを管理するハードディスク冗長管理装置上で動作するプログラムであって、
コンピュータを、
稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出手段
前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時に、電源が切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動手段
前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を複製するHD内容複製手段
として機能させることを特徴とするハードディスク冗長管理プログラムが提供される。
本発明によれば、稼動中の複数のハードディスクを監視し、故障の発生を検出した場合は、予備のハードディスクの電源を自動的に投入し、稼動中のハードディスクの内容を予備のハードディスクに複製し、故障を発生したハードディスクの電源を自動的に切断できるので、例えば5台の予備のハードディスクを用意して電源を投入しないで設置するだけで故障発生時に直ちに現地に赴く必要が無く5度の障害発生までは猶予をもって対応することが可能となり、さらに予備のハードディスクを電源切断状態で運用することができるので、エネルギーの消費を抑えることができ、低騒音で且つハードディスクは長寿命となり運用コストも削減できる。
以下、本発明の実施の形態を説明する。図1に、本発明の第1の実施の形態に係わるハードディスク冗長管理装置1の機能ブロック図を示す。
図1において、ハードディスク冗長管理装置1は、LAN(Local Area Network)5を介してネットワークとつながっている。
ここで、ハードディスク冗長管理装置1は、ハードディスクを記憶媒体として、安全または処理の高速化などのために冗長化して運営を行っている会社、またはサービス事業者などにより管理、運営される。
ハードディスク冗長管理装置1は、LAN(Local Area Network)5を介してデータの送受信を行うための送受信部12、送受信部12から受け取ったデータの処理、およびその他のさまざまな処理を行う中央演算処理部13、データを記憶するための記憶部14、および、中央演算処理部13との間でデータの入出力を行う入力部15と表示部16、収容する複数のハードディスクの電源の入り切りの切り替えを行う電源投入/切断切替回路17、ハードディスクの制御およびデータの送受信を行うハードディスクインタフェース18、本装置に直付けすることのできる警報装置とのインタフェース回路であるシリアル回路19から構成されている。入力部15と表示部16はマンマシンインタフェースの機能を有する部分である。送受信部12は通信プロトコルの機能を有する部分である。
本実施の形態におけるハードディスク冗長管理装置1は、入力部15および表示部16を備えているが、本装置への入出力はシリアル回線や、USB(Universal Serial Device)もしくはLAN5を経由して外部から行われるのみであっても良い。
さらに、中央演算処理部13は、送受信部12との間でデータの受け渡しを行う送受信処理手段(機能)131、入力部15あるいは表示部16とデータの受け渡しを行う入出力処理手段(機能)132、入出力処理手段(機能)132または送受信処理手段131を介して受信した利用者情報、故障通知宛先情報などの情報を登録したり、情報収集したりする情報登録収集手段(機能)133、複数のハードディスクの故障発生を監視し検出する機能を有する故障発生監視検出手段(機能)134、電源切断状態にある予備ハードディスクの電源を投入する機能を有するHD電源投入手段(機能)135、電源投入した予備のハードディスクに稼動中のハードディスクの内容を複製する機能を有するHD内容複製手段(機能)136、故障が発生したハードディスクの電源を切断する機能を有するHD電源切断手段(機能)137から構成される。
また、記憶部14は、本装置の管理を行うことのできる利用者の住所、氏名、電話番号、電子メールアドレスなどの情報を保存する利用者データベース(DB)151、ハードディスクの故障発生を通知する管理者などの宛先を含む故障通知宛先データベース(DB)152、ハードディスクの故障を検出するためのハードディスクに関する閾値情報を含む閾値データベース(DB)153から構成されている。
なお、本実施の形態において、利用者DB151は、利用できるユーザIDとパスワードのみを保存する簡易的なファイルであっても良い。また、故障通知宛先DB152も、メールアドレスが複数登録されているのみというファイル構成であっても良い。
図2は、本ハードディスク冗長管理装置1にログインして本システムの管理作業などを行うことができる利用者の情報を保存する利用者DB151のデータ構成例を示す。利用者DB151には、「利用者名」、「住所」、携帯電話を含む「電話番号」、「電子メールアドレス」、本ハードディスク冗長管理装置1にログインするのに必要な「利用者ID」、「パスワード」などが保存されている。
図3は、ハードディスクの故障発生を検出した時に通知する宛先を保存する故障通知宛先DB152のデータ構成例を示す。故障通知宛先DB152は、まず故障した時に通知する通知先が登録されている。本実施の形態では、「警報装置」、「システム管理者」、「○○部長」、「△△課長」が通知先として登録されている。例えば警報装置への通知は不要であった場合はこの本故障通知宛先DB152から「警報装置」を削除しておけば良い。また上記それぞれの通知先の通知方法および通知宛先がリンクされており、故障発生を通知する方法として、「電子メール」、「FAX」、「電話」の中から選択された方法、および通知する電子メールアドレスや電話番号などの通知宛先が保存されている。本実施の形態では、例えば「システム管理者」の場合は、通知方法として「電子メール」を指定しており、通知宛先は、「sysadmin@abc.def」であるということを表している。
図4は、ハードディスクの故障を診断するための「項目」、その項目の現状の値である「現状値」、その項目の過去最悪の値を示す「最悪値」、およびその値以下になった場合故障と診断する「閾値」が保存されている。本実施の形態ではSMART情報を用いているが、特有の項目と閾値であっても良い。
第1の実施の形態におけるハードディスク冗長管理装置1は以上のように構成され、以下にその動作をフローチャートなどを用いて説明する。
[1.情報の登録]
図5は、ハードディスク冗長管理装置1にて使用する情報を登録する動作の処理手順を示すフローチャートである。本ハードディスク冗長管理装置1にログインすることが可能な利用者の利用者情報、故障発生の際にその通知を行う宛先の宛先情報、ハードディスクの故障診断の閾値を示す閾値情報などの登録は予めハードディスク冗長管理装置1の入力部15および表示部16に接続されているキーボードや画面を用いて直接登録を行う。
ハードディスク冗長管理装置1に直接接続されているキーボードなどからだけでなく、シリアル回線を用いてパソコンを端末として使用して設定を行ったり、LAN5を介して外部よりネットワーク越しにログインして設定を行ったりすることも可能である。また、両場合においても操作を行う利用者のIDやパスワードのチェックを行ってから図5の動作が開始される。IDまたはパスワードが合致しない場合は本動作を行うことはできない。また、ネットワークを経由する場合はセキュリティを強化してIDおよびパスワードの送信およびデータの送受信情報を暗号化するSSH(Secure SHell)などのプロトコルを用いることが望ましい。
以降の説明は電力のハードディスク冗長管理装置1に直接つながっているキーボードを用いて登録を行う場合の処理手順について図13を用いて説明する。ネットワークを介して入力を行うことも可能である。
システム管理者などの操作者は、キーボードを用いて入力し、その入力を入力部15が中央演算処理部13に通知することでIDおよびパスワードなどの入力を行ってシステムにログインする。その後、利用者情報、故障発生を検出した際に通知する宛先情報、ハードディスクの故障を診断する指標として使用される閾値などの登録を画面とキーボードを用いて要求する(S51b)。要求を受信した(S51a)情報登録収集手段133は、利用者情報、故障通知宛先情報、閾値などの情報入力画面を作成し、表示部16を通して操作者が扱っている画面に表示する(S52a)。
操作者は画面(S52b)を見ながら利用者情報、故障通知宛先情報、閾値などの情報をキーボードで入力する。入力された情報は入力部15を介して情報登録収集手段133に通知される(S53b)。情報登録収集手段133は、入力された(S53a)利用者情報、故障通知宛先情報、閾値などの情報を、それぞれ、利用者DB151、故障通知宛先DB152、閾値DB153に登録する(S54a)。次に情報登録収集手段133は、入力を継続するか終了するかを選択する画面を作成して画面に表示する(S55a)。
画面に表示された画面を見て(S54b)、操作者が選択した内容が入力部15より情報登録収集手段133に通知される(S55b、S56a)。終了が選択された場合は本ルーチンを終了する。継続が選択された場合(S57aのnoのルート)は、ステップS52aに戻り、処理終了が選択されるまで上記動作を繰り返す。
なお、本実施の形態においてはステップS55aにて入力を終了するか継続するかを判定するような構成になっているが、別の画面に遷移するなどその他の手順が行われても良い。
[2.故障発生の監視と検出]
図6は、本実施の形態によるハードディスク冗長管理装置1が収容する複数のハードディスクの故障発生の監視と検出を行う「故障発生監視検出ルーチン」の動作の処理手順を示すフローチャートであり、本動作は故障発生監視検出手段134が行う動作である。以下図6を用いて処理を説明する。
まずは、ハードディスクをSMART機能を有効にして起動しておき、定期的に障害発生を監視するように設定しておく。「故障発生監視検出ルーチン」は定期的に起動され、ハードディスクが検出した例えば図4に示すSMARRT情報をモニターしチェックする(S61a)。指定の検査項目をチェックし現在の値または最悪値が閾値を下回っていないか判定する(S62)。閾値を下回っている場合は、ステップS67へ進み、故障検出と判定し(S67)、故障発生を検出した時に起動する「故障検出後処理ルーチン」を起動し(S68)、ステップS69へ進む。閾値を下回っていない場合は次に全ての検査項目を終了したか判定し(S63)、終了していない場合は次の項目を指定して(S64)ステップS62に戻り上記処理を全ての検査項目について終了するまで繰り返す。
次に、全ての検査項目の処理が終了したら(S63のyesのルート)ステップS65に進み、指定のハードディスクのI/Oのエラーの発生回数が予め定めた値を越えているか判定する(S65)。越えている場合は、前述したステップS67、S68、S69へと進む。ハードディスクのI/Oエラーの発生回数が予め定めた値を越えていなければ次にハードディスクのアクセス回数が予め定めた値を越えているか判定する(S66)。越えている場合は、前述したステップS67、S68、S69へと進む。越えていない場合は、指定されたハードディスクの故障は発生していないと判定し(S69)、収容している全てのハードディスクの処理が終了したか判定する(S6A)。全てのハードディスクの処理が終了していない場合は、次のハードディスクを指定し(S6B)、ステップS62に戻り、全てのハードディスクの処理が終了するまで上記処理を繰り返す。全てのハードディスクの処理が終了した場合は(S6Aのyesのルート)、次の周期までプロセスをスリープする(S6C)。プロセスのスリープ時間が満了した時にはステップS62に進み、再度次の周期で上記処理を繰り返す。
[3.故障発生検出の後処理]
図7は、故障発生を検出した際に起動される「故障検出後処理ルーチン」が行う動作の処理手順を示すフローチャートである。故障発生を検出した時は本処理にて故障のハードディスクの電源を切り、予備ハードディスクの電源を入れハードディスクの内容の複製を行うと言う処理を行うものである。以下図7を用いて処理を説明する。
まず、予備のハードディスクを稼動させるために、「HD電源投入ルーチン」を起動することで予備のハードディスクの電源を入れる。次に、電源が投入された予備のハードディスクと現在稼動中のハードディスクを指定して「HD内容複製ルーチン」を起動することで稼動中のハードディスクの内容を予備のハードディスクに複製する。
次にパラメータとして故障発生を検出したハードディスクを識別する番号などを指定して「HD電源切断ルーチン」を起動することで故障を発生したハードディスクの電源を切断する。最後に、故障が発生したことを予め定めた宛先に通知するために「故障通知ルーチン」を起動して通知処理を行う。本実施の形態では、故障したハードディスクの電源の切断はハードディスクの内容の複製を行うルーチンを起動後に行っており、また故障発生を通知するルーチンは最後に行っているが、処理の順序は何を優先するかを特定した上で変更することが可能である。
[4.予備ハードディスクの電源投入]
図8は、予備のハードディスクの電源の投入を行う「HD電源投入ルーチン」の動作の処理手順を示すフローチャートであり、本動作はHD電源投入手段135が行う動作である。以下図8を用いて処理を説明する。まず、複数の予備ハードディスクの中からどのハードディスクの電源を投入するかを決定し(S81)、ハードディスクの電源投入/切断切替回路17を用いて決定した予備のハードディスクの電源を投入する(S82)。この決定のプロセスは図示していないがハードディスクの収容位置順やインタフェースに差し込まれた順などが可能である。
[5.ハードディスクの内容の複製]
図9は、稼動中のハードディスクの内容を予備のハードディスクに複製する「HD内容複製ルーチン」の動作の処理手順を示すフローチャートであり、本動作はHD内容複製手段136が行う動作である。以下図9を用いて処理を説明する。まず、複製を行う対象の予備のハードディスクと複製元の稼動中のハードディスクを指定する(S91)。次に、新たに電源を入れた予備のハードディスクに、稼動中のハードディスクの必要な内容を複製する(S92)。全ての必要な内容を複製するまで処理を繰り返す(S93)。
[6.故障したハードディスクの電源切断]
図10は、故障発生したハードディスクの電源を切断する「HD電源切断ルーチン」の動作の処理手順を示すフローチャートであり、本動作はHD電源切断手段137が行う動作である。以下図10を用いて処理を説明する。まず、電源を切断する故障が発生したハードディスクを決定し(S101)、次にハードディスクの電源投入/切断切替回路17を用いて決定した予備のハードディスクの電源を切断する。
[7.故障発生の通知]
図11は、ハードディスクの故障が発生した際にその通知を予め定めた宛先に通知する「故障通知ルーチン」の動作の処理手順を示すフローチャートであり、以下図11を用いて処理を説明する。まず、図3に示す故障通知宛先DB152より通知先と通知方法、通知宛先を取得する(S111)。次に通知方法により分岐する(S112)。
電子メールにより通知する場合は、故障発生を知らせるメールを作成し、メールのボディに設定し、その時の宛先は取得したメールの宛先を設定する(S113)。次の作成したメールを送信し(S114)、ステップS11Aに進む。電話により通知する場合は、URL通知の場合は、まず故障発生を知らせる音声情報を作成し(S115)、宛先に電話し、応答したら作成した音声情報を読み上げる(S116)ことで通知を行い、ステップS11Aに進む。
FAXにより通知する場合は、まず故障が発生したHDの識別番号と故障内容をファイルとして作成する(S117)。次に宛先に電話してFAXプロトコルを用いて作成したファイルを送信する(S118)ことにより通知を行いステップS11Aに進む。次に警報装置の場合は、警報装置が接続されているシリアル回路19に信号を送信し(S119)、ステップS11Aに進む。シリアル回路19は信号を受信すると警報装置にその信号をそのまま送信するか何らかの加工を行って警報装置を制御して警報装置を駆動する。例えば、警報装置のランプ点灯やサイレンを鳴動させるなどである。
次にステップ11Aでは全ての宛先の処理が終了したかを判定し、終了していない場合は次の宛先を指定して(S11B)、ステップS111に戻り、全ての登録されている宛先の処理が終了するまで上記動作を繰り返す。全ての宛先の処理が終了した場合は(S11Aのyesルート)、本ルーチンの処理を終了する。
本発明による第1の実施の形態は以上のように構成され動作する。
本発明によれば、複数のハードディスクを冗長化して動作中および待機中として稼動している装置において、ハードディスクの稼動状況を監視し、予め定めた閾値などと計測値を比較するなどにて故障の発生を検出し、故障を検出した際に、予備のハードディスクの電源を自動的に投入し、稼動中のハードディスクの内容を複製し、同時に故障と判定したハードディスクの電源を切断し故障が発生したことを予め定めた宛先に自動的に通知することができるので、予備のハードディスクを複数設置することで故障発生時に直ちに現地に赴く必要は無くなるので保守の作業員の運用コストを削減することができる。
さらに予備のハードディスクは電源をオフの状態で設定することができるので、省エネルギー化を図ることができ、低騒音となり、ハードディスクの長寿命化が見込まれ運用コストの削減が可能となる。
次に第2の実施の形態について以下に説明する。図12は本発明の第2の実施の形態に係わるハードディスク冗長管理装置1の機能ブロック図を示す。第2の実施の形態では、図12に図示するように稼動状況を通知する予め定めた通知宛先を保存する稼動状況通知宛先データベース(DB)154、計測した複数のハードディスクの稼動状況を保存する稼動状況データベース(DB)155と、主・副の複数のハードディスクのアクセス回数などの稼動状況を監視する稼動状況監視手段138、計測した稼動状況を通知する宛先情報を保存する稼動状況通知手段139が追加されているところが第1の実施の形態と異なる部分である。上記新たに追加されている手段およびデータベースの詳細な内容および動作について以下に説明する。
図13は、稼動中のハードディスクのアクセス回数などの稼動状況を通知する宛先とその通知方法などを記憶する稼動状況通知宛先DB154のデータ構成例である。本稼動状況通知宛先DB154は、ハードディスクの稼動状況を通知する宛先、通知方法、通知宛先から構成されている。
図14は、複数のハードディスクの稼動状況を保存する稼動状況DB155のデータ構成例である。本稼動状況DB155は、収容するハードディスクごとに取得および計測した、正/副/予備の稼動状態、電源のオン/オフ状態、アクセス回数、I/Oエラー発生回数などを計測した複数時点での値が、現在値、1つ以前の計測値、2つ以前の計測値などとして保存するものである。
[8.ハードディスクの稼動状況の監視]
図15は、収容する複数のハードディスクの稼動状況を取得および計測する「稼動状況監視ルーチン」の動作の処理手順を示すフローチャートであり、本動作は稼動状況監視手段138が行う動作である。以下図15を用いて処理を説明する。本ルーチンは定期的、リアルタイム、要求により起動されるものであり、起動されるとまず稼働中のハードディスクの読み書きの稼働状況を計測する(S151)。次に稼働中のハードディスクのアクセス回数/アクセス時間などの稼働状況を計測する(S152)。
次に指定HDの電源の入り切り情報、およびHDが正/副/予備のどの状態であるかを取得し保存する(S153)。全ての収容されているHDの処理が終了したかを判定し(S154)、終了していない場合は次のハードディスクを指定してステップS151に戻り全てのハードディスクの処理が終了するまで上記動作を繰り返し行う。収容する全てのハードディスクの処理が終了(S154のyesのルート)したら処理を終了する。
[9.ハードディスクの内容の複製(故障時の稼動HDが2台以上の場合)]
図16は、稼動中のハードディスクに故障が発生した場合に故障していない稼動中のハードディスクが2台以上存在する場合の「HD内容複製ルーチン」の動作の処理手順を示すフローチャートである。以下図16を用いて処理を説明する。まず稼動中のハードディスクが2台以上存在するか判定する(S161)。故障が発生した時点で1台のハードディスクのみが稼動中であった場合は、次に稼動状況監視ルーチンが取得した稼動状況の結果を得る(S162)。
稼動状況を示すハードディスクのアクセス回数などが予め定めた値を越えていないかを判定し(S163)、越えていない場合は新たに電源を入れたハードディスクに、残ったHDの中の必要な内容を順に複製する(S164)。次に全ての必要な内容を複製したかを判定し(S165)、複製が終了していない場合はステップS162に戻り上記必要なハードディスクの複製が終了するまで上記処理を繰り返す。
稼動状況の稼働状況を示す処理能力値などが予め定めた値を越えている場合は(S164のyesのnルート)、ハードディスクの複製を停止(S166)してステップS162に戻る。その後は処理能力に余裕ができた時に複製作業の再開を行うことになる。
稼働中HDが2台以上ある場合は(S161のyesのルート)、稼動しているハードディスクの内の1台を運用系から切り離し(S168)、新たに電源を入れたハードディスクに、切り離したハードディスクの中の全ての必要な内容が複製されるまで繰り返し複製を行う(S168、S169)。このようにして電源を投入した予備のハードディスクに稼動中のハードディスクの必要な内容が保存される。
[10.ハードディスクの稼動状態の通知]
図17は、計測したハードディスクの稼動状態を予め定めた宛先に通知する「稼動状況通知ルーチン」の動作の処理手順を示すフローチャートであり、本動作は稼動状況通知手段139が行う動作である。以下図17を用いて処理を説明する。まず、稼働状況監視ルーチンにより取得したハードディスクの電源の入り切り情報、正/副/予備のどのモードで動作しているか、アクセス回数、アクセス時間などの稼働状況を取得する(S171)。次に図13に示す稼動状況通知宛先DB154より通知先と通知方法、通知宛先を取得し(S172)、通知方法により分岐する(S173)。
電子メールにより通知する場合は、稼働状況を知らせるメールを作成し、メールのボディに設定し、宛先は取得したメールの宛先を設定する。(S174)。次の作成したメールを送信し(S175)、ステップS17Bに進む。FAXにより通知する場合は、稼動状況をファイルとして電子的に作成し出力し(S176)、宛先に電話してFAXプロトコルにて送信する(S177)ことによって通知し、ステップS17Bへ進む。
特定プロトコルの場合は、まず稼動状況を知らせるファイルを作成し(S178)、作成したファイルを特定のプロトコルで参照できる特定の場所に置き(S179)、特定の場所に置いたことを特定の手段、例えば電子メールなどにて通知する(S17A)。特定のプロトコルがHTTP(HyperText Transfer Protocol)通知の場合は、外部から参照できるサーバなどのHTTPにてアクセス可能な場所にファイルを置き、その場所を示すURL(Uniform Resource Locator)を電子メールを用いて通知する。
次にステップ17Bでは全ての宛先の処理が終了したかを判定し(S17B)、終了していない場合は次の宛先を指定して(S17C)、ステップS172に戻り、全ての登録されている宛先の処理が終了するまで上記動作を繰り返す。全ての宛先の処理が終了した場合は(S17Bのyesルート)、本ルーチンの処理を終了する。このような手順で稼動状況を予め定めた宛先に通知することができる。本実施の形態ではメールのボディに稼動状況の結果を記載することにしているが、稼動状況を表すファイルを作成し、安全を確保するために例えば暗号化などを行った上で送信し、受け取る側で復号化して受信するという行い方でも良い。
[11.予備ハードディスクのチェック処理]
図18は、第1の実施の形態にて説明した「故障発生監視検出ルーチン」に予備のハードディスクのチェック処理が追加されたフローチャートである。図18においてステップS181、S182が追加されている。ステップS181にて予備のハードディスクのチェック処理を行うかどうかを図示していないデータを参照して判定し、チェックを行う場合は予備HDチェックルーチンを起動して予備のハードディスクのチェックを行う。その他の処理については図6の内容と同じである。
図19は、電源が切断状態になっている予備のハードディスクのチェックを行う「予備HDチェックルーチン」の動作の処理手順を示すフローチャートであり、以下図19を用いて処理を説明する。まず、予備のハードディスクを指定(S191)してHD電源投入ルーチン起動することで予備のハードディスクの電源を投入する。次に予め定めた内容を電源投入したHDに書き込む(S192)。
次に書き込み時にエラーが発生したかどうかを判定し(S193)、エラーが発生した場合はエラー発生を記録し(S194)、ステップS195に進む。エラーが発生していない場合は、次にHD電源切断ルーチンを起動(S195)してチェックを行った予備のハードディスクの電源の切断を行う。
次に必要な全ての予備のハードディスクのチェックが終了したか判定し(S196)、終了していない場合は次の予備のハードディスクを指定し(S197)、ステップS191に戻り全ての予備のハードディスクのチェック処理が終了するまで上記処理を繰り返す。全ての予備のハードディスクの処理が終了した場合は(S196のyesのルート)処理を終了する。このようにして予備のハードディスクのチェックを行うことができる。
本発明による第2の実施の形態は以上のように構成され動作する。
また、第1および第2の実施の形態におけるハードディスクの故障発生による自動切替動作のイメージを図20に示す。図20中、ハードディスクをA〜Fで表している。図20において、上段から下段に向かって時間と共に故障が発生し、自動的にハードディスクが切り替わっていく状態を示している。
まず本実施の形態における初期状態F201としては、ハードディスクAが「正」、ハードディスクBが「副」であり、その他のハードディスクC〜Fは予備のハードディスクとして電源切断状態で運用されていることを示している。この場合、稼動中のハードディスクはハードディスクAおよびBである。この状態で「正」のハードディスクAが故障した後の状態をF202は示している。
故障発生を検出するとハードディスク冗長管理装置1は予備のハードディスクCの電源を投入し、稼動中の「副」のハードディスクBの内容を複製して「副」として動作するように設定する。さらにハードディスクAが故障するまで「副」として動作していたハードディスクBの状態を「副」から「正」に状態遷移させ、故障したハードディスクAの電源を切断する。
同様に2台目としてハードディスクCが故障した時は、ハードディスク冗長管理装置1は、ハードディスクDの電源を投入し、ハードディスクBの内容をハードディスクDに複製して、ハードディスクDを「副」として動作させ、故障したハードディスクCの電源を切断する。故障が発生した際のハードディスク冗長管理装置1の動作および、各ハードディスクの状態遷移は上述のようになる。
次に、ハードディスクを取り替えた状態を示すF205においては、「正」、「副」で動作していたハードディスクはそのまま動作を継続し、他の故障して電源が切断されたハードディスクが予備として電源切断の状態で設置されるという状態になる。
本実施の形態によれば、ハードディスク冗長化管理装置1は、収容しているハードディスクの正/副/予備の状態およびハードディスクのアクセス回数やI/Oエラーの発生回数などを予め定めた宛先へ通知することができるので、システム管理者または保守管理者などがハードディスクの稼動状況を随時把握することができ、保守作業を円滑に行うことを可能となり、保守の計画を立案することも可能となる。また、稼動中のハードディスクの利用状況を考慮に入れて予備のハードディスクへの複製作業を行うことができるので、故障が発生した際の予備のハードディスクへの複製作業も実運用に対する影響を少なくして対応することが可能となる。
特に、ハードディスクへのアクセス負荷が小さい時もしくは周期的に、予備ハードディスクに正常稼動中のハードディスクの内容を複製することで、予備のハードディスクの内容を可能な限り正常稼動中のハードディスクの内容に近づけることができ、ハードディスク障害発生の際に迅速に対応することができる。
本発明の第1の実施の形態に係わるハードディスク冗長化管理装置の機能ブロック図である。 図1の利用者DBのデータ構成例である。 図1の故障通知宛先DBのデータ構成例である。 図1の閾値DBのデータ構成例である。 図1の情報登録収集手段が行う処理手順を示すフローチャートである。 図1の故障発生監視検出手段が行う処理手順を示すフローチャートである。 本発明の第1の実施の形態における故障検出後処理ルーチンが行う動作の処理手順を示すフローチャートである。 図1のHD電源投入手段が行う処理手順を示すフローチャートである。 図1のHD内容複製手段が行う処理手順を示すフローチャートである。 図1のHD電源切断手段が行う処理手順を示すフローチャートである。 本発明の第1の実施の形態における故障通知ルーチンが行う動作の処理手順を示すフローチャートである。 本発明の第2の実施の形態に係わるハードディスク冗長化管理装置の機能ブロック図である。 図12の稼動状況通知宛先DBのデータ構成例である。 図12の稼動状況DBのデータ構成例である。 図12の稼動状況監視手段が行う処理手順を示すフローチャートである。 図12のHD内容複製手段が行う動作の処理手順を示すフローチャートである。 図12の稼動状況通知手段が行う動作の処理手順を示すフローチャートである。 図12の故障発生監視検出手段が行う動作の処理手順を示すフローチャートである。 本発明の第2の実施の形態における予備HDチェックルーチンが行う動作の処理手順を示すフローチャートである。 本発明の第1および第2に実施形態におけるハードディスクの状態遷移図である。
符号の説明
1 ハードディスク冗長化管理装置
4 通信ネットワーク
5 LAN
12 送受信部
13 中央演算処理部
14 記憶部
15 入力部
16 表示部
17 電源投入/切断切替回路
18 ハードディスクインタフェース
19 シリアル回路
131 送受信処理手段
132 入出力処理手段
133 情報登録収集手段
134 故障発生監視検出手段
135 HD電源投入手段
136 HD内容複製手段
137 HD電源切断手段
138 稼動状況監視手段
139 稼動状況通知手段
151 利用者(データベース)DB
152 故障通知宛先(データベース)DB
153 閾値(データベース)DB
154 稼動状況通知宛先(データベース)DB
155 稼動状況(データベース)DB

Claims (16)

  1. 複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを管理するハードディスク冗長管理装置であって、
    稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出手段と、
    前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時は、電源切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動手段と、
    前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するHD内容複製手段と、
    を備えたことを特徴とするハードディスク冗長管理装置。
  2. 前記HD内容複製手段は、前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、1台しか存在していない場合に、当該正常稼動中のハードディスクの稼働状況を示す値を計測し、当該正常稼動中のハードディスクの稼働状況を示す値が予め定めた値よりも低い場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項1に記載のハードディスク冗長管理装置。
  3. 前記正常稼動中のハードディスクの稼働状況を示す値は、当該ハードディスクへのアクセス回数であって、
    前記HD内容複製手段は、前記正常稼動中のハードディスクへのアクセス回数が予め定めた値より小さい場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項2に記載のハードディスク冗長管理装置。
  4. 前記故障発生監視検出手段は、稼動中のハードディスクのI/Oエラー発生回数またはハードディスクのアクセス回数の少なくとも一方を監視し、どちらかが予め定めた閾値を超過した場合は故障発生を検出したとみなすことを特徴とする請求項1から3のいずれか一に記載のハードディスク冗長管理装置。
  5. 前記稼動中のハードディスクの故障発生を検出した時に、故障が検出されたハードディスクの電源を切断するHD電源切断手段をさらに備えたことを特徴とする請求項1から4のいずれか一に記載のハードディスク冗長管理装置。
  6. 複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを備えた監視制御システムであって、
    稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出手段と、
    前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時は、電源切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動手段と、
    前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するHD内容複製手段と、
    を備えたことを特徴とする監視制御システム。
  7. 前記HD内容複製手段は、前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、1台しか存在していない場合に、当該正常稼動中のハードディスクの稼働状況を示す値を計測し、当該正常稼動中のハードディスクの稼働状況を示す値が予め定めた値よりも低い場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項6に記載の監視制御システム。
  8. 前記正常稼動中のハードディスクの稼働状況を示す値は、当該ハードディスクへのアクセス回数であって、
    前記HD内容複製手段は、前記正常稼動中のハードディスクへのアクセス回数が予め定めた値より小さい場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項7に記載の監視制御システム。
  9. 複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを管理するハードディスクの冗長管理方法であって、
    稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出ステップと、
    前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時は、電源切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動ステップと、
    前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を複製するHD内容複製ステップと、
    を含むことを特徴とするハードディスク冗長管理方法。
  10. 前記HD内容複製ステップは、前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、1台しか存在していない場合に、当該正常稼動中のハードディスクの稼働状況を示す値を計測し、当該正常稼動中のハードディスクの稼働状況を示す値が予め定めた値よりも低い場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するステップを含むことを特徴とする請求項1に記載のハードディスク冗長管理方法。
  11. 前記正常稼動中のハードディスクの稼働状況を示す値は、当該ハードディスクへのアクセス回数であって、
    前記HD内容複製ステップの前記正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製するステップにおいて、前記正常稼動中のハードディスクへのアクセス回数が予め定めた値より小さい場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項10に記載のハードディスク冗長管理方法。
  12. 記故障発生監視検出ステップは、稼動中のハードディスクのI/Oエラー発生回数またはハードディスクのアクセス回数の少なくとも一方を監視し、どちらかが予め定めた閾値を超過した場合は故障発生を検出したとみなすステップを含むことを特徴とする請求項9から11のいずれか一に記載のハードディスク冗長管理方法。
  13. 前記稼動中のハードディスクの故障発生を検出した時に、故障が検出されたハードディスクの電源を切断するHD電源切断ステップをさらに含むことを特徴とする請求項9から12のいずれか一に記載のハードディスク冗長管理方法。
  14. 複数台の冗長化された動作中および待機中のハードディスクを含む稼動中のハードディスクと、複数台の電源切断状態にある予備のハードディスクとを管理するハードディスク冗長管理装置上で動作するプログラムであって、
    コンピュータを、
    稼動中のハードディスクの故障発生を監視し検出する故障発生監視検出手段
    前記稼動中のハードディスクの内、動作中のハードディスクの故障発生を検出した時に、電源が切断状態にある予備のハードディスクの1台の電源を投入し、待機中のハードディスクを動作中状態にし、待機中のハードディスクの故障発生を検出した時は、前記電源切断状態にある予備のハードディスクの1台の電源を投入するHD電源起動手段
    前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、2台以上存在している場合に、当該正常稼動中のハードディスクの一台を運用系から切り離して当該ハードディスクへの冗長化処理を停止して当該ハードディスクへの書き込みが無い状態とした上で、当該冗長化処理を停止したハードディスクの内容を複製するHD内容複製手段
    として機能させることを特徴とするハードディスク冗長管理プログラム。
  15. 前記HD内容複製手段は、前記新たなハードディスクの電源が投入された時に正常稼動中のハードディスクが2台以上存在しているか否かを判定し、1台しか存在していない場合に、当該正常稼動中のハードディスクの稼働状況を示す値を計測し、当該正常稼動中のハードディスクの稼働状況を示す値が予め定めた値よりも低い場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項14に記載のハードディスク冗長管理プログラム。
  16. 前記正常稼動中のハードディスクの稼働状況を示す値は、当該ハードディスクへのアクセス回数であって、
    前記HD内容複製手段は、前記正常稼動中のハードディスクへのアクセス回数が予め定めた値より小さい場合に当該正常稼動中のハードディスクの内容を前記新たに電源が投入された予備のハードディスクに複製することを特徴とする請求項15に記載のハードディスク冗長管理プログラム。
JP2006013251A 2006-01-20 2006-01-20 ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム Expired - Fee Related JP4761978B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006013251A JP4761978B2 (ja) 2006-01-20 2006-01-20 ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006013251A JP4761978B2 (ja) 2006-01-20 2006-01-20 ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム

Publications (2)

Publication Number Publication Date
JP2007193711A JP2007193711A (ja) 2007-08-02
JP4761978B2 true JP4761978B2 (ja) 2011-08-31

Family

ID=38449348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006013251A Expired - Fee Related JP4761978B2 (ja) 2006-01-20 2006-01-20 ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム

Country Status (1)

Country Link
JP (1) JP4761978B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128773A (ja) * 2008-11-27 2010-06-10 Nec Fielding Ltd ディスクアレイ装置、そのディスク管理方法及びそのディスク管理プログラム
KR101469059B1 (ko) * 2013-04-19 2014-12-04 (주)엔텍 내고장성 향상 시스템 및 그 구동 방법
JP2014211849A (ja) * 2013-04-22 2014-11-13 富士通株式会社 ストレージ制御装置、ストレージ装置、および制御プログラム
WO2016122510A1 (en) * 2015-01-29 2016-08-04 Hewlett Packard Enterprise Development Lp Hard disk drive power removal
CN116414661B (zh) * 2023-06-08 2023-09-08 北京星辰天合科技股份有限公司 分布式存储的固态硬盘处理方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101866A (ja) * 1995-10-06 1997-04-15 Nec Eng Ltd ディスクアレイシステムとその運用方法
JPH10247134A (ja) * 1997-03-05 1998-09-14 Nec Corp 直結バス用ディスクアレイ装置の障害処理回路
JPH10301719A (ja) * 1997-04-28 1998-11-13 Yamaha Corp ディスクアレイ装置及びそれを用いた情報処理システム
JP3120753B2 (ja) * 1997-05-28 2000-12-25 日本電気株式会社 ディスクアレイ装置の障害復旧装置
JP2000293320A (ja) * 1999-04-06 2000-10-20 Toshiba Corp ディスクサブシステム、ディスクサブシステムの検査診断方法及びディスクサブシステムのデータ復元方法
US7085953B1 (en) * 2002-11-01 2006-08-01 International Business Machines Corporation Method and means for tolerating multiple dependent or arbitrary double disk failures in a disk array

Also Published As

Publication number Publication date
JP2007193711A (ja) 2007-08-02

Similar Documents

Publication Publication Date Title
US7114094B2 (en) Information processing system for judging if backup at secondary site is necessary upon failover
CN100417081C (zh) 检查和修复网络配置的方法和系统
US8135995B2 (en) Diagnostic data repository
US7281040B1 (en) Diagnostic/remote monitoring by email
WO2022237507A1 (zh) 服务器故障智能推送方法、装置、设备及存储介质
CN101137984B (zh) 用于分布加载数据库的系统、方法和软件
JP4761978B2 (ja) ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム
JP2007286937A (ja) ストレージ装置及びストレージ装置の電源障害管理方法
WO2023226380A1 (zh) 一种磁盘处理方法、系统及电子设备
CN114064374A (zh) 一种基于分布式块存储的故障检测方法和系统
CN110291505A (zh) 减少应用的恢复时间
JP4102592B2 (ja) 集約機能付障害情報通知システム及びマシンを集約機能付障害情報通知手段として機能させるためのプログラム
JP3653335B2 (ja) コンピュータ管理システム
JP2003271422A (ja) 予防保守判定処理方法、予防保守判定処理プログラム、および保守管理方法
CN111309515B (zh) 一种容灾控制方法、装置及系统
EP0607660B1 (en) Data processing system
JP6317074B2 (ja) 障害通知装置、障害通知プログラムならびに障害通知方法
JP2011145861A (ja) 災害時自動切換えシステムとその処理方法
CN112416655A (zh) 一种基于企业服务门户的存储灾备系统及数据复制方法
JP2005134940A (ja) 記憶制御装置及び記憶制御装置の保守システム
JP3335779B2 (ja) プラント性能監視システム
CN104239425B (zh) 文件访问的方法、装置及系统
JP3880453B2 (ja) 大規模システムに接続された複数の携帯端末の運用管理システムと方法
JPWO2004001602A1 (ja) サーバマシン、クライアントマシン、サーバクライアントシステム、サーバプログラム、およびクライアントプログラム
JP3480881B2 (ja) 遠隔監視装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110607

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4761978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees