JP2004021507A - サーバ相互の監視制御方法 - Google Patents

サーバ相互の監視制御方法 Download PDF

Info

Publication number
JP2004021507A
JP2004021507A JP2002174294A JP2002174294A JP2004021507A JP 2004021507 A JP2004021507 A JP 2004021507A JP 2002174294 A JP2002174294 A JP 2002174294A JP 2002174294 A JP2002174294 A JP 2002174294A JP 2004021507 A JP2004021507 A JP 2004021507A
Authority
JP
Japan
Prior art keywords
server
servers
status
shutdown
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002174294A
Other languages
English (en)
Inventor
Toru Harima
播磨 亨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002174294A priority Critical patent/JP2004021507A/ja
Publication of JP2004021507A publication Critical patent/JP2004021507A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】二台のサーバを相互に接続して互いの状態を監視し、サーバに対して異常検出が発見されたときに、リセットされるシステムにおいて、サーバの電源のShutdownの状態如何によらず、安定稼動をできるようにする。
【解決手段】一方のサーバは、状態チェックをおこなう方のサーバに対して自らがシャットダウン状態に移ることを通知する。そして、状態チェックをおこなう方のサーバは、相手のサーバがシャットダウン状態であるときには、異常検出をおこなわないようにする。状態チェックをおこなう方のサーバは、相手のサーバの稼動状態を保持しておく。
【選択図】    図2

Description

【0001】
【発明の属する技術分野】
本発明は、サーバ相互の監視制御方法に係り、特に、複数台のサーバを相互に監視してクラスタを構成するNAS(Network Attached Storage)に用いて好適であって、サーバの安定稼動を図るサーバ相互の監視制御方法に関する。
【0002】
【従来の技術】
従来、システムのフェールセーフを目的として、サーバの2重化を図るために2台のサーバでクラスタを構成する場合には、その多くは一方のサーバがメインで動作し、もう、一方のサーバは普段動作せずスタンバイ状態であり、メインのサーバでの障害時のバックアップとして存在している。
【0003】
この場合、メイン側のサーバがスタンバイ側のサーバの状態を逐次監視する必要は無く、メイン側で障害が発生してスタンバイ側に処理を移管する直前か、あるいは、ある程度時間をおいてスタンバイ側の状態をチェックする。
【0004】
ところが、チェックされるスタンバイ側のサーバがShutdownしようとするときに、メイン側からチェックをおこなったときには正しくチェックされず、Shutdown時にも相手サーバの異常状態と認識される。
【0005】
しかしながら、このような一方のサーバがスタンバイするシステムでは、Shutdownと状態チェックが同時期におこなわれる頻度は少なく、問題となることはまれであった。
【0006】
【発明が解決しようとする課題】
上記従来技術は、メイン側のサーバとスタンバイ側のサーバで機能分担するシステムについて述べたが、NASなどでは、2台のサーバにてクラスタを構成し、2台のサーバを共にアクティブで動作させるシステム構成であることが多い。このようなときには、相手サーバ障害(無応答など)検出時は、早急に回復処理を実施する必要があるため、相手の状態を逐次監視している。
【0007】
そして、相手サーバの異常を検知すると、回復処理として相手サーバのリセット(リブート)をおこなう。
【0008】
ところが、サーバの電源をおとす際のShutdown時に状態チェックがおこなわれると、相手の状態を障害がおこったものと誤認識して、リセット処理がおこなわれるため、永久にサーバの電源をおとすことができない、また、Shutdownが完璧におこなえないために誤動作につながると言う問題点があった。
【0009】
本発明は、上記問題点を解決するためになされたもので、その目的は、二台のサーバを相互に接続して互いの状態を監視し、サーバに対して異常検出が発見されたときに、リセットされるシステムにおいて、サーバの電源のShutdownの状態如何によらず、安定稼動を図ることができるサーバ相互の監視制御方法を提供することにある。
【0010】
【課題を解決するための手段】
一方のサーバは、状態チェックをおこなう方のサーバに対して自らがシャットダウン状態に移ることを通知する。そして、状態チェックをおこなう方のサーバは、相手のサーバがシャットダウン状態であるときには、異常検出をおこなわないようにする。
【0011】
状態チェックをおこなう方のサーバは、相手のサーバの稼動状態を保持しておく。
【0012】
【発明の実施の形態】
以下、本発明に係る一実施形態を、図1および図2を用いて説明する。
図1は、本発明に係るNAS装置1におけるサーバ相互の監視制御方法の状態管理機構の概略図である。
図2は、図1に示されるサーバ2内にサーバ相互の監視制御方法の処理のフローチャートを埋め込んだ図である。
【0013】
NAS装置1は、既存のユーザLAN12を活かし、異種プラットフォーム間でのファイル共用を可能にする記憶装置である。このNAS装置1を使用することにより、ファイルの一元管理が可能となる。NAS装置1で障害が発生した場合、修復するまで装置1内の共有ストレージデバイスに格納したファイルに一切アクセスできなくなってしまうため、通常、NAS装置1の構成要素は、2重化されていることが多い。
【0014】
2重化対象の一つとして、NASのエンジンとなるサーバ2(Unixマシンor PC「Unixは、登録商標」)がある。
【0015】
上記のようにフェールセーフの理由だけによる2重化の場合、一方のサーバはスタンバイとして、障害が発生するまで待機する構成をとることも考えられるが、NASのようなネットワークに接続される装置では、アクセス性能も重要な要素であり、本NAS装置1では2台のサーバ2ともアクティブで動作するものである。
【0016】
本発明のNAS装置1に含まれるサーバ2は、図1に示されるように、状態通知機構3、状態監視機構7、リセット機構8、相手状態監視テーブル10を含み、共有ストレージデバイス11に接続されている。
【0017】
ユーザLANを介して、共有ストレージデバイス11にアクセスする場合には、どちらのサーバ2を用いてもよい。
【0018】
2台のサーバ2が共にアクティブで動作する場合、互いに相手サーバの状態を監視6をおこない、相手サーバ障害(無応答など)の検出時には早急に回復処理を実施する必要がある。
【0019】
そのために、図1に示されるように、それぞれのサーバ2の状態監視機構7は、監視ライン5を使用して相手サーバ状態監視6をおこなっている。相手サーバの障害検出時には、回復処理としてリセット機構8からリセットライン9を使用して、相手サーバのリセットをおこなう。
【0020】
この処理は、通常動作中では有益であるが、サーバの電源をおとす際のShutdown処理時に状態監視されたときには、監視の対象となっているサーバの異常と判断され、Shutdown中でもリセットがかけられることになり、サーバがまた立ち上がってしまってShutdownができなくなったり、誤動作の原因となる。
【0021】
そのために、図2に示されるように、サーバの制御機構からShutdownのメッセージを受信して(S201)、Shutdown処理をおこなう際には(S209)、状態通知機構3が相手サーバに対し、自サーバ状態(Shutdown)を通知する(S208)。図2には示していないが、状態通知機構3で受領した相手サーバ状態は、相手サーバ状態管理テーブル10に格納される。
【0022】
相手サーバ状態管理テーブル10には、”Shutdown”の他に、”Active”,”Reset”が格納される。
【0023】
ここで、”Active”は”正常動作中”、”Reset”は”相手サーバのリセット中”を意味する。図2には示していないが、”Active”が相手サーバ状態管理テーブル10が設定されるときは、相手サーバに電源が入れられて立ち上がるか、リセットによりリブートされるかして、相手サーバから状態通知機構3により通知を受けたときである。
【0024】
監視をおこなっているサーバでは、相手サーバ状態管理テーブル10に、”Shutdown”が格納されているときには監視コマンドを発行せず(S202)、それ以外のときには、監視コマンドを発行する(S203)。
【0025】
この監視コマンドにより、相手サーバの状態の監視をおこなって状態監視機構7が相手サーバ異常と認識した場合であって、かつ、サーバ状態管理テーブル10が、”Active”のときには(S204)、リセットラインにより相手サーバに対してリセット指示22をおこなって(S205)、相手状態監視テーブル10に”Reset”を記録する(S206)。
【0026】
この監視は、一定時間のWait間隔をおいて繰り返される(S207)
この方法により、サーバをShutdownするときには、監視しているサーバからの監視が遮断されて、リセットされることがなくなるため、Shutdown処理が完遂されて、Shutdownが完了していない状態で、リセットされる不都合を回避することができる。
【0027】
【発明の効果】
本発明によれば、二台のサーバを相互に接続して互いの状態を監視し、サーバに対して異常検出が発見されたときに、リセットされるシステムにおいて、サーバの電源のShutdownの状態如何によらず、安定稼動を図ることができるサーバ相互の監視制御方法を提供することができる。
【図面の簡単な説明】
【図1】本発明に係るNAS装置1におけるサーバ相互の監視制御方法の状態管理機構の概略図である。
【図2】図1に示されるサーバ2内にサーバ相互の監視制御方法の処理のフローチャートを埋め込んだ図である。
【符号の説明】
1…NAS(Network Attached Storage)装置
2…サーバ:NAS装置のエンジン部(Unixマシン or PC「Unixは、登録商標」)
3…状態通知機構
4…自サーバ状態(Shutdown処理中)送信
5…サーバ間の状態監視ライン
6…状態監視処理
7…状態監視機構
8…セット機構
9…リセットライン
10…相手サーバ状態管理テーブル
11…共有ストレージデバイス

Claims (3)

  1. 二台のサーバを相互に接続して互いの状態を監視し、第一のサーバが第二のサーバに対して異常検出をおこなって、前記第二のサーバの異常を発見したときに、前記第二のサーバに対してリセット指示をおこなうサーバ相互の監視制御方法において、
    前記第二のサーバは、前記第一のサーバに対して自らがシャットダウン状態に移ることを通知し、
    前記第一のサーバは、前記第二のサーバがシャットダウン状態であるときには、前記第二のサーバに対して異常検出をおこなわないことを特徴とするサーバ相互の監視制御方法。
  2. 前記第一のサーバは、前記第二のサーバがシャットダウン状態であるときには、前記第二のサーバに対してリセット指示をおこなわないことを特徴とする請求項1記載のサーバ相互の監視制御方法。
  3. 前記第一のサーバは、前記第二のサーバの稼動状態を保持する手段を有することを特徴とする請求項1および請求項2記載のいずれかのサーバ相互の監視制御方法。
JP2002174294A 2002-06-14 2002-06-14 サーバ相互の監視制御方法 Pending JP2004021507A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002174294A JP2004021507A (ja) 2002-06-14 2002-06-14 サーバ相互の監視制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002174294A JP2004021507A (ja) 2002-06-14 2002-06-14 サーバ相互の監視制御方法

Publications (1)

Publication Number Publication Date
JP2004021507A true JP2004021507A (ja) 2004-01-22

Family

ID=31173299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002174294A Pending JP2004021507A (ja) 2002-06-14 2002-06-14 サーバ相互の監視制御方法

Country Status (1)

Country Link
JP (1) JP2004021507A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5163807B2 (ja) * 2010-03-18 2013-03-13 トヨタ自動車株式会社 マイコン相互監視システム及びマイコン相互監視方法
JP2020190800A (ja) * 2019-05-20 2020-11-26 Necプラットフォームズ株式会社 監視制御装置、監視制御方法、コンピュータ及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5163807B2 (ja) * 2010-03-18 2013-03-13 トヨタ自動車株式会社 マイコン相互監視システム及びマイコン相互監視方法
JP2020190800A (ja) * 2019-05-20 2020-11-26 Necプラットフォームズ株式会社 監視制御装置、監視制御方法、コンピュータ及びプログラム
JP7040784B2 (ja) 2019-05-20 2022-03-23 Necプラットフォームズ株式会社 監視制御装置、監視制御方法、コンピュータ及びプログラム

Similar Documents

Publication Publication Date Title
US8954784B2 (en) Reduced power failover
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US9262257B2 (en) Providing boot data in a cluster network environment
WO2015169199A1 (zh) 分布式环境下虚拟机异常恢复方法
US20050251802A1 (en) Dynamic migration of virtual machine computer programs upon satisfaction of conditions
JPWO2010140222A1 (ja) 情報処理システム、管理装置および情報処理方法
CN114090184B (zh) 一种虚拟化集群高可用性的实现方法和设备
JP5773166B2 (ja) 計算機の制御方法、計算機及び計算機システム
JP2010224847A (ja) 計算機システム及び設定管理方法
CN111209265B (zh) 一种数据库切换方法和终端设备
JP2011065480A (ja) 電源制御装置及びその制御方法並びにストレージシステム
JP3957065B2 (ja) ネットワーク計算機システムおよび管理装置
US7437445B1 (en) System and methods for host naming in a managed information environment
US20090150459A1 (en) Highly available multiple storage system consistency heartbeat function
JP2004021507A (ja) サーバ相互の監視制御方法
JPH10307635A (ja) コンピュータシステム及び同システムに適用する温度監視方法
WO2021238579A1 (zh) 存储系统管理sata硬盘的方法及存储系统
JP5577016B2 (ja) リモート電源制御装置
JP4157807B2 (ja) 無停電電源装置
JP2006229512A (ja) サーバ切替方法,サーバ及びサーバ切替プログラム
US7676682B2 (en) Lightweight management and high availability controller
JP4068277B2 (ja) ハードウェアシステム
JP2011166886A (ja) 情報処理装置
JP2002099444A (ja) コンピュータシステム
JPH10269087A (ja) リモートネットワークコンピュータシステム