JP2009252009A - コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム - Google Patents

コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム Download PDF

Info

Publication number
JP2009252009A
JP2009252009A JP2008100217A JP2008100217A JP2009252009A JP 2009252009 A JP2009252009 A JP 2009252009A JP 2008100217 A JP2008100217 A JP 2008100217A JP 2008100217 A JP2008100217 A JP 2008100217A JP 2009252009 A JP2009252009 A JP 2009252009A
Authority
JP
Japan
Prior art keywords
management
server
processor
program
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008100217A
Other languages
English (en)
Other versions
JP5439736B2 (ja
Inventor
Akifumi Matsukuma
亮文 松熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008100217A priority Critical patent/JP5439736B2/ja
Publication of JP2009252009A publication Critical patent/JP2009252009A/ja
Application granted granted Critical
Publication of JP5439736B2 publication Critical patent/JP5439736B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】管理用プロセッサが使用できなくても、管理用プロセッサを搭載したサーバの運用を続行できる、コンピュータ管理システムを提供する。
【解決手段】複数のサーバと管理モジュール装置とを具備し、前記複数のサーバの各々は、管理プログラムを実行することにより前記各サーバの管理を行うサーバ用管理プロセッサを備え、前記管理モジュール装置は、前記複数のサーバ全体の管理を行う管理モジュールプロセッサと、前記各サーバに接続された代替用プロセッサと、前記管理プログラムの代替プログラムを格納するプログラム記憶部とを備え、前記管理モジュールプロセッサは、前記複数のサーバのうちから選択サーバが選択されたときに、前記代替用プロセッサに対し、前記代替プログラムを読み込ませ、前記代替用プロセッサは、読み込んだ前記代替プログラムを実行することにより、前記選択サーバを前記管理プロセッサ代替用パスを介して代替管理する。
【選択図】図1

Description

本発明は、コンピュータ管理システムに関し、特に、サーバシステムの管理を行うコンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラムに関する。
複数のサーバを用いたサーバシステムが知られている。そのようなサーバシステムでは、実際にサーバに要求される処理を実行するためのプロセッサとは別に、管理用プロセッサが設けられる(例えば、特許文献1(特開平10−301799号公報)参照)。管理用プロセッサは、各サーバ内に設けられたデバイスのマネジメント処理を行うためのプロセッサである。具体的には、管理プロセッサは、各サーバ内の状態(温度や電圧など)の監視、電源のON/OFFの制御、シーケンスの制御、及び内部のデバイスの障害を監視などを行う。そして、サーバ内に異常が認められた場合には、サーバ外に通知したり、そのサーバの運用を停止したりする。
しかし、この管理用プロセッサ自体も故障してしまうことがある。また、管理用プロセッサが実行する管理プログラムをアップデートする際には、管理用プロセッサによる管理を停止する必要がある。管理用プロセッサを動かすことができなければ、内部のデバイスの動作には異常がなくても、電源制御や障害処理を行うことができなくなる。従って、実際の運用系には関係なく、運用停止状態になってしまう。
従って、管理用プロセッサが故障したり、管理プログラムのアップデート中であったとしても、その管理用プロセッサを搭載するサーバの運用を続行できることが望まれる。
尚、関連技術として、特許文献2(特開2006−268742号公報)に記載されるコンピュータが挙げられる。このコンピュータは、コンピュータのデバイスと接続されデバイスの監視及び電源制御の少なくとも一つを行うとともに、コンピュータ外部の装置に接続されるコントローラと、コントローラの障害を検出する障害検出部とを備える。このコンピュータでは、障害検出部からコントローラの障害検出の通知を受けたとき、コントローラとデバイスとのパスを切り離すと共に、コンピュータ外部の装置とデバイスとのパスを接続するように切替制御を行い、コンピュータ外部の装置からデバイスの監視及び電源制御の少なくとも一つを行うことを可能としている。
他の関連技術として、特許文献3(特開2005−99918号公報)には、管理モジュール装置を二個実装しておき、管理モジュール装置を二重化することが記載されている。
更に他の関連技術として、特許文献4(特開2006−285384号公報)には、複数の処理ノードを含むシステムにおける、管理プロセッサの障害を処理するプロセッサ処理方式が開示されている。このプロセッサ障害処理方式には、当該管理プロセッサを搭載する処理ノードとは別の処理ノードが搭載する管理プロセッサである外部管理プロセッサの障害の発生を検出する障害検出手段と、その障害検出手段がいずれかの外部管理プロセッサの障害の発生を検出すると、所定の割り込み信号を障害を発生した外部管理プロセッサに送信する割込手段と、いずれかの外部管理プロセッサから割り込み信号を受信すると、当該管理プロセッサの障害を復旧するための障害復旧処理を実行する障害復旧手段とを含むことが記載されている。
更に他の関連技術として、特許文献5(特開2004−318498号公報)には、ネットワークを介して相互に接続された複数の演算処理装置のフェールセーフ装置が記載されている。このフェールセーフ装置は、複数の演算処理装置を代替制御するための代替制御プログラムをそれぞれ記憶した代替制御プログラム記憶手段を備えており、演算処理手段は、故障した演算処理装置を検出したときに、故障した演算処理装置を代替する代替制御プログラムを読み出し、ネットワーク経由で故障した演算処理装置の代替制御を行う。
特開平10−301799号公報 特開2006−268742号公報 特開2005−99918号公報 特開2006−285384号公報 特開2004−318498号公報
本発明の目的は、管理用プロセッサが使用できなくても、管理用プロセッサを搭載したサーバの運用を続行することのできる、コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラムを提供することにある。
本発明に係るコンピュータ管理システムは、複数のサーバと、前記複数のサーバに接続された管理モジュール装置とを具備する。前記複数のサーバの各々は、管理プログラムを実行することにより前記各サーバの管理を行うサーバ用管理プロセッサを備える。前記管理モジュール装置は、前記複数のサーバ全体の管理を行う管理モジュールプロセッサと、前記複数のサーバのうちから選択される選択サーバを代替管理する代替用プロセッサと、前記管理プログラムと同じプログラムを代替プログラムとして格納するプログラム記憶部とを備える。前記管理モジュールプロセッサは、前記複数のサーバのうちから前記選択サーバを選択したときに、前記代替用プロセッサに対し、前記プログラム記憶部から前記代替プログラムを読み込ませる。前記代替用プロセッサは、読み込んだ前記代替プログラムを実行することにより、前記選択サーバを代替管理する。
本発明のコンピュータシステムの管理方法は、複数のサーバと、複数のサーバに接続されて複数のサーバ全体の管理を行う管理モジュール装置とを具備するコンピュータシステムの管理方法である。このコンピュータシステムの管理方法は、通常時に、複数のサーバの各々に設けられたサーバ用管理プロセッサが管理プログラムを実行することにより、各サーバを通常管理するステップと、予め、管理モジュール装置内に、管理プログラムと同じプログラムを代替プログラムとして格納しておくステップと、複数のサーバの中から選択サーバを選択するステップと、管理モジュール装置内の代替用プロセッサに、選択サーバの前記サーバ用管理プロセッサに対応する代替プログラムを読み込ませるステップと、代替用プロセッサが読み込んだ代替プログラムを実行することにより、選択サーバを代替管理するステップとを具備する。
本発明のコンピュータシステムの管理プログラムは、上述のコンピュータシステムの管理方法を、コンピュータにより実行させる、コンピュータシステムの管理プログラムである。
本発明によれば、管理用プロセッサが使用できなくても、管理用プロセッサにより管理されるサーバの運用を続行できる、コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラムが提供される。
(実施形態)
図面を参照しつつ、本発明の実施形態について説明する。図1は、本実施形態に係るコンピュータシステム1の概略構成図である。このコンピュータシステム1は、複数のサーバ2(2−1、2−2、・・・2−n)と、複数のサーバ2全体を管理する管理モジュール装置3とを備えている。このコンピュータシステム1は、複数のサーバ2と管理モジュール装置3とが、一つの筐体(図示せず)内に収納されたブレードサーバであるものとする。管理モジュール装置3は、システム管理用パス42及び管理プロセッサ代替用パス41を介して、複数のサーバ2の各々とアクセス可能に接続されている。また、管理モジュール装置3と複数のサーバ2との間には、バックプレーン4が設けられている。システム管理用パス42及び管理プロセッサ代替用パス41は、バックプレーン4を通って、管理モジュール装置3と各サーバ2とをアクセス可能に接続している。
まず、各サーバ2の構成について説明する。
各サーバ2は、運用系デバイス25と、サーバ用管理プロセッサ22と、第1切替装置21とを備えている。運用系デバイス25と第1切替装置21とは、サーバ管理用パス23を介して接続されている。サーバ用管理プロセッサ22と第1切替装置21とは、通常管理用パス24を介して接続されている。サーバ用管理プロセッサ22は、システム管理用パス42を介して管理モジュール装置3に接続されている。第1切替装置21は、管理プロセッサ代替用パス41を介して管理モジュール装置3に接続されている。
運用系デバイス25は、各サーバに要求された処理を実際に実行するためのデバイスであり、例えば、CPUなどのプロセッサを備えている。
サーバ用管理プロセッサ22は、運用系デバイス25とは別に設けられたプロセッサであり、運用系デバイス25の管理を行う。サーバ用管理プロセッサ22には、管理プログラム22−1がインストールされている。サーバ用管理プロセッサ22は、管理プログラム22−1を実行することにより、その機能を実現する。具体的には、サーバ用管理プロセッサ22は、運用系デバイス25の障害監視、障害発生時における電源のON/OFF制御、チップセットのレジスタアクセス、ホスト内部の温度監視、電圧監視、及びHW(ハードウェア)割り込み処理、等を行う。
第1切替装置21は、サーバ用管理プロセッサ22により運用系デバイス25の管理を行うか、管理モジュール装置3により運用系デバイス25の管理を行うかを切り替えるための装置である。第1切替装置21は、例えば、CPUがインストールされたプログラムを実行することにより、その機能を実現する。
続いて、管理モジュール装置3の構成について説明する。管理モジュール装置3は、管理モジュールプロセッサ31と、代替用管理プロセッサ32と、プログラム記憶部33と、第2切替装置50とを備えている。
管理モジュールプロセッサ31は、複数のサーバ2全体の管理を行うためのプロセッサである。管理モジュールプロセッサ31は、システム管理用パス42を介して、各サーバ2のサーバ用管理プロセッサ22に接続されている。また、管理モジュールプロセッサ31は、パス38を介して第2切替装置50と、パス35を介して代替用管理プロセッサ32と、パス39を介してプログラム記憶部33と、それぞれ接続されている。管理モジュールプロセッサ31は、システム管理用パス42を介して、各サーバ2の状態を監視したり、電源制御を行う。管理モジュールプロセッサ31は、CPUを有しており、予めROMなどに格納されたコンピュータシステム管理プログラムがそのCPUにより実行されることにより、その機能を実現する。
代替用管理プロセッサ32は、サーバ用管理プロセッサ22を代替するために設けられている。代替用管理プロセッサ32は、パス36を介して第2切替装置50と、パス37を介してプログラム記憶部33と、それぞれ接続されている。
プログラム記憶部33には、代替プログラムが格納されている。代替プログラムは、各サーバ2のサーバ用管理プロセッサ22にインストールされた管理プログラムと同じプログラムである。プログラム記憶部33には、複数のサーバ2にインストールされる可能性のある全ての管理プログラムについての代替プログラムが格納されている。プログラム記憶部33は、例えば、ハードディスクやROMなどにより実現される。
第2切替装置50は、代替用管理プロセッサ32と各サーバ2間の接続を切り替えるための装置である。第2切替装置21は、管理プロセッサ代替用パス41を介して、各サーバ2の第1切替装置50に接続されている。第2切替装置50は、例えば、CPUがインストールされたプログラムを実行することにより、その機能を実現する。
続いて、本実施形態に係るコンピュータシステム1の動作について説明する。
通常時には、各サーバ2において、サーバ用管理プロセッサ22が運用系デバイス25の管理を行う。すなわち、第1切替装置21は、通常管理用パス24をサーバ管理用パス23に接続しており、管理プロセッサ代替用パス41は無効状態とされている。
ここで、あるサーバ2のサーバ用管理プロセッサ22に障害が発生したとする。図2は、サーバ用管理プロセッサ22に障害が発生したときの動作方法を示すフローチャートである。
ステップS1;障害の検出
サーバ用管理プロセッサ22に障害が発生すると、管理モジュール装置3側では、管理モジュールプロセッサ31が、システム管理用パス42を介してサーバ用管理プロセッサ22の障害を検出する。管理モジュールプロセッサ31は、障害の検出されたサーバ用管理プロセッサ22を搭載しているサーバ2を、障害サーバ2(選択サーバ)として選択する。同時に、管理モジュールプロセッサ31は、障害サーバ2のサーバ用管理プロセッサ22が実行していた管理プログラムを特定する。管理プログラムを特定するには、たとえば、予め、サーバ2もしくはサーバ用管理プロセッサ22を特定する情報に対して、管理プログラムを特定する情報を対応付けて格納しておけばよい。
ステップS2;代替プログラムの指定
続いて、管理モジュールプロセッサ31は、パス39を介してプログラム記憶部33にアクセスする。そして、S1で特定した管理プログラムに相当する代替プログラムがどれであるかを検索する。検索後、管理モジュールプロセッサ31は、パス35を介して代替用管理プロセッサ32にアクセスし、検索により該当した代替プログラムを読み込むように指示する。
ステップS3;パスの切替
また、管理モジュールプロセッサ31は、パス38を介して第2切替装置50にアクセスし、障害サーバ2に接続される管理プロセッサ代替用パス41を有効とする。
ステップS4;代替プログラムの実行
代替プログラムの読み込み指示を受け付けた代替用管理プロセッサ32は、指定された代替プログラムをプログラム記憶部33から読み込み、実行する。また、代替用管理プロセッサ32は、管理プロセッサ代替用パス41を介して障害サーバ2の第1切替装置21にアクセスし、管理プロセッサ代替用パス41をサーバ管理用パス23に接続する。これ以降、障害サーバ2の運用系デバイス25は、サーバ用管理プロセッサ22ではなく、代替用管理プロセッサ32によって管理されることになる。
ステップS5;サーバ用管理プロセッサの復旧
管理モジュールプロセッサ31は、障害サーバ2の管理が代替用管理プロセッサ32により行われている間に、障害サーバ2のサーバ用管理プロセッサ22の管理プログラムを上書きする。そして、サーバ用管理プロセッサ22を再起動して、復旧を試みる。復旧した場合には、第1切替装置21及び第2切替装置50を切り替えて、通常時の管理に戻す。すなわち、サーバ用管理プロセッサ22により、運用系デバイス25の管理が行われる。
以上説明したステップS1〜5の動作により、サーバ用管理プロセッサ22が故障した場合でも、代替用管理プロセッサ32により代替管理が行われ、障害サーバ2の運用を続行することができる。
次に、あるサーバの管理プログラム22−1をアップデートする場合の動作について説明する。図3は、管理プログラム22−1をアップデートする場合の動作を示すフローチャートである。
ステップS11;アップデート指示の受け付け
図示しない入力装置を介して、ユーザから、管理モジュール装置3に、あるサーバ2の管理プログラム22−1を、指定された場所に格納されたプログラムにアップデートする旨の指示が入力されるとする。管理モジュール装置3では、管理モジュールプロセッサ31が、アップデート指示を受け付ける。管理モジュールプロセッサ31は、アップデート対象のサーバ2を、アップデートサーバ2(選択サーバ)として選択する。
ステップS12;代替プログラムのアップデート
アップデート指示を受け付けた管理モジュールプロセッサ31は、まず、プログラム記憶部39にアクセスして、アップデートサーバの管理プログラムに対応する代替プログラムを、アップデートする。
ステップS13;代替プログラムの読み込み指示
代替プログラムのアップデート後に、管理モジュールプロセッサ31は、代替用管理プロセッサ32にアクセスして、アップデートされた代替プログラムを読み込むように指示する。
ステップS14;パスの切替
また、管理モジュールプロセッサ31は、第2切替装置50にアクセスして、代替用管理プロセッサ32とアップデートサーバ2とがアクセス可能となるように、パス36と管理プロセッサ代替用パス41とを接続する。
ステップS15;代替プログラムの実行
読み込み指示を受けた代替用管理プロセッサ32は、プログラム記憶部33より、アップデートされた代替プログラムを読み込み、実行する。また、代替用管理プロセッサ32は、第1切替装置21にアクセスして、サーバ管理用パス23と管理プロセッサ代替用パス41とを接続する。これにより、アップデートサーバ2の運用系デバイス25は、代替用管理プロセッサ32によって管理されることとなる。
ステップS16;管理プログラムのアップデート
管理モジュールプロセッサ31は、アップデートサーバ2の運用系デバイス25が代替用管理プロセッサ32によって管理されている間に、アップデートサーバ2のサーバ用管理プロセッサ22に対して、指定された場所から管理プログラムをアップデートするように指示する。サーバ用管理プロセッサ22は、指示を受けて、アップデートを開始する。
管理プログラム22−1のアップデートが完了すると、管理モジュールプロセッサ31は、代替用管理プロセッサ32にアップデート完了通知を行う。アップデート完了通知を受け取った代替用管理プロセッサ32は、代替管理を終了する。
ステップS17;パスの切替
また、アップデートサーバ2では、サーバ管理用プロセッサ22が、第1切替装置21にアクセスして、運用系デバイス25の管理がサーバ管理用プロセッサ22によって行われるように、通常管理用パス24とサーバ管理用パス23とを接続する。また、管理モジュールプロセッサ31は第2切替装置50にアクセスして、パス36と管理プロセッサ代替用パス41との接続を切断する。
以上説明したステップS11〜17の動作により、プログラム記憶部33内の代替プログラムとサーバ用管理プロセッサ22の管理プログラムとの双方を、アップデートサーバ2の運用を停止することなく、アップデートすることができる。
本実施形態によれば、障害発生時やアップデート時などのように、サーバ用管理プロセッサ22が使用できない状態となった場合でも、代替用管理プロセッサ32により対象のサーバを代替管理することができ、サーバの運用を続行することが可能である。
通常、ブレードサーバのように複数のサーバを有するコンピュータシステムでは、システム全体を管理する管理モジュール装置が設けられる。ここで、サーバ側の管理用プロセッサが故障した場合、その機能を管理モジュール装置側から代替することが考えられる。しかし、複数のサーバの各々において、インストールされた管理プログラムが全て同じであるとは限らない。従って、単に管理モジュール装置側から代替管理を行うだけでは、代替できる機能は電源を安全にOFFする程度の基本的な処理に限られてしまい、そのサーバの運用を継続することはできない。また、複数のサーバのうちの一のサーバの管理を、他のサーバによって代替することも考えられる。しかしこの場合も、複数のサーバで管理プログラムが全て同じであるとは限らないので、代替できる機能は基本的な処理に限られてしまう。
これに対して、本実施形態によれば、代替管理用プロセッサ32が管理プロセッサと同じ代替プログラムを読み込んで実行するので、サーバ用管理プロセッサ22と全く同じ機能を代替することができる。従って、サーバの運用をそのまま続行することができる。
また、故障時やアップデート時にもサーバの管理を続行できるようにするために、個々のサーバ内で管理プロセッサを二重化させることが考えられる。しかし、個々のサーバ内で管理プロセッサを二重化するには、一つのサーバに対して管理プロセッサが二個必要であり、コストが高くなってしまう。
これに対して、本実施形態によれば、複数のサーバ2に対して、一つの代替用管理プロセッサを用意するだけでよい。よって、各サーバ内で管理プロセッサを二重化する場合に比べて、コストを大幅に抑えられる。
また、本実施形態では、管理モジュールプロセッサ31とは別に、代替用管理プロセッサ32が設けられている。従って、代替用管理プロセッサ32があるサーバの代替管理を行っている間にも管理モジュールプロセッサ31によって複数のサーバ2全体の管理を続行することが可能である。すなわち、管理モジュール装置3としての機能を停止することなく、あるサーバの代替管理を行うことができる。
また、代替用管理プロセッサ32は、通常動作時には、管理モジュールプロセッサ31の補助的役割を果たすように構成することもできる。このようにすれば、単に代替用プロセッサ32の機能を代替管理に限定する場合に比べて、資源を有効に活用できる。
尚、本実施形態では、第2切替装置50が管理モジュール装置3内に設けられている場合について説明した。しかし、第2切替装置50は必ずしも管理モジュール装置3内に設けられている必要はない。例えば、図4の変形例に示されるように、バックプレーン4上に第2切替装置50が設けられていてもよい。この図4の変形例のように構成しても、本実施形態と同様の作用を奏することができる。また、バックプレーン4と管理モジュール装置3との間の配線量を削減することができる。
また、本実施形態では、第2切替装置50により、複数のサーバ2のうちのどのサーバへの管理プロセッサ代替用パス41を有効にするかが選択される場合について説明した。しかし、別の方式により、複数のサーバ2の中から有効にする管理プロセッサ代替用パス41を選択するようにしてもよい。例えば、図5に示される変形例では、第2切替装置50として、全サーバに対応する管理用プロセッサ代替用パス41がバスに接続されている。このバスには、固有のアドレスが設定されている。代替用管理プロセッサ32は、バスのアドレスを指定することにより、代替管理すべきサーバ2にアクセス可能となっている。この図5に示される変形例のような構成としても、本実施形態と同様の作用を奏することができる。
図6Aは、本実施形態の変形例を示している。この変形例では、第1切替装置21部分において、通常管理用パス24、管理プロセッサ代替用パス41、及びサーバ管理用パス23がバスを介して接続されている。このバスには、固有のアドレスが割り当てられている。代替管理用プロセッサ32は、第2切替装置50を介してこのバスを切り替えることにより、管理プロセッサ代替用パス41の有効/無効を制御する。この図6Aの変形例のような構成においても、本実施形態と同様の作用を奏することができる。また、この図6Aの変形例において、図4に示した変形例のように、第2切替装置50をバックプレーン4上に配置してもよい。
また、第1切替え装置21部分に関する更に他の変形例として、第1切替装置21自身がサーバ用管理プロセッサ22の故障を検出し、第1切替装置21が自動的にパスを切り替えるように構成することもできる。この場合、サーバ用管理プロセッサ22と第1切替装置21とが、サーバ用管理プロセッサが故障したときにレベルが変わるような信号線により接続されていればよい。
また、図6Bは、第1切替装置21部分に関する更に他の変形例を示している。この変形例では、第1切替装置21と管理モジュールプロセッサ31との間が、サーバ用管理プロセッサ22を介することのないパス40により接続されている。第1切替装置21は、代替用管理プロセッサ32によってではなく、パス40を介して管理モジュールプロセッサ31によって切り替えられる。この図6Bに示されるような構成としても、本実施形態と同様の作用を奏することができる。
図7は、本実施形態の更に別の変形例を示している。図7に示される変形例では、サーバ用管理プロセッサ22が、サーバ2に対して、hot−swap可能に取り付けられている。同様に、代替用管理プロセッサ32も、管理モジュール装置3に対して、hot−swap可能に取り付けられている。この図7の変形例のような構成によれば、サーバ用管理プロセッサ22が故障している時に、代替用管理プロセッサ32により代替管理を行っておき、その間に故障したサーバ用管理プロセッサ22を交換することができる。すなわち、コンピュータシステム1を停止することなく、また、サーバ2の管理機能を停止することなく、サーバ用管理プロセッサ22を交換することが可能となる。
尚、図1、図4乃至7に示した変形例は、矛盾のない範囲内で組み合わせることが可能である。
本発明の実施形態の概略構成図である。 障害発生時におけるフローチャートである。 アップデート時におけるフローチャートである。 本発明の実施形態の変形例を示す概略構成図である。 本発明の実施形態の他の変形例を示す概略構成図である。 本発明の実施形態の更に他の変形例を示す概略構成図である。 本発明の実施形態の更に他の変形例を示す概略構成図である。 本発明の実施形態の更に他の変形例を示す概略構成図である。
符号の説明
1 サーバシステム
2 サーバ
3 管理モジュール装置
4 バックプレーン
21 第1切替部
22 サーバ用管理プロセッサ
23 サーバ管理用パス
24 通常管理用パス
25 運用系デバイス
31 管理モジュールプロセッサ
32 代替用プロセッサ
33 プログラム記憶部
34 プログラムテーブル
35 パス
36 パス
37 パス
38 パス
39 パス
41 管理プロセッサ代替パス
42 システム管理用パス
50 第2切替部

Claims (20)

  1. 複数のサーバと、
    前記複数のサーバに接続された管理モジュール装置と
    を具備し、
    前記複数のサーバの各々は、管理プログラムを実行することにより前記各サーバの管理を行うサーバ用管理プロセッサを備え、
    前記管理モジュール装置は、
    前記複数のサーバ全体の管理を行う管理モジュールプロセッサと、
    前記複数のサーバのうちから選択される選択サーバを代替管理する代替用プロセッサと、
    前記管理プログラムと同じプログラムを代替プログラムとして格納するプログラム記憶部とを備え、
    前記管理モジュールプロセッサは、前記複数のサーバのなかから前記選択サーバが選択されたときに、前記代替用プロセッサに対し、前記プログラム記憶部から前記代替プログラムを読み込ませ、
    前記代替用プロセッサは、読み込んだ前記代替プログラムを実行することにより、前記選択サーバを代替管理する
    コンピュータ管理システム。
  2. 請求項1に記載されたコンピュータ管理システムであって、
    前記管理モジュールプロセッサは、前記サーバ用管理プロセッサが故障した前記サーバを、前記選択サーバとして選択する
    コンピュータ管理システム。
  3. 請求項1又は2に記載されたコンピュータ管理システムであって、
    前記各サーバには、前記サーバ用管理プロセッサによる管理を行うか前記代替用管理プロセッサによる管理を行うかを切り替える、第1切替手段が設けられている
    コンピュータ管理システム。
  4. 請求項3に記載されたコンピュータ管理システムであって、
    前記第1切替手段は、前記代替用管理プロセッサにより切り替えられる
    コンピュータ管理システム。
  5. 請求項4に記載されたコンピュータ管理システムであって、
    前記第1切替手段は、前記サーバ用管理プロセッサに接続された通常管理用パスと、前記代替用管理プロセッサに接続された代替管理用パスと、サーバ内部の管理を行う為のサーバ管理用パスとをバスを介して接続する部分であり、
    前記第1切替手段には、同一バス内で固有のアドレスが設定されており、
    前記代替用プロセッサは、前記アドレスを指定することによって、前記第1切替手段の切替を行う
    コンピュータ管理システム。
  6. 請求項4に記載されたコンピュータ管理システムであって、
    前記第1切替手段は、前記サーバ用管理プロセッサが故障したことを検知し、前記サーバ用管理プロセッサの故障を契機として、自動的に、前記選択サーバの管理を行うプロセッサを前記サーバ用管理プロセッサから前記代替用管理プロセッサに切り替える
    コンピュータ管理システム。
  7. 請求項1乃至6のいずれかに記載されたコンピュータ管理システムであって、
    前記管理モジュールプロセッサは、指定されたサーバの前記管理プログラムをアップデートする旨の指示を受け付けたときに、前記指定されたサーバを前記選択サーバとして選択する
    コンピュータ管理システム。
  8. 請求項7に記載されたコンピュータ管理システムであって、
    前記管理モジュールプロセッサは、前記アップデートする旨の指示を受け付けたときに、前記プログラム記憶部内の前記代替プログラムをアップデートし、
    前記代替用管理プロセッサは、アップデートされた前記代替プログラムを読みこんで実行することにより、前記選択サーバを代替管理し、
    前記選択サーバの前記サーバ用管理プロセッサは、前記代替用管理プロセッサによる代替管理が行われている間に、前記管理プログラムをアップデートする
    コンピュータ管理システム。
  9. 請求項1乃至8のいずれかに記載されたコンピュータ管理システムであって、
    更に、
    前記複数のサーバのうちのどのサーバを前記代替用管理プロセッサが管理するかを切り替える、第2切替手段
    を具備する
    コンピュータ管理システム。
  10. 請求項9に記載されたコンピュータ管理システムであって、
    更に、
    バックプレーン
    を具備し、
    前記複数のサーバと前記管理モジュール装置とは、前記バックプレーンを介して接続されており、
    前記第2切替手段は、前記バックプレーンに設けられている
    コンピュータ管理システム。
  11. 請求項1乃至9のいずれかに記載されたコンピュータ管理システムであって、
    前記サーバ用管理プロセッサは、前記各サーバに対して、Hot−swap可能に取り付けられている
    コンピュータ管理システム。
  12. 複数のサーバと、前記複数のサーバに接続されて前記複数のサーバ全体の管理を行う管理モジュール装置とを具備するコンピュータシステムの管理方法であって、
    通常時に、前記複数のサーバの各々に設けられたサーバ用管理プロセッサが管理プログラムを実行することにより、前記各複数のサーバを通常管理するステップと、
    予め、前記管理モジュール装置内に、前記管理プログラムと同じプログラムを代替プログラムとして格納しておくステップと、
    前記複数のサーバの中から選択サーバを選択するステップと、
    前記選択するステップの後に、前記管理モジュール装置内の前記代替用プロセッサに、前記代替プログラムを読み込ませるステップと、
    前記代替用プロセッサが読み込んだ前記代替プログラムを実行することにより、前記選択サーバを代替管理するステップと、
    を具備する
    コンピュータシステムの管理方法。
  13. 請求項12に記載されたコンピュータシステムの管理方法であって、
    前記選択するステップは、前記サーバ用管理プロセッサの故障した前記サーバを、前記選択サーバとして選択するステップを含む
    コンピュータシステムの管理方法。
  14. 請求項12または13に記載されたコンピュータシステムの管理方法であって、
    前記選択するステップは、指定されたサーバの前記管理プログラムをアップデートする旨の指示を受け付けたときに、前記指定されたサーバを前記選択サーバとして選択するステップを含む
    コンピュータシステムの管理方法。
  15. 請求項14に記載されたコンピュータシステムの管理方法であって、
    更に、
    前記アップデートする旨の指示を受け付けたときに、前記管理モジュール装置内の前記代替プログラムをアップデートするステップと、
    前記選択サーバが代替管理されている間に、前記選択サーバ内の前記管理プログラムをアップデートするステップと、
    を具備し、
    前記代替管理するステップは、アップデートされた前記代替プログラムを読みこんで実行することにより、前記選択サーバを代替管理するステップを含む
    コンピュータシステムの管理方法。
  16. 請求項12乃至15のいずれかに記載されたコンピュータシステムの管理方法であって、
    更に、
    前記サーバ用管理プロセッサによる管理を行うか前記代替用管理プロセッサによる管理を行うかを切り替えるステップを備えている
    を具備する
    コンピュータシステムの管理方法。
  17. 請求項12乃至16のいずれかに記載されたコンピュータシステムの管理方法であって、
    更に、
    前記複数のうちのどのサーバを代替管理するかを切り替えるステップ
    を具備する
    コンピュータシステムの管理方法。
  18. 請求項12乃至17のいずれかに記載されたコンピュータシステムの管理方法であって、
    更に、
    前記複数のサーバの各々に対して固有のアドレスを設定するステップ、
    を具備し、
    前記代替管理するステップは、前記アドレスを指定することにより、前記複数のサーバの中から前記選択サーバを選択的に代替管理する
    コンピュータシステムの管理方法。
  19. 請求項12乃至18のいずれかに記載されたコンピュータシステムの管理方法であって、
    更に、
    前記サーバ用管理プロセッサを、前記各サーバに対して、Hot−swap可能に取り付けるステップ
    を具備する
    コンピュータシステムの管理方法。
  20. 請求項12乃至19のいずれかに記載されたコンピュータシステムの管理方法を、コンピュータにより実行させる、コンピュータシステム管理プログラム。
JP2008100217A 2008-04-08 2008-04-08 コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム Expired - Fee Related JP5439736B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008100217A JP5439736B2 (ja) 2008-04-08 2008-04-08 コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008100217A JP5439736B2 (ja) 2008-04-08 2008-04-08 コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム

Publications (2)

Publication Number Publication Date
JP2009252009A true JP2009252009A (ja) 2009-10-29
JP5439736B2 JP5439736B2 (ja) 2014-03-12

Family

ID=41312647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008100217A Expired - Fee Related JP5439736B2 (ja) 2008-04-08 2008-04-08 コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム

Country Status (1)

Country Link
JP (1) JP5439736B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004082A (ja) * 2011-06-21 2013-01-07 Quanta Computer Inc サーバラックシステム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09218788A (ja) * 1996-02-09 1997-08-19 Fujitsu Ltd インサービス直接ダウンロード方式
JP2004318498A (ja) * 2003-04-16 2004-11-11 Toyota Central Res & Dev Lab Inc フェールセーフ装置
JP2005099918A (ja) * 2003-09-22 2005-04-14 Hitachi Cable Ltd 二重化管理ネットワーク装置
JP2005182484A (ja) * 2003-12-19 2005-07-07 Nec Corp 通信装置およびプログラム更新方法
JP2005228308A (ja) * 2004-02-12 2005-08-25 Internatl Business Mach Corp <Ibm> サーバ・シャーシ内のブレード・サービス・プロセッサのフラッシュの失敗を回復するための方法およびシステム
JP2006285384A (ja) * 2005-03-31 2006-10-19 Nec Corp プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法
JP2008033836A (ja) * 2006-07-31 2008-02-14 Fujitsu Ltd 伝送装置およびソフトウェア自動更新方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09218788A (ja) * 1996-02-09 1997-08-19 Fujitsu Ltd インサービス直接ダウンロード方式
JP2004318498A (ja) * 2003-04-16 2004-11-11 Toyota Central Res & Dev Lab Inc フェールセーフ装置
JP2005099918A (ja) * 2003-09-22 2005-04-14 Hitachi Cable Ltd 二重化管理ネットワーク装置
JP2005182484A (ja) * 2003-12-19 2005-07-07 Nec Corp 通信装置およびプログラム更新方法
JP2005228308A (ja) * 2004-02-12 2005-08-25 Internatl Business Mach Corp <Ibm> サーバ・シャーシ内のブレード・サービス・プロセッサのフラッシュの失敗を回復するための方法およびシステム
JP2006285384A (ja) * 2005-03-31 2006-10-19 Nec Corp プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法
JP2008033836A (ja) * 2006-07-31 2008-02-14 Fujitsu Ltd 伝送装置およびソフトウェア自動更新方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004082A (ja) * 2011-06-21 2013-01-07 Quanta Computer Inc サーバラックシステム

Also Published As

Publication number Publication date
JP5439736B2 (ja) 2014-03-12

Similar Documents

Publication Publication Date Title
US8423816B2 (en) Method and computer system for failover
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP4448878B2 (ja) 障害回復環境の設定方法
JP2010510592A (ja) システムプロセッサーのトランスペアレントな交換
JP2008186296A (ja) ストレージシステム、ストレージ装置、ファームウェアの活性交換方法、ファームウェアの活性交換プログラム
JP5545108B2 (ja) ストレージシステム、制御装置および制御方法
JP2011145910A (ja) 情報処理装置及び情報処理装置のファームウェア更新方法
JP2007172334A (ja) 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
EP2535817B1 (en) Information processing system
JP4655718B2 (ja) コンピュータシステム及びその制御方法
CN111585835A (zh) 一种带外管理系统的控制方法、装置和存储介质
JP5056504B2 (ja) 制御装置、情報処理システム、情報処理システムの制御方法および情報処理システムの制御プログラム
JP2011034161A (ja) サーバシステム及びサーバシステムの管理方法
JP5445572B2 (ja) コンピュータシステム、待機電力削減方法、及びプログラム
US7437445B1 (en) System and methods for host naming in a managed information environment
JP5439736B2 (ja) コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム
JP5332257B2 (ja) サーバシステム、サーバ管理方法、およびそのプログラム
JP2008015704A (ja) マルチプロセッサシステム
JP2009003537A (ja) 計算機
JP7212510B2 (ja) 電源管理装置、電源管理方法、及び電源管理プログラム
JP2002049509A (ja) データ処理システム
JP2009026182A (ja) プログラム実行システム及び実行装置
JP2006072492A (ja) システム制御装置、システム制御方法およびシステム制御プログラム
JP7511151B2 (ja) 照明制御システム及びバックアップコントローラ
JPH10133963A (ja) 計算機の故障検出・回復方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131202

R150 Certificate of patent or registration of utility model

Ref document number: 5439736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees