JP5439736B2 - Computer management system, computer system management method, and computer system management program - Google Patents

Computer management system, computer system management method, and computer system management program Download PDF

Info

Publication number
JP5439736B2
JP5439736B2 JP2008100217A JP2008100217A JP5439736B2 JP 5439736 B2 JP5439736 B2 JP 5439736B2 JP 2008100217 A JP2008100217 A JP 2008100217A JP 2008100217 A JP2008100217 A JP 2008100217A JP 5439736 B2 JP5439736 B2 JP 5439736B2
Authority
JP
Japan
Prior art keywords
management
server
processor
path
replacement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008100217A
Other languages
Japanese (ja)
Other versions
JP2009252009A (en
Inventor
亮文 松熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008100217A priority Critical patent/JP5439736B2/en
Publication of JP2009252009A publication Critical patent/JP2009252009A/en
Application granted granted Critical
Publication of JP5439736B2 publication Critical patent/JP5439736B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Description

本発明は、コンピュータ管理システムに関し、特に、サーバシステムの管理を行うコンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラムに関する。   The present invention relates to a computer management system, and more particularly to a computer management system for managing a server system, a computer system management method, and a computer system management program.

複数のサーバを用いたサーバシステムが知られている。そのようなサーバシステムでは、実際にサーバに要求される処理を実行するためのプロセッサとは別に、管理用プロセッサが設けられる(例えば、特許文献1(特開平10−301799号公報)参照)。管理用プロセッサは、各サーバ内に設けられたデバイスのマネジメント処理を行うためのプロセッサである。具体的には、管理プロセッサは、各サーバ内の状態(温度や電圧など)の監視、電源のON/OFFの制御、シーケンスの制御、及び内部のデバイスの障害を監視などを行う。そして、サーバ内に異常が認められた場合には、サーバ外に通知したり、そのサーバの運用を停止したりする。   A server system using a plurality of servers is known. In such a server system, a management processor is provided in addition to a processor for actually executing processing required for the server (see, for example, Patent Document 1 (Japanese Patent Laid-Open No. 10-301799)). The management processor is a processor for performing management processing of devices provided in each server. Specifically, the management processor performs monitoring of the state (temperature, voltage, etc.) in each server, control of power ON / OFF, control of sequence, and failure of internal devices. If an abnormality is recognized in the server, it is notified outside the server or the operation of the server is stopped.

しかし、この管理用プロセッサ自体も故障してしまうことがある。また、管理用プロセッサが実行する管理プログラムをアップデートする際には、管理用プロセッサによる管理を停止する必要がある。管理用プロセッサを動かすことができなければ、内部のデバイスの動作には異常がなくても、電源制御や障害処理を行うことができなくなる。従って、実際の運用系には関係なく、運用停止状態になってしまう。   However, this management processor itself may also fail. Also, when updating the management program executed by the management processor, it is necessary to stop the management by the management processor. If the management processor cannot be moved, power control and failure processing cannot be performed even if there is no abnormality in the operation of the internal device. Therefore, the operation is stopped regardless of the actual operation system.

従って、管理用プロセッサが故障したり、管理プログラムのアップデート中であったとしても、その管理用プロセッサを搭載するサーバの運用を続行できることが望まれる。   Therefore, even if the management processor breaks down or the management program is being updated, it is desirable that the operation of the server equipped with the management processor can be continued.

尚、関連技術として、特許文献2(特開2006−268742号公報)に記載されるコンピュータが挙げられる。このコンピュータは、コンピュータのデバイスと接続されデバイスの監視及び電源制御の少なくとも一つを行うとともに、コンピュータ外部の装置に接続されるコントローラと、コントローラの障害を検出する障害検出部とを備える。このコンピュータでは、障害検出部からコントローラの障害検出の通知を受けたとき、コントローラとデバイスとのパスを切り離すと共に、コンピュータ外部の装置とデバイスとのパスを接続するように切替制御を行い、コンピュータ外部の装置からデバイスの監視及び電源制御の少なくとも一つを行うことを可能としている。   In addition, as a related technique, the computer described in patent document 2 (Unexamined-Japanese-Patent No. 2006-268742) is mentioned. The computer is connected to a computer device and performs at least one of monitoring and power control of the device, and includes a controller connected to a device external to the computer and a failure detection unit that detects a failure of the controller. In this computer, when a fault detection notification is received from the fault detection unit, the path between the controller and the device is disconnected and the switching control is performed so that the path between the device outside the computer and the device is connected. It is possible to perform at least one of device monitoring and power supply control from this apparatus.

他の関連技術として、特許文献3(特開2005−99918号公報)には、管理モジュール装置を二個実装しておき、管理モジュール装置を二重化することが記載されている。   As another related technique, Patent Document 3 (Japanese Patent Laid-Open No. 2005-99918) describes that two management module devices are mounted and the management module device is duplicated.

更に他の関連技術として、特許文献4(特開2006−285384号公報)には、複数の処理ノードを含むシステムにおける、管理プロセッサの障害を処理するプロセッサ処理方式が開示されている。このプロセッサ障害処理方式には、当該管理プロセッサを搭載する処理ノードとは別の処理ノードが搭載する管理プロセッサである外部管理プロセッサの障害の発生を検出する障害検出手段と、その障害検出手段がいずれかの外部管理プロセッサの障害の発生を検出すると、所定の割り込み信号を障害を発生した外部管理プロセッサに送信する割込手段と、いずれかの外部管理プロセッサから割り込み信号を受信すると、当該管理プロセッサの障害を復旧するための障害復旧処理を実行する障害復旧手段とを含むことが記載されている。   As another related technique, Patent Document 4 (Japanese Patent Laid-Open No. 2006-285384) discloses a processor processing method for processing a failure of a management processor in a system including a plurality of processing nodes. This processor fault processing method includes a fault detection unit that detects the occurrence of a fault in an external management processor that is a management processor installed in a processing node different from the processing node in which the management processor is installed, and the fault detection unit. When the occurrence of a failure in the external management processor is detected, an interrupt means for transmitting a predetermined interrupt signal to the external management processor in which the failure has occurred, and when an interrupt signal is received from any of the external management processors, And a failure recovery means for executing a failure recovery process for recovering a failure.

更に他の関連技術として、特許文献5(特開2004−318498号公報)には、ネットワークを介して相互に接続された複数の演算処理装置のフェールセーフ装置が記載されている。このフェールセーフ装置は、複数の演算処理装置を代替制御するための代替制御プログラムをそれぞれ記憶した代替制御プログラム記憶手段を備えており、演算処理手段は、故障した演算処理装置を検出したときに、故障した演算処理装置を代替する代替制御プログラムを読み出し、ネットワーク経由で故障した演算処理装置の代替制御を行う。   As another related technique, Patent Document 5 (Japanese Patent Application Laid-Open No. 2004-318498) describes a fail-safe device of a plurality of arithmetic processing devices connected to each other via a network. This fail-safe device includes an alternative control program storage unit that stores an alternative control program for performing alternative control of a plurality of arithmetic processing units. When the arithmetic processing unit detects a faulty arithmetic processing unit, An alternative control program for substituting the failed arithmetic processing unit is read, and alternative control of the faulty arithmetic processing unit is performed via the network.

特開平10−301799号公報JP-A-10-301799 特開2006−268742号公報JP 2006-268742 A 特開2005−99918号公報JP-A-2005-99918 特開2006−285384号公報JP 2006-285384 A 特開2004−318498号公報JP 2004-318498 A

本発明の目的は、管理用プロセッサが使用できなくても、管理用プロセッサを搭載したサーバの運用を続行することのできる、コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラムを提供することにある。   An object of the present invention is to provide a computer management system, a computer system management method, and a computer system management program capable of continuing operation of a server equipped with a management processor even when the management processor cannot be used. There is to do.

本発明に係るコンピュータ管理システムは、複数のサーバと、前記複数のサーバに接続された管理モジュール装置とを具備する。前記複数のサーバの各々は、管理プログラムを実行することにより前記各サーバの管理を行うサーバ用管理プロセッサを備える。前記管理モジュール装置は、前記複数のサーバ全体の管理を行う管理モジュールプロセッサと、前記複数のサーバのうちから選択される選択サーバを代替管理する代替用プロセッサと、前記管理プログラムと同じプログラムを代替プログラムとして格納するプログラム記憶部とを備える。前記管理モジュールプロセッサは、前記複数のサーバのうちから前記選択サーバを選択したときに、前記代替用プロセッサに対し、前記プログラム記憶部から前記代替プログラムを読み込ませる。前記代替用プロセッサは、読み込んだ前記代替プログラムを実行することにより、前記選択サーバを代替管理する。   A computer management system according to the present invention includes a plurality of servers and a management module device connected to the plurality of servers. Each of the plurality of servers includes a server management processor that manages each of the servers by executing a management program. The management module device includes a management module processor that manages the plurality of servers as a whole, a replacement processor that replaces and manages a selected server selected from the plurality of servers, and a replacement program that is the same program as the management program As a program storage unit. The management module processor causes the replacement processor to read the replacement program from the program storage unit when the selected server is selected from the plurality of servers. The replacement processor manages the selection server by executing the read replacement program.

本発明のコンピュータシステムの管理方法は、複数のサーバと、複数のサーバに接続されて複数のサーバ全体の管理を行う管理モジュール装置とを具備するコンピュータシステムの管理方法である。このコンピュータシステムの管理方法は、通常時に、複数のサーバの各々に設けられたサーバ用管理プロセッサが管理プログラムを実行することにより、各サーバを通常管理するステップと、予め、管理モジュール装置内に、管理プログラムと同じプログラムを代替プログラムとして格納しておくステップと、複数のサーバの中から選択サーバを選択するステップと、管理モジュール装置内の代替用プロセッサに、選択サーバの前記サーバ用管理プロセッサに対応する代替プログラムを読み込ませるステップと、代替用プロセッサが読み込んだ代替プログラムを実行することにより、選択サーバを代替管理するステップとを具備する。   The computer system management method of the present invention is a computer system management method comprising a plurality of servers and a management module device connected to the plurality of servers and managing the plurality of servers as a whole. In this computer system management method, the server management processor provided in each of the plurality of servers normally executes a management program so that each server is normally managed, and in advance in the management module device, Corresponding to the server management processor of the selected server, the step of storing the same program as the management program as a substitute program, the step of selecting a selected server from a plurality of servers, and the replacement processor in the management module device And a step of replacing the selected server by executing the replacement program read by the replacement processor.

本発明のコンピュータシステムの管理プログラムは、上述のコンピュータシステムの管理方法を、コンピュータにより実行させる、コンピュータシステムの管理プログラムである。   The computer system management program of the present invention is a computer system management program that causes a computer to execute the above-described computer system management method.

本発明によれば、管理用プロセッサが使用できなくても、管理用プロセッサにより管理されるサーバの運用を続行できる、コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラムが提供される。   According to the present invention, there are provided a computer management system, a computer system management method, and a computer system management program capable of continuing the operation of a server managed by the management processor even when the management processor cannot be used. .

(実施形態)
図面を参照しつつ、本発明の実施形態について説明する。図1は、本実施形態に係るコンピュータシステム1の概略構成図である。このコンピュータシステム1は、複数のサーバ2(2−1、2−2、・・・2−n)と、複数のサーバ2全体を管理する管理モジュール装置3とを備えている。このコンピュータシステム1は、複数のサーバ2と管理モジュール装置3とが、一つの筐体(図示せず)内に収納されたブレードサーバであるものとする。管理モジュール装置3は、システム管理用パス42及び管理プロセッサ代替用パス41を介して、複数のサーバ2の各々とアクセス可能に接続されている。また、管理モジュール装置3と複数のサーバ2との間には、バックプレーン4が設けられている。システム管理用パス42及び管理プロセッサ代替用パス41は、バックプレーン4を通って、管理モジュール装置3と各サーバ2とをアクセス可能に接続している。
(Embodiment)
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a schematic configuration diagram of a computer system 1 according to the present embodiment. The computer system 1 includes a plurality of servers 2 (2-1, 2-2,..., 2-n) and a management module device 3 that manages the plurality of servers 2 as a whole. This computer system 1 is assumed to be a blade server in which a plurality of servers 2 and a management module device 3 are housed in a single housing (not shown). The management module device 3 is connected to each of the plurality of servers 2 via a system management path 42 and a management processor replacement path 41 so as to be accessible. A backplane 4 is provided between the management module device 3 and the plurality of servers 2. The system management path 42 and the management processor replacement path 41 pass through the backplane 4 and connect the management module device 3 and each server 2 in an accessible manner.

まず、各サーバ2の構成について説明する。   First, the configuration of each server 2 will be described.

各サーバ2は、運用系デバイス25と、サーバ用管理プロセッサ22と、第1切替装置21とを備えている。運用系デバイス25と第1切替装置21とは、サーバ管理用パス23を介して接続されている。サーバ用管理プロセッサ22と第1切替装置21とは、通常管理用パス24を介して接続されている。サーバ用管理プロセッサ22は、システム管理用パス42を介して管理モジュール装置3に接続されている。第1切替装置21は、管理プロセッサ代替用パス41を介して管理モジュール装置3に接続されている。   Each server 2 includes an operational device 25, a server management processor 22, and a first switching device 21. The active device 25 and the first switching device 21 are connected via a server management path 23. The server management processor 22 and the first switching device 21 are connected via a normal management path 24. The server management processor 22 is connected to the management module device 3 via a system management path 42. The first switching device 21 is connected to the management module device 3 via a management processor replacement path 41.

運用系デバイス25は、各サーバに要求された処理を実際に実行するためのデバイスであり、例えば、CPUなどのプロセッサを備えている。   The operational device 25 is a device for actually executing processing requested by each server, and includes a processor such as a CPU, for example.

サーバ用管理プロセッサ22は、運用系デバイス25とは別に設けられたプロセッサであり、運用系デバイス25の管理を行う。サーバ用管理プロセッサ22には、管理プログラム22−1がインストールされている。サーバ用管理プロセッサ22は、管理プログラム22−1を実行することにより、その機能を実現する。具体的には、サーバ用管理プロセッサ22は、運用系デバイス25の障害監視、障害発生時における電源のON/OFF制御、チップセットのレジスタアクセス、ホスト内部の温度監視、電圧監視、及びHW(ハードウェア)割り込み処理、等を行う。   The server management processor 22 is a processor provided separately from the operational device 25 and manages the operational device 25. A management program 22-1 is installed in the server management processor 22. The server management processor 22 realizes its function by executing the management program 22-1. Specifically, the server management processor 22 monitors the failure of the active device 25, power ON / OFF control when a failure occurs, chip set register access, host internal temperature monitoring, voltage monitoring, and hardware (HW) Ware) Interrupt processing, etc.

第1切替装置21は、サーバ用管理プロセッサ22により運用系デバイス25の管理を行うか、管理モジュール装置3により運用系デバイス25の管理を行うかを切り替えるための装置である。第1切替装置21は、例えば、CPUがインストールされたプログラムを実行することにより、その機能を実現する。   The first switching device 21 is a device for switching between management of the active device 25 by the server management processor 22 and management of the active device 25 by the management module device 3. For example, the first switching device 21 realizes its function by executing a program in which a CPU is installed.

続いて、管理モジュール装置3の構成について説明する。管理モジュール装置3は、管理モジュールプロセッサ31と、代替用管理プロセッサ32と、プログラム記憶部33と、第2切替装置50とを備えている。   Next, the configuration of the management module device 3 will be described. The management module device 3 includes a management module processor 31, a replacement management processor 32, a program storage unit 33, and a second switching device 50.

管理モジュールプロセッサ31は、複数のサーバ2全体の管理を行うためのプロセッサである。管理モジュールプロセッサ31は、システム管理用パス42を介して、各サーバ2のサーバ用管理プロセッサ22に接続されている。また、管理モジュールプロセッサ31は、パス38を介して第2切替装置50と、パス35を介して代替用管理プロセッサ32と、パス39を介してプログラム記憶部33と、それぞれ接続されている。管理モジュールプロセッサ31は、システム管理用パス42を介して、各サーバ2の状態を監視したり、電源制御を行う。管理モジュールプロセッサ31は、CPUを有しており、予めROMなどに格納されたコンピュータシステム管理プログラムがそのCPUにより実行されることにより、その機能を実現する。   The management module processor 31 is a processor for managing the entire plurality of servers 2. The management module processor 31 is connected to the server management processor 22 of each server 2 via a system management path 42. Further, the management module processor 31 is connected to the second switching device 50 via the path 38, the replacement management processor 32 via the path 35, and the program storage unit 33 via the path 39. The management module processor 31 monitors the state of each server 2 and performs power supply control via the system management path 42. The management module processor 31 has a CPU, and realizes its function by a computer system management program stored in advance in a ROM or the like being executed by the CPU.

代替用管理プロセッサ32は、サーバ用管理プロセッサ22を代替するために設けられている。代替用管理プロセッサ32は、パス36を介して第2切替装置50と、パス37を介してプログラム記憶部33と、それぞれ接続されている。   The replacement management processor 32 is provided to replace the server management processor 22. The replacement management processor 32 is connected to the second switching device 50 via the path 36 and the program storage unit 33 via the path 37.

プログラム記憶部33には、代替プログラムが格納されている。代替プログラムは、各サーバ2のサーバ用管理プロセッサ22にインストールされた管理プログラムと同じプログラムである。プログラム記憶部33には、複数のサーバ2にインストールされる可能性のある全ての管理プログラムについての代替プログラムが格納されている。プログラム記憶部33は、例えば、ハードディスクやROMなどにより実現される。   The program storage unit 33 stores alternative programs. The alternative program is the same program as the management program installed in the server management processor 22 of each server 2. The program storage unit 33 stores alternative programs for all management programs that may be installed in the plurality of servers 2. The program storage unit 33 is realized by, for example, a hard disk or a ROM.

第2切替装置50は、代替用管理プロセッサ32と各サーバ2間の接続を切り替えるための装置である。第2切替装置21は、管理プロセッサ代替用パス41を介して、各サーバ2の第1切替装置50に接続されている。第2切替装置50は、例えば、CPUがインストールされたプログラムを実行することにより、その機能を実現する。   The second switching device 50 is a device for switching the connection between the replacement management processor 32 and each server 2. The second switching device 21 is connected to the first switching device 50 of each server 2 via the management processor replacement path 41. For example, the second switching device 50 realizes its function by executing a program in which a CPU is installed.

続いて、本実施形態に係るコンピュータシステム1の動作について説明する。   Subsequently, the operation of the computer system 1 according to the present embodiment will be described.

通常時には、各サーバ2において、サーバ用管理プロセッサ22が運用系デバイス25の管理を行う。すなわち、第1切替装置21は、通常管理用パス24をサーバ管理用パス23に接続しており、管理プロセッサ代替用パス41は無効状態とされている。   Normally, in each server 2, the server management processor 22 manages the active device 25. That is, the first switching device 21 connects the normal management path 24 to the server management path 23, and the management processor replacement path 41 is in an invalid state.

ここで、あるサーバ2のサーバ用管理プロセッサ22に障害が発生したとする。図2は、サーバ用管理プロセッサ22に障害が発生したときの動作方法を示すフローチャートである。   Here, it is assumed that a failure has occurred in the server management processor 22 of a certain server 2. FIG. 2 is a flowchart showing an operation method when a failure occurs in the server management processor 22.

ステップS1;障害の検出
サーバ用管理プロセッサ22に障害が発生すると、管理モジュール装置3側では、管理モジュールプロセッサ31が、システム管理用パス42を介してサーバ用管理プロセッサ22の障害を検出する。管理モジュールプロセッサ31は、障害の検出されたサーバ用管理プロセッサ22を搭載しているサーバ2を、障害サーバ2(選択サーバ)として選択する。同時に、管理モジュールプロセッサ31は、障害サーバ2のサーバ用管理プロセッサ22が実行していた管理プログラムを特定する。管理プログラムを特定するには、たとえば、予め、サーバ2もしくはサーバ用管理プロセッサ22を特定する情報に対して、管理プログラムを特定する情報を対応付けて格納しておけばよい。
Step S1; Failure Detection When a failure occurs in the server management processor 22, the management module processor 31 detects a failure in the server management processor 22 via the system management path 42 on the management module device 3 side. The management module processor 31 selects the server 2 equipped with the server management processor 22 in which the failure is detected as the failure server 2 (selected server). At the same time, the management module processor 31 identifies the management program that has been executed by the server management processor 22 of the failed server 2. In order to specify the management program, for example, information for specifying the management program may be stored in advance in association with information for specifying the server 2 or the server management processor 22.

ステップS2;代替プログラムの指定
続いて、管理モジュールプロセッサ31は、パス39を介してプログラム記憶部33にアクセスする。そして、S1で特定した管理プログラムに相当する代替プログラムがどれであるかを検索する。検索後、管理モジュールプロセッサ31は、パス35を介して代替用管理プロセッサ32にアクセスし、検索により該当した代替プログラムを読み込むように指示する。
Step S2: Designation of Alternative Program Subsequently, the management module processor 31 accesses the program storage unit 33 via the path 39. Then, it searches for an alternative program corresponding to the management program specified in S1. After the search, the management module processor 31 accesses the alternative management processor 32 via the path 35 and instructs to read the corresponding alternative program by the search.

ステップS3;パスの切替
また、管理モジュールプロセッサ31は、パス38を介して第2切替装置50にアクセスし、障害サーバ2に接続される管理プロセッサ代替用パス41を有効とする。
Step S3: Path Switching The management module processor 31 accesses the second switching device 50 via the path 38 and validates the management processor replacement path 41 connected to the failed server 2.

ステップS4;代替プログラムの実行
代替プログラムの読み込み指示を受け付けた代替用管理プロセッサ32は、指定された代替プログラムをプログラム記憶部33から読み込み、実行する。また、代替用管理プロセッサ32は、管理プロセッサ代替用パス41を介して障害サーバ2の第1切替装置21にアクセスし、管理プロセッサ代替用パス41をサーバ管理用パス23に接続する。これ以降、障害サーバ2の運用系デバイス25は、サーバ用管理プロセッサ22ではなく、代替用管理プロセッサ32によって管理されることになる。
Step S4: Execution of Alternative Program The alternative management processor 32 that has received an instruction to read an alternative program reads the designated alternative program from the program storage unit 33 and executes it. Further, the replacement management processor 32 accesses the first switching device 21 of the failed server 2 through the management processor replacement path 41 and connects the management processor replacement path 41 to the server management path 23. Thereafter, the active device 25 of the failed server 2 is managed not by the server management processor 22 but by the alternative management processor 32.

ステップS5;サーバ用管理プロセッサの復旧
管理モジュールプロセッサ31は、障害サーバ2の管理が代替用管理プロセッサ32により行われている間に、障害サーバ2のサーバ用管理プロセッサ22の管理プログラムを上書きする。そして、サーバ用管理プロセッサ22を再起動して、復旧を試みる。復旧した場合には、第1切替装置21及び第2切替装置50を切り替えて、通常時の管理に戻す。すなわち、サーバ用管理プロセッサ22により、運用系デバイス25の管理が行われる。
Step S5: Recovery of Server Management Processor The management module processor 31 overwrites the management program of the server management processor 22 of the failed server 2 while the failure server 2 is being managed by the replacement management processor 32. Then, the server management processor 22 is restarted to attempt recovery. When recovered, the first switching device 21 and the second switching device 50 are switched to return to normal management. In other words, the operational device 25 is managed by the server management processor 22.

以上説明したステップS1〜5の動作により、サーバ用管理プロセッサ22が故障した場合でも、代替用管理プロセッサ32により代替管理が行われ、障害サーバ2の運用を続行することができる。   By the operations in steps S1 to S5 described above, even if the server management processor 22 fails, the replacement management processor 32 performs the replacement management, and the operation of the failed server 2 can be continued.

次に、あるサーバの管理プログラム22−1をアップデートする場合の動作について説明する。図3は、管理プログラム22−1をアップデートする場合の動作を示すフローチャートである。   Next, an operation when the management program 22-1 of a certain server is updated will be described. FIG. 3 is a flowchart showing an operation when the management program 22-1 is updated.

ステップS11;アップデート指示の受け付け
図示しない入力装置を介して、ユーザから、管理モジュール装置3に、あるサーバ2の管理プログラム22−1を、指定された場所に格納されたプログラムにアップデートする旨の指示が入力されるとする。管理モジュール装置3では、管理モジュールプロセッサ31が、アップデート指示を受け付ける。管理モジュールプロセッサ31は、アップデート対象のサーバ2を、アップデートサーバ2(選択サーバ)として選択する。
Step S11: Acceptance of update instruction An instruction to update the management program 22-1 of a certain server 2 to a program stored in a designated location in the management module apparatus 3 from a user via an input device (not shown). Is input. In the management module device 3, the management module processor 31 receives an update instruction. The management module processor 31 selects the update target server 2 as the update server 2 (selected server).

ステップS12;代替プログラムのアップデート
アップデート指示を受け付けた管理モジュールプロセッサ31は、まず、プログラム記憶部39にアクセスして、アップデートサーバの管理プログラムに対応する代替プログラムを、アップデートする。
Step S12: Update of Alternative Program The management module processor 31 that has received the update instruction first accesses the program storage unit 39 to update the alternative program corresponding to the management program of the update server.

ステップS13;代替プログラムの読み込み指示
代替プログラムのアップデート後に、管理モジュールプロセッサ31は、代替用管理プロセッサ32にアクセスして、アップデートされた代替プログラムを読み込むように指示する。
Step S13: Alternative Program Reading Instruction After the alternative program is updated, the management module processor 31 accesses the alternative management processor 32 and instructs to read the updated alternative program.

ステップS14;パスの切替
また、管理モジュールプロセッサ31は、第2切替装置50にアクセスして、代替用管理プロセッサ32とアップデートサーバ2とがアクセス可能となるように、パス36と管理プロセッサ代替用パス41とを接続する。
Step S14: Path Switching The management module processor 31 accesses the second switching device 50 so that the replacement management processor 32 and the update server 2 can access the path 36 and the management processor replacement path. 41 is connected.

ステップS15;代替プログラムの実行
読み込み指示を受けた代替用管理プロセッサ32は、プログラム記憶部33より、アップデートされた代替プログラムを読み込み、実行する。また、代替用管理プロセッサ32は、第1切替装置21にアクセスして、サーバ管理用パス23と管理プロセッサ代替用パス41とを接続する。これにより、アップデートサーバ2の運用系デバイス25は、代替用管理プロセッサ32によって管理されることとなる。
Step S15: Execution of Substitute Program Upon receiving the read instruction, the substitution management processor 32 reads the updated substitution program from the program storage unit 33 and executes it. Further, the replacement management processor 32 accesses the first switching device 21 to connect the server management path 23 and the management processor replacement path 41. As a result, the active device 25 of the update server 2 is managed by the replacement management processor 32.

ステップS16;管理プログラムのアップデート
管理モジュールプロセッサ31は、アップデートサーバ2の運用系デバイス25が代替用管理プロセッサ32によって管理されている間に、アップデートサーバ2のサーバ用管理プロセッサ22に対して、指定された場所から管理プログラムをアップデートするように指示する。サーバ用管理プロセッサ22は、指示を受けて、アップデートを開始する。
Step S16: Update Management Program The management module processor 31 is designated to the server management processor 22 of the update server 2 while the active device 25 of the update server 2 is managed by the replacement management processor 32. To update the management program from the new location. The server management processor 22 receives the instruction and starts updating.

管理プログラム22−1のアップデートが完了すると、管理モジュールプロセッサ31は、代替用管理プロセッサ32にアップデート完了通知を行う。アップデート完了通知を受け取った代替用管理プロセッサ32は、代替管理を終了する。   When the update of the management program 22-1 is completed, the management module processor 31 notifies the replacement management processor 32 of the update completion. The replacement management processor 32 that has received the update completion notification ends the replacement management.

ステップS17;パスの切替
また、アップデートサーバ2では、サーバ管理用プロセッサ22が、第1切替装置21にアクセスして、運用系デバイス25の管理がサーバ管理用プロセッサ22によって行われるように、通常管理用パス24とサーバ管理用パス23とを接続する。また、管理モジュールプロセッサ31は第2切替装置50にアクセスして、パス36と管理プロセッサ代替用パス41との接続を切断する。
Step S17; Switching of Paths In the update server 2, the server management processor 22 accesses the first switching device 21 to perform normal management so that the active device 25 is managed by the server management processor 22. The server path 24 and the server management path 23 are connected. Further, the management module processor 31 accesses the second switching device 50 and disconnects the connection between the path 36 and the management processor replacement path 41.

以上説明したステップS11〜17の動作により、プログラム記憶部33内の代替プログラムとサーバ用管理プロセッサ22の管理プログラムとの双方を、アップデートサーバ2の運用を停止することなく、アップデートすることができる。   Through the operations in steps S11 to S17 described above, both the alternative program in the program storage unit 33 and the management program of the server management processor 22 can be updated without stopping the operation of the update server 2.

本実施形態によれば、障害発生時やアップデート時などのように、サーバ用管理プロセッサ22が使用できない状態となった場合でも、代替用管理プロセッサ32により対象のサーバを代替管理することができ、サーバの運用を続行することが可能である。   According to the present embodiment, even when the server management processor 22 becomes unusable, such as when a failure occurs or when an update is performed, the target server can be replaced and managed by the replacement management processor 32. Server operation can be continued.

通常、ブレードサーバのように複数のサーバを有するコンピュータシステムでは、システム全体を管理する管理モジュール装置が設けられる。ここで、サーバ側の管理用プロセッサが故障した場合、その機能を管理モジュール装置側から代替することが考えられる。しかし、複数のサーバの各々において、インストールされた管理プログラムが全て同じであるとは限らない。従って、単に管理モジュール装置側から代替管理を行うだけでは、代替できる機能は電源を安全にOFFする程度の基本的な処理に限られてしまい、そのサーバの運用を継続することはできない。また、複数のサーバのうちの一のサーバの管理を、他のサーバによって代替することも考えられる。しかしこの場合も、複数のサーバで管理プログラムが全て同じであるとは限らないので、代替できる機能は基本的な処理に限られてしまう。
これに対して、本実施形態によれば、代替管理用プロセッサ32が管理プロセッサと同じ代替プログラムを読み込んで実行するので、サーバ用管理プロセッサ22と全く同じ機能を代替することができる。従って、サーバの運用をそのまま続行することができる。
Usually, in a computer system having a plurality of servers such as a blade server, a management module device for managing the entire system is provided. Here, when the management processor on the server side fails, it is conceivable to replace the function from the management module device side. However, not all of the installed management programs are the same in each of the plurality of servers. Therefore, simply performing substitution management from the management module device side, the functions that can be substituted are limited to basic processing to the extent that the power is safely turned off, and the operation of the server cannot be continued. It is also conceivable that management of one of a plurality of servers is replaced by another server. However, in this case as well, the management programs are not necessarily the same for a plurality of servers, so the functions that can be replaced are limited to basic processing.
On the other hand, according to the present embodiment, the replacement management processor 32 reads and executes the same replacement program as that of the management processor, so that the same function as that of the server management processor 22 can be replaced. Therefore, the operation of the server can be continued as it is.

また、故障時やアップデート時にもサーバの管理を続行できるようにするために、個々のサーバ内で管理プロセッサを二重化させることが考えられる。しかし、個々のサーバ内で管理プロセッサを二重化するには、一つのサーバに対して管理プロセッサが二個必要であり、コストが高くなってしまう。
これに対して、本実施形態によれば、複数のサーバ2に対して、一つの代替用管理プロセッサを用意するだけでよい。よって、各サーバ内で管理プロセッサを二重化する場合に比べて、コストを大幅に抑えられる。
In addition, in order to be able to continue server management even in the event of a failure or update, it is conceivable to duplicate the management processor in each server. However, in order to duplicate the management processor in each server, two management processors are required for one server, which increases the cost.
On the other hand, according to the present embodiment, it is only necessary to prepare one replacement management processor for the plurality of servers 2. Therefore, the cost can be greatly reduced as compared with the case where the management processor is duplicated in each server.

また、本実施形態では、管理モジュールプロセッサ31とは別に、代替用管理プロセッサ32が設けられている。従って、代替用管理プロセッサ32があるサーバの代替管理を行っている間にも管理モジュールプロセッサ31によって複数のサーバ2全体の管理を続行することが可能である。すなわち、管理モジュール装置3としての機能を停止することなく、あるサーバの代替管理を行うことができる。   In the present embodiment, an alternative management processor 32 is provided separately from the management module processor 31. Therefore, it is possible to continue the management of the plurality of servers 2 by the management module processor 31 even while the replacement management processor 32 performs the replacement management of the server. That is, it is possible to perform alternative management of a server without stopping the function as the management module device 3.

また、代替用管理プロセッサ32は、通常動作時には、管理モジュールプロセッサ31の補助的役割を果たすように構成することもできる。このようにすれば、単に代替用プロセッサ32の機能を代替管理に限定する場合に比べて、資源を有効に活用できる。   Further, the replacement management processor 32 may be configured to play an auxiliary role of the management module processor 31 during normal operation. In this way, resources can be used more effectively than when the function of the substitute processor 32 is limited to substitution management.

尚、本実施形態では、第2切替装置50が管理モジュール装置3内に設けられている場合について説明した。しかし、第2切替装置50は必ずしも管理モジュール装置3内に設けられている必要はない。例えば、図4の変形例に示されるように、バックプレーン4上に第2切替装置50が設けられていてもよい。この図4の変形例のように構成しても、本実施形態と同様の作用を奏することができる。また、バックプレーン4と管理モジュール装置3との間の配線量を削減することができる。   In the present embodiment, the case where the second switching device 50 is provided in the management module device 3 has been described. However, the second switching device 50 is not necessarily provided in the management module device 3. For example, as shown in the modification of FIG. 4, the second switching device 50 may be provided on the backplane 4. Even when configured as in the modified example of FIG. 4, the same operation as in the present embodiment can be achieved. In addition, the amount of wiring between the backplane 4 and the management module device 3 can be reduced.

また、本実施形態では、第2切替装置50により、複数のサーバ2のうちのどのサーバへの管理プロセッサ代替用パス41を有効にするかが選択される場合について説明した。しかし、別の方式により、複数のサーバ2の中から有効にする管理プロセッサ代替用パス41を選択するようにしてもよい。例えば、図5に示される変形例では、第2切替装置50として、全サーバに対応する管理用プロセッサ代替用パス41がバスに接続されている。このバスには、固有のアドレスが設定されている。代替用管理プロセッサ32は、バスのアドレスを指定することにより、代替管理すべきサーバ2にアクセス可能となっている。この図5に示される変形例のような構成としても、本実施形態と同様の作用を奏することができる。   Further, in the present embodiment, a case has been described in which the second switching device 50 selects which server among the plurality of servers 2 to validate the management processor replacement path 41. However, the management processor replacement path 41 to be valid may be selected from the plurality of servers 2 by another method. For example, in the modification shown in FIG. 5, as the second switching device 50, a management processor replacement path 41 corresponding to all servers is connected to the bus. A unique address is set for this bus. The replacement management processor 32 can access the server 2 to be replaced and managed by designating the bus address. Even with a configuration such as that of the modification shown in FIG. 5, the same operation as in the present embodiment can be achieved.

図6Aは、本実施形態の変形例を示している。この変形例では、第1切替装置21部分において、通常管理用パス24、管理プロセッサ代替用パス41、及びサーバ管理用パス23がバスを介して接続されている。このバスには、固有のアドレスが割り当てられている。代替管理用プロセッサ32は、第2切替装置50を介してこのバスを切り替えることにより、管理プロセッサ代替用パス41の有効/無効を制御する。この図6Aの変形例のような構成においても、本実施形態と同様の作用を奏することができる。また、この図6Aの変形例において、図4に示した変形例のように、第2切替装置50をバックプレーン4上に配置してもよい。
また、第1切替え装置21部分に関する更に他の変形例として、第1切替装置21自身がサーバ用管理プロセッサ22の故障を検出し、第1切替装置21が自動的にパスを切り替えるように構成することもできる。この場合、サーバ用管理プロセッサ22と第1切替装置21とが、サーバ用管理プロセッサが故障したときにレベルが変わるような信号線により接続されていればよい。
また、図6Bは、第1切替装置21部分に関する更に他の変形例を示している。この変形例では、第1切替装置21と管理モジュールプロセッサ31との間が、サーバ用管理プロセッサ22を介することのないパス40により接続されている。第1切替装置21は、代替用管理プロセッサ32によってではなく、パス40を介して管理モジュールプロセッサ31によって切り替えられる。この図6Bに示されるような構成としても、本実施形態と同様の作用を奏することができる。
FIG. 6A shows a modification of the present embodiment. In this modification, in the first switching device 21 portion, the normal management path 24, the management processor replacement path 41, and the server management path 23 are connected via a bus. A unique address is assigned to this bus. The replacement management processor 32 controls the validity / invalidity of the management processor replacement path 41 by switching the bus via the second switching device 50. Even in the configuration as in the modified example of FIG. 6A, the same operation as in the present embodiment can be achieved. Further, in the modified example of FIG. 6A, the second switching device 50 may be arranged on the backplane 4 as in the modified example shown in FIG.
As still another modification of the first switching device 21 portion, the first switching device 21 itself detects a failure of the server management processor 22, and the first switching device 21 automatically switches the path. You can also In this case, the server management processor 22 and the first switching device 21 may be connected by a signal line whose level changes when the server management processor fails.
FIG. 6B shows still another modification regarding the first switching device 21 portion. In this modification, the first switching device 21 and the management module processor 31 are connected by a path 40 that does not go through the server management processor 22. The first switching device 21 is switched not by the replacement management processor 32 but by the management module processor 31 via the path 40. Even with the configuration as shown in FIG. 6B, the same operation as in the present embodiment can be achieved.

図7は、本実施形態の更に別の変形例を示している。図7に示される変形例では、サーバ用管理プロセッサ22が、サーバ2に対して、hot−swap可能に取り付けられている。同様に、代替用管理プロセッサ32も、管理モジュール装置3に対して、hot−swap可能に取り付けられている。この図7の変形例のような構成によれば、サーバ用管理プロセッサ22が故障している時に、代替用管理プロセッサ32により代替管理を行っておき、その間に故障したサーバ用管理プロセッサ22を交換することができる。すなわち、コンピュータシステム1を停止することなく、また、サーバ2の管理機能を停止することなく、サーバ用管理プロセッサ22を交換することが可能となる。   FIG. 7 shows still another modification of the present embodiment. In the modification shown in FIG. 7, the server management processor 22 is attached to the server 2 in a hot-swappable manner. Similarly, the replacement management processor 32 is also attached to the management module device 3 in a hot-swappable manner. According to the configuration of the modified example of FIG. 7, when the server management processor 22 is out of order, replacement management is performed by the replacement management processor 32, and the failed server management processor 22 is replaced during that time. can do. In other words, the server management processor 22 can be replaced without stopping the computer system 1 and without stopping the management function of the server 2.

尚、図1、図4乃至7に示した変形例は、矛盾のない範囲内で組み合わせることが可能である。   Note that the modification examples shown in FIGS. 1 and 4 to 7 can be combined within a consistent range.

本発明の実施形態の概略構成図である。It is a schematic block diagram of embodiment of this invention. 障害発生時におけるフローチャートである。It is a flowchart at the time of failure occurrence. アップデート時におけるフローチャートである。It is a flowchart at the time of an update. 本発明の実施形態の変形例を示す概略構成図である。It is a schematic block diagram which shows the modification of embodiment of this invention. 本発明の実施形態の他の変形例を示す概略構成図である。It is a schematic block diagram which shows the other modification of embodiment of this invention. 本発明の実施形態の更に他の変形例を示す概略構成図である。It is a schematic block diagram which shows the other modification of embodiment of this invention. 本発明の実施形態の更に他の変形例を示す概略構成図である。It is a schematic block diagram which shows the other modification of embodiment of this invention. 本発明の実施形態の更に他の変形例を示す概略構成図である。It is a schematic block diagram which shows the other modification of embodiment of this invention.

符号の説明Explanation of symbols

1 サーバシステム
2 サーバ
3 管理モジュール装置
4 バックプレーン
21 第1切替部
22 サーバ用管理プロセッサ
23 サーバ管理用パス
24 通常管理用パス
25 運用系デバイス
31 管理モジュールプロセッサ
32 代替用プロセッサ
33 プログラム記憶部
34 プログラムテーブル
35 パス
36 パス
37 パス
38 パス
39 パス
41 管理プロセッサ代替パス
42 システム管理用パス
50 第2切替部
DESCRIPTION OF SYMBOLS 1 Server system 2 Server 3 Management module apparatus 4 Backplane 21 1st switching part 22 Server management processor 23 Server management path 24 Normal management path 25 Operation system device 31 Management module processor 32 Replacement processor 33 Program storage part 34 Program Table 35 path 36 path 37 path 38 path 39 path 41 Management processor alternative path 42 System management path 50 Second switching section

Claims (20)

複数のサーバと、
前記複数のサーバの各々を一括管理する管理モジュール装置と
を含み、
前記複数のサーバの各々は、
前記各サーバの管理を行うサーバ用管理プロセッサ
を具備し、
前記管理モジュール装置は、
サーバ毎の前記サーバ用管理プロセッサ用の管理プログラムを格納するプログラム記憶部と、
前記サーバ用管理プロセッサの故障時或いはアップデート時に、前記サーバ用管理プロセッサに対応する前記管理プログラムを前記プログラム記憶部から読み込み、読み込んだ前記管理プログラムを実行することで、前記サーバ用管理プロセッサの交換或いはアップデートが完了するまで前記サーバ用管理プロセッサの機能を代替し、前記各サーバの管理を継続する代替用管理プロセッサと
を具備する
コンピュータ管理システム。
Multiple servers,
A management module device that collectively manages each of the plurality of servers,
Each of the plurality of servers is
A server management processor for managing each of the servers;
The management module device includes:
A program storage unit for storing a management program for the server management processor for each server;
When the server management processor fails or is updated, the management program corresponding to the server management processor is read from the program storage unit and the read management program is executed. A computer management system comprising: a replacement management processor that replaces the function of the server management processor until the update is completed and continues management of the servers.
請求項1に記載されたコンピュータ管理システムであって、
前記各サーバは、
前記各サーバに要求された処理を実際に実行するための運用系デバイスと、
サーバ用管理パスを介して前記運用系デバイスに常時接続し、通常時には通常管理用パスを介して前記サーバ用管理プロセッサに接続し、前記サーバ用管理プロセッサの故障時或いはアップデート時には管理プロセッサ代替用パスを介して前記代替用管理プロセッサに接続する第1切替装置と
を更に具備する
コンピュータ管理システム。
A computer management system according to claim 1,
Each of the servers
An operational device for actually executing the processing requested by each server;
Always connected to the active device via a server management path, normally connected to the server management processor via a normal management path, and a management processor replacement path when the server management processor fails or is updated And a first switching device connected to the replacement management processor via the computer management system.
請求項2に記載されたコンピュータ管理システムであって、
前記管理モジュール装置は、
システム管理用パスを介して前記各サーバの前記サーバ用管理プロセッサに接続し、第1パスを介して前記プログラム記憶部に接続し、第2パスを介して前記代替用管理プロセッサに接続する管理モジュールプロセッサ
を更に具備し、
前記管理モジュールプロセッサは、前記複数のサーバのうち、障害の検出された前記サーバ用管理プロセッサを搭載しているサーバを障害サーバとして選択し、前記障害サーバの前記サーバ用管理プロセッサが実行していた前記管理プログラムを特定し、前記第1パスを介して前記プログラム記憶部にアクセスし、特定された前記管理プログラムに相当する代替プログラムを検索し、第2パスを介して前記代替用管理プロセッサにアクセスし、検索により該当した前記代替プログラムを読み込むように指示する
コンピュータ管理システム。
A computer management system according to claim 2 ,
The management module device includes:
A management module connected to the server management processor of each server via a system management path, connected to the program storage unit via a first path, and connected to the replacement management processor via a second path Further comprising a processor;
The management module processor selects a server equipped with the server management processor in which a failure is detected from the plurality of servers as a failure server, and the server management processor of the failed server is executing The management program is specified, the program storage unit is accessed through the first path, the alternative program corresponding to the specified management program is searched, and the replacement management processor is accessed through the second path. And a computer management system that instructs to read the corresponding alternative program by the search.
請求項3に記載されたコンピュータ管理システムであって、
第3パスを介して前記管理モジュールプロセッサに接続し、第4パスを介して前記代替用管理プロセッサに接続し、管理プロセッサ代替用パスを介して前記各サーバの前記サーバ用管理プロセッサに接続する第2切替装置
を更に含み、
前記管理モジュールプロセッサは、前記第3パスを介して前記第2切替装置にアクセスし、前記障害サーバに接続される前記管理プロセッサ代替用パスを有効とし、前記第4パスと前記障害サーバに接続される前記管理プロセッサ代替用パスとを接続し、前記代替用管理プロセッサと前記障害サーバの前記サーバ用管理プロセッサとをアクセス可能にする
コンピュータ管理システム。
A computer management system according to claim 3,
A third path is connected to the management module processor via a third path, is connected to the replacement management processor via a fourth path, and is connected to the server management processor of each server via a management processor replacement path. 2 further includes a switching device,
The management module processor accesses the second switching device via the third path, validates the management processor replacement path connected to the failed server, and is connected to the fourth path and the failed server. A computer management system for connecting the management processor replacement path to enable access to the replacement management processor and the server management processor of the failed server.
請求項4に記載されたコンピュータ管理システムであって、
前記管理モジュールプロセッサは、前記障害サーバの管理が前記代替用管理プロセッサにより行われている間に、前記障害サーバの前記サーバ用管理プロセッサの前記管理プログラムを上書きし、前記障害サーバの前記サーバ用管理プロセッサを再起動して復旧を試み、復旧した場合には、前記第1切替装置及び前記第2切替装置を切り替えて通常時の管理に戻し、前記障害サーバの管理が前記サーバ用管理プロセッサにより行われるようにする
コンピュータ管理システム。
A computer management system according to claim 4,
The management module processor overwrites the management program of the server management processor of the failed server while the management of the failed server is performed by the replacement management processor, and manages the server of the failed server When a recovery is attempted by restarting the processor, the first switching device and the second switching device are switched back to normal management and the failed server is managed by the server management processor. Computer management system.
請求項5に記載されたコンピュータ管理システムであって、
前記管理モジュールプロセッサは、前記複数のサーバのうち、アップデート対象のサーバをアップデートサーバとして選択し、前記第1パスを介して前記プログラム記憶部にアクセスして、前記アップデートサーバの前記管理プログラムに対応する代替プログラムをアップデートし、前記代替プログラムのアップデート後に、第2パスを介して前記代替用管理プロセッサにアクセスして、前記アップデートされた代替プログラムを読み込むように指示する
コンピュータ管理システム。
A computer management system according to claim 5, wherein
The management module processor selects a server to be updated from among the plurality of servers as an update server, accesses the program storage unit via the first path, and corresponds to the management program of the update server A computer management system that updates an alternative program and, after updating the alternative program, accesses the alternative management processor via a second path to instruct to read the updated alternative program.
請求項6に記載されたコンピュータ管理システムであって、
前記管理モジュールプロセッサは、前記第3パスを介して前記第2切替装置にアクセスし、前記アップデートサーバに接続される前記管理プロセッサ代替用パスを有効とし、前記第4パスと前記アップデートサーバに接続される前記管理プロセッサ代替用パスとを接続し、前記代替用管理プロセッサと前記アップデートサーバの前記サーバ用管理プロセッサとをアクセス可能にする
コンピュータ管理システム。
A computer management system according to claim 6, comprising:
The management module processor accesses the second switching device via the third path, validates the management processor replacement path connected to the update server, and is connected to the fourth path and the update server. A computer management system that connects the management processor replacement path to enable access to the replacement management processor and the server management processor of the update server.
請求項7に記載されたコンピュータ管理システムであって、
前記管理モジュールプロセッサは、前記アップデートサーバの前記運用系デバイスが前記代替用管理プロセッサによって代替管理されている間に、前記アップデートサーバの前記サーバ用管理プロセッサに対して、指定された場所から前記管理プログラムのアップデートを指示し、前記サーバ用管理プロセッサの前記管理プログラムのアップデートが完了すると、前記代替用管理プロセッサにアップデート完了通知を行い、
前記代替用管理プロセッサは、前記アップデート完了通知を受け取ると、前記アップデートサーバの前記運用系デバイスの代替管理を終了する
コンピュータ管理システム。
A computer management system according to claim 7,
The management module processor is configured to send the management program from a specified location to the server management processor of the update server while the operational device of the update server is being managed by the replacement management processor. of instructing the update, an update of the management program of the management processor for the server is complete, perform the update completion notification to the alternative for the management process Tsu support,
When the replacement management processor receives the update completion notification, the replacement management processor ends the replacement management of the active device of the update server.
請求項4乃至8のいずれか一項に記載されたコンピュータ管理システムであって、
前記第2切替装置は、前記各サーバと前記管理モジュール装置との間に存在するバックプレーン上に設けられている
コンピュータ管理システム。
A computer management system according to any one of claims 4 to 8, comprising:
The second switching device is a computer management system provided on a backplane existing between each server and the management module device.
請求項1乃至9のいずれか一項に記載されたコンピュータ管理システムであって、
前記サーバ用管理プロセッサ及び前記代替用管理プロセッサのうち少なくとも一方は、Hot−swap可能に取り付けられている
コンピュータ管理システム。
A computer management system according to any one of claims 1 to 9,
A computer management system in which at least one of the server management processor and the replacement management processor is mounted to be hot-swappable.
請求項1乃至10のいずれか一項に記載されたコンピュータ管理システムにおいて、複数のサーバの各々又は管理モジュール装置として使用されるコンピュータ。   The computer management system as described in any one of Claims 1 thru | or 10 WHEREIN: The computer used as each of several servers or a management module apparatus. 複数のサーバと、前記複数のサーバの各々を一括管理する管理モジュール装置とを含むコンピュータシステムの管理方法であって、
前記管理モジュール装置内のプログラム記憶部に、前記各サーバ内で前記各サーバの管理を行うサーバ用管理プロセッサ用の管理プログラムを格納するステップと、
前記管理モジュール装置内の代替用管理プロセッサが、前記サーバ用管理プロセッサの故障時或いはアップデート時に、前記サーバ用管理プロセッサに対応する前記管理プログラムを前記プログラム記憶部から読み込み、読み込んだ前記管理プログラムを実行することで、前記サーバ用管理プロセッサの交換或いはアップデートが完了するまで前記サーバ用管理プロセッサの機能を代替し、前記各サーバの管理を継続するステップと
を具備する
コンピュータシステムの管理方法。
A computer system management method including a plurality of servers and a management module device that collectively manages each of the plurality of servers,
Storing a management program for a server management processor for managing each server in each server in a program storage unit in the management module device;
The replacement management processor in the management module device reads the management program corresponding to the server management processor from the program storage unit when the server management processor fails or is updated, and executes the read management program Then, replacing the server management processor until the replacement or update of the server is completed, replacing the function of the server management processor and continuing the management of each server.
請求項12に記載されたコンピュータシステムの管理方法であって、
前記各サーバ内の運用系デバイスが、前記各サーバに要求された処理を実行するステップと、
前記各サーバ内の第1切替装置が、
サーバ用管理パスを介して前記運用系デバイスに常時接続するステップと、
通常時には通常管理用パスを介して前記サーバ用管理プロセッサに接続するステップと、
前記サーバ用管理プロセッサの故障時或いはアップデート時には管理プロセッサ代替用パスを介して前記代替用管理プロセッサに接続するステップとを更に具備する
コンピュータシステムの管理方法。
A computer system management method according to claim 12, comprising:
The operational device in each server executes a process requested by each server;
A first switching device in each of the servers,
Constantly connecting to the active device via a server management path;
Normally connecting to the server management processor via a normal management path;
A management method for a computer system, further comprising: connecting to the replacement management processor via a management processor replacement path when the server management processor fails or is updated.
請求項13に記載されたコンピュータシステムの管理方法であって、
前記管理モジュール装置内の管理モジュールプロセッサが、
システム管理用パスを介して前記各サーバの前記サーバ用管理プロセッサに接続するステップと、
第1パスを介して前記プログラム記憶部に接続するステップと、
第2パスを介して前記代替用管理プロセッサに接続するステップと、
前記複数のサーバのうち、障害の検出された前記サーバ用管理プロセッサを搭載しているサーバを障害サーバとして選択するステップと、
前記障害サーバの前記サーバ用管理プロセッサが実行していた前記管理プログラムを特定するステップと、
前記第1パスを介して前記プログラム記憶部にアクセスし、特定された前記管理プログラムに相当する代替プログラムを検索するステップと、
第2パスを介して前記代替用管理プロセッサにアクセスし、検索により該当した前記代替プログラムを読み込むように指示するステップと
を更に具備する
コンピュータシステムの管理方法。
A computer system management method according to claim 13 , comprising:
A management module processor in the management module device;
Connecting to the server management processor of each server via a system management path;
Connecting to the program storage unit via a first path;
Connecting to the alternative management processor via a second path;
Selecting a server equipped with the server management processor in which a failure is detected as the failed server among the plurality of servers;
Identifying the management program being executed by the server management processor of the failed server;
Accessing the program storage unit via the first path and searching for an alternative program corresponding to the identified management program;
A method of managing a computer system, further comprising the step of accessing the replacement management processor via a second path and instructing to read the corresponding replacement program by a search.
請求項14に記載されたコンピュータシステムの管理方法であって、
第2切替装置が、
第3パスを介して前記管理モジュールプロセッサに接続するステップと、
第4パスを介して前記代替用管理プロセッサに接続するステップと、
管理プロセッサ代替用パスを介して前記各サーバの前記サーバ用管理プロセッサに接続するステップと、
前記管理モジュールプロセッサが、
前記第3パスを介して前記第2切替装置にアクセスし、前記障害サーバに接続される前記管理プロセッサ代替用パスを有効とし、前記第4パスと前記障害サーバに接続される前記管理プロセッサ代替用パスとを接続し、前記代替用管理プロセッサと前記障害サーバの前記サーバ用管理プロセッサとをアクセス可能にするステップと
を更に具備する
コンピュータシステムの管理方法。
A method for managing a computer system according to claim 14, comprising:
The second switching device
Connecting to the management module processor via a third path;
Connecting to the alternative management processor via a fourth path;
Connecting to the server management processor of each server via a management processor alternative path;
The management module processor is
Access the second switching device via the third path, validate the management processor replacement path connected to the failed server, and replace the management processor connected to the fourth path and the failed server A computer system management method, further comprising: connecting a path to make the replacement management processor accessible to the server management processor of the failed server.
請求項15に記載されたコンピュータシステムの管理方法であって、
前記管理モジュールプロセッサが、
前記障害サーバの管理が前記代替用管理プロセッサにより行われている間に、前記障害サーバの前記サーバ用管理プロセッサの前記管理プログラムを上書きするステップと、
前記障害サーバの前記サーバ用管理プロセッサを再起動して復旧を試みるステップと、
復旧した場合には、前記第1切替装置及び前記第2切替装置を切り替えて通常時の管理に戻し、前記障害サーバの管理が前記サーバ用管理プロセッサにより行われるようにするステップと
を更に具備する
コンピュータシステムの管理方法。
A computer system management method according to claim 15, comprising:
The management module processor is
Overwriting the management program of the server management processor of the failed server while the failure server is being managed by the replacement management processor;
Restarting the server management processor of the failed server and attempting recovery;
A step of switching the first switching device and the second switching device to return to normal management when recovery is performed, so that management of the failed server is performed by the server management processor; Computer system management method.
請求項16に記載されたコンピュータシステムの管理方法であって、
前記管理モジュールプロセッサが、
前記複数のサーバのうち、アップデート対象のサーバをアップデートサーバとして選択するステップと、
前記第1パスを介して前記プログラム記憶部にアクセスして、前記アップデートサーバの前記管理プログラムに対応する代替プログラムをアップデートするステップと、
前記代替プログラムのアップデート後に、第2パスを介して前記代替用管理プロセッサにアクセスして、前記アップデートされた代替プログラムを読み込むように指示するステップと
を更に具備する
コンピュータシステムの管理方法。
A computer system management method according to claim 16, comprising:
The management module processor is
Selecting a server to be updated from among the plurality of servers as an update server;
Accessing the program storage unit via the first path to update an alternative program corresponding to the management program of the update server;
A method of managing a computer system, further comprising the step of accessing the replacement management processor via a second path and instructing to read the updated replacement program after updating the replacement program.
請求項17に記載されたコンピュータシステムの管理方法であって、
前記管理モジュールプロセッサが、前記第3パスを介して前記第2切替装置にアクセスし、前記アップデートサーバに接続される前記管理プロセッサ代替用パスを有効とし、前記第4パスと前記アップデートサーバに接続される前記管理プロセッサ代替用パスとを接続し、前記代替用管理プロセッサと前記アップデートサーバの前記サーバ用管理プロセッサとをアクセス可能にするステップ
を更に具備する
コンピュータシステムの管理方法。
A computer system management method according to claim 17, comprising:
The management module processor accesses the second switching device via the third path, validates the management processor replacement path connected to the update server, and is connected to the fourth path and the update server. The management system management method further comprising the step of: connecting the management processor replacement path to enable access to the replacement management processor and the server management processor of the update server.
請求項18に記載されたコンピュータシステムの管理方法であって、
前記管理モジュールプロセッサが、
前記アップデートサーバの前記運用系デバイスが前記代替用管理プロセッサによって代替管理されている間に、前記アップデートサーバの前記サーバ用管理プロセッサに対して、指定された場所から前記管理プログラムのアップデートを指示するステップと、
前記サーバ用管理プロセッサの前記管理プログラムのアップデートが完了すると、前記代替用管理プロセッサにアップデート完了通知を行うステップと、
前記代替用管理プロセッサが、
前記アップデート完了通知を受け取ると、前記アップデートサーバの前記運用系デバイスの代替管理を終了するステップと
を更に具備する
コンピュータシステムの管理方法。
A computer system management method according to claim 18, comprising:
The management module processor is
Instructing the server management processor of the update server to update the management program from a specified location while the operational device of the update server is being managed by the replacement management processor When,
When the update of the management program of the server management processor is completed, an update completion notification is sent to the replacement management processor;
The replacement management processor comprises:
A management method for a computer system, further comprising: upon receiving the update completion notification, terminating substitution management of the active device of the update server.
請求項12乃至19のいずれか一項に記載されたコンピュータシステムの管理方法を、コンピュータに実行させるための管理プログラム。   A management program for causing a computer to execute the computer system management method according to any one of claims 12 to 19.
JP2008100217A 2008-04-08 2008-04-08 Computer management system, computer system management method, and computer system management program Expired - Fee Related JP5439736B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008100217A JP5439736B2 (en) 2008-04-08 2008-04-08 Computer management system, computer system management method, and computer system management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008100217A JP5439736B2 (en) 2008-04-08 2008-04-08 Computer management system, computer system management method, and computer system management program

Publications (2)

Publication Number Publication Date
JP2009252009A JP2009252009A (en) 2009-10-29
JP5439736B2 true JP5439736B2 (en) 2014-03-12

Family

ID=41312647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008100217A Expired - Fee Related JP5439736B2 (en) 2008-04-08 2008-04-08 Computer management system, computer system management method, and computer system management program

Country Status (1)

Country Link
JP (1) JP5439736B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI411375B (en) * 2011-06-21 2013-10-01 Quanta Comp Inc Rack server system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09218788A (en) * 1996-02-09 1997-08-19 Fujitsu Ltd Inservice direct down loading system
JP2004318498A (en) * 2003-04-16 2004-11-11 Toyota Central Res & Dev Lab Inc Fail-safe system
JP2005099918A (en) * 2003-09-22 2005-04-14 Hitachi Cable Ltd Duplex management network device
JP2005182484A (en) * 2003-12-19 2005-07-07 Nec Corp Communication equipment and program update method
US7383461B2 (en) * 2004-02-12 2008-06-03 International Business Machines Corporation Method and system to recover a failed flash of a blade service processor in a server chassis
JP2006285384A (en) * 2005-03-31 2006-10-19 Nec Corp Processor trouble processing method, management processor, and processor trouble processing method
JP4751785B2 (en) * 2006-07-31 2011-08-17 富士通株式会社 Transmission apparatus and software automatic update method

Also Published As

Publication number Publication date
JP2009252009A (en) 2009-10-29

Similar Documents

Publication Publication Date Title
US8423816B2 (en) Method and computer system for failover
JP4572250B2 (en) Computer switching method, computer switching program, and computer system
JP4940967B2 (en) Storage system, storage device, firmware hot replacement method, firmware hot swap program
JP4448878B2 (en) How to set up a disaster recovery environment
US8713352B2 (en) Method, system and program for securing redundancy in parallel computing system
JP6056554B2 (en) Cluster system
JP5545108B2 (en) Storage system, control device, and control method
KR20090082242A (en) Transparent replacement of a system processor
JP5413514B2 (en) Management apparatus, information processing apparatus, control method, and program
JP2013097553A (en) Switching control device, switching control method, information processor and switching control program
EP2466467B1 (en) Information Processing System
JP2004088570A (en) Network computer system and management device
CN111585835A (en) Control method and device for out-of-band management system and storage medium
JP5056504B2 (en) Control apparatus, information processing system, control method for information processing system, and control program for information processing system
JP2006268742A (en) Computer system and control method thereof
JP2011034161A (en) Server system and management method for server system
US7437445B1 (en) System and methods for host naming in a managed information environment
JP5439736B2 (en) Computer management system, computer system management method, and computer system management program
JP5445572B2 (en) Computer system, standby power reduction method, and program
US20060198314A1 (en) Processing device, failure recovery method therefor, and failure restoration method
WO2008004330A1 (en) Multiple processor system
JP2002049509A (en) Data processing system
JP7212510B2 (en) Power management device, power management method, and power management program
US20060224751A1 (en) Storage system, a host adapter, a data storage, a method of controlling a node device, a method of controlling a host adapter, a signal-bearing medium embodying a program causing a host adapter to perform a method of controlling a storage system, and a signal-bearing medium embodying a program causing a digital processing apparatus to perform a method of controlling a host adapter
JP7511151B2 (en) Lighting control systems and backup controllers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131202

R150 Certificate of patent or registration of utility model

Ref document number: 5439736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees