JP2017041110A - マルチコンピュータシステム,管理装置および管理プログラム - Google Patents

マルチコンピュータシステム,管理装置および管理プログラム Download PDF

Info

Publication number
JP2017041110A
JP2017041110A JP2015162470A JP2015162470A JP2017041110A JP 2017041110 A JP2017041110 A JP 2017041110A JP 2015162470 A JP2015162470 A JP 2015162470A JP 2015162470 A JP2015162470 A JP 2015162470A JP 2017041110 A JP2017041110 A JP 2017041110A
Authority
JP
Japan
Prior art keywords
setting information
server node
node
computer
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015162470A
Other languages
English (en)
Inventor
英信 前田
Hideaki Maeda
英信 前田
猛資 上月
Takeshi Kozuki
猛資 上月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015162470A priority Critical patent/JP2017041110A/ja
Priority to US15/222,986 priority patent/US20170054597A1/en
Publication of JP2017041110A publication Critical patent/JP2017041110A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/084Configuration by using pre-existing information, e.g. using templates or copying from other elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • H04L41/0856Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0866Checking the configuration

Abstract

【課題】設定情報の格納に用いられる記憶容量を削減する。
【解決手段】複数のコンピュータのうち第1のコンピュータが、第1のコンピュータ2の設定情報を第1のコンピュータに備えられた記憶装置23に格納する制御を行なう、第1の設定情報管理部104と、第1のコンピュータに関連する第2のコンピュータの設定情報の複写を記憶装置23に格納する制御を行なう、第2の設定情報管理部103と、複数のコンピュータ2のそれぞれに対して関連するコンピュータを表す関連情報233を、記憶装置23に格納する制御を行なう、関連情報管理部102とを備える。
【選択図】図4

Description

本発明は、マルチコンピュータシステム,管理装置および管理プログラムに関する。
一般的なサーバコンピュータには、システムを動作させる上で、BIOS(Basic Input Output System)やBMC(Baseboard Management Controller)用のファームウェア等が搭載されている。
これらのBIOSやファームウェア(以下、単にファームウェア等という)の動作に際しては、例えば装置起動時に、システムボード上の不揮発性メモリに保存された設定情報が読み出され、使用される。
システム故障等によりシステムボードの交換を行なう場合には、上述した設定情報を交換前のシステムボードから退避し、交換後のシステムボードへ復元する作業が必要となる。
従来のサーバコンピュータにおいては、設定情報をシステムボードとは別に備えられた小基板の不揮発性メモリに退避させておき、システムボード交換時に、自動的に復元する手法が知られている。
また、近年ではサーバコンピュータを構成するCPU(Central Processing Unit)等の主要コンポーネントの低消費電力化や製造プロセス向上によりチップの集約・小型化が進んでいる。そして、これにより、サーバコンピュータ自身の小型化および・高集約化が加速する傾向にある。例えば、複数のサーバノードが1つの筐体内に搭載される、ブレードサーバやマルチノードサーバと呼ばれる装置が用いられている。
これらのマルチノードサーバ等についても、複数のサーバノードの各設定情報をサーバノードとは別の場所に設けられた1つの小基板上の不揮発メモリへ保存する手法が実現されている。
特開2003−92602号公報 特開2006−260330号公報
上述の如き従来のサーバコンピュータにおいて、例えば、複数のサーバノードを同一筐体内に搭載するマルチノードサーバ等において、複数のサーバノードの設定情報を1つの小基板に保存するためには、サーバノードの台数分の設定情報を格納できる容量を有する保存領域を小基板上に確保する必要がある。
サーバノードのコンピュータが小型化しても、1台当たりの設定情報のデータ量は小さくならない。その一方で、サーバの小型化は今後も進み、同一筐体内に搭載可能なサーバノードの台数はさらに増加すると考えられる。従って、これに伴い、設定情報の格納に必要な容量も増大することは明らかである。
ここで、小基板の不揮発性メモリの容量が不十分であると、将来的にサーバノードの数を増加させる場合に、設定情報を格納できないおそれがある。これに対して、将来的なシステム拡張を見据えて、搭載可能なサーバノードの最大数やそれ以上の数に合わせた容量の不揮発性メモリを実装する場合には、当初においては余剰な不揮発性メモリを備えることになる。すなわち、部品点数,実装面積および製造コストの各観点において無駄が生じる。
1つの側面では、本発明は、設定情報の格納に用いられる記憶容量を削減することができる。
このため、このマルチコンピュータシステムは、複数のコンピュータを備えるマルチコンピュータシステムにおいて、前記複数のコンピュータのうち第1のコンピュータが、前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部とを備える。
一実施形態によれば、設定情報の格納に用いられる記憶容量を削減することができる。
実施形態の一例としてのコンピュータのハードウェア構成を示す図、である。 実施形態の一例としてのコンピュータシステムの不揮発性メモリに格納される情報を例示する図である。 実施形態の一例としてのコンピュータシステムに備えられるBMCのハードウェア構成の一例を示すブロック図である。 実施形態の一例としてのコンピュータシステムのBMCの機能構成を示す図である。 実施形態の一例としてのコンピュータシステムにおけるサーバノード情報を例示する図である。 実施形態の一例としてのコンピュータシステムにおける仮サーバノード情報を例示する図である。 実施形態の一例としてのコンピュータシステムにおける仮サーバノード情報を例示する図である。 (A)〜(D)は実施形態の一例としてのコンピュータシステムの自ノード設定情報管理部による自ノード設定情報の検証方法を例示する図である。 実施形態の一例としてのコンピュータシステムにおける自ノード設定情報および他ノード設定情報を例示する図である。 実施形態の一例としてのコンピュータシステムにおけるBMCによる処理を説明するフローチャートである。 実施形態の一例としてのコンピュータシステムにおけるBMCによる処理を説明するフローチャートである。 実施形態の一例としてのコンピュータシステムにおけるBMCによる処理を説明するフローチャートである。 実施形態の一例としてのコンピュータシステムにおけるBMCによる処理を説明するフローチャートである。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。 実施形態の一例としてのコンピュータシステムのBMCにおいて授受されるデータの流れを説明するための図である。
以下、図面を参照して本マルチコンピュータシステム,管理装置および管理プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。又、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
(A)構成
図1は実施形態の一例としてのコンピュータシステム1のハードウェア構成を示す図、図2は実施形態の一例としてのコンピュータシステム1の不揮発性メモリ23に格納される情報を例示する図である。
図1に示すように、本コンピュータシステム1は、複数のサーバノード(コンピュータ)2を備え、これらのサーバノード2が同一の筐体3内に搭載されている。すなわち、本コンピュータシステム1は、複数のコンピュータを備えるマルチコンピュータシステムであり、ブレードサーバもしくはマルチノードサーバとして構成されている。
サーバノード2は、CPU21,チップセット22,不揮発性メモリ23,ネットワークインタフェース24およびBMC10を備え、これらをシステムボード20上に搭載することにより構成されている。
CPU21は、種々の制御や演算を行なう処理装置であり、不揮発性メモリ23等に格納されたOSやソフトウェアを実行することにより、種々の機能を実現する。
なお、図1に示す例においては、システムボード20に1つのCPU21が備えられている例を示しているが、これに限定されるものではなく、1つのシステムボード20上に複数のCPU21を備えてもよい。
チップセット22は、CPU21とBMC10や不揮発性メモリ23等との間のデータの受け渡しを管理する回路群である。
不揮発性メモリ23はデータ等を記憶する記憶装置であり、CPU21やBMC10の補助記憶装置として使用される。不揮発性メモリ23には、OSプログラムやアプリケーションプログラム、及び各種データが格納される。なお、補助記憶装置としては、フラッシュメモリ等の半導体記憶装置(SSD:Solid State Drive)を使用することもできる。
また、不揮発性メモリ23には、図2に示すように、サーバノード情報233およびノード設定情報230(自ノード設定情報231,他ノード設定情報232)が格納される。
なお、これらの自ノード設定情報231,他ノード設定情報232およびサーバノード情報233については後述する。
さらに、サーバノード2には、図示しないRAM(Random Access Memory)もそなえられる。RAMは、種々のデータやプログラムを格納する記憶領域であって、CPU21がOSやプログラムを実行する際に、データやプログラムを格納・展開して用いる。
ネットワークインタフェース24は、他のサーバノード2等と通信路を介して通信可能に接続するためのインタフェースであり、例えば、LAN(Local Area Network)カードである。
BMC10は、コンピュータシステム1においてハードウェアの状態を監視する管理装置である。BMC10にはCPU21とは独立して電力供給が行なわれ、コンピュータシステム1のハードウェアの状態を常時監視する。
まず、図3を参照しながら、実施形態の設定情報管理機能を実現するBMC(管理装置)10のハードウェア構成について説明する。図3は実施形態の一例としてのコンピュータシステム1に備えられるBMC10のハードウェア構成の一例を示すブロック図である。
BMC10は、例えば、プロセッサ11,メモリ12およびインタフェース13を構成要素として有する。これらの構成要素11〜13は、バス14を介して相互に通信可能に構成される。
プロセッサ(処理部)11は、BMC10全体を制御する。プロセッサ11は、マルチプロセッサであってもよい。プロセッサ11は、例えばCPU,MPU(Micro Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、プロセッサ11は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
また、プロセッサ11は、演算や実行状態を保持するレジスタを備える。本実施形態においては、このレジスタの一部が、当該サーバノード2がマスタノードであるかスレーブノードであるかを示す値が設定されるマスタ/スレーブレジスタ111(図3参照)として機能する。なお、このマスタ/スレーブレジスタ111としての機能をCPU21やメモリ12等のプロセッサ11の外部に持たせてもよい。
メモリ12は、BMC10の主記憶装置として使用される。メモリ12には、プロセッサ11に実行させるOSプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ12には、プロセッサ11による処理に必要な各種データが格納される。アプリケーションプログラムには、BMC10によって本実施形態の設定情報管理機能を実現するためにプロセッサ11によって実行される管理プログラムが含まれてもよい。
インタフェース13は、BMC10に外部機器を接続するための通信インタフェースである。インタフェース13は、例えば、I2Cインタフェースであり、サーバノード2に備えられた図示しないPCIe(Peripheral Component Interconnect Express)スイッチ等にバスを介して接続されている。
以上のようなハードウェア構成を有するBMC10によって、後述する本実施形態の設定情報管理機能を実現することができる。
なお、BMC10は、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム(管理プログラム等)を実行することにより、本実施形態の設定情報管理機能を実現する。BMC10に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、BMC10に実行させるプログラムを不揮発性メモリ23に格納しておくことができる。プロセッサ11は、不揮発性メモリ23内のプログラムの少なくとも一部をメモリ12にロードし、ロードしたプログラムを実行する。
また、BMC10(プロセッサ11)に実行させるプログラムを、光ディスク,メモリ装置,メモリカード等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ11からの制御により、図示しないHDD(Hard Disk Drive)等の記憶装置にインストールされた後、実行可能にしてもよい。また、プロセッサ11が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
次に、図4を参照しながら、本実施形態の設定情報管理機能を有するBMC10の機能構成について説明する。図4は実施形態の一例としてのコンピュータシステム1のBMC10の機能構成を示す図である。
BMC10は、図4に示すように、少なくとも、設定情報管理部101,設定比較部1 05,データ送信制御部106およびデータ受信制御部107としての機能を有している。
データ送信制御部106は、他のサーバノード2に対して種々のデータやコマンドを送信する制御を行なう。例えば、データ送信制御部106は、他のサーバノード2に対して、後述の如く、仮ID(identification)パケット,スレーブ同意通知,設定クリアコマンド,サーバノード情報,マスタ昇格リクエスト,スレーブへの移行通知,テーブル更新完了通知,他ノード設定情報の提供依頼,設定情報更新通知、等を送信する制御を行なう。
データ送信制御部106は、例えば、サーバノード2に備えられたネットワークインタフェース24を介して、これらのデータやコマンド等を他のサーバノード2に送信させる。
データ送信制御部106は、自身が機能するBMC10が搭載されたサーバノード2のファームウェアの初期設定段階において、後述するサーバノード情報管理部102からの指示に従い、予め自身に登録された固有情報である仮IDを識別情報として付与したパケット(仮IDパケット)を、本コンピュータシステム1に搭載された各サーバノード2に配信する。
なお、BMC10は常時電源動作であるので、ファームウェアの初期設定段階は、例えば、本コンピュータシステム1の電源(AC(Alternating Current))投入時に発生する。以下、ファームウェアの初期設定段階を、初期化フェーズという場合がある。
データ受信制御部107は、他のサーバノード2から種々のデータやコマンドを受信する制御を行なう。例えば、データ受信制御部107は、他のサーバノード2から送信される、仮ID発行パケット,スレーブ同意通知,設定クリアコマンド,サーバノード情報,マスタ昇格リクエスト,スレーブへの移行通知,テーブル更新完了通知,他ノード設定情報の提供依頼,設定情報更新通知、等を受信する制御を行なう。
データ受信制御部107は、例えば、サーバノード2に備えられたネットワークインタフェース24を介して、これらのデータやコマンド等を受信する。
設定比較部105は、後述する自ノード設定情報管理部104からの指示に従い、不揮発性メモリ23に格納されている自ノード設定情報231と、他の複数(本実施形態では2つ)のサーバノード(関連サーバノード)2から送信される設定情報とを比較する。
具体的には、設定比較部105は、図8(A)〜(D)を用いて後述するように、自ノード設定情報231と、他の2つの関連サーバノード2からそれぞれ送信される設定情報とを、総当りで比較し、一致/不一致を判断する。
設定比較部105は、比較の結果を自ノード設定情報管理部104に通知する。
設定情報管理部101は、設定情報の管理等を行なうものであり、設定情報管理部101は、サーバノード情報管理部102,他ノード設定情報管理部103および自ノード設定情報管理部104としての機能を備える。
サーバノード情報管理部102は、本コンピュータシステム1に備えられたサーバノード2に関する情報を、サーバノード情報233を用いて管理する。
図5は実施形態の一例としてのコンピュータシステム1におけるサーバノード情報233を例示する図である。
サーバノード情報233は、図5に示すように、ID情報,関連IDおよび状態を管理項目として備え、これらの情報を相互に関連付けることにより構成されている。
ID情報は、本コンピュータシステム1に備えられるサーバノード2を特定する識別情報である。図5に示す例においては、ID情報として1〜4の整数が登録されている。すなわち、図5に示すサーバノード情報233においては、ID=1,2,3,4で特定される4つのサーバノード2が管理されている。
状態は、各サーバノード2の起動状態もしくは電源投入状態を示す。図5に示すサーバノード情報233においては、状態として“On”または“Off”が登録されている。例えば、ID=2で表されるサーバノード2は電源投入状態(起動状態)であることを示し、ID=3で表されるサーバノード2は電源断状態(非起動状態)であることを示す。
そして、この状態においては、“On”は当該サーバノード2が正常であることを示し、“Off”は当該サーバノード2が異常であることを示す。
関連IDは、当該サーバノード2に関連付けられている他のサーバノード2を表す。例えば、図5に示す例において、ID=2で表されるサーバノード2にはID=1,3で表される2つのサーバノード2が関連付けられている。
すなわち、サーバノード情報233は、複数のサーバノード2のそれぞれに対して関連するサーバノード2を表す関連情報として機能する。
そして、ID番号によって特定されるサーバノード2の設定情報の複写が、この関連付けられている2つの他のサーバノード2に、それぞれ他ノード設定情報232として格納される。
例えば、図5に示す例において、ID=2で表されるサーバノード2の設定情報の複写がID=1,3で表される2つのサーバノード2に、それぞれ他ノード設定情報232として格納される。
以下、サーバノード2の設定情報を格納する他のサーバノード2を関連サーバノード2という場合がある。ID=2で表されるサーバノード2に対して、ID=1,3で表される2つのサーバノード2がそれぞれ関連サーバノード2に相当する。
サーバノード情報管理部102は、複数のサーバノード2のそれぞれに対して関連するサーバノード2を表す関連情報(サーバノード情報233)を、不揮発性メモリ23に格納する制御を行なう、関連情報管理部として機能するのである。
なお、本実施形態においては、一のサーバノード2に対して、2つの関連サーバノード2が設定されているが、これに限定されるものではない。例えば、一のサーバノード2に対して1つの関連サーバノード2を設定してもよく、また、一のサーバノード2に対して3つ以上の関連サーバノード2を設定してもよい。
ただし、一のサーバノード2に対して関連サーバノード2を2つ以上設定することで、コンピュータシステム1において、一のサーバノード2の設定情報の複写を冗長化して保持され、信頼性が向上する。
図5に示す例において、例えば、ID=2のサーバノード2の設定情報の複写がID=1,3の各サーバノード2に格納される。そして、ID=1のサーバノード2の設定情報の複写がID=2,4のサーバノード2に、また、ID=3のサーバノード2の設定情報の複写がID=2,4のサーバノード2に、それぞれ格納される。
すなわち、ID=2のサーバノード2は、関連サーバノード2であるID=1,3の各設定情報の複写を格納する。このように、一のサーバノード2とその関連サーバノード2との間では、互いの設定情報の複写を相互に持ち合う補完関係が成立している。
本コンピュータシステム1においては、サーバノード2の設定情報の複写を、コンピュータシステム1に備えられたサーバノード2のうちの一部である関連サーバノード2に保持させることで、設定情報を分散して格納することができる。すなわち、コンピュータシステム1に備えられた全サーバノード2の設定情報を格納するための記憶領域を有する大容量の不揮発性メモリを特定のサーバノード2等に確保する必要がなく、装置コストを低減することができる。
なお、サーバノード2に対する関連サーバノード2は、初期化フェーズにおいて、マスタのサーバノード2のサーバノード情報管理部102によって設定され、本コンピュータシステム1に備えられた他のサーバノード2に配布される。一のサーバノード2に対する関連サーバノード2の決定方法は特に限定されるものではない。例えば、本コンピュータシステム1に備えられた複数のサーバノード2の中から任意に選択してもよく、また、筐体3内のスロット位置や挿入順等、なんらかの規定に基づいて決定してもよく、種々変形して実施することができる。
サーバノード情報管理部102は、初期化フェーズにおいて、当該サーバノード情報管理部102が機能するBMC10が搭載されたサーバノード2(自サーバノード2)の不揮発性メモリ23にサーバノード情報233が登録されているかを確認する。
そして、自サーバノード2の不揮発性メモリ23にサーバノード情報233が格納されていない場合に、サーバノード情報管理部102は、データ送信制御部106に、他のサーバノード2に対する仮IDパケットの発行およびサーバノード情報233の取得要求を実施させる。
サーバノード情報233の取得要求に対して、他サーバノード2からの返信がない場合、すなわち、他のサーバノード2も初期化フェーズである場合に、サーバノード情報管理部102は、他のサーバノード2を含めてサーバノード情報233を更新するため、マスタへ昇格する手続きを実施する。具体的には、サーバノード情報管理部102は、本コンピュータシステム1に備えられた他の全てのサーバノード2に対してマスタ昇格を宣言するリクエスト(マスタ昇格通知,マスタ昇格のリクエスト)を送信する。すべてのサーバノード2からスレーブ同意通知を受信した場合に、当該サーバノード2はマスタ昇格し、そのサーバノード情報管理部102は、マスタ/スレーブレジスタ111に、マスタノードとして機能することを示す値を設定する。
これに対して、他のサーバノード2からマスタ昇格通知を受信したサーバノード2は、マスタ昇格せず、スレーブ動作することになる。その際、サーバノード情報管理部102は、マスタ/スレーブレジスタ111に、スレーブノードとして機能することを示す値を設定する。
本コンピュータシステム1においては、前述の如く、初期化フェーズにおいてサーバノード情報233が登録されていない場合、すなわち、全てのサーバノード2が初期化フェーズである場合に、各サーバノード2はそれぞれ仮IDパケットを発行する。
サーバノード情報管理部102は、各サーバノード2から受信した仮IDパケットに基づき、筐体3に搭載されたサーバノード2の構成(例えば、搭載台数)を把握する。
また、マスタのサーバノード2は、データ受信制御部107を介して、他サーバノード2から発行される仮IDパケットをそれぞれ収集し、仮サーバノード情報233aを作成する。
図6および図7実施形態の一例としてのコンピュータシステム1における仮サーバノード情報233aを例示する図である。図6は仮IDだけを登録した状態の仮サーバノード情報233aを例示する図、図7は仮IDに加えて、ID情報,関連IDおよび状態を登録した状態の仮サーバノード情報233aを例示する図である。
仮サーバノード情報233aは、図5に示したサーバノード情報233の管理項目に加えて仮IDを備える。この仮IDには、他のサーバノード2から受信した仮IDパケットから抽出した仮IDが登録される。なお、図中、既述の管理項目と同一の項目は、同様の内容を示しているので、その説明は省略する。
サーバノード情報管理部102により作成された時点の仮サーバノード情報233aにおいては、仮IDのみが登録され、ID情報,関連IDおよび状態はブランク(“−”)となっている(図6参照)。
そして、サーバノード情報管理部102は、この仮サーバノード情報233aに基づき、サーバノード情報233を作成する。
サーバノード情報管理部102は、例えば、各仮IDに対して正式にID(ID情報)を付与し、また、これらのIDに対して、関連IDを設定する。すなわち、サーバノード情報管理部102は、各サーバノード2について、その設定情報を保存させる関連サーバノード2を設定する。また、サーバノード情報管理部102は、各サーバノード2の電源投入状態を状態に設定する(図7参照)。
その後、この仮サーバノード情報233aから仮IDを除去することにより、サーバノード情報233が作成される。
サーバノード情報管理部102は、作成したサーバノード情報233をデータ送信制御部106を介して他の全てのサーバノード2に配信する。
スレーブのサーバノード2においては、サーバノード情報管理部102は、マスタのサーバノード2から受信したサーバノード情報233を用いて、不揮発性メモリ23に格納されているサーバノード情報233を更新する。
また、サーバノード情報管理部102は、サーバノード情報233を用いて他のサーバノード2、具体的には関連サーバノード2の死活監視を行なう機能を備える。
死活監視は、他のサーバノード2が正常に動作しているか否かを確認することであり、サーバノード情報管理部102は、例えば、なんらかのコマンドを関連サーバノード2に対して送信する。送信したコマンドに対する応答が得られた場合には、当該サーバノード2は正常であると判断される。送信したコマンドに対する応答が得られない場合には、当該サーバノード2は異常であると判断される。
サーバノード情報管理部102は、死活監視の結果(正常/異常)に基づき、サーバノード情報233の状態(On/Off)を更新する。また、サーバノード情報管理部102は、異常が検出された関連サーバノード2のIDと、当該サーバノード2が異常である旨を示す情報(状態変更通知)とを、本コンピュータシステム1における他の全てのサーバノード2に送信(一斉通知)する。
サーバノード情報管理部102は、サーバノード2が異常である旨を示す情報として、例えば、“IDx=Off”を送信する。なお、IDxは異常が検出されたサーバノード2のIDを示すものとする。
状態変更通知を受信したサーバノード2においては、サーバノード情報管理部102が、受信した状態変更通知に従い、不揮発性メモリ23に格納されているサーバノード情報233を更新する。
このように、サーバノード情報管理部102が、サーバノード情報233における“状態”の更新を行なうことで、本コンピュータシステム1において行なわれているサーバノード2の交換や増設の状態を把握することができる。また、死活監視の結果、異常を検出したサーバノード情報管理部102が状態変更通知を他のサーバノード2に一斉通知することにより、各サーバノード2のサーバノード情報管理部102が能動的に故障に対する復元の動作や増設に伴うサーバノード情報233の再構築を実施することができる。
自ノード設定情報管理部104は、当該自ノード設定情報管理部104が機能するBMC10が備えられたサーバノード2(自サーバノード2)の設定情報である、自ノード設定情報231を管理する。
例えば、自ノード設定情報管理部104は、不揮発性メモリ23における所定の領域に自ノード設定情報231を格納する。また、自ノード設定情報管理部104は、不揮発性メモリ23から自ノード設定情報231を読み出し、データ送信制御部106を介して2つの関連サーバノード2にそれぞれ送信させる。受信した各関連サーバノード2は、受信した設定情報を他ノード設定情報232として格納する。
これにより、当該サーバノード2の設定情報(自ノード設定情報231)の複写が、2つの関連サーバノード2においてそれぞれ他ノード設定情報232として格納される。
また、自ノード設定情報管理部104は、不揮発性メモリ23に格納された自ノード設定情報231が正しいか否かを検証する機能を有する。
例えば、本コンピュータシステム1の起動や再起動の段階で、自ノード設定情報管理部104は、自ノード設定情報231が正しいか否かの判別を行なう。
自ノード設定情報管理部104は、サーバノード情報233を参照して、関連IDによって表される関連サーバノード2のそれぞれに対して、各関連サーバノード2が格納する他ノード設定情報232の送信要求(問合せ)を行なう。送信要求を受信した各関連サーバノード2は、それぞれ自身が格納する他ノード設定情報232を応答する。
そして、自ノード設定情報管理部104は、不揮発性メモリ23に格納されている自ノード設定情報231と、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値(設定情報)とを設定比較部105に比較させる。
設定比較部105による比較の結果、自ノード設定情報231と、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値とが不一致である場合には、以下の手法により自ノード設定情報231として採用する設定情報を決定する。
すなわち、自ノード設定情報管理部104は、自ノード設定情報231として記録された設定情報および、複数の他ノード設定情報232として記録された各設定情報の間で一致数が最も多い設定情報を採用する。すなわち、自ノード設定情報管理部104は、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値とが不一致である場合に、多数決により一致数が最も多い設定情報を、自ノード設定情報231として採用する。
そして、採用する設定情報が、自身が不揮発性メモリ23に自ノード設定情報231として記録している設定情報と異なる場合には、採用する設定情報を自ノード設定情報231として決定する。
図8(A)〜(D)は実施形態の一例としてのコンピュータシステム1の自ノード設定情報管理部104による自ノード設定情報231の検証方法を例示する図である。
図8(A)〜(D)においては、ID=2のサーバノード2(サーバノード#2という)における自ノード設定情報231の検証方法を示す。ID=1のサーバノード2(サーバノード#1という)およびID=3のサーバノード2(サーバノード#3という)が、それぞれサーバノード#2の関連サーバノード2であるものとする。
サーバノード#2の自ノード設定情報管理部104は、自ノード設定情報231として不揮発性メモリ23に記録している設定情報と、サーバノード#1およびサーバノード#3のそれぞれが他ノード設定情報232として記録している、サーバノード#2についての設定情報とを相互に比較する。
なお、図中、ID=2のサーバノード2を「自身」と示し、ID=1,3の各サーバノード2を「関連サーバノード#1」,「関連サーバノード#3」と示す。
図8(A)に示す例においては、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#1および関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とが全て(完全に)一致している。
この場合には、サーバノード#2の自ノード設定情報管理部104は、自身が保持している自ノード設定情報231を自ノード設定情報231として採用する。
図8(B)に示す例においては、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報とは一致している。しかしながら、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とが不一致である(一部不一致)。
すなわち、サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とが不一致である。
この場合には、サーバノード#2の自ノード設定情報管理部104は、多数決により一致数が最も多い、自身が保持している自ノード設定情報231を自ノード設定情報231として採用する。
図8(C)に示す例においては、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報とが不一致である。また、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とも不一致である。
ただし、サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とが一致している(一部不一致)。
この場合には、サーバノード#2の自ノード設定情報管理部104は、多数決により一致数が最も多い、関連サーバノード#1(#3)が他ノード設定情報232として保持しているサーバノード#2についての設定情報を自ノード設定情報231として採用する。
図8(D)に示す例においては、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報と不一致である。また、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とも不一致である。
さらに、サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とも不一致である。
この場合には、サーバノード#2の自ノード設定情報管理部104は、自身が保持している自ノード設定情報231を自ノード設定情報231として採用する。
他ノード設定情報管理部103は、当該他ノード設定情報管理部103が機能するBMC10が備えられたサーバノード2(自サーバノード2)に対する関連サーバノード2についての設定情報の複写である、他ノード設定情報232を管理する。
例えば、他ノード設定情報管理部103は、不揮発性メモリ23における所定の領域に他ノード設定情報232を格納する。また、他ノード設定情報管理部103は、他のサーバノード2から他ノード設定情報232の送信を要求されると、不揮発性メモリ23から他ノード設定情報232を読み出し、データ送信制御部106を介して関連サーバノード2に送信させる。
これにより、他ノード設定情報232を共有することができる。また、例えば、関連サーバノード2がシステム故障等の理由で交換される場合に、この交換された関連サーバノード2に対して、その設定情報を送信し、関連サーバノード2を交換前と同様に機能させることができる。
従って、他ノード設定情報管理部103は、複数のサーバノード2のうち一のサーバノード2に関連する関連サーバノード2の設定情報の複写を、自身の不揮発性メモリ23に格納する制御を行なう、第2の設定情報管理部として機能する。
図9は実施形態の一例としてのコンピュータシステム1における自ノード設定情報231および他ノード設定情報232を例示する図である。なお、この図9に示す例においては、自ノード設定情報231と他ノード設定情報232とを組み合わせて、ノード設定情報230として示している。
ノード設定情報230は、図9に示すように、設定項目,オフセット(Offset),自設定および他設定を管理項目として備えている。また、図9に示す例においては、ID=2のサーバノード2についてのノード設定情報230(自ノード設定情報231および他ノード設定情報232)を示している。
設定項目は、設定情報の種類であり、BIOSやファームウェアにおいて管理される項目を示す。これらの設定項目毎に設定情報としての値が用意される。オフセットは、その設定項目についての設定情報の格納位置を表す。このオフセットは、例えば、不揮発性メモリ23における当該設定項目について設定情報の格納位置を、所定の基準位置からの距離で表す。
自設定は、自サーバノード2についての設定情報の値である。例えば、ID=2のサーバノード2においては、このID=2のサーバノード2(ノード2)の設定情報の各値が、この自設定として登録される。
他設定は、関連サーバノード2についての設定情報の値である。本コンピュータシステム1においては、関連サーバノード2として2つのサーバノード2が設定されるので、この図9に示す例においても、2つの他設定が備えられている。
図9に例示するノード設定情報230は、ID=2のサーバノード2についてのものであるので、ID=1のサーバノード2(ノード1)およびID=3のサーバノード2(ノード3)の各設定情報が、他設定として示されている。
例えば、“CCC”という設定項目の設定情報は、“04h”のオフセット位置に格納されるものであり、ノード2(自サーバノード2)においては“Yes”が、ノード1およびノード3においては“No”がそれぞれ設定される。
そして、ノード設定情報230において、設定項目,オフセットおよび自設定が、自ノード設定情報231に相当する。また、ノード設定情報230において、設定項目,オフセットおよび他設定が、他ノード設定情報232に相当する。
(B)動作
上述の如く構成された、実施形態の一例としてのコンピュータシステム1におけるBMC10による処理を、図14〜図23を参照しながら、図10〜図13に示すフローチャート(ステップA1〜A47)に従って説明する。
なお、図14〜図22は、それぞれ実施形態の一例としてのコンピュータシステム1のBMC10において授受されるデータの流れを説明するための図であり、図14〜図16はサーバノード情報233の更新処理に関するデータの流れを示す。また、図17は他ノード設定情報232の更新処理に関するデータの流れを、図18は自ノード設定情報231の確認処理に関するデータの流れを、図19は自ノード設定情報231が更新された場合の処理に関するデータの流れを、それぞれ示す。
また、図20および図21は死活監視に関するデータの流れを示し、特に図21は死活監視の結果異常が検出された場合のデータの流れを示す。さらに、図22はサーバノード2の交換時おけるデータの流れを示し、図23はサーバノード2の増設時におけるデータの流れを示す。
なお、図10はステップA1〜A10の処理を示し、図11はステップA11〜A19の処理を、図12はステップA20〜A26の処理を、図13はステップA27〜A47の処理を、それぞれ示す。
本コンピュータシステム1にAC電源が投入されると、BMC10のファームウェア(FW)の初期化が開始される(図10のステップA1)。サーバノード情報管理部102は、データ送信制御部106を介して、不揮発性メモリ23内のサーバノード情報233の内容を確認する(図10のステップA2)。すなわち、サーバノード情報管理部102は、サーバノード情報233に有効な情報が格納されている否かを確認する。
確認の結果、サーバノード情報233に有効な情報が格納されていない場合には(ステップA2の“情報なし”ルート参照)、初期設定段階として、サーバノード情報管理部102はサーバノード情報233の更新処理を開始する。
この状態では同一筐体3内のサーバノード2の構成等の情報を持っていないため、筐体3内に有効なサーバノード情報233を所持しているサーバノード2が存在するか不明である。そのため、サーバノード情報管理部102は、データ送信制御部106を介して、有効なサーバノード情報233を所持しているサーバノード2を探す要求をする(サーバノード情報233の取得要求発行)。
データ送信制御部106は、自身で予め所有している仮IDを識別情報として付与した仮IDパケットを、筐体3内に搭載されている全サーバノード2に対して配信する(図10のステップA3;図14の符号B1,B2参照)。
サーバノード情報管理部102は、発行したサーバノード情報233の取得要求に対して、送信元サーバノード2の正式な(仮IDではない)IDとサーバノード情報233とを受信したかを確認する(図10のステップA4)。
確認の結果、他のサーバノード2から返信がない場合、すなわち正式IDおよびサーバノード情報233を受信しない場青には(ステップA4のNOルート参照)、他のサーバノード2も初期設定段階にあると考えられる。サーバノード情報管理部102は、他のサーバノード2を含めてサーバノード情報233を更新するため、マスタへ昇格する手続きを実施する。
サーバノード情報管理部102は、他のサーバノード情報管理部102からマスタ昇格通知を受信したかを確認する(ステップA5)。
マスタ昇格通知を受信せず、また、他サーバノード2も初期設定段階である場合には(ステップA5のNOルート参照)、仮IDパケットが発行されるため、サーバノード情報管理部102は、データ受信制御部107を介して、他サーバノード2から発行される仮IDパケットを収集し(図14の符号B2参照)、仮サーバノード情報233aを作成する(図11のステップA11)。サーバノード情報管理部102は、仮IDパケットの送信元の数に基づき、本コンピュータシステム1の筐体3に搭載されたサーバノード2の構成(台数)を把握する。
一定期間、マスタ昇格通知を受信しない場合、サーバノード情報管理部102はマスタ昇格を宣言するリクエストを、データ送信制御部106を介して他の全てのサーバノード2に対して発行する(図11のステップA12:図15の符号C1参照)。
サーバノード情報管理部102は、仮サーバノード情報233aに登録された全てのサーバノード2からスレーブ同意通知を受信したかを確認する(図11のステップA13)。全てのサーバノード2からスレーブ同意通知を受信していない場合には(ステップA13のNOルート参照)、ステップA13を繰り返し実行する。
全てのサーバノード2からスレーブ同意通知を受信すると(ステップA13のYESルート参照:図15の符号C2参照)、サーバノード情報管理部102は、マスタ昇格し、マスタ/スレーブレジスタ111に、マスタノードとして機能することを示す値を設定する(図11のステップA14:図15の符号C3a)。
マスタ昇格後、このマスタサーバノード2において、サーバノード情報管理部102は、全サーバノード2に対して、設定クリアコマンドをデータ送信制御部106を介して発行する(図11のステップA15:図15の符号C3参照)。この設定クリアコマンドは、各スレーブのサーバノード2のサーバノード情報233および他ノード設定情報232のクリアを指示するものである。
設定クリアコマンドを受信したサーバノード2は、サーバノード情報233および他ノード設定情報232のクリアを行なう。また、これらのサーバノード情報233および他ノード設定情報232のクリアが完了すると、サーバノード2は、マスタサーバノード2に対して設定クリア完了を通知する。
マスタサーバノード2において、サーバノード情報管理部102は、仮サーバノード情報233aに登録された全てのサーバノード2から設定クリア完了の通知を受信したかを確認する(図11のステップA16)。
全てのサーバノード2から設定クリア完了の通知を受信していない場合には(ステップA16のNOルート参照)、ステップA16を繰り返し実行する。
全てのサーバノード2から設定クリア完了の通知を受信すると(ステップA16のYESルート参照:図15の符号C4参照)、マスタサーバノード2において、サーバノード情報管理部102は、各仮IDに対して正式なID(ID情報)を付与し、また、これらのIDに対して、関連IDを設定する。すなわち、サーバノード情報管理部102は、各サーバノード2について、その設定情報を保存させる関連サーバノード2を設定し、サーバノード情報233を作成する。
マスタサーバノード2において、サーバノード情報管理部102は、作成したサーバノード情報233をデータ送信制御部106を介して、本コンピュータシステム1に備えられた全てのサーバノード2に対して通知する(図11のステップA17:図15の符号C5参照)。
マスタサーバノード2において、サーバノード情報管理部102は、本コンピュータシステム1に備えられた全てのサーバノード2からサーバノード情報233の設定完了の通知を受信したかを確認する(図11のステップA18)。
全てのサーバノード2から設定完了の通知を受信していない場合には(ステップA18のNOルート参照)、ステップA18を繰り返し実行する。
各サーバノード2から設定完了通知の受領を確認すると(ステップA18のYESルート参照:図15の符号C6参照)マスタサーバノード2のサーバノード情報管理部102は、スレーブへの降格を行なう。すなわち、マスタサーバノード2において、サーバノード情報管理部102は、マスタ/スレーブレジスタ111の値を、スレーブノードとして機能することを示す値に変更する(図15の符号C7a参照)。
また、マスタサーバノード2において、サーバノード情報管理部102は、スレーブノードに降格したことを他サーバノード2へ通知(スレーブ移行通知)し(図11のステップA19:図15の符号C7参照)、処理は図10のステップA7に移行する。
一方、他のサーバノード2からマスタ昇格を宣言するリクエストを受信した場合(ステップA5のYESルート参照:図14の符号B3参照)、当該サーバノード2は、マスタ昇格せず、スレーブ動作する。この際、サーバノード情報管理部102は、マスタ/スレーブレジスタ111に、スレーブノードとして機能することを示す値を設定する(図14の符号B3a参照)。また、サーバノード情報管理部102は、スレーブ動作を同意する目的で、スレーブ同意通知を他サーバノード2へ発行する(図12のステップA20:図14の符号B5参照)。
その後、スレーブサーバノード2において、サーバノード情報管理部102は、マスタのサーバノード2から、他ノード設定情報232およびサーバノード情報233についての設定クリアコマンド(リクエスト)を受信したかを確認する(図12のステップA21)。マスタのサーバノード2から設定クリアコマンド(リクエスト)が受信されない場合には(ステップA21のNOルート参照)、ステップA21を繰り返し実行して設定クリアコマンドの受信を待つ。
マスタのサーバノード2から設定クリアコマンドを受信すると(ステップA21のYESルート参照:図16の符号D1参照)、スレーブサーバノード2において、サーバノード情報管理部102は、不揮発性メモリ23に格納されているサーバノード情報233および他ノード設定情報232をクリアする(図12のステップA22:図16の符号D2参照)。2つのクリアが完了した段階で、サーバノード情報管理部102は、設定クリア完了の通知をマスタのサーバノード2へ発行する(図12のステップA23:図16の符号D3参照)。
その後、スレーブサーバノード2において、サーバノード情報管理部102は、マスタのサーバノード2からサーバノード情報233を受信したかを確認する(図12のステップA24)。
マスタのサーバノード2からサーバノード情報233を受信していない場合には(ステップA24のNOルート参照)、ステップA24を繰り返し実行する。
マスタのサーバノード2からサーバノード情報233を受信すると(ステップA24のYESルート参照:図16の符号D4参照)、スレーブサーバノード2において、サーバノード情報管理部102は、不揮発性メモリ23内のサーバノード情報233を受信したサーバノード情報233の値を用いて更新する(図16の符号D5参照)。また、サーバノード情報管理部102は、サーバノード情報233の更新完了の報告をマスタのサーバノード2へ送信する(図12のステップA25:図16の符号D6参照)。
スレーブサーバノード2において、サーバノード情報管理部102は、マスタのサーバノード2からスレーブ移行通知を受信したかを確認する(図12のステップA26)。
マスタのサーバノード2からスレーブ移行通知を受信していない場合には(ステップA26のNOルート参照)、ステップA26を繰り返し実行する。
マスタのサーバノード2からスレーブ移行通知を受信すると(ステップA26のYESルート参照:図16の符号D7参照)、処理は図10のステップA7に移行する。
図10のステップA7において、他ノード設定情報管理部103は、不揮発性メモリ23に保存されている他ノード設定情報232を確認し、他ノード設定情報232に有効なデータ(設定情報)が登録されているかを確認する(図17の符号E1参照)。
確認の結果、他ノード設定情報232に有効なデータが存在しない場合には(ステップA7の“他ノード設定情報なし”ルート参照)、他ノード設定情報管理部103は、サーバノード情報233を参照して、関連サーバノード2を確認する(図17の符号E2参照)。そして、他ノード設定情報管理部103は、関連サーバノード2に対して、他ノード設定情報232の提供を依頼する(図10のステップA8:図17の符号E3参照)。
他ノード設定情報管理部103は、関連サーバノード2から他ノード設定情報232を受信したかを確認する(図10のステップA9)。
関連サーバノード2から他ノード設定情報232を受信していない場合には(ステップA9の“設定情報未受信”ルート参照)、ステップA9を繰り返し実行する。
関連サーバノード2から他ノード設定情報232を受信すると(ステップA9の“設定情報受信”ルート参照:図17の符号E4参照)、他ノード設定情報管理部103は、受信した他ノード設定情報232を不揮発性メモリ23に格納する(図10のステップA10:図17の符号E5参照)。
すなわち、上述した図10のステップA7〜A10に示す処理が、他ノード設定情報管理部103による他ノード設定情報232の更新処理に相当する。
その後、図13のステップA27に移行する。また、ステップA7における確認の結果、他ノード設定情報232に有効なデータが存在する場合においても(ステップA7の“他ノード設定情報あり”ルート参照)、図13のステップA27に移行する。このステップA27以降においては、本コンピュータシステム1は通常運用フェーズに移行する。
通常運用フェーズにおいて、例えば、本コンピュータシステム1の起動や再起動の段階で、自ノード設定情報管理部104は、自ノード設定情報231が正しいか否かの判別を行なう。
すなわち、図13のステップA27において、自ノード設定情報管理部104は、サーバノード情報233を参照し、関連サーバノード2のそれぞれに対して、他ノード設定情報232の問合せを行なう。
その後、自ノード設定情報管理部104は、各関連サーバノード2から他ノード設定情報232を受信したかを確認する(図13のステップA28)。
関連サーバノード2のそれぞれから他ノード設定情報232を受信していない場合には(ステップA28の“設定情報未受信”ルート参照)、ステップA28を繰り返し実行する。
各関連サーバノード2から他ノード設定情報232を受信すると(ステップA28の“受信済”ルート参照:図18の符号F1参照)、自ノード設定情報管理部104は、不揮発性メモリ23に格納されている自ノード設定情報231の値を読み込む(図18の符号F2参照)。
そして、自ノード設定情報管理部104は、設定比較部105に対して依頼を行ない(図18の符号F3参照)、受信した各他ノード設定情報232における自サーバノード2についての値と、不揮発性メモリ23に格納されている自ノード設定情報231の値とを比較させる(図13のステップA29:図18の符号F4参照)。
比較の結果、設定が異なる部分が検出された場合、自ノード設定情報管理部104は、多数決により自ノード設定情報231として採用するデータ(設定情報)を決定する。すなわち、自ノード設定情報管理部104は、受信した各他ノード設定情報232における自サーバノード2についての値と、不揮発性メモリ23に格納されている自ノード設定情報231の値との間で多数決を行ない、最も多く一致する設定情報の値を確認する。
自ノード設定情報231の値が、多数決の結果における多数派の値と不一致の場合には(ステップA29の“多数決結果≠自ノード設定”ルート参照)、関連サーバノード2から受信した多数派の設定情報を、自ノード設定情報231の値として不揮発性メモリ23に格納する(図13のステップA30)。すなわち、関連サーバノード2から受信した多数派の値設定情報を用いて自ノード設定情報231を更新する(図18の符号F5参照)。
また、自ノード設定情報231の値が、多数決の結果における多数派の値と一致した場合には(ステップA29の“多数決結果=自ノード設定”ルート参照)、自ノード設定情報231の値を更新せずに、図13のステップA31に移行し、本コンピュータシステム1は通常運用状態となる。
通常状態において、自ノード設定情報管理部104は、ユーザ操作等によりBIOSやファームウェア(FW)の設定変更が行なわれたか否かを確認する(図13のステップA32参照)。
BIOSやファームウェアの設定変更が行なわれていない場合には(ステップA32のNOルート参照)、ステップA33に移行し、本コンピュータシステム1は通常運用状態となる。
一方、自ノード設定情報231が更新された場合には(ステップA32のYESルート参照)、自ノード設定情報管理部104は、BIOS等の上位から設定情報更新通知を受信する(図19の符号G1参照)。
自ノード設定情報管理部104は、更新されたデータ(設定情報)を不揮発性メモリ23に書き込む(図13のステップA34:図19の符号G2参照)。これと並行して、自ノード設定情報管理部104はサーバノード情報233に基づき、各関連サーバノード2に対して、変更された設定変更を送信する(図13のステップA35:図19の符号G3参照)。
その後、自ノード設定情報管理部104は、各関連サーバノード2から設定情報の更新完了を通知する書き込み完了コマンドを受信したかを確認する(図13のステップA36)。
関連サーバノード2のそれぞれから書き込み完了コマンドを受信していない場合には(ステップA36のNOルート参照)、ステップA36を繰り返し実行する。
各関連サーバノード2から書き込み完了コマンドを受信すると(ステップA36のYESルート参照:図19の符号G4参照)、図13のステップA33に移行し、本コンピュータシステム1は通常運用状態となる。
通常状態において、サーバノード情報管理部102は、サーバノード情報233を用いて関連サーバノード2の死活監視を行なう(図13のステップA37:図20の符号H1参照)。すなわち、関連サーバノード2が正常に動作(alive)しているか、停止(dead)しているかを判断する。
サーバノード情報管理部102は、例えば、なんらかのコマンドを関連サーバノード2に対して送信する。送信したコマンドに対する応答が得られた場合には、当該サーバノード2は正常であると判断される。送信したコマンドに対する応答が得られない場合には、当該サーバノード2は異常であると判断される。
送信したコマンドに対する応答が関連サーバノード2から得られた場合(図20の符号H2参照)、すなわち、関連サーバノード2が動作している場合には(ステップA37の“alive”ルート参照)、ステップA37を繰り返し実行する。
関連サーバノード2に異常が検出された場合には(ステップA37の“dead”ルート参照:図21の符号J1参照)、サーバノード情報管理部102は、サーバノード情報233における当該関連サーバノード2のIDに対応する状態の値を、異常を示すステータスである“Off”へ変更する(図13のステップA38:図21の符号J2参照)。
また、サーバノード情報管理部102は、異常である関連サーバノード2のIDを筐体3内の全てのサーバノード2に対して状態変更通知(例えば、“IDx=Off”)を送信する(図13のステップA39:図21の符号J3参照)。この状態変更通知を受信した各サーバノード2は、それぞれ自身が管理するサーバノード情報233を状態変更通知に合わせて更新する。その後、図13のステップA40に移行し、本コンピュータシステム1は通常運用状態となる。
また、通常状態において、他のサーバノード2で異常が発生し、当該サーバノード2の交換が行なわれる場合がある。
このような場合に、交換されたサーバノード2はサーバノード情報233を所持していないため、上述の図10のステップA7に示した初期化フェーズの動作が実行される。
そのため、サーバノード2は、運用中に他のサーバノード2から仮IDを受信するケースがある。すなわち、サーバノード情報管理部102は、他のサーバノード2から仮IDを受信したか否かを確認する(図13のステップA41)。
仮IDを受信した場合に(ステップA41のYESルート参照:図22の符号K1参照)、サーバノード情報管理部102は、不揮発性メモリ23内のサーバノード情報233を確認して、関連サーバノード2の中で状態がOffとなっているものがあるかを確認する(図13のステップA43:図22の符号K2参照)。
サーバノード情報233において状態がOffのである、すなわち、異常な関連サーバノード2が存在する場合に(ステップA43のYESルート参照)、サーバノード情報管理部102は、不揮発性メモリ23からサーバノード情報233および他ノード設定情報232を読み出す(図22の符号K3参照)。
そして、サーバノード情報管理部102は、仮IDを発行したサーバノード2に対して、この状態がOffとなっている関連サーバノード2のIDを正式IDとして設定する。すなわち、サーバノード情報管理部102は、状態が異常であった関連サーバノード2が保守作業により交換されたと判断し、この異常が生じていた関連サーバノード2のIDを割り当てるのである。
そして、サーバノード情報管理部102は、仮IDを発行したサーバノード2に対して、その正式なIDとともに、サーバノード情報233および他ノード設定情報232を送信する(図13のステップA44:図22の符号K4参照)。
仮IDを発行したサーバノード2においては、正式IDとともにサーバノード情報233および他ノード設定情報232を受信した後、不揮発性メモリ23に、これらの受信したサーバノード情報233および他ノード設定情報232の値を、不揮発性メモリ23に格納する(反映させる)。そして、仮IDを発行したサーバノード2においては、そのサーバノード情報233の自らの状態を“On(正常)”へ変更する。これにより、本コンピュータシステム1は通常運用状態となる(図13のステップA45)。
また、仮IDを発行したサーバノード2においては、自身の状態が“On(正常)”であることを示す通知信号を、全てノードへ通知する(図13のステップA46)。このようにして、コンピュータシステム1におけるサーバノード2の交換作業が完了する。
その後、ステップA42に戻り、以下、通常運用フェーズとして、ステップA31以降の処理が繰り返し行なわれる。なお、図13のステップA41における確認の結果、仮IDを受信しない場合にも(ステップA41のNOルート参照)、このステップA42に移行する。
また、ステップA43における確認の結果、サーバノード情報233において状態がOffである関連サーバノード2が存在しない場合には(ステップA43のNOルート参照:図23の符号L2参照)、新規にサーバノード2が増設されたと考えられる。
この場合、コンピュータシステム1に既存の各サーバノード2において、サーバノード情報管理部102は、仮IDの受信をなかったものとみなす(無視する:図13のステップA47)。その後、ステップA42に移行する。
一方、新規に増設されたサーバノード2においては、その起動により、図10のステップA1からの処理が実行される。
その際、増設されたサーバノード2についての情報を既存の各サーバノード2は備えていないので、処理はステップA1〜A3に移行し、このステップA3において仮IDの発行が行なわれる(図23の符号L1参照)。また、処理はA7〜A9およびA11に移行し、この増設されたサーバノード2はマスタへ昇格することになる(図23の符号L3参照)。その後、この増設されたサーバノード2において、サーバノード情報233の更新が行なわれ、筐体3内全てのサーバノード2の構成情報が更新されるのである。
また、図10のステップA4における確認の結果、他のサーバノード2から正式IDおよびサーバノード情報233を受信した場合には(ステップA4のYESルート参照)、サーバノード情報管理部102は、受信した正式IDとサーバノード情報233とを不揮発性メモリ23に書き込む(図10のステップA6)。これにより、コンピュータシステム1への新たなサーバノード2の増設が完了し、ステップA27に移行して(符号A参照)、通常動作モードとなる。
(C)効果
このように、実施形態の一例としてのコンピュータシステム1によれば、一のサーバノード2の設定情報の複写を、関連サーバノード2に保持させることで、設定情報を分散して格納することができる。関連サーバノード2に保持させた設定情報の複写は、設定情報のバックアップとして機能させることができ、保守作業等によりサーバノード2が交換された場合に、これらの関連サーバノード2に保持させた設定情報のバックアップを用いて、サーバノード2を迅速に復旧することができる。
すなわち、コンピュータシステム1に備えられた全サーバノード2の設定情報を格納するための記憶領域を有する大容量の不揮発性メモリを特定のサーバノード2等に確保する必要がなく、装置コストを低減することができる。
また、一のサーバノード2に対して2つ以上の関連サーバノード2を設定することで、設定情報を冗長化してバックアップすることができる。
サーバノード2においては、自身の不揮発性メモリ23にサーバノード情報233が格納されていない場合に、サーバノード情報管理部102が、データ送信制御部106を介して、関連する他のサーバノード2に対してサーバノード情報233の取得要求を行なう。
これにより、関連する他サーバノード2から自身の設定情報を取得することができ、例えば、サーバノード2の保守交換等を行なう場合に、容易にサーバノード2を使用可能な状態に設定することができる。
また、サーバノード情報管理部102が、サーバノード情報233における“状態”の更新を行なうことで、本コンピュータシステム1において行なわれているサーバノード2の交換や増設の状態を把握することができる。また、死活監視を行ない、その結果、異常を検出したサーバノード情報管理部102が状態変更通知を他のサーバノード2に一斉通知することにより、各サーバノード2のサーバノード情報管理部102が能動的に故障に対する復元の動作や増設に伴うサーバノード情報233の再構築を実施することができる。
また、サーバノード2において構成変更や設定変更が行なわれ、設定情報に変更が生じた場合に、自ノード設定情報管理部104が、サーバノード情報233を参照して、データ送信制御部106を介して関連する他のサーバノード2に変更後の設定情報を送信する。
これにより、サーバノード2において生じた設定情報の変更を、バックアップとして保持する関連他サーバノード2に反映させることができる。
自ノード設定情報管理部104が、不揮発性メモリ23に格納されている自ノード設定情報231と、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値とを設定比較部105に比較させる。そして、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値とが不一致である場合に、多数決により一致数が最も多い設定情報を、自ノード設定情報231として採用する。
これにより、サーバノード2において自ノード設定情報231として格納される設定情報の信頼性を向上させることができる。
(D)その他
なお、上述した実施形態に関わらず、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、コンピュータシステム1に備えられるサーバノード2の数は、3つ以下または5つ以上でもよく、種々変形して実施することができる。
また、上述した実施形態においては、同一筐体3内に複数のサーバノード2を備えたコンピュータシステム1について示しているが、これに限定されるものではなく、筐体3の外部に備えられたサーバノード2の設定情報も同様に取り扱ってもよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
(E)付記
(付記1)
複数のコンピュータを備えるマルチコンピュータシステムにおいて、
前記複数のコンピュータのうち第1のコンピュータが、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
を備えることを特徴とする、マルチコンピュータシステム。
(付記2)
前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記第2の設定情報管理部が、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
ことを特徴とする、付記1記載のマルチコンピュータシステム。
(付記3)
前記第1のコンピュータの設定情報に変更が生じた場合に、
前記第1の設定情報管理部が、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
ことを特徴とする、付記1または2記載のマルチコンピュータシステム。
(付記4)
前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、付記1〜3のいずれか1項に記載のマルチコンピュータシステム。
(付記5)
前記第1の設定情報管理部が、
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
ことを特徴とする、付記4記載のマルチコンピュータシステム。
(付記6)
複数のコンピュータを備えるマルチコンピュータシステムにおいて、前記複数のコンピュータのうち第1のコンピュータに備えられる管理装置が、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
を備えることを特徴とする、管理装置。
(付記7)
前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記第2の設定情報管理部が、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
ことを特徴とする、付記6記載の管理装置。
(付記8)
前記第1のコンピュータの設定情報に変更が生じた場合に、
前記第1の設定情報管理部が、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
ことを特徴とする、付記6または7記載の管理装置。
(付記9)
前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、付記6〜8のいずれか1項に記載の管理装置。
(付記10)
前記第1の設定情報管理部が、
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
ことを特徴とする、付記9記載の管理装置。
(付記11)
マルチコンピュータシステムに備えられる複数のコンピュータのうち第1のコンピュータに備えられる管理装置において、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納し、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納し、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する
処理をプロセッサに実行させる管理プログラム。
(付記12)
前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
処理を前記プロセッサに実行させる、付記11記載の管理プログラム。
(付記13)
前記第1のコンピュータの設定情報に変更が生じた場合に、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
処理を前記プロセッサに実行させる、付記11または12記載の管理プログラム。
(付記14)
前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、付記11〜13のいずれか1項に記載の管理プログラム。
(付記15)
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
処理を前記プロセッサに実行させる、付記14記載の管理プログラム。
1 コンピュータシステム(マルチコンピュータシステム)
2 サーバノード(コンピュータ)
10 BMC
11 プロセッサ(処理部)
111 マスタ/スレーブレジスタ
12 メモリ(記憶部)
13 インタフェース
14 バス
20 システムボード
21 CPU
22 チップセット
23 不揮発性メモリ
230 ノード設定情報
231 自ノード設定情報
232 他ノード設定情報
233 サーバノード情報
24 ネットワークインタフェース
101 設定情報管理部
102 サーバノード情報管理部
103 他ノード設定情報管理部
104 自ノード設定情報管理部
105 設定比較部
106 データ送信制御部
107 データ受信制御部
1041 異常検出フラグ
3 筐体

Claims (7)

  1. 複数のコンピュータを備えるマルチコンピュータシステムにおいて、
    前記複数のコンピュータのうち第1のコンピュータが、
    前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
    前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
    前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
    を備えることを特徴とする、マルチコンピュータシステム。
  2. 複数のコンピュータを備えるマルチコンピュータシステムにおいて、前記複数のコンピュータのうち第1のコンピュータに備えられる管理装置が、
    前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
    前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
    前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
    を備えることを特徴とする、管理装置。
  3. 前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
    前記第2の設定情報管理部が、
    前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
    前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
    ことを特徴とする、請求項2記載の管理装置。
  4. 前記第1のコンピュータの設定情報に変更が生じた場合に、
    前記第1の設定情報管理部が、
    前記記憶装置に格納された前記設定情報を書き換え、
    前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
    ことを特徴とする、請求項2または3記載の管理装置。
  5. 前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
    ことを特徴とする、請求項2〜4のいずれか1項に記載の管理装置。
  6. 前記第1の設定情報管理部が、
    前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
    取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
    比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
    ことを特徴とする、請求項5記載の管理装置。
  7. マルチコンピュータシステムに備えられる複数のコンピュータのうち第1のコンピュータに備えられる管理装置において、
    前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納し、
    前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納し、
    前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する
    処理をプロセッサに実行させる管理プログラム。
JP2015162470A 2015-08-20 2015-08-20 マルチコンピュータシステム,管理装置および管理プログラム Pending JP2017041110A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015162470A JP2017041110A (ja) 2015-08-20 2015-08-20 マルチコンピュータシステム,管理装置および管理プログラム
US15/222,986 US20170054597A1 (en) 2015-08-20 2016-07-29 Multi-computer system, manager, and computer-readable recording medium having stored therein a managing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015162470A JP2017041110A (ja) 2015-08-20 2015-08-20 マルチコンピュータシステム,管理装置および管理プログラム

Publications (1)

Publication Number Publication Date
JP2017041110A true JP2017041110A (ja) 2017-02-23

Family

ID=58158542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015162470A Pending JP2017041110A (ja) 2015-08-20 2015-08-20 マルチコンピュータシステム,管理装置および管理プログラム

Country Status (2)

Country Link
US (1) US20170054597A1 (ja)
JP (1) JP2017041110A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019036861A (ja) * 2017-08-17 2019-03-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10157115B2 (en) * 2015-09-23 2018-12-18 Cloud Network Technology Singapore Pte. Ltd. Detection system and method for baseboard management controller

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003344A (ja) * 1998-06-16 2000-01-07 Toshiba Corp コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法
JP2001326660A (ja) * 2000-03-10 2001-11-22 Hitachi Ltd コンピュータの構成情報管理方法および該方法を実現するプログラムを記録した記録媒体および装置
JP2011250005A (ja) * 2010-05-25 2011-12-08 Hitachi Ltd ネットワークシステムおよびネットワーク機器
JP2014099085A (ja) * 2012-11-15 2014-05-29 Nec Corp 情報格納制御装置及びその制御方法、並びにコンピュータ・プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3919575B2 (ja) * 2002-03-29 2007-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラム、管理装置、管理方法、記録媒体、及びデータ記録媒体
JP5065470B2 (ja) * 2010-12-07 2012-10-31 楽天株式会社 サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP2014048979A (ja) * 2012-08-31 2014-03-17 Fujitsu Ltd 情報処理システム、識別情報決定装置、識別情報決定方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003344A (ja) * 1998-06-16 2000-01-07 Toshiba Corp コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法
JP2001326660A (ja) * 2000-03-10 2001-11-22 Hitachi Ltd コンピュータの構成情報管理方法および該方法を実現するプログラムを記録した記録媒体および装置
JP2011250005A (ja) * 2010-05-25 2011-12-08 Hitachi Ltd ネットワークシステムおよびネットワーク機器
JP2014099085A (ja) * 2012-11-15 2014-05-29 Nec Corp 情報格納制御装置及びその制御方法、並びにコンピュータ・プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019036861A (ja) * 2017-08-17 2019-03-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP7139584B2 (ja) 2017-08-17 2022-09-21 ソニーグループ株式会社 情報処理装置、情報処理方法、プログラム、および情報処理システム
US11689797B2 (en) 2017-08-17 2023-06-27 Sony Group Corporation Camera, method, non-transitory computer-readable medium, and system

Also Published As

Publication number Publication date
US20170054597A1 (en) 2017-02-23

Similar Documents

Publication Publication Date Title
US10353779B2 (en) Systems and methods for detection of firmware image corruption and initiation of recovery
JP5637873B2 (ja) 計算機システムおよびpciカードのhba識別子引き継ぎ方式
TWI724415B (zh) 多節點儲存系統及其韌體的更新方法
US20050160257A1 (en) System and method for updating device firmware
US20150301880A1 (en) Providing boot data in a cluster network environment
US20150205676A1 (en) Server Control Method and Server Control Device
US10430082B2 (en) Server management method and server for backup of a baseband management controller
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
JPWO2007088575A1 (ja) システム監視装置の制御方法、プログラム及びコンピュータシステム
EP3147797B1 (en) Data management method, node and system for database cluster
JP2007149085A (ja) 接続された装置を構成するための初期設定コードの実行
US10387257B1 (en) Systems and methods for reliable redundant management controller firmware update
US9063854B1 (en) Systems and methods for cluster raid data consistency
US9471256B2 (en) Systems and methods for restoring data in a degraded computer system
US11182252B2 (en) High availability state machine and recovery
US20130024726A1 (en) System and method for removable network attached storage enabling system recovery from backup
JP6599725B2 (ja) 情報処理装置およびログ管理方法、並びにコンピュータ・プログラム
US20200133805A1 (en) System and method to detect and recover from inoperable device management bus
JP2017041110A (ja) マルチコンピュータシステム,管理装置および管理プログラム
US9594526B2 (en) Storage management device and computer-readable recording medium
US20190138407A1 (en) Systems and methods of deploying an operating system from a resilient virtual drive
US9971532B2 (en) GUID partition table based hidden data store system
JP5913078B2 (ja) ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム
US9836359B2 (en) Storage and control method of the same
WO2024000535A1 (zh) 分区表更新方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190425

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190924