JP2017041110A - マルチコンピュータシステム,管理装置および管理プログラム - Google Patents
マルチコンピュータシステム,管理装置および管理プログラム Download PDFInfo
- Publication number
- JP2017041110A JP2017041110A JP2015162470A JP2015162470A JP2017041110A JP 2017041110 A JP2017041110 A JP 2017041110A JP 2015162470 A JP2015162470 A JP 2015162470A JP 2015162470 A JP2015162470 A JP 2015162470A JP 2017041110 A JP2017041110 A JP 2017041110A
- Authority
- JP
- Japan
- Prior art keywords
- setting information
- server node
- node
- computer
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/084—Configuration by using pre-existing information, e.g. using templates or copying from other elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0853—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0853—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
- H04L41/0856—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/34—Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0866—Checking the configuration
Abstract
【解決手段】複数のコンピュータのうち第1のコンピュータが、第1のコンピュータ2の設定情報を第1のコンピュータに備えられた記憶装置23に格納する制御を行なう、第1の設定情報管理部104と、第1のコンピュータに関連する第2のコンピュータの設定情報の複写を記憶装置23に格納する制御を行なう、第2の設定情報管理部103と、複数のコンピュータ2のそれぞれに対して関連するコンピュータを表す関連情報233を、記憶装置23に格納する制御を行なう、関連情報管理部102とを備える。
【選択図】図4
Description
これらのBIOSやファームウェア(以下、単にファームウェア等という)の動作に際しては、例えば装置起動時に、システムボード上の不揮発性メモリに保存された設定情報が読み出され、使用される。
従来のサーバコンピュータにおいては、設定情報をシステムボードとは別に備えられた小基板の不揮発性メモリに退避させておき、システムボード交換時に、自動的に復元する手法が知られている。
サーバノードのコンピュータが小型化しても、1台当たりの設定情報のデータ量は小さくならない。その一方で、サーバの小型化は今後も進み、同一筐体内に搭載可能なサーバノードの台数はさらに増加すると考えられる。従って、これに伴い、設定情報の格納に必要な容量も増大することは明らかである。
図1は実施形態の一例としてのコンピュータシステム1のハードウェア構成を示す図、図2は実施形態の一例としてのコンピュータシステム1の不揮発性メモリ23に格納される情報を例示する図である。
図1に示すように、本コンピュータシステム1は、複数のサーバノード(コンピュータ)2を備え、これらのサーバノード2が同一の筐体3内に搭載されている。すなわち、本コンピュータシステム1は、複数のコンピュータを備えるマルチコンピュータシステムであり、ブレードサーバもしくはマルチノードサーバとして構成されている。
CPU21は、種々の制御や演算を行なう処理装置であり、不揮発性メモリ23等に格納されたOSやソフトウェアを実行することにより、種々の機能を実現する。
チップセット22は、CPU21とBMC10や不揮発性メモリ23等との間のデータの受け渡しを管理する回路群である。
なお、これらの自ノード設定情報231,他ノード設定情報232およびサーバノード情報233については後述する。
ネットワークインタフェース24は、他のサーバノード2等と通信路を介して通信可能に接続するためのインタフェースであり、例えば、LAN(Local Area Network)カードである。
まず、図3を参照しながら、実施形態の設定情報管理機能を実現するBMC(管理装置)10のハードウェア構成について説明する。図3は実施形態の一例としてのコンピュータシステム1に備えられるBMC10のハードウェア構成の一例を示すブロック図である。
プロセッサ(処理部)11は、BMC10全体を制御する。プロセッサ11は、マルチプロセッサであってもよい。プロセッサ11は、例えばCPU,MPU(Micro Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、プロセッサ11は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
以上のようなハードウェア構成を有するBMC10によって、後述する本実施形態の設定情報管理機能を実現することができる。
BMC10は、図4に示すように、少なくとも、設定情報管理部101,設定比較部1 05,データ送信制御部106およびデータ受信制御部107としての機能を有している。
データ送信制御部106は、自身が機能するBMC10が搭載されたサーバノード2のファームウェアの初期設定段階において、後述するサーバノード情報管理部102からの指示に従い、予め自身に登録された固有情報である仮IDを識別情報として付与したパケット(仮IDパケット)を、本コンピュータシステム1に搭載された各サーバノード2に配信する。
データ受信制御部107は、他のサーバノード2から種々のデータやコマンドを受信する制御を行なう。例えば、データ受信制御部107は、他のサーバノード2から送信される、仮ID発行パケット,スレーブ同意通知,設定クリアコマンド,サーバノード情報,マスタ昇格リクエスト,スレーブへの移行通知,テーブル更新完了通知,他ノード設定情報の提供依頼,設定情報更新通知、等を受信する制御を行なう。
設定比較部105は、後述する自ノード設定情報管理部104からの指示に従い、不揮発性メモリ23に格納されている自ノード設定情報231と、他の複数(本実施形態では2つ)のサーバノード(関連サーバノード)2から送信される設定情報とを比較する。
設定比較部105は、比較の結果を自ノード設定情報管理部104に通知する。
設定情報管理部101は、設定情報の管理等を行なうものであり、設定情報管理部101は、サーバノード情報管理部102,他ノード設定情報管理部103および自ノード設定情報管理部104としての機能を備える。
図5は実施形態の一例としてのコンピュータシステム1におけるサーバノード情報233を例示する図である。
サーバノード情報233は、図5に示すように、ID情報,関連IDおよび状態を管理項目として備え、これらの情報を相互に関連付けることにより構成されている。
状態は、各サーバノード2の起動状態もしくは電源投入状態を示す。図5に示すサーバノード情報233においては、状態として“On”または“Off”が登録されている。例えば、ID=2で表されるサーバノード2は電源投入状態(起動状態)であることを示し、ID=3で表されるサーバノード2は電源断状態(非起動状態)であることを示す。
関連IDは、当該サーバノード2に関連付けられている他のサーバノード2を表す。例えば、図5に示す例において、ID=2で表されるサーバノード2にはID=1,3で表される2つのサーバノード2が関連付けられている。
そして、ID番号によって特定されるサーバノード2の設定情報の複写が、この関連付けられている2つの他のサーバノード2に、それぞれ他ノード設定情報232として格納される。
以下、サーバノード2の設定情報を格納する他のサーバノード2を関連サーバノード2という場合がある。ID=2で表されるサーバノード2に対して、ID=1,3で表される2つのサーバノード2がそれぞれ関連サーバノード2に相当する。
なお、本実施形態においては、一のサーバノード2に対して、2つの関連サーバノード2が設定されているが、これに限定されるものではない。例えば、一のサーバノード2に対して1つの関連サーバノード2を設定してもよく、また、一のサーバノード2に対して3つ以上の関連サーバノード2を設定してもよい。
図5に示す例において、例えば、ID=2のサーバノード2の設定情報の複写がID=1,3の各サーバノード2に格納される。そして、ID=1のサーバノード2の設定情報の複写がID=2,4のサーバノード2に、また、ID=3のサーバノード2の設定情報の複写がID=2,4のサーバノード2に、それぞれ格納される。
本コンピュータシステム1においては、サーバノード2の設定情報の複写を、コンピュータシステム1に備えられたサーバノード2のうちの一部である関連サーバノード2に保持させることで、設定情報を分散して格納することができる。すなわち、コンピュータシステム1に備えられた全サーバノード2の設定情報を格納するための記憶領域を有する大容量の不揮発性メモリを特定のサーバノード2等に確保する必要がなく、装置コストを低減することができる。
そして、自サーバノード2の不揮発性メモリ23にサーバノード情報233が格納されていない場合に、サーバノード情報管理部102は、データ送信制御部106に、他のサーバノード2に対する仮IDパケットの発行およびサーバノード情報233の取得要求を実施させる。
本コンピュータシステム1においては、前述の如く、初期化フェーズにおいてサーバノード情報233が登録されていない場合、すなわち、全てのサーバノード2が初期化フェーズである場合に、各サーバノード2はそれぞれ仮IDパケットを発行する。
また、マスタのサーバノード2は、データ受信制御部107を介して、他サーバノード2から発行される仮IDパケットをそれぞれ収集し、仮サーバノード情報233aを作成する。
仮サーバノード情報233aは、図5に示したサーバノード情報233の管理項目に加えて仮IDを備える。この仮IDには、他のサーバノード2から受信した仮IDパケットから抽出した仮IDが登録される。なお、図中、既述の管理項目と同一の項目は、同様の内容を示しているので、その説明は省略する。
そして、サーバノード情報管理部102は、この仮サーバノード情報233aに基づき、サーバノード情報233を作成する。
サーバノード情報管理部102は、作成したサーバノード情報233をデータ送信制御部106を介して他の全てのサーバノード2に配信する。
スレーブのサーバノード2においては、サーバノード情報管理部102は、マスタのサーバノード2から受信したサーバノード情報233を用いて、不揮発性メモリ23に格納されているサーバノード情報233を更新する。
死活監視は、他のサーバノード2が正常に動作しているか否かを確認することであり、サーバノード情報管理部102は、例えば、なんらかのコマンドを関連サーバノード2に対して送信する。送信したコマンドに対する応答が得られた場合には、当該サーバノード2は正常であると判断される。送信したコマンドに対する応答が得られない場合には、当該サーバノード2は異常であると判断される。
状態変更通知を受信したサーバノード2においては、サーバノード情報管理部102が、受信した状態変更通知に従い、不揮発性メモリ23に格納されているサーバノード情報233を更新する。
例えば、自ノード設定情報管理部104は、不揮発性メモリ23における所定の領域に自ノード設定情報231を格納する。また、自ノード設定情報管理部104は、不揮発性メモリ23から自ノード設定情報231を読み出し、データ送信制御部106を介して2つの関連サーバノード2にそれぞれ送信させる。受信した各関連サーバノード2は、受信した設定情報を他ノード設定情報232として格納する。
また、自ノード設定情報管理部104は、不揮発性メモリ23に格納された自ノード設定情報231が正しいか否かを検証する機能を有する。
例えば、本コンピュータシステム1の起動や再起動の段階で、自ノード設定情報管理部104は、自ノード設定情報231が正しいか否かの判別を行なう。
そして、自ノード設定情報管理部104は、不揮発性メモリ23に格納されている自ノード設定情報231と、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値(設定情報)とを設定比較部105に比較させる。
すなわち、自ノード設定情報管理部104は、自ノード設定情報231として記録された設定情報および、複数の他ノード設定情報232として記録された各設定情報の間で一致数が最も多い設定情報を採用する。すなわち、自ノード設定情報管理部104は、各関連サーバノード2のそれぞれから受信した各他ノード設定情報232における自サーバノード2についての値とが不一致である場合に、多数決により一致数が最も多い設定情報を、自ノード設定情報231として採用する。
図8(A)〜(D)は実施形態の一例としてのコンピュータシステム1の自ノード設定情報管理部104による自ノード設定情報231の検証方法を例示する図である。
サーバノード#2の自ノード設定情報管理部104は、自ノード設定情報231として不揮発性メモリ23に記録している設定情報と、サーバノード#1およびサーバノード#3のそれぞれが他ノード設定情報232として記録している、サーバノード#2についての設定情報とを相互に比較する。
図8(A)に示す例においては、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#1および関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とが全て(完全に)一致している。
図8(B)に示す例においては、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#1が他ノード設定情報232として保持するサーバノード#2の設定情報とは一致している。しかしながら、サーバノード#2(自身)が保持する自ノード設定情報231の設定情報と、関連サーバノード#3が他ノード設定情報232として保持するサーバノード#2の設定情報とが不一致である(一部不一致)。
この場合には、サーバノード#2の自ノード設定情報管理部104は、多数決により一致数が最も多い、自身が保持している自ノード設定情報231を自ノード設定情報231として採用する。
この場合には、サーバノード#2の自ノード設定情報管理部104は、多数決により一致数が最も多い、関連サーバノード#1(#3)が他ノード設定情報232として保持しているサーバノード#2についての設定情報を自ノード設定情報231として採用する。
この場合には、サーバノード#2の自ノード設定情報管理部104は、自身が保持している自ノード設定情報231を自ノード設定情報231として採用する。
例えば、他ノード設定情報管理部103は、不揮発性メモリ23における所定の領域に他ノード設定情報232を格納する。また、他ノード設定情報管理部103は、他のサーバノード2から他ノード設定情報232の送信を要求されると、不揮発性メモリ23から他ノード設定情報232を読み出し、データ送信制御部106を介して関連サーバノード2に送信させる。
従って、他ノード設定情報管理部103は、複数のサーバノード2のうち一のサーバノード2に関連する関連サーバノード2の設定情報の複写を、自身の不揮発性メモリ23に格納する制御を行なう、第2の設定情報管理部として機能する。
ノード設定情報230は、図9に示すように、設定項目,オフセット(Offset),自設定および他設定を管理項目として備えている。また、図9に示す例においては、ID=2のサーバノード2についてのノード設定情報230(自ノード設定情報231および他ノード設定情報232)を示している。
他設定は、関連サーバノード2についての設定情報の値である。本コンピュータシステム1においては、関連サーバノード2として2つのサーバノード2が設定されるので、この図9に示す例においても、2つの他設定が備えられている。
例えば、“CCC”という設定項目の設定情報は、“04h”のオフセット位置に格納されるものであり、ノード2(自サーバノード2)においては“Yes”が、ノード1およびノード3においては“No”がそれぞれ設定される。
(B)動作
上述の如く構成された、実施形態の一例としてのコンピュータシステム1におけるBMC10による処理を、図14〜図23を参照しながら、図10〜図13に示すフローチャート(ステップA1〜A47)に従って説明する。
なお、図10はステップA1〜A10の処理を示し、図11はステップA11〜A19の処理を、図12はステップA20〜A26の処理を、図13はステップA27〜A47の処理を、それぞれ示す。
この状態では同一筐体3内のサーバノード2の構成等の情報を持っていないため、筐体3内に有効なサーバノード情報233を所持しているサーバノード2が存在するか不明である。そのため、サーバノード情報管理部102は、データ送信制御部106を介して、有効なサーバノード情報233を所持しているサーバノード2を探す要求をする(サーバノード情報233の取得要求発行)。
サーバノード情報管理部102は、発行したサーバノード情報233の取得要求に対して、送信元サーバノード2の正式な(仮IDではない)IDとサーバノード情報233とを受信したかを確認する(図10のステップA4)。
マスタ昇格通知を受信せず、また、他サーバノード2も初期設定段階である場合には(ステップA5のNOルート参照)、仮IDパケットが発行されるため、サーバノード情報管理部102は、データ受信制御部107を介して、他サーバノード2から発行される仮IDパケットを収集し(図14の符号B2参照)、仮サーバノード情報233aを作成する(図11のステップA11)。サーバノード情報管理部102は、仮IDパケットの送信元の数に基づき、本コンピュータシステム1の筐体3に搭載されたサーバノード2の構成(台数)を把握する。
サーバノード情報管理部102は、仮サーバノード情報233aに登録された全てのサーバノード2からスレーブ同意通知を受信したかを確認する(図11のステップA13)。全てのサーバノード2からスレーブ同意通知を受信していない場合には(ステップA13のNOルート参照)、ステップA13を繰り返し実行する。
マスタ昇格後、このマスタサーバノード2において、サーバノード情報管理部102は、全サーバノード2に対して、設定クリアコマンドをデータ送信制御部106を介して発行する(図11のステップA15:図15の符号C3参照)。この設定クリアコマンドは、各スレーブのサーバノード2のサーバノード情報233および他ノード設定情報232のクリアを指示するものである。
マスタサーバノード2において、サーバノード情報管理部102は、仮サーバノード情報233aに登録された全てのサーバノード2から設定クリア完了の通知を受信したかを確認する(図11のステップA16)。
全てのサーバノード2から設定クリア完了の通知を受信すると(ステップA16のYESルート参照:図15の符号C4参照)、マスタサーバノード2において、サーバノード情報管理部102は、各仮IDに対して正式なID(ID情報)を付与し、また、これらのIDに対して、関連IDを設定する。すなわち、サーバノード情報管理部102は、各サーバノード2について、その設定情報を保存させる関連サーバノード2を設定し、サーバノード情報233を作成する。
マスタサーバノード2において、サーバノード情報管理部102は、本コンピュータシステム1に備えられた全てのサーバノード2からサーバノード情報233の設定完了の通知を受信したかを確認する(図11のステップA18)。
各サーバノード2から設定完了通知の受領を確認すると(ステップA18のYESルート参照:図15の符号C6参照)マスタサーバノード2のサーバノード情報管理部102は、スレーブへの降格を行なう。すなわち、マスタサーバノード2において、サーバノード情報管理部102は、マスタ/スレーブレジスタ111の値を、スレーブノードとして機能することを示す値に変更する(図15の符号C7a参照)。
一方、他のサーバノード2からマスタ昇格を宣言するリクエストを受信した場合(ステップA5のYESルート参照:図14の符号B3参照)、当該サーバノード2は、マスタ昇格せず、スレーブ動作する。この際、サーバノード情報管理部102は、マスタ/スレーブレジスタ111に、スレーブノードとして機能することを示す値を設定する(図14の符号B3a参照)。また、サーバノード情報管理部102は、スレーブ動作を同意する目的で、スレーブ同意通知を他サーバノード2へ発行する(図12のステップA20:図14の符号B5参照)。
マスタのサーバノード2からサーバノード情報233を受信していない場合には(ステップA24のNOルート参照)、ステップA24を繰り返し実行する。
マスタのサーバノード2からスレーブ移行通知を受信していない場合には(ステップA26のNOルート参照)、ステップA26を繰り返し実行する。
マスタのサーバノード2からスレーブ移行通知を受信すると(ステップA26のYESルート参照:図16の符号D7参照)、処理は図10のステップA7に移行する。
確認の結果、他ノード設定情報232に有効なデータが存在しない場合には(ステップA7の“他ノード設定情報なし”ルート参照)、他ノード設定情報管理部103は、サーバノード情報233を参照して、関連サーバノード2を確認する(図17の符号E2参照)。そして、他ノード設定情報管理部103は、関連サーバノード2に対して、他ノード設定情報232の提供を依頼する(図10のステップA8:図17の符号E3参照)。
関連サーバノード2から他ノード設定情報232を受信していない場合には(ステップA9の“設定情報未受信”ルート参照)、ステップA9を繰り返し実行する。
関連サーバノード2から他ノード設定情報232を受信すると(ステップA9の“設定情報受信”ルート参照:図17の符号E4参照)、他ノード設定情報管理部103は、受信した他ノード設定情報232を不揮発性メモリ23に格納する(図10のステップA10:図17の符号E5参照)。
その後、図13のステップA27に移行する。また、ステップA7における確認の結果、他ノード設定情報232に有効なデータが存在する場合においても(ステップA7の“他ノード設定情報あり”ルート参照)、図13のステップA27に移行する。このステップA27以降においては、本コンピュータシステム1は通常運用フェーズに移行する。
すなわち、図13のステップA27において、自ノード設定情報管理部104は、サーバノード情報233を参照し、関連サーバノード2のそれぞれに対して、他ノード設定情報232の問合せを行なう。
関連サーバノード2のそれぞれから他ノード設定情報232を受信していない場合には(ステップA28の“設定情報未受信”ルート参照)、ステップA28を繰り返し実行する。
そして、自ノード設定情報管理部104は、設定比較部105に対して依頼を行ない(図18の符号F3参照)、受信した各他ノード設定情報232における自サーバノード2についての値と、不揮発性メモリ23に格納されている自ノード設定情報231の値とを比較させる(図13のステップA29:図18の符号F4参照)。
通常状態において、自ノード設定情報管理部104は、ユーザ操作等によりBIOSやファームウェア(FW)の設定変更が行なわれたか否かを確認する(図13のステップA32参照)。
一方、自ノード設定情報231が更新された場合には(ステップA32のYESルート参照)、自ノード設定情報管理部104は、BIOS等の上位から設定情報更新通知を受信する(図19の符号G1参照)。
関連サーバノード2のそれぞれから書き込み完了コマンドを受信していない場合には(ステップA36のNOルート参照)、ステップA36を繰り返し実行する。
通常状態において、サーバノード情報管理部102は、サーバノード情報233を用いて関連サーバノード2の死活監視を行なう(図13のステップA37:図20の符号H1参照)。すなわち、関連サーバノード2が正常に動作(alive)しているか、停止(dead)しているかを判断する。
送信したコマンドに対する応答が関連サーバノード2から得られた場合(図20の符号H2参照)、すなわち、関連サーバノード2が動作している場合には(ステップA37の“alive”ルート参照)、ステップA37を繰り返し実行する。
また、サーバノード情報管理部102は、異常である関連サーバノード2のIDを筐体3内の全てのサーバノード2に対して状態変更通知(例えば、“IDx=Off”)を送信する(図13のステップA39:図21の符号J3参照)。この状態変更通知を受信した各サーバノード2は、それぞれ自身が管理するサーバノード情報233を状態変更通知に合わせて更新する。その後、図13のステップA40に移行し、本コンピュータシステム1は通常運用状態となる。
このような場合に、交換されたサーバノード2はサーバノード情報233を所持していないため、上述の図10のステップA7に示した初期化フェーズの動作が実行される。
そのため、サーバノード2は、運用中に他のサーバノード2から仮IDを受信するケースがある。すなわち、サーバノード情報管理部102は、他のサーバノード2から仮IDを受信したか否かを確認する(図13のステップA41)。
サーバノード情報233において状態がOffのである、すなわち、異常な関連サーバノード2が存在する場合に(ステップA43のYESルート参照)、サーバノード情報管理部102は、不揮発性メモリ23からサーバノード情報233および他ノード設定情報232を読み出す(図22の符号K3参照)。
仮IDを発行したサーバノード2においては、正式IDとともにサーバノード情報233および他ノード設定情報232を受信した後、不揮発性メモリ23に、これらの受信したサーバノード情報233および他ノード設定情報232の値を、不揮発性メモリ23に格納する(反映させる)。そして、仮IDを発行したサーバノード2においては、そのサーバノード情報233の自らの状態を“On(正常)”へ変更する。これにより、本コンピュータシステム1は通常運用状態となる(図13のステップA45)。
その後、ステップA42に戻り、以下、通常運用フェーズとして、ステップA31以降の処理が繰り返し行なわれる。なお、図13のステップA41における確認の結果、仮IDを受信しない場合にも(ステップA41のNOルート参照)、このステップA42に移行する。
この場合、コンピュータシステム1に既存の各サーバノード2において、サーバノード情報管理部102は、仮IDの受信をなかったものとみなす(無視する:図13のステップA47)。その後、ステップA42に移行する。
その際、増設されたサーバノード2についての情報を既存の各サーバノード2は備えていないので、処理はステップA1〜A3に移行し、このステップA3において仮IDの発行が行なわれる(図23の符号L1参照)。また、処理はA7〜A9およびA11に移行し、この増設されたサーバノード2はマスタへ昇格することになる(図23の符号L3参照)。その後、この増設されたサーバノード2において、サーバノード情報233の更新が行なわれ、筐体3内全てのサーバノード2の構成情報が更新されるのである。
このように、実施形態の一例としてのコンピュータシステム1によれば、一のサーバノード2の設定情報の複写を、関連サーバノード2に保持させることで、設定情報を分散して格納することができる。関連サーバノード2に保持させた設定情報の複写は、設定情報のバックアップとして機能させることができ、保守作業等によりサーバノード2が交換された場合に、これらの関連サーバノード2に保持させた設定情報のバックアップを用いて、サーバノード2を迅速に復旧することができる。
また、一のサーバノード2に対して2つ以上の関連サーバノード2を設定することで、設定情報を冗長化してバックアップすることができる。
これにより、関連する他サーバノード2から自身の設定情報を取得することができ、例えば、サーバノード2の保守交換等を行なう場合に、容易にサーバノード2を使用可能な状態に設定することができる。
これにより、サーバノード2において生じた設定情報の変更を、バックアップとして保持する関連他サーバノード2に反映させることができる。
(D)その他
なお、上述した実施形態に関わらず、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
また、上述した実施形態においては、同一筐体3内に複数のサーバノード2を備えたコンピュータシステム1について示しているが、これに限定されるものではなく、筐体3の外部に備えられたサーバノード2の設定情報も同様に取り扱ってもよい。
(E)付記
(付記1)
複数のコンピュータを備えるマルチコンピュータシステムにおいて、
前記複数のコンピュータのうち第1のコンピュータが、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
を備えることを特徴とする、マルチコンピュータシステム。
前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記第2の設定情報管理部が、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
ことを特徴とする、付記1記載のマルチコンピュータシステム。
前記第1のコンピュータの設定情報に変更が生じた場合に、
前記第1の設定情報管理部が、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
ことを特徴とする、付記1または2記載のマルチコンピュータシステム。
前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、付記1〜3のいずれか1項に記載のマルチコンピュータシステム。
(付記5)
前記第1の設定情報管理部が、
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
ことを特徴とする、付記4記載のマルチコンピュータシステム。
複数のコンピュータを備えるマルチコンピュータシステムにおいて、前記複数のコンピュータのうち第1のコンピュータに備えられる管理装置が、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
を備えることを特徴とする、管理装置。
前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記第2の設定情報管理部が、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
ことを特徴とする、付記6記載の管理装置。
前記第1のコンピュータの設定情報に変更が生じた場合に、
前記第1の設定情報管理部が、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
ことを特徴とする、付記6または7記載の管理装置。
前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、付記6〜8のいずれか1項に記載の管理装置。
(付記10)
前記第1の設定情報管理部が、
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
ことを特徴とする、付記9記載の管理装置。
マルチコンピュータシステムに備えられる複数のコンピュータのうち第1のコンピュータに備えられる管理装置において、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納し、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納し、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する
処理をプロセッサに実行させる管理プログラム。
前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
処理を前記プロセッサに実行させる、付記11記載の管理プログラム。
前記第1のコンピュータの設定情報に変更が生じた場合に、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
処理を前記プロセッサに実行させる、付記11または12記載の管理プログラム。
前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、付記11〜13のいずれか1項に記載の管理プログラム。
(付記15)
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
処理を前記プロセッサに実行させる、付記14記載の管理プログラム。
2 サーバノード(コンピュータ)
10 BMC
11 プロセッサ(処理部)
111 マスタ/スレーブレジスタ
12 メモリ(記憶部)
13 インタフェース
14 バス
20 システムボード
21 CPU
22 チップセット
23 不揮発性メモリ
230 ノード設定情報
231 自ノード設定情報
232 他ノード設定情報
233 サーバノード情報
24 ネットワークインタフェース
101 設定情報管理部
102 サーバノード情報管理部
103 他ノード設定情報管理部
104 自ノード設定情報管理部
105 設定比較部
106 データ送信制御部
107 データ受信制御部
1041 異常検出フラグ
3 筐体
Claims (7)
- 複数のコンピュータを備えるマルチコンピュータシステムにおいて、
前記複数のコンピュータのうち第1のコンピュータが、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
を備えることを特徴とする、マルチコンピュータシステム。 - 複数のコンピュータを備えるマルチコンピュータシステムにおいて、前記複数のコンピュータのうち第1のコンピュータに備えられる管理装置が、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納する制御を行なう、第1の設定情報管理部と、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納する制御を行なう、第2の設定情報管理部と、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する制御を行なう、関連情報管理部と
を備えることを特徴とする、管理装置。 - 前記第2のコンピュータの設定情報の複写が前記記憶装置に格納されていない場合に、
前記第2の設定情報管理部が、
前記関連情報を参照して、前記関連する第2のコンピュータに前記設定情報の複写の送信を依頼し、
前記関連する第2のコンピュータから応答された前記設定情報の複写を前記記憶装置に格納する
ことを特徴とする、請求項2記載の管理装置。 - 前記第1のコンピュータの設定情報に変更が生じた場合に、
前記第1の設定情報管理部が、
前記記憶装置に格納された前記設定情報を書き換え、
前記関連情報を参照して、前記関連する第2のコンピュータに変更後の前記設定情報の複写を送信する
ことを特徴とする、請求項2または3記載の管理装置。 - 前記第1のコンピュータに対して、複数のコンピュータが前記関連する第2のコンピュータとして対応付けられる
ことを特徴とする、請求項2〜4のいずれか1項に記載の管理装置。 - 前記第1の設定情報管理部が、
前記関連情報を参照して、関連する複数の前記第2のコンピュータから、当該第1のコンピュータに関する設定情報の複写を取得し、
取得した複数の当該第1のコンピュータに関する設定情報の複写のそれぞれと、前記記憶装置に格納した前記第1のコンピュータの設定情報とを比較し、
比較の結果、一致数が多い設定情報を用いて前記記憶装置に格納した前記第1のコンピュータの設定情報を更新する
ことを特徴とする、請求項5記載の管理装置。 - マルチコンピュータシステムに備えられる複数のコンピュータのうち第1のコンピュータに備えられる管理装置において、
前記第1のコンピュータの設定情報を前記第1のコンピュータに備えられた記憶装置に格納し、
前記複数のコンピュータのうち前記第1のコンピュータに関連する第2のコンピュータの設定情報の複写を、前記記憶装置に格納し、
前記複数のコンピュータのそれぞれに対して関連するコンピュータを表す関連情報を、前記記憶装置に格納する
処理をプロセッサに実行させる管理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015162470A JP2017041110A (ja) | 2015-08-20 | 2015-08-20 | マルチコンピュータシステム,管理装置および管理プログラム |
US15/222,986 US20170054597A1 (en) | 2015-08-20 | 2016-07-29 | Multi-computer system, manager, and computer-readable recording medium having stored therein a managing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015162470A JP2017041110A (ja) | 2015-08-20 | 2015-08-20 | マルチコンピュータシステム,管理装置および管理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017041110A true JP2017041110A (ja) | 2017-02-23 |
Family
ID=58158542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015162470A Pending JP2017041110A (ja) | 2015-08-20 | 2015-08-20 | マルチコンピュータシステム,管理装置および管理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170054597A1 (ja) |
JP (1) | JP2017041110A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019036861A (ja) * | 2017-08-17 | 2019-03-07 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10157115B2 (en) * | 2015-09-23 | 2018-12-18 | Cloud Network Technology Singapore Pte. Ltd. | Detection system and method for baseboard management controller |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000003344A (ja) * | 1998-06-16 | 2000-01-07 | Toshiba Corp | コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法 |
JP2001326660A (ja) * | 2000-03-10 | 2001-11-22 | Hitachi Ltd | コンピュータの構成情報管理方法および該方法を実現するプログラムを記録した記録媒体および装置 |
JP2011250005A (ja) * | 2010-05-25 | 2011-12-08 | Hitachi Ltd | ネットワークシステムおよびネットワーク機器 |
JP2014099085A (ja) * | 2012-11-15 | 2014-05-29 | Nec Corp | 情報格納制御装置及びその制御方法、並びにコンピュータ・プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3919575B2 (ja) * | 2002-03-29 | 2007-05-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | プログラム、管理装置、管理方法、記録媒体、及びデータ記録媒体 |
JP5065470B2 (ja) * | 2010-12-07 | 2012-10-31 | 楽天株式会社 | サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体 |
JP2014048979A (ja) * | 2012-08-31 | 2014-03-17 | Fujitsu Ltd | 情報処理システム、識別情報決定装置、識別情報決定方法、及びプログラム |
-
2015
- 2015-08-20 JP JP2015162470A patent/JP2017041110A/ja active Pending
-
2016
- 2016-07-29 US US15/222,986 patent/US20170054597A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000003344A (ja) * | 1998-06-16 | 2000-01-07 | Toshiba Corp | コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法 |
JP2001326660A (ja) * | 2000-03-10 | 2001-11-22 | Hitachi Ltd | コンピュータの構成情報管理方法および該方法を実現するプログラムを記録した記録媒体および装置 |
JP2011250005A (ja) * | 2010-05-25 | 2011-12-08 | Hitachi Ltd | ネットワークシステムおよびネットワーク機器 |
JP2014099085A (ja) * | 2012-11-15 | 2014-05-29 | Nec Corp | 情報格納制御装置及びその制御方法、並びにコンピュータ・プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019036861A (ja) * | 2017-08-17 | 2019-03-07 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP7139584B2 (ja) | 2017-08-17 | 2022-09-21 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、プログラム、および情報処理システム |
US11689797B2 (en) | 2017-08-17 | 2023-06-27 | Sony Group Corporation | Camera, method, non-transitory computer-readable medium, and system |
Also Published As
Publication number | Publication date |
---|---|
US20170054597A1 (en) | 2017-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10353779B2 (en) | Systems and methods for detection of firmware image corruption and initiation of recovery | |
JP5637873B2 (ja) | 計算機システムおよびpciカードのhba識別子引き継ぎ方式 | |
TWI724415B (zh) | 多節點儲存系統及其韌體的更新方法 | |
US20050160257A1 (en) | System and method for updating device firmware | |
US20150301880A1 (en) | Providing boot data in a cluster network environment | |
US20150205676A1 (en) | Server Control Method and Server Control Device | |
US10430082B2 (en) | Server management method and server for backup of a baseband management controller | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
JPWO2007088575A1 (ja) | システム監視装置の制御方法、プログラム及びコンピュータシステム | |
EP3147797B1 (en) | Data management method, node and system for database cluster | |
JP2007149085A (ja) | 接続された装置を構成するための初期設定コードの実行 | |
US10387257B1 (en) | Systems and methods for reliable redundant management controller firmware update | |
US9063854B1 (en) | Systems and methods for cluster raid data consistency | |
US9471256B2 (en) | Systems and methods for restoring data in a degraded computer system | |
US11182252B2 (en) | High availability state machine and recovery | |
US20130024726A1 (en) | System and method for removable network attached storage enabling system recovery from backup | |
JP6599725B2 (ja) | 情報処理装置およびログ管理方法、並びにコンピュータ・プログラム | |
US20200133805A1 (en) | System and method to detect and recover from inoperable device management bus | |
JP2017041110A (ja) | マルチコンピュータシステム,管理装置および管理プログラム | |
US9594526B2 (en) | Storage management device and computer-readable recording medium | |
US20190138407A1 (en) | Systems and methods of deploying an operating system from a resilient virtual drive | |
US9971532B2 (en) | GUID partition table based hidden data store system | |
JP5913078B2 (ja) | ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム | |
US9836359B2 (en) | Storage and control method of the same | |
WO2024000535A1 (zh) | 分区表更新方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190425 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190924 |