JP6863013B2 - 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム - Google Patents

情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム Download PDF

Info

Publication number
JP6863013B2
JP6863013B2 JP2017072060A JP2017072060A JP6863013B2 JP 6863013 B2 JP6863013 B2 JP 6863013B2 JP 2017072060 A JP2017072060 A JP 2017072060A JP 2017072060 A JP2017072060 A JP 2017072060A JP 6863013 B2 JP6863013 B2 JP 6863013B2
Authority
JP
Japan
Prior art keywords
bmc
information processing
virtual
monitoring
management device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017072060A
Other languages
English (en)
Other versions
JP2018173854A (ja
Inventor
一仁 横内
一仁 横内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2017072060A priority Critical patent/JP6863013B2/ja
Publication of JP2018173854A publication Critical patent/JP2018173854A/ja
Application granted granted Critical
Publication of JP6863013B2 publication Critical patent/JP6863013B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、情報通信網を介して接続されている複数の情報処理装置を監視する技術に関する。
情報処理装置(例えばサーバ)には、障害発生時を考慮したBMC(Baseboard Management Controller)と呼ばれる装置が搭載される場合がある。BMCは、情報処理装置本体とは電源系や制御系が異なり、障害発生に因り情報処理装置本体が正常に動作できない場合であっても当該情報処理装置の障害発生を外部に通報することやリモート操作により情報処理装置の電源を遮断することができる。また、BMCは、情報処理装置本体の動作状況の情報を取得し当該取得した情報を動作状況の履歴情報として蓄積する機能をも備えている。その動作状況の履歴情報は、例えば、情報処理装置に障害が発生した場合に障害の原因究明などに利用される。すなわち、BMCは情報処理装置の動作状況を監視する監視装置としての機能を持つ。
特許文献1には、複数の情報処理装置(例えばサーバ)のそれぞれに搭載されているBMCを一括管理する構成が示されている。すなわち、特許文献1の構成では、各情報処理装置のBMCが情報通信網を介して管理用サーバに接続されており、当該管理用サーバがそれらBMCを一括管理している。
特許文献2には、情報処理装置(コンピュータ)内にプライマリBMCとセカンダリBMCを搭載する構成が示されている。この構成では、セカンダリBMCは予備としてのBMCであり、例えばプライマリBMCが故障した場合に、プライマリBMCに代わってセカンダリBMCが動作することにより、BMCの可用性を高めることができる。
特許第5689783号公報 特開2014−170308号公報
特許文献1の構成では、複数の情報処理装置のBMCを一括管理するために、管理用のサーバ(管理用サーバ)を設けている。よって、管理用サーバに障害が発生した場合に、BMCの一括管理に支障を来す虞がある。
特許文献2の構成では、BMCの多重化を実現しているが、複数の情報処理装置のBMCを一括管理するシステムの可用性を高めるものではない。
本発明は上記課題等を解決するために考え出された。すなわち、本発明の主な目的は、複数の情報処理装置の動作状況を監視する監視装置を一括管理するシステムの可用性を高めることができる技術を提供することにある。
上記目的を達成するために、本発明の情報処理装置は、
複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを構成するための前記情報処理装置であって、
当該情報処理装置自らの動作状況を監視する監視装置を備え、
前記監視装置は、コンピュータプログラムが格納されているメモリと、前記コンピュータプログラムを実行するプロセッサと、を備えており、
前記コンピュータプログラムは、
前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置と、当該複数の仮想監視装置を管理するプライマリ仮想管理装置と、を前記プロセッサに構築させ、
前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置と、セカンダリ仮想管理装置と、を前記プロセッサに構築させるコンピュータプログラムを含む。
本発明のコンピュータシステムは、
複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムであって、 前記複数の情報処理装置の各々は、
当該情報処理装置自らの動作状況を監視する監視装置を備え、
前記監視装置は、コンピュータプログラムが格納されているメモリと、前記コンピュータプログラムを実行するプロセッサと、を備えており、
前記コンピュータプログラムは、
前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置と、当該複数の仮想監視装置を管理するプライマリ仮想管理装置と、を前記プロセッサに構築させ、
前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置と、セカンダリ仮想管理装置と、を前記プロセッサに構築させるコンピュータプログラムを含む。
本発明の監視システム構築方法は、
複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを監視する監視システム構築方法であって、
前記情報処理装置に備えられた監視装置に備わるプロセッサに、
前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置を構築し、
当該複数の仮想監視装置を管理するプライマリ仮想管理装置を構築し、
前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置とセカンダリ仮想管理装置と、を構築する。
本発明のコンピュータプログラムは、
複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを監視するためのコンピュータプログラムであって、
前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置と、当該複数の仮想監視装置を管理するプライマリ仮想管理装置と、を前記監視装置に備わるプロセッサに構築させ、
前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置と、セカンダリ仮想管理装置と、を前記プロセッサに構築させる。
本発明によれば、複数の情報処理装置の動作状況を監視する監視装置を一括管理するシステムの可用性を高めることができる。
本発明に係る第1実施形態の情報処理装置の構成を簡略化して示すブロック図である。 第1実施形態の情報処理装置により構成されるコンピュータシステムの構成を簡略化して示すブロック図である。 本発明に係る第2実施形態の情報処理装置であるサーバにより構成されるコンピュータシステムの構成を簡略化して示すブロック図である。 第2実施形態におけるサーバのBMC(BMC24A)に係る構成を簡略化して示すブロック図である。 第2実施形態における別のサーバのBMC(BMC24B)に係る構成を簡略化して示すブロック図である。 第2実施形態のコンピュータシステムの起動時における動作の一例を表すフローチャートである。 第2実施形態のコンピュータシステムにおけるBMCの動作の一例を表すフローチャートである。 第2実施形態のコンピュータシステムにおける別のBMCの動作の一例を表すフローチャートである。 本発明に係る第3実施形態の情報処理装置であるサーバのBMC(BMC24C)に係る構成を簡略化して示すブロック図である。 第3実施形態におけるBMC24Cの動作例を表すフローチャートである。
以下に、本発明に係る実施形態を図面を参照しつつ説明する。
<第1実施形態>
図1は、本発明に係る第1実施形態の情報処理装置の構成を簡略化して表すブロック図である。図2は、第1実施形態の情報処理装置により構成されるコンピュータシステムの一例を説明する図である。
第1実施形態の情報処理装置1は、図2に表されるように、情報通信網15を介して他の情報処理装置1と接続しコンピュータシステム10を構成する。情報処理装置1は監視装置3を備えている。監視装置3は、情報処理装置1自らの動作状況を監視する機能を持つ。
監視装置3は、図1に表されるように、プロセッサ4とメモリ5を有して構成されている。メモリ5にはコンピュータプログラム(プログラム)6が格納されている。メモリ5に格納されているプログラム6をプロセッサ4が実行することにより、監視装置3(プロセッサ4)は次のような装置として機能することができる。
すなわち、コンピュータシステム10を構成する複数の情報処理装置1のうちの一つ(ここではプライマリサーバとなった情報処理装置1Aとする)における監視装置3(3A)には、図2に表されるような複数の仮想監視装置12と、プライマリ仮想管理装置13とが構築される。複数の仮想監視装置12は、コンピュータシステム10を構成する複数の情報処理装置1の監視装置3にそれぞれ対応しており、監視装置3と同様の機能を有する。プライマリ仮想管理装置13は、それら複数の仮想監視装置12を管理する機能を備えている。
コンピュータシステム10を構成する別の情報処理装置1(セカンダリサーバとなった情報処理装置1B)の監視装置3(3B)には、上記同様の複数の仮想監視装置12と、セカンダリ仮想管理装置14とが構築されている。セカンダリ仮想管理装置14は、プライマリ仮想管理装置13と同様に、複数の仮想監視装置12を管理する機能を備えている。セカンダリ仮想管理装置14は、複数の仮想監視装置12を管理する機能の冗長化を図るものである。すなわち、プログラム6が監視装置3のプロセッサ4上で実行されることにより、複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを監視する監視システムが構築される。
第1実施形態の情報処理装置1により構成されるコンピュータシステム10は、コンピュータシステム10を構成する複数の情報処理装置1のうちの一つに仮想の管理装置(つまり、プライマリ仮想管理装置13)を構築している。これにより、情報処理装置1とは別の管理用の装置(管理用サーバ)を設けずに、複数の情報処理装置1の監視装置3を管理することができる。換言すれば、管理用サーバの導入費用を招くことなく、複数の情報処理装置1の動作状況を一括管理できる。
その上、第1実施形態では、プライマリ仮想管理装置13とは別にセカンダリ仮想管理装置14が構築されている。このため、仮に、プライマリ仮想管理装置13に障害が発生してしまっても、セカンダリ仮想管理装置14によって、監視装置3の一括管理を継続することが可能である。つまり、第1実施形態の情報処理装置1により構成されるコンピュータシステム10は、監視装置3を一括管理するシステムの可用性を高めることができる。
なお、第1実施形態では、仮想監視装置12とプライマリ仮想管理装置13とセカンダリ仮想管理装置14は、監視装置3に構築されている。これに代えて、仮想監視装置12とプライマリ仮想管理装置13とセカンダリ仮想管理装置14は、情報処理装置1本体に設けられているプロセッサの機能により情報処理装置1本体に構築されてもよい。
<第2実施形態>
以下に、本発明に係る第2実施形態を説明する。
図3は、本発明に係る第2実施形態の情報処理装置であるサーバと、当該サーバにより構成されるコンピュータシステムとの構成を簡略化して表すブロック図である。第2実施形態では、コンピュータシステム20は、複数のサーバ22A,22B,22Cが情報通信網21を介して接続されている構成を備えている。サーバ22A,22B,22Cは、それぞれ、当該サーバ22A,22B,22Cの動作を制御するプロセッサ23A,23B,23Cを備えている。また、サーバ22A,22B,22Cは、それぞれ、メモリ30A,30B,30Cを備えている。メモリ30A,30B,30Cは、各種データやコンピュータプログラム(プログラム)を格納する記憶装置である。記憶装置には様々な種類が有り、適宜な種類の記憶装置が情報処理装置1に搭載される。ここでは、情報処理装置1に搭載される複数種の記憶装置をまとめてメモリ30A,30B,30Cとして記載する。
さらに、サーバ22A,22B,22Cは、それぞれ、監視装置であるBMC(Baseboard Management Controller)24A,24B,24Cを搭載している。BMC24A,24B,24Cは、搭載されているサーバ22A,22B,22Cの動作状況を表す情報を取得し当該取得した情報をメモリ(例えばDRAM(Dynamic Random Access Memory))30A,30B,30Cに動作履歴情報として蓄積する機能を持つ。動作履歴情報としては、例えば、イベントログ情報や、サーバ22A,22B,22Cに設けられているセンサのセンサ出力データの記録情報がある。
第2実施形態では、サーバ22A,22B,22Cのうちの一つ(ここでは、プライマリサーバとなったサーバ22Aとする)のBMC24Aには、仮想監視装置である仮想BMC26A,26B,26Cと、プライマリ仮想管理装置であるプライマリ仮想BMCマネージャー27とが構築されている。仮想BMC26Aは、BMC24Aに対応し、BMC24Aにより取得された動作履歴情報をメモリ30Aに設定されたBMC24A用の記憶領域31Aに格納する機能を持つ。仮想BMC26Bは、BMC24Bに対応し、BMC24Bにより取得された動作履歴情報をメモリ30Aに設定されたBMC24B用の記憶領域31Bに格納する機能を持つ。仮想BMC26Cは、BMC24Cに対応し、BMC24Cにより取得された動作履歴情報をメモリ30Aに設定されたBMC24C用の記憶領域31Cに格納する機能を持つ。
プライマリ仮想BMCマネージャー27は、機能部として、図4に表されるような供給部40と取得部41を備える。取得部41は、BMC24Aにより取得された動作履歴情報を供給部40に出力する機能を備える。また、取得部41は、サーバ22Aに設けられているインターフェース34と、情報通信網21とを介してサーバ22B,22CのBMC24B,24Cから動作履歴情報を取得し、供給部40に出力する機能を備えている。
供給部40は、取得部41から受け取ったBMC24A,24B,24Cの動作履歴情報を、それぞれ対応する仮想BMC26A,26B,26Cに提供する機能を備えている。動作履歴情報を受け取った仮想BMC26A,26B,26Cは、前記の如く、対応する記憶領域31A,31B,31Cに動作履歴情報を格納する。
サーバ22A,22B,22Cのうちの別の一つ(ここでは、セカンダリサーバとなったサーバ22Bとする)のBMC24Bには、図3に表されるように、仮想監視装置である仮想BMC26A,26B,26Cが構築されている。仮想BMC26A,26B,26Cは、BMC24Aに設けられている仮想BMC26A,26B,26Cと同様の機能を持つ。
また、BMC24B(プライマリ仮想BMCマネージャー27が構築されていないBMC)には、セカンダリ仮想管理装置であるセカンダリ仮想BMCマネージャー28が構築されている。
セカンダリ仮想BMCマネージャー28は、機能部として、図5に表されるような供給部40と取得部41と検知部42を備える。取得部41は、サーバ22Bに設けられているインターフェース34と、情報通信網21とを介してサーバ22AからBMC24A,24B,24Cの動作履歴情報を取得し、供給部40に出力する機能を備える。供給部40は、プライマリ仮想BMCマネージャー27の供給部40と同様に、取得部41から受け取ったBMC24A,24B,24Cの動作履歴情報を、それぞれ対応する仮想BMC26A,26B,26Cに提供する機能を備えている。動作履歴情報を受け取った仮想BMC26A,26B,26Cは、前記の如く、対応する記憶領域31A,31B,31Cに動作履歴情報を格納する。換言すれば、セカンダリ仮想BMCマネージャー28は、プライマリ仮想BMCマネージャー27により取得されメモリ30Aに格納されたBMC24A,24B,24Cの動作履歴情報のコピーをメモリ30Bに格納する機能を備えている。
また、セカンダリ仮想BMCマネージャー28は、前記の如く、検知部42を備えている。検知部42は、例えばBMC24A(プライマリ仮想BMCマネージャー27を備えているBMC)からの通知に基づいて、プライマリサーバ22AのBMC24Aに障害が発生しているか否かを検知する機能を備えている。そして、検知部42は、BMC24Aに障害が発生したことを検知した場合には、その旨を例えば取得部41などに通知する機能を備えている。取得部41は、検知部42からBMC24Aの障害発生が通知された場合には、BMC24A,24B,24Cの動作履歴情報をBMC24Aから取得する動作モードから、各BMC24B,24Cから取得する動作モードに切り替わる。つまり、プライマリサーバ22AのBMC24Aに障害が発生した場合には、セカンダリサーバ22Bのセカンダリ仮想BMCマネージャー28が、プライマリ仮想BMCマネージャーに切り替わる。
上記構成を持つBMC24A,24B,24Cは、第1実施形態において説明した監視装置3と同様に、ハードウェア構成として、プロセッサ4とメモリ5とを備えている(図1参照)。そのメモリ5に格納されているコンピュータプログラム6をプロセッサ4が実行することにより、BMC24A,24B,24Cは、各種機能を備える。つまり、BMC24A,24B、24Cには、上記のような仮想BMC26A,26B,26Cや、プライマリ仮想BMCマネージャー27あるいはセカンダリ仮想BMCマネージャー28が構築される。
以下に、図6〜図8に基づいて、コンピュータシステム20におけるBMC24A,24B,24Cの管理に関する動作例を説明する。
まず、コンピュータシステム20の起動時について説明する。
例えば、コンピュータシステム20の全てのサーバ22A,22B,22Cが停止している状態から、一つのサーバ(ここではサーバ22Aとする)が最初に起動したとする(図6におけるステップS101)。よって、サーバ22Aがプライマリサーバとなる。起動したプライマリサーバ22AのBMC24Aは、当該BMC24Aのプロセッサが当該BMC24Aのメモリに格納されているプログラムを実行することにより、プログラムに基づいた処理を実行する。例えば、BMC24Aは、インターフェース34と情報通信網21を介して、他のサーバ22B,22CのBMC24B,24Cとの通信を試る。そして、BMC24Aは、他のBMC24B,24Cが起動していないことを検知した場合には、プライマリ仮想BMCマネージャー27を構築すると共に、仮想BMC26Aを構築する(ステップS102)。
その後、別のサーバ(ここではサーバ22Bとする)が起動したとする(ステップS103)。よって、サーバ22Bがセカンダリサーバとなる。起動したセカンダリサーバ22BのBMC24Bは、当該BMC24Bのプロセッサが当該BMC24Bのメモリに格納されているプログラムを実行することにより、プログラムに基づいた処理を実行する。例えば、BMC24Bは、インターフェース34と情報通信網21を介して、他のサーバ22A,22CのBMC24A,24Cとの通信を試る。そして、BMC24Bは、プライマリサーバ22AのBMC24Aにプライマリ仮想BMCマネージャー27が構築されていることを検知すると、セカンダリ仮想BMCマネージャー28を構築すると共に、仮想BMC26A,26Bを構築する(ステップS104)。その後、BMC24Bのセカンダリ仮想BMCマネージャー28は、サーバ22A,22BのBMC24A,24Bから当該BMC24A,24Bが取得しているBMC24A,24Bの動作履歴情報を取得する(ステップS105)。
このように、コンピュータシステム20が起動していくと共に、BMC24A,24B,24Cによるサーバ22A,22B,22Cを監視するシステムが起動していく。
なお、上述した図6の例では、最初に起動したBMC24Aにプライマリ仮想BMCマネージャー27が構築された後に、サーバ22Bが起動し当該サーバ22BのBMC24Bにセカンダリ仮想BMCマネージャー28が構築されている。これに代えて、例えば、サーバ22A,22B,22Cが順次、短い時間間隔で起動することが想定される場合がある。この場合には、全てのサーバ22A,22B,22Cが起動した後に、BMC24A,24B,24Cが相互に通信することによりサーバの起動順を確認する。そして、この確認された起動順に基づいて、最初に起動したサーバのBMCにプライマリ仮想BMCマネージャー27が構築され、次に起動したサーバのBMCにセカンダリ仮想BMCマネージャー28が構築されてもよい。
また、上述した例に代えて、例えば、サーバ22A,22B,22Cが順次、短時間間隔で起動することが想定される場合には、サーバの起動順に関係無く、予め定められたルールに基づいて、BMC24A,24B,24Cの一つにプライマリ仮想BMCマネージャー27が構築され、BMC24A,24B,24Cの別の一つにセカンダリ仮想マネージャー28が構築されてもよい。
次に、通常運用時におけるBMC24A,24B,24Cの管理に関する動作例を図7に基づき説明する。例えば、BMC24Aのプライマリ仮想BMCマネージャー27は、設定の時間間隔毎に、サーバ22A,22B,22CのBMC24A,24B,24Cに接続する(ステップS201)。そして、プライマリ仮想BMCマネージャー27は、サーバ22A,22B,22Cのメモリにおける動作履歴情報が更新されたか否かを判断する(ステップS202)。換言すれば、プライマリ仮想BMCマネージャー27は、BMC24A,24B,24Cの動作履歴情報をポーリングする。
プライマリ仮想BMCマネージャー27は、更新された動作履歴情報が無いと判断した場合には、次の動作履歴情報の更新有無判断動作に備える。一方、プライマリ仮想BMCマネージャー27は、更新された動作履歴情報が有ると判断した場合には、その更新された動作履歴情報を取得し(ステップS203)、当該動作履歴情報を、対応する仮想BMCを介してメモリに格納させる。
また、通常運用中には、セカンダリ仮想BMCマネージャー28は、設定の時間間隔毎に、プライマリ仮想BMCマネージャー27に接続し、当該プライマリ仮想BMCマネージャー27が動作履歴情報を更新したか否かを判断する。そして、セカンダリ仮想BMCマネージャー28は、更新された動作履歴情報が無いと判断した場合には、次の動作履歴情報の更新有無判断動作に備える。一方、更新された動作履歴情報が有ると判断した場合には、セカンダリ仮想BMCマネージャー28は、プライマリ仮想BMCマネージャー27を介して、その更新された動作履歴情報を取得し対応する仮想BMCを介してメモリに格納させる。
次に、プライマリサーバ22AのBMC24Aに障害が発生した場合におけるセカンダリ仮想BMCマネージャー28の動作例を図8に基づき説明する。例えば、セカンダリ仮想BMCマネージャー28は、BMC24Aから通知を受け取ると(図8におけるステップS401)、その通知に基づいて、BMC24Aに障害が発生したか否かを判断する(ステップS402)。この判断により、BMC24Aに障害が発生していないと判断した場合には、セカンダリ仮想BMCマネージャー28は、次の通知の受け取りに備える。一方、BMC24Aに障害が発生していると判断した場合には、BMC24Bのセカンダリ仮想BMCマネージャー28は、プライマリ仮想BMCマネージャーに切り替わる(ステップS403)。
第2実施形態のサーバ22A,22B,22Cによるコンピュータシステム20は、サーバ22A,22B,22Cの一つにプライマリ仮想BMCマネージャー27を構築する。このため、コンピュータシステム20は、第1実施形態と同様に、管理用のサーバを設けずに、複数のサーバ22A,22B,22CのBMC24A,24B,24Cを監視することができる。これにより、コンピュータシステム20は、管理用サーバの導入費用を招くことなく、複数のサーバ22A,22B,22Cの動作状況を一括管理できる。
その上、第2実施形態では、プライマリサーバ22Aに備えられたBMC24Aのプライマリ仮想BMCマネージャー27とは別に、セカンダリサーバ22Bに備えられたBMC24Bにセカンダリ仮想BMCマネージャー28が構築されている。よって、プライマリサーバ22AのBMC24Aに障害が発生してしまっても、セカンダリサーバ22BのBMC24Bのセカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わるので、BMC24A,24B,24Cの一括管理は継続される。つまり、コンピュータシステム20は、BMC24A,24B,24Cを一括管理するシステムの可用性を高めることができる。
<第3実施形態>
以下に、本発明に係る第3実施形態を説明する。なお、第3実施形態の説明において、第2実施形態のサーバおよびコンピュータシステムを構成する構成部分と同一名称部分には同一符号を付し、その共通部分の重複説明は省略する。
この第3実施形態のコンピュータシステム20は、第2実施形態の構成に加えて、サーバ22CのBMC24C(プライマリ仮想BMCマネージャー27もセカンダリ仮想BMCマネージャー28も構築されていないBMC)に、次の構成を備える。すなわち、BMC24Cは、図9に示されるように、検知部43と起動部44が備えられている。検知部43および起動部44も、供給部40や取得部41や検知部42と同様に、BMC24Cのプロセッサがメモリのプログラムを実行することにより、BMC24Cが持つ機能部である。
検知部43は、例えばBMC24B(セカンダリ仮想BMCマネージャー28を備えているBMC)からの通知に基づいて、セカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わったことを検知した場合には、その旨を起動部44に通知する機能を備えている。
また、検知部43は、例えばBMC24Bからの通知に基づいて、BMC24Bに障害が発生しているか否かを検知する機能を備えている。そして、検知部42は、BMC24Bに障害が発生したことを検知した場合には、その旨を起動部44に通知する機能を備えている。
起動部44は、セカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わったこと、あるいは、BMC24Bの障害発生を検知すると、BMC24Cに、前述したような仮想BMC26A,26B,26Cを構築する機能を備えている。また、起動部44は、BMC24Cに、前述したようなセカンダリ仮想BMCマネージャー28を構築する機能を備えている。さらに、起動部44は、BMC24AあるいはBMC24Bから、メモリ30A,30Bに格納されている各サーバ22A,22B,22Cの動作履歴情報を取得し、サーバ22Cのメモリ30Cに格納する機能を備えている。
第3実施形態におけるコンピュータシステム20の上記以外の構成は第2実施形態と同様である。以下に、第3実施形態におけるBMC24Cのセカンダリ仮想BMCマネージャーの起動に係る動作例を図10に基づいて説明する。
例えば、BMC24Cの検知部43は、BMC24Bからの通知を受信すると、この通知に基づいて、BMC24Bのセカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わったか否かを判断する(図10におけるステップS301)。そして、検知部43は、セカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わったことを判断した場合には、その旨、起動部44に通知する。これにより、起動部44が、BMC24Cに仮想BMC26A,26B,26Cとセカンダリ仮想BMCマネージャー28を構築し(ステップS302)、BMC24Bからサーバ22A,22B,22Cの動作履歴情報を取得する。そして、検知部43と起動部44は、BMC24Bからの次の通知に備える。
一方、セカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わっていない場合には、検知部43は、BMC24Bに障害が発生したか否かを判断する(ステップS303)。そして、検知部43は、BMC24Bに障害が発生したことを検知した場合には、その旨を起動部44に通知する。これにより、起動部44が、前記同様に、BMC24Cに仮想BMC26A,26B,26Cとセカンダリ仮想BMCマネージャー28を構築する(ステップS302)。
第3実施形態のコンピュータシステム20は、第2実施形態の構成を備えているので、第2実施形態と同様の効果を得ることができる。その上、第3実施形態のコンピュータシステム20は、BMC24Cに、セカンダリ仮想BMCマネージャー28などを構築できる構成を備えている。このため、プライマリサーバ22AのBMC24Aの障害発生によりセカンダリサーバ22BのBMC24Bのセカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わった場合や、セカンダリサーバ22BのBMC24Bに障害が発生した場合に、コンピュータシステム20は、BMC24に新たなセカンダリ仮想BMCマネージャー28を構築できる。すなわち、第3実施形態のコンピュータシステム20は、BMC24A,24B,24Cを一括管理するシステムの可用性をより高めることができる。
<その他の実施形態>
なお、本発明は、第1〜第3の実施形態に限定されず、様々な実施の形態を採り得る。例えば、第2や第3の実施形態では、検知部42,43は、BMC24A,24Bからの通知によって、BMC24AやBMC24Bの障害を検知している。これに代えて、例えば、サーバ22Aやサーバ22Bに、BMC24A,24Bの障害を通知する機能を持たせてもよく、この場合には、サーバ22A,22Bからの通知に基づいて、検知部42,43は、BMC24A,24Bの障害を検知する。
また、第2や第3の実施形態では、コンピュータシステムを構成するサーバの数は、3台であったが、4台以上であってもよい。4台以上のサーバによりコンピュータシステムが構成される場合には、例えば、サーバ22A,22B,22C以外のサーバに、サーバ22CのBMC24Cがセカンダリ仮想BMCマネージャー28を構築したか否かを監視する機能を持たせてもよい。さらに、当該サーバに、セカンダリ仮想BMCマネージャー28が構築された場合には、第3実施形態で述べたような検知部43と起動部44の機能を持たせてもよい。この場合には、コンピュータシステムは、複数のBMCを一括管理するシステムの可用性をより高めることができる。
さらに、第2実施形態では、プライマリ仮想BMCマネージャー27を備えるBMC24Aに障害が発生した場合には、BMC24Bのセカンダリ仮想BMCマネージャー28がプライマリ仮想BMCマネージャーに切り替わる構成である。これに代えて、例えば、サーバ22CのBMC24Cが、BMC24Aに障害が発生したか否かを検知する検知部を備えていてもよい。さらに、BMC24Cは、BMC24Aに障害が発生した場合に仮想BMC26A,26B,26Cとプライマリ仮想BMCマネージャー27をBMC24Cに構築する起動部を備えていてもよい。プライマリ仮想BMCマネージャー27がBMC24AからBMC24Cに切り替わって構築された場合には、BMC24Bのセカンダリ仮想BMCマネージャー28の検知部42は、BMC24Cからの通知に基づいて、BMC24Cの障害発生を検知することになる。
さらに、第2と第3の実施形態では、仮想BMC26A,26B,26Cと、プライマリ仮想BMCマネージャー27あるいはセカンダリ仮想BMCマネージャー28とは、BMC24A,24B,24Cに構築されている。これに代えて、仮想BMC26A,26B,26Cと、プライマリ仮想BMCマネージャー27あるいはセカンダリ仮想BMCマネージャー28とは、サーバ22A,22B,22Cのプロセッサ23A,23B,23Cによってサーバ22A,22B,22Cに構築可能としてもよい。
1 情報処理装置
3 監視装置
4 プロセッサ
5 メモリ
6 プログラム
10,20 コンピュータシステム
12 仮想監視装置
13 仮想管理装置
22A,22B,22C サーバ
23A,23B,23C プロセッサ
24A,24B,24C BMC
26A,26B,26C 仮想BMC
27 プライマリ仮想BMCマネージャー
28 セカンダリ仮想BMCマネージャー

Claims (9)

  1. 複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを構成するための前記情報処理装置であって、
    当該情報処理装置自らの動作状況を監視する監視装置を備え、
    前記監視装置は、コンピュータプログラムが格納されているメモリと、前記コンピュータプログラムを実行するプロセッサと、を備えており、
    前記コンピュータプログラムは、
    前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置と、当該複数の仮想監視装置を管理するプライマリ仮想管理装置と、を前記プロセッサに構築させ、
    前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置と、セカンダリ仮想管理装置と、を前記プロセッサに構築させるコンピュータプログラムを含む
    情報処理装置。
  2. 前記コンピュータプログラムは、さらに、
    前記プライマリ仮想管理装置が構築されている別の監視装置に、障害が発生したか否かを前記プロセッサに検知させ、
    前記プライマリ仮想管理装置が構築されている別の監視装置に、障害が発生したことを検知した場合に、前記プライマリ仮想管理装置を前記プロセッサに構築させるコンピュータプログラムを含む
    請求項1に記載の情報処理装置。
  3. 前記コンピュータプログラムは、さらに、
    前記プライマリ仮想管理装置と前記セカンダリ仮想管理装置の何れもが、別の監視装置のプロセッサに構築される場合に、前記セカンダリ仮想管理装置が構築されている別の監視装置に、障害が発生したか否かを前記プロセッサに検知させ、
    前記セカンダリ仮想管理装置が構築されている別の監視装置に、障害が発生したことを検知した場合に、前記セカンダリ仮想管理装置を前記プロセッサに構築させるコンピュータプログラムを含む
    請求項1又は請求項2に記載の情報処理装置。
  4. 前記コンピュータプログラムは、さらに、
    前記プライマリ仮想管理装置が構築されている場合に、当該プライマリ仮想管理装置に、前記複数の情報処理装置の監視装置から動作履歴情報を取得させるコンピュータプログラムを含む
    請求項1乃至請求項3の何れか一つに記載の情報処理装置。
  5. 前記コンピュータプログラムは、さらに、
    前記セカンダリ仮想管理装置が構築されている場合に、当該セカンダリ仮想管理装置に、前記プライマリ仮想管理装置から前記複数の情報処理装置についての前記動作履歴情報を取得させるコンピュータプログラムを含む
    請求項4に記載の情報処理装置。
  6. 前記情報処理装置自らが備えるメモリに格納されているコンピュータプログラムは、前記コンピュータプログラムを前記監視装置の前記メモリに代えて含む
    請求項1乃至請求項5の何れか一つに記載の情報処理装置。
  7. 複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムであって、
    前記複数の情報処理装置の各々は、
    当該情報処理装置自らの動作状況を監視する監視装置を備え、
    前記監視装置は、コンピュータプログラムが格納されているメモリと、前記コンピュータプログラムを実行するプロセッサと、を備えており、
    前記コンピュータプログラムは、
    前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置と、当該複数の仮想監視装置を管理するプライマリ仮想管理装置と、を前記プロセッサに構築させ、
    前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置と、セカンダリ仮想管理装置と、を前記プロセッサに構築させるコンピュータプログラムを含むコンピュータシステム。
  8. 複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを監視する監視システム構築方法であって、
    前記情報処理装置に備えられた監視装置に備わるプロセッサに、
    前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置を構築し、
    当該複数の仮想監視装置を管理するプライマリ仮想管理装置を構築し、
    前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置とセカンダリ仮想管理装置と、を構築する監視システム構築方法。
  9. 複数の情報処理装置が情報通信網を介して接続されるコンピュータシステムを監視するためのコンピュータプログラムであって、
    前記複数の情報処理装置にそれぞれ備わる監視装置に対応する複数の仮想監視装置と、当該複数の仮想監視装置を管理するプライマリ仮想管理装置と、を前記監視装置に備わるプロセッサに構築させ、
    前記プライマリ仮想管理装置が別の監視装置のプロセッサに構築される場合に、前記複数の仮想監視装置と、セカンダリ仮想管理装置と、を前記プロセッサに構築させるコンピュータプログラム。
JP2017072060A 2017-03-31 2017-03-31 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム Active JP6863013B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017072060A JP6863013B2 (ja) 2017-03-31 2017-03-31 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017072060A JP6863013B2 (ja) 2017-03-31 2017-03-31 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2018173854A JP2018173854A (ja) 2018-11-08
JP6863013B2 true JP6863013B2 (ja) 2021-04-21

Family

ID=64108714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017072060A Active JP6863013B2 (ja) 2017-03-31 2017-03-31 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6863013B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3887130B2 (ja) * 1999-07-30 2007-02-28 株式会社東芝 高可用性計算機システム及び同システムにおけるデータバックアップ方法
CN101212345A (zh) * 2006-12-31 2008-07-02 联想(北京)有限公司 一种刀片服务器管理系统
JP4918696B2 (ja) * 2008-09-22 2012-04-18 株式会社日立システムズ サーバ監視システムおよびそのためのプログラム
JP5689783B2 (ja) * 2011-11-24 2015-03-25 株式会社東芝 コンピュータ、コンピュータシステム、および障害情報管理方法
JP2015230720A (ja) * 2014-06-09 2015-12-21 株式会社日立製作所 計算機システム

Also Published As

Publication number Publication date
JP2018173854A (ja) 2018-11-08

Similar Documents

Publication Publication Date Title
US9582373B2 (en) Methods and systems to hot-swap a virtual machine
CN105229613B (zh) 协调分布式系统中的故障恢复
US20090276657A1 (en) Managing cluster split-brain in datacenter service site failover
CN109446169B (zh) 一种双控磁盘阵列共享文件系统
EP2360614B1 (en) Information processing device and hardware setting method for said information processing device
US9210059B2 (en) Cluster system
JP2012173996A (ja) クラスタシステム、クラスタ管理方法、およびクラスタ管理プログラム
US20170228250A1 (en) Virtual machine service availability
US20180089055A1 (en) Method and apparatus for monitoring logs
US20230244579A1 (en) Event-driven system failover and failback
JP2015230720A (ja) 計算機システム
JP6863013B2 (ja) 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
JP2009223519A (ja) クラスタシステム及び同システムにおいてマスタノードを選択する方法
KR102030461B1 (ko) 복수의 프로세서 오류 감지 시스템 및 그 방법
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
JP4495248B2 (ja) 情報処理装置、障害処理方法
JP2009026182A (ja) プログラム実行システム及び実行装置
JP4511455B2 (ja) ファイバーチャネルスイッチおよびそれを用いたコンピュータシステム
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统
JP5653322B2 (ja) 障害検出装置、ネットワーク構成推定装置および障害検出方法
JP5252574B2 (ja) ディスクアレイ制御装置及び方法並びにプログラム
JP6934754B2 (ja) 分散処理システム、分散処理システムの管理方法、及び分散処理システム管理プログラム
JP2007094604A (ja) 災害対策用コンピュータバックアップ方式
JP2009211279A (ja) 操業データ管理サーバシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210315

R150 Certificate of patent or registration of utility model

Ref document number: 6863013

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150