JP2018097739A - 計算機システム - Google Patents

計算機システム Download PDF

Info

Publication number
JP2018097739A
JP2018097739A JP2016243586A JP2016243586A JP2018097739A JP 2018097739 A JP2018097739 A JP 2018097739A JP 2016243586 A JP2016243586 A JP 2016243586A JP 2016243586 A JP2016243586 A JP 2016243586A JP 2018097739 A JP2018097739 A JP 2018097739A
Authority
JP
Japan
Prior art keywords
power supply
fan
server
power
detection unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016243586A
Other languages
English (en)
Other versions
JP6953710B2 (ja
Inventor
勝平 岩竹
Shohei Iwatake
勝平 岩竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016243586A priority Critical patent/JP6953710B2/ja
Publication of JP2018097739A publication Critical patent/JP2018097739A/ja
Application granted granted Critical
Publication of JP6953710B2 publication Critical patent/JP6953710B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】電源装置の異常をサーバへ速やかに通知するのは困難であること。【解決手段】計算機システムは、サーバ装置と、サーバ装置へ電力を供給する電源装置と、検出部と、第1の通信線とを備える。検出部は、電源装置の異常を検出する。第1の通信線は、検出部とサーバ装置とを接続し、検出部の検出結果をサーバ装置へ伝達する。【選択図】図1

Description

本発明は、計算機システム、および制御方法に関する。
近年、複数のサーバ、スイッチ、温度センサ、ファン、電源装置などを筐体に収納した計算機システムが実用化されている。このような計算機システムの一例が特許文献1に記載されている。
特許文献1に記載の計算機システム(以下、本発明に関連する計算機システムと記す)では、エンクロージャマネージャ(以下、EMと記す)と呼ばれる管理装置が筐体に収納され、また各サーバにベースボードマネージメントコントローラ(以下、BMCと記す)と呼ばれる管理装置が搭載されている。EMおよびBMCは、切替スイッチを介して、管理対象ユニット(サーバ、スイッチモジュール、電源装置など)に接続することが可能である。EMは、スイッチモジュール設定機能、電源管理機能、冷却管理機能、筐体管理機能、システム情報監視機能等の各種の管理機能を実施する。また、EMが管理対象ユニットを管理することができない場合、切替スイッチを切り替えて、BMCがEMに代わって管理対象ユニットを管理するように構成されている。
特開2016−167213号公報
上述した本発明に関連する計算機システムでは、電源装置に異常が発生した場合、電源装置から切替スイッチを通じてEMあるいはBMCに電源異常が通知され、このEMあるいはBMCから各管理対象ユニットに電源異常が通知される。即ち、電源装置の異常は、電源装置からEMあるいはBMCに一旦通知され、EMあるいはBMCから管理対象ユニットの一つであるサーバに通知される。そのため、電源装置の異常をサーバへ速やかに通知するのは困難であった。
本発明の目的は、上述した課題、すなわち電源装置の異常をサーバへ速やかに通知するのは困難である、という課題を解決する計算機システムを提供することにある。
本発明の一形態に係る計算機システムは、
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムであって、
前記電源装置の異常を検出する検出部と、
前記検出部と前記サーバ装置とを接続し、前記検出部の検出結果を前記サーバ装置へ伝達する第1の通信線と、
を備えている。
本発明の他の形態に係る制御方法は、
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムが実行する制御方法であって、
前記電源装置に設けられた検出部で前記電源装置の異常を検出し、
前記検出部の検出結果を、前記検出部と前記サーバ装置とを接続する第1の通信線を通じて、前記サーバ装置へ伝達する。
本発明は、上述した構成を有することにより、電源装置の異常をサーバ装置へ速やかに通知することができる。
本発明の第1の実施形態に係る計算機システムのブロック図である 本発明の第2の実施形態に係る計算機システムのブロック図である。 本発明の第2の実施形態におけるセンサ監視モジュールとPSUの内部構成例を示す図である。 本発明の第2の実施形態におけるファン制御手段、CPU制御手段、異常通知信号制御手段の動作を示すフローチャートである。 本発明の第2の実施形態におけるセンサ監視モジュールの復旧に関連する内部構成例を示す図である。 本発明の第2の実施形態における復旧手段、ファン回転数変更手段、CPU電源状態変更手段の動作を示すフローチャートである。 本発明の第3の実施形態に係る計算機システムのブロック図である。
次に本発明の実施の形態について図面を参照して詳細に説明する。
[第1の実施形態]
図1を参照すると、本発明の第1の実施形態に係る計算機システム1000は、n台のサーバ装置1010−1〜1010−nと、m台の電源装置1020−1〜1020−mと、n台のファン1030−1〜1030−nとを備えている。nとmは1以上の正の整数である。好ましくは、nとmは2以上の正の整数である。
それぞれのサーバ装置1010−i(i=1〜n)は、CPUおよびメモリ等を含んで構成され、CPU上でOS(オペレーションシステム)やアプリケーションプログラムを実行することにより、所定の業務を遂行する。サーバ装置1010−iは、端子1010−i1〜1010−i3を有する。端子1010−i1は電力線1400に接続されている。サーバ装置1010−iは、電力線1400を通じて端子1010−i1に電力を受電する。端子1010−i2は通信線1100−iに接続されている。サーバ装置1010−iは、通信線1100−iを通じて電源装置の異常信号を端子1010−i2に受信する。サーバ装置1010−iは、通常状態において端子1010−i2に電源装置の異常信号を受信すると、通常の動作状態からスリープ状態へ移行する。サーバ装置1010−iは、スリープ状態では、サーバ装置1010−i内の種々の構成部品の電源断を行うが、システムメモリを通電し続けてシステムメモリの内容を保持する。一般にスリープ状態にあるサーバ装置1010−iは、通常状態のときに比べて消費電力が大幅に少なくなる。また、端子1010−i3は、制御線1090−iに接続されている。サーバ装置1010−iは、制御線1090−iを通じて制御信号を端子1010−i3に受信する。サーバ装置1010−iは、スリープ状態において端子1010−i3から通常状態への復帰を要求する制御信号を受信すると、スリープ状態から通常状態へ復帰する。
ファン1030−i(i=1〜n)は、サーバ装置1010−iを冷却するための空気の流れを発生する。図1の例では、ファン1030−iは主にサーバ装置1010−iを冷却する。即ち、サーバ装置1010−i毎にその冷却用のファン1030−iが設けられている。ファン1030−iは、端子1030−i1〜1030−i3を有する。端子1030−i1は電力線1400に接続されている。ファン1030−iは、電力線1400を通じて端子1030−i1に電力を受電する。端子1030−i2は通信線1200−iに接続されている。ファン1030−iは、通信線1200−iを通じて端子1030−i2に電源装置の異常信号を受信する。ファン1030−iは、端子1030−i2に電源装置の異常信号を受信すると、ファンを予め設定された最低回転数で回転させる。端子1030−i3は制御線1500−iに接続されている。ファン1030−iは、制御線1500−iを通じて制御信号を端子1030−i3に受信する。ファン1030−iは、端子1030−i3に回転数を指定した制御信号を受信すると、ファンを指定された回転数で回転させる。
電源装置1020−j(j=1〜m)は、計算機システム1000の各部へ電力を供給する。電源装置1020−jは、端子1020−j1〜1020−j3を有する。端子1020−j1は商用電源に接続されている。電源装置1020−jは、端子1020−j1に受電した商用電源による交流電力を所定電圧値の直流電圧に変換し、端子1020−j2から出力する。端子1020−j2は電力線1400に接続されている。端子1020−j3は制御線1600−jに接続されている。電源装置1020−jは、制御線1600−jを通じて端子1020−j3に制御信号を受信する。電源装置1020−jは、端子1020−j3に受信した制御信号に応じた処理を行う。例えば、電源装置1020−jは、稼働系あるいは予備系を指定した制御信号を端子1020−jに受信すると、電源装置1020−jの状態を稼働あるいは予備に切り替える。m台の電源装置1020のうちの複数台を稼働系とすることにより、大きな電力を供給することができる。また、m台の電源装置1020の一部を予備として待機させておけば、稼働中の電源装置に異常が発生した場合、予備の電源装置をその代わりに稼働させることができる。
電源装置1020−jは、検出部1070−jを内蔵している。検出部1070−jは、電源装置1020−jの異常を検出する。電源装置1020−jの異常とは、例えば、電源装置1020−jの出力断、出力の低下などである。検出部1070−jは、電源装置1020−jの異常を検出すると、端子1070−j1から電源装置の異常信号を出力する。端子1070−j1は、通信線1080を通じて切替スイッチ1050に接続されている。
切替スイッチ1050は、通信線1080に接続された端子1050−1、通信線1090に接続された端子1150−2、電力線1400に接続された端子1050−3、および制御線1700−1に接続された端子1150−4を有する。切替スイッチ1050は、電力線1400を通じて端子1050−3に電力を受電する。切替スイッチ1050は、端子1050−1と端子1050−2との間を接続したオン状態、それらの端子間を切断したオフ状態を採る。端子1050−4は制御線1700−1を通じて制御信号を受信する。切替スイッチ1050は、端子1050−4に受信した制御信号に従って、オン状態からオフ状態へ切り替わり、またその逆にオフ状態からオン状態へ切り替わる。端子1150−2は、通信線1090を通じて切替スイッチ1040および切替スイッチ1060に接続されている。
切替スイッチ1040は、通信線1090に接続されたn個の端子1040−1i、通信線1100−iに接続されたn個の端子1040−2i、電力線1400に接続された端子1040−3、および制御線1700−2に接続された端子1040−4を有する。切替スイッチ1040は、電力線1400を通じて端子1040−3に電力を受電する。切替スイッチ1040は、端子1040−1iと端子1040−2iとの同じiのペア毎に独立に、それらの端子間を接続したオン状態、それらの端子間を切断したオフ状態を採る。端子1040−4は制御線1700−2を通じて制御信号を受信する。切替スイッチ1040は、端子1040−4から受信した制御信号に従って、端子1040−1iと端子1040−2iとの同じiのペア毎に独立に、オン状態からオフ状態へ切り替わり、またその逆にオフ状態からオン状態へ切り替わる。端子1040−2iは、通信線1100−iを通じてサーバ装置1010−iの端子1010−i2に接続されている。
切替スイッチ1060は、通信線1090に接続されたn個の端子1060−1i、通信線1200−iに接続されたn個の端子1060−2i、電力線1400に接続された端子1060−3、および制御線1700−3に接続された端子1060−4を有する。切替スイッチ1060は、電力線1400を通じて端子1060−3に電力を受電する。切替スイッチ1060は、端子1060−1iと端子1060−2iとの同じiのペア毎に独立に、それらの端子間を接続したオン状態、それらの端子間を切断したオフ状態を採る。端子1060−4は制御線1700−3を通じて制御信号を受信する。切替スイッチ1060は、端子1060−4に受信した制御信号に従って、端子1060−1iと端子1060−2iとの同じiのペア毎に独立に、オン状態からオフ状態へ切り替わり、またその逆にオフ状態からオン状態へ切り替わる。端子1060−2iは、通信線1200−iを通じてファン1030−iの端子1030−i2に接続されている。
計算機システム1000は、さらに管理装置1300を備えている。管理装置1300は、端子1800−1〜1800−m、端子1900−1〜1900−4、端子2000−1〜2000−n、端子2100−1〜2100−nを有する。端子1800−jは、制御線1600−jを通じて電源装置1020−jの端子1020−j3に接続されている。端子1900−1は、制御線1700−1を通じて切替スイッチ1050の端子1150−4に接続されている。端子1900−2は、制御線1700−2を通じて切替スイッチ1040の端子1040−4に接続されている。端子1900−3は、制御線1700−3を通じて切替スイッチ1060の端子1060−4に接続されている。端子1900−4は電力線1400に接続されている。端子2000−iは、制御線1090−iを通じてサーバ装置1010−iの端子1010−i3に接続されている。端子2100−iは、制御線1500−iを通じてファン1030−iの端子1030−i3に接続されている。
管理装置1300は、電力線1400から端子1900−4に電力を受電する。管理装置1300は、端子1800−jから制御線1600−jを通じて電源装置1020−jへ制御信号を送信することにより、電源装置1020の状態を取得し、或いは状態を制御する。また管理装置1300は、端子1900−1から制御線1700−1を通じて切替スイッチ1050へ制御信号を送信することにより、切替スイッチ1050の状態を切り替える。また管理装置1300は、端子1900−2から制御線1700−2を通じて切替スイッチ1040へ制御信号を送信することにより、切替スイッチ1040の状態を切り替える。また管理装置1300は、端子1900−3から制御線1700−3を通じて切替スイッチ1060へ制御信号を送信することにより、切替スイッチ1060の状態を切り替える。また管理装置1300は、端子2000−iから制御線1090−iを通じてサーバ装置1010−iへ制御信号を送信することにより、サーバ装置1010−iの状態を制御する。また管理装置1300は、端子2100−iから制御線1500−iを通じてファン1030−iへ制御信号を送信することにより、ファン1030−iの状態を制御する。管理装置1300は、ハードウェアで構成することができると共に、例えばコンピュータとプログラムとで実現することできる。
次に、本実施形態に係る計算機システム1000の動作を説明する。
計算機システム1000の運用を開始するのに先立って、管理装置1300は、電源装置1020−1〜1020−mによる電源投入後、切替スイッチ1040、1050、1060の状態を全てオン状態とする。これにより、電源装置1020−1〜1020−mに内蔵された検出部1070−1〜1070−mの電源異常信号の出力端子1070−11〜1070−m1が、通信線1080、切替スイッチ1050、通信線1090、切替スイッチ1040、通信線1100−1〜1100−nを通じて、サーバ装置1010−1〜1010−nの電源異常信号の入力端子1010−12〜1010−n2に電気的に接続される。また、検出部1070−1〜1070−mの電源異常信号の出力端子1070−11〜1070−m1が、通信線1080、切替スイッチ1050、通信線1090、切替スイッチ1060、通信線1200−1〜1200−nを通じて、ファン1030−1〜1030−nの電源異常信号の入力端子1030−12〜1030−n2に電気的に接続される。
その後、管理装置1300は、サーバ装置1010−1〜1010−nおよびファン1030−1〜1030−nを動作させて、計算機システム1000の運用を開始する。計算機システム1000の運用中に電源装置1020−1〜1020−mの何れかに異常が発生すると、異常の発生した電源装置1020−jに内蔵された検出部1070−jでその異常が検出され、端子1070−j1から電源異常信号が出力される。この電源異常信号は、通信線1080、切替スイッチ1050、通信線1090、切替スイッチ1040、通信線1100−1〜1100−nを伝搬し、サーバ装置1010−1〜1010−nの端子1010−12〜1010−n2に到達する。これにより、サーバ装置1010−1〜1010−nはスリープ状態に移行する。また、電源異常信号は、通信線1080、切替スイッチ1050、通信線1090、切替スイッチ1060、通信線1200−1〜1200−nを通じて、ファン1030−1〜1030−nの端子1030−12〜1030−n2に到達する。これにより、ファン1030−1〜1030−nは最低の回転数で回転するようになる。何れかの電源装置1020−jに異常が発生して、計算機システム1000の各部に供給される電力が低下しても、全てのサーバ装置1010−1〜1010−nがスリープ状態になっており、また全てのファン1030−1〜1030−nが最低の回転数で回転しているため、需要電力が供給電力を上回る可能性は少ない。その結果、サーバ装置1010−1〜1010−nにおける作業中のデータを保持するシステムメモリの記憶内容の保持が可能になる。
次に、管理装置1300は、電源装置1020−jの異常を検出すると自律的に、或いはシステム管理者からの指示に従って、計算機システム1000の復旧を行う。まず、管理装置1300は、正常な電源装置1020による供給可能総電力から現在の需要電力を差し引いた余剰電力を算出する。供給可能総電力は、例えば正常な電源装置1020の定格出力の情報等に基づいて算出することができる。また、現在の需要電力は、例えば図示しない電力計によって計測することで算出できる。次に、管理装置1300は、余剰電力が予め定められた閾値電力以上であるか否かを判定する。そして、管理装置1300は、余剰電力が閾値電力以上であれば、以下の制御を実施する。
まず、管理装置1300は、スリープ状態の1つのサーバ装置1010−iに注目する。次に、管理装置1300は、注目中のサーバ装置1010−iに対して制御線1090−iを通じて通常状態へ復帰する制御信号を送出し、注目中のサーバ装置1010−iをスリープ状態から通常状態へ復帰させる。このとき、管理装置1300は、注目中のサーバ装置1010−iを冷却するファン1030−iに対して制御線1500−iを通じて制御信号を送出し、当該ファン1030−iの回転数を所定量増大させる。次に、管理装置1300は、注目中のサーバ装置1010−iに対して制御線1090−iを通じてシャットダウンを要求する制御信号を送出し、注目中のサーバ装置1010−iをシャットダウンさせる。また管理装置1300は、シャットダウンしたサーバ装置1010−iを冷却するためのファン1030−iを停止させる。
管理装置1300は、注目中のサーバ装置1010−iをシャットダウンさせると、次に、スリープ状態の他の1つのサーバ装置1010−iに注目を移し、先に注目したサーバ装置に対して実施した上記処理と同様の処理を実施して、シャットダウンする。管理装置1300は、以上と同様の動作をスリープ状態の全てのサーバ装置をシャットダウンするまで繰り返す。これにより、電源故障による電力供給不足が発生しても、サーバ装置1010の作業データを保護しつつ、支障なく全サーバ装置をシャットダウンすることができる。
以上の復旧動作では、管理装置1300は、スリープ状態になった全てのサーバ装置をシャットダウンさせた。しかし、管理装置1300は、スリープ状態になったサーバ装置の一部をシャットダウンさせ、残りは通常状態で稼働させ続けるようにしてもよい。管理装置1300は、シャットダウンするサーバ装置および通常状態で稼働させ続けるサーバ装置の決定を、予め設定されたサーバ装置の優先度情報に基づいて行うことができる。
また以上の動作説明では、管理装置1300は、計算機システム1000の運用を開始するのに先立って、切替スイッチ1040、1050、1060の状態を全てオン状態とした。しかし、管理装置1300は、電源装置1020−1〜1020−mの電力供給能力に十分な余裕がある、或いは、予備の電源装置が複数個確保されている等、何れかの電源装置1020に異常が発生しても直ちに全サーバ装置1020をスリープ状態にする必要性がない場合、切替スイッチ1050をオフ状態としておいてもよい。また、管理装置1300は、業務処理等の関係からスリープ状態にすることに支障のあるサーバ装置1010−iが存在する場合、そのサーバ装置1010−iの電源異常信号入力端子1010−i2に繋がる切替スイッチ1040の端子ペア(1040−1iと1040−2i)間を切断状態としておいてもよい。こうすれば、当該サーバ装置1010−iには電源異常信号は伝達されないため、電源異常時に強制的に稼働状態からスリープ状態へ遷移することはなくなる。また、管理装置1300は、スリープ状態へ遷移させずに稼働させ続けるサーバ装置1010−iを冷却するファン1030−iに繋がる切替スイッチ1060の端子ペア(1060−1iと1060−2i)間を切断状態としておく。こうすれば、当該ファン1030−iには電源異常信号は伝達されないため、電源異常時に強制的に最低の回転数で回転させられることはなくなる。
このように本実施形態によれば、電源装置1020の異常をサーバ装置1010へ速やかに通知することができる。その理由は、電源装置1020の異常を検出する検出部1070とサーバ装置1010との間に、検出部1070の検出結果を伝達する通信線1080、1090、1100を設けているためである。
また本実施形態によれば、電源装置1020の異常時、ファン1030の回転数を強制的に速やかに低下させることができる。その理由は、電源装置1020の異常を検出する検出部1070とファン1030との間に、検出部1070の検出結果を伝達する通信線1080、1090、1200を設けているためである。
また本実施形態によれば、電源装置1020の異常時、計算機システム1000全体の需要電力を強制的に低下させることができる。その理由は、サーバ装置1020は電源異常信号を受信するとスリープ状態に入るためである。また別の理由は、ファン1030は電源異常信号を受信すると回転数を下げるためである。
また本実施形態によれば、電源装置1020の異常時に強制的にスリープ状態に遷移させるサーバ装置、遷移させずに通常状態で稼働させ続けるサーバ装置を選択することができる。その理由は、電源装置の異常信号を伝搬する通信路(1090、1100)の途中に、サーバ装置単位で異常信号の伝達の可否を制御する切替スイッチ1040を設けてあるためである。
また本実施形態によれば、電源装置1020の異常時に強制的に回転数を低下させるファン、低下させないファンを選択することができる。その理由は、電源装置の異常信号を伝搬する通信路(1090、1200)の途中に、ファン単位で異常信号の伝達の可否を制御する切替スイッチ1060を設けてあるためである。
また本実施形態によれば、電源装置1020の異常時、サーバ装置1010の作業データを保護しつつ、支障なくサーバ装置をシャットダウンすることができる。その理由は、管理装置1300が、正常な電源装置1020による供給可能総電力から現在の需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認した上で、1台ずつ順番に通常状態への復帰とシャットダウンとを実施するためである。
[第2の実施形態]
次に本発明の第2の実施形態について説明する。
<本実施形態の特徴>
本実施形態は、筐体内に複数のサーバを実装する、高集積計算機システムで、筐体内のセンサ監視モジュールと各サーバ、および筐体内の各ファンの間に通信線が実装されているシステムである。上記高集積計算機システムにおいて、筐体内の電源故障による電力供給不足が発生しても、即座にサーバデータを保護し、順次サーバを退避・停止させることを可能とする。
<本実施形態が解決しようとする課題>
筐体に複数の電源装置(PSU)が実装される高集積計算機システムでは、電源故障による電力供給不足が発生する確率が高まる。電力供給不足が発生した場合、筐体内の数十から数百の全サーバに影響が及ぶ(サーバダウン)。
ここで、電力供給不足を防ぐ手段の一つとして、無停電電源装置(UPS)があるが、UPSと筐体の間の電源ケーブル故障、または電源ケーブル抜け、筐体の電源装置(PSU)の故障などには対応できない。
予備の電源装置(PSU)を複数個実装することで、電力供給不足の発生率を下げる方法もあるが、コストが上昇してしまう。また、高集積計算機システムにおいては、サーバの集積度が低下することも問題となる。
一般的な故障発生時の対処として、ネットワークを介して、管理サーバに障害情報の通知および、管理サーバから各サーバの制御を行う方法(SNMP等)は存在するが、電源故障による電力供給不足の場合には、障害通知からサーバ停止の制御を行っても間に合わないという課題がある。
上述の通り、高集積計算機システムにおいて、低コストで電源故障による電力供給不足の影響を最小限にする技術が必要である。
<本実施形態による解決手段>
電源故障による電力供給不足の場合、障害発生から即座に各サーバへ異常を通知する必要があるため、筐体内部の通信線を用いて、センサ監視モジュールから各サーバの制御を行う。電力供給不足の場合、各サーバを通常の手順で停止(OSシャットダウン)する時間がないため、各サーバはメモリ情報を保持するためにスリープ状態に入る。
電源障害発生から、即座に各サーバがスリープ状態に入ることで、全サーバダウンを回避しメモリ情報の保持が可能となる。その後、利用可能な電力を使って、順次サーバの復旧を行うことで、電源故障の影響を最小限に抑えることが可能となる。
また、高集積計算機システムの場合、ファン(FAN)も大量に電力を消費するため、センサ監視モジュールから制御を行い、電力供給不足が発生した場合、ファンの回転数を最低まで下げることでサーバの復旧に利用する電力を確保する。
<本実施形態の概要>
筐体内のセンサ監視モジュールで電源異常を検知した場合、筐体内の通信線を用いて、各サーバ・ファンへ通知を行う。異常通知を受けた各サーバは、メモリ情報を保持するためにスリープ状態に入る。異常通知を受けた各ファンは、回転数を最低まで落とし消費電力を低下させる。電源故障による電力供給不足の場合、上記手順で筐体内の消費電力を即座に低下させることで、各サーバのメモリ情報を保持し、利用可能な電力を使ってスリープ状態の各サーバを順次復旧させることが可能となる。
電源異常発生から、タイムラグなく各サーバ・ファンに通知するため、電源装置(PSU)とセンサ監視モジュール、およびセンサ監視モジュールと各サーバ・ファンの間にスイッチを実装する。センサ監視モジュールは、異常発生時ではなく、PSUの状態によって、事前に異常発生の信号を「通知する」「通知しない」のスイッチを切り替えるだけで良い。
例えば、電源の状態が予備電源ありならば、電源故障が発生しても電力供給不足にはならないため「通知しない」、予備電源なしならば、「通知する」に切り替える。
実際に、電源異常が発生した場合、PSUからスイッチを経由して、各サーバ・ファンへ通知が行われ、メモリ情報の保持、およびファン回転数の低下を行う。
<本実施形態の構成>
図2に示すように、高集積計算機1の筐体内には、筐体内の各センサを監視する、センサ監視モジュール10と、複数のファン40〜4n、複数のサーバ60〜6n、そして、筐体内のサーバ等に電力供給するためのPSU20〜2nを有する。各サーバ・ファンには異常発生の信号を制御するための、ファン制御スイッチ30とCPU制御スイッチ50が接続されている。また、センサ監視モジュール10から各ファンと各サーバの間には、制御信号を送受信するための通信線70を有する。
図3に示すように、センサ監視モジュール10は、ファン制御手段11、CPU制御手段12、異常通知信号制御手段13、センサ監視手段14、スイッチ切替手段15、内部スイッチ16で構成される。
ファン制御手段11は、電源異常発生時に、ファンへ「通知する」「通知しない」の制御を行う。「通知する」「通知しない」を切り替えるには、スイッチ切替手段15を使ってファン制御スイッチ30の切り替えを行う。
CPU制御手段12は、電源異常発生時に、サーバへ「通知する」「通知しない」の制御を行う。「通知する」「通知しない」を切り替えるには、スイッチ切替手段15を使ってCPU制御スイッチ50の切り替えを行う。
異常通知信号制御手段13は、電源の状態に応じて、PSUからの異常信号を各サーバ・ファンへ「通知する」「通知しない」の制御を行う。「通知する」「通知しない」を切り替えるには、スイッチ切替手段15を使って内部スイッチ16の切り替えを行う。
センサ監視手段14は、筐体内の温度、電圧、電力、ファン回転数、PSUの状態などのセンサ情報を定期的に収集する。PSUの状態が変わった場合、異常通知信号制御手段13へ通知を行い、内部スイッチ16の切り替えを行うトリガとなる。
電源(PSU20)は、電力供給部201とPSU異常通知手段202を有する。電力供給部201は筐体内の全装置に対して電力を供給する。PSU異常通知手段202は、電力供給部201を監視しており、異常(電力低下など)を検出した場合、異常発生を知らせるための信号をセンサ監視モジュール10の内部スイッチ16に対して送る。
なお、異常信号を「通知する」「通知しない」によって、接続状態が変わるため、図3では、各スイッチの間とファン制御スイッチ30とファン40〜4nの間、CPU制御スイッチ50とCPU601〜6n1の間の線は破線で表現している。
次に、サーバを復旧する際に必要となる構成を説明する。重複を避けるため、図2との差分のみを図5に示す。
図5に示すように、センサ監視モジュール10は、復旧手段17、ファン回転数変更手段18、CPU電源状態変更手段19を有する。
復旧手段17は、センサ監視手段14から電源の状態を取得し利用できる電力を確認し、ファン回転数変更手段18とCPU電源状態変更手段19を使って、順次サーバの復旧を行っていく(下記の手順を全サーバに対し繰り返す)。ただし、利用可能な電力がない(スリープ状態を維持するのでいっぱい)場合は、復旧を行わない。
ファン回転数変更手段18は、復旧するサーバを冷却するため、対象となるサーバ周辺のファンの回転数を上げる。回転数を上げるファンを指定するため、ファン制御手段11を使ってファン制御スイッチ30を切り替える。ファン制御スイッチ30を切り替えた後、復旧手段17から指示された回転数に変更するための指示を対象ファンに出す。
CPU電源状態変更手段19は、CPUの電源状態を変更するため、CPU制御手段12を使ってCPU制御スイッチ50を切り替える。CPU制御スイッチ50を切り替えた後、復旧手段17から指示された電源状態へ変更するための指示を対象CPUに出す。
<本実施形態の動作の説明>
図3および、図4を用いて、本実施形態の動作を説明する。
ファン制御手段11は、ファン制御SG(システムジェネレーショ)仕様書を読み込み、電源異常発生時に回転数を低下させるファンを決定する(ステップ111)。回転数を低下させるファンについて、スイッチ切替手段15を使ってファン制御スイッチ30を切り替える(ステップ112)。ここで、ステップ111において、回転数を低下させるファンを変更するためのインターフェースを用意しておくことで、運用中でも対象となるファンを変更可能とする。
CPU制御手段12は、CPU制御SG仕様書を読み込み、電源異常発生時にスリープ状態にするCPU(サーバ)を決定する(ステップ121)。スリープさせるCPUについて、スイッチ切替手段15を使ってCPU制御スイッチ50を切り替える(ステップ122)。ここで、ステップ121において、スリープさせるCPUを変更するためのインターフェースを用意しておくことで、運用中でも対象となるCPUを変更可能とする。
ファン制御SG仕様書とCPU制御SG仕様書については、基本的にはすべてのファンとCPUに対し異常発生の信号を通知し、ファン回転数の低下とCPUをスリープ状態にする。ただし、サーバの優先度に応じて、電力供給部201の故障による電力供給不足の場合でも、一部のサーバは処理を止めない選択も可能である。その場合、処理を止めないサーバについては、異常発生の信号を通知しなければ、スリープには入らない。また、CPU制御に合わせて、処理を止めないサーバがあれば、その周辺のファンも止められないため、ファン制御も優先度を付けて、一部のファンの回転数を低下させないという設定も可能である。
異常通知信号制御手段13は、センサ監視手段14から電源のセンサ情報を受け取る(ステップ131)。電源異常制御SG仕様書を読み込み、PSUからの異常発生信号を各サーバ・ファンに「通知する」「通知しない」を判断する(ステップ132)。「通知する」と判断した場合、スイッチ切替手段15を使って、内部スイッチ16を切り替える(ステップ133)。
電源異常制御SG仕様書については、電源の予備ありならば「通知しない」、電源の予備なしならば「通知する」といった設定を行う。また、複数のPSUでセンサ値の異常(故障の前兆)を検出した場合、予備電源があっても「通知する」といった設定も可能である。
実際に電力供給部201が故障し、電力供給不足が発生した時は、PSU異常通知手段202が電力供給部201の異常を検出し、センサ監視モジュール10の内部スイッチ16に対し、異常信号を通知する。上述したとおり、各スイッチは事前に切り替えが行われているため、回転数を低下させるファンについては、内部スイッチ16、ファン制御スイッチ30を経由して異常信号が通知される。スリープ状態に入るCPUについては、内部スイッチ16、CPU制御スイッチ50を経由して異常信号が通知される。異常信号を受けたファンは、回転数を最低まで下げ、異常信号を受けたCPUはスリープ状態に入りメモリ情報を保持する。
次に、図5および図6を用いて、サーバ復旧の動作を説明する。
復旧手段17は、センサ監視手段14から電源の状態を取得する。各電源装置(PSU)の状態と供給電力値をもとに、復旧に利用できる電力を計算し、利用できる電力がなければ復旧は行わず、各サーバはスリープ状態を維持する。利用できる電力があれば次ステップへ進む(ステップ171)。復旧手順SG仕様書を読み込み、復旧を行うサーバと周辺ファンの制御情報を取得する(ステップ172)。ファン回転数変更手段18とCPU電源状態変更手段19を使って、サーバの復旧を行う(ステップ173)。復旧手順SG仕様書に定義されている全サーバに対しステップ173を行う。
ファン回転数変更手段18は、復旧手段17からファン回転数変更の指示を受け(ステップ181)、回転数を変更するファンに指示を出すため、ファン制御手段11を使ってファン制御スイッチ30を切り替える(ステップ182)。ファン制御スイッチ30を切り替えた後、ファン制御スイッチ30に対し回転数変更の指示を出す(ステップ183)。
CPU電源状態変更手段19は、復旧手段17からCPU電源状態変更の指示を受け(ステップ191)、電源状態を変更するCPUに指示を出すため、CPU制御手段12を使ってCPU制御スイッチ50を切り替える(ステップ192)。CPU制御スイッチ50を切り替えた後、CPU制御スイッチに対しCPU電源状態変更の指示を出す(ステップ193)。
復旧手段17のステップ173を詳細に説明すると、以下の制御の繰り返しとなる。
(1)復旧させるサーバを冷却するためのファンの回転数を上げる。
(2)復旧させるサーバのCPU電源状態をONにする。
(3)サーバを通常停止(OSシャットダウン)させる。
(4)ファンの回転数を下げる。
(1)について、センサ監視モジュール10は、サーバの実装位置(スロット番号)とファンの実装位置を把握しており、復旧対象のサーバとファンを関連付けることが可能である。
上記はサーバを通常停止する復旧手順を説明したが、優先的に稼動させるサーバについては、(3)(4)は省略される。
<効果の説明>
第一の効果は、障害発生から各サーバ・ファンの制御までの時間を大幅に短縮できることにある。電源故障による電力供給不足など、即座に対応が求められる障害に対し、筐体内部の通信線を使って各サーバ・ファンに通知することで、メモリ情報を保持することが可能である。これに対して、従来技術では、筐体内の全サーバがダウンし、処理中のデータが失われてしまう。
第二の効果は、安価に障害対応できることにある。予備の電源を増設する(例えば予備1台の構成を予備2台とする)ことで、故障に備えることが可能だが、設置面積の問題や追加コストの問題がある。本実施形態を適用することで、通信線とスイッチを追加するだけで、安価に故障への対応が可能となる。
また、従来技術の課題で述べた、無停電電源装置(UPS)から先の、電源ケーブル故障や電源ケーブル抜け、筐体の電源装置(PSU)故障に対し、本実施形態を適用することでデータロストを防ぐ効果がある。
[第3の実施形態]
次に本発明の第3の実施形態について説明する。
図7を参照すると、第3の実施形態に係る計算機システム3000は、サーバ装置3100と、サーバ装置3100へ電力を供給する電源装置3200とを備えている。また、計算機システム3000は、電源装置3200の異常を検出する検出部3300を備えている。さらに、計算機システム3000は、検出部3300とサーバ装置3100とを接続する通信線3400を備えている。通信線3400は、検出部3300の検出結果をサーバ装置3100へ伝達するために使用される。
このように構成された計算機システム3000は、以下のように動作する。即ち、電源装置3200に設けられた検出部3300は、電源装置3200の異常を検出する。検出部3300が電源装置3200の異常を検出すると、その検出結果が、通信線3400を通じて、サーバ装置3100へ伝達される。
このように本実施形態によれば、電源装置の異常をサーバ装置へ速やかに通知することができる。その理由は、検出部3300とサーバ装置3100とを接続する通信線3400を備え、検出部3300が電源装置3200の異常を検出すると、その検出結果が通信線3400を通じてサーバ装置3100へ伝達されるためである。
[その他の実施形態]
上述した第2の実施形態では、筐体内の電源装置(PSU)が、例えば、稼動3台+予備1台のような構成において、PSUの2重障害に対する運用性の向上を想定しているが、予備電源なしの構成でも本発明を適用することでデータロストを防ぐことが可能であるため、より安価に、より省スペースで、高集積計算機システムを実現可能となる。
また、1つの筐体に閉じた説明を行ってきたが、ラック単位で本発明を適用した高集積計算機システムを設置すれば、ラック単位のUPSを省略した構成も可能となる。また、データセンタであれば、本発明を適用した高集積計算機システムをフロア内の全ラックに設置すれば、フロア単位のUPSを省略した構成も可能となる。
上記第2の実施形態では、簡単のため、異常発生時の信号を「通知する」「通知しない」の2値の制御としたが、ファン制御スイッチ30から各ファン、CPU制御スイッチ50から各CPUへ複数ビットの制御信号を送るようにしてもよい。この場合、例えばCPUであれば、CPUを強制停止(データ破棄)/スリープ状態に入る(データ保護)/低消費電力モードで実行/通知しない(そのまま実行)、といった制御が可能となる。
本発明は計算機システム、特に高集積計算機システムを利用した、データセンタやクラウドサービス、小さなサーバを大量に使った分散処理システム(Hadoop等)の分野に利用できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
[付記1]
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムであって、
前記電源装置の異常を検出する検出部と、
前記検出部と前記サーバ装置とを接続し、前記検出部の検出結果を前記サーバ装置へ伝達する第1の通信線と、
を備えた計算機システム。
[付記2]
前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを前記サーバ装置毎に切り替える第1の切替スイッチを、
さらに備える付記1に記載の計算機システム。
[付記3]
前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを複数のサーバ装置一括で切り替える第2の切替スイッチを、
さらに備える付記1または2に記載の計算機システム。
[付記4]
ファンと、
前記検出部と前記ファンとを接続し、前記検出部の検出結果を前記ファンへ伝達する第2の通信線とを、
さらに備える付記1乃至3の何れかに記載の計算機システム。
[付記5]
前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを前記ファン毎に切り替える第3の切替スイッチを、
さらに備える付記4に記載の計算機システム。
[付記6]
前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを複数のファン一括で切り替える第4の切替スイッチを、
さらに備える付記4または5に記載の計算機システム。
[付記7]
前記ファンは、前記第2の通信線を通じて前記検出部の検出結果を受信すると、回転数を低下するように構成されている、
付記4乃至6の何れかに記載の計算機システム。
[付記8]
前記サーバ装置は、前記第1の通信線を通じて前記検出部の検出結果を受信すると、スリープ状態に入るように構成されている、
付記1乃至7の何れかに記載の計算機システム。
[付記9]
前記電源装置による供給可能総電力から需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認し、前記スリープ状態の前記サーバ装置を前記スリープ状態から通常状態へ復帰させる復旧手段を、
さらに備える付記8に記載の計算機システム。
[付記10]
前記復旧手段は、前記通常状態へ復帰させた後の前記サーバ装置のOSシャットダウンを行う、
付記9に記載の計算機システム。
[付記11]
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムが実行する制御方法であって、
前記電源装置に設けられた検出部で前記電源装置の異常を検出し、
前記検出部の検出結果を、前記検出部と前記サーバ装置とを接続する第1の通信線を通じて、前記サーバ装置へ伝達する、
制御方法。
[付記12]
前記第1の通信線の途中に接続された第1の切替スイッチにより、前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを前記サーバ装置毎に切り替える、
付記11に記載の制御方法。
[付記13]
前記第1の通信線の途中に接続された第2の切替スイッチにより、前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを複数のサーバ装置一括で切り替える、
付記11または12に記載の制御方法。
[付記14]
前記検出部の検出結果を、前記検出部と前記計算機システムに備わるファンとを接続する第2の通信線を通じて、前記ファンへ伝達する、
付記11乃至13の何れかに記載の制御方法。
[付記15]
前記第2の通信線の途中に接続された第3の切替スイッチにより、前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを前記ファン毎に切り替える、
付記14に記載の制御方法。
[付記16]
前記第2の通信線の途中に接続された第4の切替スイッチにより、前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを複数のファン一括で切り替える、
付記14または15に記載の制御方法。
[付記17]
前記ファンは、前記第2の通信線を通じて前記検出部の検出結果を受信すると、回転数を低下させる、
付記14乃至16の何れかに記載の制御方法。
[付記18]
前記サーバ装置は、前記第1の通信線を通じて前記検出部の検出結果を受信すると、スリープ状態に遷移する、
付記11乃至17の何れかに記載の制御方法。
[付記19]
前記電源装置による供給可能総電力から需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認し、前記スリープ状態の前記サーバ装置を前記スリープ状態から通常状態へ復帰させる、
付記18に記載の制御方法。
[付記20]
前記通常状態へ復帰させた後の前記サーバ装置のOSシャットダウンを行う、
付記19に記載の制御方法。
1…高集積計算機
10…センサ監視モジュール
11…ファン制御手段
12…CPU制御手段
13…異常通知信号制御手段
14…センサ監視手段
15…スイッチ切替手段
16…内部スイッチ
17…復旧手段
18…ファン回転数変更手段
19…CPU電源状態変更手段
20〜2n…PSU
30…ファン制御スイッチ
40〜4n…ファン
50…CPU制御スイッチ
60〜6n…サーバ
70…通信線
201…電力供給部
202…PSU異常通知手段
601〜6n1…CPU
602〜6n2…主記憶
1000…計算機システム
1010−1〜1010−n…サーバ装置
1010−11〜1010−13…端子
1010−21〜1010−23…端子
1010−31〜1010−33…端子
1020−1〜1020−m…電源装置
1020−11〜1020−13…端子
1020−m1〜1020−m3…端子
1030−1〜1030−n…ファン
1030−11〜1030−13…端子
1030−21〜1030−23…端子
1030−31〜1030−33…端子
1040…切替スイッチ
1040−11〜1040−1n…端子
1040−21〜1040−2n…端子
1040−3〜1040−4…端子
1050…切替スイッチ
1050−1〜1050−4…端子
1060…切替スイッチ
1060−11〜1060−1n…端子
1060−21〜1060−2n…端子
1060−3〜1060−4…端子
1070−1〜1070−m…電源装置
1070−11〜1070−m1…端子
1080…通信線
1090…通信線
1090−1〜1090−n…制御線
1100−1〜1100−n…通信線
1200−1〜1200−n…通信線
1300…管理装置
1500−1〜1500−n…制御線
1600−1〜1600−m…制御線
1700−1〜1700−3…制御線
1800−1〜1800−m…端子
1900−1〜1900−4…端子
2000−1〜2000−n…端子
2100−1〜2100−n…端子
3000…計算機システム
3100…サーバ装置
3200…電源装置
3300…検出部
3400…通信線

Claims (10)

  1. サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムであって、
    前記電源装置の異常を検出する検出部と、
    前記検出部と前記サーバ装置とを接続し、前記検出部の検出結果を前記サーバ装置へ伝達する第1の通信線と、
    を備えた計算機システム。
  2. 前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを前記サーバ装置毎に切り替える第1の切替スイッチを、
    さらに備える請求項1に記載の計算機システム。
  3. 前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを複数のサーバ装置一括で切り替える第2の切替スイッチを、
    さらに備える請求項1または2に記載の計算機システム。
  4. ファンと、
    前記検出部と前記ファンとを接続し、前記検出部の検出結果を前記ファンへ伝達する第2の通信線とを、
    さらに備える請求項1乃至3の何れかに記載の計算機システム。
  5. 前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを前記ファン毎に切り替える第3の切替スイッチを、
    さらに備える請求項4に記載の計算機システム。
  6. 前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを複数のファン一括で切り替える第4の切替スイッチを、
    さらに備える請求項4または5に記載の計算機システム。
  7. 前記ファンは、前記第2の通信線を通じて前記検出部の検出結果を受信すると、回転数を低下するように構成されている、
    請求項4乃至6の何れかに記載の計算機システム。
  8. 前記サーバ装置は、前記第1の通信線を通じて前記検出部の検出結果を受信すると、スリープ状態に入るように構成されている、
    請求項1乃至7の何れかに記載の計算機システム。
  9. 前記電源装置による供給可能総電力から需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認し、前記スリープ状態の前記サーバ装置を前記スリープ状態から通常状態へ復帰させる復旧手段を、
    さらに備える請求項8に記載の計算機システム。
  10. サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムが実行する制御方法であって、
    前記電源装置に設けられた検出部で前記電源装置の異常を検出し、
    前記検出部の検出結果を、前記検出部と前記サーバ装置とを接続する第1の通信線を通じて、前記サーバ装置へ伝達する、
    制御方法。
JP2016243586A 2016-12-15 2016-12-15 計算機システム Active JP6953710B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016243586A JP6953710B2 (ja) 2016-12-15 2016-12-15 計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016243586A JP6953710B2 (ja) 2016-12-15 2016-12-15 計算機システム

Publications (2)

Publication Number Publication Date
JP2018097739A true JP2018097739A (ja) 2018-06-21
JP6953710B2 JP6953710B2 (ja) 2021-10-27

Family

ID=62633050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016243586A Active JP6953710B2 (ja) 2016-12-15 2016-12-15 計算機システム

Country Status (1)

Country Link
JP (1) JP6953710B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023233635A1 (ja) * 2022-06-02 2023-12-07 日本電信電話株式会社 ネットワーク管理装置、方法およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012108757A (ja) * 2010-11-18 2012-06-07 Nec Corp 電力供給管理システム
US20160062449A1 (en) * 2014-08-27 2016-03-03 Hewlett-Packard Development Company, L.P. Computing platform power consumption level adjustment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012108757A (ja) * 2010-11-18 2012-06-07 Nec Corp 電力供給管理システム
US20160062449A1 (en) * 2014-08-27 2016-03-03 Hewlett-Packard Development Company, L.P. Computing platform power consumption level adjustment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023233635A1 (ja) * 2022-06-02 2023-12-07 日本電信電話株式会社 ネットワーク管理装置、方法およびプログラム

Also Published As

Publication number Publication date
JP6953710B2 (ja) 2021-10-27

Similar Documents

Publication Publication Date Title
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
US7275182B2 (en) Method and apparatus for correlating UPS capacity to system power requirements
JP4155190B2 (ja) 無停電電源装置、電力供給制御プログラム、電力供給制御プログラム記録媒体及び電力供給制御方法
RU2690750C1 (ru) Способ для управления питанием системы и его вычислительная система
US7045914B2 (en) System and method for automatically providing continuous power supply via standby uninterrupted power supplies
US11099961B2 (en) Systems and methods for prevention of data loss in a power-compromised persistent memory equipped host information handling system during a power loss event
CN114090184B (zh) 一种虚拟化集群高可用性的实现方法和设备
TW201911813A (zh) 網路切換控制系統
JP2015035175A (ja) 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム
US10317985B2 (en) Shutdown of computing devices
JPWO2015104841A1 (ja) 多重系システムおよび多重系システム管理方法
US20100318826A1 (en) Changing Power States Of Data-Handling Devices To Meet Redundancy Criterion
US20040073817A1 (en) Method for automatically saving in-process programs before shutdown
CN103176581A (zh) 电源管理装置及电源管理方法
CN107026759A (zh) 一种基于bmc的远程管理bbu模块的固件及其开发方法
JP5549535B2 (ja) 情報処理装置,制御方法および制御装置
CN111984471B (zh) 一种机柜电源bmc冗余管理系统及方法
JP6953710B2 (ja) 計算機システム
CN106407081B (zh) 一种机箱管理系统及服务器
US11733762B2 (en) Method to allow for higher usable power capacity in a redundant power configuration
JP2012128573A (ja) 二重化システムおよびそのシステムを用いたビル管理システム
JP5626884B2 (ja) 電力供給管理システム及び電力供給管理方法
US10365705B2 (en) System and methods for prioritized multi-node server and infrastructure availability during power capacity loss
KR20140140719A (ko) 가상 머신 동기화 장치 및 시스템과 이를 이용한 장애 처리 방법
TW201344403A (zh) 電源管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210913

R150 Certificate of patent or registration of utility model

Ref document number: 6953710

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150