JP2018097739A - 計算機システム - Google Patents
計算機システム Download PDFInfo
- Publication number
- JP2018097739A JP2018097739A JP2016243586A JP2016243586A JP2018097739A JP 2018097739 A JP2018097739 A JP 2018097739A JP 2016243586 A JP2016243586 A JP 2016243586A JP 2016243586 A JP2016243586 A JP 2016243586A JP 2018097739 A JP2018097739 A JP 2018097739A
- Authority
- JP
- Japan
- Prior art keywords
- power supply
- fan
- server
- power
- detection unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムであって、
前記電源装置の異常を検出する検出部と、
前記検出部と前記サーバ装置とを接続し、前記検出部の検出結果を前記サーバ装置へ伝達する第1の通信線と、
を備えている。
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムが実行する制御方法であって、
前記電源装置に設けられた検出部で前記電源装置の異常を検出し、
前記検出部の検出結果を、前記検出部と前記サーバ装置とを接続する第1の通信線を通じて、前記サーバ装置へ伝達する。
[第1の実施形態]
図1を参照すると、本発明の第1の実施形態に係る計算機システム1000は、n台のサーバ装置1010−1〜1010−nと、m台の電源装置1020−1〜1020−mと、n台のファン1030−1〜1030−nとを備えている。nとmは1以上の正の整数である。好ましくは、nとmは2以上の正の整数である。
次に本発明の第2の実施形態について説明する。
<本実施形態の特徴>
本実施形態は、筐体内に複数のサーバを実装する、高集積計算機システムで、筐体内のセンサ監視モジュールと各サーバ、および筐体内の各ファンの間に通信線が実装されているシステムである。上記高集積計算機システムにおいて、筐体内の電源故障による電力供給不足が発生しても、即座にサーバデータを保護し、順次サーバを退避・停止させることを可能とする。
筐体に複数の電源装置(PSU)が実装される高集積計算機システムでは、電源故障による電力供給不足が発生する確率が高まる。電力供給不足が発生した場合、筐体内の数十から数百の全サーバに影響が及ぶ(サーバダウン)。
電源故障による電力供給不足の場合、障害発生から即座に各サーバへ異常を通知する必要があるため、筐体内部の通信線を用いて、センサ監視モジュールから各サーバの制御を行う。電力供給不足の場合、各サーバを通常の手順で停止(OSシャットダウン)する時間がないため、各サーバはメモリ情報を保持するためにスリープ状態に入る。
筐体内のセンサ監視モジュールで電源異常を検知した場合、筐体内の通信線を用いて、各サーバ・ファンへ通知を行う。異常通知を受けた各サーバは、メモリ情報を保持するためにスリープ状態に入る。異常通知を受けた各ファンは、回転数を最低まで落とし消費電力を低下させる。電源故障による電力供給不足の場合、上記手順で筐体内の消費電力を即座に低下させることで、各サーバのメモリ情報を保持し、利用可能な電力を使ってスリープ状態の各サーバを順次復旧させることが可能となる。
図2に示すように、高集積計算機1の筐体内には、筐体内の各センサを監視する、センサ監視モジュール10と、複数のファン40〜4n、複数のサーバ60〜6n、そして、筐体内のサーバ等に電力供給するためのPSU20〜2nを有する。各サーバ・ファンには異常発生の信号を制御するための、ファン制御スイッチ30とCPU制御スイッチ50が接続されている。また、センサ監視モジュール10から各ファンと各サーバの間には、制御信号を送受信するための通信線70を有する。
図3および、図4を用いて、本実施形態の動作を説明する。
(2)復旧させるサーバのCPU電源状態をONにする。
(3)サーバを通常停止(OSシャットダウン)させる。
(4)ファンの回転数を下げる。
第一の効果は、障害発生から各サーバ・ファンの制御までの時間を大幅に短縮できることにある。電源故障による電力供給不足など、即座に対応が求められる障害に対し、筐体内部の通信線を使って各サーバ・ファンに通知することで、メモリ情報を保持することが可能である。これに対して、従来技術では、筐体内の全サーバがダウンし、処理中のデータが失われてしまう。
次に本発明の第3の実施形態について説明する。
上述した第2の実施形態では、筐体内の電源装置(PSU)が、例えば、稼動3台+予備1台のような構成において、PSUの2重障害に対する運用性の向上を想定しているが、予備電源なしの構成でも本発明を適用することでデータロストを防ぐことが可能であるため、より安価に、より省スペースで、高集積計算機システムを実現可能となる。
[付記1]
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムであって、
前記電源装置の異常を検出する検出部と、
前記検出部と前記サーバ装置とを接続し、前記検出部の検出結果を前記サーバ装置へ伝達する第1の通信線と、
を備えた計算機システム。
[付記2]
前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを前記サーバ装置毎に切り替える第1の切替スイッチを、
さらに備える付記1に記載の計算機システム。
[付記3]
前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを複数のサーバ装置一括で切り替える第2の切替スイッチを、
さらに備える付記1または2に記載の計算機システム。
[付記4]
ファンと、
前記検出部と前記ファンとを接続し、前記検出部の検出結果を前記ファンへ伝達する第2の通信線とを、
さらに備える付記1乃至3の何れかに記載の計算機システム。
[付記5]
前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを前記ファン毎に切り替える第3の切替スイッチを、
さらに備える付記4に記載の計算機システム。
[付記6]
前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを複数のファン一括で切り替える第4の切替スイッチを、
さらに備える付記4または5に記載の計算機システム。
[付記7]
前記ファンは、前記第2の通信線を通じて前記検出部の検出結果を受信すると、回転数を低下するように構成されている、
付記4乃至6の何れかに記載の計算機システム。
[付記8]
前記サーバ装置は、前記第1の通信線を通じて前記検出部の検出結果を受信すると、スリープ状態に入るように構成されている、
付記1乃至7の何れかに記載の計算機システム。
[付記9]
前記電源装置による供給可能総電力から需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認し、前記スリープ状態の前記サーバ装置を前記スリープ状態から通常状態へ復帰させる復旧手段を、
さらに備える付記8に記載の計算機システム。
[付記10]
前記復旧手段は、前記通常状態へ復帰させた後の前記サーバ装置のOSシャットダウンを行う、
付記9に記載の計算機システム。
[付記11]
サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムが実行する制御方法であって、
前記電源装置に設けられた検出部で前記電源装置の異常を検出し、
前記検出部の検出結果を、前記検出部と前記サーバ装置とを接続する第1の通信線を通じて、前記サーバ装置へ伝達する、
制御方法。
[付記12]
前記第1の通信線の途中に接続された第1の切替スイッチにより、前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを前記サーバ装置毎に切り替える、
付記11に記載の制御方法。
[付記13]
前記第1の通信線の途中に接続された第2の切替スイッチにより、前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを複数のサーバ装置一括で切り替える、
付記11または12に記載の制御方法。
[付記14]
前記検出部の検出結果を、前記検出部と前記計算機システムに備わるファンとを接続する第2の通信線を通じて、前記ファンへ伝達する、
付記11乃至13の何れかに記載の制御方法。
[付記15]
前記第2の通信線の途中に接続された第3の切替スイッチにより、前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを前記ファン毎に切り替える、
付記14に記載の制御方法。
[付記16]
前記第2の通信線の途中に接続された第4の切替スイッチにより、前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを複数のファン一括で切り替える、
付記14または15に記載の制御方法。
[付記17]
前記ファンは、前記第2の通信線を通じて前記検出部の検出結果を受信すると、回転数を低下させる、
付記14乃至16の何れかに記載の制御方法。
[付記18]
前記サーバ装置は、前記第1の通信線を通じて前記検出部の検出結果を受信すると、スリープ状態に遷移する、
付記11乃至17の何れかに記載の制御方法。
[付記19]
前記電源装置による供給可能総電力から需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認し、前記スリープ状態の前記サーバ装置を前記スリープ状態から通常状態へ復帰させる、
付記18に記載の制御方法。
[付記20]
前記通常状態へ復帰させた後の前記サーバ装置のOSシャットダウンを行う、
付記19に記載の制御方法。
10…センサ監視モジュール
11…ファン制御手段
12…CPU制御手段
13…異常通知信号制御手段
14…センサ監視手段
15…スイッチ切替手段
16…内部スイッチ
17…復旧手段
18…ファン回転数変更手段
19…CPU電源状態変更手段
20〜2n…PSU
30…ファン制御スイッチ
40〜4n…ファン
50…CPU制御スイッチ
60〜6n…サーバ
70…通信線
201…電力供給部
202…PSU異常通知手段
601〜6n1…CPU
602〜6n2…主記憶
1000…計算機システム
1010−1〜1010−n…サーバ装置
1010−11〜1010−13…端子
1010−21〜1010−23…端子
1010−31〜1010−33…端子
1020−1〜1020−m…電源装置
1020−11〜1020−13…端子
1020−m1〜1020−m3…端子
1030−1〜1030−n…ファン
1030−11〜1030−13…端子
1030−21〜1030−23…端子
1030−31〜1030−33…端子
1040…切替スイッチ
1040−11〜1040−1n…端子
1040−21〜1040−2n…端子
1040−3〜1040−4…端子
1050…切替スイッチ
1050−1〜1050−4…端子
1060…切替スイッチ
1060−11〜1060−1n…端子
1060−21〜1060−2n…端子
1060−3〜1060−4…端子
1070−1〜1070−m…電源装置
1070−11〜1070−m1…端子
1080…通信線
1090…通信線
1090−1〜1090−n…制御線
1100−1〜1100−n…通信線
1200−1〜1200−n…通信線
1300…管理装置
1500−1〜1500−n…制御線
1600−1〜1600−m…制御線
1700−1〜1700−3…制御線
1800−1〜1800−m…端子
1900−1〜1900−4…端子
2000−1〜2000−n…端子
2100−1〜2100−n…端子
3000…計算機システム
3100…サーバ装置
3200…電源装置
3300…検出部
3400…通信線
Claims (10)
- サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムであって、
前記電源装置の異常を検出する検出部と、
前記検出部と前記サーバ装置とを接続し、前記検出部の検出結果を前記サーバ装置へ伝達する第1の通信線と、
を備えた計算機システム。 - 前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを前記サーバ装置毎に切り替える第1の切替スイッチを、
さらに備える請求項1に記載の計算機システム。 - 前記検出部と前記サーバ装置とを前記第1の通信線によって接続するか否かを複数のサーバ装置一括で切り替える第2の切替スイッチを、
さらに備える請求項1または2に記載の計算機システム。 - ファンと、
前記検出部と前記ファンとを接続し、前記検出部の検出結果を前記ファンへ伝達する第2の通信線とを、
さらに備える請求項1乃至3の何れかに記載の計算機システム。 - 前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを前記ファン毎に切り替える第3の切替スイッチを、
さらに備える請求項4に記載の計算機システム。 - 前記検出部と前記ファンとを前記第2の通信線によって接続するか否かを複数のファン一括で切り替える第4の切替スイッチを、
さらに備える請求項4または5に記載の計算機システム。 - 前記ファンは、前記第2の通信線を通じて前記検出部の検出結果を受信すると、回転数を低下するように構成されている、
請求項4乃至6の何れかに記載の計算機システム。 - 前記サーバ装置は、前記第1の通信線を通じて前記検出部の検出結果を受信すると、スリープ状態に入るように構成されている、
請求項1乃至7の何れかに記載の計算機システム。 - 前記電源装置による供給可能総電力から需要電力を差し引いた余剰電力が予め定められた閾値電力以上であることを確認し、前記スリープ状態の前記サーバ装置を前記スリープ状態から通常状態へ復帰させる復旧手段を、
さらに備える請求項8に記載の計算機システム。 - サーバ装置と前記サーバ装置へ電力を供給する電源装置とを備えた計算機システムが実行する制御方法であって、
前記電源装置に設けられた検出部で前記電源装置の異常を検出し、
前記検出部の検出結果を、前記検出部と前記サーバ装置とを接続する第1の通信線を通じて、前記サーバ装置へ伝達する、
制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016243586A JP6953710B2 (ja) | 2016-12-15 | 2016-12-15 | 計算機システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016243586A JP6953710B2 (ja) | 2016-12-15 | 2016-12-15 | 計算機システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018097739A true JP2018097739A (ja) | 2018-06-21 |
JP6953710B2 JP6953710B2 (ja) | 2021-10-27 |
Family
ID=62633050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016243586A Active JP6953710B2 (ja) | 2016-12-15 | 2016-12-15 | 計算機システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6953710B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023233635A1 (ja) * | 2022-06-02 | 2023-12-07 | 日本電信電話株式会社 | ネットワーク管理装置、方法およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012108757A (ja) * | 2010-11-18 | 2012-06-07 | Nec Corp | 電力供給管理システム |
US20160062449A1 (en) * | 2014-08-27 | 2016-03-03 | Hewlett-Packard Development Company, L.P. | Computing platform power consumption level adjustment |
-
2016
- 2016-12-15 JP JP2016243586A patent/JP6953710B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012108757A (ja) * | 2010-11-18 | 2012-06-07 | Nec Corp | 電力供給管理システム |
US20160062449A1 (en) * | 2014-08-27 | 2016-03-03 | Hewlett-Packard Development Company, L.P. | Computing platform power consumption level adjustment |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023233635A1 (ja) * | 2022-06-02 | 2023-12-07 | 日本電信電話株式会社 | ネットワーク管理装置、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6953710B2 (ja) | 2021-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8656003B2 (en) | Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed | |
US7275182B2 (en) | Method and apparatus for correlating UPS capacity to system power requirements | |
JP4155190B2 (ja) | 無停電電源装置、電力供給制御プログラム、電力供給制御プログラム記録媒体及び電力供給制御方法 | |
RU2690750C1 (ru) | Способ для управления питанием системы и его вычислительная система | |
US7045914B2 (en) | System and method for automatically providing continuous power supply via standby uninterrupted power supplies | |
US11099961B2 (en) | Systems and methods for prevention of data loss in a power-compromised persistent memory equipped host information handling system during a power loss event | |
CN114090184B (zh) | 一种虚拟化集群高可用性的实现方法和设备 | |
TW201911813A (zh) | 網路切換控制系統 | |
JP2015035175A (ja) | 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム | |
US10317985B2 (en) | Shutdown of computing devices | |
JPWO2015104841A1 (ja) | 多重系システムおよび多重系システム管理方法 | |
US20100318826A1 (en) | Changing Power States Of Data-Handling Devices To Meet Redundancy Criterion | |
US20040073817A1 (en) | Method for automatically saving in-process programs before shutdown | |
CN103176581A (zh) | 电源管理装置及电源管理方法 | |
CN107026759A (zh) | 一种基于bmc的远程管理bbu模块的固件及其开发方法 | |
JP5549535B2 (ja) | 情報処理装置,制御方法および制御装置 | |
CN111984471B (zh) | 一种机柜电源bmc冗余管理系统及方法 | |
JP6953710B2 (ja) | 計算機システム | |
CN106407081B (zh) | 一种机箱管理系统及服务器 | |
US11733762B2 (en) | Method to allow for higher usable power capacity in a redundant power configuration | |
JP2012128573A (ja) | 二重化システムおよびそのシステムを用いたビル管理システム | |
JP5626884B2 (ja) | 電力供給管理システム及び電力供給管理方法 | |
US10365705B2 (en) | System and methods for prioritized multi-node server and infrastructure availability during power capacity loss | |
KR20140140719A (ko) | 가상 머신 동기화 장치 및 시스템과 이를 이용한 장애 처리 방법 | |
TW201344403A (zh) | 電源管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6953710 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |