JP2020008971A - サーバ装置,電力制御プログラムおよび監視制御装置 - Google Patents

サーバ装置,電力制御プログラムおよび監視制御装置 Download PDF

Info

Publication number
JP2020008971A
JP2020008971A JP2018127264A JP2018127264A JP2020008971A JP 2020008971 A JP2020008971 A JP 2020008971A JP 2018127264 A JP2018127264 A JP 2018127264A JP 2018127264 A JP2018127264 A JP 2018127264A JP 2020008971 A JP2020008971 A JP 2020008971A
Authority
JP
Japan
Prior art keywords
power
node
power consumption
nodes
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018127264A
Other languages
English (en)
Other versions
JP7131136B2 (ja
Inventor
佐藤 智彦
Tomohiko Sato
智彦 佐藤
知輝 山田
Tomoki Yamada
知輝 山田
思無邪 小林
Shimuya Kobayashi
思無邪 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018127264A priority Critical patent/JP7131136B2/ja
Priority to US16/459,664 priority patent/US11073883B2/en
Publication of JP2020008971A publication Critical patent/JP2020008971A/ja
Application granted granted Critical
Publication of JP7131136B2 publication Critical patent/JP7131136B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3212Monitoring battery levels, e.g. power saving mode being initiated when battery voltage goes below a certain level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3296Power saving characterised by the action undertaken by lowering the supply or operating voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)

Abstract

【課題】管理装置を備えることなく安定した電力制御を実現する。【解決手段】複数のノード10と、電力を供給する複数の電力供給装置20と、複数のノード10のそれぞれから読み書き可能な共用の記憶領域30とを備え、複数のノード10のそれぞれが、自ノード10の消費電力情報を記憶領域30に記憶する記録制御部103と、複数の電力供給装置20のうち一部の電力供給装置20に異常が検出された場合に、記憶領域30から読み出した消費電力情報に基づいて、正常電力供給装置20から自ノード10への供給電力を制御する制御部102とを備える。【選択図】図1

Description

本発明は、サーバ装置,電力制御プログラムおよび監視制御装置に関する。
一般的なサーバシステムでは、一部の電力供給装置(PSU:Power Supply Unit)の故障等により消費電力が供給可能電力を上回った時に、一時的にCPU(Central Processing Unit)のクロックを最低レベルまで落とすことで、残ったPSUの供給電力を抑える手法が知られている。
このように、PSUの供給電力を低減させることで、残ったPSUが供給可能な電力を超えて電力供給を行なうことを阻止して、連鎖的なPSUの故障を防止する。
また、サーバシステムとして、筐体内に複数のノードを備えたマルチノードサーバが知られている。
マルチノードサーバにおいては、システム全体を管理する管理装置(以下、シャーシマネージャという)を備え、このシャーシマネージャが各ノードの電力供給を管理することで、PSUの供給可能電力を超えないように制御することが知られている。
図7は従来のマルチノードサーバにおける消費電力の遷移を示す図である。なお、図7中において縦軸はサーバにおける消費電力を示し、横軸は経過時間を示す。
PSU故障などによる電力不足が発生し、残ったPSUにおける供給可能電力をオーバーすると(矢印A1参照)、シャーシマネージャは、各ノードのBMC(Baseboard Management Controller)の電力制御部のCPUを最低レベルのクロックに落とし、消費電力を抑える(矢印A2参照)。BMCは、自身が搭載されたノード(自ノード)におけるハードウェアの状態を監視する監視装置である。
また、シャーシマネージャは、各ノードのBMCに消費電力上限を通知する。各ノードのBMCの電力制御部はCPUのスロットリングを徐々に開放することで、消費電力を徐々に上昇させる(矢印A3参照)。この間に、残ったPSUの供給可能電力内で電力の復旧を試みる。
シャーシマネージャは、マルチノードサーバ全体の消費電力を確認し、PSUの供給可能電力を超えそうだと判断すると、スロットリングの開放を止め(矢印A4参照)、ノードの消費電力がPSUの供給可能電力に収まるようにする。
一方、開発コストや製造コストの削減を目的として、シャーシマネージャを非搭載のサーバシステムも用いられている。このようなシャーシマネージャを非搭載のマルチノードサーバにおいては、当該マルチノードサーバに備えられた各ノードのBMCの電力制御部としての機能が、それぞれ自ノードの電力制御を行なう。
特開2012−173926号公報 特開2016−167213号公報
図8は従来のシャーシマネージャ非搭載のマルチノードサーバにおけるPSU故障発生時の処理を示すシーケンス図である。
この図8に示す従来のシャーシマネージャ非搭載のマルチノードサーバは、2つのPSU#00,#01と4つのノード#00〜#03とを備える。
このようなシャーシマネージャを非搭載のマルチノードサーバにおいて、例えばPSU#00の故障が発生すると(矢印B1参照)、PSU#01が各ノード#00〜#03に対して、電力不足の発生を通知する。
通知を受け取った各ノード#00〜#03においては、BMCの電力制御部が自ノードのCPUを最低レベルのクロックに落とし、消費電力を抑える(スロットリング:矢印B2参照)。
その後、各ノードのBMCの電力制御部は、それぞれ自ノードのCPUのスロットリングを徐々に開放し、消費電力を徐々に上昇させる(ランプアップ:矢印B3参照)。すなわち、残ったPSU#01で供給可能電力内で電力の復旧を試みる。
各ノードにおいて、それぞれ消費電力を上昇させることで、全ノードの消費電力の合計値がPSUの供給可能電力をオーバーし、残ったPSU#01による供給電力の不足が発生する(矢印B4)。
これにより、上記各ノードにおいては、同様の処理が繰り返し行なわれる。すなわち、PSU#01が各ノード#00〜#03に対して、電力不足の発生を通知する。
通知を受け取った各ノード#00〜#03においては、BMCの電力制御部が自ノードのCPUを最低レベルのクロックに落とし、消費電力を抑える(スロットリング:矢印B5参照)。
その後、各ノードのBMCの電力制御部は、それぞれ自ノードのCPUのスロットリングを徐々に開放し、消費電力を徐々に上昇させる(矢印B6参照)。すなわち、残ったPSU#01で供給可能電力内で電力の復旧を試みる。
各ノードにおいて、他のノードの消費電力を考慮することなく、それぞれ消費電力を上昇させることで、全ノードの消費電力の合計値がPSUの供給可能電力をオーバーし、残ったPSU#01による供給電力の不足が発生する。
図9は図8に示した従来のシャーシマネージャ非搭載のマルチノードサーバにおける消費電力の遷移を示す図である。
この図9に示すように、従来のシャーシマネージャ非搭載のマルチノードサーバにおいては、PSUによる供給可能電力オーバーの発生と、CPUのスロットリングとランプアップとが繰り返し行なわれる。
すなわち、PSUの保護は行なわれても、サーバの消費電力は下降と上昇を繰り返し、サーバの処理性能が安定しないという課題がある。
1つの側面では、本発明は、管理装置非搭載のマルチノードサーバにおいて安定した電力制御を実現することを目的とする。
このため、このサーバ装置は、複数のノードと、電力を供給する複数の電力供給装置と、前記複数のノードのそれぞれから読み書き可能な共用の記憶領域とを備え、前記複数のノードのそれぞれが、自ノードの消費電力情報を前記記憶領域に記憶する記録制御部と、前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する制御部とを備える。
一実施形態によれば、管理装置を備えることなく安定した電力制御を実現することができる。
第1実施形態の一例としてのマルチノードサーバの構成を模式的に示す図である。 第1実施形態の一例としてのマルチノードサーバにおけるノードのハードウェアを示す図である。 第1実施形態の一例としてのマルチノードサーバにおけるBMCのハードウェア構成を示す図である。 (a),(b)は、第1実施形態の一例としてのマルチノードサーバにおけるPSUの故障発生時の割当可能電力の決定方法を説明するための図である。 (a),(b)は、第1実施形態の一例としてのマルチノードサーバにおける電力手法を説明するためのシーケンス図である。 (a),(b)は、第2実施形態の一例としてのマルチノードサーバにおけるPSUの故障発生時の割当可能電力の決定方法を説明するための図である。 従来のマルチノードサーバにおける消費電力の遷移を示す図である。 従来のシャーシマネージャ非搭載のマルチノードサーバにおけるPSU故障発生時の処理を示すシーケンス図である 図8に示した従来のシャーシマネージャ非搭載のマルチノードサーバにおける消費電力の遷移を示す図である。
以下、図面を参照して本サーバ装置,電力制御プログラムおよび監視制御装置にかかる実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態および各変形例を組み合わせる等)して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
(I)第1実施形態の説明
(A)構成
図1は第1実施形態の一例としてのマルチノードサーバ1の構成を模式的に示す図、図2はノード10−1〜10−4のハードウェアを示す図、図3はBMC14のハードウェア構成を示す図である。
マルチノードサーバ1は、筐体2内に複数(図1に示す例では4つ)のノード10−1〜10−4を備えるサーバコンピュータ(情報処理装置)である。
なお、以下、ノードを示す符号としては、複数のノードのうち1つを特定する必要があるときには符号10−1〜10−4を用いるが、任意のノードを指すときには符号10を用いる。また、以下、ノード10−1をノード#0という場合がある。同様に、以下、ノード10−2,10−3,10−4を、それぞれノード#1,ノード#2,ノード#3という場合がある。
ノード10は、演算処理の主体となるコンピュータであり、マルチノードサーバ1における構成単位である。マルチノードサーバ1においては、筐体2内に搭載するノード10の数を増減することで、処理性能を任意に変更することができる。なお、薄板状に形成され、筐体に抜き差し可能に構成されたブレードコンピュータ(ブレードサーバ)もノード10に含んでもよい。
PSU20−1,20−2は、筐体2内に備えられた各部に電力供給を行なう電力供給装置である。なお、以下、PSUを示す符号としては、複数のPSUのうち1つを特定する必要があるときには符号20−1,20−2を用いるが、任意のPSUを指すときには符号20を用いる。また、以下、PSU20−1をPSU#0という場合があり、PSU20−2をPSU#1という場合がある。
PSU20は、各ノード10や筐体記憶領域30,FAN等40に対して電力供給を行なう。本マルチノードサーバ1においては、複数(図1に示す例では2つ)のPSU20を備えることで冗長構成を実現している。
また、PSU20は、自身に異常を検知した場合には、通信線146を介して各ノード10のBMC14に対して異常の発生および当該異常に関する情報を通知する。例えば、PSU20は、自身の電力供給能力を超えて電力供給を行なう場合には、その旨の通知を各ノード10に通知する。
FAN等40は、PSU20から供給される電力により動作する電子機器である。例えば、筐体2内に搭載された電子機器であって、この筐体2内に備えられた発熱源を冷却するFANやLED(Light Emitting Diode)等がFAN等40に相当する。また、筐体2内に搭載され、複数のノード10によって共用されるストレージ装置やディスプレイ装置等をFAN等40に含めてもよい。
筐体記憶領域30は、筐体2内に搭載され、各ノード10のBMC14のそれぞれからデータの読み出し(参照)および書き込みが可能な共用の記憶領域である。例えば、シリアル番号などの装置固有の情報やベンダー固有の情報を格納するために一般的に筐体2に搭載されるFRU(Field Replacement Unit)デバイスの不揮発性メモリやChassisIDPROMを筐体記憶領域30として用いてもよい。
筐体記憶領域30は、各ノード10のBMC14によって共用され、この筐体記憶領域30には、後述の如く、各ノード10のBMC14の電力記録部103によって消費電力情報が記録される。
ノード10は、図2に示すように、それぞれ、CPU11,メモリ12,記憶装置13およびBMC14を備える情報処理装置である。
記憶装置13は、ハードディスクドライブ(Hard Disk Drive:HDD)、SSD(Solid State Drive),ストレージクラスメモリ(Storage Class Memory:SCM)や、等の記憶装置であって、種々のデータを格納するものである。
メモリ12はROM(Read Only Memory)およびRAM(Random Access Memory)を含む記憶メモリである。メモリ12のROMには、OS(Operating System)や各種ソフトウェアプログラム,プログラム用のデータ類が書き込まれている。メモリ12上のソフトウェアプログラムは、CPU11に適宜読み込まれて実行される。また、メモリ12のRAMは、一次記憶メモリあるいはワーキングメモリとして利用される。
CPU11は、種々の制御や演算を行なう処理装置であり、メモリ12に格納されたOSやプログラムを実行することにより、種々の機能を実現する。
BMC14は、自身が搭載されたノード(自ノード)10において主にハードウェアの状態を監視する監視制御装置である。
図3に示すように、BMC14は、CPU141,メモリ142,不揮発性メモリ143およびインタフェース(I/F:Interface)144,145を備える。
インタフェース144は、通信線147を介して筐体記憶領域30と接続される通信インタフェース装置である。BMC14はこのインタフェース144を介して、筐体記憶領域30に対してデータの書き込みを行ない、また、この筐体記憶領域30からデータの読み出しを行なう。インタフェース144は、例えば、I2C(Inter-Integrated Circuit)の規格に基づいて筐体記憶領域30との間の通信を行なう。
インタフェース145は、通信線146を介してPSU20−1,20−2と接続される通信インタフェース装置である。BMC14はこのインタフェース145を介して、PSU20−1,20−2との間で通信を行なう。インタフェース145は、例えば、I2Cの規格に基づいてPSU20との間の通信を行なう。
不揮発性メモリ143は、半導体記憶素子を有する記憶装置であって、ノード10のハードウェアの監視機能を実現する監視制御プログラムや、このプログラムの実行に用いられる種々のデータを格納するものである。この監視制御プログラムには、自ノード10への供給電力を制御する電力制御プログラムが含まれる。
メモリ142は、BMC10の主記憶装置として使用される。メモリ142には、CPU141に実行させるOSやアプリケーションプログラムの少なくとも一部が不揮発性メモリ143から読み出され、一時的に格納される。また、メモリ142には、CPU141による処理に必要な各種データが格納される。
メモリ142上のアプリケーションプログラムは、CPU141に適宜読み込まれて実行される。また、メモリ142は、一次記憶メモリあるいはワーキングメモリとして利用される。
CPU141は、種々の制御や演算を行なう処理装置であり、メモリ142に格納されたOSやプログラムを実行することにより、種々の機能を実現する。
そして、CPU141が監視制御プログラムを実行することで、図1に示す電力監視部101,電力制御部102および電力記録部103としての機能が実現される。
なお、これらの電力監視部101,電力制御部102および電力記録部103としての機能を実現するためのプログラム(電力制御プログラム)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
電力監視部101,電力制御部102および電力記録部103としての機能を実現する際には、内部記憶装置(本実施形態ではBMC14のメモリ142や不揮発性メモリ143)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではBMC14のCPU141)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
電力監視部101は、PSU20から筐体2の全体での電力消費量(全体消費電力)を取得する。また、電力監視部101は、自ノード10の電力消費量(消費電力)を取得する。電力監視部101は、自ノード10の消費電力を、自身で求めてもよく、また、PSU20から取得してもよい。
なお、BMC14における自ノード10の電力消費量の取得は、既知の種々の手法を用いて実現することができ、その説明は省略する。
また、以下、これらの筐体2の全体消費電力および自ノード10の電力消費量を消費電力情報という場合がある。また、この消費電力情報は、当該マルチノードサーバ1における電力消費状況を示す。すなわち、以下、消費電力情報を電力消費状況という場合がある。
電力記録部103は、電力監視部101によって取得された消費電力情報(筐体2の消費電力および自ノード10の消費電力量)を筐体記憶領域30に記録する。電力記録部103は、記録制御部に相当する。
電力記録部103は、定期的(例えば、1秒毎)に消費電力情報を筐体記憶領域30に記録する。
また、電力記録部103は、消費電力情報を筐体記憶領域30に記録する際に、消費電力情報が更新されたことを示す更新判別情報を、消費電力情報とともに筐体記憶領域30に記録する。更新判別情報は、筐体記憶領域30において消費電力情報に対応付けて記録される。
更新判別情報としては、例えば、電力記録部103が消費電力情報を筐体記憶領域30に記録した日時を示す更新時刻情報(タイムスタンプ)を含んでもよく、この更新時刻情報は消費電力情報に対応付けて筐体記憶領域30に記録される。
この更新時刻情報を参照することで、対応する消費電力情報が記録された日時(時刻)を把握することができ、また、消費電力情報が電力記録部103により更新されたことを把握することができる。
また、更新判別情報は、筐体記憶領域30に記録する消費電力情報に基づいて生成するエラー検出情報を含んでもよい。本マルチノードサーバ1においては、エラー検出情報として、誤り検出符号の1種であるチェックサムを用いる例を示す。すなわち、電力記録部103は、消費電力情報に基づいてチェックサムを作成する機能を有する。なお、チェックサムの作成は既知の種々の手法で実現することができ、その説明は省略する。このチェックサムは消費電力情報に対応付けて筐体記憶領域30に記録される。
例えば、筐体記憶領域30に記録された消費電力情報に基づいてチェックサムを算出し、算出したチェックサムの値を、筐体記憶領域30に記録されたチェックサムと比較することで、このチェックサムに対応する消費電力情報が更新された値であることを把握することができる。
筐体記憶領域30の初期値は不定値である。筐体記憶領域30から読み出したチェックサムの値が、消費電力情報に基づいて算出したチェックサムと不一致である場合には、当該消費電力情報が未更新であり、初期値のままであると判断することができる。
本マルチノードサーバ1においては、各BMC14の電力記録部103は、消費電力情報と更新時刻情報とチェックサムとを筐体記憶領域30に記録する。電力記録部103は、筐体記憶領域30における特定の記憶領域にこれらの消費電力情報と更新時刻情報とチェックサムとを相互に対応付けて記録してもよい。
なお、電力記録部103は、自ノード10が電源投入状態(パワーオン時)にのみ、消費電力情報と更新時刻情報とチェックサムとを筐体記憶領域30に記録する。
また、電力記録部103は、ノード10の電力消費量として、PSU20等の故障直前の消費電力や故障前の平均の使用電力を消費電力情報として記録してもよい。また、電力記録部103は、過去の自ノード10の使用実績等から予測した今後の電力消費量を消費電力情報として用いてもよい。
消費電力情報および更新判別情報は、筐体記憶領域30においてノード10毎に設けられた所定の領域に記録されることが望ましい。
電力制御部102は、PSU20の故障等によりPSU20による供給可能電力が不足する場合に、筐体記憶領域30から筐体2の電力消費状況を取得し、残った正常なPSU(正常電力供給装置)20から供給される供給可能電力のうち自ノード10で使用可能な電力を決定する。
なお、このような、残った正常なPSU20から供給される供給可能電力のうち自ノード10で使用可能な電力は、自ノード10に対して割り当てられる割当電力に相当する。また、残った正常なPSU20から供給される供給可能電力のうち自ノード10で使用可能な電力は、自ノード10において消費できる消費電力ということもできる。
電力制御部102は、決定した自ノード10への割当電力に相当する電力が供給されるように、PSU20およびBMC14の制御を行なう。なお、この決定された割当電力が自ノード10に供給されるようにする制御は既知であり、その説明は省略する。
図4(a),(b)は第1実施形態の一例としてのマルチノードサーバ1におけるPSU20の故障発生時の割当可能電力の決定方法を説明するための図であり、図4(a)は故障発生前の状態を示し、図4(b)は故障発生後の状態を示す。
図4(a)に例示する状態においては、PSU#0,#1はそれぞれ1000Wの電力を供給可能であり、全体で2000Wが供給可能電力となっている。また、ノード#0,#1,#2,#3がそれぞれ動作中(パワーオン中)であり、各消費電力がそれぞれ250W,250W,1000W,0Wである。なお、ノード#3は未使用(パワーオフ中)の状態である。また、FAN等40の消費電力が200Wである。
以下においては、本マルチノードサーバ1に備えられた2つのPSU20のうち、一つのPSU20が故障して供給電力が不足した例について示す。
図4(b)に例示する状態においては、PSU#1に故障が発生し、これにより、PSU#0により供給される1000Wが故障発生後の全体での供給可能電力となっている。
このような場合に、動作中のノード#0〜#2のBMC14において、各電力制御部102は、先ず、自ノード10のCPU141をそれぞれ最低レベルのクロックに落とすことで消費電力を抑える。
その後、各電力制御部102は、それぞれ以下の(処理1)〜(処理4)に従って自ノード10の消費電力、すなわち、1ノードあたりの割当電力を算出する。
(処理1)筐体記憶領域30から、各ノード10の電力記録部103が記録した消費電力を取得する。
(処理2)ノード10に割当可能な電力を算出する。
本マルチノードサーバ1においては、動作中のノード10のほか、FAN等40も電力を消費する。
そこで、電力制御部102は、FAN等40が消費する電力を、筐体2全体の消費電力から各ノード10の消費電力の総和を減算することで求める。以下、FAN等40が消費する電力を[その他の消費電力]という場合がある。この[その他の消費電力]の算出は、いずれのPSU20においても故障が検出されていない状態(正常動作状態)で予め行なっておくことが望ましい。
1つのPSU20(図4に示す例ではPSU#1)に故障が発生した場合に、電力制御部102は、残ったPSU20(図4に示す例ではPSU#0)が供給可能な電力のうち、動作中(パワーオン中)のノード10全体に割当可能な電力を、以下の式(1)により求める。
[割当可能な電力]=[故障後の供給可能電力]−[その他の消費電力]・・・(1)
図4(a)に示す例においては、[故障後の供給可能電力]= 1000Wであり、[その他の消費電力]=200Wである。従って、パワーオン中のノード10全体に割り当て可能な電力は以下のとおりである。
[割当可能な電力]= 1000W − 200W = 800W
(処理3)各ノードへの割当電力の計算
電力制御部102は、割当可能な電力をパワーオン中のノード10で分配した値を各ノード10への割当電力とする。また、ノード10間における電力配分は、パワーオン中であり、筐体記憶領域30において消費電力情報が正常に更新されている各ノード10に対して行なわれ、これらのノード10の消費電力の割合に基づいて決定する。これにより、
電力制御部102は、自ノード10に対する割当電力を取得する。
すなわち、電力制御部102は、割当可能な電力を、故障発生前における各ノードの消費電力に応じて比例配分(案分)することで、各ノードへの供給可能電力を決定する。
このため、電力制御部102は、筐体記憶領域30において消費電力情報が正常に更新された値であるかを判断(判別)する更新判別機能を有する。消費電力情報が正常に更新されていないと判断した場合には、当該消費電力情報に対応するノード10は正常に動作していないと考えられる。そこで、電力制御部102は、当該消費電力情報を処理対象外とし、また、この消費電力情報に対応するノード10を動作中のノード10ではないものとして取り扱う。
なお、この筐体記憶領域30において消費電力情報が正常に更新された値であるかの判別手法については後述する。
図4(a),(b)に示す例においては、ノード#0〜#2が電力の割当対象(配分対象)であり、ノード#3は割当対象外となる。
図4(a)に示す例においては、パワーオン中のノード#0〜#2における1ノードあたりの消費電力の割合(比率)は以下のとおりである。
ノード#0:ノード#1:ノード#2=250W:250W:1000W=1:1:4
この比率に基づいて、[割当可能な電力]である800W をパワーオン中のノード#0〜#2間で配分すると、以下のとおりとなる。
ノード#0:ノード#1:ノード#2=133W:133W:533W
電力制御部102は、このようにして求めた割当電力に基づき、自ノード10に対して配分される割当電力を取得する。
(処理4)電力制御部102は、自ノード10のCPU141のスロットリングを徐々に開放し、上述の如く算出した自ノード10に対する割当電力に到達するまで消費電力を徐々に上昇させる。
次に、電力制御部102による、筐体記憶領域30において消費電力情報が正常に更新された値であるかの判別手法について説明する。
筐体記憶領域30に対する書き込みは、ノード10が筐体2に搭載された状態でのみ行なわれる。また筐体記憶領域30の初期値は不定値である。
電力制御部102が、ノード10の電力制御モードによって正しく記録された消費電力情報以外の情報を用いて上述の手法に従って1ノードあたりの割当電力を算出すると、不正な値が計算に用いられ、間違った計算結果となってしまう。
そのため、本マルチノードサーバ1においては、該当のノード10に対する消費電力情報が、例えば、筐体2に未搭載のノード10についての不正値であるのか、筐体2に搭載されたノード10より更新済みの正規値であるのか判別することが重要である。
例えば、電力制御部102は、以下に示す手法(i)〜(iii)のいずれかを用いて、筐体記憶領域30に記録された更新判別情報に基づいて、各ノード10がパワーオン中であるかを判断する。
(i)タイムスタンプを用いる手法
電力制御部102は、筐体記憶領域30からの消費電力情報の読み出し時に、この消費電力情報に付加されているタイムスタンプ(更新時刻情報)を読み出す。
電力制御部102は、自ノード10が有する時刻情報(現在時刻)と、消費電力情報に付されたタイムスタンプ(更新時刻情報)とを比較する。この比較の結果、タイムスタンプの時刻と自ノード10の有する現在時刻とが所定の閾値以上離れている場合に、当該消費電力情報は正常に更新されていない(未更新である)と判断することができる。
例えば、電力記録部103が1秒毎に筐体記憶領域30の消費電力情報を更新する設定となっている状況において、10秒以上消費電力情報の更新がされていない場合には、当該消費電力情報は正常に更新されていないと判断することができる。
(ii)チェックサムを用いる手法
電力制御部102は、筐体記憶領域30からの消費電力情報の読み出し時に、この消費電力情報に付加されているチェックサム(更新時刻情報,エラー検出情報)を読み出す。
電力制御部102は、筐体記憶領域30から読み出した消費電力情報に基づいてチェックサムを作成し、この作成したチェックサムと、筐体記憶領域30に記録された消費電力情報に付されたチェックサムとを比較する。この比較の結果、自身が作成したチェックサムと、筐体記憶領域30から読み出したチェックサムとが不一致である場合に、当該消費電力情報は正常に更新されていない(未更新である)と判断することができる。例えば、筐体記憶領域30から読み出した消費電力情報の値は、不定値である初期値のままであると考えられる。
(iii)消費電力情報の変化を用いる手法
電力制御部102は、筐体記憶領域30から消費電力情報の読み出しを所定の間隔(例えば、1秒毎)で複数回繰り返して行なう。この消費電力情報の読み出しを所定の時間継続して行なう。
電力の特性上、消費電力がずっと同じ値を示すことはほぼない。そこで、所定の時間内において、複数回読んだ消費電力情報の値が変化しない場合、すなわち、毎回同じ値を示す場合は、当該消費電力情報は正常に更新されていない(未更新である)と判断することができる。
なお、これらの手法(i)〜(iii)は、少なくとも2つ以上の手法を併用してもよい。また、例えば、手法(iii)を、手法(i)または手法(ii)を用いることができない場合の代用手段として用いてもよい。例えば、筐体記憶領域30から消費電力情報だけしか読み出せず、更新判別情報(タイムスタンプ,チェックサム)を読み出すことができない場合に、手法(iii)を用いてもよい。
電力制御部102は、上述した判別手法によって、筐体記憶領域30の消費電力情報が未更新と判断した場合に、そのノード10をパワーオフ状態とみなし、割当電力の分配の対象外とする。
(B)動作
上述の如く構成された第1実施形態の一例としてのマルチノードサーバ1における電力手法を、図5(a),(b)に示すシーケンス図に従って説明する。なお、図5(a)は本マルチノードサーバ1における通常時の処理を示し、図5(b)は本マルチノードサーバ1においてPSU#1が故障し電力不足が発生した電力不足時の処理を示す。
また、この図5(a),(b)においては、便宜上、マルチノードサーバ1に備えられた複数のノード10(BMC14)のうち、1つのノード10(BMC14)について示す。
先ず、本第1実施形態のマルチノードサーバ1における通常時、すなわち、電力不足が発生していない状態での処理を説明する。
通常時においては、図5(a)に示すように、ノード10のBMC14において、電力監視部101は、各PSU#0,#1から当該マルチノードサーバ1における全体消費電力を取得する(矢印C1,C2参照)。また、電力監視部101は、自ノード10の消費電力を取得する。
電力記録部103は、電力監視部101から電力監視部101が取得した全体消費電力および自ノード10の消費電力を、消費電力情報として取得する(矢印C3参照)。そして、電力記録部103は、取得した消費電力情報および更新判別情報を筐体記憶領域30に記録する(矢印C4参照)。
以上の処理は、本マルチノードサーバ1において定期的(例えば、1秒毎)に実施される。
次に、本本第1実施形態のマルチノードサーバ1における電力不足の発生時の処理を説明する。
本マルチノードサーバ1において、PSU20(図5に示す例ではPSU#1)の故障が発生すると、PSU#0が各ノード10のBMC14(電力制御部102)に対して、故障および電力不足の発生を通知する(矢印C5参照)。
通知を受け取った各ノード10においては、電力制御部102が、自ノードのCPUを最低レベルのクロックに落とし、消費電力を抑える(スロットリング:矢印C6参照)。
その後、電力制御部102は、筐体記憶領域30から消費電力情報および更新判別情報を取得する(矢印C7参照)。すなわち、電力制御部102は、筐体記憶領域30から、各ノード10の電力記録部103が記録した消費電力情報および更新判別情報を取得する
電力制御部102は、取得した消費電力情報および更新判別情報を用いて、各ノードへの割当電力の計算を行なう。
すなわち、電力制御部102は、動作中のノード10全体へ割当可能な電力を求め、この割当可能な電力を、パワーオン中のノード10に対して、各ノード10の消費電力の割合に応じて分配することで、各ノード10への割当電力を決定する(矢印C8参照)。
その後、電力制御部102は、それぞれ自ノードのCPUのスロットリングを徐々に開放し、自ノード10への割当電力に到達するまで消費電力を上昇させる(ランプアップ:矢印C9参照)。
(C)効果
このように、第1実施形態の一例としてのマルチノードサーバ1によれば、複数のノード10への電力供給を管理する管理装置(シャーシマネージャ)を備えることなく、各ノード10において自律的に消費電力量を制御することができる。また、シャーシマネージャを構成から省略することができるので、製造コストおよび運用コストを低減することができる。
本マルチノードサーバ1に備えられる各ノード10のBMC14において、電力監視部101が取得した筐体2の全体消費電力および自ノード10の消費電力を示す消費電力情報と更新判別情報とを、電力記録部103が筐体記憶領域30に記録する。
これにより、各ノード10についての消費電力情報および更新判別情報を筐体2内の複数のノード10(BMC14)で共用することができる。
そして、いずれかのPSU20に障害発生した場合に、各BMC14において電力制御部102が、自ノードのCPUを最低レベルのクロックに落とし、消費電力を抑えた後、筐体記憶領域30から取得した消費電力情報および更新判別情報を用いて、各ノード10への割当電力を決定する。
この際、電力制御部102が、筐体2全体の消費電力からFAN等40によるその他の消費電力情報を減算することで、残ったPSU20によって供給される電力のうち、動作中の複数のノード10に割当可能な電力を容易に求めることができる。
そして、電力制御部102が、動作中の複数のノード10に割当可能な電力を、パワーオン中のノード10に対して、各ノード10の正常動作時の消費電力の割合に応じて分配することで、各ノード10への割当電力を決定する。これにより、マルチノードサーバ1における複数のノード10に対して、各ノード10の稼働状況に応じた電力を配分することができ、効率的な電力配分を行なうことができる。
その後、電力制御部102は、それぞれ自ノードのCPUのスロットリングを徐々に開放し、自ノード10への割当電力に到達するまで供給電力を上昇させて動作させる。
このように電力制御部102は、自ノード10に対して、当該自ノード10への割当電力を超えない範囲で電力供給を行なうことで、残ったPSU20からに過負荷を与えることなく、安定した電力供給を行なうことができる。
(II)第2実施形態の説明
上述した第1実施形態のマルチノードサーバ1においては、電力制御部102は、PSU20の故障前における複数のノード10間での消費電力比率に基づいて、各ノード10への割当電力を計算している。この場合に、PSU20の故障前にアイドル(IDLE)中のノード10があった場合、PSU20の故障後に割り当てられる電力はそのノード10の動作可能電力を下回るおそれがある。
そこで、本第2実施形態の一例としてのマルチノードサーバ1においては、各ノード10の必要最低消費電力を用いて、いずれかのPSU20に障害発生した場合の各ノード10への電力供給量が各ノード10の必要最低消費電力を下回ることがないように制御する。
すなわち、各ノード10は必要最低電力以下では動作できないため、電力制御部102は、各ノード10への割当電力が当該ノード10の必要最低消費電力を下回らないように必要最低電力を各ノード10に確保する。
具体的には本第2実施形態のマルチノードサーバ1においては、各ノード10のBMC14において電力記録部103は、消費電力情報と更新判別情報に加えて、自ノード10の必要最低電力を筐体記憶領域30に書き込む。
なお、このノード10の必要最低電力は、例えば、スロットリング時における消費電力を用いてもよい。また、ノード10の必要最低電力を、当該マルチノードサーバ1を構成する各構成部品の必要最低消費電力を加算することで求めてもよく、既知の種々の手法を用いて得ることができる。
また、電力制御部102は、各ノード10への割当電力の計算を行なう際に、各ノード10の必要最低消費電力の総計(以下、ノード必要最低消費電力総計)を求め、パワーオン中のノード10に割り当て可能な電力からこのノード必要最低消費電力総計を減算した電力量を、比率分配可能な消費電力として算出する。
そして、電力制御部102は、この比率分配可能な消費電力を、パワーオン中のノード10に対して、各ノード10の消費電力の割合に応じて分配することで、各ノード10への割当電力を決定する。
なお、本変形例のマルチノードサーバ1は、以下に示す電力監視部101,電力制御部102および電力記録部103による各処理以外の部分については、前述した一実施形態のマルチノードサーバ1と同様に構成されている。
図6(a),(b)は第2実施形態の一例としてのマルチノードサーバ1におけるPSU20の故障発生時の割当可能電力の決定方法を説明するための図であり、図6(a)は故障発生前の状態を示し、図6(b)は故障発生後の状態を示す。
図6(a)に例示する状態においては、PSU#0,#1はそれぞれ1000Wの電力を供給可能であり、全体で2000Wが供給可能電力となっている。また、ノード#0,#1,#2,#3がそれぞれ動作中(パワーオン中)であり、各消費電力がそれぞれ250W,250W,1000W,0Wである。なお、ノード#3は未使用(パワーオフ中)の状態である。また、FAN等40の消費電力が200Wである。
また、ノード#0,#1,#2,#3の各必要最低消費電力がそれぞれ150W,150W,300W,0Wである。なお、ノード#3は使用しないものとする。
以下においては、本マルチノードサーバ1に備えられた2つのPSU20のうち、一つのPSU20が故障して供給電力が不足した例について示す。
図6(b)に例示する状態においては、PSU#1に故障が発生し、これにより、PSU#0により供給される1000Wが故障発生後の全体での供給可能電力となっている。
このような場合に、動作中のノード#0〜#2のBMC14において、各電力制御部102は、先ず、自ノード10のCPU141をそれぞれ最低レベルのクロックに落とすことで消費電力を抑える。
その後、各電力制御部102は、それぞれ以下の(処理11)〜(処理16)に従って自ノード10の消費電力、すなわち、1ノードあたりの割当電力を算出する。
(処理11)筐体記憶領域30から、各ノード10の電力記録部103が記録した消費電力および必要最低消費電力を取得する。
(処理12)ノード10に割当可能な電力を算出する。
電力制御部102は、FAN等40が消費する電力(その他の消費電力)を、筐体2全体の消費電力から各ノード10の消費電力の総和を減算することで求める。
1つのPSU20(図6に示す例ではPSU#1)に故障が発生した場合に、電力制御部102は、残ったPSU20(図6に示す例ではPSU#0)が供給可能な電力のうち、動作中(パワーオン中)のノード10全体に割当可能な電力を、以下の式(1)により求める。
[割当可能な電力]=[故障後の供給可能電力]−[その他の消費電力]・・・(1)
図6(a)に示す例においては、[故障後の供給可能電力]= 1000Wであり、[その他の消費電力]=200Wである。従って、パワーオン中のノード10に割り当て可能な電力は以下のとおりである。
[割当可能な電力]= 1000W − 200W = 800W
(処理13)ノード必要最低消費電力総計の計算
電力制御部102は、各ノード10の必要最低消費電力を合計することでノード必要最低消費電力総計を算出する。
図6(a)に示す例においては、ノード#0,#1,#2,#3の各必要最低消費電力がそれぞれ150W,150W,300W,0Wであるので、ノード必要最低消費電力総計は以下の式により求められる。
[ノード必要最低消費電力総計]= 150W + 150W + 300W = 600W
(処理14)ノード10に比率分配可能な電力を算出する。
電力制御部102は、[割当可能な電力]から[ノード必要最低消費電力総計]を減算することで動作中(パワーオン中)のノード10全体に分配可能な電力(比率分配可能な電力:分配対象電力)を算出する。
図6(a)に示す例においては、比率分配可能な電力は以下の式(2)により求められる。
[比率分配可能な電力]=[割当可能な電力]−[ノード必要最低消費電力総計]
・・(2)
=800W − 600W = 200W
(処理15)比率分配可能な電力の分配量の計算
電力制御部102は、上述の如く求めた比率分配可能な電力を、パワーオン中であり、筐体記憶領域30において消費電力情報が正常に更新されている各ノード10に対して分配するための、各ノード10に対する分配量を計算する。この分配量の計算は、パワーオン中であり、筐体記憶領域30において消費電力情報が正常に更新されているノード10の消費電力の割合に基づいて決定する。
図6(a),(b)に示す例においては、ノード#0〜#2が電力の割当対象(配分対象)であり、ノード#3は割当対象外となる。
図6(a)に示す例においては、パワーオン中のノード#0〜#2における1ノードあたりの割当電力の割合(比率)は以下のとおりである。
ノード#0:ノード#1:ノード#2=250W:250W:1000W=1:1:4
この比率に基づいて、[比率分配可能な電力]である200W をパワーオン中のノード#0〜#2間で配分することで、各ノード10への分配電力を求める。
すなわち、電力制御部102は、比例分配可能な電力を、故障前における各ノードの消費電力に応じて比例配分(案分)することで決定する。各ノード10への分配電力は以下のとおりとなる。
ノード#0:ノード#1:ノード#2=33W:33W:133W
(処理16)各ノード10への割当電力の計算
電力制御部102は、各ノード10に対して求めた分配電力を、各ノード10の必要最低消費電力に加算することで、各ノード10への割当電力を算出する。
すなわち、前述の如く、ノード#0,#1、#2の各必要最低消費電力がそれぞれ150W,150W,300Wであるので、これらに前述の如く求めた分配電力を加算することで、各ノード10への割当電力は、以下のように求められる。
ノード#0:150W +33W = 183W
ノード#1:150W +33W = 183W
ノード#2:300W +133W = 433W
ノード#3:0W
電力制御部102は、このようにして求めた割当電力に基づき、自ノード10に対して配分される割当電力を取得する。
このように、本発明の第2実施形態としてのマルチノードサーバ1によれば、上述した第1実施形態と同様の作用効果を得ることができる他、一部のPSU20に故障が生じた場合であっても、各ノード10への割当電力が当該ノード10の必要最低消費電力を下回ることがないので、各ノード10をより安定して動作させることができる。
(III)その他
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
例えば、上述した各実施形態においては、マルチノードサーバ1に2つのPSU20を備えた例を示しているが、これに限定されるものではなく、3つ以上のPSU20を備えてもよい。
このように3つ以上のPSU20が備えられ、その一部のPSU20に故障等が生じた場合には、各ノード10の電力制御部102は、残ったPSU20の供給可能電力の合計を、動作中のノード10に配分するよう割当電力を求める。
また、上述した各実施形態においては、マルチノードサーバ1に4つのノード10を備えた例を示しているが、これにされるものではなく、3つ以下または5つ以上のノード10を備えてもよい。
さらに、上述した各実施形態においては、更新判別情報として、筐体記憶領域30に記録する消費電力情報に基づいて生成するチェックサムを用いる例を示しているが、これに限定されるものではない。すなわち、エラー検出情報としてチェックサム以外の情報を用いてもよい。例えば、更新判別情報として消費電力情報にハッシュ関数を適用して算出するハッシュ値を用いてもよく、種々変形して実施することができる。
なお、例えば、電力記録部103が筐体記憶領域30に消費電力情報等を記録する前にPSU20に故障が生じた場合には、BMC14がスロットリングにより自ノード10のCPU11のクロックを低下させて消費電力を低減させた後、消費電力を徐々に上昇させるランプアップを行なう。
そして、このランプアップの過程において、電力記録部103が消費電力情報や更新判別情報等を筐体記憶領域30に格納する。その後、PSU20より供給電力異常が通知された場合に、この筐体記憶領域30に格納された消費電力情報や更新判別情報を用いることで、上述した各実施形態の制御を実現することができるのである。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
(IV)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
複数のノードと、
電力を供給する複数の電力供給装置と、
前記複数のノードのそれぞれから読み書き可能な共用の記憶領域とを備え、
前記複数のノードのそれぞれが、
自ノードの消費電力情報を前記記憶領域に記憶する記録制御部と、
前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する制御部と
を備えることを特徴とする、サーバ装置。
(付記2)
前記制御部が、
前記正常電力供給装置から供給可能な供給可能電力を、動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することで、前記ノードへの供給電力を決定する
ことを特徴とする付記1記載のサーバ装置。
(付記3)
前記制御部が、
前記正常電力供給装置から供給可能な供給可能電力から動作中の前記ノードの各必要最低消費電力の総和を減算して求める分配対象電力を、前記動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することでノード毎の分配電力を求め、前記分配電力を、各ノードの必要最低消費電力に加算することで、前記ノードへの供給電力を決定する
ことを特徴とする、付記1記載のサーバ装置。
(付記4)
前記記録制御部が、
前記消費電力情報を前記記録領域に記録する際に、前記記録時刻を示す時刻情報を前記記録領域に記録し、
前記制御部が、
前記記録領域から読み出した前記時刻情報の示す値と現在時刻との時間差が閾値以上である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
ことを特徴とする、付記2または3記載のサーバ装置。
(付記5)
前記記録制御部が、
前記消費電力情報を前記記録領域に記録する際に、前記消費電力情報に基づいて作成したエラー検出情報を前記記録領域に記録し、
前記制御部が、
前記記録領域から読み出したエラー検出情報と、前記記憶領域から読み出した前記消費電力情報に基づいて作成したエラー検出情報とが不一致である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
ことを特徴とする、付記2〜4のいずれか1項に記載のサーバ装置。
(付記6)
前記制御部が、
前記記録領域から前記時刻情報を所定間隔で繰り返し読み出し、この読み出した前記時刻情報の値に変化がない場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
ことを特徴とする、付記2〜5のいずれか1項に記載のサーバ装置。
(付記7)
複数のノードと、電力を供給する複数の電力供給装置とを備えたサーバシステムにおいて、前記複数のノードに備えられたプロセッサに、
自ノードの消費電力情報を、前記複数のノードのそれぞれから読み書き可能な共用の記憶領域に記憶し、
前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する
処理を実行させる、電力制御プログラム。
(付記8)
前記正常電力供給装置から供給可能な供給可能電力を、動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することで、前記ノードへの供給電力を決定する
処理を前記プロセッサに実行させる付記7記載の電力制御プログラム。
(付記9)
前記正常電力供給装置から供給可能な供給可能電力から動作中の前記ノードの各必要最低消費電力の総和を減算して求める分配対象電力を、前記動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することでノード毎の分配電力を求め、前記分配電力を、各ノードの必要最低消費電力に加算することで、前記ノードへの供給電力を決定する
処理を前記プロセッサに実行させる付記7記載の電力制御プログラム。
(付記10)
前記消費電力情報を前記記録領域に記録する際に、前記記録時刻を示す時刻情報を前記記録領域に記録させ、
前記記録領域から読み出した前記時刻情報の示す値と現在時刻との時間差が閾値以上である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
処理を前記プロセッサに実行させる、付記8または9記載の電力制御プログラム。
(付記11)
前記消費電力情報を前記記録領域に記録する際に、前記消費電力情報に基づいて作成したエラー検出情報を前記記録領域に記録させ、
前記記録領域から読み出したエラー検出情報と、前記記憶領域から読み出した前記消費電力情報に基づいて作成したエラー検出情報とが不一致である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
処理を前記プロセッサに実行させる、付記8〜10のいずれか1項に記載の電力制御プログラム。
(付記12)
前記記録領域から前記時刻情報を所定間隔で繰り返し読み出し、この読み出した前記時刻情報の値に変化がない場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
処理を前記プロセッサに実行させる、付記8〜11のいずれか1項に記載の電力制御プログラム。
(付記13)
複数のノードと、電力を供給する複数の電力供給装置とを備えたサーバシステムにおいて、前記複数のノードのそれぞれに備えられる監視制御装置であって、
自ノードの消費電力情報を前記複数のノードのそれぞれから読み書き可能な共用の記憶領域に記憶する記録制御部と、
前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する制御部と
を備えることを特徴とする、監視制御装置。
(付記14)
前記制御部が、
前記正常電力供給装置から供給可能な供給可能電力を、動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することで、前記ノードへの供給電力を決定する
ことを特徴とする付記13記載の監視制御装置。
(付記15)
前記制御部が、
前記正常電力供給装置から供給可能な供給可能電力から動作中の前記ノードの各必要最低消費電力の総和を減算して求める分配対象電力を、前記動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することでノード毎の分配電力を求め、前記分配電力を、各ノードの必要最低消費電力に加算することで、前記ノードへの供給電力を決定する
ことを特徴とする、付記13記載の監視制御装置。
(付記16)
前記記録制御部が、
前記消費電力情報を前記記録領域に記録する際に、前記記録時刻を示す時刻情報を前記記録領域に記録し、
前記制御部が、
前記記録領域から読み出した前記時刻情報の示す値と現在時刻との時間差が閾値以上である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
ことを特徴とする、付記14または15記載の監視制御装置。
(付記17)
前記記録制御部が、
前記消費電力情報を前記記録領域に記録する際に、前記消費電力情報に基づいて作成したエラー検出情報を前記記録領域に記録し、
前記制御部が、
前記記録領域から読み出したエラー検出情報と、前記記憶領域から読み出した前記消費電力情報に基づいて作成したエラー検出情報とが不一致である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
ことを特徴とする、付記14〜16のいずれか1項に記載の監視制御装置。
(付記18)
前記制御部が、
前記記録領域から前記時刻情報を所定間隔で繰り返し読み出し、この読み出した前記時刻情報の値に変化がない場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
ことを特徴とする、付記14〜17のいずれか1項に記載の監視制御装置。
1 マルチノードサーバ
2 筐体
10−1〜10−4,10 ノード
11,141 CPU
12,142 メモリ
13 記憶装置
14 BMC
20−1,20−2,20 PSU
30 筐体記憶領域
40 FAN等
101 電力監視部
102 電力制御部
103 電力記録部
143 不揮発性メモリ
144,145 インタフェース
146,147 通信線

Claims (8)

  1. 複数のノードと、
    電力を供給する複数の電力供給装置と、
    前記複数のノードのそれぞれから読み書き可能な共用の記憶領域とを備え、
    前記複数のノードのそれぞれが、
    自ノードの消費電力情報を前記記憶領域に記憶する記録制御部と、
    前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する制御部と
    を備えることを特徴とする、サーバ装置。
  2. 前記制御部が、
    前記正常電力供給装置から供給可能な供給可能電力を、動作中の前記ノードの消費電力の割合に応じて動作中のノード10に配分することで、前記ノードへの供給電力を決定する
    ことを特徴とする請求項1記載のサーバ装置。
  3. 前記制御部が、
    前記正常電力供給装置から供給可能な供給可能電力から動作中の前記ノードの各必要最低消費電力の総和を減算して求める分配対象電力を、前記動作中の前記ノードの消費電力の割合に応じて動作中のノードに配分することでノード毎の分配電力を求め、前記分配電力を、各ノードの必要最低消費電力に加算することで、前記ノードへの供給電力を決定する
    ことを特徴とする、請求項1記載のサーバ装置。
  4. 前記記録制御部が、
    前記消費電力情報を前記記録領域に記録する際に、前記記録時刻を示す時刻情報を前記記録領域に記録し、
    前記制御部が、
    前記記録領域から読み出した前記時刻情報の示す値と現在時刻との時間差が閾値以上である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
    ことを特徴とする、請求項2または3記載のサーバ装置。
  5. 前記記録制御部が、
    前記消費電力情報を前記記録領域に記録する際に、前記消費電力情報に基づいて作成したエラー検出情報を前記記録領域に記録し、
    前記制御部が、
    前記記録領域から読み出したエラー検出情報と、前記記憶領域から読み出した前記消費電力情報に基づいて作成したエラー検出情報とが不一致である場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
    ことを特徴とする、請求項2〜4のいずれか1項に記載のサーバ装置。
  6. 前記制御部が、
    前記記録領域から前記時刻情報を所定間隔で繰り返し読み出し、この読み出した前記時刻情報の値に変化がない場合に、前記消費電力情報に対応するノードを動作中のノードではないものとして取り扱う
    ことを特徴とする、請求項2〜5のいずれか1項に記載のサーバ装置。
  7. 複数のノードと、電力を供給する複数の電力供給装置とを備えたサーバシステムにおいて、前記複数のノードに備えられたプロセッサに、
    自ノードの消費電力情報を、前記複数のノード10のそれぞれから読み書き可能な共用の記憶領域に記憶し、
    前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する
    処理を実行させる、電力制御プログラム。
  8. 複数のノードと、電力を供給する複数の電力供給装置とを備えたサーバシステムにおいて、前記複数のノードのそれぞれに備えられる監視制御装置であって、
    自ノードの消費電力情報を前記複数のノードのそれぞれから読み書き可能な共用の記憶領域に記憶する記録制御部と、
    前記複数の電力供給装置のうち一部の電力供給装置に異常が検出された場合に、前記記憶領域から前記消費電力情報を読み出し、当該消費電力情報に基づいて、前記複数の電力供給装置のうち異常が検出されていない正常電力供給装置から自ノードへの供給電力を制御する制御部と
    を備えることを特徴とする、監視制御装置。
JP2018127264A 2018-07-04 2018-07-04 サーバ装置,電力制御プログラムおよび監視制御装置 Active JP7131136B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018127264A JP7131136B2 (ja) 2018-07-04 2018-07-04 サーバ装置,電力制御プログラムおよび監視制御装置
US16/459,664 US11073883B2 (en) 2018-07-04 2019-07-02 Server apparatus, monitoring control apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018127264A JP7131136B2 (ja) 2018-07-04 2018-07-04 サーバ装置,電力制御プログラムおよび監視制御装置

Publications (2)

Publication Number Publication Date
JP2020008971A true JP2020008971A (ja) 2020-01-16
JP7131136B2 JP7131136B2 (ja) 2022-09-06

Family

ID=69102612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018127264A Active JP7131136B2 (ja) 2018-07-04 2018-07-04 サーバ装置,電力制御プログラムおよび監視制御装置

Country Status (2)

Country Link
US (1) US11073883B2 (ja)
JP (1) JP7131136B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021115144A (ja) * 2020-01-23 2021-08-10 株式会社三共 遊技機
JP2021115145A (ja) * 2020-01-23 2021-08-10 株式会社三共 遊技機
JP7452259B2 (ja) 2020-06-02 2024-03-19 富士通株式会社 半導体装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11132041B2 (en) * 2020-02-05 2021-09-28 Dell Products L.P. Power supply with management interface and method therefor
JP7312141B2 (ja) * 2020-05-25 2023-07-20 ルネサスエレクトロニクス株式会社 半導体装置
CN113448418A (zh) * 2021-06-29 2021-09-28 新华三云计算技术有限公司 一种设备上电方法、装置以及服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222092A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd マルチノード計算機システムのブート方法及びマルチノード計算機システム
JP2008083841A (ja) * 2006-09-26 2008-04-10 Nec Computertechno Ltd ブレードサーバ、ブレード装置、及びブレードサーバの電力管理方法
JP2012108757A (ja) * 2010-11-18 2012-06-07 Nec Corp 電力供給管理システム
JP2012173926A (ja) * 2011-02-21 2012-09-10 Nec Corp サーバシステム及び電力供給制御方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5546591A (en) * 1991-12-20 1996-08-13 Vlsi Technology, Inc. Distributed power management system for battery operated personal computers
US5628029A (en) * 1995-02-03 1997-05-06 Vlsi Technology, Inc. Apparatus for monitoring distributed I/O device by providing a monitor in each I/O device control for generating signals based upon the device status
US6968467B2 (en) * 2000-10-26 2005-11-22 Matsushita Electric Industrial Co., Ltd. Decentralized power management system for integrated circuit using local power management units that generate control signals based on common data
US7372682B2 (en) * 2004-02-12 2008-05-13 Power-One, Inc. System and method for managing fault in a power system
US9625974B2 (en) * 2013-12-23 2017-04-18 Dell Products, L.P. Global throttling of computing nodes in a modular, rack-configured information handling system
JP2016167213A (ja) 2015-03-10 2016-09-15 日本電気株式会社 ブレード装置およびブレード装置管理方法
US10372185B2 (en) * 2015-07-28 2019-08-06 Western Digital Technologies, Inc. Enhanced power control of data storage arrays
US10097572B1 (en) * 2016-06-07 2018-10-09 EMC IP Holding Company LLC Security for network computing environment based on power consumption of network devices

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222092A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd マルチノード計算機システムのブート方法及びマルチノード計算機システム
JP2008083841A (ja) * 2006-09-26 2008-04-10 Nec Computertechno Ltd ブレードサーバ、ブレード装置、及びブレードサーバの電力管理方法
JP2012108757A (ja) * 2010-11-18 2012-06-07 Nec Corp 電力供給管理システム
JP2012173926A (ja) * 2011-02-21 2012-09-10 Nec Corp サーバシステム及び電力供給制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021115144A (ja) * 2020-01-23 2021-08-10 株式会社三共 遊技機
JP2021115145A (ja) * 2020-01-23 2021-08-10 株式会社三共 遊技機
JP7452259B2 (ja) 2020-06-02 2024-03-19 富士通株式会社 半導体装置

Also Published As

Publication number Publication date
US20200012328A1 (en) 2020-01-09
JP7131136B2 (ja) 2022-09-06
US11073883B2 (en) 2021-07-27

Similar Documents

Publication Publication Date Title
JP7131136B2 (ja) サーバ装置,電力制御プログラムおよび監視制御装置
US20090132097A1 (en) Virtual cooling infrastructure
US9870159B2 (en) Solid-state disk (SSD) management
JP5260987B2 (ja) データバックアップシステムにおいてバックアップタスク間でリソースを割り当てるための方法及び装置
JP5324666B2 (ja) ストレージシステム
US7669071B2 (en) Power allocation management in an information handling system
US8145932B2 (en) Systems, methods and media for reducing power consumption in multiple controller information handling systems
US7779276B2 (en) Power management in a power-constrained processing system
JP5235590B2 (ja) 電子システムの電力管理の方法、システム、およびプログラム(電子システムの電力管理)
US7461274B2 (en) Method for maximizing server utilization in a resource constrained environment
US8006112B2 (en) System and method for managing blades after a power supply unit failure
US7529949B1 (en) Heterogeneous power supply management system
US7131019B2 (en) Method of managing power of control box
US20110202655A1 (en) Data Center Manager
US8151122B1 (en) Power budget managing method and system
US10852795B2 (en) Method for system power management and computing system thereof
JP6206496B2 (ja) クラスタシステム,制御装置,制御方法,制御プログラム及び同プログラムを記録したコンピュータ読取可能な記録媒体
US7730365B1 (en) Workload management for maintaining redundancy of non-data computer components
US11921588B2 (en) System and method for data protection during power loss of a storage system
CN107533348B (zh) 热管理高性能计算系统的方法和装置及计算机可读介质
TW202227975A (zh) 機架管理系統、方法及控制器
US20240069761A1 (en) Storage system
KR20200059435A (ko) 가상머신의 어플리케이션 중요도 평가를 통한 bmc기반 서버 전원 임계치 설정 방법
JP5958562B2 (ja) 制御装置、および制御方法
IE85330B1 (en) Power allocation management in an information handling system

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220808

R150 Certificate of patent or registration of utility model

Ref document number: 7131136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150