JP2019102078A - システム電源管理方法及び計算機システム - Google Patents

システム電源管理方法及び計算機システム Download PDF

Info

Publication number
JP2019102078A
JP2019102078A JP2018212920A JP2018212920A JP2019102078A JP 2019102078 A JP2019102078 A JP 2019102078A JP 2018212920 A JP2018212920 A JP 2018212920A JP 2018212920 A JP2018212920 A JP 2018212920A JP 2019102078 A JP2019102078 A JP 2019102078A
Authority
JP
Japan
Prior art keywords
power consumption
power
node
real
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018212920A
Other languages
English (en)
Other versions
JP6663970B2 (ja
Inventor
王偉丞
Wei Cheng Wang
張家政
Jia Zheng Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Giga Byte Technology Co Ltd
Original Assignee
Giga Byte Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Giga Byte Technology Co Ltd filed Critical Giga Byte Technology Co Ltd
Publication of JP2019102078A publication Critical patent/JP2019102078A/ja
Application granted granted Critical
Publication of JP6663970B2 publication Critical patent/JP6663970B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/263Arrangements for using multiple switchable power supplies, e.g. battery and AC
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Power Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Power Sources (AREA)

Abstract

【課題】システム電源管理方法及び計算機システムを提供することを課題とする。
【解決手段】システム電源管理方法であって、計算機システムに応用される。前記方法は、複数の電源供給ユニット及び複数の演算ノードの電力出力及び消費電力状態を取得し、間接的に付属装置のリアルタイム付属消費電力を取得することで、付属装置の最大付属消費電力を引き続き更新する。電源供給ユニットのうちのいずれかが異常となった場合、他のこれら電源供給ユニットの残った最大出力電力の総和を改めて取得し、また残った最大出力電力の総和かあら最大付属消費電力を差し引いてこれら演算ノードの第1ノード消費電力の総和とする。最後に、第1ノード消費電力の総和に基づいてこれら演算ノード少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げる。
【選択図】図2

Description

本発明は、複数の電源供給ユニットの制御に関し、特に、システム電源管理方法及び該方法を応用した計算機システムに関する。
サーバーシステム或いは高速演算サーバーにおいて、2個以上の電源供給ユニットで構成される冗長電源供給ユニットが通常用いられることで、電源供給の需要を満たし、電源供給ユニットに対し互いに電源をバックアップさせる。
各電源供給ユニットは、単独で完全なシステム電力消費の需要を供給できる。例えばシステムの最大の総電力消費量が2200Wの時、各電源供給ユニットは2200Wの最大出力を提供できる。いずれかの電源供給ユニットに異常があった時、別の電源供給ユニットでもシステムの正常な運転を維持させることができる。ただし、全ての電源供給ユニットが正常な時、高すぎる冗長電力は電源資源の無駄となってしまうため、前に述べた例のように2200Wの冗長電力が不必要なアイドリング状態を形成していた。
上記の問題について、従来技術では、個々の最大出力電力が比較的小さい電源供給ユニットを用いて複数の電源供給ユニットの最大出力電力の総和をシステムの電力消費の最大値に等しく又はやや大きくさせ、各電源供給ユニットの個々の最大出力電力が十分利用させるようにすることができ、電源資源もアイドリング状態にされない。
個々の電源供給ユニットに異常が現れた時、システムは、該電源供給ユニットをオフラインさせて電力を供給し、同時にシステム運転モードを極低周波モード(Ultra−Low Frequency Mode、ULFM)に切り換える。この時システムのパフォーマンスは速やかに低下する。しかしながら、外部からのアクセス又はサービス提供要求に必要な消費電源は、必ず同時に低下するわけではなく、従ってシステム運転の不安定が生じていた。
上記問題点に鑑み、本発明は、従来技術内の冗長電源ワット数の無駄又はアンダークロックで生じる問題を解決できるシステム電源管理方法及び該方法を応用した計算機システムを提供することである。
本発明は、システム電源管理方法を提供するものであり、複数の電源供給ユニットの最大出力電力の総和を取得するステップと、各々電源供給ユニットの個々のリアルタイム出力電力及び複数の演算ノードのリアルタイムノード消費電力を取得し、各個々のリアルタイム出力電力を集計してリアルタイム出力電力の総和とするステップと、各該集計したリアルタイムノード消費電力を集計してリアルタイム消費電力の総和とし、リアルタイム出力電力の総和とリアルタイム消費電力の総和の差を付属装置のリアルタイム付属消費電力とするステップと、リアルタイム付属消費電力を引き続き取得することで、付属装置の最大付属消費電力を更新するステップと、各電源供給ユニットの異常の有無を検出するステップと、これら電源供給ユニットのうちのいずれかが異常になった際、他のこれら電源供給ユニットから残った最大出力電力の総和を取得するステップと、残った最大出力電力の総和から最大付属消費電力を差し引いて、これら演算ノードの第1ノード消費電力の総和とするステップと、該第1消費電力の総和に基づき、これら演算ノードの少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げるステップと、を含む。
本発明の一つ或いは複数の実施例において、最大付属消費電力を更新するステップは、付属装置の第1リアルタイム付属消費電力を記録して最大付属消費電力とし、また付属装置の第2リアルタイム付属消費電力を引き続き取得することと、第2リアルタイム付属消費電力と最大付属消費電力を比較し、第2リアルタイム付属消費電力が最大付属消費電力より大きくなった際、第2リアルタイム付属消費電力で最大付属消費電力を代替することと、を含む。
本発明の一つ或いは複数の実施例において、これら演算ノードの少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げるステップは、第1ノード消費電力の総和を演算ノードに均等に分配させることを含む。
本発明の一つ或いは複数の実施例において、これら演算ノードの少なくともいずれか一つの消費電力を該第1ノード消費電力に引き下げるステップは、これら演算ノードをメイングループ及びサブグループにグループ化することと、第1ノード消費電力の総和からメイングループのリアルタイムノード消費電力を差し引いた後、サブグループに均等に分配させることと、を含む。
本発明の一つ或いは複数の実施例において、各電源供給ユニットに異常状態がないことを検出した場合、これら演算ノードの少なくともいずれか一つの消費電力を該第1ノード消費電力に引き下げることを停止する。
本発明の一つ或いは複数の実施例において、これら電源供給ユニットのうちのいずれかに異常があった後、リアルタイム出力電力の総和は、残った最大出力電力の総和より小さくなった場合、各演算ノードのリアルタイムノード消費電力を維持する。
本発明の一つ或いは複数の実施例において、これら演算ノードの少なくともいずれか一つの消費電力を該第1ノード消費電力に引き下げるステップは、これら演算ノードをメイングループ及びサブグループにグループ化することと、電源制御モードが起動されたかどうかを判断することと、電源制御モードが起動された場合、第1ノード消費電力の総和からメイングループの該リアルタイムノード消費電力を差し引いた後、サブグループに均等に分配させることと、電源制御モードか起動されていなかった場合、第1ノード消費電力の総和をメイングループ以及びサブグループに均等に分配させることと、を含む。
本発明の一つ或いは複数の実施例において、これら演算ノードの少なくともいずれか一つの消費電力を該第1ノード消費電力に引き下げるステップは、予め設定された時間間隔に付属装置の最大付属消費電力を取得することと、該予め設定された時間間隔の後に予め設定された時間間隔の最大付属消費電力が予め設定された時間間隔前の最大付属消費電力より小さいかどうかを判断することと、判断結果に基づき、予め設定された時間間隔の最大付属消費電力により、第2ノード消費電力の総和を取得することと、第2ノード消費電力の総和に基づき、調整された演算ノードの消費電力を第2ノード消費電力に再調整することと、を含む。
本発明の一つ或いは複数の実施例において、各該電源供給ユニットの異常の有無を検出するステップは、各電源供給ユニットで出力正常信号を発すことと、出力正常信号が中断した場合、電源供給ユニットに異常と判断させることと、を含む。
本発明の一つ或いは複数の実施例において、各該電源供給ユニットの異常の有無を検出するステップは、電源供給ユニットに異常が起きた時、電源供給ユニットは警告メッセージを発し、警告メッセージを受信した後、電源供給ユニットに異常と判断させることを含む。
本発明は、計算機システムを更に提供し、システム電源管理を実施するシステムである。前記計算機システムは、複数の電源供給ユニットと複数の演算ノードと少なくとも1個の付属装置とシャーシ管理コントローラとを含む。これら電源供給ユニットは、各々電力を供給するために用いられ、かつ各電源供給ユニットが個々の最大出力電力を各々有することで、それを集計して最大出力電力の総和とし、また各電源供給ユニットが個々のリアルタイム電力出力をフィードバックでき、それを集計してリアルタイム電力出力の総和とする。これら演算ノードは、各々演算機能を提供し、各々これら電源供給ユニットから電力を取得し、各演算ノードが各々リアルタイム消費電力をフィードバックでき、それを集計してリアルタイム消費電力の総和とする。付属装置は、これら電源供給ユニットから電力を取得し、かつ付属装置がリアルタイム付属消費電力及び最大付属消費電力を有する。シャーシ管理コントローラは、これら電源供給ユニット及びこれら演算ノードに接続すると共に制御し、かつ最大出力電力の総和、リアルタイム出力電力の総和及びリアルタイム消費電力の総和を取得し、シャーシ管理コントローラは、リアルタイム電力出力の総和とリアルタイム消費電力の総和の差により、リアルタイム付属消費電力を取得し、またリアルタイム付属消費電力の変化により、最大付属消費電力を継続して更新する。
シャーシ管理コントローラは、これら電源供給ユニットのうちのいずれかが異常となると検出した際、他のこれら電源供給ユニットから残った最大出力電力の総和を取得し、残った最大出力電力の総和から最大付属消費電力を差し引いて、これら演算ノードの第1ノード消費電力の総和とし、第1ノード消費電力の総和に基づき、これら演算ノードの少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げる。
本発明の一つ或いは複数の実施例において、シャーシ管理コントローラは、該最大付属消費電力とするため、該付属装置の第1リアルタイム付属消費電力を記録し、また該付属装置の第2リアルタイム付属消費電力を引き続き取得し、かつ該シャーシ管理コントローラが更に第2リアルタイム付属消費電力と最大付属消費電力を比較し、第2リアルタイム付属消費電力は最大付属消費電力より大きくなった際、第2リアルタイム付属消費電力で最大付属消費電力を代替する。
本発明の一つ或いは複数の実施例において、シャーシ管理コントローラは、第1ノード消費電力の総和を演算ノードに均等に分配させる。
本発明の一つ或いは複数の実施例において、これら演算ノードはメイングループ及びサブグループにグループ化され、シャーシ管理コントローラが第1ノード消費電力の総和からメイングループの該リアルタイムノード消費電力を差し引いた後、サブグループに均等に分配させる。
本発明の一つ或いは複数の実施例において、各電源供給ユニットに異常な状態がなかったと検出した際、シャーシ管理コントローラはこれら演算ノードの少なくともいずれか一つの消費電力を該第1ノード消費電力に引き下げることを停止する。
本発明の一つ或いは複数の実施例において、これら電源供給ユニットのうちのいずれかが異常となり、かつリアルタイム出力電力の総和が該残った最大出力電力の総和より小さくなった場合、シャーシ管理コントローラは各演算ノードのリアルタイムノード消費電力を維持する。
本発明の一つ或いは複数の実施例において、これら演算ノードはメイングループ及びサブグループにグループ化され、かつシャーシ管理コントローラは電源制御モードが起動されたかどうかを判断し、電源制御モードが起動されていた場合、シャーシ管理コントローラは第1ノード消費電力の総和からメイングループのリアルタイムノード消費電力を差し引いた後、サブグループに均等に分配し、電源制御モードが起動されていなかった場合、シャーシ管理コントローラは第1ノード消費電力の総和をメイングループ以及びサブグループに均等に分配させる。
本発明の一つ或いは複数の実施例において、これら演算ノードの少なくともいずれか一つの消費電力を該第1ノード消費電力に引き下げた後、シャーシ管理コントローラは予め設定された時間間隔に付属装置の最大付属消費電力を取得し、予め設定された時間間隔の後にシャーシ管理コントローラは予め設定された時間間隔の最大付属消費電力が予め設定された時間間隔前の最大付属消費電力より小さいかどうかを判断し、判断結果に基づき、シャーシ管理コントローラは予め設定された時間間隔の最大付属消費電力により、第2ノード消費電力の総和を取得し、かつ第2ノード消費電力の総和に基づき、調整された演算ノードの消費電力を第2ノード消費電力に調整する。
本発明の一つ或いは複数の実施例において、各電源供給ユニットが出力正常信号を引き続き発し、出力正常信号が中断した場合、シャーシ管理コントローラは電源供給ユニットを異常と判断する。
本発明の一つ或いは複数の実施例において、各電源供給ユニットに異常が起きた時、電源供給ユニットが警告メッセージを発し、シャーシ管理コントローラは警告メッセージを受信した後、電源供給ユニットに異常と判断させる。
本発明のシステム電源管理方法及び計算機システムによれば、計算機システム内の電源供給状態、電源の電力損失状態を、リアルタイムで検出すると共に記録できる。よって、電源供給ユニットに異常があった時、正確かつ速やかに必要な消費電力の調整値を見積もることができ、かつ選択的に負荷が比較的軽い演算ノードについて許容消費電力を下げて他の演算ノードの許容消費電力を維持する。よって、計算機システムの全体的な演算パフォーマンスは、異常な電源供給ユニットの使用を停止した後でもシステムパフォーマンスを維持でき、従って計算機システムの安定性に役立つ。
本発明の実施例1に係る計算機システムの回路ブロック図である。 本発明の実施例1に係るシステム電源管理方法のフローチャートである。 本発明の実施例1に係るシステム電源管理方法のフローチャートである。 本発明の実施例2に係る計算機システムの回路ブロック図である。 本発明の実施例2に係るシステム電源管理方法のフローチャートである。 本発明の実施例2に係るシステム電源管理方法のフローチャートである。 本発明の実施例2に係るシステム電源管理方法のフローチャートである。 本発明の実施例2に係るシステム電源管理方法のフローチャートである。 本発明の実施例2に係るシステム電源管理方法のフローチャートである。
本発明のシステム電源管理方法及び計算機システムについて以下に説明する。
図1を参照する。本発明の実施例1に係る計算機システム100の回路ブロック図であり、システム電源管理を実施する方法である。前記計算機システム100は、シャーシ管理コントローラ110(Chassis Management Control、CMC)と複数の演算ノード120と複数の電源供給ユニット130(Power Supply Unit、PSU)と少なくとも1個の付属装置140とを含む。
図1に示すように、複数の演算ノード120は、各々演算機能を提供することで、計算機システム100に1つ或いは複数のサービスを実行させる。各演算ノード120は、各々シャーシ管理コントローラ110に電気的に接続し、シャーシ管理コントローラ110が操作管理を統合することで、タスク割り当て処理手順及び演算ノード120の間のシステム資源調整を行うために供する。
図1に示すように、各演算ノード120は、電力を取得するため、各電源供給ユニット130に電気的に接続される。演算ノード120は、通常マザーボード及びマザーボードを格納するコンピュータケース構造であるため、計算機システム100のケースから抜き差すことができる。演算ノード120は、CPU122とシステムチップセット124とメモリ126と必要なバスとを含む。前記バスは、SMBus(System Management Bus、システム管理バス)、PMBus(Power Management Bus、電源管理バス)及びPECI(Platform Environmental Control Interface、プラットフォーム環境制御インターフェース)が挙げられるが、これに限定されない。
図1に示すシステムチップセット124の構成を例にすると、コントローラハブ124a(control hub)、ボード管理コントローラ124b(board management control、BMC)及びロジックIC124c(logic IC)が挙げられ、コントローラハブ124aは、サウスブリッジチップとノースブリッジチップのセット、プラットフォームコントローラハブ(platform control hub、PCH)、メモリコントローラ(Memory Controller Hub、MCH)、I/Oコントローラハブ(I/O control hub、ICH)、AMD Fusion Controller Hub等とすることができる。
図1に示すシステムチップセット124及びその構成は例示に過ぎず、実施形態を限定するものではなく、CPU122とその他の素子との間のI/Oタスクの処理に用いる回路チップはシステムチップセット124である。
図1に示すように、演算ノード120は、SMBus、PMBus及び他のプロトコルのバスを通じてシャーシ管理コントローラ110に電気的に接続することで、シャーシ管理コントローラ110を介して対外的に接続する。同時に、シャーシ管理コントローラ110が演算ノード120を制御することで、システム資源の応用を調整する。
具体的実施例において、計算機システム100は、同時に複数のサービスプログラムを実行し、各サービスプログラムが各々一組の演算ノード120グループで実行し、各グループが1つ或いは複数の演算ノード120を含む。
図1に示すように、複数の電源供給ユニット130は、各々電力を供給するために用いられ、かつ各電源供給ユニット130が個々の最大出力電力を各々有する。各電源供給ユニット130は、PMBusを通じて、個々の最大出力電力、個々のリアルタイム電力出力及び出力正常信号(PW_OK)をシャーシ管理コントローラ110にフィードバックでき、前記メッセージもPMBusを通じて更に各演算ノード120のシステムチップセット124に転送できる。
前記個々の最大出力電力は、電源供給ユニット130が出力できる電力の最大値である。これら電源供給ユニット130の個々の最大出力電力の集計は、最大出力電力の総和であり、これら電源供給ユニット130のリアルタイム出力電力の集計がリアルタイム電力出力の総和である。
理想的な状態において、最大出力電力の総和は、計算機システム100の最大消費電力に等しい。実際のシステム設計において、市場から直接取得できる電源供給ユニット130は、通常固定規格であり、計算機システム100の消費電力についてカスタマイズしているわけでないため、最大出力電力の総和が通常計算機システム100の最大消費電力よりやや大きくなることで、システムの設計を図る。
例えば、よく見られる計算機システム100は、電力が同じ2個の電源供給ユニット130が設けられ、計算機システム100の最大消費電力が3000Wとすると、市場上から取得できる電源供給ユニット130の個々の最大出力電力が1200W、1600W、2000Wの3種類がある時、個々の最大出力電力が1600Wの電源供給ユニット130は選択され、最大出力電力の総和を3200Wにさせ、計算機システム100の最大消費電力3000Wよりやや大きい。このように電源供給ユニット130の配置は、計算機システム100の最大消費電力3000Wを満たすことができる以外に、電源供給ユニット130の配置にオーバーデザイン(over−design)が現れないようにさせることもできる。
図1に示すように、付属装置140は、これら電源供給ユニット130から電力を取得し、かつ付属装置140がリアルタイム付属消費電力及び最大付属消費電力を有する。計算機システム100において、シャーシ管理コントローラ110は、通常直接各種バスから付属装置140のリアルタイム付属消費電力及び最大付属消費電力を取得することができない。
計算機システム100において、シャーシ管理コントローラ110及び演算ノード120に属さない部分が、付属装置140である。よく見られる付属装置140は、ハードディスクドライブアレイ、ファンアレイ、取外し可能な記憶媒体読取装置、コンピュータエクスプレスカード(PCI Express card、PCIe card)等或いは前記装置の任意の組み合わせがあり、コンピュータエクスプレススロット(PCI Express slot、PCIe slot)を通じて回路基板に接続し、更に接続インターフェースを通じてシャーシ管理コントローラ110に接続する。
留意すべき点は、時に個々のハードディスクドライブ又はファンが演算ノード120内に直接設けられ、或いは演算ノード120のバスに直接接続して、演算ノード120から電力を取得し、この時これらハードディスクドライブ或いはファンが演算ノード120の一部に属し、付属装置140にならない。本実施例において、付属装置140は、各演算ノード120から独立したハードディスクドライブアレイ及びファンアレイの組み合わせを例として説明を行う。
図1に示すように、シャーシ管理コントローラ110は、電源供給ユニット130及び演算ノード120に接続すると共に制御するために用いられ、かつ最大出力電力の総和、リアルタイム出力電力の総和及びリアルタイム消費電力の総和を取得する。
シャーシ管理コントローラ110は、リアルタイム電力出力の総和とリアルタイム消費電力の総和の差に基づき、リアルタイム付属消費電力が得られる。すなわち、リアルタイム電力出力の総和とリアルタイム消費電力の総和の差が、リアルタイム付属消費電力である。シャーシ管理コントローラ110は、リアルタイム付属消費電力を引き続き取得でき、またリアルタイム付属消費電力の変化により最大付属消費電力を引き続き更新する。
図2及び図3を参照する。本発明の実施例1に係るシステム電源管理方法のフローチャートである。
図1及び図2に示すように、計算機システム100は、立ち上がった後、まずシャーシ管理コントローラ110を通じて電力パラメータ検出段階を行う。これはステップStep110に示される。この段階において、主な目的は、電力出力及び消費電力に関するパラメータを取得することである。
図1及び図3に示すように、ステップStep110内において、シャーシ管理コントローラ110が取得するパラメータは、次の通りとする。下記順序は、各パラメータの取得順序を制限するものでなく、これらパラメータの取得順序を任意に変化させることができる。
シャーシ管理コントローラ110は、PMBusを通じてソフト・ハードウェア仕様及びリアルタイムな運転状態を含む電源供給ユニット130の電源情報を取得できる。よって、ステップStep112に示すように、シャーシ管理コントローラ110は、複数の電源供給ユニット130の個々の最大出力電力及び個々のリアルタイム出力電力を取得できる。
同時に、PMBusインターフェースを介して接続し、各電源供給ユニット130が出力正常信号(PW_OK)をシャーシ管理コントローラ110に継続して発させ、出力正常信号(PW_OK)が中断した場合、シャーシ管理コントローラ110は、電源供給ユニット130に異常と判断させることができる。
前記ステップStep112において、電源供給ユニット130の個々の最大出力電力検出タスクは、計算機システム100が立ち上がった時の初期化ステップの一部とすることができる。システムが立ち上がった時の初期化過程で、電源供給ユニット130は、電源情報(ソフト・ハードウェア仕様及びリアルタイムな運転状態を含む)をシャーシ管理コントローラ110に伝送でき、シャーシ管理コントローラ110に立ち上がった時に各電源供給ユニット130の個々の最大出力電力を取得させることができる。
各電源供給ユニット130の個々の最大出力電力を取得した後、シャーシ管理コントローラ110は、集計計算を通じて全ての電源供給ユニット130の最大出力電力の総和を取得でき、また数値をシャーシ管理コントローラ110のバッファ記憶装置の記憶アドレス内に書き込ませる。同様に、各電源供給ユニット130の個々のリアルタイム出力電力を取得した後、シャーシ管理コントローラ110は、集計計算を通じて全ての電源供給ユニット130のリアルタイム出力電力の総和を取得して別のバッファアドレス内に書き込ませることができる。
図1及び図3を再度参照する。同様にPMBus又はその他のバスの接続を通じて、シャーシ管理コントローラ110は、各演算ノード120の運転状態(各演算ノード120のリアルタイムノード消費電力を含む)を取得する。これは、ステップStep114の通りである。
前記のように、シャーシ管理コントローラ110がPMBusで各演算ノード120のボード管理コントローラ124bに接続して、リアルタイムノード消費電力及び許容消費電力を取得し、従ってこれらリアルタイム消費電力を集計することで、複数の演算ノード120のリアルタイム消費電力の総和を得る。
演算ノード120の許容消費電力は、必ず演算ノード120のハードウェア仕様の最大消費電力に等しくなる必要はなく、この許容消費電力を最大消費電力より小さく設定できる。
図1以及び図3を参照する。ステップStep116のように前記数値を取得してからシャーシ管理コントローラ110は、これら電源供給ユニット130のリアルタイム出力電力の総和及びこれら演算ノード120のリアルタイム消費電力の総和の差を計算することで、付属装置140のリアルタイム付属消費電力を取得する。
図1及び図3を参照する。ステップStep118のようにシャーシ管理コントローラ110は、付属装置140のリアルタイム付属消費電力を引き続き取得することで、付属装置140の最大付属消費電力を更新する。
シャーシ管理コントローラ110は、バッファ記憶装置で付属装置140の最大付属消費電力を記録する。付属装置140の最大付属消費電力の更新方法として、シャーシ管理コントローラ110は第1リアルタイム付属消費電力を記録して最大付属消費電力とし、またバッファ記憶装置に記録する。次に、シャーシ管理コントローラ110は、付属装置140の第2リアルタイム付属消費電力を引き続き取得する。そしてシャーシ管理コントローラ110が、付属装置140の第2リアルタイム付属消費電力とバッファ記憶装置に記録されている最大付属消費電力を比較する。
第2リアルタイム付属消費電力が記録済みの最大付属消費電力より大きい場合、シャーシ管理コントローラ110は、第2リアルタイム付属消費電力で記録済みの最大付属消費電力を代替することで、最大付属消費電力を更新させる。第2リアルタイム付属消費電力がバッファ記憶装置内に記録されている最大付属消費電力より小さい場合、バッファ記憶装置内に記録されている数値を付属装置140の最大付属消費電力として維持する。
図1及び図2を参照する。ステップStep120に示すように関連のパラメータを取得した後、シャーシ管理コントローラ110は、これら電源供給ユニット130の運転の監視を開始し、従って各電源供給ユニット130に異常があるか否かを検出する。
図1及び図2に示すように、電源供給ユニット130自体が自己監視を行い、出力又は入力において異常状態が生じた時(例えば出力が不安定或いは出力電力が上昇できない時)、電源供給ユニット130は、異常状態についてインターフェースピンの信号を変化させることができる。ステップStep120に示すように、シャーシ管理コントローラ110は、PMBus或いはその他のバスを通じて電源供給ユニット130と接続し、インターフェースピンの信号変化に基づき、各電源供給ユニット130に異常があるか否かを検出する。
前記のように、異常検出方法の一つとして、シャーシ管理コントローラ110はPMBusのいずれか1個の空きピンを通じてステータスクエリ信号を発し、各電源供給ユニット130から出力正常信号(PW_OK)を発して応答し、シャーシ管理コントローラ110はPMBusの1個の空きピンを通じて電源供給ユニット130で出力正常信号(PW_OK)を受信する。
出力正常信号(PW_OK)が中断した場合、シャーシ管理コントローラ110は、電源供給ユニット130に異常が生じたと判断する。他の実施例において、PMbus内のデータピン及びクロックピンを通じて状態を検出でき、各電源供給ユニット130が出力正常信号を引き続き発し、シャーシ管理コントローラ110はPMBusのデータピン及びクロックピンを通じて電源供給ユニット130で出力正常信号を受信する。上記異常検出方法も同時に使用できる。
別の異常検出方法は、電源供給ユニット130に対しプログラム可能な設定を行う。電源供給ユニット130に異常が生じた時、電源供給ユニット130は、PMBusを通じて警告メッセージとしてPMBus Alertをシャーシ管理コントローラ110に発し、シャーシ管理コントローラ110が警告メッセージを受信して電源供給ユニット130に異常と判断させる。
前記異常イベントは、電源供給ユニット130過熱(Over Temperature)、過電圧(Over Voltage)、低電圧(Under Voltage)(例:商用電源が低すぎる)、過電流(Over Current)、ファン故障(Fan fault)等が挙げられる。
図1及び図2に示すように、これら電源供給ユニット130のいずれか一つが異常となった場合、シャーシ管理コントローラ110は、他の電源供給ユニット130から残った最大出力電力の総和を取得する。次にステップStep130に示すように、シャーシ管理コントローラ110は、残った最大出力電力の総和から最大付属消費電力を差し引いてこれら演算ノード120の第1ノード消耗総和とする。
図1及び図2に示すように、最後に、シャーシ管理コントローラ110は、ステップStep140に示す通り、第1ノード消費電力の総和に基づき、これら演算ノード120の少なくともいずれか一つの消費電力の第1ノード消費電力を引き下げる。
これら演算ノード120の少なくともいずれか一つの消費電力は、電源供給ユニット130の最大出力電力の総和の変化により第1ノード消費電力に引き下げられ、調整後の計算機システム100の最大消費電力が、残った最大出力電力の総和より大きくならない。引き下げられた演算ノード120の数量が複数の時、消費電力を均等に分配させる。すなわち、第1ノード消費電力の総和からその他のこれら演算ノード120のリアルタイムノード消費電力を差し引いた後、引き下げられた演算ノード120に均等に分配させる。
上記調整は、演算ノード120の利用できる出力電力をできる限り見積もり、差別的に特定の1個或いは1つグループの演算ノード120に対し消費電力の引き下げを行うことで、電源供給ユニット130の残った最大出力電力の総和が計算機システム100の需要を満たすことができ、同時に一部の演算ノード120に既存の演算パフォーマンスをできる限り維持させることができる。
すなわち、本願は特定の演算ノード120のみに対し引き下げ、一括で全ての演算ノード120を低消費電力モードに調整するのではなく、これによりシステムパフォーマンスをできる限り維持することができる。特に、本来負荷が重い部分(例えばファイルサーバーに提供される演算ノード120)は、既存の消費電力モードを維持でき、サブシステム(例えば利用率が比較的低いユーザアカウント管理サービス)は選択的に消費電力制限モードがオンにされる。
こうして、本発明に係る計算機システム100は、電源供給に障害が現れた時、一部の演算ノード120のみがアンダークロックされるため、システム全体の運転パフォーマンスが、速やかに低下されることがないため、計算機システム100の一時的な安定運転に役立つ。
図4を参照する。本発明の実施例2で提供する計算機システム100の回路ブロック図であり、システム電源管理を実施する方法である。実施例2に係る計算機システム100は、実施例1で示したものとほぼ同じで、相違点は正確な電源管理を図るため、実施例2に係る演算ノード120a、120bが更にグループ化されことである。
図4に示すように、複数の演算ノード120a、120bは、メイングループ及びサブグループにグループされる。メイングループは、少なくとも1個の演算ノード120aを含み、サブグループも少なくとも1個の演算ノード120bを含む。図4内のメイングループ及びサブグループは、各々演算ノード120a、120bを含んでいるものを例示し、実際にメイングループ及びサブグループが各々複数の演算ノード120a、120bを含むことができる。
メイングループ及びサブグループのグループ化原則は、平均負荷によって区分することができる。平均負荷が重い演算ノード120aは、メイングループの一部に分類でき、平均負荷が軽い演算ノード120bをサブグループの一部とすることもできる。例えば、1つのファイルサーバーにおいて、ユーザがファイルをアクセスするために用いられる演算ノード120aをメイングループに分類し、ユーザアカウント情報を管理するために用いられる演算ノード120bをサブグループに分類できる。
図5乃至図9は、本発明の実施例2に係るシステム電源管理方法のフローチャートである。
図5に示すように、実施例2は、ステップStep210に示す通り、同様にシャーシ管理コントローラ110で電力パラメータ検出段階を行う。
ステップStep210において、シャーシ管理コントローラ110は、先に複数の電源供給ユニット130の最大出力電力の総和を取得する。次に、シャーシ管理コントローラ110は、電源供給ユニット130のリアルタイム出力電力の総和及び演算ノード120a、120bのリアルタイム消費電力の総和を取得し、リアルタイム出力電力の総和とリアルタイム消費電力の総和の差を付属装置140のリアルタイム付属消費電力とする。
シャーシ管理コントローラ110は、またリアルタイム付属消費電力を引き続き取得して付属装置140の最大付属消費電力を更新する。ステップStep210は、実施例1のステップStep110とほぼ同じであるため、以下この説明を省略する。
図5に示すように、関連のパラメータを取得した後、シャーシ管理コントローラ110は、ステップStep 220に示す通り、これら電源供給ユニット130の運転の検出を開始し、各電源供給ユニット130の異常の有無を検出する。
図5及び図6を参照する。ステップStep221及びステップStep223に示すように、各電源供給ユニット130に異常状態がないと検出した場合、シャーシ管理コントローラ110は、更に許容消費電力制限の設定を有効化にしたかどうか、すなわち、演算ノード120の消費電力が第1リアルタイムノード消費電力に引き下げられたかどうを確認する。有効化した場合、許容消費電力制限の設定を無効化にし、シャーシ管理コントローラ110は演算ノード120の少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げることを停止すると共にフローを終了する。
図5に示すように、これら電源供給ユニット130のうちのいずれかが異常となった場合、ステップStep222に示す通り、シャーシ管理コントローラ110は、他の電源供給ユニット130の残った最大出力電力の総和を取得し、またリアルタイム出力電力の総和が残った最大出力電力の総和より大きいかどうかを判断する。
図5及び図6に示すように、リアルタイム出力電力の総和が残った最大出力電力の総和より小さい場合、ステップStep225に示す通り、システムが正常な運転を維持する。すなわち、各演算ノード120の消費電力を維持し、演算ノード120消費電力を引き下げる消費電力制限設定を行うことなく、フローを終了する。
図5に示すように、リアルタイム出力電力の総和が残った最大出力電力の総和より大きかった場合、ステップStep224に示す通り、電源制御モードが起動されているかどうかを更に判断する。電源制御モードは、通常計算機システム100のBIOS内の設定アドレスで記録し、設定アドレスの数値がTRUEの場合、電源制御モードが起動され、設定アドレスの数値がFALSEの場合、電源制御モードが起動していないことである。
図5に示すように、電源制御モードが起動された時は、ステップStep230に示す通り、シャーシ管理コントローラ110は、電源供給ユニット130の残った最大出力電力の総和から付属装置140の最大付属消費電力を差し引くことで、これら演算ノード120a、120bの第1ノード消費電力の総和を改めて取得する。
ステップStep230において、メイングループの演算ノード120の消費電力を調整せず、シャーシ管理コントローラ110が、第1ノード消費電力の総和からメイングループのリアルタイムノード消費電力を差し引いた後、サブグループの各演算ノード120に均等に分配させる。
図5に示すように、最後に、シャーシ管理コントローラ110は、ステップStep240に示す通り、第1ノード消費電力の総和に基づき、サブグループの演算ノード120に対し第1ノード消費電力を設定し、サブグループの消費電力を第1ノード消費電力に引き下げる。通常の手法は、第1ノード消費電力の総和からメイングループの演算ノード120の許容消費電力を差し引いた後、サブグループの演算ノード120に均等に分配させて該第1ノード消費電力とする。
付属装置140の最大付属消費電力、例えばハードディスクドライブアレイ或いはファンアレイの消費電力は、演算ノード120のリアルタイムノード消費電力の低下に伴って低下する。すなわち、1個或いは複数の演算ノード120の消費電力が第1ノード消費電力に引き下げられた後、付属装置140の最大付属消費電力も、実際に一緒に低下する。
よって、本発明は、電力放出フローを更に含み、付属装置140に保留されていた消費電力を放出させて演算ノード120に供給する。
図7は本発明の実施例に係るシステム電源管理方法内の電力放出フローであり、そのステップを以下に説明する。
図7に示すように、ステップStep240の後にシャーシ管理コントローラ110は、ステップStep250に示す通り、先に許容消費電力の制限が設定されると共に有効化にしたことを記録する。
図7及び図8に示すように、演算ノード120bの電力が第1ノード消費電力に引き下げられた後、すなわち、ステップStep260に示す通り、許容消費電力の制限を設定した後、シャーシ管理コントローラ110が計時タスクを起動させ、予め設定された時間間隔Tでカウントダウンし始め、予め設定された時間間隔Tを待った後更に次のステップに進む。
図7及び図8を参照する。具体的実施例において、付属装置140が少なくとも1個のファンを含み、予め設定された時間間隔Tを待った後、更に次のステップに進む理由は、少なくとも一部の演算ノード120の消費電力が第1ノード消費電力に引き下げられた後、これら調整された演算ノード120の発熱量が低下し、計算機システム100内部の温度も改めて平衡させることである。
予め設定された時間間隔Tの後、新しい平衡状態に達し、ファンの運転状態を1つの新しい平衡状態に達させ、一般的にはファンの運転状態は、30分間(1800秒)後に熱平衡状態に達することができる。この時、付属装置140の最大付属消費電力が低下し、電源供給ユニット130に余った出力電力があって演算ノード120に分配させることができる。具体的な計時フローは、ステップStep262〜ステップStep268に示す通り、図8のサイクルの通りである。
図7に示すように、次にシャーシ管理コントローラ110が電力パラメータの検出を再実施し、ステップStep270に示す通り、付属装置140の予め設定された時間間隔Tにおける最大付属消費電力を取得する。
図7に示すように、その後、予め設定された時間間隔Tの後に、シャーシ管理コントローラ110は、ステップStep280に示す通り、予め設定された時間間隔Tにおける最大付属消費電力が予め設定された時間間隔Tの前における最大付属消費電力より小さいかどうかを判断する。すなわち、予め設定された時間間隔Tの後に、付属装置140の最大付属消費電力が低下したかどうかを判断する。
図7は、判断結果に基づき、予め設定された時間間隔Tの最大付属消費電力が予め設定された時間間隔Tの前における最大付属消費電力より小さくなった場合、電源供給ユニット130に余った出力電力があって演算ノード120に改めて分配できることを示している。この時、シャーシ管理コントローラ110は、ステップStep290に示す通り、予め設定された時間間隔Tの最大付属消費電力に基づき、第2ノード消費電力の総和を取得する。
図7に示すように、その後、第2ノード消費電力の総和に基づき、シャーシ管理コントローラ110がサブグループの演算ノード120の消費電力を第2ノード消費電力に改めて調整する。これは、ステップStep292に示す通りである。そして、シャーシ管理コントローラ110は、ステップStep294に示す通り、新しい消費電力制限が設定されていると共に有効化されることを記録する。その後、フローがステップStep260に戻り、計時タスクを再起動させる。
図5及び図9を参照する。ステップStep224内において、電源制御モードが起動されていなかった場合、シャーシ管理コントローラ110は、やはり演算ノード120の消費電力調整を実行する。この時、シャーシ管理コントローラ110は、第1ノード消費電力の総和を計算し、すなわち、ステップStep224aに示す通り、残った最大出力電力の総和から付属装置140の最大付属消費電力を差し引いて第1ノード消費電力の総和を取得する。
次に、シャーシ管理コントローラ110は、ステップStep224bに示す通り、第1ノード消費電力の総和をメイングループ及びサブグループの演算ノード120に均等に分配させてこれら演算ノード120の第1ノード消費電力とする。最後にフローを終了する。
計算機システム100内の電源供給状態、電源の消費電力状態は、リアルタイムで検出すると共に記録される。よって、電源供給ユニット130に異常があった時、計算機システム100は正確かつ速やかに必要な消費電力の調整値を見積もることができ、かつ選択的に負荷が比較的軽い演算ノード120/120bについてノード消費電力を下げて他の演算ノード120/120aのノード消費電力を維持する。よって、計算機システム100の全体的な演算パフォーマンスは、異常な電源供給ユニットの使用を停止した後、やはりシステパフォーマンスを維持でき、従って計算機システムの安定性に役立つ。
100 計算機システム
110 シャーシ管理コントローラ
120、120a、120b 演算ノード
122 CPU
124 システムチップセット
124a コントローラハブ
124b ボード管理コントローラ
124c ロジックIC
126 メモリ
130 電源供給ユニット
140 付属装置
Step110〜Step292 ステップ

Claims (20)

  1. 複数の電源供給ユニットの最大出力電力の総和を取得するステップと、
    各々電源供給ユニットの個々のリアルタイム出力電力及び複数の演算ノードのリアルタイムノード消費電力を取得し、各前記個々のリアルタイム出力電力を集計してリアルタイム出力電力の総和とするステップと、
    各前記集計したリアルタイムノード消費電力を集計してリアルタイム消費電力の総和とし、前記リアルタイム出力電力の総和と前記リアルタイム消費電力の総和の差を付属装置のリアルタイム付属消費電力とするステップと、
    前記リアルタイム付属消費電力を引き続き取得することで、前記付属装置の最大付属消費電力を更新するステップと、
    各前記電源供給ユニットの異常の有無を検出するステップと、
    前記電源供給ユニットのうちのいずれかが異常になった際、他の前記電源供給ユニットから残った最大出力電力の総和を取得するステップと、
    前記残った最大出力電力の総和から前記最大付属消費電力を差し引いて、前記演算ノードの第1ノード消費電力の総和とするステップと、
    前記第1消費電力の総和に基づき、前記演算ノードの少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げるステップと、を含むことを特徴とする、
    システム電源管理方法。
  2. 前記最大付属消費電力を更新するステップは、前記付属装置の第1リアルタイム付属消費電力を記録して前記最大付属消費電力とし、また前記付属装置の第2リアルタイム付属消費電力を引き続き取得することと、前記第2リアルタイム付属消費電力と前記最大付属消費電力を比較し、前記第2リアルタイム付属消費電力が前記最大付属消費電力より大きくなった際、前記第2リアルタイム付属消費電力で前記最大付属消費電力を代替することと、を含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  3. 前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げるステップは、前記第1ノード消費電力の総和を前記演算ノードに均等に分配させることを含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  4. 前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げるステップは、前記演算ノードをメイングループ及びサブグループにグループ化することと、前記第1ノード消費電力の総和から前記メイングループのリアルタイムノード消費電力を差し引いた後、前記サブグループに均等に分配させることと、を含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  5. 各前記電源供給ユニットに異常状態がないことを検出した場合、前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げることを停止することを特徴とする、請求項1に記載のシステム電源管理方法。
  6. 前記電源供給ユニットのうちのいずれかに異常があった後、前記リアルタイム出力電力の総和は、前記残った最大出力電力の総和より小さくなった場合、各前記演算ノードの前記リアルタイムノード消費電力を維持することを特徴とする、請求項1に記載のシステム電源管理方法。
  7. 前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げるステップは、前記演算ノードをメイングループ及びサブグループにグループ化することと、電源制御モードが起動されたかどうかを判断することと、前記電源制御モードが起動された場合、前記第1ノード消費電力の総和から前記メイングループの前記リアルタイムノード消費電力を差し引いた後、前記サブグループに均等に分配させることと、前記電源制御モードか起動されていなかった場合、前記第1ノード消費電力の総和を前記メイングループ以及び前記サブグループに均等に分配させることと、を含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  8. 前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げるステップは、予め設定された時間間隔に前記付属装置の最大付属消費電力を取得することと、前記予め設定された時間間隔の後に前記予め設定された時間間隔の前記最大付属消費電力が予め設定された時間間隔前の前記最大付属消費電力より小さいかどうかを判断することと、判断結果に基づき、前記予め設定された時間間隔の前記最大付属消費電力により、第2ノード消費電力の総和を取得することと、前記第2ノード消費電力の総和に基づき、前記調整された演算ノードの消費電力を第2ノード消費電力に調整することと、を更に含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  9. 各前記電源供給ユニットの異常の有無を検出するステップは、各前記電源供給ユニットで出力正常信号を発すことと、前記出力正常信号が中断した場合、前記電源供給ユニットに異常と判断させることと、を含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  10. 各前記電源供給ユニットの異常の有無を検出するステップは、前記電源供給ユニットに異常が起きた時、前記電源供給ユニットは警告メッセージを発し、前記警告メッセージを受信した後、前記電源供給ユニットに異常と判断させることを含むことを特徴とする、請求項1に記載のシステム電源管理方法。
  11. 各々電力を供給するために用いられ、かつ各電源供給ユニットが個々の最大出力電力を各々有することで、それを集計して最大出力電力の総和とし、また各前記電源供給ユニットが個々のリアルタイム電力出力をフィードバックでき、それを集計してリアルタイム電力出力の総和とする複数の電源供給ユニットと、
    各々演算機能を提供し、各々前記電源供給ユニットから前記電力を取得し、かつ各々リアルタイム消費電力をフィードバックでき、それを集計してリアルタイム消費電力の総和とする演算ノードと、
    前記電源供給ユニットから前記電力を取得し、かつ前記付属装置がリアルタイム付属消費電力及び最大付属消費電力を有する付属装置と、
    前記電源供給ユニット及び前記演算ノードに接続すると共に制御し、かつ前記最大出力電力の総和、前記リアルタイム出力電力の総和及び前記リアルタイム消費電力の総和を取得し、前記リアルタイム電力出力の総和とリアルタイム消費電力の総和の差により、前記リアルタイム付属消費電力を取得し、また前記リアルタイム付属消費電力の変化により、前記最大付属消費電力を継続して更新するシャーシ管理コントローラと、を含む計算機システムにおいて、
    前記シャーシ管理コントローラは、前記電源供給ユニットのうちのいずれかが異常となると検出した際、他の前記電源供給ユニットから残った最大出力電力の総和を取得し、前記残った最大出力電力の総和から前記最大付属消費電力を差し引いて、前記演算ノードの第1ノード消費電力の総和とし、前記第1ノード消費電力の総和に基づき、前記演算ノードの少なくともいずれか一つの消費電力を第1ノード消費電力に引き下げることを特徴とする、
    計算機システム。
  12. 前記シャーシ管理コントローラは、前記最大付属消費電力とするため、前記付属装置の第1リアルタイム付属消費電力を記録し、また前記付属装置の第2リアルタイム付属消費電力を引き続き取得し、かつ前記シャーシ管理コントローラが更に前記第2リアルタイム付属消費電力と前記最大付属消費電力を比較し、前記第2リアルタイム付属消費電力は前記最大付属消費電力より大きくなった際、前記第2リアルタイム付属消費電力で前記最大付属消費電力を代替することを特徴とする、請求項11に記載の計算機システム。
  13. 前記シャーシ管理コントローラは、前記第1ノード消費電力の総和を前記演算ノードに均等に分配させることを特徴とする、請求項11に記載の計算機システム。
  14. 前記演算ノードは、メイングループ及びサブグループにグループ化され、前記シャーシ管理コントローラが前記第1ノード消費電力の総和から前記メイングループの前記リアルタイムノード消費電力を差し引いた後、前記サブグループに均等に分配させることを特徴とする、請求項11に記載の計算機システム。
  15. 各前記電源供給ユニットに異常な状態がなかったと検出した際、前記シャーシ管理コントローラは前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げることを停止することを特徴とする、請求項11に記載の計算機システム。
  16. 前記電源供給ユニットのうちのいずれかが異常となり、かつ前記リアルタイム出力電力の総和が前記残った最大出力電力の総和より小さくなった場合、前記シャーシ管理コントローラは各前記演算ノードのリアルタイムノード消費電力を維持することを特徴とする、請求項11に記載の計算機システム。
  17. 前記演算ノードは、メイングループ及びサブグループにグループ化され、かつ前記シャーシ管理コントローラは電源制御モードが起動されたかどうかを判断し、電源制御モードが起動されていた場合、前期シャーシ管理コントローラは前記第1ノード消費電力の総和から前記メイングループの前記リアルタイムノード消費電力を差し引いた後、前記サブグループに均等に分配し、前記電源制御モードが起動されていなかった場合、前期シャーシ管理コントローラは前記第1ノード消費電力の総和を前記メイングループ以及び前記サブグループに均等に分配させることを特徴とする、請求項11に記載の計算機システム。
  18. 前記演算ノードの少なくともいずれか一つの消費電力を前記第1ノード消費電力に引き下げた後、前記シャーシ管理コントローラは予め設定された時間間隔に前記付属装置の前記最大付属消費電力を取得し、前記予め設定された時間間隔の後に前記シャーシ管理コントローラは前記予め設定された時間間隔の前記最大付属消費電力が前記予め設定された時間間隔前の前記最大付属消費電力より小さいかどうかを判断し、判断結果に基づき、前記シャーシ管理コントローラは前記予め設定された時間間隔の前記最大付属消費電力により、第2ノード消費電力の総和を取得し、かつ前記第2ノード消費電力の総和に基づき、前記調整された演算ノードの消費電力を第2ノード消費電力に調整することを特徴とする、請求項11に記載の計算機システム。
  19. 各前記電源供給ユニットが出力正常信号を引き続き発し、前記出力正常信号が中断した場合、前記シャーシ管理コントローラは前記電源供給ユニットを異常と判断することを特徴とする、請求項11に記載の計算機システム。
  20. 各前記電源供給ユニットに異常が起きた時、前記電源供給ユニットが警告メッセージを発し、前記シャーシ管理コントローラは前記警告メッセージを受信した後、前記電源供給ユニットに異常と判断させることを特徴とする、請求項11に記載の計算機システム。
JP2018212920A 2017-12-07 2018-11-13 システム電源管理方法及び計算機システム Active JP6663970B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW106143024A TWI659297B (zh) 2017-12-07 2017-12-07 系統電源管理方法及計算機系統
TW106143024 2017-12-07

Publications (2)

Publication Number Publication Date
JP2019102078A true JP2019102078A (ja) 2019-06-24
JP6663970B2 JP6663970B2 (ja) 2020-03-13

Family

ID=63350430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018212920A Active JP6663970B2 (ja) 2017-12-07 2018-11-13 システム電源管理方法及び計算機システム

Country Status (6)

Country Link
US (1) US10852795B2 (ja)
EP (1) EP3495918B1 (ja)
JP (1) JP6663970B2 (ja)
KR (1) KR102140219B1 (ja)
RU (1) RU2690750C1 (ja)
TW (1) TWI659297B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414070B (zh) * 2020-03-06 2021-10-15 苏州浪潮智能科技有限公司 一种机箱功耗管理方法、系统及电子设备和存储介质
TWI750623B (zh) 2020-03-31 2021-12-21 技嘉科技股份有限公司 電源管理系統以及電源管理方法
US11181961B2 (en) * 2020-04-07 2021-11-23 Dell Products L.P. System and method for increasing power delivery to information handling systems
TWI740632B (zh) * 2020-09-03 2021-09-21 宏碁股份有限公司 電腦裝置及電源閘控電路
TWI784748B (zh) * 2021-10-14 2022-11-21 茂達電子股份有限公司 電源管理系統及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118771A1 (en) * 2005-11-22 2007-05-24 International Business Machines Corporation Power management using spare capacity of redundant power supply in blade environment
JP2007143236A (ja) * 2005-11-16 2007-06-07 Oki Electric Ind Co Ltd 電源装置
JP2009060758A (ja) * 2007-09-03 2009-03-19 Alaxala Networks Corp 電子装置
JP2012003438A (ja) * 2010-06-16 2012-01-05 Hitachi Ltd 電源モジュールの出力状態に応じた電力抑止機能を設けた情報処理装置システム
JP2013025343A (ja) * 2011-07-15 2013-02-04 Alaxala Networks Corp ネットワーク装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7400062B2 (en) * 2002-10-15 2008-07-15 Microsemi Corp. - Analog Mixed Signal Group Ltd. Rack level power management
US7484110B2 (en) * 2006-03-16 2009-01-27 Microsoft Corporation Adaptive power management
JP4838112B2 (ja) * 2006-12-25 2011-12-14 富士通株式会社 消費電力調整プログラム,装置,および処理方法
EP2241014B1 (en) * 2008-02-05 2016-11-02 Philips Lighting Holding B.V. Controlling the power consumption of a receiving unit
US8051316B2 (en) * 2008-06-09 2011-11-01 Dell Products L.P. System and method for managing power supply units
US8390148B2 (en) * 2008-08-13 2013-03-05 Dell Products L.P. Systems and methods for power supply wear leveling in a blade server chassis
US8132034B2 (en) 2008-08-28 2012-03-06 Dell Products L.P. System and method for managing information handling system power supply capacity utilization based on load sharing power loss
CN102318200A (zh) * 2009-02-17 2012-01-11 华为技术有限公司 一种管理电源的方法、装置及供电系统
TW201243560A (en) * 2011-04-29 2012-11-01 Pegatron Corp Power management device, high performance server and power management method
CN103138940B (zh) * 2011-11-28 2016-06-01 英业达科技有限公司 服务器机架系统
US9348395B2 (en) * 2012-10-15 2016-05-24 Dell Products L.P. Power demand reduction system
TWI497274B (zh) * 2013-06-26 2015-08-21 Inventec Corp 機櫃與其電源控制方法
US9176564B2 (en) * 2013-12-18 2015-11-03 Dell Products L.P. Systems and methods for thermal control of a storage enclosure
US9625974B2 (en) * 2013-12-23 2017-04-18 Dell Products, L.P. Global throttling of computing nodes in a modular, rack-configured information handling system
US10620857B2 (en) * 2014-10-31 2020-04-14 Hewlett Packard Enterprise Development Lp Combined backup power
US9588571B2 (en) * 2015-07-08 2017-03-07 Quanta Computer Inc. Dynamic power supply management

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007143236A (ja) * 2005-11-16 2007-06-07 Oki Electric Ind Co Ltd 電源装置
US20070118771A1 (en) * 2005-11-22 2007-05-24 International Business Machines Corporation Power management using spare capacity of redundant power supply in blade environment
JP2009060758A (ja) * 2007-09-03 2009-03-19 Alaxala Networks Corp 電子装置
JP2012003438A (ja) * 2010-06-16 2012-01-05 Hitachi Ltd 電源モジュールの出力状態に応じた電力抑止機能を設けた情報処理装置システム
JP2013025343A (ja) * 2011-07-15 2013-02-04 Alaxala Networks Corp ネットワーク装置

Also Published As

Publication number Publication date
RU2690750C1 (ru) 2019-06-05
KR20200068017A (ko) 2020-06-15
US20190179386A1 (en) 2019-06-13
US10852795B2 (en) 2020-12-01
TWI659297B (zh) 2019-05-11
JP6663970B2 (ja) 2020-03-13
EP3495918B1 (en) 2024-04-10
TW201925982A (zh) 2019-07-01
KR102140219B1 (ko) 2020-08-03
EP3495918A1 (en) 2019-06-12

Similar Documents

Publication Publication Date Title
JP6663970B2 (ja) システム電源管理方法及び計算機システム
US10509456B2 (en) Server rack power management
KR102385766B1 (ko) 스토리지 시스템의 전력 분석을 수행하는 방법 및 장치
US8006108B2 (en) Dynamic selection of group and device power limits
US9235252B2 (en) Dynamic balancing of power across a plurality of processor domains according to power policy control bias
US7783907B2 (en) Power management of multi-processor servers
JP5770300B2 (ja) 処理ノードの熱制御のための方法および装置
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
US9563254B2 (en) System, method and apparatus for energy efficiency and energy conservation by configuring power management parameters during run time
JP5317360B2 (ja) データ処理システムにおいてシステムの電力損失通知をしきい値処理するためのコンピュータ・プログラム、システム、および方法
JP2009181571A (ja) 大規模データセンターまたはitインフラにおけるエネルギー消費の確定および動的制御方法
US11003239B2 (en) Power consumption management in an information handling system
CN109917900B (zh) 系统电源管理方法及计算机系统
US11733762B2 (en) Method to allow for higher usable power capacity in a redundant power configuration
US20200326760A1 (en) Control fan using neural network
CN107533348B (zh) 热管理高性能计算系统的方法和装置及计算机可读介质
CN110362180A (zh) 一种服务器电源寿命均衡控制装置及方法
TW202227975A (zh) 機架管理系統、方法及控制器
US11181961B2 (en) System and method for increasing power delivery to information handling systems
US8745189B2 (en) Method and power-saving control device for controlling operations of computing units
CN116302655A (zh) 断电保护方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200217

R150 Certificate of patent or registration of utility model

Ref document number: 6663970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250