JP6703045B2 - 機器ラック及び機器ラックからの状態報告を保証する方法 - Google Patents

機器ラック及び機器ラックからの状態報告を保証する方法 Download PDF

Info

Publication number
JP6703045B2
JP6703045B2 JP2018127326A JP2018127326A JP6703045B2 JP 6703045 B2 JP6703045 B2 JP 6703045B2 JP 2018127326 A JP2018127326 A JP 2018127326A JP 2018127326 A JP2018127326 A JP 2018127326A JP 6703045 B2 JP6703045 B2 JP 6703045B2
Authority
JP
Japan
Prior art keywords
management controller
power supply
supply unit
chassis
system bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018127326A
Other languages
English (en)
Other versions
JP2019121338A (ja
Inventor
樂生 周
樂生 周
添榮 張
添榮 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of JP2019121338A publication Critical patent/JP2019121338A/ja
Application granted granted Critical
Publication of JP6703045B2 publication Critical patent/JP6703045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/02Constructional details
    • H04Q1/025Cabinets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/02Constructional details
    • H04Q1/03Power distribution arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0016Inter-integrated circuit (I2C)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Small-Scale Networks (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Description

本開示は、一般に、複数のネットワーク装置を動作させるためのシャーシに関する。より詳細には、本開示の態様は、シャーシ取り付けネットワーク装置の動作を監視する複数のシャーシ管理コントローラのネットワーク接続に関する。
計算処理用途のためのクラウドの出現によって、リモート接続されたコンピュータ装置ユーザによってアクセスされるデータを記憶しアプリケーションを実行する、データセンタとして知られるオフサイト施設の需要が増えてきた。そのようなデータセンタは、典型的には、リモートコンピュータユーザが好都合にアクセスできるように、データを記憶し管理する膨大な数のサーバ、スイッチ及び記憶装置を有する。典型的なデータセンタは、電力及び通信接続が付随する物理ラック構造物を有する。このラックは、データセンタの部屋全体に配列される。各ラックは、サーバ、スイッチ、記憶装置などの複数の装置を保持できる横向きスロット又はシャーシを有するフレームを有する。最新のデータセンタでは、そのようなラック構造物内に積み重ねられた多数のそのような装置が見られる。例えば、幾つかのデータセンタには、何万台ものサーバと、それに付随する記憶装置とネットワークスイッチがある。したがって、典型的なデータセンタは、何万又は何十万の個別のラック内に何万台更には何十万台もの装置を含みうる。データセンタは、典型的には、機器の適切な動作を監視し保証するためにコントロールセンタ内に管理システムを有する。効率的に管理するため、管理者は、データセンタ内の各ラック内の機器の瞬間の状態に関する知識に依存する。
図1に、典型的なラックシステム10を示す。ラックシステム10は、パワーシェルフ14に結合されたシャーシ管理コントローラ(CMC)12を有する。パワーシェルフ14は、幾つかの電源ユニットとそれに対応する冷却用ファンを有する。パワーシェルフ14は、ネットワーク装置バンク16及び18に接続され、バンク16及び18内のネットワーク装置のそれぞれに電力を提供する。この例では、ネットワーク装置バンク16及び18内のネットワーク装置は、ブレードサーバでよい。ラックシステム10は、また、管理スイッチ20と2台のデータスイッチ22及び24を含む。管理スイッチ20は、パワーシェルフ14上の電源を含むバンク16及び18に格納されたネットワーク装置の動作を監視する。データスイッチ22及び24は、バンク16及び18に格納されたネットワーク装置間のデータ通信を提供する。
CMC12は、バンク16及び18内のネットワーク装置を管理する。CMC12は、設定及び監視タスクを実行し、バンク16及び18内のネットワーク装置への電力を制御し、バンク16及び18内のネットワーク装置に警告を提供する。CMC12は、マイクロプロセッサとメモリを有する。CMC12は、パワーシェルフ14上の電源によって電力供給される。
CMC12は、データセンタ内のラック10の管理に重要な役割を果たす。CMC12は、データセンタ管理ソフトウェアのためにラック10からラックベースでの動作情報を収集する。動作情報には、(1)ラック全消費電力、(2)各ネットワーク装置からのIPアドレスリスト、(3)全体及び個別のラック構成要素の健全性に関する状態、並びに(4)ラックベースでのファン及び温度状態が含まれうる。そのような情報は、CMC12や管理スイッチ20上のラック管理コントローラなどのラックの全ての管理ユニットに対して、ラック電力キャッピングやラックID更新などの機能を実行するためにデータセンタ管理ソフトウェアによって使用されうる。したがって、データセンタ管理者は、そのような情報の収集によってデータセンタの各ラックシステム内の装置の動作をリモートで監視できる。
CMC12のためにパワーシェルフ14上の構成要素との通信を実施する幾つかの周知の方法がある。例えば、CMC12は、インターインテグレーテッドサーキットプロトコル(I2C)、ユニバーサル非同期型レシーバ/トランスミッタ(UART)、又はパワーシェルフ14からの動作データを管理スイッチ20と通信するネットワークを使用できる。
動作では、CMC12は、パワーシェルフ14の状態を定期的にポーリングする。リモート管理者は、管理スイッチ20などの管理スイッチを介してコマンドを送ってパワーシェルフ状態を取得できる。次に、CMC12は、リモート管理者からの要求に応じてパワーシェルフ14の状態を報告する。警告が出されたとき、CMC12は、潜在的故障などの潜在的状況への対応を強化するために、パワーシェルフ14の状態をリモート管理ノードに能動的に報告する。
「Managing shared resources in a multi-computer system with failover support」と題する米国特許出願公開第2012/0005348号明細書
一般に、図1で、各キャニスタには1台のCMC−たとえばラック10のようなラック−しかない。しかしながら、データセンタのリモート管理者は、CMC12が故障するかオフラインになると、キャニスタ又はラックパワーシェルフ14の状態監視を行う能力を失う。これにより、ラック10から提供される全ての電力及び支援からの問題が報告されなくなるので、ラック10の動作が妨げられる。
したがって、CMC12の故障によって、ラック10内の全てのネットワーク装置の動作が妨げられる。正常状態では、キャニスタ又はラック10内のCMC12は、パワーシェルフ14の状態を監視し、その状態を管理ノードに報告する。CMC12の故障又は誤動作は、ネットワーク装置の監視を妨げ、したがって、ユニットが検査されうるまで動作を停止しなければならない。幾つかの現行のラック設計は、第1のCMCが故障した場合に、キャニスタ又はラック状態をリモート管理者に報告するバックアップCMCを備える。しかしながら、両方のCMCがリモート管理者から通信を遮断される可能性があるので、これは、完全な解決策ではない。更に、キャニスタ上の両方のCMCが故障すると、動作が停止されなければならない。
したがって、CMCがオフラインになった場合でも、支援シェルフ状態のリモート監視を可能にするラックシステムが必要である。更に、CMCがラック上の装置の監視データを報告できない場合でも、ラックの動作を可能にする機構が必要である。更に、ラック内の複数の装置の状態監視データを収集する複数のCMCを有するラックシステムが必要である。
特許文献1は、複合コンピュータシステムに挿入されたコンピュータから、挿入されたコンピュータの優先順位を表わす優先順位検出信号を読み取るステップと、コンピュータから、複合コンピュータシステムに現在挿入されている全てのコンピュータの挿入状態を表わす平面検出信号を読み取るステップと、優先順位検出信号と平面検出信号に従って、コンピュータが、複合コンピュータシステムに挿入された全てのコンピュータの中で最高優先順位を有するかどうかを決定するステップと、コンピュータが最高優先順位を有するという決定に応じて、共用リソースを監視し、最高優先順位コンピュータと関連付けられた特定出力信号を出力するステップであって、特定出力信号が、複合コンピュータシステムに現在挿入されている他のコンピュータに対して最高優先順位コンピュータの識別を提供し、最高優先順位コンピュータによって共用リソースの制御を提示するステップを開示した。
1つの開示される例は、管理コントローラと、第1及び第2のシャーシとを含む機器ラックである。前記第1のシャーシは、第1の電源ユニットと、該第1の電源ユニットに結合された第1のシステムバスと、該第1のシステムバスに結合された第1のシャーシ管理コントローラと、第1のネットワーク装置とを含む。前記第1の電源ユニットは、前記第1のシステムバスに状態データを送る。前記第2のシャーシは、第2の電源ユニットと、該第2の電源ユニットに結合された第2のシステムバスと、該第2のシステムバスに結合された第2のシャーシ管理コントローラと、第2のネットワーク装置とを含む。前記第2の電源ユニットは、前記第2のシステムバスに状態データを送る。前記第1のシャーシ管理コントローラは、前記第1の電源ユニットから状態データを取得するために前記第1のシステムバスと通信する。前記第1のシャーシ管理コントローラは、前記第2の電源ユニットから状態データを取得するために前記第2のシステムバスと通信する。前記第1のシャーシ管理コントローラは、状態データを中継するために管理スイッチと通信する。第2のシャーシ管理コントローラは、前記第1の電源ユニットから状態データを取得するために前記第1のシステムバスと通信する。前記第2のシャーシ管理コントローラは、前記第2の電源ユニットから状態データを取得するために前記第2のシステムバスと通信する。管理コントローラは、状態データを中継するために前記管理コントローラと前記第2のシャーシ管理コントローラの間の通信を確立する働きをする。
別の開示された例は、機器ラックからの状態報告を保証する方法である。前記機器ラックは、管理コントローラを有する。前記機器ラックは、第1の電源ユニット、第1のシステムバス、第1のシャーシ管理コントローラ及び第1のネットワーク装置を含む第1のシャーシを有する。前記機器ラックは、第2の電源ユニット、第2のシステムバス、第2のシャーシ管理コントローラ及び第2のネットワーク装置を含む第2のシャーシを有する。状態データが、前記第1の電源ユニットから前記第1のシステムバスに提供される。前記状態データが、前記第2の電源ユニットから前記第2のシステムバスに提供される。前記第1のシャーシ管理コントローラと前記第1のシステムバスの間に通信が確立されて、前記第1の電源ユニットから状態データが取得される。前記第1のシャーシ管理コントローラと前記第2のシステムバスの間に通信が確立されて、前記第2の電源ユニットから状態データが取得される。状態データは、前記第1のシャーシ管理コントローラによって管理スイッチに中継される。前記第2のシャーシ管理コントローラと前記第2のシステムバスの間に通信が確立されて、前記第2の電源ユニットから状態データが取得される。前記第2のシャーシ管理コントローラと前記第1のシステムバスの間に通信が確立されて、前記第1の電源ユニットから状態データが取得される。前記第1のシャーシ管理コントローラからの状態データが中継されないという決定に基づいて、前記第2のシャーシ管理コントローラによる状態データの中継が、前記管理コントローラに対して行われる。
上記の要約は、本開示の各実施形態又は全ての態様を表わすものではない。より正確に言うと、前述の要約は、本明細書に記載された新規の態様及び特徴の幾つかの例を提供するに過ぎない。本開示の上記の特徴及び利点並びに他の特徴及び利点は、添付図面及び添付の特許請求の範囲に関連して行われるとき本発明を実現する代表的な実施形態及び形態の以下の詳細な説明から容易に明らかになるであろう。
開示は、添付図面に関連した典型的実施形態の以下の記述からよりよく理解されるであろう。
ラック動作データを監視する単一CMCを有する先行技術のラックシステムの例を示す図である。 マスタCMCが故障した場合に継続的な報告を可能にするパートナCMCを含む例示的ラック内の構成要素のブロック図である。 CMCがそれぞれのパワーシェルフを監視する能力を示す図2の例示的ラックの構成要素のブロック図である。 通常動作マスタCMCからの状態データの流れを示す図2の例示的ラックの構成要素のブロック図である。 情報を維持しマスタCMC機能をパートナCMCに切り替えるために管理コントローラによって実行されるプロセスの流れ図である。 本開示の様々な例による典型的システムを示す図である。 本開示の様々な例による典型的システムを示す図である。
本開示は、様々な修正及び代替形態が可能である。幾つかの代表的な実施形態は、図面に例として示され、本明細書で詳述される。しかしながら、本発明が、開示された特定の形態に限定されないことを理解されたい。より正確に言うと、開示は、添付の特許請求の範囲で定義されたような本発明の趣旨及び範囲内にある修正物、等価物、及び代替物を全て対象として含む。
本発明は、様々な形態で実施されうる。代表的な実施形態が図面に示され、本明細書で詳述される。本開示は、本開示の原理の例又は説明であり、開示の広い態様を、示された実施形態に限定するものではない。その範囲で、例えば、要約(Abstract)、課題を解決するための手段(Summary)及び発明を実施するための形態(Detailed Description)の節に開示されているが、特許請求の範囲に明示的に記載されていない要素及び制限は、含意、参照又は他の方法によって、単独又は集合的に、特許請求の範囲に組み込まれるべきでない。この詳細な説明のため、具体的に否定されない限り、単数は複数を含み逆の場合も同様であり、用語「含む(including)」は、「限定なしに含む」ことを意味する。更に、「約(about)」、「ほぼ(almost)」、「実質的に(substantially)」、「近似的に(approximately)」などの近似の用語は、本明細書では、「における(at)」、「近い(near)」、「に近い(nearly at」)、「〜の3〜5%以内(within 3-5% of)」、「許容可能な製造公差内」、又はこれらの任意の論理的組み合わせを意味するために使用されうる。
図2は、単一CMC又は単一ボード上の複数のCMCが故障した場合でもラック100上の全ての装置の動作データの監視を可能にするために、異なるシャーシユニット内の異なるシェルフ又はボード上に複数のCMCを有する例示的な複式シャーシキャニスタラック100を示す。動作データ状態を取得する別個シャーシ上に少なくとも1つのパートナCMCを追加することにより、マスタCMCが状態情報を提供できない場合でも、連続監視が可能になり、したがってラック100の動作が可能になる。
ラック100は、管理スイッチ110と、2つのデータスイッチ112及び114を有する。ラック100は、第1のシャーシユニット120と第2のシャーシユニット130を含む。管理スイッチ110は、ラック100上の全ての装置の動作を監視する管理コントローラとして働くコントローラを含みうる。第1のシャーシユニット120は、サーバ122、124及び126などの様々なネットワーク装置を含む。シャーシユニット120は、また、シャーシユニット120のサーバ122、124及び126用の電源ユニット及びその他の支援電子回路を収容するパワーシェルフ128を含む。他のシャーシユニット130は、サーバ132、134及び136などの様々なネットワーク装置を含む。シャーシユニット130は、また、シャーシユニット130のネットワーク装置132、134及び136用の電源ユニット及び他の支援電子回路を収容するパワーシェルフ138を含む。例えば、シャーシユニット120及び130は、スロットを画定する取付け機構を保持する平行な側壁を備えうる。パワーシェルフは、シャーシユニット内の任意の位置に取り付けられうる。それぞれのネットワーク装置は、スロットに挿入され、それぞれのパワーシェルフ上の電源ユニットに接続されうる。
図2は、また、パワーシェルフ128及び138のブロック図を示す。パワーシェルフ128は、一連の電源ユニット202、204及び206を有する。電源ユニット202、204及び206はそれぞれ、対応するファン212、214及び216を有する。パワーシェルフ128は、パワーシェルフ128の動作を監視するCMC220を有する。この例では、パワーシェルフ128は、サーバ122、124及び126などの関連ネットワーク装置に電力を提供する。システム管理(SM)バススイッチ222は、システムバス224を介して電源ユニット202、204及び206並びにファン212、214及び216と通信する。SMバススイッチ222は、動作データを受け取り、電源ユニット202、204及び206並びにファン212、214及び216にオン/オフコマンドを伝える働きをする。CMC220は、ネットワークインタフェース226に結合され、SMバススイッチ222に結合される。
同様に、パワーシェルフ138は、一連の電源ユニット252、254及び256を有する。電源ユニット252、254及び256はそれぞれ、対応するファン262、264及び266を有する。パワーシェルフ138は、パワーシェルフ138の動作を監視するCMC270を有する。この例では、パワーシェルフ138は、サーバ132、134及び136などの関連ネットワーク装置に電力を提供する。システム管理(SM)バススイッチ272は、システムバス274を介して、電源ユニット252、254及び256並びにファン262、264及び266と通信する。SMバススイッチ272は、動作データを受け取り、電源ユニット252、254及び256並びにファン262、264及び266にオン/オフコマンドを通信する働きをする。CMC270は、ネットワークインタフェース276に結合され、またSMバススイッチ272に結合される。
図2に示されたように、CMC220及び270は、それぞれのネットワークインタフェース226及び276を介してネットワークによって管理スイッチ110に接続される。ネットワークインタフェース226は、SMバススイッチ272にも接続される。ネットワークインタフェース276は、SMバススイッチ222に接続される。後述されるように、この機構は、CMC220又は270がパワーシェルフ128又は138を監視し制御することを可能にする。
この例では、CMC220は、ラック100のマスタCMCであり、CMC270はパートナCMCである。当然ながら、CMC270は、マスタCMCとして働くことができ、CMC220は、ラック100のパートナCMCとして働く。CMCを有する追加のシャーシユニットが、ラック100内に取り付けられた例では、そのような他のCMCが、マスタCMCとして働きうる。この例では、CMC220は、SMバススイッチ222を介してパワーシェルフ128のパワーシェルフ状態を定期的にポーリングする。このようにして、CMC220は、電源ユニット202、204、206並びにファン212、214及び216の動作状態データを収集する。CMC220は、また、パワーシェルフ138の状態に関してパートナCMC270をポーリングする。CMC270は、SMバススイッチ272を介してそのような状態データを、電源ユニット252、254、256並びにファン262、264及び266の動作状態データに関して収集する。
リモート管理者は、CMC220へのネットワーク接続を介して管理スイッチ110からパワーシェルフ状態を取得するコマンドを送信できる。次に、CMC220は、管理スイッチ110を介したリモート管理者からの要求に応じてパワーシェルフ状態を報告する。冗長CMC220及び270は、I2C、CPIO、UART又は類似のネットワークプロトコルなどの接続によって互いに通信できる。2つのCMC220と270の間のハンドシェークが、適切なプロトコルによるハートビートネゴシエーションによって行われる。この例では、このネゴシエーションは、I2C、CPIO、UART又は類似のネットワークなどのプロトコルによって行われうる。したがって、CMC220及び270は、それぞれのパワーシェルフ128及び138からの電力状態情報を交換できる。CMC220又は270の一方が、他方のCMCが通信によるサービスを停止していることを発見した場合、そのCMCは、監視機能を引き継ぐ。
CMC220が故障した場合、パートナCMC270は、元のマスタCMCが故障したか管理スイッチ110へのネットワーク接続が絶たれたことを検出できる。あるいは、管理スイッチ110のコントローラなどの管理コントローラは、元のマスタCMCからの通信の失敗を検出できる。次に、パートナCMC270は、状態データをリモート管理者に報告する役割を引き継ぎ、パートナCMCが既にそのような機能を引き継いだという警告をリモート管理者に送る。したがって、リモート管理者に報告される情報は、元のマスタCMCがまだ機能している場合と同じになる。
図3は、CMC220がマスタCMCとして指定されたパワーシェルフ128及びパワーシェルフ138を示す。図3の類似要素には、図2の類似要素の番号が付けられている。通常動作では、CMC220及び270は両方とも、それぞれのパワーシェルフ128及び138上のそれぞれの電源ユニットから全てのセンサ情報を能動的に読み取る。CMC220などのCMCの1つが、マスタCMCとして指定される。この例では、CMC270は、パートナCMCであり、SMバススイッチ272から収集した状態情報を、図3に線300によって示されたように、CMC220に直接送らせる。また、CMC220は、SMバススイッチ222から収集した状態情報を、線302によって示されたように、CMC270に送らせる。マスタCMCとして指定されたCMC220は、両方のパワーシェルフ128及び138上の全ての構成要素の状態を、管理スイッチ110(図2)へのネットワーク接続によって、リモート管理に報告する。接続は、管理スイッチ110への能動的なデータ伝送を示す線310によって示されうる。両方のCMC220及び270が、それぞれのSMバススイッチ222及び272を介して情報を取得できるので、CMC220及び270の両方が常に同期される。CMC220から管理スイッチに伝送される動作又は状態データは、インターインテグレーテッドサーキットプロトコル(I2C)、ユニバーサル非同期レシーバ/トランスミッタ(UART)、又はネットワークを介したものでよい。
図4は、パワーシェルフ128とパワーシェルフ138を示し、この場合、CMC220は、管理スイッチ110と通信していない。図4の類似要素は、図2の類似要素の番号で示される。CMC220からの通信がない理由は、CMC220の故障又は通信路の切断であることある。CMC220及び270は両方とも、それぞれのパワーシェルフ128及び138上のそれぞれの電源ユニットから全てのセンサ情報を能動的に読み取る。この例では、CMC270は、パートナCMCであり、SMバススイッチ272から収集された状態情報を、線400によって示されたように、CMC220に直接送らせる。CMC220は、また、SMバススイッチ222から収集された状態情報を、線402によって示されたように、CMC270に送らせる。この場合、システムは、管理スイッチ110(図2)との通信を開始するパートナCMC(CMC270など)に切り替わる。この接続は、管理スイッチ110へのデータの能動的伝送を示す線410によって示される。CMC270から管理スイッチ110に送られる動作又は状態データは、インターインテグレーテッドサーキットプロトコル(I2C)、ユニバーサル非同期レシーバ/トランスミッタ(UART)又はネットワークを介したものでよい。
SMバススイッチ222及び272には、取り付けられたSMバスをあるものから別のものに切り替えることができる限り他の装置を使用できることを理解されたい。例えば、様々なSMバスからの入力に同時に通信できるSMバスアービタが使用されうる。SMバスアービタは、どのバスが最初にターゲットにトークできるかを決めるアービトレータの役割をすることができる。あるいは、ターゲットに通信するバスを選択するためにマルチプレクサも使用できる。
図5の流れ図は、図2のラック100が図2のCMCの一方からの状態情報の流れを保証する例示的な機械可読命令を表す。この例では、機械可読命令は、(a)プロセッサ、(b)コントローラ、及び/又は(c)1つ以上の他の適切な処理装置によって実行されるアルゴリズムを含む。アルゴリズムは、例えば、フラッシュメモリ、CD−ROM、フロッピディスク、ハードディスク、デジタルビデオ(多用途)ディスク(DVD)、又は他のメモリ装置などの有形媒体上に記憶されたソフトウェアで実施されうる。しかしながら、当業者は、アルゴリズム全体及び/又はその一部分が、代替として、プロセッサ以外の装置によって実行されかつ/又はファームウェア又は専用ハードウェアで周知の方法で実施されうることを容易に理解するであろう(例えば、特定用途向け集積回路[ASIC]、プログラム可能論理回路[PLD]、フィールドプログラム可能論理回路[FPLD]、フィールドプログラマブルゲートアレイ[FPGA]、個別ロジックなどによって実現されうる)。例えば、インタフェースの構成要素のどれか又は全てが、ソフトウェア、ハードウェア、及び/又はファームウェアによって実現されうる。また、図5のフローチャートによって表わされた機械可読命令の幾つか又は全てが、手動で実行されうる。更に、図5に示されたフローチャートに関連して例示的なアルゴリズムを記述するが、当業者は、代替として、例示的な機械可読命令を実行する他の多くの方法が使用されうることを容易に認識するであろう。例えば、ブロックの実行順序が変更されてもよく、及び/又は記述されたブロックの幾つかが変更、削除又は組み合わせられてもよい。
図5は、シャーシユニット120及び130(図2)の監視を保証するために例示的ラック100を操作するプロセスの例示的な流れ図を示す。この例では、図2のCMCのそれぞれ(CMC220及びCMC270など)が、それぞれのパワーシェルフ状態をポーリングする(500)。CMCはそれぞれ、図2のバススイッチ222などのバススイッチから動作状態データを収集する(502)。CMCは、また、パートナCMCによって監視されたそれぞれのパワーシェルフの状態に関して全てのパートナCMCをポーリングする(504)。管理スイッチ110(図2)の管理コントローラは、マスタCMC220が動作しているかどうかを決定する(506)。マスタCMC220が動作している場合、管理スイッチ110は、パワーシェルフ状態を取得するために要求をマスタCMC220に送る(508)。要求を受け取ると、CMC220は、各シェルフの収集された動作データを送る(510)。
現在のマスタCMCが動作できない場合、管理スイッチ110は、マスタCMCの役割を引き受けるようにCMC270の状態を切り替える(512)。次に、管理スイッチ110は、パワーシェルフ状態を取得する要求を新しいマスタCMC270に送る(514)。CMC270は、要求を受け取ると、各シェルフの収集された動作データを管理スイッチ110に送る(516)。
図6は、例示的な計算処理システム600であり、計算処理システムの構成要素は、バス602を使用して互いに電気通信する。システム600は、処理ユニット(CPU又はプロセッサ)630と、システムメモリ604(例えば、読み取り専用メモリ(ROM)606及びランダムアクセスメモリ(RAM)608)を含む様々なシステム構成要素をプロセッサ630に結合するシステムバス602とを含む。システム600は、プロセッサ630と直接接続されるか、プロセッサ630と接近するか、プロセッサ630の一部として一体化された高速メモリのキャッシュを含みうる。システム600は、メモリ604及び/又は記憶装置612からのデータを、プロセッサ630による迅速アクセスされるキャッシュ628に複写できる。このようにして、キャッシュは、データを待っている間にプロセッサ630の性能向上を提供できる。以上その他のモジュールは、様々なアクションを実行するために、プロセッサ630を制御するかそのプロセッサ630を制御するように構成されうる。他のシステムメモリ604も使用可能でよい。メモリ604は、異なる性能特性を有する複数の様々なタイプのメモリを含みうる。プロセッサ630は、任意の汎用プロセッサと、記憶装置612に埋め込まれたモジュール1 614、モジュール2 616、モジュール3 618などのハードウェアモジュール又はソフトウェアモジュールも含みうる。ハードウェアモジュール又はソフトウェアモジュールは、プロセッサ630、並びにソフトウェア命令が実際のプロセッサ設計に組み込まれた専用プロセッサを制御するように構成される。プロセッサ630は、本質的に、複数のコア又はプロセッサ、バス、メモリコントローラ、キャッシュなどを含む完全自立式の計算処理システムでよい。マルチコアプロセッサは、対称的でも非対称的でもよい。
計算処理装置600とのユーザ対話を可能にするため、入力装置620が、入力機構として提供される。入力装置620は、会話用のマイクロフォン、ジェスチャ又は図形入力用のタッチセンシティブスクリーン、キーボード、マウス、モーション入力などを含みうる。幾つかの例では、多モードシステムは、ユーザが、システム600と通信するために複数タイプの入力を提供することを可能にできる。この例では、出力装置622も提供される。通信インタフェース624は、ユーザ入力とシステム出力を支配し管理できる。
記憶装置612は、コンピュータによってアクセス可能なデータを記憶する不揮発性メモリでよい。記憶装置612は、磁気カセット、フラッシュメモリカード、ソリッドステートメモリ装置、デジタル多機能ディスク、カートリッジ、ランダムアクセスメモリ(RAM)608、読み取り専用メモリ(ROM)606、及びこれらの複合物でよい。
コントローラ610は、BMC(ベースボード管理コントローラ)などのシステム600上の専用マイクロコントローラ又はプロセッサでよい。場合によって、コントローラ610は、インテリジェントプラットフォーム管理インタフェース(IPMI)の一部でよい。更に、場合によって、コントローラ610は、システム600のマザーボード又は主回路基板に埋め込まれうる。コントローラ610は、システム管理ソフトウェアとプラットホームハードウェアの間のインタフェースを管理できる。また、コントローラ610は、更に後述されるように、コントローラや周辺構成要素などの様々なシステム機器及び構成要素(内部及び/又は外部)と通信できる。
コントローラ610は、通知、警告、及び/又はイベントに対する固有の応答を生成し、リモート装置又は構成要素(例えば、電子メールメッセージ、ネットワークメッセージなど)と通信して、自動ハードウェア回復手順などのための命令又はコマンドを生成できる。管理者は、また、更に後述されるように、コントローラ610とリモートで通信して、特定のハードウェア回復手順又は動作を開始又は行うことができる。
コントローラ610は、また、コントローラ610が受け取ったイベント、警告、及び通知を管理及び維持するためにシステムイベントログコントローラ及び/又は記憶装置を含みうる。例えば、コントローラ610又はシステムイベントログコントローラは、1つ以上の装置及び構成要素から警告又は通知を受け取り、システムイベントログ記憶構成要素内に警告又は通知を維持できる。
フラッシュメモリ632は、記憶及び/又はデータ転送のためにシステム600によって使用されうる電子式不揮発性コンピュータ記憶媒体又はチップでよい。フラッシュメモリ632は、電気的消去及び/又は再プログラムされうる。例えば、フラッシュメモリ632には、EPROM(消去可能PROM)、EEPROM(電気的消去可能プログラム可能な読み取り専用メモリ)、ROM、NVRAM、又はCMOS(相補型金属酸化膜半導体)が含まれうる。フラッシュメモリ632は、ファームウェア634に専用化された1組の構成に加えて、システム600が最初に起動されたときにシステム600によって実行されるファームウェア634を記憶できる。フラッシュメモリ632は、また、ファームウェア634によって使用される構成を記憶できる。
ファームウェア634は、EFI(拡張可能ファームウェアインタフェース)やUEFI(統合拡張可能ファームウェアインタフェース)などの基本入出力システム又は等価物を含みうる。ファームウェア634は、システム600が起動されるたびにシーケンスプログラムとしてロード及び実行されうる。ファームウェア634は、1組の構成に基づいてシステム600内にあるハードウェアを認識、初期化、試験できる。ファームウェア634は、システム600上でPOST(電源投入時自己試験)などの自己試験を実行できる。この自己試験は、ハードディスクドライブ、光学読み取り装置、冷却装置、メモリモジュール、拡張カードなどの様々なハードウェア構成要素の機能を試験できる。ファームウェア634は、オペレーティングシステム(OS)を記憶するメモリ604、ROM606、RAM608及び/又は記憶装置612内の領域をアドレス指定し割り当てることができる。ファームウェア634は、ブートローダ及び/又はOSをロードし、システム600の制御をOSに提供できる。
システム600のファームウェア634は、ファームウェア634がシステム600内の様々なハードウェア構成要素をどのように制御するかを定義するファームウェア構成を含みうる。ファームウェア構成は、システム600内の様々なハードウェア構成要素が始動される順序を決定できる。ファームウェア634は、ファームウェアデフォルト構成がパラメータと異なりうる様々な異なるパラメータを設定できるようにするUEFIなどのインタフェースを提供できる。例えば、ユーザ(例えば、管理者)は、ファームウェア634を使用してクロックとバス速度を指定し、どの周辺装置がシステム600に取り付けられるかを定義し、健全状態(例えば、ファン回転速度及びCPU温度制限)の監視を設定し、及び/又はシステム600の全体性能及び消費電力に影響を及ぼす様々な他のパラメータを提供できる。ファームウェア634は、フラッシュメモリ632に記憶されるように示されているが、当業者は、ファームウェア634がメモリ604やROM606などの他のメモリ構成要素に記憶されうることを容易に理解するであろう。
システム600は、1つ以上のセンサ626を含みうる。1つ以上のセンサ626には、例えば、1つ以上の温度センサ、サーマルセンサ、酸素センサ、化学センサ、ノイズセンサ、ヒートセンサ、電流センサ、検電器、空気流量センサ、流量センサ、赤外線放射温度計、熱流束センサ、温度計、高温計などが含まれうる。例えば、1つ以上のセンサ626は、例えば、バス602を介して、プロセッサ、キャッシュ628、フラッシュメモリ632、通信インタフェース624、メモリ604、ROM606、RAM608、コントローラ610及び記憶装置612と通信できる。1つ以上のセンサ626は、システム内の他の構成要素と、インターインテグレーテッドサーキット(I2C)、汎用出力(GPO)などの1つ以上の異なる手段によって通信できる。また、システム600上の様々なタイプのセンサ(例えば、センサ626)は、冷却ファン速度、電力状態、オペレーティングシステム(OS)状態、ハードウェア状態などのパラメータについてコントローラ610に報告できる。表示装置636は、コントローラ610によって実行されるアプリケーションに関連付けられたグラフィックを提供するために、システム600によって使用されうる。
図7は、記述された方法又は動作を実行し、グラフィックカルユーザインタフェース(GUI)を生成し表示する際に使用されうる、チップセットアーキテクチャを有する例示的なコンピュータシステム700を示す。コンピュータシステム700は、開示された技術を実施するために使用されうるコンピュータハードウェア、ソフトウェア及びファームウェアを含みうる。システム700は、識別された計算を実行するように構成されたソフトウェア、ファームウェア及びハードウェアを実行できる様々な物理的及び/又は論理的に別個のリソースを表すプロセッサ710を含みうる。プロセッサ710は、プロセッサ710への入出力を制御できるチップセット702と通信できる。この例では、チップセット702は、表示装置などの出力装置714に情報を出力し、また記憶装置716に情報を読み書きできる。例えば、記憶装置716には、磁気媒体とソリッドステート媒体が含まれうる。チップセット702は、また、RAM718からデータを読み出しデータを書き込みできる。チップセット702とインタフェースするために、様々なユーザインタフェース構成要素706とインタフェースするブリッジ704が提供されうる。ユーザインタフェース構成要素706には、キーボード、マイクロフォン、タッチ検出及び処理回路、及びマウスなどのポインティング装置が含まれうる。
チップセット702は、また、様々な物理インタフェースを有しうる1つ以上の通信インタフェース708とインタフェースできる。そのような通信インタフェースには、有線及び無線ローカルエリアネットワーク、広帯域無線ネットワーク、及びパーソナルエリアネットワークのためのインタフェースが含まれうる。更に、機械は、ユーザインタフェース構成要素706を介してユーザから入力を受け取り、プロセッサ710を使用してそのような入力を解釈することによってブラウズ機能などの適切な機能を実行できる。
更に、チップセット702は、また、起動時にコンピュータシステム700によって実行されうるファームウェア712と通信できる。ファームウェア712は、1組のファームウェア構成に基づいてコンピュータシステム700内にあるハードウェアを理解、初期化、試験できる。ファームウェア712は、システム700上でPOSTなどの自己試験を実行できる。自己試験は、様々なハードウェア構成要素702〜718の機能を試験できる。ファームウェア712は、OSを記憶するメモリ718内の領域をアドレス指定し割り当てることができる。ファームウェア712は、ブートローダ及び/又はOSをロードし、システム700の制御をOSに提供できる。場合によって、ファームウェア712は、ハードウェア構成要素702〜710及び714〜718と通信できる。ここで、ファームウェア712は、チップセット702及び/又は1つ以上の他の構成要素によって、ハードウェア構成要素702〜710及び714〜718と通信できる。場合によって、ファームウェア712は、ハードウェア構成要素702〜710及び714〜718と直接通信できる。
例示的なシステム600(図6)及び700は、複数のプロセッサ(例えば、630、710)を有してもよく、より高い処理性能を提供するためにネットワーク接続された一群又はクラスタの計算処理装置の一部でもよい。
本明細書で使用される用語は、特定の実施形態について述べるためだけのものであり、本発明を限定するものではない。本明細書で使用されるとき、単数形「a」、「an」及び「the」は、文脈で特に断らない限り、複数形も含む。更に、用語「含む(including)」、「含む(includes)」、「有する(having)」、「有する(has)」、「備える(with)」、又はこれらの変形は、詳細な説明及び/又は特許請求の範囲で使用される範囲で、そのような用語は、「含む(comprising)」と同じように包括的である。
特に定義されない限り、本明細書で使用される全ての用語(技術及び科学用語を含む)は、当業者によって一般に理解される意味と同じ意味を有する。更に、一般に使用されている辞書で定義されたような用語は、関連技術の文脈での意味と一致する意味を有すると解釈されるべきであり、本明細書で明示的に定義されない限り、理想的又は過度に形式的な意味で解釈されない。
以上、本発明の様々な実施形態について述べたが、それらの実施形態が、単なる例であり限定ではないことを理解されたい。開示された実施形態に対する多数の変更が、本発明の趣旨又は範囲から逸脱せずに、本明細書の開示に従って行われうる。したがって、本発明の広さ及び範囲は、前述の実施形態のいずれによっても限定されるべきでない。より正確に言うと、本発明の範囲は、以下の特許請求の範囲とその等価物によって定義されるべきである。
本発明を1つ以上の実施態様に関して図示し述べてきたが、本明細書及び添付図面の読み取りと理解に基づいて、等価な変更及び修正が行われる又は当業者に知られる。更に、本発明の特定の特徴が、幾つかの実施態様の1つのみに関して開示されたが、そのような特徴が、任意の所定又は特定用途に望ましく有利になるように、他の実施態様の1つ以上の他の特徴と組み合わせられうる。
110 管理スイッチ
112,114 データスイッチ
122,124,126,132,134,136 サーバ
128,138 パワーシェルフ/CMC
202,204,206,252,254,256 ファン
222,272 SMバススイッチ

Claims (9)

  1. 機器ラックであって、
    管理コントローラと、
    第1の電源ユニット、前記第1の電源ユニットに結合された第1のシステムバス、前記第1のシステムバスに結合された第1のシャーシ管理コントローラ、及び第1のネットワーク装置を含み、かつ、前記第1の電源ユニットが前記第1のシステムバスに状態データを送る第1のシャーシと、
    第2の電源ユニット、前記第2の電源ユニットに結合された第2のシステムバス、前記第2のシステムバスに結合された第2のシャーシ管理コントローラ、及び第2のネットワーク装置を含み、かつ、前記第2の電源ユニットが前記第2のシステムバスに状態データを送る第2のシャーシと、
    前記第1のシャーシ管理コントローラと前記第2のシャーシ管理コントローラとの間で状態データを切り換えるのに用いられる第1のバスアービタと第2のバスアービタをそれぞれ備え
    前記第1のシャーシ管理コントローラが、前記第1のシステムバスと通信して前記第1の電源ユニットから状態データを取得し、前記第2のシステムバスと通信して前記第2の電源ユニットから状態データを取得し、前記第1のシャーシ管理コントローラが、前記管理コントローラと通信して前記状態データを中継し、
    前記第2のシャーシ管理コントローラが、前記第1のシステムバスと通信して前記第1の電源ユニットから状態データを取得し、前記第2のシステムバスと通信して前記第2の電源ユニットから状態データを取得し、
    前記管理コントローラと前記第2のシャーシ管理コントローラの間の通信を確立して前記状態データを中継する働きをする機器ラック。
  2. 前記第1の電源ユニットが、複数の電源ユニットの1つであり、前記複数の電源ユニットがそれぞれ、前記第1のシステムバスに状態データを提供する、請求項1に記載の機器ラック。
  3. 前記第1のネットワーク装置が、前記第1のシャーシ上の複数のネットワーク装置の1つである、請求項1に記載の機器ラック。
  4. 前記第1のネットワーク装置に接続されたデータスイッチを更に有し、前記データスイッチが前記第1及び第2のネットワーク装置の一方と通信する、請求項1に記載の機器ラック。
  5. 前記シャーシ管理コントローラが、インターインテグレーテッドサーキットプロトコル(I2C)、ユニバーサル非同期レシーバ/トランスミッタ(UART)及びネットワークの少なくとも1つを介して管理スイッチと通信する、請求項1に記載の機器ラック。
  6. 前記第1のネットワーク装置が、サーバである、請求項1に記載の機器ラック。
  7. 前記第1の電源ユニットと前記第1のシャーシ管理コントローラが、パワーシェルフに取り付けられた、請求項1に記載の機器ラック。
  8. 前記管理コントローラが、前記第1のシャーシ管理コントローラからの状態データの通信の失敗を決定する働きをし、更に、前記管理コントローラは、前記第1のシャーシ管理コントローラからの状態データの通信の失敗が決定されたときに前記第2のシャーシ管理コントローラとの通信を確立する働きをする、請求項1に記載の機器ラック。
  9. 管理コントローラと、第1の電源ユニット、第1のシステムバス、第1のシャーシ管理コントローラ及び第1のネットワーク装置を有する第1のシャーシと、第2の電源ユニット、第2のシステムバス、第2のシャーシ管理コントローラ、及び第2のネットワーク装置を有する第2のシャーシを有する機器ラックからの状態報告を保証する方法であって
    前記第1の電源ユニットから前記第1のシステムバスに状態データを提供するステップと、
    前記第2の電源ユニットから前記第2のシステムバスに状態データを提供するステップと、
    第1のバスアービタと第2のバスアービタのそれぞれによって前記第1のシャーシ管理コントローラと前記第2のシャーシ管理コントローラとの間で状態データを切り換えるステップと、
    前記第1のシャーシ管理コントローラと前記第1のシステムバスの間の通信を確立して前記第1の電源ユニットから状態データを取得するステップと、
    前記第1のシャーシ管理コントローラと前記第2のシステムバスの間の通信を確立して前記第2の電源ユニットから状態データを取得するステップと、
    前記第1のシャーシ管理コントローラを介して前記管理コントローラに状態データを中継するステップと、
    前記第2のシャーシ管理コントローラと前記第2のシステムバスの間の通信を確立して前記第2の電源ユニットから状態データを取得するステップと、
    前記第2のシャーシ管理コントローラと前記第1のシステムバスの間の通信を確立して前記第1の電源ユニットから状態データを取得するステップと、
    前記第1のシャーシ管理コントローラから状態データが中継されないという決定に基づいて、前記第2のシャーシ管理コントローラを介して前記管理コントローラに状態データの中継を開始するステップとを含む方法。
JP2018127326A 2018-01-05 2018-07-04 機器ラック及び機器ラックからの状態報告を保証する方法 Active JP6703045B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862613855P 2018-01-05 2018-01-05
US62/613,855 2018-01-05
US15/968,382 2018-05-01
US15/968,382 US10613950B2 (en) 2018-01-05 2018-05-01 CMC failover for two-stick canisters in rack design

Publications (2)

Publication Number Publication Date
JP2019121338A JP2019121338A (ja) 2019-07-22
JP6703045B2 true JP6703045B2 (ja) 2020-06-03

Family

ID=62846048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018127326A Active JP6703045B2 (ja) 2018-01-05 2018-07-04 機器ラック及び機器ラックからの状態報告を保証する方法

Country Status (5)

Country Link
US (1) US10613950B2 (ja)
EP (1) EP3508980B1 (ja)
JP (1) JP6703045B2 (ja)
CN (1) CN110011821B (ja)
TW (1) TWI668974B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102067128B1 (ko) * 2018-06-07 2020-01-16 코츠테크놀로지주식회사 헬스 모니터링 장치 및 이를 포함하는 대화면 시현기
TWI770451B (zh) * 2019-12-17 2022-07-11 財團法人金屬工業研究發展中心 工作母機加工資訊即時呈現方法與工作母機即時呈現系統

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6948008B2 (en) 2002-03-12 2005-09-20 Intel Corporation System with redundant central management controllers
US20030177224A1 (en) 2002-03-15 2003-09-18 Nguyen Minh Q. Clustered/fail-over remote hardware management system
US20040246982A1 (en) * 2003-06-06 2004-12-09 Sun Microsystems, Inc. Methods and apparatus for configuring a packet switching (PS) backplane to support various configurations
KR101320001B1 (ko) 2006-01-19 2013-10-18 어메리칸 파워 컨버젼 코포레이션 냉각 시스템 및 방법
US7581133B2 (en) * 2006-08-04 2009-08-25 Dell Products, Lp System and method of providing real time to devices within a server chassis
WO2009066336A1 (ja) 2007-11-19 2009-05-28 Fujitsu Limited 情報処理装置及び情報処理システム並びにそれらの制御方法
JP5278433B2 (ja) 2008-08-14 2013-09-04 富士通株式会社 冷却方法及び計算機
US20100146592A1 (en) * 2008-12-04 2010-06-10 Dell Products L. P. Systems and methods for providing session continuity across a chassis management controller failover
US8037364B2 (en) * 2009-01-09 2011-10-11 International Business Machines Corporation Forced management module failover by BMC impeachment consensus
US9058155B2 (en) * 2009-06-19 2015-06-16 Hewlett-Packard Development Company, L.P. Enclosure power controller providing plurality of power control signals to plurality of removable compute nodes based on a duty cycle of each power control signal
US8868936B2 (en) * 2010-11-29 2014-10-21 Cisco Technology, Inc. Dynamic power balancing among blade servers in a chassis
TW201222208A (en) * 2010-11-30 2012-06-01 Inventec Corp Server integrate system
US8842664B2 (en) * 2011-09-27 2014-09-23 Znyx Networks, Inc. Chassis management modules for advanced telecom computing architecture shelves, and methods for using the same
TWI454092B (zh) * 2011-09-29 2014-09-21 Quanta Comp Inc 伺服器叢集及其控制機制
CN103138943A (zh) * 2011-11-28 2013-06-05 英业达科技有限公司 服务器机架系统及电源系统
CN103138945B (zh) * 2011-11-28 2016-06-08 英业达科技有限公司 管理电源供应的服务器机架系统
WO2013094006A1 (ja) * 2011-12-19 2013-06-27 富士通株式会社 プログラム、情報処理装置および方法
US9935901B2 (en) 2011-12-30 2018-04-03 Dell Products, Lp System and method of enabling a multi-chassis virtual switch for virtual server network provisioning
JP5842695B2 (ja) 2012-03-21 2016-01-13 日本電気株式会社 電子機器用ラック
US8694693B2 (en) * 2012-04-10 2014-04-08 Dell Products L.P. Methods and systems for providing user selection of associations between information handling resources and information handling systems in an integrated chassis
US9170627B2 (en) * 2012-08-20 2015-10-27 Dell Products L.P. Power management for PCIE switches and devices in a multi-root input-output virtualization blade chassis
US9229497B2 (en) 2012-11-08 2016-01-05 Silicon Graphics International Corp. On-blade cold sink for high-density clustered computer system
US9690593B2 (en) * 2013-03-04 2017-06-27 Dell Products L.P. Server information handling system configuration from an end state definition file
US9118589B2 (en) * 2013-03-11 2015-08-25 Dell Products, L.P. System and method for rapid VLT connection failure handling
US9477592B2 (en) * 2013-03-29 2016-10-25 Silicon Graphics International Corp. Localized fast bulk storage in a multi-node computer system
TW201445936A (zh) * 2013-05-17 2014-12-01 Hon Hai Prec Ind Co Ltd 可動態切換主節點的伺服器系統及動態切換主節點的方法
US9665154B2 (en) * 2013-05-31 2017-05-30 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Subsystem-level power management in a multi-node virtual machine environment
US9804980B2 (en) * 2013-07-25 2017-10-31 Dell Products, Lp System management through direct communication between system management controllers
US9424148B2 (en) * 2013-08-21 2016-08-23 Dell Products L.P. Automatic failover in modular chassis systems
US9619243B2 (en) * 2013-12-19 2017-04-11 American Megatrends, Inc. Synchronous BMC configuration and operation within cluster of BMC
US9788451B2 (en) * 2013-12-23 2017-10-10 Dell Products, L.P. Block chassis sled having one-third width computing and storage nodes for increased processing and storage configuration flexibility within a modular, scalable and/or expandable rack-based information handling system
US9753520B2 (en) * 2013-12-23 2017-09-05 Dell Products, L.P. Predictive power capping and power allocation to computing nodes in a rack-based information handling system
US10097409B2 (en) * 2014-03-01 2018-10-09 Dell Products, Lp System and method for managing multi-tenant chassis environment using virtual private chassis management controllers
US20150363340A1 (en) * 2014-06-11 2015-12-17 Microsoft Corporation Providing multiple synchronous serial console sessions using data buffering
US9804937B2 (en) * 2014-09-08 2017-10-31 Quanta Computer Inc. Backup backplane management control in a server rack system
US9588836B2 (en) * 2014-10-08 2017-03-07 Dell Products L.P. Component-level fault detection in virtualized information handling systems
US11349701B2 (en) * 2015-03-09 2022-05-31 Vapor IO Inc. Data center management with rack-controllers
US10505843B2 (en) * 2015-03-12 2019-12-10 Dell Products, Lp System and method for optimizing management controller access for multi-server management
US10382534B1 (en) * 2015-04-04 2019-08-13 Cisco Technology, Inc. Selective load balancing of network traffic
US9588571B2 (en) * 2015-07-08 2017-03-07 Quanta Computer Inc. Dynamic power supply management
US9734093B2 (en) * 2015-09-18 2017-08-15 Dell Products, L.P. Management of secured storage devices in an information handling system
TWI566613B (zh) * 2015-10-15 2017-01-11 廣達電腦股份有限公司 資料流中繼裝置與通訊裝置
US9942935B2 (en) * 2015-11-17 2018-04-10 Dell Products, Lp System and method for providing a wireless failover of a management connection in a server rack of a data center
US10404676B2 (en) * 2016-03-29 2019-09-03 Intel Corporation Method and apparatus to coordinate and authenticate requests for data
US10402207B2 (en) 2016-06-16 2019-09-03 Quanta Computer Inc. Virtual chassis management controller
KR102273770B1 (ko) * 2016-07-19 2021-07-06 삼성에스디아이 주식회사 배터리 시스템
US10691562B2 (en) * 2017-03-17 2020-06-23 American Megatrends International, Llc Management node failover for high reliability systems
US10728086B2 (en) * 2017-03-23 2020-07-28 Dell Products, L.P. System and method for providing a redundant communication path between a server rack controller and one or more server controllers
US10506734B2 (en) * 2018-01-10 2019-12-10 Dell Products, Lp Information handling system having synchronized power loss detection armed state

Also Published As

Publication number Publication date
TW201931820A (zh) 2019-08-01
EP3508980A1 (en) 2019-07-10
JP2019121338A (ja) 2019-07-22
EP3508980B1 (en) 2020-06-17
CN110011821A (zh) 2019-07-12
US20190213091A1 (en) 2019-07-11
CN110011821B (zh) 2022-08-30
US10613950B2 (en) 2020-04-07
TWI668974B (zh) 2019-08-11

Similar Documents

Publication Publication Date Title
CN107479721B (zh) 远程多计算机切换技术的存储装置、系统及方法
JP6686266B2 (ja) リモートシステム復旧のためのシステムおよび方法
US9965367B2 (en) Automatic hardware recovery system
EP3540605A1 (en) Cpld cache application in a multi-master topology system
US10846159B2 (en) System and method for managing, resetting and diagnosing failures of a device management bus
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
TWI559148B (zh) 自動硬體恢復方法及自動硬體恢復系統
US10691185B2 (en) Cooling behavior in computer systems
US10783109B2 (en) Device management messaging protocol proxy
EP3739446B1 (en) Method and system for communication channels to management controller
JP2020053017A (ja) ハイブリッド電源のシステム及び方法
JP6703045B2 (ja) 機器ラック及び機器ラックからの状態報告を保証する方法
US20220019561A1 (en) Event-based generation of context-aware telemetry reports
TWI649992B (zh) 決定網路節點的網路介面卡操作速度的方法、端口扇出配置系統及其方法
US10853204B2 (en) System and method to detect and recover from inoperable device management bus
CN109391327B (zh) 自动组合数据中心数据的方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200507

R150 Certificate of patent or registration of utility model

Ref document number: 6703045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250