TWI668974B - 裝備機架及其狀態報告確保方法 - Google Patents

裝備機架及其狀態報告確保方法 Download PDF

Info

Publication number
TWI668974B
TWI668974B TW107121357A TW107121357A TWI668974B TW I668974 B TWI668974 B TW I668974B TW 107121357 A TW107121357 A TW 107121357A TW 107121357 A TW107121357 A TW 107121357A TW I668974 B TWI668974 B TW I668974B
Authority
TW
Taiwan
Prior art keywords
management controller
chassis
power supply
supply unit
status data
Prior art date
Application number
TW107121357A
Other languages
English (en)
Other versions
TW201931820A (zh
Inventor
周樂生
張添榮
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201931820A publication Critical patent/TW201931820A/zh
Application granted granted Critical
Publication of TWI668974B publication Critical patent/TWI668974B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/02Constructional details
    • H04Q1/025Cabinets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/02Constructional details
    • H04Q1/03Power distribution arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0016Inter-integrated circuit (I2C)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一種用於機架固定結構的雙CMC結構。此CMC結構具有第一機箱及第二機箱。第一機箱具有多個電源供應器、第一機箱管理控制器、及第一組網路裝置。第二機箱包含多個電源供應器、第二機箱管理控制器、及第二組網路裝置。各自的機箱管理控制器取得電源供應器的狀態資料,以及來自對方機箱管理控制器的狀態資料。第一機箱管理控制器係設置為主要控制器,且報告來自第一及第二機箱的狀態資料。在第一機箱管理控制器失敗的事件中,此CMC結構係操作以將狀態資料的通訊切換至第二機箱管理控制器。

Description

裝備機架及其狀態報告確保方法
本發明是有關於一種用於操作多網路裝置的機箱,且特別地,本揭露的方面是有關於將兩個或多個機箱管理控制器連網以監視機架固定網路裝置的操作。
用於計算應用的雲的出現增加了對異地(off-site)安裝(異地也稱為資料中心)的需求。這些資料中心儲存資料,並運行由遠端連接計算機裝置使用者所存取的應用程序。這種資料中心通常具有大量的伺服器、交換機和儲存裝置來儲存和管理資料,因此遠端計算機使用者可以便利的方式進行存取。典型的資料中心具有實體機架結構並伴隨電源和通訊連接。機架在整個資料中心的一個或多個房間內排列成行。每個機架都包含一個框架,此框架具有水平定向的插槽或可以容納多個裝置(例如伺服器、交換機和儲存設備)的機箱。在現代資料中心,這種機架結構中堆疊了許多這樣的裝置。例如,一些資料中心擁有數以萬計的伺服器並伴隨儲存裝置和網路交換機。因此,典型的資料中心的數百或數千個獨立機架中可能包括數萬甚至數十萬個裝置。資料中心通常在控制中心具有一個管理系統用來監視和確保裝備的正常運行。為了有效管理,管理員需要立即了解資料中心每個機架中裝備的狀態。
典型的機架系統10係顯示於第1圖中。機架系統10包括耦接到電源架14的機箱管理控制器(chassis management controller, CMC)12。電源架14包括多個電源供應單元及對應之用於冷卻的風扇。電源架14連接到網路裝置組(bank)16和18,並且向組16和18中的每個網路裝置提供電源。在此例中,網路裝置組16和18中的網路裝置可以是刀鋒(blade)伺服器。機架系統10也包括管理交換機20和兩個資料交換機22和24。管理交換機20監視組16和18中所儲存的網路裝置的操作,包括電源架14上的電源供應。資料交換機22和24提供儲存於組16和18中的網路裝置之間的資料通訊。
CMC 12管理網路裝置組16和18中的網路裝置。CMC 12執行配置和監視任務、控制對組16和18中的網路裝置的電源、及為組16和18中的網路裝置提供警報。CMC 12具有微處理器及記憶體。CMC 12由電源架14上的電源供應器供電。
CMC 12在資料中心中的機架10管理中伴演重要的角色。 CMC 12從機架10收集基於機架的操作資訊以用於資料中心管理軟體。操作資訊可以包括:(1)機架總功率消耗;(2)來自每個網路裝置的IP位址清單;(3)整體和個別機架組件的健康狀態;及(4)基於機架的風扇和散熱狀態。資料中心管理軟體可以使用這些資訊向機架的所有管理單元(例如CMC 12或管理交換機20上的機架管理控制器)執行功能,例如管控(cap)機架電源或更新機架ID。如此,資料中心管理員可以通過收集這些資訊來遠端監視資料中心中每個機架系統的裝置的性能。
有一些已知的方式來實現與用於CMC 12的電源架14上的組件的通訊。例如,CMC 12可以使用內部積體電路協議(inter-integrated circuit protocol, I2C)、通用非同步收發傳輸器(universal asynchronous receiver/transmitter, UART);或網路以將來自電源架14的操作資料與管理交換機20進行通訊。
在操作中,CMC 12週期性地輪詢電源架14的狀態。遠端管理員可以通過管理交換機(例如管理交換機20)傳送命令以獲取電源架狀態。接著,CMC 12根據來自遠端管理員的請求報告電源架14的狀態。當警報被發起時,CMC 12主動報告電源架14的狀態至遠端管理節點,以增強對潛在情況(例如潛在失效)的響應。
一般而言,在第1圖中,只有一個CMC用於每個容器(canister),或者例如機架10的機架。然而,如果CMC 12發生失效或離線(off line),資料中心的遠端管理員將失去對容器或機架電源架14進行狀態監視的能力。這會妨礙機架10的操作,因為無法將來自機架10提供的整體功率問題進行報告,且妨礙來自機架10的支持。
因此,CMC 12的失效將阻礙機架10中的所有網路裝置的操作。在一般情況下,容器或機架10內的CMC 12將監控電源架14的狀態,且將狀態報告給管理節點。 CMC 12的失效或失能將妨礙對網路裝置的監視,因此必須暫停操作直到此單元可以被檢查。一些當前的機架設置包括備份CMC,以便在第一個CMC失效時向遠端管理員報告容器或機架狀態。然而,這不是一個完美的解決方案,因為兩個CMC都可能與遠端管理員的通訊中斷。再者,如果容器上的兩個CMC均失效,則必須暫停操作。
因此,需要一種機架系統,即使CMC離線,也允許遠端監視架狀態。還需要一種機制,即使CMC無法報告機架上的裝置的監控資料,也允許機架的操作。還需要一種具有多個CMC的機架系統,收集機架中的多個裝置的狀態監視資料。
所揭露的一種範例為裝備機架,包括管理控制器及第一與第二機箱(chassis)。第一機箱包含第一電源供應單元;第一系統匯流排,耦接至第一電源供應單元;第一機箱管理控制器,耦接至第一系統匯流排;及第一網路裝置。第一電源供應單元傳送狀態資料至第一系統匯流排。第二機箱包括第二電源供應單元;第二系統匯流排,耦接至第二電源供應單元;第二機箱管理控制器,耦接至第二系統匯流排;及第二網路裝置。第二電源供應單元傳送狀態資料至第二系統匯流排。第一機箱管理控制器係與第一系統匯流排通訊以取得來自第一電源供應單元的狀態資料。第一機箱管理控制器係與第二系統匯流排通訊以取得來自第二電源供應單元的狀態資料。第一機箱管理控制器係與管理交換機通訊以中繼(relay)狀態資料。第二機箱管理控制器係與第一系統匯流排通訊以取得來自第一電源供應單元的狀態資料。第二機箱管理控制器係與第二系統匯流排通訊以取得來自第二電源供應單元的狀態資料。管理控制器係被操作以建立管理控制器及第二機箱管理控制器之間的通訊以中繼狀態資料。
所揭露的另一種範例為從裝備機架確保狀態報告之方法。此裝備機架具有管理控制器。裝備機架具有第一機箱,第一機箱包括第一電源供應單元、第一系統匯流排、第一機箱管理控制器、及第一網路裝置。裝備機架具有第二機箱,第二機箱包括第二電源供應單元、第二系統匯流排、第二機箱管理控制器、及第二網路裝置。狀態資料係從第一電源供應單元提供至第一系統匯流排。狀態資料係從第二電源供應單元提供至第二系統匯流排。建立第一機箱管理控制器與第一系統匯流排之間的通訊,以取得來自第一電源供應單元的狀態資料。建立第一機箱管理控制器與第二系統匯流排之間的通訊,以取得來自第二電源供應單元的狀態資料。經由第一機箱管理控制器到管理控制器的狀態資料被中繼。建立第二機箱管理控制器與第二系統匯流排之間的通訊,以取得來自第二電源供應單元的狀態資料。建立第二機箱管理控制器與第一系統匯流排之間的通訊,以取得來自第一電源供應單元的狀態資料。在決定來自第一機箱管理控制器的狀態資料未被中繼時,經由第二機箱管理控制器向管理控制器發起狀態資料的中繼。
以上概述不旨在代表本揭露的每個實施例或每個方面。相反地,前述概述僅僅提供了在此闡述的一些新穎方面和特徵的示例。當結合附圖和所附請求項時,從以下用於實現本揭露的代表性實施例和模式的詳細說明中,本揭露的上述特徵和優點以及其他特徵和優點將變得顯而易見。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉實施例,並配合所附圖式詳細說明如下:
本發明可以以許多不同的形式來實施。代表性實施例係繪示於所附圖式中,並且將在此處被詳細說明,請理解本揭露是本揭露原理的一個範例或示例,並且不意於將本揭露的廣泛方面限制於所示之實施例。就此而言,例如在摘要、發明內容、及實施方式的部分中揭露但在請求項中未明確闡述的要素和限制,不應該通過暗示、推斷或以其他方式而單獨或集體併入到申請範例範圍中。除非明確否認,本詳細描述的目的:單數包括複數,反之亦然;而“包括”一詞的意思是“包括但不限於”。此外,此處所使用約莫的字詞例如“大約”、“幾乎”、“實質上”、“近似”等類似詞語,可表示“位於、接近、或接近於”或在3-5%之內”、“或在可接受的製造公差內”、或其任何邏輯組合。
第2圖繪示範例性雙機箱容器機架100,機架100包括不同機箱單元內的不同架或板上的多個CMC,以在單個板上的單個CMC或多個CMC發生失效時,仍允許對機架100上的所有裝置進行操作資料監測。雖然主要CMC無法提供狀態資訊,在單獨的機箱上增加至少一個伙伴CMC以取得操作資料狀態,從而允許連續監視及機架100的操作。
機架100包括管理交換機110及兩個資料交換機112及114。機架100包括第一機箱單元120和第二機箱單元130。管理交換機110可以包括作為管理控制器的控制器以監視機架100上所有裝置的操作。第一機箱單元120包括各種網路裝置,例如伺服器122、124、及126。機箱單元120也包括電源架128,電源架128容納電源供應單元及其他支持的電子設備以用於機箱單元120的伺服器122、124、及126。另一機箱單元130包括各種網路裝置,例如伺服器132、134、及136。機箱單元130也包括電源架138,電源架138容納電源供應單元及其他支持的電子裝置以用於機箱單元130的網路裝置132、134、及136。例如,機箱單元120及130可具有平行的側壁以保持用以定義槽的固定機制。電源架可固定在機箱單元的任何位置。對應的網路裝置可被插入插槽並連接到對應之電源架上的電源供應單元。
第2圖也繪示電源架128及138的方塊圖。電源架128包括一串電源供應單元202、204、及206。電源供應單元202、204、及206中的每一個具有對應的一個風扇212、214、及216。電源架128包括CMC 220以監視電源架128的操作。在此範例中,電源架128提供電源至關聯的網路裝置,例如伺服器122、124、及126。系統管理(system management, SM)匯流排交換機222經由系統匯流排224通訊至電源供應單元202、204、及206以及風扇212、214、及216。SM匯流排交換機222用於接收操作資料並將開/關命令通訊至電源供應單元202、204、及206以及風扇212、214、及216。CMC 220耦接到網路介面226並且耦接到SM匯流排交換機222。
相仿地,電源架138包括一串電源供應單元252、254、及256。電源供應單元252、254、及256中的每一個具有對應的一個風扇262、264、及266。電源架138包括CMC 270以監視電源架138的操作。在此範例中,電源架138提供電源至關聯的網路裝置,例如伺服器132、134、及136。SM匯流排交換機272係通過系統匯流排274通訊至電源供應單元252、254、及256以及風扇262、264、及266。SM匯流排交換機272用於接收操作資料並將開/關命令通訊至電源供應單元252、254、及256以及風扇262、264、及266。CMC 270耦接到網路介面276,並且耦接到SM匯流排交換機272。
如第2圖所示,CMC 220和270通過網路經由對應的網路介面226和276連接到管理交換機110。網路介面226也連接到SM匯流排交換機272。網路介面276連接到SM匯流排交換機222。如下所述,這種配置允許CMC 220或270監視和控制電源架128或138。
在此範例中,CMC 220是機架100的主要CMC,CMC 270是伙伴CMC。當然,CMC 270可以作為主要CMC,而CMC 220作為機架100的伙伴CMC。在具有CMC的附加機箱單元固定在機架100中的情況下,這樣的其他CMC可以作為主要CMC 。在此範例中,CMC 220經由SM匯流排交換機222週期性地輪詢電源架128的電源架狀態。以此方式,CMC 220收集電源供應單元202、204、及206和風扇212、 214、及216的操作狀態資料。CMC 220也輪詢伙伴CMC 270以求得電源架138的狀態。CMC 270經由SM匯流排交換機272收集此種狀態資料,以求得電源供應單元252、254、及256和風扇262、264、及266的操作狀態資料。
遠端管理員可以通過連接到CMC 220的網路傳送命令以從管理交換機110取得電源架狀態。接著,CMC 220回應於遠端管理員的請求而通過管理交換機110報告電源架狀態。冗餘的CMC 220和270可以通過例如I2C、CPIO、UART或類似網路協議的連接彼此通訊。兩個CMC 220和270之間的握手(hand shake)是通過適當協議的心跳協商(heartbeat negotiation)作成的。在這個例子中,協商可以通過例如I2C、CPIO、UART或類似網路的協議來作成。因此,CMC 220和270可以從它們各自的電源架128和138交換電源狀態資訊。如果CMC 220或270中的一個經過通訊發現另一個CMC不在服務中,那麼此CMC將接管監視功能。
在CMC 220發生失效的情況下,伙伴CMC 270可偵測到原始主要CMC已發生失效,或與管理交換機110的網路連接中斷。替代地,例如管理交換機110的控制器之類的管理控制器可以偵測來自原始主要CMC的通訊失敗。伙伴CMC 270將接管向遠端管理員報告狀態資料的責任,並向遠端管理員發送伙伴CMC已接管這些功能的警報。因此,資訊會被報告給遠端管理員,就好像原始主要CMC仍是有功能的一樣。
第3圖繪示電源架128和電源架138,其中CMC 220被指定為主要CMC。在第3圖中相仿的元件係標號為如同第2圖中相仿的元件。在一般操作中,CMC 220和270兩者主動讀取來自對應電源架128和138上的對應電源供應單元的所有感測器資訊。CMC的其中一者,例如CMC 220,被指定為主要CMC 。在此範例中,CMC 270是伙伴CMC,且 給予從SMbus交換機272所收集之狀態資訊,此狀態資料將被直接傳送至CMC 220,如第3圖中的線300所示。CMC 220也給予從SMbus交換機222所收集之狀態資訊,此狀態資訊將被直接傳送至CMC 270,如第3圖中的線302所示。指定為主要CMC 的CMC 220將兩電源架128及138上的所有組件的狀態,通過管理交換機110(在第2圖中)的網路連接報告至遠端管理。此連接可由線310所表示並顯示資料主動傳送到管理交換機110。由於CMC 220和270兩者都可以通過各自的SMBus交換機222和272獲得資訊,所以兩個CMC 220和270在任何時間都同步。從CMC 220傳輸到管理交換機的操作或狀態資料可以通過I2C、UART、或網路。
第4圖繪示電源架128和電源架138,其中CMC 220不與管理交換機110通訊。在第4圖中相仿的元件係標示為如同第2圖中相仿的元件。CMC 220的通訊缺乏可能是由於CMC 220的失效或通訊線路的故障(breakdown)。 CMC 220和270兩者主動讀取來自對應之電源架128和138上的對應電源供應單元的所有感測器資訊。在此範例中,CMC 270是伙伴CMC,且給予從SMbus交換機272所收集之狀態資訊,此狀態資訊將被直接傳送至CMC 220,如線400所示。CMC 220也給予從SMbus交換機222所收集之狀態資訊,此狀態資訊將被直接傳送至CMC 270,如線402所示。於此情況中,系統切換至伙伴CMC,例如CMC 270,並發起與管理交換機110(於第2圖中)的通訊。此連接可由線410所表示並顯示資料主動傳送到管理交換機110。從CMC 270傳輸到管理交換機110的操作或狀態資料可以通過I2C、UART、或網路。
應理解的是,其他裝置可以用於SMbus交換機222和272,只要這種裝置可以將附接的SMbus從一個切換到另一個。例如,可以使用可同時與來自不同SMBus的輸入進行通訊的SMBus仲裁器(arbiter)。SMBus仲裁器可以擔任哪個匯流排可以首先與目標通訊的仲裁器。替代地,還可以使用多工器(multiplexor)來選擇用於與目標通訊的匯流排。
第5圖的流程圖為代表之範例性機器可讀取指令,用於第2圖中的機架100以確保來自第2圖中的CMC之其中一者的狀態資訊的流動。在此範例中,機器可讀取指令包括用於通過以下來執行的演算法:(a)處理器; (b)控制器;及/或(c)一個或多個其他合適的處理裝置。演算法可以軟體實施而儲存在有形媒介上,例如快閃記憶體、CD-ROM、軟碟、硬碟驅動器、數位視訊(多用途)碟片(digital video (versatile) disk, DVD)、或其他記憶體裝置。然而,本領域具有通常知識者將容易理解,整個及/或部分演算法可以替代地由處理器之外的裝置所執行,及/或以眾所周知的方式實施在韌體或專用硬體中(例如,它可以由特殊應用積體電路(application specific integrated circuit, ASIC)、可編程邏輯裝置(programmable logic device, PLD)、現場可程式邏輯裝置(field programmable logic device, FPLD)、現場可程式邏輯陣列(field programmable gate array, FPGA)、離散邏輯等等來實現)。例如,介面的任何或所有組件可以通過軟體、硬體及/或韌體來實現。再者 ,由第5圖的流程圖所表示的一些或全部機器可讀取指令也可被手動地實現。再者,雖然範例性演算法係參照第5圖中所示的流程圖而被說明,本領域的具有通常知識者將容易理解,可以替代地使用許多實現範例性機器可讀取指令的其他方法。例如,可以改變方塊的執行順序、及/或改變、消除、或合併所描述的一些方塊。
第5圖繪示操作範例性機架100之過程以確保監視機箱單元120及130(在第2圖中)的範例性流程圖。在此範例中,第2圖中的每個CMC例如CMC 220和CMC 270輪詢對應的電源架狀態(500)。每個CMC收集來自匯流排交換機(例如第2圖中的匯流排交換機222)的操作狀態資料(502)。 CMC也輪詢所有伙伴CMC以求得由伙伴CMC監視之對應的電源架的狀態(504)。管理交換機110(在第2圖中)的管理控制器決定主要CMC 220是否可操作(506)。如果主要CMC 202是可操作的,管理交換機110向主要CMC 202傳送獲取電源架狀態的請求(508)。在接收到請求時,CMC 220傳送所收集的每個架的操作資料(510)。
如果當前主要CMC是不可操作的,管理交換機110切換CMC 270的狀態以承擔(assume)主要CMC(512)的角色。接著,管理交換機110傳送請求至新的主要CMC 270以獲取電源架狀態(514)。在接收到請求時,CMC 270接著將所收集的每個架的操作資料傳送到管理交換機110(516)。
笫6圖繪示範例計算系統600,其中計算系統的組件使用匯流排602而彼此電性通訊。系統600包括處理單元(CPU或處理器)630和系統匯流排602,系統匯流排602耦接各種系統組件至處理器630,各種組件包括系統記憶體604(例如唯讀記憶體(read only memory, ROM)606和隨機存取記憶體(random access memory, RAM)608)。系統600可包括直接連接至處理器630之高速記憶體的快取、緊密接近處理器630之高速記憶體的快取、或整合為處理器630的一部分的快取。系統600可將來自記憶體604及/或儲存裝置612的資料複製到快取628以供處理器630快速存取。以此方式,快取可提供處理器630在等待資料時的性能提升。這些和其他模組可以控制或被配置為控制處理器630以執行各種動作。其他系統記憶體604也可供使用。記憶體604可以包括具有不同性能特徵的多種不同類型的記憶體。處理器630可以包括嵌入在儲存裝置612中的任何一般用途處理器和硬體模組或軟體模組,例如模組1 (614)、模組2 (616)、和模組3 (618)。硬體模組或軟體模組被配置為控制處理器630,以及將軟體指令整合入實際處理器設置的特殊用途處理器。處理器630可以是實質上完全獨立的計算系統,其包含多個核心或處理器、匯流排、記憶體控制器、快取等。多核心處理器可以是對稱的或不對稱的。
為了使使用者能夠與計算裝置600進行互動,輸入裝置620係提供作為輸入機制。輸入裝置620可包括用於語音的麥克風、用於手勢或圖形輸入的觸控螢幕、鍵盤、滑鼠、動作輸入等。在一些情況下,多模式系統可以使使用者能夠提供多種類型的輸入以與系統600通訊。在此例中,輸出裝置622也被提供。通訊介面624可以主宰和管理使用者輸入和系統輸出。
儲存裝置612可以是非揮發性記憶體,用於儲存由計算機存取的資料。儲存裝置612可以是磁帶盒、快閃記憶卡、固態記憶裝置、數位多功能碟、卡閘(cartridge)、隨機存取記憶體(RAM)608、唯讀記憶體(ROM)606及其組合。
控制器610可以是系統600上的特殊用途微控制器或處理器,例如基板管理控制器 (baseboard management controller, BMC)。在一些情況下,控制器610可以是智慧平台管理介面(intelligent platform management interface, IPMI)的一部分。再者,在一些情況下,控制器610可以被嵌入系統600的母板或主電路板上。控制器610可以管理系統管理軟體和平台硬體之間的介面。控制器610還可以與各種系統裝置和組件(內部及/或外部)進行通訊,例如控制器或周邊組件,如下面進一步說明。
控制器610可以產生對通知、警報及/或事件的特定響應,並與遠端裝置或組件(例如,電子郵件資訊,網路資訊等)通訊,以產生用於自動硬體恢復程序的指令或命令等。管理員還可以與控制器610遠端通訊以發起或執行特定的硬體恢復程序或操作,如下面進一步描述。
控制器610還可以包括用於管理和維護控制器610所接收的事件、警報和通知的一系統事件日誌控制器及/或儲存器。例如​​,控制器610或系統事件日誌控制器可以接收來自一個或多個裝置及組件的警報或通知,並將警報或通知維護在系統事件日誌儲存組件中。
快閃記憶體632可以是電子非揮發性計算機儲存媒介或晶片,可被系統600使用於儲存及/或資料傳輸。快閃記憶體632可以被電性抹除及/或重新編程。例如,快閃記憶體632例如可以包括可抹除可編程唯讀記憶體(erasable programmable read-only memory, EPROM)、電性可抹除可編程唯讀記憶體(electrically erasable programmable read-only memory, EEPROM)、ROM、非揮發性的隨機存取記憶體(NVRAM)或互補金屬氧化物(complementary metal-oxide semiconductor , CMOS)。快閃記憶體632可以儲存當系統600首次通電時由系統600執行的韌體634,以及專門用於韌體634的一組配置。快閃記憶體632還可以儲存由韌體634使用的配置。
韌體634可以包括基本輸入/輸出系統或均等物,例如可延伸韌體介面(Extensible Firmware Interface, EFI)或統一可延伸韌體介面(Unified Extensible Firmware Interface, UEFI)。每當系統600啟動時,韌體634可作為順序程式而被載入和執行。韌體634可基於此組配置來識別、初始化、及測試系統600中存在的硬體。韌體634可在系統600上執行自檢(例如開機自檢(Power-on-Self-Test, POST))。此自檢可以測試各種硬體組件的功能,例如硬碟驅動器、光學讀取裝置、冷卻裝置、記憶體模組、擴充卡等。韌體634可以定址和分配記憶體604、ROM 606、RAM 608、及/或儲存裝置612中的區域,以儲存作業系統(operating system, OS)。韌體634可以載入啟動載入器(boot loader)及/或OS,並將系統600的控制權交給OS。
系統600的韌體634可以包括韌體配置,韌體配置定義韌體634如何控制系統600中的各種硬體組件。韌體配置可以決定系統600中的各種硬體組件被啟動的順序。韌體634可以提供允許設置各種不同參數的介面,例如UEFI,其可以與韌體預設配置中的參數不同。例如,使用者(例如管理員)可以使用韌體634來指定時鐘和匯流排速度;定義連接到系統600的周邊;設置健康監測(例如,風扇速度和CPU溫度限制);及/或提供影響系統600的整體性能和功率使用的各種其他參數。雖然韌體634被繪示為儲存在快閃記憶體632中,但本領域的具有通常知識者將無疑地體會到韌體634可以儲存在其他記憶體組件中,例如記憶體604或ROM 606。
系統600可以包括一個或多個感測器626。一個或多個感測器626可以包括例如一個或多個溫度感測器、溫度(thermal)感測器、氧感測器、化學感測器、噪音感測器、熱能(heat)感測器、電流感測器、電壓偵測器、氣流感測器、流量感測器、紅外溫度計、熱通量感測器、溫度計、高溫計等。一個或多個感測器626可以與處理器、快取628、快閃記憶體632、通訊介面624、記憶體604、ROM 606、RAM 608,控制器610、及儲存裝置612,例如經由匯流排602進行通訊。一個或多個感測器626也可以經由一個或多個不同手段與系統中的其他組件進行通訊,例如經由內部積體電路協議(I2C)、一般用途輸出(general purpose output, GPO)及類似物。系統600上不同類型的感測器(例如感測器626)也可以向控制器610報告例如冷卻風扇速度、電源狀態、操作系統(OS)狀態、硬體狀態等的參數。系統600可以使用顯示器636來提供與控制器610或處理器630所執行的應用有關的圖形。
第7圖繪示具有晶片組架構之範例計算系統700之示意圖,可用於執行所述方法或運作,以及產生和顯示圖形化使用者介面(graphical user interface, GUI)。計算系統700可以包括可用來實現所揭露之技術的計算機硬體、軟體和韌體。系統700可以包括處理器710,處理器710代表能夠執行軟體、韌體和硬體的各種實體及/或邏輯上不同的資源,被配置以進行所識別的運算。處理器710可以與晶片組702通訊,晶片組702可以控制送至處理器710的輸入及來自處理器710的輸出。在此範例中,晶片組702將資訊輸出到輸出裝置714,例如顯示器,並且可以讀取資訊並將資訊寫入儲存裝置716,儲存裝置716可以包括例如磁媒介和固態媒介。晶片組702還可以從RAM 718讀取資料並將資料寫入到RAM 718中。橋接器704用於與各種使用者介面組件706接合(interface),可被提供以與晶片組702接合。使用者介面組件706可以包括鍵盤、麥克風、觸碰偵測和處理電路、以及例如滑鼠的指向設備。
晶片組702也可以與可具有不同實體介面的一個或多個通訊介面708接合。這種通訊介面可以包括用於有線和無線區域網路、用於寬頻帶無線網路、和用於個人區域網路的介面。再者,機器可以通過使用者介面組件706接收來自使用者的輸入並執行適當的功能,例如通過使用處理器710解譯這些輸入的瀏覽功能。
再者,晶片組702也可以與韌體712通訊,韌體712可以在通電時由計算系統700執行。韌體712可以基於一組韌體配置來識別、初始化和測試存在於計算機系統700中的硬體。韌體712可以在系統700上執行自檢(例如POST)。自檢可以測試各種硬體組件702-718的功能。韌體712可以定址和分配記憶體718中的區域以儲存OS。韌體712可以載入啟動載入器及/或OS,並且將系統700的控制權交給OS。在一些情況下,韌體712可以與硬體組件702-710和714-718通訊。於此,韌體712可以通過晶片組702與硬體組件702-710和714-718通訊,及/或通過一個或多個其他組件與硬體組件702-710和714-718通訊。在一些情況下,韌體712可以直接與硬體組件702-710和714-718通訊。
可以理解的是,範例系統600(第6圖)和700可以具有多於一個的處理器(例如630、710),或者可以是一組或一群(cluster)連網在一起的電腦裝置的其中一部分,以提供更強的處理能力。
此處所使用的術語僅用於描述特定實施例的目的,而不意圖於限制本發明。如本文所使用的,除非上下文另外清楚地指出,否則單數形式“一”和“該” 也意於包括複數形式。此外,就在詳細描述及/或申請專利範圍中使用術語“包括”、“包含”、“具”、“具有”、“有”或其變體的範圍而言,這些術語用意在於涵蓋以類似於術語“包括”的方式。
除非另外定義,否則此處使用的所有術語(包括技術和科學術語)具有與本發明所屬領域的具有通常知識者通常理解的相同含義。應進一步理解的是,例如在常用字典中定義的那些術語應被解釋為具有與其在相關領域的上下文中的含義一致的含義,並且不會被理解為理想化或過度形式化的意義,除非明確如此定義。
雖然以上已經描述了本發明的各種實施例,應理解的是,它們僅作為示例呈現,而不是限制。在不脫離本發明的精神或範圍的情況下,可以根據本文的揭露對所揭露的實施例進行各種改變。因此,本發明的廣度和範圍不應該受到任何上述實施例的限制。相反,本發明的範圍應根據以下申請專利範圍及其均等物來定義。
儘管本發明已參照一個或多個實施方式作說明和描述,但是本領域具有通常知識者在閱讀和理解本說明書和附圖後將能思及等效的改變和修改。再者,雖然本發明的特定特徵可能僅已參照多個實施方式中的其中一個被揭露,但是這樣的特徵可以與其他實現的一個或多個其他特徵組合,以期望於或有助於任何給定的或特定的應用。
綜上所述,雖然本發明已以實施例揭露如上,然其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
10:機架系統 12、220、270:CMC 14、128、138:電源架 16、18:網路裝置組 20、110:管理交換機 22、24、112、114:資料交換機 100:機架 120、130:機箱單元 122、124、126、132、134、136:伺服器 202、204、206:電源供應單元 212、214、216、252、254、256、262、264、266:風扇 222、272:系統管理匯流排交換機 224、274:系統匯流排 226、276:網路介面 300、302、310、400、402、410:線 500~516:流程步驟 600、700:計算系統 602:系統匯流排 604:記憶體 606:ROM 608、718:RAM 610:控制器 612、716:儲存裝置 614:模組1 616:模組2 618:模組3 620:輸入裝置 622、714:輸出裝置 624、708:通訊介面 626:感測器 628:快取 630、710:處理器 632:快閃記憶體 634:韌體 636:顯示器 702:晶片組 704:橋接器 706:使用者介面組件 708:通訊介面 712:韌體
第1圖繪示習知具有單一CMC以監視機架操作資料之機架系統之一範例的示意圖。 第2圖繪示允許在主要CMC失效事件中持續報告之包含伙伴CMC之範例機架內的組件的方塊圖。 第3圖繪示顯示CMC之能力以監視各別電源架之第2圖之範例機架的組件的方塊圖。 第4圖繪示顯示來自一般操作主要CMC之狀態資料流動之第2圖之範例機架的組件的方塊圖。 第5圖繪示由管理控制器運作以維持資訊及切換主要CMC功能至伙伴CMC之過程的流程圖。 第6及7圖繪示依照本揭露各種範例之範例性系統。 本揭露易受各種修改和替代形式的影響。一些代表性實施例已經通過附圖中的示例示出並且將在本文中詳細描述。然而,應理解本發明並非意在限制於所揭露的特定形式。相反,本揭露將涵蓋落入由所附請求項所定義之本發明的精神和範圍內的所有修改、均等作法、以及替代作法。

Claims (10)

  1. 一種裝備機架,包括: 一管理控制器; 一第一機箱,包括一第一電源供應單元、一第一系統匯流排、一第一機箱管理控制器及一第一網路裝置,該第一系統匯流排耦接至該第一電源供應單元,該第一機箱管理控制器耦接至該第一系統匯流排,其中該第一電源供應單元傳送狀態資料至該第一系統匯流排;以及 一第二機箱,包括一第二電源供應單元、一第二系統匯流排、一第二機箱管理控制器及一第二網路裝置,該第二系統匯流排耦接至該第二電源供應單元,該第二機箱管理控制器耦接至該第二系統匯流排,其中該第二電源供應單元傳送狀態資料至該第二系統匯流排; 其中,該第一機箱管理控制器係與該第一系統匯流排通訊以取得來自該第一電源供應單元的狀態資料,且與該第二系統匯流排通訊以取得來自該第二電源供應單元的狀態資料,且其中該第一機箱管理控制器係與該管理控制器通訊以中繼(relay)該狀態資料; 其中,該第二機箱管理控制器係與該第一系統匯流排通訊以取得來自該第一電源供應單元的狀態資料,且與該第二系統匯流排通訊以取得來自該第二電源供應單元的狀態資料; 其中該裝備機架係被操作以建立該管理控制器及該第二機箱管理控制器之間的通訊以中繼該狀態資料。
  2. 如申請專利範圍第1項所述之裝備機架,其中該第一電源供應單元係複數個電源供應單元之其中之一,各該電源供應單元的狀態資料提供至該第一系統匯流排。
  3. 如申請專利範圍第1項所述之裝備機架,其中該第一網路裝置係該第一機箱上的複數個網路裝置之其中之一。
  4. 如申請專利範圍第1項所述之裝備機架,更包括一資料交換機,該資料交換機連接至該第一網路裝置,該資料交換機係與該第一或該第二網路裝置之其中之一進行通訊。
  5. 如申請專利範圍第1項所述之裝備機架,其中該機箱管理控制器經由內部積體電路協議(inter-integrated circuit protocol, I2C)、通用非同步收發傳輸器(UART)或網路之至少其中之一與一管理交換機進行通訊。
  6. 如申請專利範圍第1項所述之裝備機架,其中該第一網路裝置係一伺服器。
  7. 如申請專利範圍第1項所述之裝備機架,其中該第一電源供應單元及該第一機箱管理控制器係附接至一電源架(power shelf)。
  8. 如申請專利範圍第5項所述之裝備機架,其中該管理交換機包含一管理控制器,該管理控制器可操作的基於編譯來自該第一和第二機箱單元所接收的狀態資料來決定機架狀態。
  9. 如申請專利範圍第1項所述之裝備機架,其中該管理控制器可操作的決定來自該第一機箱管理控制器的狀態資料的通訊失敗,且該管理控制器更可操作的當來自該第一機箱管理控制器的狀態資料被確定通訊失敗時與該第二機箱管理控制器建立通訊。
  10. 一種用以確保一裝備機架的狀態報告的方法,該裝備機架具有一管理控制器、一第一機箱及一第二機箱,其中,該第一機箱包括一第一電源供應單元、一第一系統匯流排、一第一機箱管理控制器及一第一網路裝置,其中該第二機箱包括一第二電源供應單元、第二系統匯流排、一第二機箱管理控制器及一第二網路裝置,該方法包括: 將來自該第一電源供應單元的狀態資料提供至一第一系統匯流排; 將來自該第二電源供應單元的狀態資料提供至一第二系統匯流排; 建立該第一機箱管理控制器與該第一系統匯流排之間的通訊,以取得來自該第一電源供應單元的狀態資料; 建立該第一機箱管理控制器與該第二系統匯流排之間的通訊,以取得來自該第二電源供應單元的狀態資料; 經由該第一機箱管理控制器將狀態資料中繼到該管理控制器; 建立該第二機箱管理控制器與該第二系統匯流排之間的通訊,以取得來自該第二電源供應單元的狀態資料; 建立該第二機箱管理控制器與該第一系統匯流排之間的通訊,以取得來自該第一電源供應單元的狀態資料;以及 在決定來自該第一機箱管理控制器的狀態資料未被中繼時,經由該第二機箱管理控制器向該管理控制器發起狀態資料的中繼。
TW107121357A 2018-01-05 2018-06-21 裝備機架及其狀態報告確保方法 TWI668974B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862613855P 2018-01-05 2018-01-05
US62/613,855 2018-01-05
US15/968,382 2018-05-01
US15/968,382 US10613950B2 (en) 2018-01-05 2018-05-01 CMC failover for two-stick canisters in rack design

Publications (2)

Publication Number Publication Date
TW201931820A TW201931820A (zh) 2019-08-01
TWI668974B true TWI668974B (zh) 2019-08-11

Family

ID=62846048

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107121357A TWI668974B (zh) 2018-01-05 2018-06-21 裝備機架及其狀態報告確保方法

Country Status (5)

Country Link
US (1) US10613950B2 (zh)
EP (1) EP3508980B1 (zh)
JP (1) JP6703045B2 (zh)
CN (1) CN110011821B (zh)
TW (1) TWI668974B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102067128B1 (ko) * 2018-06-07 2020-01-16 코츠테크놀로지주식회사 헬스 모니터링 장치 및 이를 포함하는 대화면 시현기
TWI770451B (zh) * 2019-12-17 2022-07-11 財團法人金屬工業研究發展中心 工作母機加工資訊即時呈現方法與工作母機即時呈現系統

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130173810A1 (en) * 2011-12-30 2013-07-04 Dell Products, Lp System and Method of Enabling a Multi-Chassis Virtual Switch for Virtual Server Network Provisioning
WO2014160556A2 (en) * 2013-03-29 2014-10-02 Silicon Graphics International Corp. Populating localized fast bulk storage in a multi-node computer system
US9424148B2 (en) * 2013-08-21 2016-08-23 Dell Products L.P. Automatic failover in modular chassis systems
US20170132062A1 (en) * 2014-10-08 2017-05-11 Dell Products L.P. Modular System Awareness in Virtualized Information Handling Systems
US9690593B2 (en) * 2013-03-04 2017-06-27 Dell Products L.P. Server information handling system configuration from an end state definition file

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6948008B2 (en) 2002-03-12 2005-09-20 Intel Corporation System with redundant central management controllers
US20030177224A1 (en) 2002-03-15 2003-09-18 Nguyen Minh Q. Clustered/fail-over remote hardware management system
US20040246982A1 (en) * 2003-06-06 2004-12-09 Sun Microsystems, Inc. Methods and apparatus for configuring a packet switching (PS) backplane to support various configurations
AU2007207648B2 (en) 2006-01-19 2012-06-14 American Power Conversion Corporation Cooling system and method
US7581133B2 (en) * 2006-08-04 2009-08-25 Dell Products, Lp System and method of providing real time to devices within a server chassis
JP5299283B2 (ja) 2007-11-19 2013-09-25 富士通株式会社 情報処理装置及び情報処理システム並びにそれらの制御方法
EP2325721A1 (en) 2008-08-14 2011-05-25 Fujitsu Limited Cooling method and computer
US20100146592A1 (en) * 2008-12-04 2010-06-10 Dell Products L. P. Systems and methods for providing session continuity across a chassis management controller failover
US8037364B2 (en) * 2009-01-09 2011-10-11 International Business Machines Corporation Forced management module failover by BMC impeachment consensus
CN102782606B (zh) * 2009-06-19 2015-11-25 惠普开发有限公司 外壳功率控制器
US8868936B2 (en) * 2010-11-29 2014-10-21 Cisco Technology, Inc. Dynamic power balancing among blade servers in a chassis
TW201222208A (en) * 2010-11-30 2012-06-01 Inventec Corp Server integrate system
US8842664B2 (en) * 2011-09-27 2014-09-23 Znyx Networks, Inc. Chassis management modules for advanced telecom computing architecture shelves, and methods for using the same
TWI454092B (zh) * 2011-09-29 2014-09-21 Quanta Comp Inc 伺服器叢集及其控制機制
CN103138945B (zh) * 2011-11-28 2016-06-08 英业达科技有限公司 管理电源供应的服务器机架系统
CN103138943A (zh) * 2011-11-28 2013-06-05 英业达科技有限公司 服务器机架系统及电源系统
WO2013094006A1 (ja) * 2011-12-19 2013-06-27 富士通株式会社 プログラム、情報処理装置および方法
JP5842695B2 (ja) 2012-03-21 2016-01-13 日本電気株式会社 電子機器用ラック
US8694693B2 (en) * 2012-04-10 2014-04-08 Dell Products L.P. Methods and systems for providing user selection of associations between information handling resources and information handling systems in an integrated chassis
US9170627B2 (en) * 2012-08-20 2015-10-27 Dell Products L.P. Power management for PCIE switches and devices in a multi-root input-output virtualization blade chassis
US9229497B2 (en) 2012-11-08 2016-01-05 Silicon Graphics International Corp. On-blade cold sink for high-density clustered computer system
US9118589B2 (en) * 2013-03-11 2015-08-25 Dell Products, L.P. System and method for rapid VLT connection failure handling
TW201445936A (zh) * 2013-05-17 2014-12-01 Hon Hai Prec Ind Co Ltd 可動態切換主節點的伺服器系統及動態切換主節點的方法
US9665154B2 (en) * 2013-05-31 2017-05-30 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Subsystem-level power management in a multi-node virtual machine environment
US9804980B2 (en) * 2013-07-25 2017-10-31 Dell Products, Lp System management through direct communication between system management controllers
US9619243B2 (en) * 2013-12-19 2017-04-11 American Megatrends, Inc. Synchronous BMC configuration and operation within cluster of BMC
US9788451B2 (en) * 2013-12-23 2017-10-10 Dell Products, L.P. Block chassis sled having one-third width computing and storage nodes for increased processing and storage configuration flexibility within a modular, scalable and/or expandable rack-based information handling system
US9753520B2 (en) * 2013-12-23 2017-09-05 Dell Products, L.P. Predictive power capping and power allocation to computing nodes in a rack-based information handling system
US10097409B2 (en) * 2014-03-01 2018-10-09 Dell Products, Lp System and method for managing multi-tenant chassis environment using virtual private chassis management controllers
US20150363340A1 (en) * 2014-06-11 2015-12-17 Microsoft Corporation Providing multiple synchronous serial console sessions using data buffering
US9804937B2 (en) * 2014-09-08 2017-10-31 Quanta Computer Inc. Backup backplane management control in a server rack system
US11349701B2 (en) * 2015-03-09 2022-05-31 Vapor IO Inc. Data center management with rack-controllers
US10505843B2 (en) * 2015-03-12 2019-12-10 Dell Products, Lp System and method for optimizing management controller access for multi-server management
US10382534B1 (en) * 2015-04-04 2019-08-13 Cisco Technology, Inc. Selective load balancing of network traffic
US9588571B2 (en) * 2015-07-08 2017-03-07 Quanta Computer Inc. Dynamic power supply management
US9734093B2 (en) * 2015-09-18 2017-08-15 Dell Products, L.P. Management of secured storage devices in an information handling system
TWI566613B (zh) * 2015-10-15 2017-01-11 廣達電腦股份有限公司 資料流中繼裝置與通訊裝置
US9942935B2 (en) * 2015-11-17 2018-04-10 Dell Products, Lp System and method for providing a wireless failover of a management connection in a server rack of a data center
US10404676B2 (en) * 2016-03-29 2019-09-03 Intel Corporation Method and apparatus to coordinate and authenticate requests for data
US10402207B2 (en) * 2016-06-16 2019-09-03 Quanta Computer Inc. Virtual chassis management controller
KR102273770B1 (ko) * 2016-07-19 2021-07-06 삼성에스디아이 주식회사 배터리 시스템
US10691562B2 (en) * 2017-03-17 2020-06-23 American Megatrends International, Llc Management node failover for high reliability systems
US10728086B2 (en) * 2017-03-23 2020-07-28 Dell Products, L.P. System and method for providing a redundant communication path between a server rack controller and one or more server controllers
US10506734B2 (en) * 2018-01-10 2019-12-10 Dell Products, Lp Information handling system having synchronized power loss detection armed state

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130173810A1 (en) * 2011-12-30 2013-07-04 Dell Products, Lp System and Method of Enabling a Multi-Chassis Virtual Switch for Virtual Server Network Provisioning
US9690593B2 (en) * 2013-03-04 2017-06-27 Dell Products L.P. Server information handling system configuration from an end state definition file
WO2014160556A2 (en) * 2013-03-29 2014-10-02 Silicon Graphics International Corp. Populating localized fast bulk storage in a multi-node computer system
US9424148B2 (en) * 2013-08-21 2016-08-23 Dell Products L.P. Automatic failover in modular chassis systems
US20170132062A1 (en) * 2014-10-08 2017-05-11 Dell Products L.P. Modular System Awareness in Virtualized Information Handling Systems

Also Published As

Publication number Publication date
EP3508980B1 (en) 2020-06-17
JP2019121338A (ja) 2019-07-22
US10613950B2 (en) 2020-04-07
JP6703045B2 (ja) 2020-06-03
EP3508980A1 (en) 2019-07-10
CN110011821A (zh) 2019-07-12
US20190213091A1 (en) 2019-07-11
TW201931820A (zh) 2019-08-01
CN110011821B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
TWI616758B (zh) 遠端多電腦切換技術之儲存裝置、系統及方法
TWI620072B (zh) 可擴充集中式非揮發性記憶體儲存盒、電腦實施方法以及非暫態電腦可讀取儲存裝置
US8948000B2 (en) Switch fabric management
TWI670604B (zh) 多主機拓撲系統之cpld快取應用
TWI559148B (zh) 自動硬體恢復方法及自動硬體恢復系統
EP3739446B1 (en) Method and system for communication channels to management controller
TWI649992B (zh) 決定網路節點的網路介面卡操作速度的方法、端口扇出配置系統及其方法
US20190235592A1 (en) Cooling behavior in computer systems
JP2020053017A (ja) ハイブリッド電源のシステム及び方法
US11640377B2 (en) Event-based generation of context-aware telemetry reports
TWI668974B (zh) 裝備機架及其狀態報告確保方法
US10852792B2 (en) System and method for recovery of sideband interfaces for controllers
TWI652919B (zh) 自動組合資料中心資源的方法及自動組合資料中心資源的系統