TWI662810B - 伺服器管理系統及伺服器管理方法 - Google Patents

伺服器管理系統及伺服器管理方法 Download PDF

Info

Publication number
TWI662810B
TWI662810B TW107126663A TW107126663A TWI662810B TW I662810 B TWI662810 B TW I662810B TW 107126663 A TW107126663 A TW 107126663A TW 107126663 A TW107126663 A TW 107126663A TW I662810 B TWI662810 B TW I662810B
Authority
TW
Taiwan
Prior art keywords
server
power value
servers
controller
predicted
Prior art date
Application number
TW107126663A
Other languages
English (en)
Other versions
TW202008750A (zh
Inventor
孫佩傑
黃添壽
Original Assignee
技嘉科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 技嘉科技股份有限公司 filed Critical 技嘉科技股份有限公司
Priority to TW107126663A priority Critical patent/TWI662810B/zh
Application granted granted Critical
Publication of TWI662810B publication Critical patent/TWI662810B/zh
Publication of TW202008750A publication Critical patent/TW202008750A/zh

Links

Landscapes

  • Power Sources (AREA)

Abstract

本發明提出一種伺服器管理系統及伺服器管理方法。伺服器管理系統包括:多個伺服器,每個伺服器設置控制器,且每個伺服器具有額定功率值;電源供應器,耦接到伺服器;物聯網閘道器,耦接到伺服器。每個伺服器獲得預測功率值,並將預測功率值透過物聯網協定廣播到伺服器的控制器。每個伺服器的控制器根據預測功率值來調整額定功率值。當伺服器產生警示訊息時,警示訊息透過物聯網閘道器傳送到物聯網裝置。

Description

伺服器管理系統及伺服器管理方法
本發明是有關於一種伺服器管理系統及伺服器管理方法,且特別是有關於一種能自動達成伺服器功率負載平衡的伺服器管理系統及伺服器管理方法。
由於大數據與人工智慧的興起,資料中心伺服器的建置與管理是系統運作最基本的需求。電源供應與溫度控制是維持系統穩定最重要的因素。雖然現有的伺服器管理可透過基板管理控制器(Baseboard Management Controller,BMC)來監控伺服器的健康狀態及電源管理,但一個基板管理控制器只能管理單一伺服器,並獲得伺服器的簡單狀態訊息。當事件發生時,雖然可搭配簡單網路管理協定陷阱(Simple Network Management Protocol,SNMP trap)或簡單郵件傳輸協定(Simple Mail Transfer Protocol,SMTP)的通報機制,但無法達到即時通知管理者來處理的功能。因此,如何讓資料中心的基板管理控制器彼此溝通進而自動調整各自系統的資源使用率來降低整體功率消耗,是本領域技術人員應致力的目標。
本發明提供一種伺服器管理系統及伺服器管理方法,能自動調整各自系統的資源使用率來降低整體功率消耗。
本發明提出一種伺服器管理系統,包括:多個伺服器,每個伺服器設置控制器,且每個伺服器具有額定功率值;電源供應器,耦接到伺服器;物聯網閘道器,耦接到伺服器。每個伺服器獲得預測功率值,並將預測功率值透過物聯網協定廣播到伺服器的控制器。每個伺服器的控制器根據預測功率值來調整額定功率值。當伺服器產生警示訊息時,警示訊息透過物聯網閘道器傳送到物聯網裝置。
在本發明的一實施例中,上述伺服器包括第一伺服器及至少一第二伺服器,當第一伺服器的預測功率值大於第一伺服器的額定功率值時,第一伺服器的控制器獲得預測功率值小於額定功率值的至少一第二伺服器的資訊,則減少該電源供應器對該至少一第二伺服器的該額定功率值提供並且提供該預測功率值給該第一伺服器。。
在本發明的一實施例中,當上述伺服器的第三伺服器的預測功率值小於額定功率值時,第三伺服器的控制器將第三伺服器的預測功率值廣播到伺服器的控制器。
在本發明的一實施例中,上述物聯網裝置包括發光裝置、發聲裝置及行動裝置,當物聯網裝置接收到警示訊息時,物聯網裝置發出光線、聲音、或來電通知。
在本發明的一實施例中,上述伺服器的額定功率值的總和小於電源供應器所能提供的最大功率值。
在本發明的一實施例中,上述控制器為基板管理控制器(Baseboard Management Controller,BMC)。
本發明提出一種伺服器管理方法,適用於多個伺服器,每個伺服器設置控制器,且每個伺服器具有額定功率值。電源供應器耦接到伺服器。物聯網閘道器耦接到伺服器。伺服器管理方法包括:藉由每個伺服器獲得預測功率值,並將預測功率值透過物聯網協定廣播到伺服器的控制器;藉由每個伺服器的控制器根據預測功率值來調整額定功率值;以及當伺服器產生警示訊息時,藉由警示訊息透過物聯網閘道器傳送到物聯網裝置。
在本發明的一實施例中,上述伺服器包括第一伺服器及至少一第二伺服器,當第一伺服器的預測功率值大於第一伺服器的額定功率值時,第一伺服器的控制器獲得預測功率值小於額定功率值的至少一第二伺服器的資訊,並減少電源供應器對至少一第二伺服器的額定功率值提供且提供預測功率值給第一伺服器。
在本發明的一實施例中,當上述伺服器的第三伺服器的預測功率值小於額定功率值時,第三伺服器的控制器將第三伺服器的預測功率值廣播到伺服器的控制器。
在本發明的一實施例中,上述物聯網裝置包括發光裝置、發聲裝置及行動裝置,當物聯網裝置接收到警示訊息時,物聯網裝置發出光線、聲音、或來電通知。
在本發明的一實施例中,上述伺服器的額定功率值的總和小於電源供應器所能提供的最大功率值。
在本發明的一實施例中,上述控制器為基板管理控制器。
基於上述,本發明的伺服器管理系統及伺服器管理方法可透過不同伺服器之間的控制器的溝通來獲得每個伺服器的預測功率值,並根據每個伺服器的預測功率值來動態調整電源供應器提供到每個伺服器的功率,以達到更有效地控管伺服器管理系統的系統功耗的目標。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1為根據本發明一實施例的伺服器管理系統的方塊圖。
請參照圖1,本發明一實施例的伺服器管理系統100包括伺服器110(1)~110(n)、交換器120、閘道器130、發光裝置140、發聲裝置150及行動裝置160。伺服器110(1)~110(n)透過交換器120耦接到閘道器130。交換器120例如是機架上交換器(Top of Rack Switch)。閘道器130例如是物聯網閘道器。閘道器130耦接到發光裝置140、發聲裝置150及行動裝置160等物聯網裝置。本發明不對物聯網裝置的種類作出限制。也就是說,閘道器130也可耦接到其他種類的物聯網裝置。
在本實施例中,伺服器110(1)~110(n)可藉由一電源供應器來提供功率。每個伺服器110(1)~110(n)都設置一控制器,例如基板管理控制器,用以獲取伺服器110(1)~110(n)元件的功耗及溫度等基本資訊。此外,基板管理控制器還可收集伺服器110(1)~110(n)內的每秒計算使用量(Compute Usage Per Second,CUPS)資料。由於伺服器110(1)~110(n)的每秒計算使用量的值與工作負載(workload)是成正比關係,而系統的工作負載與實際的功率消耗也是正比關係,因此可利用演算法來預測伺服器110(1)~110(n)的工作負載需要使用的功率。舉例來說,伺服器110(1)~110(n)每日的工作負載都可被記錄為歷史資料,而將上述歷史資料輸入機器學習模組後,就可利用現有的功率值進行一段預定時間後的功率值的預測。上述預測各伺服器110(1)~110(n)功率值的演算法可被實作於每個伺服器110(1)~110(n)的控制器中。
在一實施例中,每個伺服器110(1)~110(n)的控制器可透過物聯網協定(IOT protocol)進行彼此的溝通。詳細來說,當每個伺服器110(1)~110(n)的控制器獲得一預測功率值時,會將此預測功率值廣播到所有伺服器110(1)~110(n)的控制器。因此所有伺服器110(1)~110(n)的控制器可根據接收到的預測功率值來調整各伺服器110(1)~110(n)的額定功率值。值得注意的是,所有伺服器110(1)~110(n)的額定功率值的總和會小於電源供應器所能提供的最大功率值。而在實作上,電源供應器通常只會輸出最大功率值的特定百分比的功率,以維持系統的穩定與延長電源供應器元件的使用壽命。
在一實施例中,假設每個伺服器110(1)~110(n)的額定功率值為80%。額定功率值80%代表了電源供應器提供給每個伺服器110(1)~110(n)的功率最多只能達成80%的工作負載。當伺服器110(1)的預測功率值為100%時,由於此預測功率值100%大於伺服器110(1)的額定功率值80%,因此伺服器110(1)的控制器獲得預測功率值小於額定功率值的至少一個伺服器的資訊。舉例來說,伺服器110(1) 、伺服器110(2)及伺服器110(3)的控制器可得知預測功率值為100%、70%、70%。因此伺服器110(2)及伺服器110(3)的的控制器會降低伺服器110(2)及伺服器110(3)對電源供應器的額定功率值,而伺服器110(1)的控制器可提高對電源供應的需求達預測功率值100%。換句話說,伺服器110(2)及伺服器110(3)的控制器調降伺服器110(2)及伺服器110(3)的額定功率值並且伺服器110(1)的控制器調升伺服器110(1)的額定功率值,以將原本要提供給伺服器110(2)及伺服器110(3)的部分功率提供給伺服器110(1)。另一方面,當伺服器110(1)~110(n)的其中之一的預測功率值小於額定功率值時,此伺服器的控制器會將預測功率值廣播到伺服器110(1)~110(n)的控制器。
因此,本發明一實施例的伺服器管理系統100的每個伺服器110(1)~110(n)可預測各個階段可能的功率需求,並根據預測功率值來動態調整電源供應器的功率分配,以達到功率負載平衡的目的。
在一實施例中,伺服器管理系統100還可透過物聯網協定使用訊息佇列遙測傳輸 (Message Queuing Telemetry Transport,MQTT)的訂閱(subscribe)與發布(publish)方式,彈性地增加享要關注的事件。當收到系統事件時,可搭配閘道器130(物聯網閘道器)透過Zigbee、藍芽、3G、4G等通訊模組在物聯網裝置上顯示燈光、發出聲響或撥打電話等。
圖2為根據本發明一實施例的伺服器管理方法的流程圖。
請參照圖2,在步驟S201中,訂閱物聯網每秒計算使用量主題。在步驟S202中,由伺服器的控制器收集每秒計算使用量資料。在步驟S203中,預測每秒計算使用量及對應的功率消耗。在步驟S204中,將預測的每秒計算使用量發布給其他伺服器的控制器。在步驟S205中,伺服器也會聆聽其他伺服器發布的每秒計算使用量。在步驟S206中,計算每秒計算使用量對應的負載並進行分析。在步驟S207中,調整適合的額定功率值以達成負載平衡。達成負載平衡後,回到步驟S202及S205繼續收集每秒計算使用量資料與聆聽其他伺服器發布的每秒計算使用量。
圖3為根據本發明一實施例的事件處理方法的流程圖。
請參照圖3,在步驟S301中,伺服器的控制器監控系統健康狀態。在步驟S302中,判斷是否有錯誤發生。若無錯誤發生,則回到步驟S301中。若有錯誤發生,在步驟S303中,將錯誤事件發布給訂閱者。上述發布動作是藉由閘道器130來進行,以將錯誤事件透過物聯網協定發布給物聯網裝置。
綜上所述,本發明的伺服器管理系統及伺服器管理方法可透過不同伺服器之間的控制器的溝通來獲得每個伺服器的預測功率值,並根據每個伺服器的預測功率值來動態調整電源供應器提供到每個伺服器的功率,以達到更有效地控管伺服器管理系統的系統功耗的目標。此外,當有錯誤發生時,也可透過物聯網閘道器將錯誤訊息以聲光或來電等方式呈現在物聯網裝置上,讓系統管理者可即時處理錯誤。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
100‧‧‧伺服器管理系統
110(1)~110(n)‧‧‧伺服器
120‧‧‧交換器
130‧‧‧閘道器
140‧‧‧發光裝置
150‧‧‧發聲裝置
160‧‧‧行動裝置
S201~S207‧‧‧伺服器管理方法的步驟
S301~S303‧‧‧事件處理方法的步驟
圖1為根據本發明一實施例的伺服器管理系統的方塊圖。 圖2為根據本發明一實施例的伺服器管理方法的流程圖。 圖3為根據本發明一實施例的事件處理方法的流程圖。

Claims (12)

  1. 一種伺服器管理系統,包括: 多個伺服器,每個該些伺服器設置一控制器,且每個該些伺服器具有一額定功率值; 一電源供應器,耦接到該些伺服器; 一物聯網閘道器,耦接到該些伺服器,其中 每個該些伺服器獲得一預測功率值,並將該預測功率值透過一物聯網協定廣播到該些伺服器的該些控制器, 每個該些伺服器的該控制器根據該預測功率值來調整該額定功率值, 當該些伺服器產生一警示訊息時,該警示訊息透過該物聯網閘道器傳送到一物聯網裝置。
  2. 如申請專利範圍第1項所述的伺服器管理系統,其中該些伺服器包括一第一伺服器及至少一第二伺服器,當該第一伺服器的該預測功率值大於該第一伺服器的該額定功率值時,該第一伺服器的該控制器獲得該預測功率值小於該額定功率值的該至少一第二伺服器的資訊,則減少該電源供應器對該至少一第二伺服器的該額定功率值提供並且提供該預測功率值給該第一伺服器。。
  3. 如申請專利範圍第1項所述的伺服器管理系統,其中當該些伺服器的一第三伺服器的該預測功率值小於該額定功率值時,該第三伺服器的該控制器將該第三伺服器的該預測功率值廣播到該些伺服器的該些控制器。
  4. 如申請專利範圍第1項所述的伺服器管理系統,其中該物聯網裝置包括一發光裝置、一發聲裝置及一行動裝置,當該物聯網裝置接收到該警示訊息時,該物聯網裝置發出光線、聲音、或來電通知。
  5. 如申請專利範圍第1項所述的伺服器管理系統,其中該些伺服器的該額定功率值的總和小於該電源供應器所能提供的一最大功率值。
  6. 如申請專利範圍第1項所述的伺服器管理系統,其中該控制器為一基板管理控制器(Baseboard Management Controller,BMC)。
  7. 一種伺服器管理方法,適用於多個伺服器,每個該些伺服器設置一控制器,且每個該些伺服器具有一額定功率值,一電源供應器耦接到該些伺服器,一物聯網閘道器耦接到該些伺服器,伺服器管理方法包括: 藉由每個該些伺服器獲得一預測功率值,並將該預測功率值透過一物聯網協定廣播到該些伺服器的該些控制器; 藉由每個該些伺服器的該控制器根據該預測功率值來調整該額定功率值;以及 當該些伺服器產生一警示訊息時,藉由該警示訊息透過該物聯網閘道器傳送到一物聯網裝置。
  8. 如申請專利範圍第7項所述的伺服器管理方法,其中該些伺服器包括一第一伺服器及至少一第二伺服器,當該第一伺服器的該預測功率值大於該第一伺服器的該額定功率值時,該第一伺服器的該控制器獲得該預測功率值小於該額定功率值的該至少一第二伺服器的資訊,則減少該電源供應器對該至少一第二伺服器的該額定功率值提供並且提供該預測功率值給該第一伺服器。。
  9. 如申請專利範圍第7項所述的伺服器管理方法,其中當該些伺服器的一第三伺服器的該預測功率值小於該額定功率值時,該第三伺服器的該控制器將該第三伺服器的該預測功率值廣播到該些伺服器的該些控制器。
  10. 如申請專利範圍第7項所述的伺服器管理方法,其中該物聯網裝置包括一發光裝置、一發聲裝置及一行動裝置,當該物聯網裝置接收到該警示訊息時,該物聯網裝置發出光線、聲音、或來電通知。
  11. 如申請專利範圍第7項所述的伺服器管理方法,其中該些伺服器的該額定功率值的總和小於該電源供應器所能提供的一最大功率值。
  12. 如申請專利範圍第7項所述的伺服器管理方法,其中該控制器為一基板管理控制器。
TW107126663A 2018-08-01 2018-08-01 伺服器管理系統及伺服器管理方法 TWI662810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW107126663A TWI662810B (zh) 2018-08-01 2018-08-01 伺服器管理系統及伺服器管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107126663A TWI662810B (zh) 2018-08-01 2018-08-01 伺服器管理系統及伺服器管理方法

Publications (2)

Publication Number Publication Date
TWI662810B true TWI662810B (zh) 2019-06-11
TW202008750A TW202008750A (zh) 2020-02-16

Family

ID=67764576

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107126663A TWI662810B (zh) 2018-08-01 2018-08-01 伺服器管理系統及伺服器管理方法

Country Status (1)

Country Link
TW (1) TWI662810B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009055368A2 (en) * 2007-10-21 2009-04-30 Citrix Systems, Inc. Systems and methods to adaptively load balance user sessions to reduce energy consumption
CN101430595A (zh) * 2007-11-08 2009-05-13 国际商业机器公司 限制功耗的功率管理电子系统与方法
US20120072745A1 (en) * 2010-09-22 2012-03-22 International Business Machines Corporation Server power management with automatically-expiring server power allocations
JP5129151B2 (ja) * 2005-11-30 2013-01-23 マイクロソフト コーポレーション マルチユーザ・ディスプレイ・プロキシ・サーバ
US20160334860A1 (en) * 2014-03-06 2016-11-17 Dell Products, Lp System and Method for Server Rack Power Management

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5129151B2 (ja) * 2005-11-30 2013-01-23 マイクロソフト コーポレーション マルチユーザ・ディスプレイ・プロキシ・サーバ
WO2009055368A2 (en) * 2007-10-21 2009-04-30 Citrix Systems, Inc. Systems and methods to adaptively load balance user sessions to reduce energy consumption
CN101430595A (zh) * 2007-11-08 2009-05-13 国际商业机器公司 限制功耗的功率管理电子系统与方法
US20120072745A1 (en) * 2010-09-22 2012-03-22 International Business Machines Corporation Server power management with automatically-expiring server power allocations
US20160334860A1 (en) * 2014-03-06 2016-11-17 Dell Products, Lp System and Method for Server Rack Power Management

Also Published As

Publication number Publication date
TW202008750A (zh) 2020-02-16

Similar Documents

Publication Publication Date Title
US9568975B2 (en) Power balancing to increase workload density and improve energy efficiency
US20150286507A1 (en) Method, node and computer program for enabling automatic adaptation of resource units
US7957335B2 (en) Dynamic power usage management based on historical traffic pattern data for network devices
US9712448B2 (en) Proxy server, hierarchical network system, and distributed workload management method
US10649822B2 (en) Event ingestion management
WO2018156764A1 (en) Predictive analytics for virtual network functions
Wang et al. Minimizing controller response time through flow redirecting in SDNs
CN105242956A (zh) 虚拟功能服务链部署系统及其部署方法
US20200213205A1 (en) Adjusting triggers for automatic scaling of virtual network functions
WO2018232917A1 (zh) 一种物联网降低网络拥塞的方法及路由器
WO2014190523A1 (zh) 一种调度方法、装置及系统
US20170185456A1 (en) Dynamically scaled web service deployments
Bahari et al. Review on data center issues and challenges: Towards the Green Data Center
US11039404B2 (en) Method for control and distribution of the amount of power to be lowered or raised in a multi-load system
WO2015154483A1 (zh) 网络流量均衡的方法及超级控制器
JP5710006B2 (ja) Atcaベースの機器において通信トラフィックをスケジュールするための方法および装置
CN112448987A (zh) 一种熔断降级的触发方法、系统和存储介质
TWI662810B (zh) 伺服器管理系統及伺服器管理方法
CN105407059A (zh) 一种应用于SCSI目标器的QoS调度器及调度方法
CN114978998B (zh) 一种流量控制方法、装置、终端及存储介质
Yu et al. Energy-efficient, qos-aware packet scheduling in high-speed networks
KR101888693B1 (ko) 통신 시스템을 통한 푸시 알림 서비스의 푸시 알림 메시지 전송주기 조절 방법 및 장치
CN110798323A (zh) 服务器管理系统及服务器管理方法
US10291490B1 (en) System and method for collecting data from low-availability devices
US20150142527A1 (en) Architecture for a contact center with emulator driven self control loop