TWI570545B - 伺服器系統及其電腦實現之方法及非暫態電腦可讀取儲存媒體 - Google Patents

伺服器系統及其電腦實現之方法及非暫態電腦可讀取儲存媒體 Download PDF

Info

Publication number
TWI570545B
TWI570545B TW104130894A TW104130894A TWI570545B TW I570545 B TWI570545 B TW I570545B TW 104130894 A TW104130894 A TW 104130894A TW 104130894 A TW104130894 A TW 104130894A TW I570545 B TWI570545 B TW I570545B
Authority
TW
Taiwan
Prior art keywords
psus
server system
subset
load
algorithm
Prior art date
Application number
TW104130894A
Other languages
English (en)
Other versions
TW201638712A (zh
Inventor
黃仁烜
林發達
林耿宇
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201638712A publication Critical patent/TW201638712A/zh
Application granted granted Critical
Publication of TWI570545B publication Critical patent/TWI570545B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer And Data Communications (AREA)
  • Telephonic Communication Services (AREA)
  • Power Sources (AREA)

Description

伺服器系統及其電腦實現之方法及非暫態電腦可讀取儲存媒體
本發明係有關於電信網路的伺服器系統技術。
現代的伺服器群(server farm)或資料中心通常採用大量的伺服器來負責處理各種應用服務的處理需求。每個伺服器處理多種操作並且需要一特定準位的耗電以維持這些操作。其中的一些操作為”關鍵任務”(mission critical)的操作,針對這些”關鍵任務”的中斷可能對與這些操作相關的使用者造成顯著安全漏洞或收入損失。
前述中斷的一個來源是來自於一伺服器系統的電源供應單元(power supply unit,以下簡稱PSU)發生故障或錯誤。發生在一或多個PSU的故障或錯誤可能會導致伺服器系統突然強制關機,可能導致伺服器系統的資料遺失,甚至損壞伺服器系統。一般情況下,伺服器系統包含一或多個冗餘PSU,用以提供電力給伺服器系統的負載(load)。因此,當一個電源供應單元(PSU)發生故障時,其他的PSU可以繼續提供電力給負載。然而,使用冗餘的電源供應單元仍然存在許多相關的內在 問題。
依據本發明的各種實施例的系統以及方法可提供了解決上述問題的方法,其可透過動態地管理一伺服器系統中的二或多個電源管理單元(power supply unit,下稱PSU),使得伺服器系統的二或多個PSU可操作在大致上為最佳化的效能準位並且具有大致上最佳的平均故障間隔時間(Mean Time Between Failure,MTBF)。更確切來說,本發明的各種實施例可依據一或多個PSU管理演算法來提供管理伺服器系統中的二或多個PSU的方法。一些實施例中可決定一伺服器系統的目前以及/或預測的負載量(loading)以及伺服器系統的二或多個PSU之每一者之負載量。至少依據伺服器系統的目前以及/或預測的負載量以及伺服器系統的二或多個PSU電源供應單元之負載量,二或多個PSU的一第一子集中的PSU可被關閉。二或多個PSU中正在運作的一第二子集的PSU之間的伺服器系統之目前負載量可被重新平衡。二或多個PSU的第一子集中的一或多個PSU可依據上述一或多個PSU管理演算法週期性地與第二子集中的一或多個PSU進行交換。
在一些實施例中,伺服器系統的目前負載量可在其二或多個PSU的一第二子集中的PSU之間重新取得平衡,使得第二子集中的PSU可大致地運作在一門檻效能準位。舉例來說,第二子集中的每個PSU可被加載到接近其最大額定電流的一既定百分比(例如:50%)。
在一些實施例中,一個負載量平衡演算法可以用 來在二或多個PSU的正在操作中的一第二子集的PSU之間平衡伺服器系統的目前負載量或者交換二或多個PSU的第一子集與第二子集之間的至少一PSU。其中,平衡伺服器系統的目前電流負載量或者交換二或多個PSU的第一子集與第二子集之間的至少一PSU的判斷可至少依據一既定最小負載量、一既定最大負載量或一既定最小效能來決定。
在一些實施例中,相應於一伺服器系統的負載量已增加超過一高門檻值,在兩個或多個的PSU的第一子集的所有PSU可以合併至兩個或多個的PSU的第二子集。換言之,在伺服器系統中兩個或多個PSU的所有PSU都會被開啟並開始操作。
一些實施例可以收集伺服器系統的歷史負載量資訊。所收集到的歷史負載量資訊可以依據一或多個機器學習演算法進行分析,並可用於預測伺服器系統在特定的未來時間時的負載量型式(loading pattern)。所述二或多個的PSU的第一子集可至少依據伺服器系統的目前以及預測的負載量或者伺服器系統的二或多個PSU的負載量來加以決定。在一些實施例中,與伺服器系統相關聯的其他資訊也可被收集並用於預測伺服器系統的負載量。其他資訊可包括但不受限於,所述二或多個的PSU的每一者的健康情形、其他伺服器系統、一天中的時間,一年中的天數、溫度、冷卻風扇的速度、電源狀態、記憶體與作業系統(OS)的狀態、各種資料封包抵達速率以及資料佇列統計資料等等。在一些實施例中,關於每個所述二或多個PSU的負載量和效能的歷史資料可被收集並用於動態地分配包含 在與不包含在所述PSU的第一子集與第二子集中的PSU。舉例來說,一特定的PSU,其已至少在二或多個PSU之間較少使用或具有比二或多個PSU的平均效能更高的操作效能,可以更頻繁地分配至第二子集中。
在一些實施例中,一或多個PSU管理演算法可包括至少一機器學習演算法。與伺服器系統相關聯的收集到的資訊可作為上述至少一機器學習演算法的一輸入特徵集合(input feature set)來預測伺服器系統的負載量模式。一或多個機器學習演算法可包括但不限於,線性回歸模型演算法、類神經網路模型演算法、支持向量機為基礎的模型演算法、貝葉斯統計(Bayesian statistics)演算法、案例推理(case-based reasoning)演算法、決策樹演算法、歸納邏輯程式(inductive logic programming)演算法、高斯程序回歸(Gaussian process regression)演算法、資料處理群集分析演算法(group method of data handling)、學習自動機演算法、隨機森林演算法、合奏式分類器(ensembles of classifiers)演算法、有序分類(ordinal classification)演算法、或者條件式隨機場域(conditional random field,CRF)演算法之其中至少一者。
100‧‧‧伺服器系統
101‧‧‧電源供應
110‧‧‧中央處理單元(CPU)
111‧‧‧快取記憶體
120‧‧‧電池系統
120‧‧‧電源供應單元(PSU)
130‧‧‧北橋(NB)
135‧‧‧PCI匯流排
140‧‧‧南橋(NB)
150‧‧‧插槽
151‧‧‧處理器
152‧‧‧ISA插槽
160‧‧‧PCIe插槽
161‧‧‧PCIe插槽
170‧‧‧PCI插槽
171‧‧‧PCI插槽
180‧‧‧主記憶體
400‧‧‧方法流程圖
221、222、223、224、225、226‧‧‧PSU
321、322、323、324、325、326‧‧‧PSU
400、402、404、406、408、410、412、414、416、418、420‧‧‧執行步驟
500‧‧‧運算裝置
515‧‧‧匯流排
561‧‧‧記憶體
562‧‧‧CPU
563‧‧‧處理器
568‧‧‧介面
600‧‧‧系統
605‧‧‧系統匯流排
610‧‧‧處理器
612‧‧‧快取記憶體
615‧‧‧記憶體
620‧‧‧ROM
625‧‧‧RAM
630‧‧‧儲存裝置
632‧‧‧MOD 1
634‧‧‧MOD 2
636‧‧‧MOD 3
635‧‧‧輸出裝置
640‧‧‧通訊介面
645‧‧‧輸入裝置
650‧‧‧電腦系統
655‧‧‧處理器
660‧‧‧晶片組
665‧‧‧輸出裝置
670‧‧‧儲存裝置
675‧‧‧RAM
680‧‧‧橋接器
685‧‧‧用戶介面元件
690‧‧‧通訊介面
為使本發明之上述和其他目的、特徵、和優點能更明顯易懂,下文特舉出一或多個較佳實施例,並配合所附圖式,作詳細說明如下。注意的是,雖然揭露書係依所附圖式進行說明,然其並非用以限定本發明,任何熟悉此項技藝者,在不脫離本發明之精神和範圍內,當可做些許更動與潤飾,其原 理與附加特徵可配合所附圖式描述與解釋,其中:第1圖顯示依據本發明一實施例之示範伺服器系統的示意方塊圖;第2A圖至第2G圖顯示依據本發明實施例之示意圖,其中表示二或多個PSU的一第一子集被關閉,而二或多個PSU的一第二子集正在運作中的例子;第3A圖至第3B圖顯示依據本發明另些實施例之示意圖,其中表示二或多個PSU的一第一子集被關閉,而二或多個PSU的一第二子集正在運作中的另些例子;第4圖顯示依據本發明一實施例之用以管理一伺服器系統的多個PSU的示範方法之流程圖;第5圖顯示依據本發明各種實施例之運算裝置之示意圖;以及第6A與6B圖顯示依據本發明各種實施例之示範系統之示意圖。
本發明的各種實施例提供了用於在伺服器系統管理兩個或多個PSU的方法,以實現PSU大致上最佳化的功率效能以及MTBF。在一些實施例中,伺服器系統的目前和/或預測的負載量以及伺服器系統的二或多個PSU的每一者的負載量可以藉由使用一或多個PSU管理演算法來決定。PSU的第一子集可至少依據伺服器系統以及二或多個PSU所判定的負載量資訊而被關閉。伺服器系統的目前負載量可在二或多個PSU中的第二子集(亦即:正在操作中的剩餘PSU)之間來重新平衡。在第 一子集和第二子集的PSU可以依據PSU管理演算法被週期性地交換。
第1圖顯示依據本發明一實施例之示範伺服器系統100的示意方塊圖。在本實施例中,伺服器系統100包括連接到快取記憶體111的至少一個微處理器或中央處理單元(CPU)110、主記憶體180、二或多個電源供應單元(PSU)120,每個PSU 120可提供電源給伺服器系統100。主記憶體180可以透過北橋(NB)邏輯130耦接至CPU 110。記憶體控制模組(未繪示)可用以透過在記憶體操作期間產生(assert)必要的控制信號來控制主記憶體180的操作。主記憶體180可以包括,但不限於,動態隨機存取記憶體(dynamic random access memory,DRAM)、雙倍資料速率動態隨機存取記憶體(dual data rate DRAM,DDR DRAM)、靜態隨機存取記憶體(static RAM,SRAM),或其他類型的適當記憶體。
在一些實施例中,CPU 110可為多核心處理器,其中的每一核心係透過連接到北橋邏輯130的一CPU匯流排耦接在一起。在一些實施例中,北橋邏輯130可整合在CPU 110中。北橋邏輯130也可連接至多個週邊元件高速互連(Peripheral Component Interconnect express,PCIe)埠160以及南橋(SB)邏輯140。前述多個PCIe埠160可用於連接以及作為匯流排,如PCI Express ×1、USB 2.0、SMBus卡、SIM卡、PCIe另一通道的未來擴展、1.5伏以及3.3伏電力、以及診斷伺服器的機箱上之發光二極體(Light-Emitting Diode,LED)的電線。
在本例中,北橋邏輯130以及南橋邏輯140係透過 一周邊元件互連(peripheral component interconnect,PCI)匯流排135連接。PCI匯流排135可支援標準化格式的CPU功能,此標準化格式獨立於所有的CPU的本地匯流排的格式。PCI匯流排135可另外連接至多個PCI插槽170(例如:PCI插槽171)。匯流排控制器(未繪示)可將連接PCI匯流排的裝置視為直接連接到CPU匯流排,分派在CPU 110的位址空間的位址,且與單獨匯流排時脈同步。PCI卡可用於多個PCI插槽170,其包括但不受限於,網路介面卡(Network Interface Card,NIC)、音效卡、數據機、TV調諧器卡、硬碟控制器、顯示卡、小電腦系統介面(Small Computer System Interface,SCSI)轉換器、以及個人電腦記憶卡國際協會(PCMCIA)卡等。
南橋邏輯140可經由擴充匯流排,將PCI匯流排135耦接至多個擴充卡或插槽150(例如:ISA插槽152)。擴充匯流排可為用於南橋邏輯140以及周邊裝置之間通訊的一匯流排,並且可包括,但不限於,工業標準架構(Industry Standard Architecture,ISA)匯流排、PC/104匯流排,低腳位數(low pin count)匯流排、擴充ISA(Expansion ISA,EISA)匯流排、通用序列匯流排(Universal Serial Bus,USB)、整合式電子驅動介面(Integrated Drive Electronics,IDE)匯流排、或任何適合用於周邊裝置的資料通訊的其他匯流排。
在本例中,南橋邏輯140更耦接至連接到二或多個PSU 120的控制器151。二或多個PSU 120係用以提供電源至伺服器系統100的各種元件,例如:CPU 110、快取記憶體111、北橋邏輯130,PCIe插槽160、主記憶體180、南橋邏輯140、ISA 插槽150、PCI插槽170以及控制器151。在伺服器系統100的電源開啟後,伺服器系統100係用以從記憶體、電腦儲存裝置或外部儲存裝置中載入軟體應用程式以執行各種操作。伺服器系統100可更包含一電池系統(未繪示),其係用以於電源供應101被中斷時提供電源至伺服器系統100。二或多個PSU 120可包括一或多個可充電電池。上述一個或多個可充電的電池單元可以包括,但不限於,電化學電池單元(electrochemical cell)、燃料電池單元(fuel cell)、或超電容器(ultra-capacitor)。電化學電池單元可以包括從鉛酸、鎳鎘(NiCd)、鎳金屬氫化物(NiMH)、鋰離子(Li-離子)以及鋰離子聚合物(Li-離子聚合物)的列表中的一或多個化學物質。在充電模式下,PSU 120可對上述一或多個可充電電池單元進行充電。
在一些實施例中,控制器151可為基板管理控制器(Baseboard Management Controller,BMC)、機架管理控制器(Rack Management Controller,RMC)、鍵盤控制器、或其他合適類型的系統控制器。控制器用於控制二或多個PSU 120的操作以及/或其他可應用操作。
一些實施例中,控制器151可收集伺服器系統100以及二或多個PSU 120的負載量資訊。在一些實施例中,可收集一個或多個既定時間窗口之內的伺服器系統100的歷史負載量資訊。本文所用相對於伺服器系統或其部分中,術語“負載”(load)或“負載量”(loading)是指該伺服器系統(或其部分)在一段感興趣的時間上正在執行或預期執行的計算工作量。收集到的目前以及/或歷史負載量資訊可被分析並用於依據一或 多個PSU管理演算法來決定要被關閉的PSU的第一子集。在一些實施例中,一或多個PSU管理演算法可更包括至少一或多個機器多個機器學習演算法,其包括線性回歸模型演算法、類神經網路模型演算法、支持向量機為基礎的模型演算法、貝葉斯統計(Bayesian statistics)演算法、案例推理(case-based reasoning)演算法、決策樹演算法、歸納邏輯程式(inductive logic programming)演算法、高斯程序回歸(Gaussian process regression)演算法、資料處理群集分析演算法(group method of data handling)、學習自動機演算法、隨機森林演算法、合奏式分類器(ensembles of classifiers)演算法、有序分類(ordinal classification)演算法、或者條件式隨機場域(conditional random field,CRF)演算法。舉例來說,類神經網路模型演算法可用於分析歷史負載量資訊並且用以獲得伺服器系統100的時間和負載量型式之間的複雜相關性。
在一些實施例中,也可收集其他伺服器系統的負載量資訊並將其儲存在與伺服器系統100的相關聯的本地或遠端資料儲存裝置。其他伺服器系統的負載量資訊也可以被分析,以預測伺服器系統100的一負載量型式並且用以依據一或多個PSU管理演算法來決定需要被關閉的PSU的第一子集。
在一些實施例中,控制器151可以從內建於伺服器系統100內的不同類型感測器中收集各種參數(例如:溫度、冷卻風扇速度、電源狀態、記憶體以及/或作業系統的狀態等)。在一些實施例中,控制器151也可收集其它資訊,其包括但不限於,二或多個的PSU的每一者的健康情形、一天中的時間、 一年中的天數、各種資料封包抵達速率以及資料佇列統計資料等等。收集的參數資訊也可被分析並用以決定伺服器系統100的負載量型式以及用以決定PSU中需要被關閉的第一子集。在一些實施例中,關於所述二或多個PSU的每個PSU的負載量和效能的歷史資料也可被收集並用以動態地分配包含在與不包含在所述PSU的第一子集與第二子集中的PSU。舉例來說,一特定的PSU,其已至少在過去被頻繁的使用或具有比二或多個PSU的平均效能更低的操作效能,可以更頻繁地分配至第一子集中。
一些實施例中可重新平衡二或多個PSU 120的一第二子集之間的伺服器系統100的目前負載量,使得在第二子集中的至少一PSU操作在一大致上為最佳化的效能準位。因此,伺服器系統100的二或多個PSU 120的能量效能可大致上透過將二或多個PSU 120的第二子集操作在大致上為最佳化的效能準位並關閉剩餘的PSU來達到最佳化。
在一些實施例中,二或多個PSU的第一子集和第二子集中的一或多個PSU可以週期性地依據一或多個PSU管理演算法來進行交換,使得二或多個PSU 120的整體MTBF可以大致地最佳化。舉例來說,伺服器系統100中的一特定PSU的生命週期可透過將此特定PSU週期性地交換至二或多個PSU 120的第一子集中來加以延長。此特定的PSU可在被交換回操作之前,休息一特定時間週期T,如此可有效地產生在二或多個PSU120的一最佳化的整體MTBF。
在一些實施例中,控制器151可用以在必要時採取 適當的動作。舉例來說,相應於偵測到內建於伺服器系統100的各種類型感測器上任何參數超出其預設極限,其可表示伺服器系統100的一潛在故障,控制器151可用以相應於上述潛在故障執行一適當的操作。適當的操作可包括,但不限於,透過網路發送一警報給CPU 110或系統管理員,或採取某些校正動作,例如重置該節點或使該節點重新開機,以使一當掉的OS再重新執行。
雖然第1圖只顯示伺服器系統100之內的一些元件,伺服器統100也可包括可處理或儲存資料,或接收或傳送訊號之各類型的電子或運算元件。另外,伺服器系統100內之電子或運算元件可用於執行各類型的應用程式以及/或可使用各類型的作業系統。這些作業系統可包括但不受限於Android、柏克萊軟體套件(Berkeley Software Distribution,BSD)、iPhoneOS(iOS)、Linux、OS X、類Unix的即時作業系統(例如:QNX)、微軟視窗、微軟視窗電話、以及IBMz/OS。
取決於伺服器系統100中所需之實施方式而定,各種網路和訊息通訊協定可包括但不受限於TCP/IP,開放式系統互聯通訊(Open System Interconnection,OSI)、檔案傳輸通訊協定(File Transfer Protocol,FTP)、通用隨插即用(Universal Plug and Play,UpnP)、網路檔案系統(Network File System,NFS)、網路檔案共享系統(Common Internet File System,CIFS)、AppleTalk等等。熟習此技藝人士可知第1圖中顯示之伺服器系統100係用於說明的目的。因此,網路系統可使用許多 合適的變化來實現,同時仍依據本發明各種實施例提供網路平台設定。
在第1圖的實施例設置中,伺服器系統100內也可包括一或多個無線元件,用於與特定無線通道的運算範圍內之一或多個電子裝置通訊。無線通道可為任意用於讓裝置進行無線通訊的合適通道,例如藍芽、蜂巢、NFC、或Wi-Fi通道。同時需要了解裝置可有一或多個習知有線通訊連接,如習知技術。在本發明各種實施例的範圍中可盡可能的包括各種其他元件以及/或其結合。
第2A圖至第2G圖顯示依據本發明實施例之示意圖,其中表示二或多個PSU的一第一子集被關閉,而二或多個PSU的一第二子集正在運作中的例子。第2A圖顯示當一伺服器系統操作於一輕負載量條件時的情形。在本實施例中,伺服器系統中總共有六個PSU。六個PSU(即:221、222、223、224、225和226)中的每個PSU只操作25%的負載量且具有低於一最佳化的負載量(例如:50%)的操作效能(operation efficiency)的操作效能。熟習此技藝人士可知第2A圖中顯示之負載量與效能僅係用於說明的目的。因此,本發明各種實施例當可適用於不同負載量與效能或不同負載量與效能之間的各種相關性。
伺服器系統的一控制器可收集伺服器系統的目前以及/或預測的負載量以及伺服器系統中的六個PSU的負載量。控制器可更分析負載量資訊以預測伺服器系統的一負載量 型式並用以依據一或多個PSU管理演算法來決定需要被關閉的PSU的第一子集。假設當六個PSU中每一個PSU的對應PSU操作在50%的負載量時會達到一最佳化效能準位。第2B圖顯示PSU的第一子集中的PSU均被關閉以及PSU的第二子集中的PSU均在運作中的一個例子。在本實施例中,PSU的第一子集包括PSU 224、225和226,PSU的第二子集則包括221、222和223。在第二子集中的PSU操作在一大致最佳化的效能準位上(即:50%),而在第一子集中的PSU則被關閉。
在一些實施例中,伺服器系統的控制器可將伺服器系統中的PSU的負載量在與一既定的低門檻值(例如:30%)進行比對。相應於判定二或多個PSU操作於比低門檻值還低的負載量下時,控制器可以關閉二或多個PSU中的其中一個並且將對應PSU包含在被關閉的PSU的第一子集。
第2C圖至第2G圖顯示依據本發明實施例之示意圖,用以表示週期性交換六個PSU中的被關閉PSU所形成的一第一子集以及六個PSU中的正在運作中PSU所形成的一第二子集之間一或多個PSU的例子。第2C圖顯示PSU的第一子集中的PSU(即:225和226)均被關閉以及PSU的第二子集中的PSU(即:221、222、223和224)均為運作中的例子。於本例中,在第二子集中的PSU操作在一大致最佳化的效能準位上(即:50%),而在第一子集中的PSU則被關閉。
第2D圖至第2G圖顯示週期性交換第2C圖中的 PSU的第一子集以及PSU中的第二子集之間一或多個PSU的例子。如第2D圖所示,第2C圖中的第二子集的PSU 224係與第一子集的PSU 226互相交換。如第2E圖所示,第2D圖中的第二子集的PSU 222與223係分別與第一子集的PSU 224與225互相交換,或者第2C圖中的第二子集的PSU 222與223係分別與第一子集的PSU 225與226互相交換。如第2F圖所示,第2E圖中的第二子集的PSU 221係與第一子集的PSU 223互相交換,或者第2C圖中的第二子集的PSU 221與222係分別與第一子集的PSU 225與226互相交換。如第2G圖所示,第2F圖中的第二子集的PSU 226係與第一子集的PSU 222互相交換,或者第2C圖中的第二子集的PSU 221係與第一子集的PSU 225互相交換。
需要了解第2A-2G圖中的第一子集與第二子集的型式都僅用於說明目的。依據本發明,實際的型式可以變化並且包括各種其它類型的型式。舉例來說,實際的型式可以包括一既定的型式或者依據伺服器系統的一預測負載量,伺服器系統中的二或多個PSU的負載量或每個單獨PSU的健康情形等動態決定的型式。
第3A圖至第3B圖顯示依據本發明另些實施例之示意圖,其中表示二或多個PSU的一第一子集被關閉,而二或多個PSU的一第二子集正在運作中的另些例子。第3A圖顯示當一伺服器系統操作於一重負載量條件時的情形。在本實施例 中,伺服器系統中總共有六個PSU。PSU 321、322、323中的每個PSU都操作有90%的負載量且具有低於一最佳化的負載量(例如:50%)的操作效能的操作效能。於本實施例中,伺服器系統的目前以及/或歷史的負載量以及伺服器系統中的六個PSU的負載量資料可被收集並分析以預測伺服器系統的一負載量型式並且用以依據一或多個PSU管理演算法決定出PSU的第一子集以及第二子集。假設當六個PSU中每一個PSU的對應PSU操作在50%的負載量時會達到一最佳化效能準位。第3B圖顯示PSU的第一子集中的PSU(即:326)被關閉以及PSU的第二子集中的PSU(即:321、322、323、324和325)均在運作中的一個例子。在本實施例中,第二子集中的PSU 321、322、323、324和325操作在一大致最佳化的效能準位上(即:54%),而在第一子集中的PSU 326則被關閉。
在一些實施例中,伺服器系統的控制器可將伺服器系統中的PSU的負載量在與一既定的高門檻值(例如:75%)進行比對。相應於判定二或多個PSU操作於比高門檻值還高的負載量下時,控制器可以開啟二或多個PSU中的其中一個並且將對應PSU包含在正在運作中的PSU的第二子集。
第4圖顯示依據本發明一實施例之用以管理一伺服器系統的多個PSU的示範方法之流程圖。需要了解實施例方法400僅用於說明目的,且依據本發明實施例的其他方法可包括以相似或替代順序、或平行方式執行更多、更少、或替代步 驟。
實施例方法400在步驟402中首先決定一伺服器系統之負載量。接著,在步驟404中決定二或多個PSU中的每一者的負載量。在一些實施例中,伺服器系統的歷史負載量資訊以及/或其他伺服器系統的負載量資訊可被收集並分析。
在步驟406中,可以依據一或多個PSU管理演算法分析伺服器系統的目前負載量與二或多個PSU的負載量來判斷是否有任何PSU需要被關閉或開啟。
相應於在步驟406中判定不需要關閉或開啟一個或多個PSU中的任一者時,可在步驟408中判斷正在運作中的PSU的第二子集之間的伺服器負載量是否有平衡。相應於判定伺服器系統的負載量並未平衡,在步驟410中可重新平衡在運作中的PSU的第二子集之間的伺服器的負載量。方法流程可接著回到起始步驟402繼續監控。
相應於在步驟406中判定需要關閉或開啟一個或多個PSU中的至少一者時,可在步驟412中依據一或多個PSU管理演算法來決定伺服器系統的一預測的負載量型式。在一些實施例中,伺服器系統的預測的負載量型式可至少依據伺服器系統的目前以及/或歷史負載量或其他伺服器系統的負載量來決定。在一些實施例中,一或多個PSU管理演算法包括至少一個機器學習演算法。所收集到伺服器系統以及其他伺服器系統的目前以及/或歷史負載量資訊可以依據上述至少一個機器學習演算法進行分析,並可用於預測伺服器系統在特定的未來時間時的負載量型式。
基於伺服器系統的預測的負載量型式,在步驟414中可依據一或多個PSU管理演算法來決定是否仍然需要關閉或開啟任何PSU。相應於判定沒有第二子集中的PSU需要被關閉或沒有第一子集中的PSU需要被開啟時,可執行步驟410來重新平衡運作中的PSU的第二子集之間的伺服器的負載量。然而,相應於判定至少一個PSU仍需要被關閉或開啟時,在步驟416中可至少依據伺服器系統在對應時間時的預測的負載量型式來決定在一特定時間時需要被關閉的PSU的第一子集。
在步驟418中,可重新平衡在運作中的第二子集之間的伺服器的負載量。在步驟420中,可依據一或多個PSU管理演算法,週期性交換PSU的第一子集中的一或多個關閉的PSU與PSU的第二子集中的一或多個的運作中的PSU。在一些實施例中,可依據一既定的型式來週期性地交換第一子集以及第二子集中的PSU。
術語
一電腦網路係為藉由通訊連接和區段互連之節點的地理分配聚集,用以於終端之間傳輸資料,例如:個人電腦和工作站。可適用於許多類型的網路,其類型範圍從區域網路(Local Area Network,LAN)和廣域網路(Wide Area Network,WAN)到重疊式(overlay)和軟體定義網路,例如虛擬可擴展區域網路(Virtual Extensible Local Area Network,VXLAN)。
LAN通常連接位於相同通用實體位置,例如大樓或校園的專用私有通訊連接之節點。另一方面,WAN通常連 接長距通訊連接之地理分散節點,例如共同載波電話線、光纖路徑、同步光纖網路(Synchronous Optical network,SONET)、或同步數位階級(Synchronous Digital Hierarchy,SDH)連結。LAN和WAN可包括第2層(L2)以及/或第3層(L3)網路和裝置。
網際網路為WAN的一個例子,其連接世界上的不同網路,提供各種網路上之節點之間的全球通訊。節點通常依據預定義通訊協定例如傳輸控制通訊協定/網際網路通訊協定(TCP/IP)等交換離散資料訊框或封包而在前述網路上進行通訊。於本案中,通訊協定可視為一組定義節點間如何彼此互動的規則。電腦網路可進一步藉由中繼網路節點例如路由器等互連,以延伸每個網路的有效”大小”。
重疊式網路(overlay network)一般允許在一實體網路基礎建設上產生以及分層虛擬網路。重疊式網路通訊協定,例如虛擬可擴展區域網(Virtual Extensible LAN,VXLAN)、一般路由封裝實現網路虛擬化(Network Virtualization Using Generic Router Encapsulation,NVGRE)、網路虛擬化共存(Network Virtualization Overlays,NVO3)、以及傳輸層隧道(Stateless Transport Tunnelling,STT),提供流量封裝方案,允許通過邏輯通道透過L2和L3網路而承載網路流量。這種邏輯通道可透過虛擬通道終端(VTEP)起始以及結束。
另外,重疊式網路可包括虛擬區段,例如VXLAN重疊式網路內之VXLAN區段,其可包括虛擬L2以及/或L3 重疊式網路,虛擬機器(Virtual Machine,VM)可在之上進行通訊。虛擬區段可透過虛擬網路識別值(VNI)而被辨識,例如VXLAN網路識別值,此虛擬網路識別值可特別辨識相關虛擬區段或網域。
網路虛擬化允許硬體和軟體資源結合入虛擬網路。舉例來說,網路虛擬化可使多個VM分別透過虛擬LAN(VLAN)依附於實體網路。VM可分別依據其VLAN進行分組,且可與其他VM以及內部或外部網路的其他裝置通訊。
網路區段,例如實體或虛擬區段、網路、裝置、埠、實體或邏輯連結、以及/或流量大致來說可分為橋接或洪水網域(flood domain)。橋接網域或洪水網域可表示一廣播網域,例如L2廣播網域。橋接網域或洪水網域可包括單獨子網路,但也可包括多子網路。另外,橋接網域可相關於網路裝置上之橋接網域介面,例如一切換器。橋接網域介面可為支援L2橋接網路以及L3路由網路之間流量的邏輯介面。此外橋接網域介面可支援網際網路通訊協定(IP)終止、VPN終止、位址解析處理、MAC定位等等。橋接網域和橋接網域介面兩者可藉由相同索引或識別值而被辨識。
此外,終端群組(EndPoint Group,下稱EPG)在網路中可用於將應用程式對映(mapping)至網路。特別來說,EPG可使用網路中應用程式終端的分組,應用連接性和政策來對應用程式分組。EPG可作為用於裝運的容器,或是應用程式或應 用程式元件的集合,以及實現轉送和政策邏輯的層級。EPG也允許從藉由使用邏輯應用程式邊界代替決定位址將網路政策、安全性、以及轉送分開。
在一或多個網路也可提供雲端運算,藉以使用共享資源提供運算服務。雲端運算可大致上包括網際網路為基礎的運算,其中運算資源透過網路(例如"雲端")可取得的資源集合被動態提供與分配給用戶端或用戶電腦或其他裝置的隨選(on-demand)功能。雲端運算資源,例如,可包括任意類型的資源,例如運算、儲存、以及網路裝置,虛擬機器(Virtual Machine,簡稱VM)等等。舉例來說,資源可包括服務裝置(防火牆、深度封包檢測,流量監控、負載量平衡等等)、運算/處理裝置(伺服器、CPU的、記憶體、暴力(brute force)處理能力)、儲存裝置(例如依附網路的儲存器、儲存區域網路裝置)等等。此外,這種資源會用於支援虛擬網路、虛擬機器(VM)、資料庫、應用程式(Apps)等等。
雲端運算資源可包括"私有雲端”、"公有雲端”、以及/或"混和式雲端。"混和式雲端"可為一種由二或多個PSU雲端所組成的雲端基礎建設,該二或多個PSU雲端可透過技術相互運作或進行同盟。本質上混和式雲端為私有和公有雲端之間的互動,其中私有雲端結合公有雲端並以一種安全且有彈性(scalable)的方式使用公有雲端資源。雲端運算資源也可透過虛擬網路在重疊式網路例如VXLAN之內提供。
在網路切換系統中,可維持一查找資料庫(lookup database)以保持多個依附切換系統之終端之間的路徑軌跡。然而終端可具有各種設定且相關於許多承租者。終端可具有各種類型的識別值,例如IPv4、IPv6、或第2層。查找資料庫必須設定不同模式來處理不同類型的終端識別值。一些查找資料庫的能力是設計用於處理不同位址類型的進入封包。另外網路切換系統中之查找資料庫通常受限於1K虛擬路由以及轉送(VRF)。因此,需要用於處理各種類型的終端識別值的改良查找演算法。本發明所揭露的技術提出用於電信網路中的位址查找所需的技術。本發明所揭露的系統、方法、和電腦可讀取儲存媒體用於藉由將終端識別值對映到一致空間且允許一致處理不同形式的查找來統一各種類型的終端識別值。接著參見第5圖和第6圖所示,實施例系統和網路的簡單描述將在此揭露。本發明實施例的變形於各個實施例中描述。相關技術請參考第5圖。
第5圖顯示依據本發明一實施例之運算裝置(computing device)500之示意圖。運算裝置500包括主中央處理單元(CPU)562、介面568、以及匯流排515(例如PCI匯流排)。當在合適軟體或韌體的控制下動作時,CPU 562用於負責執行封包管理、錯誤偵測、以及/或路由功能,例如不當連接(miscabling)偵測功能。CPU 562較佳地在包括操作系統以及任意合適應用程式軟體的軟體控制之下完成上述功能。CPU 562可包括一或多個處理器563,例如來自Motorola微處理器家族 或MIPS微處理器家族的處理器。在另一實施例中,處理器563為特定設計的硬體,用於控制運算裝置500的操作。於特定實施例中,記憶體561(例如非揮發性RAM以及/或ROM)也形成CPU 562一部分。然而,記憶體可透過許多不同方式耦接系統。
介面568通常提供作為介面卡(有時稱為"線路卡(line card)")。一般來說,介面568控制通過網路之資料封包的傳送與接收且有時支援與運算裝置500一起使用的其他周邊。可提供的介面為乙太網介面、訊框中繼介面、纜線介面、DSL介面、記號環(token ring)介面等等。此外,可提供各種非常高速介面例如快速記號環介面、無線介面、乙太網介面、Gigabit乙太網介面、ATM介面、HSSI介面、POS介面、FDDI介面等等。一般而言,這些介面可包括用於合適媒體之通訊的合適埠。在一些實施例中,介面也可包括獨立處理器,以及在一些實施例中可包括揮發性RAM。獨立處理器可控制封包切換、媒體控制和管理等此種通訊密集任務。藉由對通訊密集任務提供分開的處理器,上述介面允許主微處理器562有效執行路由運算、網路診斷、安全性功能等等。
雖然第5圖所示之系統為本發明實施例之一特定運算裝置,然其絕非本發明實施例僅有的網路裝置構造。舉例來說,經常使用具有單獨處理器的構造,該單獨處理器處理通訊以及路由運算等等。另外,其他類型的介面和媒體也能與路由器一起使用。
無論網路裝置的設定是什麼,網路裝置都會使用一或多個記憶體或記憶體模組(包括記憶體561)用於針對儲存通用網路操作的程式指令以及針對上述漫遊、路由優化和路由功能的機制。例如程式指令可控制作業系統以及/或一或多個應用程式的操作。記憶體或複數記憶體也可用於儲存表格例如移動連結、註冊、和相關表格等等。
第6A與6B圖顯示依據本發明多個實施例之示範系統之示意圖。熟習此技藝者在應用本發明實施例時可應用更合適的實施例。熟習此技藝者也已知其他系統實施例的可能性。
第6A圖顯示習知系統中一種匯流排運算系統構造600,其中系統的元件互相使用匯流排605進行電性通訊。系統600的例子包括處理單元(CPU或處理器)610以及系統匯流排605,此系統匯流排605耦接各種系統元件到處理器610,各種系統元件包括系統記憶體615,例如唯讀記憶體(ROM)620和隨機存取記憶體(RAM)625。系統600可包括高速記憶體之快取記憶體,此高速記憶體直接連接、靠近、或整合為處理器610之一部分。系統600可將資料從記憶體615以及/或儲存裝置630複製到快取記憶體612用於處理器610的快速存取。以此方式快取記憶體可於等待資料時提供效能增進,避免處理器610延遲。上述以及其他模組會控制或用於控制處理器610藉以執行各種動作。同時也可使用其他系統記憶體615。記憶體 615可包括多個具有不同效能特性的不同類型記憶體。處理器610可包括任意通用處理器以及硬體模組或軟體模組,例如儲存於儲存裝置630之模組632,模組634,和模組636,用於控制處理器610以及特殊功用處理器,其中軟體指令結合入實際處理器設計。處理器610可實質上為完全自給自足的運算系統,包括多核心或處理器、匯流排,記憶體控制器、快取記憶體等等。多核處理器可為對稱或非對稱。
為了使用戶可以和運算裝置600互動,輸入裝置645會代表任意數量的輸入機制,例如用於演講的麥克風、用於手勢或圖形輸入的觸控螢幕、鍵盤、滑鼠、動作輸入、語音以及其他。輸出裝置635也可為熟習此技藝者所知之一或多個多個輸出機制。在一些例子中,多模系統會對用戶提供多類型的輸入藉以和運算裝置600通訊。通訊介面640會大致上包含並管理用戶輸入以及系統輸出。任意特定硬體設置上的各種操作沒有限制,因此這裡的基本特徵會很容易置入發展增進中的硬體或韌體設置。
儲存裝置630係為非揮發性記憶體且可為硬碟或其他類型的電腦可讀取媒體,該電腦可讀取媒體會儲存電腦可存取資料,且可例如為磁帶、快閃記憶體卡、固態記憶體裝置、數位光碟、卡匣、隨機存取記憶體(RAM)625、唯讀記憶體(ROM)620、以及其混合。
儲存裝置630可包括軟體模組632、634、636,用 於控制處理器610。也會考慮其他硬體或軟體模組。儲存裝置630會連接至系統匯流排605。於某個方面,執行特定功能的硬體模組可包括儲存於電腦可讀取媒體的軟體元件,該儲存於電腦可讀取媒體和所需硬體元件有關,該所需硬體元件可例如為用於執行功能的處理器610、匯流排605、輸出裝置635(例如顯示器)等等。
第6B圖係顯示一種具有晶片組構造的電腦系統650,該晶片組構造會被使用來執行所述方法並產生及顯示圖形用戶介面(GUI)。電腦系統650係為用於實現所揭露技術的電腦硬體、軟體和韌體的實施例。系統650可包括處理器655,表示任意數量的實體以及/或邏輯區別資源,執行用於所示運算的軟體、韌體、和硬體。處理器655會與晶片組660通訊,該晶片組660會控制處理器655的輸入和輸出。在本實施例中,晶片組660輸出資訊至輸出裝置665,例如顯示器,且會讀取和寫入資訊至儲存裝置670,儲存裝置670可包括例如磁碟媒體和固態媒體。晶片組660也會讀取資料和寫入資料至RAM 675。用於與各種用戶介面元件685進行介面的橋接器680會用於與晶片組660進行介面。此種用戶介面元件685可包括鍵盤、麥克風、觸控偵測和處理電路、指向裝置,例如滑鼠等等。大致來說系統650的輸入會來自各種來源,可以由機器產生以及/或人工產生。
晶片組660也會與一或多個具有不同實體介面之 通訊介面690進行介面。此種通訊介面可包括用於寬頻無線網路以及個人區域網路(personal area network)的有線和無線本地區域網路的介面。一些用於產生、顯示、以及使用本發明實施例GUI之方法的應用程式可包括,藉由處理器655分析儲存於儲存670或RAM 675之資料而接收通過實體介面或由機器自行產生的請求資料組。另外機器接收來自用戶透過用戶介面元件685的輸入並會藉由使用處理器655解釋輸入來執行合適的功能,例如瀏覽功能。
實施例系統600和650會具有一個以上的處理器610或為群組一部分或為一起網路連接之運算裝置群集,用以提供更多處理能力。
為了清楚解釋,在本發明一些實施例可包括獨自的功能區塊,該功能區塊包括軟體或硬體和軟體的結合實現的方法中之裝置、裝置元件、步驟或常式(routines)。
在一些實施例中電腦可讀取儲存裝置、媒體、以及記憶體可包括纜線或包括位元流的無線訊號等等。然而當提到時,非暫態電腦可讀取儲存媒體明確排除例如能量、載波訊號、電磁波、以及訊號等等媒體。
依據上述實施例的方法會使用電腦可執行指令實現,該電腦可執行指令儲存於電腦可讀取媒體或可由電腦可讀取媒體提供。此種指令可包括,例如讓通用電腦、特殊功能電腦、或特殊功能處理裝置執行一些功能或功能群組的指令和資 料。部分電腦資源可通過網路存取。電腦可執行指令可為例如二元、中繼格式指令例如組合語言、韌體、或來源碼。電腦可讀取媒體的實施例會用於儲存指令、使用資訊、以及/或依據所述實施例之方法進行中所產生之資訊,該電腦可讀取媒體包括磁碟或光碟、快閃記憶體、非揮發性記憶體提供之USB裝置、網路連接儲存裝置等等。
依據本發明實施例實現之裝置可包括硬體,韌體以及/或軟體,並可使用各種形式因素。形式因素的典型實施例包括筆記型電腦、智慧手機、小型化機構(small form factor)個人電腦、個人數位助理等等。所述之功能性也會以周邊或擴充卡實現。功能性也會藉由其他實施例,由單獨裝置中電路板上不同晶片或不同程序間的執行動作實現。
指令、傳遞該指令的媒體、執行該指令的運算資源、以及其他支援該運算資源的構造為用以提供揭露書所述功能的方式。
本發明實施例的各個方面提供用以在一伺服器系統中管理二或多個PSU的方法,以實現所有PSU的大致上最佳化的功率效能與MTBF。雖然以上已經引用特定實施例來顯示可選操作在不同指令下如何使用,其他實施例可結合可選操作和不同指令。為了清楚解釋,在本發明一些實施例可包括獨自的功能區塊,該功能區塊包括軟體或硬體和軟體的結合實現的方法中之裝置、裝置元件、步驟或常式。
其他實施例可另外在各種操作環境中實現,該各種操作環境在一些實施例中可包括用於操作多個應用程式之一或多台伺服器電腦、用戶電腦或運算裝置。用戶或客戶裝置可包括任意多個通用個人電腦,例如以標準操作系統運作的桌上型或膝上型電腦、以及以行動軟體運作並能支援多個網路和訊息通訊協定的蜂巢、無線以及手持裝置。該系統也可包括多個以各種商用操作系統以及其他已知針對特殊目的之應用程式運作的工作站,上述特殊目的可例如為發展和資料庫管理。上述裝置也可包括其他電子裝置,例如虛擬終端、瘦客户端、遊戲系統以及其他能透過網路通訊之裝置。
為了延伸實施例,本發明實施例或部分實施例以硬體實現,並以任意一種或以下技術的結合實現:具有邏輯閘之離散邏輯電路,可於收到資料訊號時用於實現邏輯功能、具有合適的組合邏輯閘的特定應用積體電路(Application Specific Integrated Circuit,ASIC)、可編程硬體例如可編程閘陣列(Programmable Gate Array,PGA)、現場可編程閘陣列(FPGA)等等。
大部分實施例使用熟習此技藝者周知之至少一網路,用於支援各種商用通訊協定之通訊,例如TCP/IP、OSI、FTP、UPnP、NFS、CIFS、AppleTalk等等。網路可為,例如為本地區域網路、廣域網路、虛擬私有網路、網際網路、內連網(intranet)、外連網(extranet)、公眾電話交換網路(public switched telephone network)、紅外線網路、無線網路以及以上任意組合。
本發明實施例之方法可使用電腦可執行指令實現,該電腦可執行指令儲存於電腦可讀取媒體或可由電腦可讀取媒體提供。此種指令可包括,例如讓通用電腦、特殊用途電腦、或特殊用途處理裝置執行一些功能或功能群組的指令和資料。部分電腦資源可通過網路存取。電腦可執行指令可為例如二元碼、中繼格式指令例如組合語言、韌體、或來源碼。電腦可讀取媒體的實施例可用於儲存指令、使用資訊、以及/或依據所述實施例之方法進行中所產生之資訊,該電腦可讀取媒體包括磁碟或光碟、快閃記憶體、具有非揮發性記憶體之USB裝置、網路連接儲存裝置等等。
依據本發明實現方法實現之裝置可包括硬體,韌體以及/或軟體,並使用各種形式因素。形式因素的典型實施例包括筆記型電腦、智慧手機、小型化機構(small form factor)個人電腦、個人數位助理等等。所述之功能性也可以周邊或擴充卡實現。功能性也可藉由其他實施例,由單獨裝置中電路板上不同晶片或不同程序間的執行動作實現。
在使用網路伺服器之實施例中,網路伺服器可執行各種伺服器或中層應用程式,包括HTTP伺服器、FTP伺服器、CGI伺服器、資料伺服器、Java伺服器以及商業應用程式伺服器。伺服器也能夠相應於用戶裝置的請求而執行程式或腳 本,例如藉由執行一或多個以任意編程語言或其他腳本語言編寫的網路應用程式,上述任意編程語言可例如為Java®、C、C#或C++,且上述其他腳本語言可例如為Perl、Python或TCL、以及其中一種組合。伺服器也可包括資料庫伺服器,包括但不限於可在開放商業市場上取得的伺服器。
伺服器資料中心可包括上述討論之各種資料儲存以及其他記憶體和儲存媒體。各種資料儲存以及其他記憶體和儲存媒體會駐於各種位置之內,例如儲存媒體本地之上(以及/或駐於)一或多台電腦或網路上任意電腦或所有電腦的遠端。在實施例的特定組合中,資訊可駐於熟習此技藝人士所熟知之儲存區域網路(SAN)之內。類似地,用於執行電腦,伺服器或其他網路裝置特性功能的任意所需檔案可於合適之處在本地以及/或遠端儲存。上述系統包括電腦化裝置,每個這種裝置可包括透過匯流排電耦接的硬體元件,元件包括,例如至少一中央處理單元(CPU)、至少一輸入裝置(例如滑鼠、鍵盤、控制器、觸控顯示器元素或按鍵)以及至少一輸出裝置(例如顯示器裝置、印表機或喇叭)。此種系統也可包括一或多個儲存裝置,例如碟機、光學儲存裝置和固態儲存裝置例如隨機存取記憶體(RAM)或唯讀記憶體(ROM),以及可移除媒體裝置、記憶體卡、快閃卡等等。
該裝置也可包括所述之電腦可讀取儲存媒體讀取器、通訊裝置(例如終端機、網路卡(無線或有線)、紅外線運算 裝置)以及工作記憶體。電腦可讀取儲存媒體讀取器可連接或用於接收電腦可讀取儲存媒體用於暫時以及/或更永久包括、儲存、傳送、以及擷取電腦可讀取資訊,該電腦可讀取儲存媒體代表遠端、本地、固定以及/或可移除儲存裝置以及儲存媒體。系統和各種裝置通常也可包括位於至少一工作記憶體裝置之內之多個軟體應用程式、模組、服務或其他元件,包括操作系統和應用程式程式,例如客製化應用程式或網路瀏覽器。熟習此技藝人士可知替代實施例具有上述實施例的各種變化型。例如,也可使用客製化硬體以及/或特定元件可以硬體、軟體(包括可攜軟體、例如小程式(applet))或兩者兼有加以實現。另外,也可使用到其他運算裝置的連接,該其他運算裝置可例如為網路輸入/輸出裝置。
用以包括編碼、或部分編碼的儲存媒體和電腦可讀取媒體可包括此技藝中已知或使用的任意合適媒體,包括儲存媒體和運算媒體,例如但不限於揮發性和非揮發性、可移除和不可移除媒體,以針對儲存以及/或資訊傳輸的任意方法或技術實現,例如電腦可讀取指令、資料構造、程式模組或其他資料,包括RAM、ROM、EPROM、EEPROM、快閃記憶體或其他記憶體技術、CD-ROM、數位光碟(digital versatile disk,DVD)或其他光學儲存、磁盒、磁帶、磁碟儲存或其他磁性儲存裝置或任意其他用於儲存所需資訊且會由系統裝置存取之媒體。依據本發明技術和教示,熟習此技藝人士可知其他方式 以及/或方法用以實現本發明各種實施例。
本發明雖以較佳實施例揭露如上,然其並非用以限定本發明,任何熟習此項技藝者,在不脫離本發明之精神和範圍內,當可做些許的更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
400‧‧‧方法流程圖
400、402、404、406、408、410、412、414、416、418、420‧‧‧執行步驟

Claims (18)

  1. 一種伺服器系統,包括:至少一處理器;以及一記憶體,其包括複數指令,當該等指令在被該至少一處理器執行時使得該伺服器系統進行以下步驟:收集該伺服器系統之負載量(loading);收集該伺服器系統的二或多個PSU電源供應單元(power supply unit,PSU)之每一者之負載量;依據一或多個PSU管理演算法,至少依據該伺服器系統之該負載量以及該伺服器系統的該等二或多個PSU之該等負載量,決定該等二或多個PSU中要被關閉的一第一子集;以及依據該一或多個PSU管理演算法,致使該第一子集中的一或多個PSU被週期性地與該等二或多個PSU中正在運作的一第二子集的一或多個PSU進行交換,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:收集該伺服器系統之歷史負載量資訊;依據該一或多個PSU管理演算法,至少依據該伺服器系統之該歷史負載量資訊,決定在一指定時間點之一預測的負載量型式(loading pattern);以及決定該等二或多個PSU中要在該指定時間點被關閉的該第一子集。
  2. 如申請專利範圍第1項所述之伺服器系統,其中該等指令 在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:收集該伺服器系統以外的複數其他伺服器系統之歷史負載量資訊;以及依據該一或多個PSU管理演算法,至少依據該等其他伺服器系統之該等歷史負載量資訊,決定在該指定時間點之該預測的負載量型式。
  3. 如申請專利範圍第2項所述之伺服器系統,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:收集與該伺服器系統相關聯之資訊,該資訊包括一天中的時間、一年中的天數、溫度、冷卻風扇的速度、電源狀態、記憶體與作業系統(OS)狀態、各種資料封包抵達速率(arrival rate)以及資料佇列統計資料;以及至少依據一部分的所收集到的與該伺服器系統相關聯之該資訊,依據該一或多個PSU管理演算法,決定在該指定時間點之該預測的負載量型式。
  4. 如申請專利範圍第1項所述之伺服器系統,其中該一或多個PSU管理演算法包括至少一機器學習演算法。
  5. 如申請專利範圍第4項所述之伺服器系統,其中該至少一機器學習演算法包括線性回歸模型演算法、類神經網路模型演算法演算法、支持向量機為基礎的模型演算法、貝葉斯統計(Bayesian statistics)演算法、案例推理(case-based reasoning)演算法、決策樹演算法、歸納邏 輯程式(inductive logic programming)演算法、高斯程序回歸(Gaussian process regression)演算法、資料處理群集分析演算法(group method of data handling)、學習自動機演算法、隨機森林演算法、合奏式分類器(ensembles of classifiers)演算法、有序分類(ordinal classification)演算法、或者條件式隨機場域(conditional random field,CRF)演算法。
  6. 如申請專利範圍第1項所述之伺服器系統,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:平衡在該伺服器系統之該等二或多個PSU的該第二子集中的該等PSU之間的該伺服器系統之該負載量。
  7. 如申請專利範圍第6項所述之伺服器系統,其中該等二或多個PSU的該第二子集包括運作在一門檻效能準位之上的至少一PSU。
  8. 如申請專利範圍第1項所述之伺服器系統,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:致使該第一子集中的該一或多個PSU與該第二子集中的該一或多個PSU被週期性地以一既定型式進行交換,使得該等二或多個PSU的平均故障間隔時間(Mean Time Between Failure,MTBF)大致上為最佳化。
  9. 如申請專利範圍第1項所述之伺服器系統,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以 下步驟:將該第二子集中之每一該等PSU的負載量與一既定低門檻值進行比對;相應於判定該第二子集中至少2個PSU所運作的負載量準位低於該既定低門檻值,致使該至少2個PSU之其中一者關閉並且指定該者為該等二或多個PSU之該第一子集。
  10. 如申請專利範圍第1項所述之伺服器系統,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:將該第二子集中之每一該等PSU的該負載量與一既定高門檻值進行比對;相應於判定該第二子集中至少2個PSU所運作的負載量準位高於該既定高門檻值,致使該第一子集中之其中一PSU開啟並且指定該PSU為該等二或多個PSU之該第二子集。
  11. 一種電腦實現之方法,用以於一伺服器系統中管理二或多個電源供應單元(power supply unit,PSU),包括以下步驟:收集該伺服器系統之負載量;收集該伺服器系統的該二或多個PSU電源供應單元之每一者之負載量;依據一或多個PSU管理演算法,至少依據該伺服器系統之該負載量以及該伺服器系統的該等二或多個PSU之該 等負載量,決定該等二或多個PSU中要被關閉的一第一子集;以及依據該一或多個PSU管理演算法,致使該第一子集中的一或多個PSU被週期性地與該等二或多個PSU中正在運作的一第二子集的一或多個PSU進行交換,其中該方法更包括:收集該伺服器系統之歷史負載量資訊;依據該一或多個PSU管理演算法,至少依據該伺服器系統之該歷史負載量資訊,決定在一指定時間點之一預測的負載量型式;以及決定該等二或多個PSU中要在該指定時間點被關閉的該第一子集。
  12. 如申請專利範圍第11項所述之電腦實現之方法,更包括:收集與該伺服器系統相關聯之資訊,該資訊包括一天中的時間、一年中的天數、溫度、冷卻風扇的速度、電源狀態、記憶體與作業系統狀態、各種資料封包抵達速率以及資料佇列統計資料;以及至少依據一部分的所收集到的與該伺服器系統相關聯之該資訊,依據該一或多個PSU管理演算法,決定在該指定時間點之該預測的負載量型式。
  13. 如申請專利範圍第11項所述之電腦實現之方法,更包括:將該第二子集中之每一該等PSU的負載量與一既定高門 檻值進行比對;相應於判定該第二子集中至少2個PSU所運作的負載量準位高於該既定高門檻值,致使該第一子集中之其中一PSU開啟並且指定該PSU為該等二或多個PSU之該第二子集。
  14. 如申請專利範圍第11項所述之電腦實現之方法,其中該一或多個PSU管理演算法包括至少一機器學習演算法,並且其中該至少一機器學習演算法包括線性回歸模型演算法、類神經網路模型演算法演算法、支持向量機為基礎的模型演算法、貝葉斯統計(Bayesian statistics)演算法、案例推理(case-based reasoning)演算法、決策樹演算法、歸納邏輯程式(inductive logic programming)演算法、高斯程序回歸(Gaussian process regression)演算法、資料處理群集分析演算法(group method of data handling)、學習自動機演算法、隨機森林演算法、合奏式分類器(ensembles of classifiers)演算法、有序分類(ordinal classification)演算法、或者條件式隨機場域(conditional random field,CRF)演算法。
  15. 如申請專利範圍第11項所述之電腦實現之方法,更包括:平衡在該伺服器系統之該等二或多個PSU的該第二子集中的該等PSU之間的該伺服器系統之該負載量;其中該等二或多個PSU的該第二子集包括運作在一門檻效能準位之上的至少一PSU。
  16. 一種非暫態(non-transitory)電腦可讀取儲存媒體,其中包含複數指令,當該等指令在一伺服器系統之至少一處理器執行時使得該伺服器系統進行以下步驟:收集該伺服器系統之負載量;收集該伺服器系統的二或多個電源供應單元(power supply unit,PSU)之每一者之負載量;依據一或多個PSU管理演算法,至少依據該伺服器系統之該負載量以及該伺服器系統的該等二或多個PSU之該等負載量,決定該等二或多個PSU中要被關閉的一第一子集;以及依據該一或多個PSU管理演算法,致使該第一子集中的一或多個PSU被週期性地與該等二或多個PSU中正在運作的一第二子集的一或多個PSU進行交換,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:收集該伺服器系統之歷史負載量資訊;依據該一或多個PSU管理演算法,至少依據該伺服器系統之該歷史負載量資訊,決定在一指定時間點之一預測的負載量型式(loading pattern);以及決定該等二或多個PSU中要在該指定時間點被關閉的該第一子集。
  17. 如申請專利範圍第16項所述之非暫態電腦可讀取儲存媒體,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟: 致使該第一子集中的該一或多個PSU與該第二子集中的該一或多個PSU被週期性地以一既定型式進行交換,使得該等二或多個PSU的平均故障間隔時間(Mean Time Between Failure,MTBF)大致上為最佳化。
  18. 如申請專利範圍第16項所述之非暫態電腦可讀取儲存媒體,其中該等指令在被該至少一處理器執行時更使得該伺服器系統進行以下步驟:將該第二子集中之每一該等PSU的負載量與一既定低門檻值進行比對;相應於判定該第二子集中至少2個PSU所運作的負載量準位低於該既定低門檻值,致使該至少2個PSU之其中一者關閉並且指定該者為該等二或多個PSU之該第一子集。
TW104130894A 2015-04-28 2015-09-18 伺服器系統及其電腦實現之方法及非暫態電腦可讀取儲存媒體 TWI570545B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14/698,221 US20160320818A1 (en) 2015-04-28 2015-04-28 Dynamic management of power supply units

Publications (2)

Publication Number Publication Date
TW201638712A TW201638712A (zh) 2016-11-01
TWI570545B true TWI570545B (zh) 2017-02-11

Family

ID=57204056

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104130894A TWI570545B (zh) 2015-04-28 2015-09-18 伺服器系統及其電腦實現之方法及非暫態電腦可讀取儲存媒體

Country Status (3)

Country Link
US (1) US20160320818A1 (zh)
CN (1) CN106095035A (zh)
TW (1) TWI570545B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170117813A1 (en) * 2015-10-21 2017-04-27 Quanta Computer Inc. Method and system for testing a power supply unit
US10102033B2 (en) * 2016-05-26 2018-10-16 International Business Machines Corporation Method and system for performance ticket reduction
WO2018213232A1 (en) 2017-05-15 2018-11-22 Molex, Llc Reconfigurable server and server rack with same
CN111587412B (zh) * 2017-09-11 2023-05-30 蜂能知识产权控股有限责任公司 能量卸载系统
US10712795B2 (en) * 2018-01-30 2020-07-14 Quanta Computer Inc. Power supply unit fan recovery process
CN108845881A (zh) * 2018-05-30 2018-11-20 有米科技股份有限公司 服务器容量动态调整的方法及装置
US11394693B2 (en) * 2019-03-04 2022-07-19 Cyxtera Cybersecurity, Inc. Establishing network tunnel in response to access request
CN110297715B (zh) * 2019-07-02 2021-09-14 北京工业大学 一种基于周期性特征分析的在线负载资源预测方法
GB201919009D0 (en) * 2019-12-20 2020-02-05 Eaton Intelligent Power Ltd Power management of computing system
CN111309132B (zh) * 2020-02-21 2021-10-29 苏州浪潮智能科技有限公司 一种服务器多档位电源冗余的方法
CN111813209B (zh) * 2020-06-19 2022-03-08 浪潮电子信息产业股份有限公司 一种电源组管控方法、系统、装置及计算机可读存储介质
TWI827938B (zh) * 2021-06-09 2024-01-01 英業達股份有限公司 控制裝置及控制方法
US20230126736A1 (en) * 2021-10-25 2023-04-27 Dell Products L.P. Actively Selecting of Power Supply Unit Operating Mode
CN114461041B (zh) * 2022-01-07 2023-07-18 苏州浪潮智能科技有限公司 一种多节点服务器psu访问及能耗散热管理结构和方法
US11747886B2 (en) 2022-02-02 2023-09-05 Hewlett Packard Enterprise Development Lp Response mechanisms of a power sourcing equipment to a swap event of a power supply unit

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464717A (zh) * 2009-01-09 2009-06-24 华硕电脑股份有限公司 应用于计算机系统的电源供应调整方法
US20100038963A1 (en) * 2008-08-13 2010-02-18 Dell Products L.P. Systems and Methods for Power Supply Wear Leveling In a Blade Server Chassis
TW201502757A (zh) * 2013-07-02 2015-01-16 Samsung Electronics Co Ltd 電源供應裝置、具有該電源供應裝置之微伺服器以及電源供應方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965502B2 (en) * 2001-03-21 2005-11-15 Primarion, Inc. System, device and method for providing voltage regulation to a microelectronic device
US7337333B2 (en) * 2001-09-19 2008-02-26 Dell Products L.P. System and method for strategic power supply sequencing in a computer system with multiple processing resources and multiple power supplies
US8041967B2 (en) * 2005-02-15 2011-10-18 Hewlett-Packard Development Company, L.P. System and method for controlling power to resources based on historical utilization data
CN104166450A (zh) * 2014-08-20 2014-11-26 浪潮电子信息产业股份有限公司 一种vr芯片fw版本的区分方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100038963A1 (en) * 2008-08-13 2010-02-18 Dell Products L.P. Systems and Methods for Power Supply Wear Leveling In a Blade Server Chassis
CN101464717A (zh) * 2009-01-09 2009-06-24 华硕电脑股份有限公司 应用于计算机系统的电源供应调整方法
TW201502757A (zh) * 2013-07-02 2015-01-16 Samsung Electronics Co Ltd 電源供應裝置、具有該電源供應裝置之微伺服器以及電源供應方法

Also Published As

Publication number Publication date
TW201638712A (zh) 2016-11-01
US20160320818A1 (en) 2016-11-03
CN106095035A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
TWI570545B (zh) 伺服器系統及其電腦實現之方法及非暫態電腦可讀取儲存媒體
TWI571741B (zh) 伺服器系統及其用以增強記憶體容錯能力之方法 及非暫態電腦可讀取儲存媒體
US10594158B2 (en) ORing FET control method for battery backup system
TWI598746B (zh) 伺服器系統及其電腦實現之方法
US10649512B2 (en) High efficient battery backup system
TWI612415B (zh) 伺服器之系統與管理方法以及電腦可讀儲存媒介
US10346271B2 (en) Manage power supply units and modularized automatic transfer switches
TWI598822B (zh) 用以關閉系統之複數個主動元件的電源之電腦可實現方法及伺服器系統
US20180348836A1 (en) Operable server system when standby power of psu fails
TW201638800A (zh) 計算系統、電腦實現方法及其非暫態電腦可讀取媒體
TWI541634B (zh) 伺服器系統中用於分配電力之系統、運算裝置、以及電腦實現之方法
JP6231598B2 (ja) 電源供給ユニットのホールドタイムを延長するためのサーバシステム、方法、および、コンピュータ可読記憶媒体
US20220329522A1 (en) Adaptive resilient network communication
TW201640271A (zh) 管理儲存子系統之電力消耗的電腦實現方法與電腦系統
TWI637611B (zh) 使用wol的系統復原

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees