CN106095035A - 服务器系统及其计算机实现的方法及计算机可读存储介质 - Google Patents

服务器系统及其计算机实现的方法及计算机可读存储介质 Download PDF

Info

Publication number
CN106095035A
CN106095035A CN201510647806.4A CN201510647806A CN106095035A CN 106095035 A CN106095035 A CN 106095035A CN 201510647806 A CN201510647806 A CN 201510647806A CN 106095035 A CN106095035 A CN 106095035A
Authority
CN
China
Prior art keywords
psu
server system
subset
algorithm
load capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510647806.4A
Other languages
English (en)
Inventor
黄仁烜
林发达
林耿宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN106095035A publication Critical patent/CN106095035A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer And Data Communications (AREA)
  • Telephonic Communication Services (AREA)
  • Power Sources (AREA)

Abstract

服务器系统及其计算机实现的方法及计算机可读存储介质。本发明的各种实施例提供用于在一服务器系统中依据一或多个电源供应单元(PSU)管理二或多个PSU的方法。一些实施例中决定一服务器系统的目前和/或预测的负载量以及服务器系统的二或多个PSU的每一个的负载量。至少依据服务器系统的目前和/或预测的负载量以及服务器系统的二或多个PSU的负载量,二或多个PSU的一第一子集中的PSU可被关闭。二或多个PSU中正在运作的一第二子集的PSU之间的服务器系统的目前负载量可被重新平衡。二或多个PSU的第一子集中的一或多个PSU可依据一或多个PSU管理算法周期性地与第二子集中的一或多个PSU进行交换。

Description

服务器系统及其计算机实现的方法及计算机可读存储介质
技术领域
本发明涉及电信网络的服务器系统技术。
背景技术
现代的服务器群(server farm)或数据中心通常采用大量的服务器来负责处理各种应用服务的处理需求。每个服务器处理多种操作并且需要一特定电平的耗电以维持这些操作。其中的一些操作为“关键任务”(mission critical)的操作,针对这些“关键任务”的中断可能对与这些操作相关的使用者造成显著安全漏洞或收入损失。
前述中断的一个来源是来自于一服务器系统的电源供应单元(powersupply unit,以下简称PSU)发生故障或错误。发生在一或多个PSU的故障或错误可能会导致服务器系统突然强制关机,可能导致服务器系统的数据遗失,甚至损坏服务器系统。一般情况下,服务器系统包含一或多个冗余PSU,用以提供电力给服务器系统的负载(load)。因此,当一个电源供应单元(PSU)发生故障时,其他的PSU可以继续提供电力给负载。然而,使用冗余的电源供应单元仍然存在许多相关的内在问题。
发明内容
依据本发明的各种实施例的系统以及方法可提供了解决上述问题的方法,其可通过动态地管理一服务器系统中的二或多个电源管理单元(powersupply unit,下称PSU),使得服务器系统的二或多个PSU可操作在大致上为最佳化的效能电平并且具有大致上最佳的平均故障间隔时间(Mean TimeBetween Failure,MTBF)。更确切来说,本发明的各种实施例可依据一或多个PSU管理算法来提供管理服务器系统中的二或多个PSU的方法。一些实施例中可决定一服务器系统的目前和/或预测的负载量(loading)以及服务器系统的二或多个PSU的每一个的负载量。至少依据服务器系统的目前和/或预测的负载量以及服务器系统的二或多个PSU电源供应单元的负载量,二或多个PSU的一第一子集中的PSU可被关闭。二或多个PSU中正在运作的一第二子集的PSU之间的服务器系统的目前负载量可被重新平衡。二或多个PSU的第一子集中的一或多个PSU可依据上述一或多个PSU管理算法周期性地与第二子集中的一或多个PSU进行交换。
在一些实施例中,服务器系统的目前负载量可在其二或多个PSU的一第二子集中的PSU之间重新取得平衡,使得第二子集中的PSU可大致地运作在一阈值效能电平。举例来说,第二子集中的每个PSU可被加载到接近其最大额定电流的一既定百分比(例如:50%)。
在一些实施例中,一个负载量平衡算法可以用来在二或多个PSU的正在操作中的一第二子集的PSU之间平衡服务器系统的目前负载量或者交换二或多个PSU的第一子集与第二子集之间的至少一PSU。其中,平衡服务器系统的目前电流负载量或者交换二或多个PSU的第一子集与第二子集之间的至少一PSU的判断可至少依据一既定最小负载量、一既定最大负载量或一既定最小效能来决定。
在一些实施例中,相应于一服务器系统的负载量已增加超过一高阈值,在两个或多个的PSU的第一子集的所有PSU可以合并至两个或多个的PSU的第二子集。换句话说,在服务器系统中两个或多个PSU的所有PSU都会被开启并开始操作。
一些实施例可以收集服务器系统的历史负载量信息。所收集到的历史负载量信息可以依据一或多个机器学习算法进行分析,并可用于预测服务器系统在特定的未来时间时的负载量模式(loading pattern)。所述二或多个的PSU的第一子集可至少依据服务器系统的目前以及预测的负载量或者服务器系统的二或多个PSU的负载量来加以决定。在一些实施例中,与服务器系统相关联的其他信息也可被收集并用于预测服务器系统的负载量。其他信息可包括但不受限于,所述二或多个的PSU的每一个的健康情形、其他服务器系统、一天中的时间,一年中的天数、温度、冷却风扇的速度、电源状态、存储器与操作系统(OS)的状态、各种数据分组抵达速率以及数据队列统计数据等等。在一些实施例中,关于每个所述二或多个PSU的负载量和效能的历史数据可被收集并用于动态地分配包含在与不包含在所述PSU的第一子集与第二子集中的PSU。举例来说,一特定的PSU,其已至少在二或多个PSU之间较少使用或具有比二或多个PSU的平均效能更高的操作效能,可以更频繁地分配至第二子集中。
在一些实施例中,一或多个PSU管理算法可包括至少一机器学习算法。与服务器系统相关联的收集到的信息可作为上述至少一机器学习算法的一输入特征集合(input feature set)来预测服务器系统的负载量模式。一或多个机器学习算法可包括但不限于,线性回归模型算法、类神经网络模型算法、支持向量机为基础的模型算法、贝叶斯统计(Bayesian statistics)算法、案例推理(case-based reasoning)算法、决策树算法、归纳逻辑程序(inductive logicprogramming)算法、高斯程序回归(Gaussian process regression)算法、数据处理群集分析算法(group method of data handling)、学习自动机算法、随机森林算法、合奏式分类器(ensembles of classifiers)算法、有序分类(ordinalclassification)算法、或者条件式随机场域(conditional random field,CRF)算法的其中至少一个。
附图说明
为使本发明的上述和其他目的、特征、和优点能更明显易懂,下文特举出一或多个优选实施例,并配合附图,作详细说明如下。注意的是,虽然公开书依附图进行说明,然其并非用以限定本发明,本领域技术人员在不脱离本发明的精神和范围内,当可做些许更动与润饰,其原理与附加特征可配合附图描述与解释,其中:
图1显示依据本发明一实施例的示范服务器系统的示意方块图;
图2A至图2G显示依据本发明实施例的示意图,其中表示二或多个PSU的一第一子集被关闭,而二或多个PSU的一第二子集正在运作中的例子;
图3A至图3B显示依据本发明另些实施例的示意图,其中表示二或多个PSU的一第一子集被关闭,而二或多个PSU的一第二子集正在运作中的另些例子;
图4显示依据本发明一实施例的用以管理一服务器系统的多个PSU的示范方法的流程图;
图5显示依据本发明各种实施例的运算装置的示意图;以及
图6A与图6B显示依据本发明各种实施例的示范系统的示意图。
【符号说明】
100~服务器系统;
101~电源供应;
110~中央处理单元(CPU);
111~快取存储器;
120~电池系统;
120~电源供应单元(PSU);
130~北桥(NB);
135~PCI总线;
140~南桥(NB);
150~插槽;
151~处理器;
152~ISA插槽;
160~PCIe插槽;
161~PCIe插槽;
170~PCI插槽;
171~PCI插槽;
180~主存储器;
400~方法流程图;
221、222、223、224、225、226~PSU;
321、322、323、324、325、326~PSU;
400、402、404、406、408、410、412、414、416、418、420~执行步骤;
500~运算装置;
515~总线;
561~存储器;
562~CPU;
563~处理器;
568~接口;
600~系统;
605~系统总线;
610~处理器;
612~快取存储器;
615~存储器;
620~ROM;
625~RAM;
630~存储装置;
632~MOD 1;
634~MOD 2;
636~MOD 3;
635~输出装置;
640~通信接口;
645~输入装置;
650~计算机系统;
655~处理器;
660~芯片组;
665~输出装置;
670~存储装置;
675~RAM;
680~桥接器;
685~用户接口元件;以及
690~通信接口。
具体实施方式
本发明的各种实施例提供了用于在服务器系统管理两个或多个PSU的方法,以实现PSU大致上最佳化的功率效能以及MTBF。在一些实施例中,服务器系统的目前和/或预测的负载量以及服务器系统的二或多个PSU的每一个的负载量可以藉由使用一或多个PSU管理算法来决定。PSU的第一子集可至少依据服务器系统以及二或多个PSU所判定的负载量信息而被关闭。服务器系统的目前负载量可在二或多个PSU中的第二子集(亦即:正在操作中的剩余PSU)之间来重新平衡。在第一子集和第二子集的PSU可以依据PSU管理算法被周期性地交换。
图1显示依据本发明一实施例的示范服务器系统100的示意方块图。在本实施例中,服务器系统100包括连接到快取存储器111的至少一个微处理器或中央处理单元(CPU)110、主存储器180、二或多个电源供应单元(PSU)120,每个PSU 120可提供电源给服务器系统100。主存储器180可以通过北桥(NB)逻辑130耦接至CPU 110。存储器控制模块(未绘示)可用以通过在存储器操作期间产生(assert)必要的控制信号来控制主存储器180的操作。主存储器180可以包括,但不限于,动态随机存取存储器(dynamic randomaccess memory,DRAM)、双倍数据速率动态随机存取存储器(dual data rateDRAM,DDR DRAM)、静态随机存取存储器(static RAM,SRAM),或其他类型的适当存储器。
在一些实施例中,CPU 110可为多内核处理器,其中的每一内核通过连接到北桥逻辑130的一CPU总线耦接在一起。在一些实施例中,北桥逻辑130可整合在CPU 110中。北桥逻辑130也可连接至多个周边元件高速互连(Peripheral Component Interconnect express,PCIe)端口160以及南桥(SB)逻辑140。前述多个PCIe端口160可用于连接以及作为总线,如PCI Express×1、USB 2.0、SMBus卡、SIM卡、PCIe另一通道的未来扩展、1.5伏以及3.3伏电力、以及诊断服务器的机箱上的发光二极管(Light-Emitting Diode,LED)的电线。
在本例中,北桥逻辑130以及南桥逻辑140通过一周边元件互连(peripheral component interconnect,PCI)总线135连接。PCI总线135可支持标准化格式的CPU功能,此标准化格式独立于所有的CPU的本地总线的格式。PCI总线135可另外连接至多个PCI插槽170(例如:PCI插槽171)。总线控制器(未绘示)可将连接PCI总线的装置视为直接连接到CPU总线,分派在CPU 110的地址空间的地址,且与单独总线时钟同步。PCI卡可用于多个PCI插槽170,其包括但不受限于,网络接口卡(Network Interface Card,NIC)、音效卡、数据机、TV调谐器卡、硬盘控制器、显示卡、小计算机系统接口(SmallComputer System Interface,SCSI)转换器、以及个人计算机存储卡国际协会(PCMCIA)卡等。
南桥逻辑140可经由扩充总线,将PCI总线135耦接至多个扩充卡或插槽150(例如:ISA插槽152)。扩充总线可为用于南桥逻辑140以及周边装置之间通信的一总线,并且可包括,但不限于,工业标准架构(Industry StandardArchitecture,ISA)总线、PC/104总线,低引脚数(low pin count)总线、扩充ISA(Expansion ISA,EISA)总线、通用序列总线(Universal Serial Bus,USB)、整合式电子驱动接口(Integrated Drive Electronics,IDE)总线、或任何适合用于周边装置的数据通信的其他总线。
在本例中,南桥逻辑140更耦接至连接到二或多个PSU 120的控制器151。二或多个PSU 120用以提供电源至服务器系统100的各种元件,例如:CPU110、快取存储器111、北桥逻辑130,PCIe插槽160、主存储器180、南桥逻辑140、ISA插槽150、PCI插槽170以及控制器151。在服务器系统100的电源开启后,服务器系统100用以从存储器、计算机存储装置或外部存储装置中载入软件应用程序以执行各种操作。服务器系统100可还包含一电池系统(未绘示),其用以于电源供应101被中断时提供电源至服务器系统100。二或多个PSU 120可包括一或多个可充电电池。上述一个或多个可充电的电池单元可以包括,但不限于,电化学电池单元(electrochemical cell)、燃料电池单元(fuel cell)、或超电容器(ultra-capacitor)。电化学电池单元可以包括从铅酸、镍镉(NiCd)、镍金属氢化物(NiMH)、锂离子(Li-离子)以及锂离子聚合物(Li-离子聚合物)的列表中的一或多个化学物质。在充电模式下,PSU 120可对上述一或多个可充电电池单元进行充电。
在一些实施例中,控制器151可为基板管理控制器(BaseboardManagement Controller,BMC)、机架管理控制器(Rack Management Controller,RMC)、键盘控制器、或其他合适类型的系统控制器。控制器用于控制二或多个PSU 120的操作和/或其他可应用操作。
一些实施例中,控制器151可收集服务器系统100以及二或多个PSU 120的负载量信息。在一些实施例中,可收集一个或多个既定时间窗口之内的服务器系统100的历史负载量信息。本文所用相对于服务器系统或其部分中,术语“负载”(load)或“负载量”(loading)是指该服务器系统(或其部分)在一段感兴趣的时间上正在执行或预期执行的计算工作量。收集到的目前和/或历史负载量信息可被分析并用于依据一或多个PSU管理算法来决定要被关闭的PSU的第一子集。在一些实施例中,一或多个PSU管理算法可还包括至少一或多个机器多个机器学习算法,其包括线性回归模型算法、类神经网络模型算法、支持向量机为基础的模型算法、贝叶斯统计(Bayesian statistics)算法、案例推理(case-based reasoning)算法、决策树算法、归纳逻辑程序(inductivelogic programming)算法、高斯程序回归(Gaussian process regression)算法、数据处理群集分析算法(group method of data handling)、学习自动机算法、随机森林算法、合奏式分类器(ensembles of classifiers)算法、有序分类(ordinalclassification)算法、或者条件式随机场域(conditional random field,CRF)算法。举例来说,类神经网络模型算法可用于分析历史负载量信息并且用以获得服务器系统100的时间和负载量模式之间的复杂相关性。
在一些实施例中,也可收集其他服务器系统的负载量信息并将其存储在与服务器系统100的相关联的本地或远端数据存储装置。其他服务器系统的负载量信息也可以被分析,以预测服务器系统100的一负载量模式并且用以依据一或多个PSU管理算法来决定需要被关闭的PSU的第一子集。
在一些实施例中,控制器151可以从内建于服务器系统100内的不同类型传感器中收集各种参数(例如:温度、冷却风扇速度、电源状态、存储器和/或操作系统的状态等)。在一些实施例中,控制器151也可收集其它信息,其包括但不限于,二或多个的PSU的每一个的健康情形、一天中的时间、一年中的天数、各种数据分组抵达速率以及数据队列统计数据等等。收集的参数信息也可被分析并用以决定服务器系统100的负载量模式以及用以决定PSU中需要被关闭的第一子集。在一些实施例中,关于所述二或多个PSU的每个PSU的负载量和效能的历史数据也可被收集并用以动态地分配包含在与不包含在所述PSU的第一子集与第二子集中的PSU。举例来说,一特定的PSU,其已至少在过去被频繁的使用或具有比二或多个PSU的平均效能更低的操作效能,可以更频繁地分配至第一子集中。
一些实施例中可重新平衡二或多个PSU 120的一第二子集之间的服务器系统100的目前负载量,使得在第二子集中的至少一PSU操作在一大致上为最佳化的效能电平。因此,服务器系统100的二或多个PSU 120的能量效能可大致上通过将二或多个PSU 120的第二子集操作在大致上为最佳化的效能电平并关闭剩余的PSU来达到最佳化。
在一些实施例中,二或多个PSU的第一子集和第二子集中的一或多个PSU可以周期性地依据一或多个PSU管理算法来进行交换,使得二或多个PSU 120的整体MTBF可以大致地最佳化。举例来说,服务器系统100中的一特定PSU的生命周期可通过将此特定PSU周期性地交换至二或多个PSU120的第一子集中来加以延长。此特定的PSU可在被交换回操作之前,休息一特定时间周期T,如此可有效地产生在二或多个PSU120的一最佳化的整体MTBF。
在一些实施例中,控制器151可用以在必要时采取适当的动作。举例来说,相应于检测到内建于服务器系统100的各种类型传感器上任何参数超出其预设极限,其可表示服务器系统100的一潜在故障,控制器151可用以相应于上述潜在故障执行一适当的操作。适当的操作可包括,但不限于,通过网络发送一警报给CPU 110或系统管理员,或采取某些校正动作,例如重置该节点或使该节点重新开机,以使一当掉的OS再重新执行。
虽然图1只显示服务器系统100之内的一些元件,服务器系统100也可包括可处理或存储数据,或接收或传送信号的各类型的电子或运算元件。另外,服务器系统100内的电子或运算元件可用于执行各类型的应用程序和/或可使用各类型的操作系统。这些操作系统可包括但不受限于Android、柏克莱软件套件(Berkeley Software Distribution,BSD)、iPhoneOS(iOS)、Linux、OS X、类Unix的即时操作系统(例如:QNX)、微软视窗、微软视窗电话、以及IBMz/OS。
取决于服务器系统100中所需的实施方式而定,各种网络和讯息通信协议可包括但不受限于TCP/IP,开放式系统互联通信(Open SystemInterconnection,OSI)、文件传输通信协议(File Transfer Protocol,FTP)、通用随插即用(Universal Plug and Play,UpnP)、网络文件系统(Network File System,NFS)、网络文件共享系统(Common Internet File System,CIFS)、AppleTalk等等。本领域技术人员可知图1中显示的服务器系统100是用于说明的目的。因此,网络系统可使用许多合适的变化来实现,同时仍依据本发明各种实施例提供网络平台设定。
在图1的实施例设置中,服务器系统100内也可包括一或多个无线元件,用于与特定无线通道的运算范围内的一或多个电子装置通信。无线通道可为任意用于让装置进行无线通信的合适通道,例如蓝牙、蜂窝、NFC、或Wi-Fi通道。同时需要了解装置可有一或多个已知有线通信连接,如已知技术。在本发明各种实施例的范围中可尽可能地包括各种其他元件和/或其结合。
图2A至图2G显示依据本发明实施例的示意图,其中表示二或多个PSU的一第一子集被关闭,而二或多个PSU的一第二子集正在运作中的例子。图2A显示当一服务器系统操作于一轻负载量条件时的情形。在本实施例中,服务器系统中总共有六个PSU。六个PSU(即:221、222、223、224、225和226)中的每个PSU只操作25%的负载量且具有低于一最佳化的负载量(例如:50%)的操作效能(operation efficiency)的操作效能。本领域技术人员可知图2A中显示的负载量与效能仅用于说明的目的。因此,本发明各种实施例当可适用于不同负载量与效能或不同负载量与效能之间的各种相关性。
服务器系统的一控制器可收集服务器系统的目前和/或预测的负载量以及服务器系统中的六个PSU的负载量。控制器可更分析负载量信息以预测服务器系统的一负载量模式并用以依据一或多个PSU管理算法来决定需要被关闭的PSU的第一子集。假设当六个PSU中每一个PSU的对应PSU操作在50%的负载量时会达到一最佳化效能电平。图2B显示PSU的第一子集中的PSU均被关闭以及PSU的第二子集中的PSU均在运作中的一个例子。在本实施例中,PSU的第一子集包括PSU 224、225和226,PSU的第二子集则包括221、222和223。在第二子集中的PSU操作在一大致最佳化的效能电平上(即:50%),而在第一子集中的PSU则被关闭。
在一些实施例中,服务器系统的控制器可将服务器系统中的PSU的负载量在与一既定的低阈值(例如:30%)进行比对。相应于判定二或多个PSU操作于比低阈值还低的负载量下时,控制器可以关闭二或多个PSU中的其中一个并且将对应PSU包含在被关闭的PSU的第一子集。
图2C至图2G显示依据本发明实施例的示意图,用以表示周期性交换六个PSU中的被关闭PSU所形成的一第一子集以及六个PSU中的正在运作中PSU所形成的一第二子集之间一或多个PSU的例子。图2C显示PSU的第一子集中的PSU(即:225和226)均被关闭以及PSU的第二子集中的PSU(即:221、222、223和224)均为运作中的例子。于本例中,在第二子集中的PSU操作在一大致最佳化的效能电平上(即:50%),而在第一子集中的PSU则被关闭。
图2D至图2G显示周期性交换图2C中的PSU的第一子集以及PSU中的第二子集之间一或多个PSU的例子。如图2D所示,图2C中的第二子集的PSU 224与第一子集的PSU 226互相交换。如图2E所示,图2D中的第二子集的PSU 222与223分别与第一子集的PSU 224与225互相交换,或者图2C中的第二子集的PSU 222与223分别与第一子集的PSU 225与226互相交换。如图2F所示,图2E中的第二子集的PSU 221与第一子集的PSU 223互相交换,或者图2C中的第二子集的PSU 221与222分别与第一子集的PSU 225与226互相交换。如图2G所示,图2F中的第二子集的PSU 226与第一子集的PSU 222互相交换,或者图2C中的第二子集的PSU 221与第一子集的PSU225互相交换。
需要了解图2A-图2G中的第一子集与第二子集的模式都仅用于说明目的。依据本发明,实际的模式可以变化并且包括各种其它类型的模式。举例来说,实际的模式可以包括一既定的模式或者依据服务器系统的一预测负载量,服务器系统中的二或多个PSU的负载量或每个单独PSU的健康情形等动态决定的模式。
图3A至图3B显示依据本发明另些实施例的示意图,其中表示二或多个PSU的一第一子集被关闭,而二或多个PSU的一第二子集正在运作中-的另些例子。图3A显示当一服务器系统操作于一重负载量条件时的情形。在本实施例中,服务器系统中总共有六个PSU。PSU 321、322、323中的每个PSU都操作有90%的负载量且具有低于一最佳化的负载量(例如:50%)的操作效能的操作效能。在本实施例中,服务器系统的目前和/或历史的负载量以及服务器系统中的六个PSU的负载量数据可被收集并分析以预测服务器系统的一负载量模式并且用以依据一或多个PSU管理算法决定出PSU的第一子集以及第二子集。假设当六个PSU中每一个PSU的对应PSU操作在50%的负载量时会达到一最佳化效能电平。图3B显示PSU的第一子集中的PSU(即:326)被关闭以及PSU的第二子集中的PSU(即:321、322、323、324和325)均在运作中的一个例子。在本实施例中,第二子集中的PSU 321、322、323、324和325操作在一大致最佳化的效能电平上(即:54%),而在第一子集中的PSU 326则被关闭。
在一些实施例中,服务器系统的控制器可将服务器系统中的PSU的负载量在与一既定的高阈值(例如:75%)进行比对。相应于判定二或多个PSU操作于比高阈值还高的负载量下时,控制器可以开启二或多个PSU中的其中一个并且将对应PSU包含在正在运作中的PSU的第二子集。
图4显示依据本发明一实施例的用以管理一服务器系统的多个PSU的示范方法的流程图。需要了解实施例方法400仅用于说明目的,且依据本发明实施例的其他方法可包括以相似或替代顺序、或并行方式执行更多、更少、或替代步骤。
实施例方法400在步骤402中首先决定一服务器系统的负载量。接着,在步骤404中决定二或多个PSU中的每一个的负载量。在一些实施例中,服务器系统的历史负载量信息和/或其他服务器系统的负载量信息可被收集并分析。
在步骤406中,可以依据一或多个PSU管理算法分析服务器系统的目前负载量与二或多个PSU的负载量来判断是否有任何PSU需要被关闭或开启。
相应于在步骤406中判定不需要关闭或开启一个或多个PSU中的任一个时,可在步骤408中判断正在运作中的PSU的第二子集之间的服务器负载量是否有平衡。相应于判定服务器系统的负载量并未平衡,在步骤410中可重新平衡在运作中的PSU的第二子集之间的服务器的负载量。方法流程可接着回到起始步骤402继续监控。
相应于在步骤406中判定需要关闭或开启一个或多个PSU中的至少一个时,可在步骤412中依据一或多个PSU管理算法来决定服务器系统的一预测的负载量模式。在一些实施例中,服务器系统的预测的负载量模式可至少依据服务器系统的目前和/或历史负载量或其他服务器系统的负载量来决定。在一些实施例中,一或多个PSU管理算法包括至少一个机器学习算法。所收集到服务器系统以及其他服务器系统的目前和/或历史负载量信息可以依据上述至少一个机器学习算法进行分析,并可用于预测服务器系统在特定的未来时间时的负载量模式。
基于服务器系统的预测的负载量模式,在步骤414中可依据一或多个PSU管理算法来决定是否仍然需要关闭或开启任何PSU。相应于判定没有第二子集中的PSU需要被关闭或没有第一子集中的PSU需要被开启时,可执行步骤410来重新平衡运作中的PSU的第二子集之间的服务器的负载量。然而,相应于判定至少一个PSU仍需要被关闭或开启时,在步骤416中可至少依据服务器系统在对应时间时的预测的负载量模式来决定在一特定时间时需要被关闭的PSU的第一子集。
在步骤418中,可重新平衡在运作中的第二子集之间的服务器的负载量。在步骤420中,可依据一或多个PSU管理算法,周期性交换PSU的第一子集中的一或多个关闭的PSU与PSU的第二子集中的一或多个的运作中的PSU。在一些实施例中,可依据一既定的模式来周期性地交换第一子集以及第二子集中的PSU。
术语
一计算机网络为藉由通信连接和区段互连的节点的地理分配聚集,用以在终端之间传输数据,例如:个人计算机和工作站。可适用于许多类型的网络,其类型范围从区域网络(Local Area Network,LAN)和广域网络(Wide AreaNetwork,WAN)到重叠式(overlay)和软件定义网络,例如虚拟可扩展区域网络(Virtual Extensible Local Area Network,VXLAN)。
LAN通常连接位于相同通用物理位置,例如大楼或校园的专用私有通信连接的节点。另一方面,WAN通常连接长距通信连接的地理分散节点,例如共同载波电话线、光纤路径、同步光纤网络(Synchronous Optical network,SONET)、或同步数字阶级(Synchronous Digital Hierarchy,SDH)连结。LAN和WAN可包括第2层(L2)和/或第3层(L3)网络和装置。
互联网为WAN的一个例子,其连接世界上的不同网络,提供各种网络上的节点之间的全球通信。节点通常依据预定义通信协议例如传输控制通信协议/互联网通信协议(TCP/IP)等交换离散数据帧或分组而在前述网络上进行通信。于本申请中,通信协议可视为一组定义节点间如何彼此互动的规则。计算机网络可进一步藉由中继网络节点例如路由器等互连,以延伸每个网络的有效”大小”。
重叠式网络(overlay network)一般允许在一物理网络基础建设上产生以及分层虚拟网络。重叠式网络通信协议,例如虚拟可扩展区域网(VirtualExtensible LAN,VXLAN)、一般路由封装实现网络虚拟化(NetworkVirtualization Using Generic Router Encapsulation,NVGRE)、网络虚拟化共存(Network Virtualization Overlays,NVO3)、以及传输层隧道(Stateless TransportTunnelling,STT),提供流量封装方案,允许通过逻辑通道通过L2和L3网络而承载网络流量。这种逻辑通道可通过虚拟通道终端(VTEP)起始以及结束。
另外,重叠式网络可包括虚拟区段,例如VXLAN重叠式网络内的VXLAN区段,其可包括虚拟L2和/或L3重叠式网络,虚拟机器(VirtualMachine,VM)可在之上进行通信。虚拟区段可通过虚拟网络识别值(VNI)而被辨识,例如VXLAN网络识别值,此虚拟网络识别值可特别辨识相关虚拟区段或网域。
网络虚拟化允许硬件和软件资源结合入虚拟网络。举例来说,网络虚拟化可使多个VM分别通过虚拟LAN(VLAN)依附于物理网络。VM可分别依据其VLAN进行分组,且可与其他VM以及内部或外部网络的其他装置通信。
网络区段,例如物理或虚拟区段、网络、装置、端口、物理或逻辑连结、和/或流量大致来说可分为桥接或洪水网域(flood domain)。桥接网域或洪水网域可表示一广播网域,例如L2广播网域。桥接网域或洪水网域可包括单独子网络,但也可包括多子网络。另外,桥接网域可相关于网络装置上的桥接网域接口,例如一切换器。桥接网域接口可为支持L2桥接网络以及L3路由网络之间流量的逻辑接口。此外桥接网域接口可支持互联网通信协议(IP)终止、VPN终止、地址解析处理、MAC定位等等。桥接网域和桥接网域接口两者可藉由相同索引或识别值而被辨识。
此外,终端群组(EndPoint Group,下称EPG)在网络中可用于将应用程序对映(mapping)至网络。特别来说,EPG可使用网络中应用程序终端的分组,应用连接性和政策来对应用程序分组。EPG可作为用于装运的容器,或是应用程序或应用程序元件的集合,以及实现转送和政策逻辑的层级。EPG也允许从藉由使用逻辑应用程序边界代替决定地址将网络政策、安全性、以及转送分开。
在一或多个网络也可提供云端运算,藉以使用共享资源提供运算服务。云端运算可大致上包括互联网为基础的运算,其中运算资源通过网络(例如"云端")可取得的资源集合被动态提供与分配给用户端或用户计算机或其他装置的随选(on-demand)功能。云端运算资源,例如,可包括任意类型的资源,例如运算、存储、以及网络装置,虚拟机器(Virtual Machine,简称VM)等等。举例来说,资源可包括服务装置(防火墙、深度分组检测,流量监控、负载量平衡等等)、运算/处理装置(服务器、CPU的、存储器、暴力(brute force)处理能力)、存储装置(例如依附网络的存储器、存储区域网络装置)等等。此外,这种资源会用于支持虚拟网络、虚拟机器(VM)、数据库、应用程序(Apps)等等。
云端运算资源可包括“私有云端”、“公有云端”、和/或“混和式云端”。“混和式云端”可为一种由二或多个PSU云端所组成的云端基础建设,该二或多个PSU云端可通过技术相互运作或进行同盟。本质上混和式云端为私有和公有云端之间的互动,其中私有云端结合公有云端并以一种安全且有弹性(scalable)的方式使用公有云端资源。云端运算资源也可通过虚拟网络在重叠式网络例如VXLAN之内提供。
在网络切换系统中,可维持一查找数据库(lookup database)以保持多个依附切换系统的终端之间的路径轨迹。然而终端可具有各种设定且相关于许多承租者。终端可具有各种类型的识别值,例如IPv4、IPv6、或第2层。查找数据库必须设定不同模式来处理不同类型的终端识别值。一些查找数据库的能力是设计用于处理不同地址类型的进入分组。另外网络切换系统中的查找数据库通常受限于1K虚拟路由以及转送(VRF)。因此,需要用于处理各种类型的终端识别值的改良查找算法。本发明所公开的技术提出用于电信网络中的地址查找所需的技术。本发明所公开的系统、方法、和计算机可读存储介质用于藉由将终端识别值对映到一致空间且允许一致处理不同形式的查找来统一各种类型的终端识别值。接着参见图5和图6所示,实施例系统和网络的简单描述将在此公开。本发明实施例的变形于各个实施例中描述。相关技术请参考图5。
图5显示依据本发明一实施例的运算装置(computing device)500的示意图。运算装置500包括主中央处理单元(CPU)562、接口568、以及总线515(例如PCI总线)。当在合适软件或固件的控制下动作时,CPU 562用于负责执行分组管理、错误检测、和/或路由功能,例如不当连接(miscabling)检测功能。CPU 562较佳地在包括操作系统以及任意合适应用程序软件的软件控制之下完成上述功能。CPU 562可包括一或多个处理器563,例如来自Motorola微处理器家族或MIPS微处理器家族的处理器。在另一实施例中,处理器563为特定设计的硬件,用于控制运算装置500的操作。在特定实施例中,存储器561(例如非易失性RAM和/或ROM)也形成CPU 562一部分。然而,存储器可通过许多不同方式耦接系统。
接口568通常提供作为接口卡(有时称为"线路卡(line card)")。一般来说,接口568控制通过网络的数据分组的传送与接收且有时支持与运算装置500一起使用的其他周边。可提供的接口为以太网接口、帧中继接口、缆线接口、DSL接口、信令环(token ring)接口等等。此外,可提供各种非常高速接口例如快速信令环接口、无线接口、以太网接口、Gigabit以太网接口、ATM接口、HSSI接口、POS接口、FDDI接口等等。一般而言,这些接口可包括用于合适介质的通信的合适端口。在一些实施例中,接口也可包括独立处理器,以及在一些实施例中可包括易失性RAM。独立处理器可控制分组切换、介质控制和管理等此种通信密集任务。藉由对通信密集任务提供分开的处理器,上述接口允许主微处理器562有效执行路由运算、网络诊断、安全性功能等等。
虽然图5所示的系统为本发明实施例的一特定运算装置,然其绝非本发明实施例仅有的网络装置构造。举例来说,经常使用具有单独处理器的构造,该单独处理器处理通信以及路由运算等等。另外,其他类型的接口和介质也能与路由器一起使用。
无论网络装置的设定是什么,网络装置都会使用一或多个存储器或存储器模块(包括存储器561)用于针对存储通用网络操作的程序指令以及针对上述漫游、路由优化和路由功能的机制。例如程序指令可控制操作系统和/或一或多个应用程序的操作。存储器或多个存储器也可用于存储表格例如移动连结、注册、和相关表格等等。
图6A与图6B显示依据本发明多个实施例的示范系统的示意图。本领域技术人员在应用本发明实施例时可应用更合适的实施例。本领域技术人员也已知其他系统实施例的可能性。
图6A显示已知系统中一种总线运算系统构造600,其中系统的元件互相使用总线605进行电性通信。系统600的例子包括处理单元(CPU或处理器)610以及系统总线605,此系统总线605耦接各种系统元件到处理器610,各种系统元件包括系统存储器615,例如只读存储器(ROM)620和随机存取存储器(RAM)625。系统600可包括高速存储器的快取存储器,此高速存储器直接连接、靠近、或整合为处理器610的一部分。系统600可将数据从存储器615和/或存储装置630复制到快取存储器612用于处理器610的快速存取。以此方式快取存储器可于等待数据时提供效能增进,避免处理器610延迟。上述以及其他模块会控制或用于控制处理器610藉以执行各种动作。同时也可使用其他系统存储器615。存储器615可包括多个具有不同效能特性的不同类型存储器。处理器610可包括任意通用处理器以及硬件模块或软件模块,例如存储于存储装置630的模块632,模块634,和模块636,用于控制处理器610以及特殊功用处理器,其中软件指令结合入实际处理器设计。处理器610可实质上为完全自给自足的运算系统,包括多内核或处理器、总线,存储器控制器、快取存储器等等。多核处理器可为对称或非对称。
为了使用户可以和运算装置600互动,输入装置645会代表任意数量的输入机制,例如用于演讲的麦克风、用于手势或图形输入的触控屏幕、键盘、鼠标、动作输入、语音以及其他。输出装置635也可为本领域技术人员所知的一或多个输出机制。在一些例子中,多模系统会对用户提供多类型的输入藉以和运算装置600通信。通信接口640会大致上包含并管理用户输入以及系统输出。任意特定硬件设置上的各种操作没有限制,因此这里的基本特征会很容易置入发展增进中的硬件或固件设置。
存储装置630为非易失性存储器且可为硬盘或其他类型的计算机可读介质,该计算机可读介质会存储计算机可存取数据,且可例如为磁带、快闪存储器卡、固态存储器装置、数字光盘、卡匣、随机存取存储器(RAM)625、只读存储器(ROM)620、以及其混合。
存储装置630可包括软件模块632、634、636,用于控制处理器610。也会考虑其他硬件或软件模块。存储装置630会连接至系统总线605。在某个方面,执行特定功能的硬件模块可包括存储于计算机可读介质的软件元件,该存储于计算机可读介质和所需硬件元件有关,该所需硬件元件可例如为用于执行功能的处理器610、总线605、输出装置635(例如显示器)等等。
图6B是显示一种具有芯片组构造的计算机系统650,该芯片组构造会被使用来执行所述方法并产生及显示图形用户接口(GUI)。计算机系统650为用于实现所公开技术的计算机硬件、软件和固件的实施例。系统650可包括处理器655,表示任意数量的物理和/或逻辑区别资源,执行用于所示运算的软件、固件、和硬件。处理器655会与芯片组660通信,该芯片组660会控制处理器655的输入和输出。在本实施例中,芯片组660输出信息至输出装置665,例如显示器,且会读取和写入信息至存储装置670,存储装置670可包括例如磁盘介质和固态介质。芯片组660也会读取数据和写入数据至RAM675。用于与各种用户接口元件685进行接口的桥接器680会用于与芯片组660进行接口。此种用户接口元件685可包括键盘、麦克风、触控检测和处理电路、指向装置,例如鼠标等等。大致来说系统650的输入会来自各种来源,可以由机器产生和/或人工产生。
芯片组660也会与一或多个具有不同物理接口的通信接口690进行接口。此种通信接口可包括用于宽频无线网络以及个人区域网络(personal areanetwork)的有线和无线本地区域网络的接口。一些用于产生、显示、以及使用本发明实施例GUI的方法的应用程序可包括,藉由处理器655分析存储于存储670或RAM 675的数据而接收通过物理接口或由机器自行产生的请求数据组。另外机器接收来自用户通过用户接口元件685的输入并会藉由使用处理器655解释输入来执行合适的功能,例如浏览功能。
实施例系统600和650会具有一个以上的处理器610或为群组一部分或为一起网络连接的运算装置群集,用以提供更多处理能力。
为了清楚解释,在本发明一些实施例可包括独自的功能区块,该功能区块包括软件或硬件和软件的结合实现的方法中的装置、装置元件、步骤或常式(routines)。
在一些实施例中计算机可读存储装置、介质、以及存储器可包括缆线或包括比特流的无线信号等等。然而当提到时,非暂态计算机可读存储介质明确排除例如能量、载波信号、电磁波、以及信号等等介质。
依据上述实施例的方法会使用计算机可执行指令实现,该计算机可执行指令存储于计算机可读介质或可由计算机可读介质提供。此种指令可包括,例如让通用计算机、特殊功能计算机、或特殊功能处理装置执行一些功能或功能群组的指令和数据。部分计算机资源可通过网络存取。计算机可执行指令可为例如二元、中继格式指令例如组合语言、固件、或来源码。计算机可读介质的实施例会用于存储指令、使用信息、和/或依据所述实施例的方法进行中所产生的信息,该计算机可读介质包括磁盘或光盘、快闪存储器、非易失性存储器提供的USB装置、网络连接存储装置等等。
依据本发明实施例实现的装置可包括硬件,固件和/或软件,并可使用各种形式因素。形式因素的典型实施例包括笔记型计算机、智能手机、小型化机构(small form factor)个人计算机、个人数字助理等等。所述的功能性也会以周边或扩充卡实现。功能性也会藉由其他实施例,由单独装置中电路板上不同芯片或不同程序间的执行动作实现。
指令、传递该指令的介质、执行该指令的运算资源、以及其他支持该运算资源的构造为用以提供公开书所述功能的方式。
本发明实施例的各个方面提供用以在一服务器系统中管理二或多个PSU的方法,以实现所有PSU的大致上最佳化的功率效能与MTBF。虽然以上已经引用特定实施例来显示可选操作在不同指令下如何使用,其他实施例可结合可选操作和不同指令。为了清楚解释,在本发明一些实施例可包括独自的功能区块,该功能区块包括软件或硬件和软件的结合实现的方法中的装置、装置元件、步骤或常式。
其他实施例可另外在各种操作环境中实现,该各种操作环境在一些实施例中可包括用于操作多个应用程序的一或多台服务器计算机、用户计算机或运算装置。用户或客户装置可包括任意多个通用个人计算机,例如以标准操作系统运作的桌上型或膝上型计算机、以及以移动软件运作并能支持多个网络和讯息通信协议的蜂窝、无线以及手持装置。该系统也可包括多个以各种商用操作系统以及其他已知针对特殊目的的应用程序运作的工作站,上述特殊目的可例如为发展和数据库管理。上述装置也可包括其他电子装置,例如虚拟终端、瘦客户端、游戏系统以及其他能通过网络通信的装置。
为了延伸实施例,本发明实施例或部分实施例以硬件实现,并以任意一种或以下技术的结合实现:具有逻辑门的离散逻辑电路,可在收到数据信号时用于实现逻辑功能、具有合适的组合逻辑门的特定应用集成电路(Application Specific Integrated Circuit,ASIC)、可编程硬件例如可编程门阵列(Programmable Gate Array,PGA)、现场可编程门阵列(FPGA)等等。
大部分实施例使用本领域技术人员周知的至少一网络,用于支持各种商用通信协议的通信,例如TCP/IP、OSI、FTP、UPnP、NFS、CIFS、AppleTalk等等。网络可为,例如为本地区域网络、广域网络、虚拟私有网络、互联网、内连网(intranet)、外连网(extranet)、公众电话交换网络(public switchedtelephone network)、红外线网络、无线网络以及以上任意组合。
本发明实施例的方法可使用计算机可执行指令实现,该计算机可执行指令存储于计算机可读介质或可由计算机可读介质提供。此种指令可包括,例如让通用计算机、特殊用途计算机、或特殊用途处理装置执行一些功能或功能群组的指令和数据。部分计算机资源可通过网络存取。计算机可执行指令可为例如二元码、中继格式指令例如组合语言、固件、或来源码。计算机可读介质的实施例可用于存储指令、使用信息、和/或依据所述实施例的方法进行中所产生的信息,该计算机可读介质包括磁碟或光盘、快闪存储器、具有非易失性存储器的USB装置、网络连接存储装置等等。
依据本发明实现方法实现的装置可包括硬件,固件和/或软件,并使用各种形式因素。形式因素的典型实施例包括笔记型计算机、智慧手机、小型化机构(small form factor)个人计算机、个人数字助理等等。所述的功能性也可以周边或扩充卡实现。功能性也可藉由其他实施例,由单独装置中电路板上不同芯片或不同程序间的执行动作实现。
在使用网络服务器的实施例中,网络服务器可执行各种服务器或中层应用程序,包括HTTP服务器、FTP服务器、CGI服务器、数据服务器、Java服务器以及商业应用程序服务器。服务器也能够相应于用户装置的请求而执行程序或脚本,例如藉由执行一或多个以任意编程语言或其他脚本语言编写的网络应用程序,上述任意编程语言可例如为C、C#或C++,且上述其他脚本语言可例如为Perl、Python或TCL、以及其中一种组合。服务器也可包括数据库服务器,包括但不限于可在开放商业市场上取得的服务器。
服务器数据中心可包括上述讨论的各种数据存储以及其他存储器和存储介质。各种数据存储以及其他存储器和存储介质会驻于各种位置之内,例如存储介质本地之上(和/或驻于)一或多台计算机或网络上任意计算机或所有计算机的远端。在实施例的特定组合中,信息可驻于本领域技术人员所熟知的存储区域网络(SAN)之内。类似地,用于执行计算机,服务器或其他网络装置特性功能的任意所需文件可于合适之处在本地和/或远端存储。上述系统包括计算机化装置,每个这种装置可包括通过总线电耦接的硬件元件,元件包括,例如至少一中央处理单元(CPU)、至少一输入装置(例如鼠标、键盘、控制器、触控显示器元素或按键)以及至少一输出装置(例如显示器装置、打印机或喇叭)。此种系统也可包括一或多个存储装置,例如碟机、光学存储装置和固态存储装置例如随机存取存储器(RAM)或只读存储器(ROM),以及可移除介质装置、存储器卡、快闪卡等等。
该装置也可包括所述的计算机可读存储介质读取器、通信装置(例如终端机、网络卡(无线或有线)、红外线运算装置)以及工作存储器。计算机可读存储介质读取器可连接或用于接收计算机可读存储介质用于暂时和/或更永久包括、存储、传送、以及提取计算机可读信息,该计算机可读存储介质代表远端、本地、固定和/或可移除存储装置以及存储介质。系统和各种装置通常也可包括位于至少一工作存储器装置之内的多个软件应用程序、模块、服务或其他元件,包括操作系统和应用程序,例如定制化应用程序或网络浏览器。本领域技术人员可知替代实施例具有上述实施例的各种变化型。例如,也可使用定制化硬件和/或特定元件可以硬件、软件(包括可携软件、例如小程序(applet))或两者兼有加以实现。另外,也可使用到其他运算装置的连接,该其他运算装置可例如为网络输入/输出装置。
用以包括编码、或部分编码的存储介质和计算机可读介质可包括本领域中已知或使用的任意合适介质,包括存储介质和运算介质,例如但不限于易失性和非易失性、可移除和不可移除介质,以针对存储和/或信息传输的任意方法或技术实现,例如计算机可读指令、数据构造、程序模块或其他数据,包括RAM、ROM、EPROM、EEPROM、快闪存储器或其他存储器技术、CD-ROM、数字光盘(digital versatile disk,DVD)或其他光学存储、磁盒、磁带、磁盘存储或其他磁性存储装置或任意其他用于存储所需信息且会由系统装置存取的介质。依据本发明技术和教示,本领域技术人员可知其他方式和/或方法用以实现本发明各种实施例。
本发明虽以优选实施例公开如上,然其并非用以限定本发明,本领域技术人员,在不脱离本发明的精神和范围内,当可做些许的更动与润饰,因此本发明的保护范围当视所附权利要求书界定范围为准。

Claims (20)

1.一种服务器系统,包括:
至少一处理器;以及
存储器,其包括多个指令,当所述指令在被该至少一处理器执行时使得该服务器系统进行以下步骤:
收集该服务器系统的负载量(loading);
收集该服务器系统的二或多个PSU电源供应单元(power supply unit,PSU)的每一个的负载量;
依据一或多个PSU管理算法,至少依据该服务器系统的该负载量以及该服务器系统的所述二或多个PSU的所述负载量,决定所述二或多个PSU中要被关闭的第一子集;以及
依据该一或多个PSU管理算法,致使该第一子集中的一或多个PSU被周期性地与所述二或多个PSU中正在运作的第二子集的一或多个PSU进行交换。
2.如权利要求1所述的服务器系统,其中所述指令在被该至少一处理器执行时还使得该服务器系统进行以下步骤:
收集该服务器系统的历史负载量信息;
依据该一或多个PSU管理算法,至少依据该服务器系统的该历史负载量信息,决定在指定时间点的预测的负载量模式(loading pattern);以及
决定所述二或多个PSU中要在该指定时间点被关闭的该第一子集。
3.如权利要求2所述的服务器系统,其中所述指令在被该至少一处理器执行时更使得该服务器系统进行以下步骤:
收集该服务器系统以外的多个其他服务器系统的历史负载量信息;以及
依据该一或多个PSU管理算法,至少依据所述其他服务器系统的所述历史负载量信息,决定在该指定时间点的该预测的负载量模式。
4.如权利要求3所述的服务器系统,其中所述指令在被该至少一处理器执行时还使得该服务器系统进行以下步骤:
收集与该服务器系统相关联的信息,该信息包括一天中的时间、一年中的天数、温度、冷却风扇的速度、电源状态、存储器与操作系统(OS)状态、各种数据分组抵达速率(arrival rate)以及数据队列统计数据;以及
至少依据一部分的所收集到的与该服务器系统相关联的该信息,依据该一或多个PSU管理算法,决定在该指定时间点的该预测的负载量模式。
5.如权利要求1所述的服务器系统,其中该一或多个PSU管理算法包括至少一机器学习算法。
6.如权利要求5所述的服务器系统,其中该至少一机器学习算法包括线性回归模型算法、类神经网络模型算法算法、支持向量机为基础的模型算法、贝叶斯统计(Bayesian statistics)算法、案例推理(case-based reasoning)算法、决策树算法、归纳逻辑程序(inductive logic programming)算法、高斯程序回归(Gaussian process regression)算法、数据处理群集分析算法(group method ofdata handling)、学习自动机算法、随机森林算法、合奏式分类器(ensembles ofclassifiers)算法、有序分类(ordinal classification)算法、或者条件式随机场域(conditional random field,CRF)算法。
7.如权利要求1所述的服务器系统,其中所述指令在被该至少一处理器执行时还使得该服务器系统进行以下步骤:
平衡在该服务器系统的所述二或多个PSU的该第二子集中的所述PSU之间的该服务器系统的该负载量。
8.如权利要求7所述的服务器系统,其中所述二或多个PSU的该第二子集包括运作在阈值效能电平之上的至少一PSU。
9.如权利要求1所述的服务器系统,其中所述指令在被该至少一处理器执行时还使得该服务器系统进行以下步骤:
致使该第一子集中的该一或多个PSU与该第二子集中的该一或多个PSU被周期性地以既定模式进行交换,使得所述二或多个PSU的平均故障间隔时间(Mean Time Between Failure,MTBF)大致上为最佳化。
10.如权利要求1所述的服务器系统,其中所述指令在被该至少一处理器执行时还使得该服务器系统进行以下步骤:
将该第二子集中的每一所述PSU的负载量与既定低阈值进行比对;
相应于判定该第二子集中至少2个PSU所运作的负载量电平低于该既定低阈值,致使该至少2个PSU的其中一个关闭并且指定该者为所述二或多个PSU的该第一子集。
11.如权利要求1所述的服务器系统,其中所述指令在被该至少一处理器执行时还使得该服务器系统进行以下步骤:
将该第二子集中的每一所述PSU的该负载量与既定高阈值进行比对;
相应于判定该第二子集中至少2个PSU所运作的负载量电平高于该既定高阈值,致使该第一子集中的其中一PSU开启并且指定该PSU为所述二或多个PSU的该第二子集。
12.一种计算机实现的方法,用以在一服务器系统中管理二或多个电源供应单元(power supply unit,PSU),包括以下步骤:
收集该服务器系统的负载量;
收集该服务器系统的该二或多个PSU电源供应单元的每一个的负载量;
依据一或多个PSU管理算法,至少依据该服务器系统的该负载量以及该服务器系统的所述二或多个PSU的所述负载量,决定所述二或多个PSU中要被关闭的第一子集;以及
依据该一或多个PSU管理算法,致使该第一子集中的一或多个PSU被周期性地与所述二或多个PSU中正在运作的一第二子集的一或多个PSU进行交换。
13.如权利要求12所述的计算机实现的方法,还包括:
收集该服务器系统的历史负载量信息;
依据该一或多个PSU管理算法,至少依据该服务器系统的该历史负载量信息,决定在指定时间点的预测的负载量模式;以及
决定所述二或多个PSU中要在该指定时间点被关闭的该第一子集。
14.如权利要求13所述的计算机实现的方法,还包括:
收集与该服务器系统相关联的信息,该信息包括一天中的时间、一年中的天数、温度、冷却风扇的速度、电源状态、存储器与操作系统状态、各种数据分组抵达速率以及数据队列统计数据;以及
至少依据一部分的所收集到的与该服务器系统相关联的该信息,依据该一或多个PSU管理算法,决定在该指定时间点的该预测的负载量模式。
15.如权利要求12所述的计算机实现的方法,还包括:
将该第二子集中的每一所述PSU的负载量与既定高阈值进行比对;
相应于判定该第二子集中至少2个PSU所运作的负载量电平高于该既定高阈值,致使该第一子集中的其中一PSU开启并且指定该PSU为所述二或多个PSU的该第二子集。
16.如权利要求12所述的计算机实现的方法,其中该一或多个PSU管理算法包括至少一机器学习算法,并且其中该至少一机器学习算法包括线性回归模型算法、类神经网络模型算法算法、支持向量机为基础的模型算法、贝叶斯统计(Bayesian statistics)算法、案例推理(case-based reasoning)算法、决策树算法、归纳逻辑程序(inductive logic programming)算法、高斯程序回归(Gaussian process regression)算法、数据处理群集分析算法(group method ofdata handling)、学习自动机算法、随机森林算法、合奏式分类器(ensembles ofclassifiers)算法、有序分类(ordinal classification)算法、或者条件式随机场域(conditional random field,CRF)算法。
17.如权利要求12所述的计算机实现的方法,还包括:
平衡在该服务器系统的所述二或多个PSU的该第二子集中的所述PSU之间的该服务器系统的该负载量;
其中所述二或多个PSU的该第二子集包括运作在阈值效能电平之上的至少一PSU。
18.一种非暂态计算机可读存储介质,其中包含多个指令,当所述指令在服务器系统的至少一处理器执行时使得该服务器系统进行以下步骤:
收集该服务器系统的负载量;
收集该服务器系统的二或多个电源供应单元(power supply unit,PSU)的每一个的负载量;
依据一或多个PSU管理算法,至少依据该服务器系统的该负载量以及该服务器系统的所述二或多个PSU的所述负载量,决定所述二或多个PSU中要被关闭的第一子集;以及
依据该一或多个PSU管理算法,致使该第一子集中的一或多个PSU被周期性地与所述二或多个PSU中正在运作的第二子集的一或多个PSU进行交换。
19.如权利要求18所述的非暂态计算机可读存储介质,其中所述指令在被该至少一处理器执行时更使得该服务器系统进行以下步骤:
致使该第一子集中的该一或多个PSU与该第二子集中的该一或多个PSU被周期性地以一既定模式进行交换,使得所述二或多个PSU的平均故障间隔时间(Mean Time Between Failure,MTBF)大致上为最佳化。
20.如权利要求18所述的非暂态计算机可读存储介质,其中所述指令在被该至少一处理器执行时更使得该服务器系统进行以下步骤:
将该第二子集中的每一所述PSU的负载量与既定低阈值进行比对;
相应于判定该第二子集中至少2个PSU所运作的负载量电平低于该既定低阈值,致使该至少2个PSU的其中一个关闭并且指定该者为所述二或多个PSU的该第一子集。
CN201510647806.4A 2015-04-28 2015-10-09 服务器系统及其计算机实现的方法及计算机可读存储介质 Pending CN106095035A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/698,221 US20160320818A1 (en) 2015-04-28 2015-04-28 Dynamic management of power supply units
US14/698,221 2015-04-28

Publications (1)

Publication Number Publication Date
CN106095035A true CN106095035A (zh) 2016-11-09

Family

ID=57204056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510647806.4A Pending CN106095035A (zh) 2015-04-28 2015-10-09 服务器系统及其计算机实现的方法及计算机可读存储介质

Country Status (3)

Country Link
US (1) US20160320818A1 (zh)
CN (1) CN106095035A (zh)
TW (1) TWI570545B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108845881A (zh) * 2018-05-30 2018-11-20 有米科技股份有限公司 服务器容量动态调整的方法及装置
CN111587412A (zh) * 2017-09-11 2020-08-25 蜂能知识产权控股有限责任公司 能量卸载系统

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170117813A1 (en) * 2015-10-21 2017-04-27 Quanta Computer Inc. Method and system for testing a power supply unit
US10102033B2 (en) * 2016-05-26 2018-10-16 International Business Machines Corporation Method and system for performance ticket reduction
US11100026B2 (en) 2017-05-15 2021-08-24 Molex, Llc Reconfigurable server and server rack with same
US10712795B2 (en) * 2018-01-30 2020-07-14 Quanta Computer Inc. Power supply unit fan recovery process
US11212262B2 (en) * 2019-03-04 2021-12-28 Cyxtera Cybersecurity, Inc. Management of network access request based on source address of device
CN110297715B (zh) * 2019-07-02 2021-09-14 北京工业大学 一种基于周期性特征分析的在线负载资源预测方法
GB201919009D0 (en) * 2019-12-20 2020-02-05 Eaton Intelligent Power Ltd Power management of computing system
CN111309132B (zh) * 2020-02-21 2021-10-29 苏州浪潮智能科技有限公司 一种服务器多档位电源冗余的方法
CN111813209B (zh) * 2020-06-19 2022-03-08 浪潮电子信息产业股份有限公司 一种电源组管控方法、系统、装置及计算机可读存储介质
TWI827938B (zh) * 2021-06-09 2024-01-01 英業達股份有限公司 控制裝置及控制方法
US20230126736A1 (en) * 2021-10-25 2023-04-27 Dell Products L.P. Actively Selecting of Power Supply Unit Operating Mode
CN114461041B (zh) * 2022-01-07 2023-07-18 苏州浪潮智能科技有限公司 一种多节点服务器psu访问及能耗散热管理结构和方法
US11747886B2 (en) 2022-02-02 2023-09-05 Hewlett Packard Enterprise Development Lp Response mechanisms of a power sourcing equipment to a swap event of a power supply unit

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020171985A1 (en) * 2001-03-21 2002-11-21 Duffy Thomas P. System, device and method for providing voltage regulation to a microelectronic device
US20030056125A1 (en) * 2001-09-19 2003-03-20 Dell Products L.P. System and method for strategic power supply sequencing in a computer system
US20060184287A1 (en) * 2005-02-15 2006-08-17 Belady Christian L System and method for controlling power to resources based on historical utilization data
US20100038963A1 (en) * 2008-08-13 2010-02-18 Dell Products L.P. Systems and Methods for Power Supply Wear Leveling In a Blade Server Chassis
CN104166450A (zh) * 2014-08-20 2014-11-26 浪潮电子信息产业股份有限公司 一种vr芯片fw版本的区分方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464717A (zh) * 2009-01-09 2009-06-24 华硕电脑股份有限公司 应用于计算机系统的电源供应调整方法
KR20150004169A (ko) * 2013-07-02 2015-01-12 삼성전자주식회사 전원공급장치, 이를 구비한 마이크로 서버 및 전원공급방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020171985A1 (en) * 2001-03-21 2002-11-21 Duffy Thomas P. System, device and method for providing voltage regulation to a microelectronic device
US20030056125A1 (en) * 2001-09-19 2003-03-20 Dell Products L.P. System and method for strategic power supply sequencing in a computer system
US20060184287A1 (en) * 2005-02-15 2006-08-17 Belady Christian L System and method for controlling power to resources based on historical utilization data
US20100038963A1 (en) * 2008-08-13 2010-02-18 Dell Products L.P. Systems and Methods for Power Supply Wear Leveling In a Blade Server Chassis
CN104166450A (zh) * 2014-08-20 2014-11-26 浪潮电子信息产业股份有限公司 一种vr芯片fw版本的区分方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111587412A (zh) * 2017-09-11 2020-08-25 蜂能知识产权控股有限责任公司 能量卸载系统
CN108845881A (zh) * 2018-05-30 2018-11-20 有米科技股份有限公司 服务器容量动态调整的方法及装置

Also Published As

Publication number Publication date
TWI570545B (zh) 2017-02-11
US20160320818A1 (en) 2016-11-03
TW201638712A (zh) 2016-11-01

Similar Documents

Publication Publication Date Title
CN106095035A (zh) 服务器系统及其计算机实现的方法及计算机可读存储介质
US20200396296A1 (en) Cognitive edge processing for internet-of-things networks
Verma et al. A survey on network methodologies for real-time analytics of massive IoT data and open research issues
Haghi Kashani et al. Quality of service‐aware approaches in fog computing
US11962644B2 (en) Resource orchestration brokerage for internet-of-things networks
CN105912448B (zh) 服务器系统及其用以增强存储器容错能力的方法
US10594158B2 (en) ORing FET control method for battery backup system
CN105721535B (zh) 用于对服务功能链中的服务功能进行并行处理的计算设备、方法以及机器可读存储介质
Akbar Neghabi et al. Nature‐inspired meta‐heuristic algorithms for solving the load balancing problem in the software‐defined network
WO2018009205A1 (en) Intelligent gateway configuration for internet-of-things networks
CN106919242A (zh) 服务器系统及其管理方法及计算机可读式存储多媒体
CN104012063A (zh) 用于软件定义网络中的灵活和可扩展流处理的控制器
CN108293005A (zh) 用于共享状态相关信息的方法和设备
CN106155260A (zh) 服务器的系统与管理方法以及计算机可读存储介质
CN106095034A (zh) 计算系统、计算机实现方法及其非瞬时计算机可读取媒体
CN108319357A (zh) 用以关闭系统的多个主动元件的电源的方法及伺服器系统
CN108983938A (zh) 当待机电源故障时可操作系统、计算机实现方法、及介质
CN106055059A (zh) 用于分配电力的系统、运算装置和计算机实现方法
Ashraf et al. TOPSIS-based service arbitration for autonomic internet of things
CN106155264A (zh) 管理存储子系统的电力消耗的计算机方法与计算机系统
CN106055067A (zh) 服务器系统及增强服务器系统的存储器错误容忍率的方法
US20230053575A1 (en) Partitioning and placement of models
US20220294740A1 (en) Dynamic bandwidth allocation and autonomous device management enabled by an intelligent orchestration management system
Gilbert Artificial intelligence for autonomous networks
Singh et al. Prospective on technical considerations for edge–cloud cooperation using software-defined networking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161109