CN101441506B - 一种刀片服务器系统及其功耗管理方法 - Google Patents
一种刀片服务器系统及其功耗管理方法 Download PDFInfo
- Publication number
- CN101441506B CN101441506B CN2007101873518A CN200710187351A CN101441506B CN 101441506 B CN101441506 B CN 101441506B CN 2007101873518 A CN2007101873518 A CN 2007101873518A CN 200710187351 A CN200710187351 A CN 200710187351A CN 101441506 B CN101441506 B CN 101441506B
- Authority
- CN
- China
- Prior art keywords
- blade
- power
- bmc
- priority
- payload
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Power Sources (AREA)
Abstract
一种刀片服务器系统,包括多个刀片、管理模块以及电源模块;每一刀片又有BMC、Payload、开关及传感器;其中,管理模块通过读取存储在BMC中刀片的优先级数据及传感器对Payload功耗的实时监测数据,并读取电源模块能提供的功率,实时计算出系统当前的剩余功率,分别在系统上电、有刀片插入或拔出时据刀片优先级、槽位来确定刀片的上电顺序,并据此和系统当前能提供的剩余功率,依次对各刀片的Payload的通电与否向BMC做出指示;电源模块分配和回收所有刀片的电源功率;BMC分别对获准上电、被采取断电的Payload控制开关闭合或断开。本发明能够有效地对刀片服务器的功耗进行管理,保证其长期正常运行。
Description
技术领域
本发明涉及网络服务器的功耗管理技术,尤其涉及刀片服务器的功耗管理和电源功率分配技术。
背景技术
刀片服务器是指在机架式机箱内可插装多个卡式的服务器单元,即刀片单板(亦可简称刀片)。其实际上是类似电脑主板的板卡,板卡上有处理器、芯片组、内存和硬盘等,并安装了操作系统,因此一个“刀片”就是一台小型服务器。这一张张的刀片组合起来,进行数据的互通和共享,在系统软件的协调下同步工作,就可以变成高可用及高密度型的服务器。通常,刀片服务器应用在一些大型的数据中心场合。
刀片服务器系统作为一种高密度系统,通常可以容纳十多个刀片。电源模块作为刀片服务器系统的动力来源,要求其能够提供足够的功率,即能够支撑机框内所有的刀片运行在100%功率下的操作状态,且所用的电源模块都设置了充分的冗余,因为其安全可靠性直接关系整个系统的性能和稳定性。由于刀片服务器是一个庞大的耗电系统,在典型的数据中心中,通常部署了大量服务器,但可用的功率一般是有限的,因此,有效管理刀片单板的功耗就显得尤为重要。
而目前服务器计算平台的处理器、芯片组、内存、硬盘等器件的发展日新月异,相关芯片器件的功耗逐步增加;但刀片服务器系统的电源模块更新速率却远低于处理器、芯片组的更新速度,这就对在原有的刀片服务器系统内兼容运行新的刀片单板和将来的可能更大功耗的刀片单板,都提出极大的挑战。现实情况也表明,在某些主流厂商的刀片服务器系统中,所用电源模块提供的电源功率远跟不上刀片单板的功率要求,不得不被迫通过多次升级电源模块的功率来解决这个问题。而即使通过这种方式,还是无法确保在刀片系统内满配置所有的刀片,仍然有可能出现新增加的重要性更高的刀片可 能会由于功率短缺而无法正常上电,从而引发服务器的灾难性故障。单纯地通过升级提高电源模块功率指标的方式并不能从根本上解决这种问题。
目前,业界流行的刀片服务器系统的功耗管理策略有2种:
第一种功耗管理策略是最常用的也是最简单的功耗管理策略,管理员或用户假设最坏的情况发生,即假设每个刀片都以100%的功率运行,然后根据这个假设,对刀片服务器手动分配给各个刀片的电源功率为最大功耗额定值,以确保刀片服务器系统内所有的刀片运行能够在100%功率的操作状态。
但是,这种功耗管理办法存在一些问题:一方面,将每个刀片的功耗都设置为最大额定值,而通常刀片服务器系统并没有完全使用所分配的所有功耗,因此浪费了一些功率容量,这会导致管理员或用户因无法有效管理功耗而不得不限制服务器的使用。另一方面,所有刀片的功耗设置都是一样的,无法体现不同刀片在业务运行中的重要性;在已部署的服务器使用完所有可用的电源功率时,新增加的重要性更高的刀片可能会由于功率短缺而无法正常上电,服务器的灾难性故障就可能由此而引起。
另一种功耗管理策略,是在第一种功耗管理策略基础中进行了改进,即在刀片系统中采用电源节流策略。例如,IBM公司专利号为CN200610144410的专利“用于刀片系统的节流管理的方法和系统”,就是针对第一种功耗管理策略的弊端做了改进。根据实践统计发现的实际应用很少出现所有刀片都以100%功率运行,事实上,刀片在实际操作中需要100%功率的概率仅约为0.2%。因而在大多数情况下,系统有大量功率可以分配给其它刀片,所以采用节流策略,根据对刀片预期使用的实际功率的估计值而不是最大功率额定值来为刀片分配功率,并设置阈值监控刀片负载,如果该负载超过这个阈值,则触发系统执行节流操作,降低该刀片的功耗,以维持更多刀片的运行。
而这种功耗管理办法也存在一些问题:一方面,所有刀片的设置还是相同的,无法体现各自在业务运行中的重要性;在已部署的服务器使用了所有可用的电源功率时,新增加的重要性更高的刀片还是有可能会由于功率短缺而无法正常上电。另一方面,每个刀片的功耗设置是基于估计预期使用的实际功率,估计的准确度是否符合实际应用情况都需要经过实践的验证,在不同业务平台这个数据差别很大,不能一概而论。
因此,希望有一种方法能够体现出刀片服务器系统中不同刀片运行业务的重要性,并能够优先考虑重要性较高的刀片的功率分配,让刀片服务器中每一个上电的刀片都尽可能地运行在其实际需要的功率下,从而能够有效地实现刀片服务器的功率分配及功耗管理。
发明内容
本发明所要解决的技术问题是提供一种刀片服务器系统及其功耗管理方法,以避免因重要性高的刀片无法上电而导致灾难性故障。
为了解决上述技术问题,本发明提供了一种刀片服务器系统,包含在一个机框内;该系统包括:多个刀片、管理模块以及电源模块;每一刀片又含有:刀片管理子系统BMC、主负荷模块Payload、开关SW以及传感器;其中:
管理模块,分别与每一刀片的BMC及电源模块连接,用于对机框内所有刀片,依据从BMC读取的刀片的优先级数据确定刀片的功率分配顺序,并根据从电源模块获取的系统当前的剩余功率,依功率分配顺序对各刀片Payload的通电与否向刀片的MC做出指示;
电源模块,与SW通过电源线连接,用于在管理模块的控制下,分配和回收机框内所有刀片的电源功率;
BMC,分别与辅助电源线、SW及传感器连接,用于向管理模块申请本刀片上Payload的通电,并对获准通电的Payload控制SW闭合;当收到管理模块对刀片的Payload断电的指示后,控制SW断开;
Payload,分别与SW和传感器连接,用于作为刀片的主要部分在SW的控制下接受电源模块对其提供的功率分配,并接受BMC通过传感器对其实施的功耗监测;
开关SW,用于在BMC的控制下为刀片的Payload提供通电或断电操作;
传感器,用于将刀片的Payload所汲取的功耗信号进行实时转换传输给
进一步地,BMC的重要管理数据VPD里含有根据运行业务重要性而自定义的刀片的优先级数据,管理模块对申请上电的刀片从高优先级到低优先级排序,在属于同一优先级的刀片之间依其安装槽位的顺序排序,依此排序结果作为功率分配顺序。
进一步地,管理模块通过读取存储在BMC中对Payload功耗的实时监测数据,并读取电源模块能提供的功率,实时计算出系统当前的剩余功率;管理模块分别在机框开机上电、机框内有新刀片插入或有刀片拔出时,采用冒泡排序法对申请通电的刀片进行排序。
进一步地,BMC的VPD里还含有刀片的静态信息,包括刀片的型号、序列号以及版本号。
进一步地,管理模块在判断系统当前的剩余功率不足以为当前排序第一的刀片提供上电功率时,对机框内现有的分配功率范围内的刀片依照其优先级执行节能降耗措施,该节能降耗措施包括:针对优先级别较低的刀片根据对其功耗的监测数据,将提供给该刀片的功率降至略高于该监测数据;或者,在当前排序第一的刀片的优先级高于机框内已通电的其它刀片的优先级时,指示优先级别最低的刀片的BMC对其Payload断电,以将腾出功率为当前排序第一的刀片上电提供。
进一步地,BMC还用于向管理模块输出刀片未获准上电或对刀片实施强制断电的告警信息,以及将未获准上电或被实施强制断电的刀片记录到管理日志中;管理模块还用于对机框内所有刀片的工作状态属性和事件进行记录和上报;该工作状态属性包括电压、温度、风扇转速以及CPU状况,该事件包括刀片的热插拔、刀片未允许上电或被实施强制断电或其它异常事件;以及对刀片信息进行管理,该刀片信息包括静态信息及刀片的运行功耗。
为了解决上述技术问题,本发明提供了一种刀片服务器系统的功耗管理方法,涉及系统内的电源模块、多个刀片以及刀片上的管理子系统BMC和主负荷模块Payload;该方法包括以下步骤:
(a)按照刀片的优先级对申请上电的刀片进行排序;
(b)针对当前排序第一的刀片,若系统当前的剩余功率足够分配,则指示BMC将刀片的Payload通电并为其分配功率。
进一步地,该方法还包括步骤:
(c)针对当前排序第一的刀片,若系统当前的剩余功率不足够分配,则在现有已通电的刀片范围内据刀片的优先级执行节能降耗操作后,重复执行步骤(b);该节能降耗操作包括:针对优先级别较低的刀片根据对其功耗的监测数据,将提供给该刀片的Payload的功率降至略高于该监测数据。
进一步地,步骤(c)若采取所述节能降耗操作后,系统当前的剩余功率仍不足以分配;则该方法还包括步骤:
(d)当机框内存在现有已通电的刀片的优先级低于当前排序第一的刀片的优先级时,指示优先级别最低的刀片的BMC将Payload强制断电,以将腾出功率为当前排序第一的刀片上电提供;BMC对刀片实施强制断电后上报告警信息,并将该信息记录在管理日志上。
进一步地,步骤(c)若采取所述节能降耗操作后,系统当前的剩余功率仍不足以分配;则该方法还包括步骤:
步骤(e)当机框内不存在现有已通电的刀片的优先级低于当前排序第一的刀片的优先级时,则指示当前排序第一的刀片的BMC不允许对其Payload通电;该BMC上报未获准通电告警信息,并将该信息记录在管理日志上。
进一步地,步骤(a)根据运行业务重要性而自定义的刀片的优先级和刀片在系统内的槽位顺序采用冒泡排序法进行排序,即将高优先级的刀片排列在先,对同一优先级别的刀片按其所述槽位顺序排列。
进一步地,通过实时读取所有BMC对刀片运行功耗的监测数据的总和,及获取电源模块所能提供的功率,来实时计算获取系统当前的剩余功率。
进一步地,所述方法应用于系统的上电初始化流程,即在步骤(a)前还包括步骤:
(a1)系统开机上电,电源模块及刀片的BMC通电,系统执行初始化操作;
(a2)BMC提出刀片的通电申请,并提供刀片的优先级数据。
进一步地,所述方法应用于将一新刀片插入系统的处理流程,即在步骤(a)前还包括步骤:
(a1)插入新刀片,该新刀片的BMC通电;
(a2)该BMC提出新刀片的通电申请,并提供新刀片的优先级数据。
进一步地,所述方法应用于从系统拔出刀片的处理流程,即在步骤(a)前还包括步骤:
(a1)从系统拔出刀片;
(a2)若系统存在刀片的Payload未上电的情况,且系统内存在强制断电告警信息或未获准上电告警信息,则对告警信息相应的刀片继续执行步骤(a);若系统存在刀片的Payload未上电的情况,但系统内不存在强制断电告警信息或未获准上电告警信息,则直接进入步骤(b)执行;若系统不存在刀片的Payload未上电的情况,则实时读取刀片运行功耗的监测数据。
本发明上述系统及方法由于针对刀片运行业务的不同重要性而引入刀片优先级的概念,故能根据刀片优先级进行刀片功率分配管理;通过管理模块与BMC管理子系统的配合,实施对每个刀片的上电、功率分配及功耗监测,以此达到刀片服务器系统运行过程整体功耗的平衡,而有效地实现刀片服务器的功耗管理,从而保证刀片服务器的长期正常运行。而且,本发明还能够节省针对降低刀片服务器的功耗所需采取措施的投资。
附图说明
图1是本发明带有功耗管理的刀片服务器系统的结构框图;
图2是本发明的刀片服务器上电初始化的功耗管理流程图;
图3是本发明的刀片服务器插入新刀片的功耗管理流程图;
图4是本发明的刀片服务器拔出刀片的功耗管理流程图。
具体实施方式
本发明的刀片服务器系统,包括在机框中有:多个刀片、管理模块以及电源模块;每一刀片又包括:刀片管理子系统BMC、主负荷模块Payload、开关SW以及传感器;其中:管理模块分别与电源模块及每一刀片的BMC连接,作为整个机框的核心控制器件用于控制对所有刀片的功率分配和回收及功耗管理,即通过读取存储在BMC中刀片的优先级数据及传感器对Payload功耗的实时监测数据,并读取电源模块所能提供的功率,实时计算出系统当前的剩余功率,分别在机框开机上电、机框内有刀片插入或拔出时,根据所有刀片的优先级、槽位来确定刀片的功耗分配顺序,并据此顺序和系统当前能提供的剩余功率,依次对各刀片的主负荷模块Payload的通电与否向其BMC做出指示;当判断系统当前的剩余功率不足以为当前排列在先的刀片提供上电功率时,根据电源功率管理策略对机框内现有功率范围内的刀片依照其优先级执行节能降耗操作,以提供对该当前排列在先的刀片上电的支持。管理模块负责对刀片工作状态属性、刀片事件记录和上报以及刀片信息的管理。电源模块与开关通过电源线VCC连接,用于在管理模块的控制下,分配和回收机框内所有刀片单板的电源功率,切换冗余电源以及监测电源故障。BMC分别与辅助电源线VAU、开关及传感器连接,用于向管理模块申请本刀片Payload的上电,并对获准上电的刀片Payload控制开关闭合;当收到管理模块对刀片Payload断电的指示后,控制开关断开,并向管理模块发出对该刀片强制断电的告警信息,以及将被实施强制断电的刀片和未获准上电的刀片记录到管理日志中。Payload分别与开关和传感器连接,用于作为刀片的主要部分,在开关的控制下接受电源模块对其提供的功率,并在传感器的监测下接受BMC对其实施的功耗管理。
以下将结合实施例和附图对本发明上述技术方案做详细阐述。
如图1所示,是本发明刀片服务器系统的一个实施例。囊括在机框(该机框是刀片服务器系统的框架,通过背板将其上各部件和模块进行互连通讯)中的该刀片服务器系统100含有:多个刀片单板(图中只示出一个)101、管理模块102以及多个电源模块102(刀片服务器内电源模块一般至少要有四个,图1中只示出一个);每一个刀片101又包括:刀片管理子系统(BMC, Board Manager Controller)1011、主负荷模块(Payload)1012、开关(SW)1013以及传感器1014;其中:
管理模块102,分别与每一刀片的BMC 1011及电源模块103连接,用于作为整个机框的核心控制器件来控制对所有刀片的功率分配和回收及功耗管理,即对上、下电顺序进行控制、对刀片热插拔的管理、刀片工作状态属性的记录(包括电压、温度、风扇转速、CPU状况等)和上报(即管理模块将负责将监测到的情况记录通过Web界面或命令行界面CLI都上报给刀片服务器的用户)、刀片事件(比如热插拔事件、未允许上电或被实施强制断电或其它异常事件等)记录和上报以及刀片信息的管理(比如记录本板的版本、功耗等);
具体地,通过读取存储在BMC 1011中刀片的优先级数据及传感器1014对Payload 1012功耗的实时监测数据,并读取电源模块103所能提供的功率,实时计算出电源模块103当前能提供的剩余功率;分别在机框开机上电、机框内有刀片插入或拔出时,根据所有刀片的优先级、槽位来确定刀片的功率分配顺序,即对申请上电的刀片从高优先级到低优先级排序,在属于同一优先级的刀片之间依安装槽位的顺序排序;根据排序和电源模块103当前能提供的剩余功率,依次对各刀片的主负荷模块Payload 1012的通电与否向其BMC做出指示。
管理模块102在审核刀片通电申请的过程中,根据多个刀片的优先级和槽位再通过排序算法实现对刀片功率分配的排序。由于每个刀片服务器系统所能容纳的刀片单板最多数量只有十几片,所以在排序算法上没有特殊的要求,不同排序算法之间的性能差异很小,采用普通的冒泡排序法就足以了。
当管理模块102判断电源模块103当前能提供的剩余功率不足以为当前较高优先级的刀片提供上电功率时,会根据电源功率管理策略,对机框内现有在分配功率范围内的刀片依照其优先级执行节能降耗操作。也就是针对优先级别较低的刀片根据监测其功耗数据,将提供给其的功率降至稍高于此监测的功耗数据即可;甚至在必要时,即在实施降耗操作后系统当前的剩余功率仍不足以供分配,且当前排序在先的刀片的优先级要比现有的已上电刀片的优先级更高时,要对优先级别最低的刀片采取断电措施,以腾出功率为优 先级别高的刀片上电提供。
电源模块103,与开关1013通过电源线VCC连接,用于在管理模块的控制下,分配和回收机框内所有刀片单板的电源功率,切换冗余电源以及监测电源故障;
BMC 1011,分别与辅助电源线VAU、开关1013及传感器1014连接,用于向管理模块102申请本刀片的Payload 1012的上电,并对获准上电刀片的Payload 1012控制开关1013闭合;当收到管理模块102对刀片的Payload1012断电的指示后,控制开关1013断开,并向管理模块102发出对该刀片强制断电的告警信息,以及将被实施强制断电的刀片和未获准上电的刀片记录到管理日志中;
在BMC 1011的重要管理数据(VPD,Vital Product Data)包中包括上述提及的根据运行业务重要性而自定义的刀片优先级数据、刀片单板的型号、序列号以及版本号等信息。
Payload 1012,分别与开关1013和传感器1014连接,用于作为刀片的主要部分(包括处理器、内存、硬盘及I/O接口芯片等),在开关1013的控制下接受电源模块103对其提供的功率分配,并在传感器1014的监测下接受BMC对其实施的功耗管理;
开关1013,用于在BMC的控制下为刀片的Payload 1012提供通电或断电操作;
传感器1014,用于实时监测刀片的Payload 1012所汲取的功耗。
本实施例克服现有技术中存在的无法体现出不同刀片单板运行业务的重要性、以及无法有效实现刀片系统中的功率分配的缺陷,能够确保高重要性的刀片单板在电源功率分配方面始终具有高优先权。
具体是体现在刀片管理子系统BMC和管理模块方面:BMC的VPD包内增加了根据某个刀片对于整个系统的影响和重要性设置其优先级,例如:Web服务器,邮件服务器、JAVA服务器、数据库服务器等等。刀片的优先级数据通过用户编码定制写在BMC的VPD包中。管理模块增加了根据所 有刀片的优先级、槽位来确定刀片的功率分配顺序,即高优先级的刀片具有高优先权的功率分配,同一优先级别的刀片按其槽位顺序分配功率,依此并根据系统当前能提供的剩余功率来确定一个刀片的上电与否。
每块刀片在上电前,都必须通过BMC向管理模块提交通电申请,管理模块根据上述功率分配策略审批通电申请。只有满足通电的各项条件(优先级、槽位顺序以及系统当前能提供的剩余功率等),刀片的Payload才能获得分配的功率。以此达到系统能够根据刀片运行业务的重要性进行功率分配的目的,且能够有效地管理刀片服务器内的功耗,从而节省了电源模块功率的消耗和为降耗所进行的投资和部署,提高了刀片服务器系统的功耗管理能力。
本发明提供的刀片服务器系统功耗管理方法,包括以下步骤:
(a)按照刀片的优先级及刀片在机框内的安装槽位顺序对申请上电的刀片排序;
(b)针对当前排序第一的刀片,若确定系统当前电源的剩余功率足够分配,则将此刀片上电并分配功率;
(c)针对当前排序第一的刀片,若确定系统当前电源的剩余功率不足以分配,则对现有的在分配功率范围内的刀片据优先级执行降耗措施后,重复执行步骤(b);该降耗措施包括:针对优先级别较低的刀片根据对其功耗的监测数据,将提供给其的功率降至略高于此监测数据;当在采取上述降耗操作后确定系统当前电源的剩余功率仍不足以分配,且当前排序第一的刀片的优先级高于机框内现有的在分配功率范围内的刀片优先级,则针对优先级最低的刀片采取断电措施。
本发明的上述方法步骤贯穿在本实施例的三个流程中,以下将分别对这三个流程进行详细描述。
(1)刀片服务器系统开机上电初始化的处理流程,如图2所示;
系统内对刀片101依上电顺序进行上电操作,是系统能够安全可靠运行 的重要保证,也是保证系统从静止状态到运行状态转换的必要过程。刀片上电的初始必要条件是:至少有一个电源模块103存在于刀片系统中,至少有一个管理模块102存在于刀片系统中,至少有一个刀片101存在于刀片服务器系统中。管理模块102与每个刀片的BMC相互配合,对申请上电的刀片从高优先级到低优先级依次分配功率,在属于同一优先级的刀片之间根据安装槽位的顺序依次分配功率,在完成高优先级的所有刀片电源分配之后如果还有剩余电源功率才继续分配给低优先级的刀片,以此方式实现刀片服务器系统的电源功率按照刀片优先级分配和有效管理功耗的目的。
图2所示流程包括如下步骤:
201:外部电源接入机框;
202:电源模块、风扇模块以及管理模块等执行系统的初始化操作;
203:各个刀片上的BMC上电初始化,并与管理模块通讯,向管理模块提供相应刀片的优先级;
204:管理模块读取各个刀片的优先级及槽位后,按照刀片优先级高低排序,同一优先级按照刀片在机框内槽位顺序排序准备对相应刀片的Payload上电;
205:管理模块与电源模块通讯,根据在线电源模块的功率额度、状态和数量,确定电源模块能够提供的有效功率输出,并判断系统当前的剩余电源功率是否足够分配(初始状态时,系统当前的剩余电源功率接近或等于电源模块能够提供的有效功率输出);若是执行步骤212,若否则执行步骤206;
206:管理模块根据功率管理策略对机框内现有功率域内的刀片根据优先级执行节能降耗操作,即针对优先级别较低的刀片根据对其功耗的监测数据,将提供给其的功率降至略高于此监测数据;
207:管理模块与电源模块再次通讯,确定电源模块当前能够提供的有效功率输出,并判断系统当前的剩余电源功率是否足够分配;若是执行步骤212,若否则执行步骤208;
208:管理模块比较当前排序第一刀片的优先级是否高于机框内现有的至少一个已上电的刀片;若是执行步骤209,若否则执行步骤210;
209:管理模块指示机框内优先级最低刀片的BMC将该刀片的Payload断电,然后执行步骤211;
210:管理模块指示当前排序第一刀片的BMC不允许该刀片的Payload上电(即当前刀片申请上电由于优先级别不够而未获批准),且将现有已上电的刀片分配的功率恢复到降耗操作前水平;该未获准上电刀片的BMC向管理模块输出未上电告警信息,并将此记录到日志中,然后结束流程;
211:被实施断电操作刀片的BMC向管理模块输出强制断电告警信息,并将该刀片被强制断电的信息记录到日志中;
212:管理模块指示当前排序第一刀片的BMC将该刀片的Payload通电;
213:管理模块检测机框内是否存在Payload未上电的刀片;若是执行步骤214,若否则执行步骤215;
214:管理模块判断机框内是否有强制断电告警信息;若是执行步骤215,若否则返回执行步骤205;
215:管理模块指示停止上电操作且已经上电的刀片正常工作,并监视各个刀片的功率消耗和电源模块提供的功率输出,结束流程。
(2)新刀片插入正在运行的系统中的处理流程,如图3所示;
当刀片101首次被插入机框时,并不会立即被通电,而是先允许该刀片的BMC 1011从电源提取10W功率与机框管理模块102通讯,然后由BMC1011向管理模块102申请Payload 1012通电。管理模块读取存储在BMC内的优先级数据,检测出该刀片的槽位,并将新刀片与机框内其它已申请上电但未获批准的刀片进行排序,确定出当前排序第一的刀片。管理模块读取当前刀片系统中的剩余电源功率,如果功率不够,执行一次节能降耗操作,在进行降耗操作后若剩余功率仍不够,则管理模块将当前排序第一刀片的优先级和机框内现有已通电刀片的优先级进行比较,如果存在优先级较低的现有已通电刀片,则将该优先级最低刀片的Payload断电,回收功率再分配到当前排序第一的刀片,优先级最低的刀片等待有足够的剩余功率再工作。
图3所示流程包括如下步骤:
301:插入新刀片单板;
302:新刀片的BMC上电,允许提取10W功率和机框管理模块通讯,发送该刀片的上电申请,并提供该刀片的优先级数据;
303:管理模块按照新刀片的优先级和槽位,与机框内其它已申请上电但未获批准的刀片进行排序;
304:管理模块与电源模块通讯,根据在线电源模块的功率额度、状态和数量,确定电源模块能够提供的有效功率输出,再根据获取对所有现有通电的Payload功耗总和的实时监测数据,计算出电源模块当前能提供的剩余功率,并判断系统当前的剩余电源功率是否足够分配;若是执行步骤311,若否则执行步骤305;
305:管理模块根据功率管理策略,对机框内现有功率域内的刀片根据优先级执行节能降耗操作,即针对优先级别较低的刀片根据对其功耗的监测数据,将提供给其的功率降至略高于此监测数据;
306:管理模块与电源模块再次通讯,确定电源模块当前能够提供的有效功率输出,判断系统当前的剩余电源功率是否足够分配;若是执行步骤311,若否则执行步骤307;
307:管理模块比较当前排序第一刀片的优先级是否高于机框内现有的至少一个已上电的刀片;若是执行步骤308,若否则执行步骤309;
308:管理模块指示机框内优先级最低刀片的BMC将该刀片的Payload断电,然后执行步骤310;
309:管理模块指示当前排序第一刀片的BMC不允许该刀片的Payload上电(即当前刀片申请上电未获批准),且将现有已上电的刀片分配的功率恢复到降耗操作前水平;该未获准上电刀片的BMC向管理模块输出未上电告警信息,并将此记录到日志中,然后结束流程;
310:被实施断电操作刀片的BMC向管理模块输出强制断电告警信息,并将该刀片被强制断电的信息记录到日志中;
311:管理模块指示当前排序第一刀片的BMC将其Payload通电,结束流程。
(3)从正在运行的系统中拔出刀片的处理流程,如图4所示;
当刀片101从机框拔出时,管理模块102先将多余的功率回收,检测机框是否存在未上电的刀片,如果存在,根据前述按优先级及槽位排序的功率分配原则,将回收的电源功率再次分配给这些有功率需求的刀片。
图4所示流程包括如下步骤:
401:拔出刀片单板;
402:管理模块检测机框内是否存在Payload未上电的刀片;若是执行步骤403,若否则执行步骤409;
403:管理模块判断是否机框内存在强制断电告警信息或未获准上电告警信息;若是执行步骤404,若否则执行步骤406;
404:管理模块根据告警信息和刀片优先级及槽位与机框内其它已申请上电但未获批准或已被强制断电的刀片进行排序执行准备上电操作;
405:管理模块消除该刀片的槽位的告警信息(包括强制断电告警信息或未获准上电告警信息);
406:管理模块与电源模块通讯,根据在线电源模块的功率额度、状态和数量,确定电源模块当前能够提供的有效功率输出,再根据获取对所有现有通电的Payload功耗总和的实时监测数据,计算出电源模块当前能提供的剩余功率,并判断系统当前的剩余电源功率是否足够分配;若是执行步骤410,若否则执行步骤407;
407:管理模块根据功率管理策略对机框内现有功率域内的刀片根据优先级执行节能降耗操作,即针对优先级别较低的刀片根据对其功耗的监测数据,将提供给其的功率降至略高于此监测数据;
408:管理模块与电源模块再次通讯,确定电源模块当前能够提供的有效功率输出,判断系统当前的剩余功率是否足够分配;若是执行步骤410,若否则执行步骤409;
409:管理模块指示已经上电的刀片正常工作,并监视各刀片的功率消耗和电源模块提供的功率,然后结束流程;
410:管理模块指示此槽位刀片的BMC将其Payload通电,并结束流程。
采用本发明上述系统和方法,能够根据各个刀片单板运行业务的重要性指定的优先级决定刀片的功率分配顺序,并能有效地管理刀片服务器系统内各刀片的功率分配和功率回收,解决了现有电源模块在不能满足更多的大功率刀片单板情况下,无法运行更高优先级的刀片的问题,提高了刀片服务器系统的功耗管理能力,使刀片系统中的功率分配和回收更加合理有效。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (15)
1.一种刀片服务器系统,包含在一个机框内,所述系统包括:多个刀片、管理模块以及电源模块;每一刀片又含有:刀片管理子系统BMC、主负荷模块Payload、开关SW以及传感器;其中:
所述管理模块,分别与所述每一刀片的所述BMC及所述电源模块连接,用于对所述机框内所有所述刀片,依据从所述BMC读取的所述刀片的优先级数据确定所述刀片的功率分配顺序,并根据从所述电源模块获取的系统当前的剩余功率,依所述功率分配顺序对各刀片所述Payload的通电与否向所述刀片的所述BMC做出指示;
所述电源模块,与所述SW通过电源线连接,用于在所述管理模块的控制下,分配和回收所述机框内所有所述刀片的电源功率;
所述BMC,分别与辅助电源线、所述SW及所述传感器连接,用于向所述管理模块申请本刀片上所述Payload的通电,并对获准通电的所述Payload控制所述SW闭合;当收到所述管理模块对所述刀片的所述Payload断电的指示后,控制所述SW断开;
所述Payload,分别与所述SW和所述传感器连接,用于作为所述刀片的主要部分在所述SW的控制下接受所述电源模块对其提供的功率分配,并接受所述BMC通过所述传感器对其实施的功耗监测;
所述开关,用于在所述BMC的控制下为所述刀片的所述Payload提供所述通电或所述断电操作;
所述传感器,用于将所述刀片的所述Payload所汲取的功耗信号进行实时转换传输给所述BMC。
2.按照权利要求1所述的系统,其特征在于,所述BMC的重要管理数据VPD里含有根据运行业务重要性而自定义的所述刀片的优先级数据,所述管理模块对申请上电的所述刀片从高优先级到低优先级排序,在属于同一优先级的所述刀片之间依其安装槽位的顺序排序,依此排序结果作为所述功率分配顺序。
3.按照权利要求2所述的系统,其特征在于,所述管理模块通过读取存储在所述BMC中对所述Payload功耗的实时监测数据,并读取所述电源模块能提供的功率,实时计算出所述系统当前的剩余功率;所述管理模块分别在所述机框开机上电、所述机框内有新刀片插入或有所述刀片拔出时,采用冒泡排序法对所述申请通电的刀片进行所述排序。
4.按照权利要求2所述的系统,其特征在于,所述BMC的所述VPD里还含有所述刀片的静态信息,包括所述刀片的型号、序列号以及版本号。
5.按照权利要求1至4任一项所述的系统,其特征在于,所述管理模块在判断所述系统当前的剩余功率不足以为当前排序第一的所述刀片提供上电功率时,对所述机框内现有的分配功率范围内的所述刀片依照其所述优先级执行节能降耗措施,所述节能降耗措施包括:针对优先级别较低的所述刀片根据对其功耗的监测数据,将提供给该刀片的功率降至略高于所述监测数据;或者,在所述当前排序第一的刀片的所述优先级高于所述机框内已通电的其它刀片的所述优先级时,指示优先级别最低的所述刀片的所述BMC对所述Payload断电,以将腾出功率为所述当前排序第一的刀片上电提供。
6.按照权利要求4所述的系统,其特征在于,所述BMC还用于向所述管理模块输出所述刀片未获准上电或对所述刀片实施强制断电的告警信息,以及将所述未获准上电或被实施强制断电的刀片记录到管理日志中;所述管理模块还用于对所述机框内所有所述刀片的工作状态属性和事件进行记录和上报;所述工作状态属性包括电压、温度、风扇转速以及CPU状况,所述事件包括所述刀片的热插拔、所述刀片未允许上电或被实施强制断电或其它异常事件;以及对所述刀片信息进行管理,所述刀片信息包括所述静态信息及所述刀片的运行功耗。
7.一种刀片服务器系统的功耗管理方法,涉及系统内的电源模块、多个刀片以及所述刀片上的管理子系统BMC和主负荷模块Payload;所述方法包括以下步骤:
(a)管理模块对申请上电的所述刀片,依据从BMC读取的刀片的优先级数据确定刀片的功率分配顺序,并从电源模块获取系统当前的剩余功率, 其中,刀片的优先级是根据各个刀片单板运行业务的重要性指定的;
(b)管理模块针对当前排序第一的所述刀片,若所述系统当前的剩余功率足够分配,则指示所述BMC将所述刀片的所述Payload通电并为其分配功率。
8.按照权利要求7所述的方法,其特征在于,所述方法还包括步骤:
(c)针对所述当前排序第一的刀片,若所述系统当前的剩余功率不足够分配,则在现有已通电的所述刀片范围内据所述刀片的优先级执行节能降耗操作后,重复执行步骤(b);所述节能降耗操作包括:针对优先级别较低的所述刀片根据对其功耗的监测数据,将提供给该刀片的所述Payload的功率降至略高于所述监测数据。
9.按照权利要求8所述的方法,其特征在于,步骤(c)若采取所述节能降耗操作后,所述系统当前的剩余功率仍不足以分配;则所述方法还包括步骤:
(d)当机框内存在现有已通电的所述刀片的所述优先级低于所述当前排序第一的刀片的所述优先级时,指示优先级别最低的所述刀片的所述BMC将所述Payload强制断电,以将腾出功率为所述当前排序第一的刀片上电提供;所述BMC对所述刀片实施强制断电后上报告警信息,并将所述信息记录在管理日志上。
10.按照权利要求8所述的方法,其特征在于,步骤(c)若采取所述节能降耗操作后,所述系统当前的剩余功率仍不足以分配;则所述方法还包括步骤:
(e)当机框内不存在现有已通电的所述刀片的所述优先级低于所述当前排序第一的刀片的所述优先级时,则指示所述当前排序第一的刀片的所述BMC不允许对其Payload通电;所述BMC上报未获准通电告警信息,并将所述信息记录在管理日志上。
11.按照权利要求7至10任一项所述的方法,其特征在于,步骤(a)根据运行业务重要性而自定义的所述刀片的所述优先级和所述刀片在所述系 统内的槽位顺序采用冒泡排序法进行排序,即将高优先级的所述刀片排列在先,对同一优先级别的所述刀片按其所述槽位顺序排列。
12.按照权利要求7至10任一项所述的方法,其特征在于,通过实时读取所有所述BMC对所述刀片运行功耗的监测数据的总和,及获取所述电源模块所能提供的功率,来实时计算获取所述系统当前的剩余功率。
13.按照权利要求7所述的方法,其特征在于,所述方法应用于所述系统的上电初始化流程,即在所述步骤(a)前还包括步骤:
(a1)所述系统开机上电,所述电源模块及所述刀片的所述BMC通电,所述系统执行所述初始化操作;
(a2)所述BMC提出所述刀片的通电申请,并提供所述刀片的所述优先级数据。
14.按照权利要求7至10任一项所述的方法,其特征在于,所述方法应用于将一新刀片插入所述系统的处理流程,即在所述步骤(a)前还包括步骤:
(a1)插入所述新刀片,所述新刀片的所述BMC通电;
(a2)所述BMC提出所述新刀片的通电申请,并提供所述新刀片的所述优先级数据。
15.按照权利要求7或8所述的方法,其特征在于,所述方法应用于从所述系统拔出所述刀片的处理流程,即在所述步骤(a)前还包括步骤:
(a1)从所述系统拔出所述刀片;
(a2)若所述系统存在所述刀片的所述Payload未上电的情况,且系统内存在强制断电告警信息或未获准上电告警信息,则对告警信息相应的所述刀片继续执行所述步骤(a);若所述系统存在所述刀片的所述Payload未上电的情况,但系统内不存在强制断电告警信息或未获准上电告警信息,则直接进入所述步骤(b)执行;若所述系统不存在所述刀片的所述Payload未上电的情况,则实时读取所述刀片运行功耗的监测数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101873518A CN101441506B (zh) | 2007-11-20 | 2007-11-20 | 一种刀片服务器系统及其功耗管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101873518A CN101441506B (zh) | 2007-11-20 | 2007-11-20 | 一种刀片服务器系统及其功耗管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101441506A CN101441506A (zh) | 2009-05-27 |
CN101441506B true CN101441506B (zh) | 2011-05-11 |
Family
ID=40725965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101873518A Expired - Fee Related CN101441506B (zh) | 2007-11-20 | 2007-11-20 | 一种刀片服务器系统及其功耗管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101441506B (zh) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101938368A (zh) | 2009-06-30 | 2011-01-05 | 国际商业机器公司 | 刀片服务器系统中的虚拟机管理器和虚拟机处理方法 |
US9442540B2 (en) * | 2009-08-28 | 2016-09-13 | Advanced Green Computing Machines-Ip, Limited | High density multi node computer with integrated shared resources |
CN102478898A (zh) * | 2010-11-30 | 2012-05-30 | 英业达股份有限公司 | 服务器整合系统 |
CN102479142A (zh) * | 2010-11-30 | 2012-05-30 | 英业达股份有限公司 | 一种机架服务器系统及其监控方法 |
CN102478905B (zh) * | 2010-11-30 | 2014-06-11 | 英业达股份有限公司 | 数据中心 |
CN102043456A (zh) * | 2010-12-10 | 2011-05-04 | 曙光信息产业(北京)有限公司 | 刀片服务器的电源调配方法 |
TW201312334A (zh) | 2011-09-05 | 2013-03-16 | Acer Inc | 電子系統與效能控制方法 |
TWI590065B (zh) | 2011-09-05 | 2017-07-01 | 宏碁股份有限公司 | 電子系統與電源管理方法 |
CN102999150B (zh) * | 2011-09-14 | 2016-02-03 | 宏碁股份有限公司 | 电子系统与效能控制方法 |
CN102999149A (zh) * | 2011-09-14 | 2013-03-27 | 宏碁股份有限公司 | 电子系统与电源管理方法 |
CN103139000A (zh) | 2011-11-28 | 2013-06-05 | 英业达科技有限公司 | 多个机架系统的监控方法 |
CN102692988A (zh) * | 2012-05-15 | 2012-09-26 | 浪潮电子信息产业股份有限公司 | 一种刀片服务器上的用电方法 |
CN103034320B (zh) * | 2012-12-21 | 2016-02-03 | 加弘科技咨询(上海)有限公司 | 服务器机柜的集中式电源模块的控制装置及控制方法 |
CN104007805A (zh) * | 2013-02-22 | 2014-08-27 | 中兴通讯股份有限公司 | 实现移动终端节电的方法及装置及移动终端 |
CN104656871A (zh) * | 2013-11-21 | 2015-05-27 | 华为终端有限公司 | 降低电子设备功耗的方法及电子设备 |
CN104008019A (zh) * | 2014-06-13 | 2014-08-27 | 浪潮集团有限公司 | 一种实现刀片服务器中服务器电源功率自动分配的方法 |
CN104142880A (zh) * | 2014-08-04 | 2014-11-12 | 浪潮电子信息产业股份有限公司 | 一种刀片服务器的简便功耗评估方法 |
KR102210770B1 (ko) * | 2014-09-02 | 2021-02-02 | 삼성전자주식회사 | 반도체 장치, 반도체 시스템 및 그 제어 방법 |
CN105700657A (zh) * | 2014-11-26 | 2016-06-22 | 中兴通讯股份有限公司 | 一种机框电源的管理方法、装置及机框系统 |
CN104777890A (zh) * | 2015-04-02 | 2015-07-15 | 浪潮电子信息产业股份有限公司 | 一种多路服务器的功耗管理系统 |
CN106445001B (zh) * | 2015-08-08 | 2019-07-23 | 昆达电脑科技(昆山)有限公司 | 运行状态信息共享的服务器系统 |
CN105262613A (zh) * | 2015-09-07 | 2016-01-20 | 北京星网锐捷网络技术有限公司 | 一种动态功率管理方法及装置 |
CN105468122A (zh) * | 2015-11-13 | 2016-04-06 | 浪潮(北京)电子信息产业有限公司 | 节点错峰开机的方法及装置、整机柜服务器 |
CN105929923B (zh) * | 2016-04-25 | 2018-12-07 | 浙江大华技术股份有限公司 | 一种电源功率的管理方法及装置 |
CN108279761B (zh) * | 2018-01-22 | 2020-06-16 | 苏州浪潮智能科技有限公司 | 一种支持风扇热插拔的服务器电源电路及控制方法 |
CN109753138B (zh) * | 2018-12-14 | 2021-10-08 | 新华三技术有限公司 | 功耗管理方法、装置、电子设备及计算机可读存储介质 |
CN109800082B (zh) * | 2018-12-18 | 2022-09-02 | 平安科技(深圳)有限公司 | 结合实际功耗采购服务器的方法、装置及存储介质 |
CN112230755A (zh) * | 2020-09-30 | 2021-01-15 | 新华三云计算技术有限公司 | 一种电源管理方法、装置、设备及机器可读存储介质 |
CN113325940A (zh) * | 2021-05-31 | 2021-08-31 | 山东英信计算机技术有限公司 | 智能设备的功耗管控方法、系统、终端及存储介质 |
CN113805963A (zh) * | 2021-09-07 | 2021-12-17 | 北京中电兴发科技有限公司 | 一种适用于小功率电源的多节点刀片服务器分步上电方法 |
CN114443522B (zh) * | 2021-12-31 | 2023-08-11 | 苏州浪潮智能科技有限公司 | 一种硬盘背板装置及服务器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1987734A (zh) * | 2006-11-28 | 2007-06-27 | 曙光信息产业(北京)有限公司 | 一种刀片式服务器系统初始状态的顺序上下电系统和方法 |
CN101021742A (zh) * | 2005-12-19 | 2007-08-22 | 国际商业机器公司 | 用于刀片系统的节流管理的方法和系统 |
-
2007
- 2007-11-20 CN CN2007101873518A patent/CN101441506B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021742A (zh) * | 2005-12-19 | 2007-08-22 | 国际商业机器公司 | 用于刀片系统的节流管理的方法和系统 |
CN1987734A (zh) * | 2006-11-28 | 2007-06-27 | 曙光信息产业(北京)有限公司 | 一种刀片式服务器系统初始状态的顺序上下电系统和方法 |
Non-Patent Citations (1)
Title |
---|
JP特开2005-202506A 2005.07.28 |
Also Published As
Publication number | Publication date |
---|---|
CN101441506A (zh) | 2009-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101441506B (zh) | 一种刀片服务器系统及其功耗管理方法 | |
CN1969248B (zh) | 用于管理服务器的功耗的方法和装置 | |
US8812890B2 (en) | Controlling power sequence in a blade center environment | |
DE102007048505B4 (de) | Server, konfiguriert zum Verwalten von Leistung und Betriebsverhalten | |
DE102007021258B4 (de) | Leistungszuweisungsmanagement in einem Informationsverarbeitungssystem | |
CN102290854B (zh) | 一种对冗余电源模块进行状态控制的方法和装置 | |
US8332673B2 (en) | System and method to manage power consumption | |
US7512824B2 (en) | System and method for managing power consumption in a computer system having a redundant power supply | |
US20090187776A1 (en) | Server power consumption controller, and method and computer program for controlling server power consumption | |
US20200150733A1 (en) | Mass storage device electrical power consumption monitoring | |
CN105929923B (zh) | 一种电源功率的管理方法及装置 | |
CN101689070A (zh) | 为了高效率操作的动态转换器控制 | |
CN101154096A (zh) | 信息处理系统中电能管理的装置与方法 | |
US20080028238A1 (en) | Selective power-on of hard disk drives within and across multiple drive enclosures and power supply domains | |
CN105247759A (zh) | 用于配置ups输出插座的系统和方法 | |
JP6663970B2 (ja) | システム電源管理方法及び計算機システム | |
CN106850286A (zh) | 单板上的基板管理控制器及网元管理盘的基板管理控制器 | |
CN101593082A (zh) | 一种管理存储设备电源电路的装置、方法和计算机 | |
US10216212B1 (en) | Operating temperature-based mass storage device management | |
CN109753138A (zh) | 功耗管理方法、装置、电子设备及计算机可读存储介质 | |
CN110362180A (zh) | 一种服务器电源寿命均衡控制装置及方法 | |
CN109917900A (zh) | 系统电源管理方法及计算机系统 | |
CN105488616A (zh) | 一种更换抽屉式配电柜后的数据记录方法和装置 | |
CN113325940A (zh) | 智能设备的功耗管控方法、系统、终端及存储介质 | |
CN114610562A (zh) | 服务器功耗管控方法、系统、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110511 Termination date: 20171120 |