CN101599840A - 一种大规模集群中服务器分时上电的方法 - Google Patents

一种大规模集群中服务器分时上电的方法 Download PDF

Info

Publication number
CN101599840A
CN101599840A CNA2009100168020A CN200910016802A CN101599840A CN 101599840 A CN101599840 A CN 101599840A CN A2009100168020 A CNA2009100168020 A CN A2009100168020A CN 200910016802 A CN200910016802 A CN 200910016802A CN 101599840 A CN101599840 A CN 101599840A
Authority
CN
China
Prior art keywords
server
power
time
cluster
control end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2009100168020A
Other languages
English (en)
Inventor
魏健
邸双朋
李刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Langchao Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Langchao Electronic Information Industry Co Ltd filed Critical Langchao Electronic Information Industry Co Ltd
Priority to CNA2009100168020A priority Critical patent/CN101599840A/zh
Publication of CN101599840A publication Critical patent/CN101599840A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提供了一种适应大规模集群中服务器分时上电的方法,这种方法是一种纯软件方式的方法,有别于软硬结合的电源管理的方法。该方法通过在控制端对集群中需要管理的服务器设置电源总功率、额定功率、启动间隔时间等参数,利用智能的调度策略,在恰当的时间向各服务器发出网络启动的命令,实现服务器的分时启动。通过该方法在集群管理中,对服务器进行分时上电,避免服务器同时开机出现的浪涌,使电源能力不足,同时降低功耗、节约能源。该方法实现简单,成本低。

Description

一种大规模集群中服务器分时上电的方法
技术领域
本发明涉及计算机领域,具体涉及一种集群中服务器管理的技术,尤其涉及一种服务器分时上电的方法。
背景技术
随着集群应用的推广,集群的管理越来越重要,对服务器电源的管理尤其重要,它不但关系到服务器能否正常运行,严重时还会损坏服务器,造成安全隐患。服务器在开机的瞬间会产生很大的浪涌电流,通常为服务器额定电流的2、3倍,虽然该电流的持续时间极短,但是如果多台服务器在同一时刻同时启动,则会产生巨大的电流,容易造成服务器元器件的损坏,甚至烧毁供电设备。服务器的使用寿命也会因此受到影响。目前电源防止大的浪涌电流的技术已经比较成熟,在电源的设计里面有很多电路是防止浪涌电流的,而且智能的PDU提供远程的对用电情况的管理和监控,但是它成本高,造价较大。目前在集群中大部分的使用的仍然是普通的PDU,在不改变现有硬件设备的情况下,如果能提供一种纯软件方式的方法,对服务器实现智能的分时上电管理,将能节约投资成本,提高集群的管理水平,增加服务器的使用寿命。而且软件的方法在定制化方面更加灵活,能在界面,服务器节点排序,定制分时时间,分时策略方面能满足管理员的特殊需求。
发明内容
本发明的一种大规模集群中服务器分时上电的方法是按以下方式实现的。
该方法通过在控制端对集群中需要管理的服务器设置电源的总功率、每种型号服务器的额定功率、以及服务器启动时间,启动间隔时间。利用智能的调度策略,在恰当的时间向各服务器发出网络启动的命令,实现服务器的分时上电。
其中智能的调度策略,会自动对所要启动的服务器进行分组,然后发送启动命令。假设要上电的服务器数量是N,N大于1,此调度策略利用电源额定总功率W1减去正在运行服务器的额定功率之和∑W,计算出能够提供的额定输出功率W2,然后除以经验值3,把得到的结果W3作为额定功率,看能够满足几台服务器的运行,假设能够满足M台服务器的运行,然后在控制端发送M台机器的启动命令,这M个启动命令默认间隔时间是30毫秒,然后按照设定的时间间隔再发送M台机器的启动命令,直到N台服务器的启动指令都发送完毕。
本发明的方法要求能够支持网络启动的服务器,其网卡和主板都要支持网络启动,目前大部分的网卡和主板都支持。网络启动时需要服务器的网卡的MAC地址。
该发明中需要网络启动的服务器的MAC地址是通过ARP解析自动获取的。在控制端已知所有被管理服务器的IP地址,通过arp解析命令获得所有被管理服务器的MAC地址保存到数据库,供其他程序使用。
本发明通过智能的调度策略在控制端对需要启动的服务器实现自动分时上电,本发明的有益效果是:能节约硬件投资成本,提高集群的管理水平,增加服务器的使用寿命,而且基于控制端的管理方式能方便管理员的远程管理。这种方法适用范围广,无论硬件方面采用何种电源管理方式,采用此方法都能简单灵活的实现服务器的分时上电。
具体实施方式
为了使本发明的目的、技术方案和优点更加清晰,对本发明作以下详细说明。
此实施实例是浪潮的天梭管理监控软件,在实施实例中采用jsp和java语言实现,jsp实现界面显示部分,java实现具体功能部分。
用jsp编写机柜管理页面,如图1所示,在机柜管理中可以查看现有机柜详细信息,新建机柜和删除机柜。例如图1的机柜管理界面中,可以查看到机柜“cabinet1”、“cabinet2”的电源能够支持的总额定功率。这个总额定功率在“新建机柜”时输入,记作W1,由后台java程序保存到数据库中,供其他程序使用。
由于每个服务器在集群中可以看作一个节点,所以服务器的基本信息,可以称为节点的基本信息。用jsp编写的节点管理页面如图2所示。在节点管理中,可以参看、修改节点的基本信息,对节点进行IP配置等。在图2中,选中节点“node11”,出现节点node11的管理页面,在节点node11的基本信息中可以查看到节点node11的“机器类型”和“额定功率”,在“节点node11的IP配置”中可以查看node11的现有IP地址和MAC,同样可以添加其他的网络接口或者IP等操作。其中额定功率记作W+节点名,例如Wnodell。这些信息是在“新建节点”时输入的,然后由后台java程序保存到数据库中,现有MAC地址是通过在控制端对IP的ARP解析获得的,保存到后台数据库,供其他程序使用。同样可以查看node12、node13等其他节点的信息。
用jsp编写的服务器启动/关闭管理界面如例图3所示。在该页面中能够实现单台/多台服务器的启动关闭,其中包括多台服务器的分时上电的功能。首先选择需要启动的服务器节点,在左侧树图中关闭状态的节点均显示成X,选中要启动的“node12”、“node13”、“node14”、“node16”;其次设定启动间隔时间,在例图3中选定“设定启动间隔时间”,输入1,代表1S,其最小单位是0.1S;最后是node12、node13、node14、node16的启动,在例图3中,点击“启动”,交给后台java程序,实现node12、node13、node14、node16的分时上电。后台java程序按照智能调度策略的算法,首先获得机柜cabinet1的总额定功率W1,在此实施例中W1=8000w,然后获得正在运行服务器的额定功率之和∑W,此实施例中正在运行的服务器是node11,其额定功率是480w,因此∑W=480w,因此机柜还能提供的额定输出功率W2=W1-∑W=8000w-480w=7520w,W2除以经验值3,得到W3=2506w,判断W3能否满足node12、node13、node14、node16启动需要的额定功率。因为此实施例中机器类型都是NF190D,单台服务器的额定功率都是480w,W3能够支持5台NF190D的同时启动。因此,W3显然能够满足node12、node13、node14、node16启动需要的额定功率,后台程序依次对node12、node13、node14、node16发送网络启动的命令,这些命令默认间隔30ms发送。假设在左侧树图中,选中要启动的节点是“node12”至“node17”;那么上述情况则有所不同。W3仍然不变,但是node12至node17是6个节点,启动需要的额定功率是2880w,W3只能满足5个节点,因此网络启动命令将分为2组发送,第一组是node12至node16,共5个节点,依次间隔30ms发送,费时120ms,然后间隔1S后,发送第二组node17的网络启动命令。命令发送成功后,页面上会显示启动命令发送成功的提示,当各节点启动后,其状态由红色X自动更新到如node11的状态。
由本发明的技术方案可见,本发明不但对服务器实现了智能的分时上电管理,能节约投资成本,提高集群的管理水平,增加服务器的使用寿命。而且能在用户界面,服务器节点排序,定制分时时间,分时策略方面满足管理员的特殊需求,从而使集群管理员为个人和组织提供更加灵活的服务。

Claims (4)

1、一种大规模集群中服务器分时上电的方法,其特征在于该方法是通过在控制端对集群中需要管理的服务器设置电源总功率、额定功率、启动间隔时间参数,利用智能调度策略,适时向各服务器发出网络启动命令,实现服务器的分时启动;步骤如下:
2、根据权利要求1所描述的方法,其特征在于,根据集群中各种型号服务器的额定功率以及启动间隔时间累计设定电源的总功率,其中启动间隔时间包括自定义或按照默认的间隔时间执行。
3、根据权利要求1所描述的方法,其特征在于,智能调度策略是:设定上电的服务器数量是N,N大于1,电源额定总功率W1减去正在运行服务器的额定功率之和∑W,计算出能够提供的额定输出功率W2,然后除以经验值3,把得到的结果W3作为额定功率,额定功率能够满足M台服务器的运行,然后在控制端发送M台机器的启动命令,这M个启动命令默认间隔时间是30毫秒,然后按照设定的时间间隔再发送相同数量的M台服务器的启动命令,直到N台服务器的启动指令都发送完毕。
4、根据权利要求1所描述的方法,其特征在于,使用该方法的服务器都支持网络启动,控制端发送的启动命令的目标是与控制端相连的服务器网卡的MAC地址。
CNA2009100168020A 2009-07-07 2009-07-07 一种大规模集群中服务器分时上电的方法 Pending CN101599840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2009100168020A CN101599840A (zh) 2009-07-07 2009-07-07 一种大规模集群中服务器分时上电的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2009100168020A CN101599840A (zh) 2009-07-07 2009-07-07 一种大规模集群中服务器分时上电的方法

Publications (1)

Publication Number Publication Date
CN101599840A true CN101599840A (zh) 2009-12-09

Family

ID=41421107

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2009100168020A Pending CN101599840A (zh) 2009-07-07 2009-07-07 一种大规模集群中服务器分时上电的方法

Country Status (1)

Country Link
CN (1) CN101599840A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101772140A (zh) * 2009-12-25 2010-07-07 中兴通讯股份有限公司 一种自适应节能方法及具备该功能的业务系统
CN102478944A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 一种用于向多台服务器提供电源的供电方法
CN102480359A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 一种用于向多台服务器提供电源的供电方法
WO2012163026A1 (zh) * 2011-10-27 2012-12-06 华为技术有限公司 一种服务器上电的方法、装置及系统
CN103078950A (zh) * 2013-01-18 2013-05-01 浪潮电子信息产业股份有限公司 一种云环境下提高集群物理机开机速度的方法
CN104598568A (zh) * 2015-01-12 2015-05-06 浪潮电子信息产业股份有限公司 一种高效、低功耗的离线存储系统及方法
CN109361524A (zh) * 2018-09-27 2019-02-19 淮南智涵信息科技有限公司 渲染行业自适应开关机节能技术
CN110399028A (zh) * 2019-06-28 2019-11-01 苏州浪潮智能科技有限公司 一种电源批量操作时防止电涌发生的方法、设备以及介质
CN111488049A (zh) * 2020-03-20 2020-08-04 苏州浪潮智能科技有限公司 一种服务器机柜供电系统及控制方法
CN111949106A (zh) * 2020-08-06 2020-11-17 深圳市国鑫恒运信息安全有限公司 一种x86机架式服务器及其错峰上电的控制方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101772140A (zh) * 2009-12-25 2010-07-07 中兴通讯股份有限公司 一种自适应节能方法及具备该功能的业务系统
CN102478944B (zh) * 2010-11-30 2014-07-23 英业达股份有限公司 一种用于向多台服务器提供电源的供电方法
CN102478944A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 一种用于向多台服务器提供电源的供电方法
CN102480359A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 一种用于向多台服务器提供电源的供电方法
WO2012163026A1 (zh) * 2011-10-27 2012-12-06 华为技术有限公司 一种服务器上电的方法、装置及系统
CN103444129A (zh) * 2011-10-27 2013-12-11 华为技术有限公司 一种服务器上电的方法、装置及系统
CN103078950A (zh) * 2013-01-18 2013-05-01 浪潮电子信息产业股份有限公司 一种云环境下提高集群物理机开机速度的方法
CN104598568A (zh) * 2015-01-12 2015-05-06 浪潮电子信息产业股份有限公司 一种高效、低功耗的离线存储系统及方法
CN109361524A (zh) * 2018-09-27 2019-02-19 淮南智涵信息科技有限公司 渲染行业自适应开关机节能技术
CN110399028A (zh) * 2019-06-28 2019-11-01 苏州浪潮智能科技有限公司 一种电源批量操作时防止电涌发生的方法、设备以及介质
CN111488049A (zh) * 2020-03-20 2020-08-04 苏州浪潮智能科技有限公司 一种服务器机柜供电系统及控制方法
CN111949106A (zh) * 2020-08-06 2020-11-17 深圳市国鑫恒运信息安全有限公司 一种x86机架式服务器及其错峰上电的控制方法
CN111949106B (zh) * 2020-08-06 2022-07-01 深圳市国鑫恒运信息安全有限公司 一种x86机架式服务器及其错峰上电的控制方法

Similar Documents

Publication Publication Date Title
CN101599840A (zh) 一种大规模集群中服务器分时上电的方法
CN104239132B (zh) 一种唤醒对齐的方法、装置及终端
CN107172205B (zh) 推送信息处理方法、移动终端及计算机存储介质
CN110502340A (zh) 一种资源动态调整方法、装置、设备及存储介质
CN107991892A (zh) 控制设备的方法、装置和系统
CN111988409B (zh) 一种实现云手机挂载外部存储启动的方法及系统
CN108540568A (zh) 计算能力共享方法及智能设备
CN101930375A (zh) 单用户光网络单元中内存空间自适应的程序数据升级方法
CN108322437A (zh) 用于多规约设备之间的自适应通讯方法和装置
CN105893087A (zh) 一种应用程序启动的方法以及装置
CN103049064B (zh) 计算终端的开机方法、系统及计算终端
CN103905652A (zh) 电源管理方法及电子设备
CN106067886A (zh) 安全策略更新方法及系统
CN109491485A (zh) 一种用于高性能服务器加速卡错峰上电的系统和方法
Van Heddeghem et al. Energy in ICT-Trends and research directions
CN116546242A (zh) 一种直播播控方法、装置、计算机设备和存储介质
CN100568178C (zh) 一种控件添加方法
CN106293730A (zh) 一种锁屏时间的确定方法及终端
CN105828421A (zh) 一种终端及终端省电的方法
CN110689175A (zh) 混沌多重宇宙的分布式绿色云数据中心能耗优化方法
CN109765986A (zh) 省电模式控制方法、终端设备及计算机可读存储介质
CN101169781B (zh) 幻灯片播放系统及方法
CN211350064U (zh) 显示装置和显示系统
CN103731501A (zh) 基于移动终端的多人协同管理待办事项的方法和系统
CN106254346A (zh) 安全策略更新方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091209