CN101847044A - 一种适用于千万亿次计算机机群的低功耗管理方法 - Google Patents

一种适用于千万亿次计算机机群的低功耗管理方法 Download PDF

Info

Publication number
CN101847044A
CN101847044A CN 201010130934 CN201010130934A CN101847044A CN 101847044 A CN101847044 A CN 101847044A CN 201010130934 CN201010130934 CN 201010130934 CN 201010130934 A CN201010130934 A CN 201010130934A CN 101847044 A CN101847044 A CN 101847044A
Authority
CN
China
Prior art keywords
node
task
server
power consumption
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010130934
Other languages
English (en)
Other versions
CN101847044B (zh
Inventor
彭绯
陈杰
刘轶
钱德沛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN2010101309349A priority Critical patent/CN101847044B/zh
Publication of CN101847044A publication Critical patent/CN101847044A/zh
Application granted granted Critical
Publication of CN101847044B publication Critical patent/CN101847044B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)

Abstract

本发明公开了一种适用于千万亿次计算机机群的低功耗管理方法,该方法仅针对千万亿次计算机机群处于运行状态和休眠状态的模式进行分析。假设任意节点在运行状态的功率为Pw,休眠状态功率为Ps,由休眠状态转入运行状态需耗能记为β。对每一个节点赋一个节能尺度记为
Figure 201010130934.9_AB_0
,在此尺度下,每一个节点每次的休眠时长tr都与前一次运行时长tw存在的休眠关系为
Figure 201010130934.9_AB_1
。待休眠时间到达,该节点向服务器发出一个可接近任务的信息,服务器收到该信息后,将此节点加入可接受任务的节点集N={n1,n2,……,nj}中。本发明方法通过节点自身的休眠时间定制来实现各个节点的低功耗,设计系统级上有效降低千万亿高效能计算机运行能耗的策略和方法,在保证千万亿次计算机运行效率的前提下,实现尽可能降低运行时能耗的目的。

Description

一种适用于千万亿次计算机机群的低功耗管理方法
技术领域
本发明涉及一种对局域网中各节点能耗管理,更特别地说,是指一种适用于千万亿次计算机对机群的低功耗管理方法。
背景技术
随着高性能计算的发展,器件功耗逐渐增加,在高密度计算的环境下,热设计的难度越来越高,功耗带来的超级计算机或数据中心的运行成本日益高涨。很多大型机在设计过程中已经把如何有效控制系统功耗作为一个设计原则。
功耗控制是千万高效能计算机设计中需要考虑的重要因素。
机群系统的运行功耗在整个运行成本中站有相当比重,即使通过优化设计将峰值功耗控制在较低水平上,其产生的费用也是相当惊人的;另一方面,对于千万亿次计算机这种大规模系统来说,其满负荷运行的时间在整个运行时间中所占比例并不高,换句话说,相当多的节点在很多时间处于空闲状态。因此,在不影响性能的前提下,有效地降低系统运行时的功耗,是非常重要的。
由于在高性能计算中,对于每一个任务,不能准确估计其在某一个节点上的执行时间长度,并且任务的到来只能通过统计方法给出一个大致分布,所以对于节点的空闲时间与时刻不能进行有效估计。
发明内容
本发明的目的是提出一种适用于千万亿次计算机机群的低功耗管理方法,该方法通过节点自身的休眠时间定制来实现各个节点的低功耗。在分析现有的低功耗管理/控制的方法和策略的基础上,设计系统级上有效降低千万亿高效能计算机运行能耗的策略和方法。在此基础上进行代码的开发实现,为高效能计算机系统软件的其他模块提供功耗管理/控制接口,在保证千万亿次计算机运行效率的前提下,实现尽可能降低运行时能耗的目的。
本发明机群的低功耗管理方法执行下列步骤:
步骤一:开机后,通过服务器向各节点发出节能尺度,所有节点归入可接受任务集N={n1,n2,……,nj},可接受任务集N均可接受服务器发送的任务;
n表示可接受任务的节点;
j表示可接受任务节点的个数;
步骤二:服务器将任务队列A={a1,a2,……,ak}中的任务按照到达顺序分配给N中的节点,并从N中剔除该节点;
若任务队列A中没有任务可供分配,则不进行分配,直至任务到达;
a表示任务队列中的任务;
k表示任务队列中的任务个数;
步骤三:分配有任务的节点对接收到的任务进行执行,并将执行完成的结束时刻通知服务器,并根据休眠关系
Figure GSA00000060926800021
进行休眠;
步骤四:待休眠时间到达,该节点向服务器发出一个可接近任务的信息,服务器收到该信息后,将此节点加入可接受任务的节点集N={n1,n2,……,nj}中。
本发明低功耗管理方法具有如下优点:
(1)本发明通过改变传统的以服务器为主导的设计方案,将必要的休眠时间交由节点支配;休眠期间服务器不得向节点分配任务。因此该方法也是一种以节点节能为衡量指标的方法。
(2)本发明所采用的方法不需要对任务的分布有所了解,也不需要知道任务的执行时间。方便管理与计算,同时省去服务器用于统计及分析的时间与能量消耗。
附图说明
图1是机群系统结构示意图。
图2A是有无管控机群在不同任务密度下的总执行时间对比。
图2B是有无管控机群在不同任务密度下的消耗能量对比。
图3A是有无管控机群在不同节点数量下的总运行时间对比。
图3B是有无管控机群在不同节点数量下的消耗能量对比。
具体实施方式
下面将结合附图和实施例对本发明做进一步的详细说明。
在适用于千万亿次计算机机群中出于节能目的,不能将节点始终保持在运行状态;又由于节点由低能耗状态转入运行状态需要消耗一定的能量,导致没有目的的休眠节点往往会产生更高的能耗。
于是,欲达到节能目的,节点进入休眠状态后,即要保持一定时间,再进行唤醒。
本发明仅针对千万亿次计算机机群处于运行状态和休眠状态的模式进行分析。
假设任意节点(任意一个千万亿次计算机)在运行状态的功率为Pw,休眠状态功率为Ps,由休眠状态转入运行状态需耗能记为β。
对每一个节点赋一个节能尺度记为
Figure GSA00000060926800031
在此尺度下,每一个节点每次的休眠时长tr都与前一次运行时长tw存在的休眠关系为
Figure GSA00000060926800032
Figure GSA00000060926800033
本发明机群的低功耗管理方法执行下列步骤:
步骤一:开机后,通过服务器向各节点发出节能尺度
Figure GSA00000060926800034
所有节点归入可接受任务集N={n1,n2,……,nj},可接受任务集N均可接受服务器发送的任务;
n表示可接受任务的节点;
j表示可接受任务节点的个数;
步骤二:服务器将任务队列A={a1,a2,……,ak}中的任务按照到达顺序分配给N中的节点,并从N中剔除该节点;
若任务队列A中没有任务可供分配,则不进行分配,直至任务到达;
a表示任务队列中的任务;
k表示任务队列中的任务个数;
步骤三:分配有任务的节点对接收到的任务进行执行,并将执行完成的结束时刻通知服务器,并根据休眠关系
Figure GSA00000060926800035
进行休眠;
步骤四:待休眠时间到达,该节点向服务器发出一个可接近任务的信息,服务器收到该信息后,将此节点加入可接受任务的节点集N={n1,n2,……,nj}中。
在不同任务密度下的千万亿次计算机机群系统的低功耗管理测试:
参见图2A、图2B所示,该图为机群的节点数量设为128个,参加测试的任务量为1000个。图中分别对比了,任务密度为1、10、100、1000、10000等五个档次的环境中,执行任务需要花费的总时间和总消耗能量。此处的任务密度指的是任务平均执行时间与每两个任务到达时间差的比例。
整个测试系统在IBM HS21刀片服务器上进行搭建,测试过程中使用威格电子GDW1200C型功率仪对整个系统的能耗进行测量。测试系统内的所有刀片上采用Red Hat Enterprise Linux 5.0操作系统,并将内核升级至2.6.30版本。
表1 任务密度不同的机群系统执行时间及消耗能量对比
注:无管控是指未运行本发明低功耗策略的千万亿次计算机构成的机群。
使用管控是指运行本发明低功耗策略的千万亿次计算机构成的机群。
如图2A、图2B及表1中所示,当任务密度在100以下时(此密度可以更高),使用管控机群执行时间与无管控机群执行时间相同。而消耗能量方面,使用管控机群能耗比例随着任务密度增加而增加,当任务密度为1时,使用管控机群消耗能量为无管控机群的20%;但是,当任务密度大于100时,使用管控机群的任务执行时间有了非常大的损失。这是因为,任务密度过大时,空闲时间则相应过短,运行本发明低功耗管理策略的节点仍然转入休眠状态,从而延长了整个机群系统的总执行时间。
在不同节点数量下的千万亿次计算机机群系统的低功耗管理测试:
参见图3A、图3B所示,固定任务数量为1000个,任务密度为100。图中分别对比了,机群节点数量为16、32、64、128、256等五个档次的环境中机群执行任务需要花费的总时间和总消耗能量。
整个测试系统在IBM HS21刀片服务器上进行搭建,测试过程中使用威格电子GDW1200C型功率仪对整个系统的能耗进行测量。测试系统内的所有刀片上采用Red Hat Enterprise Linux 5.0操作系统,并将内核升级至2.6.30版本。
表2节点规模不同的机群系统的执行时间及消耗能量对比
Figure GSA00000060926800042
注:无管控是指未运行本发明低功耗策略的千万亿次计算机构成的机群。
使用管控是指运行本发明低功耗策略的千万亿次计算机构成的机群。
如图3A、图3B及表2中所示,使用管控机群任务执行时间及消耗能量比例随着节点规模的增加而减少。其中,消耗能量始终小于无管控机群消耗的能量。而执行时间,在机群规模小于64时,有明显延长。这是因为,节点数量少,而任务数量固定,则由本发明策略决定的休眠次数增加,从而使服务器任务队列中的任务长时间等待分配。

Claims (2)

1.一种适用于千万亿次计算机机群的低功耗管理方法,其特征在于低功耗管理执行下列步骤:
步骤一:开机后,通过服务器向各节点发出节能尺度
Figure FSA00000060926700011
所有节点归入可接受任务集N={n1,n2,……,nj},可接受任务集N均可接受服务器发送的任务;
n表示可接受任务的节点;
j表示可接受任务节点的个数;
步骤二:服务器将任务队列A={a1,a2,……,ak}中的任务按照到达顺序分配给N中的节点,并从N中剔除该节点;
若任务队列A中没有任务可供分配,则不进行分配,直至任务到达;
a表示任务队列中的任务;
k表示任务队列中的任务个数;
步骤三:分配有任务的节点对接收到的任务进行执行,并将执行完成的结束时刻通知服务器,并根据休眠关系
Figure FSA00000060926700012
进行休眠;
步骤四:待休眠时间到达,该节点向服务器发出一个可接近任务的信息,服务器收到该信息后,将此节点加入可接受任务的节点集N={n1,n2,……,nj}中。
2.根据权利要求1所述的适用于千万亿次计算机机群的低功耗管理方法,其特征在于:仅针对千万亿次计算机机群处于运行状态和休眠状态的模式进行分析。
CN2010101309349A 2010-03-22 2010-03-22 一种适用于千万亿次计算机机群的低功耗管理方法 Expired - Fee Related CN101847044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101309349A CN101847044B (zh) 2010-03-22 2010-03-22 一种适用于千万亿次计算机机群的低功耗管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101309349A CN101847044B (zh) 2010-03-22 2010-03-22 一种适用于千万亿次计算机机群的低功耗管理方法

Publications (2)

Publication Number Publication Date
CN101847044A true CN101847044A (zh) 2010-09-29
CN101847044B CN101847044B (zh) 2012-05-30

Family

ID=42771678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101309349A Expired - Fee Related CN101847044B (zh) 2010-03-22 2010-03-22 一种适用于千万亿次计算机机群的低功耗管理方法

Country Status (1)

Country Link
CN (1) CN101847044B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102749987A (zh) * 2012-06-20 2012-10-24 武汉理工大学 计算机同构集群系统高能效资源分配方法
CN107729150A (zh) * 2017-10-17 2018-02-23 山东衡昊信息技术有限公司 一种异构集群安监设备最小能耗节点的寻址方法
CN111741130A (zh) * 2020-07-31 2020-10-02 苏州交驰人工智能研究院有限公司 一种服务器管理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991254A (ja) * 1995-09-20 1997-04-04 Nec Corp 消費電力低減制御システム及びその方法
CN1595332A (zh) * 2003-09-08 2005-03-16 三星电子株式会社 计算机系统及其控制方法
US20090158074A1 (en) * 2007-12-12 2009-06-18 Electronics And Telecommunications Research Institute Cluster system with reduced power consumption and power management method thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991254A (ja) * 1995-09-20 1997-04-04 Nec Corp 消費電力低減制御システム及びその方法
CN1595332A (zh) * 2003-09-08 2005-03-16 三星电子株式会社 计算机系统及其控制方法
US20090158074A1 (en) * 2007-12-12 2009-06-18 Electronics And Telecommunications Research Institute Cluster system with reduced power consumption and power management method thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《小型微型计算机系统》 20080531 刘轶, 张昕, 李鹤, 钱德沛 多核处理器大规模并行系统中的任务分配问题及算法 972-975 1-2 第29卷, 第5期 2 *
《计算机研究与发展》 20100630 刘轶,张昕,李鹤,钱德沛 一种面向多核处理器并行系统的启发式任务分配算法 1058-1064 1-2 , 第6期 2 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102749987A (zh) * 2012-06-20 2012-10-24 武汉理工大学 计算机同构集群系统高能效资源分配方法
CN102749987B (zh) * 2012-06-20 2014-12-03 武汉理工大学 计算机同构集群系统高能效资源分配方法
CN107729150A (zh) * 2017-10-17 2018-02-23 山东衡昊信息技术有限公司 一种异构集群安监设备最小能耗节点的寻址方法
CN111741130A (zh) * 2020-07-31 2020-10-02 苏州交驰人工智能研究院有限公司 一种服务器管理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN101847044B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN101313284B (zh) 用于提供对处理器状态转换进行检测的方法和装置
Zhu et al. Adaptive energy-efficient scheduling for real-time tasks on DVS-enabled heterogeneous clusters
CA2741088C (en) Methods of achieving cognizant power management
Zhang et al. Cost efficient scheduling for delay-sensitive tasks in edge computing system
CN106844051A (zh) 一种边缘计算环境中功耗优化的负载任务迁移算法
CN103823545B (zh) 一种云计算系统的服务器唤醒方法
CN109324875A (zh) 一种基于强化学习的数据中心服务器功耗管理与优化方法
CN103076870B (zh) 数据中心中能耗驱动的应用融合调度和资源动态配置方法
CN102508714A (zh) 一种云计算中基于绿色计算的虚拟机调度方法
CN102929720A (zh) 一种节能作业调度系统
Li et al. Energy-efficient scheduling in nonpreemptive systems with real-time constraints
Wen et al. Energy-aware hierarchical scheduling of applications in large scale data centers
CN106445070B (zh) 一种硬实时系统资源受限偶发任务能耗优化调度方法
CN103944985A (zh) 一种异构云计算系统节能方法及任务调度方法
CN101847044B (zh) 一种适用于千万亿次计算机机群的低功耗管理方法
CN101794169A (zh) 基于改变控制模式进行机群系统能耗管控的方法
Tian et al. Modeling and analyzing power management policies in server farms using stochastic petri nets
CN103345296B (zh) 动态电压频率调整触发装置和方法
Terzopoulos et al. Performance evaluation of a real-time grid system using power-saving capable processors
CN106209390A (zh) 网络设备管理及节能方法及其资源管理装置、路由节能装置
CN111966208A (zh) 一种降低服务器功耗的方法及装置
Fan et al. GreenSleep: a multi-sleep modes based scheduling of servers for cloud data center
Li et al. An energy efficient resource management method in virtualized cloud environment
CN104182280B (zh) 面向混合主存嵌入式系统的低能耗rm实时任务调度方法
Huang et al. Dynamic allocation/reallocation of dark cores in many-core systems for improved system performance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530

Termination date: 20150322

EXPY Termination of patent right or utility model