CN102118407A - 一种降低集群作业系统运行功耗的方法、节点及系统 - Google Patents

一种降低集群作业系统运行功耗的方法、节点及系统 Download PDF

Info

Publication number
CN102118407A
CN102118407A CN2009102444453A CN200910244445A CN102118407A CN 102118407 A CN102118407 A CN 102118407A CN 2009102444453 A CN2009102444453 A CN 2009102444453A CN 200910244445 A CN200910244445 A CN 200910244445A CN 102118407 A CN102118407 A CN 102118407A
Authority
CN
China
Prior art keywords
computing node
node
low power
state
computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102444453A
Other languages
English (en)
Other versions
CN102118407B (zh
Inventor
邱同亮
杨琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN2009102444453A priority Critical patent/CN102118407B/zh
Publication of CN102118407A publication Critical patent/CN102118407A/zh
Application granted granted Critical
Publication of CN102118407B publication Critical patent/CN102118407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Power Sources (AREA)

Abstract

本发明提供了一种降低集群作业系统运行功耗的方法、节点及系统。本发明通过控制空闲的计算节点进入低功耗状态,同时管理节点记录各个计算节点的设备状态,并根据计算节点是否分配到作业,来决定是否唤醒该计算节点,从而可以在保证作业系统的正常运作的同时,节约集群作业系统的整体功耗。

Description

一种降低集群作业系统运行功耗的方法、节点及系统
技术领域
本发明涉及集群作业技术领域,具体涉及一种降低集群作业系统运行功耗的方法、节点及系统。
背景技术
随着现代社会发展,设备节能问题日益受到重视,相应地在高性能计算领域,如集群作业系统中,随着计算规模的扩大,在提升系统性能的同时,系统功耗问题逐渐为人们关注的重点问题之一,性能功耗比已经成为衡量系统运行效能的重要指标之一。
国内外的很多政府机构和厂商也一直致力于节能方面的技术和标准的推动,包括20世纪90年代提出的能源之星认证标准,到现在的绿色计算的概念等。涉及的具体技术包括处理器的电压调节、频率调节,外围设备的电源管理,休眠等,但针对高性能集群计算方面还没有完整的系统解决方案。
在电源管理方面,从硬件到软件,目前的技术对单台服务器已经提供了很多节能方面的支持,如处理器自动降频,关闭外设,休眠等技术手段。而在高性能集群作业系统中,一般认为系统处于繁忙状态,因此在系统运行中不考虑计算节点休眠,而保证集群运行的软件系统,如作业调度系统,也没有提供节能方面的支持。
发明内容
本发明实施例所要解决的技术问题是提供一种降低集群作业系统运行功耗的方法、节点及系统
为解决上述技术问题,本发明实施例提供方案如下:
一种降低集群作业系统运行功耗的方法,包括:
获取并记录所述集群作业系统中的计算节点的设备状态信息,其中,所述计算节点在满足预定的本地功耗策略时将进入低功耗状态并向所述管理节点汇报自身设备状态;
在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
唤醒所述处于低功耗状态的计算节点;
在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
优选地,上述方法中,还包括:
统计一段预定时间内所述集群作业系统中各个计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;
在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
优选地,上述方法中,还包括:
选择出所述概率大于第二门限的第二类计算节点;
在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类计算节点。
本发明实施例还提供了另一种降低集群作业系统运行功耗的方法,包括:
在第一计算节点满足预定的功耗策略时,控制所述第一计算节点进入低功耗状态,并将所述第一计算节点的当前设备状态通知给所述集群作业系统中的管理节点;
接收所述管理节点在向所述第一计算节点分配作业前发送的第一唤醒命令;
根据所述第一唤醒命令,唤醒所述第一计算节点;
在所述第一计算节点被唤醒进入工作状态后,将所述第一计算节点的当前设备状态通知给所述管理节点;
接收并执行所述管理节点在所述第一计算节点进入工作状态后分配给所述第一计算节点的作业。
优选地,上述方法中,还包括:
所述第一计算节点接收到所述管理节点向第一类计算节点发送的控制命令,所述第一类计算节点是在一段预定时间内分配到作业的概率小于第一门限的计算节点;
根据所述控制命令,控制所述第一计算节点进入低功耗状态。
优选地,上述方法中,还包括:
所述第一计算节点接收到所述管理节点向第二类计算节点发送的第二唤醒命令,所述第二类计算节点是在一段预定时间内分配到作业的概率大于第二门限的计算节点;
根据所述第二唤醒命令,唤醒所述第一计算节点。
本发明实施例还提供了又一种降低集群作业系统运行功耗的方法,包括:
所述集群作业系统中的计算节点在满足预定的功耗策略时,控制自身进入低功耗状态,并将自身当前的设备状态通知给所述集群作业系统中的管理节点;
所述管理节点获取并记录所述计算节点的设备状态信息;
所述管理节点在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
所述管理节点唤醒所述低功耗状态的计算节点;
所述管理节点在所述低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
优选地,上述方法中,还包括:
所述管理节点统计一段预定时间内各个所述计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;并在所述集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
优选地,上述方法中,还包括:
所述管理节点选择出所述概率大于第二门限的第二类计算节点;
所述管理节点在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类节点。
本发明实施例还提供了一种集群作业系统中的管理节点,包括:
状态获取单元,用于获取并记录所述集群作业系统中的计算节点的设备状态信息,其中,所述计算节点在满足预定的本地功耗策略时将进入低功耗状态;
节点选择单元,用于在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
第一唤醒单元,用于唤醒所述处于低功耗状态的计算节点;
作业分配单元,用于在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
优选地,上述管理节点中,还包括:
统计单元,用于统计一段预定时间内所述集群作业系统中各个计算节点分配到作业的概率;
第一选择单元,用于选择出所述概率小于第一门限的第一类计算节点;
状态控制单元,用于在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类节点进入低功耗状态。
优选地,上述管理节点中,还包括:
第二选择单元,用于选择出所述概率大于第二门限的第二类计算节点;
第二唤醒单元,用于在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类节点。
本发明实施例还提供了一种集群作业系统中的计算节点,包括:
第一状态控制单元,用于在满足预定的功耗策略时,控制本计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述集群作业系统中的管理节点;
第一接收单元,用于接收所述管理节点在向本计算节点分配作业前发送的第一唤醒命令;
第一唤醒单元,用于根据所述第一唤醒命令,唤醒本计算节点;
状态通知单元,用于在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点;
作业处理单元,用于接收并执行所述管理节点在本计算节点进入工作状态后分配的作业。
优选地,上述计算节点中,还包括:
第二接收单元,用于接收到所述管理节点向第一类计算节点发送的控制命令,所述第一类计算节点是在一段预定时间内分配到作业的概率小于第一门限的计算节点;
第二状态控制单元,用于根据所述控制命令,控制所述第一计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述管理节点。
优选地,上述计算节点中,还包括:
第三接收单元,用于接收到所述管理节点向第二类计算节点发送的第二唤醒命令,所述第二类计算节点是在一段预定时间内分配到作业的概率大于第二门限的计算节点;
第二唤醒单元,用于根据所述第二唤醒命令,唤醒所述第一计算节点。
本发明实施例还提供了一种集群作业系统,所述集群作业系统包括管理节点和多个计算节点,
所述计算节点,用于在满足预定的功耗策略时,控制自身进入低功耗状态,并将自身当前的设备状态通知给所述管理节点;接收并根据所述管理节点发送的第一唤醒命令,唤醒本计算节点,并在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点;以及接收并执行所述管理节点分配的作业;
所述管理节点,用于获取并记录所述计算节点的设备状态信息;在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点,并唤醒所述处于低功耗状态的计算节点;以及,在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
优选地,上述集群作业系统中,
所述管理节点,还用于统计一段预定时间内各个所述计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;并在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
优选地,上述集群作业系统中,
所述管理节点,还用于选择出所述概率大于第二门限的第二类计算节点;并在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类计算节点。
从以上所述可以看出,本发明实施例提供的降低集群作业系统运行功耗的方法、节点及系统,通过控制空闲的计算节点进入低功耗状态,同时管理节点记录各个计算节点的设备状态,并根据计算节点是否分配到作业,来决定是否唤醒该计算节点,从而可以在保证作业系统的正常运作的同时,节约集群作业系统的整体功耗。并且,本发明实施例还通过管理节点主动控制集群作业系统中的不常被分配到作业的计算节点进入低功耗状态,以更好地节约系统功耗;以及通过管理节点在分配作业之前,主动唤醒常被分配到作业的计算节点,提高了集群作业系统的作业执行效率。
附图说明
图1为本发明实施例1所述降低集群作业系统运行功耗的方法的流程图;
图2为本发明实施例1所述管理节点的结构示意图;
图3为本发明实施例2所述降低集群作业系统运行功耗的方法的流程图;
图4为本发明实施例2所述计算节点的结构示意图。
具体实施方式
本发明实施例的核心思想在于,集群作业系统的计算节点能够自行进入低功耗状态,集群作业系统的管理节点负责记录各个计算节点的设备状态,在需要某个计算节点进行作业、而该计算节点又处于低功耗状态时,管理节点通过网络唤醒该计算节点,从而既保证了作业系统的正常运作,又节约了系统的整体功耗。
本发明实施例所述集群作业系统,包括管理节点和多个计算节点。管理节点负责根据预先制定的作业调度策略,为计算节点分配作业。计算节点负责执行管理节点分配的作业。
本实施例中,设备状态包括工作状态、待机状态、休眠状态和睡眠状态,而低功耗状态具体包括待机状态、休眠状态和睡眠状态。计算节点在工作状态下可以正常接收并执行管理节点下发的作业。在低功耗状态下,计算节点通过停止对部分或全部部件供电,节约计算节点的设备功耗。
以下将结合附图,通过具体实施例对本发明作进一步的说明。
<实施例1>
请参照图1,本实施例所述降低集群作业系统运行功耗的方法,应用在集群作业系统中的管理节点上,具体包括以下步骤:
步骤11,管理节点获取并记录所述集群作业系统中的计算节点的设备状态信息,其中,所述计算节点在满足预定的本地功耗策略时将进入低功耗状态并向所述管理节点汇报自身设备状态。
为达到节约功耗的目的,本实施例中,计算节点可以根据本地的预定功耗策略,控制本计算节点的设备状态,例如,在集群作业系统不繁忙时,如果本计算节点在经过一段预定超时时间后仍没有接收到作业,此时将控制本计算节点进入低功耗状态。
具体的,计算节点的低功耗状态控制可以通过计算节点的操作系统实现。例如,以目前集群中应用最为广泛的Linux操作系统为例,待机、休眠和睡眠控制技术已经相对成熟稳定。可以通过三种方式实现,包括:内核集成的软件挂起(swsusp,Software Suspend)、TuxOnIce和用户空间软件挂起(uswsusp,userspace software suspend)方式。当然,计算节点的低功耗状态控制也可以通过第三方软件或其它现有技术实现。
本实施例中,集群作业系统开机后,所有计算节点上通过其上安装的作业系统客户端,向管理节点上安装的作业系统服务器端报告本计算节点当前的设备状态。而对于未启动或故障的计算节点,作业系统服务端在经过一段等待时间后,将该节点标记为失效(down)状态,作业系统服务器端记录所有计算节点的当前设备状态。
步骤12,管理节点在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点。
这里,在有作业任务时,管理节点通过作业系统服务器端进行作业分配,确定执行该作业的计算节点集合,并分析出该计算节点集合中是否存在处于低功耗状态的计算节点。
步骤13,管理节点通过网络向所述处于低功耗状态的计算节点发送第一唤醒命令,唤醒所述处于低功耗状态的计算节点;
这里,管理节点可以通过以太网唤醒(Wake On LAN)或智能平台管理接口(IPMI,Intelligent Platform Management Interface)等方式,唤醒所述处于低功耗状态的计算节点。
步骤14,管理节点在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点;所述计算节点集合中的计算节点接收并执行管理节点分配的作业。
从以上所述可以看出,本实施例通过控制空闲的计算节点进入低功耗状态,同时管理节点记录各个计算节点的设备状态,并根据计算节点是否分配到作业,来决定是否唤醒该计算节点,从而可以在保证作业系统的正常运作的同时,节约集群作业系统的整体功耗。
本实施例中,管理节点还可以统计一段预定时间内各个计算节点分配到作业的概率,进而选择出所述概率小于第一门限的第一类计算节点,从而,在集群作业系统没有作业需要执行(处于空闲状态)时,向所述第一类计算节点发送控制命令,用于控制所述第一类节点进入低功耗状态。这样,管理节点能够主动控制集群作业系统中的不常被分配到业务计算节点进入低功耗状态,从而可以更好地节约系统功耗。
当然,管理节点还可以进一步选择出所述概率大于第二门限的第二类计算节点,从而在进行作业分配之前,首先向所述第二类节点发送第二唤醒命令,用于唤醒所述第二类节点。如果接收到该第二唤醒命令的第二类节点当前已经处于工作状态,则忽略该第二唤醒命令。这样,管理节点在分配作业之前,能够尽早地唤醒常被分配到业务的计算节点,从而提高系统的作业执行效率。
基于上述的降低集群作业系统运行功耗的方法,本实施例相应地提供了一种集群作业系统中的管理节点,如图2所示,该管理节点包括:
状态获取单元,用于获取并记录所述集群作业系统中的计算节点的设备状态信息,其中,所述计算节点在满足预定的本地功耗策略时将进入低功耗状态;
节点选择单元,用于在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
第一唤醒单元,用于唤醒所述处于低功耗状态的计算节点;
作业分配单元,用于在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
优选地,图2所示的管理节点中,所述第一唤醒单元包括:
唤醒子单元,用于通过以太网唤醒或智能平台管理接口IPMI唤醒所述第二计算节点。
优选地,图2所示的管理节点中,还包括:
统计单元,用于统计一段预定时间内各个所述计算节点分配到作业的概率;
第一选择单元,用于选择出所述概率小于第一门限的第一类计算节点;
状态控制单元,用于在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类节点进入低功耗状态。
第二选择单元,用于选择出所述概率大于第二门限的第二类计算节点;
第二唤醒单元,用于在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类节点。
<实施例2>
请参照图3,本实施例所述降低集群作业系统运行功耗的方法,应用在集群作业系统中的第一计算节点上,具体包括以下步骤:
步骤31,所述第一计算节点在满足预先制定的功耗策略时,控制本计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述集群作业系统中的管理节点。
这里,控制本计算节点进入低功耗状态的方式有很多种,可以采用第三方软件或各种现有技术实现。例如,在LINUX系统下,可以通过swsusp、TuxOnIce、或uswsusp方式,控制所述计算节点进入低功耗状态。
步骤32,所述第一计算节点接收所述管理节点在向所述第一计算节点分配作业前发送的第一唤醒命令。
这里,管理节点在向本计算节点分配作业前,如果根据之前记录的本计算节点的设备状态,获知本计算节点处于低功耗状态,则需要向本计算节点发送第一唤醒命令。具体的,管理节点可以通过以太网唤醒或IPMI等方式,发送所述第一唤醒命令,用以唤醒所述第一计算节点。
步骤33,所述第一计算节点根据所述第一唤醒命令,唤醒本计算节点。
步骤34,所述第一计算节点在自身被唤醒进入工作状态后,将自身的当前设备状态通知给所述管理节点。
这里,管理节点在获知所述第一计算节点已经进入工作状态后,则可以将作业分配到所述第一计算节点。
步骤35,所述第一计算节点接收并执行所述管理节点在所述第一计算节点进入工作状态后分配的作业。
本实施例所述降低集群作业系统运行功耗的方法中,所述第一计算节点还可以进一步接收所述管理节点向第一类计算节点发送的控制命令,所述第一类计算节点是在一段预定时间内分配到作业的概率小于第一门限的计算节点;并根据所述控制命令,控制所述第一计算节点进入低功耗状态。
所述第一计算节点还可以接收所述管理节点向第二类计算节点发送的第二唤醒命令,所述第二类计算节点是在一段预定时间内分配到作业的概率大于第二门限的计算节点;根据所述第二唤醒命令,唤醒本计算节点。
基于上述的降低集群作业系统运行功耗的方法,本实施例相应地提供了一种集群作业系统中的计算节点,如图4所示,该计算节点包括:
第一状态控制单元,用于在满足预定的功耗策略时,控制本计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述集群作业系统中的管理节点;
第一接收单元,用于接收所述管理节点在向本计算节点分配作业前发送的第一唤醒命令;
第一唤醒单元,用于根据所述第一唤醒命令,唤醒本计算节点;
状态通知单元,用于在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点;
作业处理单元,用于接收并执行所述管理节点在本计算节点进入工作状态后分配的作业。
优选地,图4所示的计算节点中,所述第一状态控制单元包括:
状态切换单元,用于通过软件挂起swsusp、TuxOnIce、或用户空间软件挂起uswsusp方式,控制本计算节点进入低功耗状态。
优选地,图4所示的计算节点中,还包括:
第二接收单元,用于接收到所述管理节点向第一类计算节点发送的控制命令,所述第一类计算节点是在一段预定时间内分配到作业的概率小于第一门限的计算节点;
第二状态控制单元,用于根据所述控制命令,控制所述第一计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述管理节点;
第三接收单元,用于接收到所述管理节点向第二类计算节点发送的第二唤醒命令,所述第二类计算节点是在一段预定时间内分配到作业的概率大于第二门限的计算节点;
第二唤醒单元,用于根据所述第二唤醒命令,唤醒所述第一计算节点。
<实施例3>
本实施例提供了一种降低集群作业系统运行功耗的方法,所述集群作业系统包括管理节点和多个计算节点,所述方法包括:
步骤51,所述集群作业系统中的计算节点在满足预定的功耗策略时,控制自身进入低功耗状态,并将自身当前的设备状态通知给所述管理节点。
步骤52,所述管理节点获取并记录所述计算节点的设备状态信息。
步骤53,所述管理节点在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点。
步骤54,所述管理节点向所述处于低功耗状态的计算节点,唤醒所述处于低功耗状态的计算节点。
步骤55,所述处于低功耗状态的计算节点根据接收到的所述第一唤醒命令,唤醒本计算节点,并在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点。
步骤56,所述管理节点在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合。
本实施例中,所述管理节点还可以统计一段预定时间内各个所述计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;并在所述集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
更进一步的,所述管理节点还可以选择出所述概率大于第二门限的第二类计算节点;并在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类节点。
同时,本实施例还提供了一种集群作业系统,所述集群作业系统包括管理节点和多个计算节点,其中,
所述计算节点,用于在满足预定的功耗策略时,控制自身进入低功耗状态,并将自身当前的设备状态通知给所述管理节点;接收并根据所述管理节点发送的第一唤醒命令,唤醒本计算节点,并在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点;以及接收并执行所述管理节点分配的作业;
所述管理节点,用于获取并记录所述计算节点的设备状态信息;在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点,并唤醒所述处于低功耗状态的计算节点;以及,在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
优选地,本实施例所述集群作业系统中,所述管理节点,还用于统计一段预定时间内各个所述计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;并在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
优选地,本实施例所述集群作业系统中,所述管理节点,还用于选择出所述概率大于第二门限的第二类计算节点;并在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类计算节点。
综上所述,本发明实施例提供的降低集群作业系统运行功耗的方法、节点及系统,可以降低系统整体运行功耗,提高系统运行效率。
以上所述仅是本发明的实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种降低集群作业系统运行功耗的方法,其特征在于,包括:
获取并记录所述集群作业系统中的计算节点的设备状态信息,其中,所述计算节点在满足预定的本地功耗策略时将进入低功耗状态并向所述管理节点汇报自身设备状态;
在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
唤醒所述处于低功耗状态的计算节点;
在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
2.如权利要求1所述的方法,其特征在于,还包括:
统计一段预定时间内所述集群作业系统中各个计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;
在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
3.如权利要求2所述的方法,其特征在于,还包括:
选择出所述概率大于第二门限的第二类计算节点;
在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类计算节点。
4.一种降低集群作业系统运行功耗的方法,其特征在于,包括:
在第一计算节点满足预定的功耗策略时,控制所述第一计算节点进入低功耗状态,并将所述第一计算节点的当前设备状态通知给所述集群作业系统中的管理节点;
接收所述管理节点在向所述第一计算节点分配作业前发送的第一唤醒命令;
根据所述第一唤醒命令,唤醒所述第一计算节点;
在所述第一计算节点被唤醒进入工作状态后,将所述第一计算节点的当前设备状态通知给所述管理节点;
接收并执行所述管理节点在所述第一计算节点进入工作状态后分配给所述第一计算节点的作业。
5.如权利要求4所述的方法,其特征在于,还包括:
所述第一计算节点接收到所述管理节点向第一类计算节点发送的控制命令,所述第一类计算节点是在一段预定时间内分配到作业的概率小于第一门限的计算节点;
根据所述控制命令,控制所述第一计算节点进入低功耗状态。
6.如权利要求4所述的方法,其特征在于,还包括:
所述第一计算节点接收到所述管理节点向第二类计算节点发送的第二唤醒命令,所述第二类计算节点是在一段预定时间内分配到作业的概率大于第二门限的计算节点;
根据所述第二唤醒命令,唤醒所述第一计算节点。
7.一种降低集群作业系统运行功耗的方法,其特征在于,包括:
所述集群作业系统中的计算节点在满足预定的功耗策略时,控制自身进入低功耗状态,并将自身当前的设备状态通知给所述集群作业系统中的管理节点;
所述管理节点获取并记录所述计算节点的设备状态信息;
所述管理节点在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
所述管理节点唤醒所述低功耗状态的计算节点;
所述管理节点在所述低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
8.如权利要求7所述的方法,其特征在于,还包括:
所述管理节点统计一段预定时间内各个所述计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;并在所述集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
9.如权利要求8所述的方法,其特征在于,还包括:
所述管理节点选择出所述概率大于第二门限的第二类计算节点;
所述管理节点在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类节点。
10.一种集群作业系统中的管理节点,其特征在于,包括:
状态获取单元,用于获取并记录所述集群作业系统中的计算节点的设备状态信息,其中,所述计算节点在满足预定的本地功耗策略时将进入低功耗状态;
节点选择单元,用于在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点;
第一唤醒单元,用于唤醒所述处于低功耗状态的计算节点;
作业分配单元,用于在所述处于低功耗状态的计算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
11.如权利要求10所述的管理节点,其特征在于,还包括:
统计单元,用于统计一段预定时间内所述集群作业系统中各个计算节点分配到作业的概率;
第一选择单元,用于选择出所述概率小于第一门限的第一类计算节点;
状态控制单元,用于在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类节点进入低功耗状态。
12.如权利要求11所述的管理节点,其特征在于,还包括:
第二选择单元,用于选择出所述概率大于第二门限的第二类计算节点;
第二唤醒单元,用于在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类节点。
13.一种集群作业系统中的计算节点,其特征在于,包括:
第一状态控制单元,用于在满足预定的功耗策略时,控制本计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述集群作业系统中的管理节点;
第一接收单元,用于接收所述管理节点在向本计算节点分配作业前发送的第一唤醒命令;
第一唤醒单元,用于根据所述第一唤醒命令,唤醒本计算节点;
状态通知单元,用于在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点;
作业处理单元,用于接收并执行所述管理节点在本计算节点进入工作状态后分配的作业。
14.如权利要求13所述的计算节点,其特征在于,还包括:
第二接收单元,用于接收到所述管理节点向第一类计算节点发送的控制命令,所述第一类计算节点是在一段预定时间内分配到作业的概率小于第一门限的计算节点;
第二状态控制单元,用于根据所述控制命令,控制所述第一计算节点进入低功耗状态,并将本计算节点的当前设备状态通知给所述管理节点。
15.如权利要求13所述的方法,其特征在于,还包括:
第三接收单元,用于接收到所述管理节点向第二类计算节点发送的第二唤醒命令,所述第二类计算节点是在一段预定时间内分配到作业的概率大于第二门限的计算节点;
第二唤醒单元,用于根据所述第二唤醒命令,唤醒所述第一计算节点。
16.一种集群作业系统,所述集群作业系统包括管理节点和多个计算节点,其特征在于,
所述计算节点,用于在满足预定的功耗策略时,控制自身进入低功耗状态,并将自身当前的设备状态通知给所述管理节点;接收并根据所述管理节点发送的第一唤醒命令,唤醒本计算节点,并在本计算节点被唤醒进入工作状态后,将本计算节点的当前设备状态通知给所述管理节点;以及接收并执行所述管理节点分配的作业;
所述管理节点,用于获取并记录所述计算节点的设备状态信息;在进行作业分配时,确定执行所述作业的计算节点集合,并根据所述设备状态信息,从所述计算节点集合中选择出处于低功耗状态的计算节点,并唤醒所述处于低功耗状态的计算节点;以及,在所述处于低功耗状态的叶算节点都被唤醒后,将作业分配到所述计算节点集合中的计算节点。
17.如权利要求16所述的集群作业系统,其特征在于,
所述管理节点,还用于统计一段预定时间内各个所述计算节点分配到作业的概率,选择出所述概率小于第一门限的第一类计算节点;并在集群作业系统没有作业需要执行时,向所述第一类计算节点发送控制命令,控制所述第一类计算节点进入低功耗状态。
18.如权利要求17所述的集群作业系统,其特征在于,
所述管理节点,还用于选择出所述概率大于第二门限的第二类计算节点;并在进行所述作业分配之前,向所述第二类节点发送第二唤醒命令,唤醒所述第二类计算节点。
CN2009102444453A 2009-12-31 2009-12-31 一种降低集群作业系统运行功耗的方法、节点及系统 Active CN102118407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009102444453A CN102118407B (zh) 2009-12-31 2009-12-31 一种降低集群作业系统运行功耗的方法、节点及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102444453A CN102118407B (zh) 2009-12-31 2009-12-31 一种降低集群作业系统运行功耗的方法、节点及系统

Publications (2)

Publication Number Publication Date
CN102118407A true CN102118407A (zh) 2011-07-06
CN102118407B CN102118407B (zh) 2013-10-30

Family

ID=44216996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102444453A Active CN102118407B (zh) 2009-12-31 2009-12-31 一种降低集群作业系统运行功耗的方法、节点及系统

Country Status (1)

Country Link
CN (1) CN102118407B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890554A (zh) * 2011-07-22 2013-01-23 鸿富锦精密工业(深圳)有限公司 电源管理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060120303A1 (en) * 2004-12-07 2006-06-08 Mark Yarvis Apparatus, system and method capable of low duty cycle hierarchical AD HOC networks
CN1829986A (zh) * 2003-05-26 2006-09-06 株式会社东芝 负载分配系统和方法
CN101349914A (zh) * 2008-09-18 2009-01-21 贺新 基于ZigBee通信技术的阀门控制器及其控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1829986A (zh) * 2003-05-26 2006-09-06 株式会社东芝 负载分配系统和方法
US20060120303A1 (en) * 2004-12-07 2006-06-08 Mark Yarvis Apparatus, system and method capable of low duty cycle hierarchical AD HOC networks
CN101349914A (zh) * 2008-09-18 2009-01-21 贺新 基于ZigBee通信技术的阀门控制器及其控制方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890554A (zh) * 2011-07-22 2013-01-23 鸿富锦精密工业(深圳)有限公司 电源管理系统及方法

Also Published As

Publication number Publication date
CN102118407B (zh) 2013-10-30

Similar Documents

Publication Publication Date Title
US8996895B2 (en) Method, apparatus, and system for energy efficiency and energy conservation including optimizing C-state selection under variable wakeup rates
CN101598969B (zh) 基于等待时间准则的平台功率管理
CN101495958B (zh) 用于控制处理器低功率状态的系统和方法
US7197652B2 (en) Method and system for energy management in a simultaneous multi-threaded (SMT) processing system including per-thread device usage monitoring
US8977880B2 (en) Method for managing power supply of multi-core processor system involves powering off main and slave cores when master bus is in idle state
US8775838B2 (en) Limiting the number of unexpected wakeups in a computer system implementing a power-saving preemptive wakeup method from historical data
CN1321362C (zh) 包括器件使用评估和功率状态控制的功率管理方法和系统
WO2009067956A1 (fr) Procédé d&#39;économie d&#39;énergie et appareil pour la station de base
CN111625080B (zh) 一种服务器节能方法、装置及电子设备和存储介质
CN101154130A (zh) 一种虚拟机系统及其电源管理方法
CN103345415A (zh) 管理定时器的终端节能方法和装置
CN103076868B (zh) 电源管理方法及应用该方法的电子系统
KR102060431B1 (ko) 멀티 코어 시스템의 전력 관리 장치 및 방법
CN101661327A (zh) 一种调节中央处理器主频的方法及装置
CN106471433A (zh) 用于支持到存储器的常通路径的超低功率架构
CN102929381B (zh) 电子系统及其电源管理方法
CN105549723A (zh) 一种服务器节电控制方法、装置及电子设备节电控制装置
JP2015106313A (ja) 情報処理システム、管理装置、情報処理システムの制御方法及び管理装置の制御プログラム
CN105101371A (zh) 一种手机省电管理方法
CN102681650B (zh) 一种电源控制节能方法及其对应的存储系统
CN102118407B (zh) 一种降低集群作业系统运行功耗的方法、节点及系统
US20140136748A1 (en) System and method for performance optimization in usb operations
CN114327023B (zh) 一种Kubernetes集群的节能方法、系统、计算机介质和电子设备
CN101943944A (zh) 一种基于空闲历史信息的计算阵列节能方法
CN102594575A (zh) 控制服务器休眠与唤醒的系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant