CN107003706B - 非暂时性计算机可读存储介质和用于管理作业的装置 - Google Patents

非暂时性计算机可读存储介质和用于管理作业的装置 Download PDF

Info

Publication number
CN107003706B
CN107003706B CN201580040030.8A CN201580040030A CN107003706B CN 107003706 B CN107003706 B CN 107003706B CN 201580040030 A CN201580040030 A CN 201580040030A CN 107003706 B CN107003706 B CN 107003706B
Authority
CN
China
Prior art keywords
power
job
computer system
distributed computer
jobs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580040030.8A
Other languages
English (en)
Other versions
CN107003706A (zh
Inventor
穆拉利哈·拉加帕
A·霍夫曼
迪瓦达塔·博达斯
J·宋
詹姆斯·亚历山大
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN107003706A publication Critical patent/CN107003706A/zh
Application granted granted Critical
Publication of CN107003706B publication Critical patent/CN107003706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • G06F9/4893Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues taking into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3209Monitoring remote activity, e.g. over telephone lines or network connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3228Monitoring task completion, e.g. by use of idle timers, stop commands or wait commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3296Power saving characterised by the action undertaken by lowering the supply or operating voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0833Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for reduction of network energy consumption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/78Architectures of resource allocation
    • H04L47/783Distributed allocation of resources, e.g. bandwidth brokers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/82Miscellaneous aspects
    • H04L47/821Prioritising resource allocation or reservation requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Public Health (AREA)
  • General Business, Economics & Management (AREA)
  • Automation & Control Theory (AREA)
  • Environmental & Geological Engineering (AREA)
  • Power Sources (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Debugging And Monitoring (AREA)

Abstract

示出一种非暂时性计算机可读存储介质,存储有指令,所述指令可由分布式计算机系统的一个或多个处理器执行以执行操作,所述操作包括:确定由所述分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率大于分配给所述分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由所述分布式计算机系统的一个或多个处理器执行的一个或多个计算,以及响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业。

Description

非暂时性计算机可读存储介质和用于管理作业的装置
相关申请的交叉引用
本申请要求在先美国临时专利申请(第62/040,576)的权益,所述在先美国临时专利申请的标题为“用于把HPC系统的功耗限制在预算内的简单功率感知调度器 (SIMPLEPOWER-AWARE SCHEDULER TO LIMIT POWER CONSUMPTION BY HPC SYSTEM WITHIN ABUDGET)”并且于2014年8月22日提交,特此将所述在先美国临时专利申请的全部内容引入本文以作参考。
本申请涉及:美国专利申请(14/582,795)(代理人案号:42P73498),它的标题为“估计在分布式计算机系统的多个节点上运行的作业的功率性能的方法和装置(METHODSAND APPARATUS TO ESTIMATE POWER PERFORMANCE OF A JOB THAT RUNS ON MULTIPLENODES OF A DISTRIBUTED COMPUTER SYSTEM)”,它提交于2014年12月24日;美国专利申请(14/582,783)(代理人案号42P74562),它的标题为“用于生成和使用节点的功率、热量和性能特性以改善能量效率并降低对队列中作业的等待时间的方法和装置(METHOD ANDAPPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICSOF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIME FOR JOBS IN THEQUEUE)”并于2014年12月24日提交;美国专利申请(14/582,979)(代理人案号42P74563),标题为“对任务执行的调整”,并于2014年12月24日提交;美国专利申请(14/582,985)(代理人案号42P74564),标题为“功耗的控制(control of power consumption)”,并于2014年12月24日提交;美国专利申请(14/582,988)(代理人案卷号42P74565),标题为“对能量需求的预测(FORECAST FOR DEMAND OF ENERGY)”,并于2014年12月24日提交;美国专利申请(14/582,743)(代理人案号42P74567),标题为“管理分布式计算系统的功率性能(MANAGINGPOWER PERFORMANCE OF DISTRIBUTED COMPUTING SYSTEMS)”,并于2014年12月24日提交;美国专利申请(14/582,756)(代理人案卷号42P74568),标题为“剖析数据处理系统的作业功率和能量消耗(PROFILING A JOB POWER AND ENERGY CONSUMPTION FOR A DATAPROCESSING SYSTEM)”,并于2014年12月24日提交; 美国专利申请(14/582,764)(代理人案号42P74569),标题为“用于数据处理系统的功率感知作业调度器和管理器(A POWER AWAREJOB SCHEDULER AND MANAGER FOR A DATA PROCESSING SYSTEM)”,并于2014年12月24日提交。
领域
本公开的实施例一般涉及计算机系统中的功率节省领域。更具体地,本公开的一个实施例涉及当对分布式计算机系统的功率分配有变化时对分布式计算机系统的作业的管理。
一般背景
分布式计算机系统可以通过同时使用多个节点以执行被称为作业的计算任务来执行并行计算。每个节点可以包括一个或多个处理器、存储器、操作系统和一个或多个输入/输出(I / O)组件。节点可以通过高速网络结构彼此通信,并且可以使用共享的文件系统或存储器。作业可以被划分成分布在数千个节点上的数千个并行任务。这些节点每秒互相可以同步数百次。
未来的分布式计算机系统预计需要数十兆瓦的功率,使得它们的功率管理成为业界最关心的事情。这些分布式计算机系统将有望在有限的功率和能量预算下提供百万兆级(exascale)的性能。当前的分布式计算机系统可以应用功率封顶来遵守有限的功率和能量预算。然而,不管功率封顶如何,都有可能降低给分布式计算机系统(“所述系统”)的功率分配,从而所述系统正消耗的功率就超过分配给所述系统的功率。
管理所述系统的队列中当前运行的作业、挂起的作业和新请求的作业在维持所述系统的预期性能并且确保所述系统消耗的功率保持小于分配给所述系统的功率上是至关重要的。随着分配给所述系统的功率波动,可能需要挂起和/或终止一个或多个当前运行的作业,恢复一个或多个挂起的作业和/或起动已经在队列中的一个或多个新作业。另外,可能需要所述系统遵守关于对某些类型的作业的功率分配的优先级。
附图说明
在附图的图中通过示例而非限制的方式示出了本发明的实施例,其中相同的附图标记指示相似的元件,并且其中:
图1是接收多个输入的HPC系统100的示例性框图。
图2是包括HPC系统100的逻辑的示例性框图。
图3是示出当所述系统消耗的功率超过分配给所述系统的功率时管理HPC系统100内的作业的样例方法的流程图。
图4A-4C包括流程图,所述流程图示出了当HPC系统100消耗的功率小于或近似等于分配给HPC系统100的功率时管理一个或多个作业的方法的一个实施例。
具体实施方式
本公开的各种实施例涉及管理由分布式计算机系统正处理着的作业(“当前运行的作业”)、由分布式计算机系统挂起的作业(“挂起的作业”)以及被放置在分布式计算机系统的队列中的新请求的作业(“新作业”)。在一个实施例中,作业的管理可能需要分布式计算机系统在挂起和/或终止一个或多个作业之前尝试降低一个或多个作业所消耗的功率。在第二实施例中,当分配给分布式计算机系统的功率被减小时,作业的管理可能需要分布式计算机系统挂起和/或终止一个或多个作业。另外,作业的管理可以允许分布式计算机系统恢复一个或多个挂起的作业和/或起动一个或多个新作业。作业的管理可以依赖于由分布式计算机系统生成的估计,这在标题为“用于估计在分布式计算机系统的多个节点上运行的作业的功率性能的方法和装置(Methods and apparatus to estimate powerperformance of a job that runs on multiple nodes of a distributed computersystem)”的美国专利申请( 14/582,795)(代理人案号42P73498)中被讨论。分布式计算机系统可以是例如高性能计算(HPC)系统。在本公开的一些实施例中,作业可以不受由作业的所有者提出用于限制提供给作业的功率的功率策略的支配;然而,HPC系统可能并且将很可能具有由HPC系统处理的作业的组合不能超过的有限的总功率预算。
本公开的实施例涉及确定分配给所述系统的功率的减小是否需要挂起和/或终止一个或多个当前作业。本公开的其他实施例涉及确定分配给所述系统的功率的增加或可用功率的增加(例如,作业完成了处理)是否允许HPC系统恢复一个或多个挂起的作业和/或起动HPC系统的队列中等待的新作业。某些实施例涉及当确定要挂起、终止、恢复和/或起动哪一个或一些作业时确定HPC系统内的特定作业和/或作业类型的优先级。
本公开的一些实施例涉及当所述系统消耗的功率在从分配给所述系统的功率起处于预定义阈值(例如,系统保护带)内时确定是否可以降低一个或多个作业的功率消耗。可以降低一个或多个作业所消耗的功率,以便尽可能利用最大数量的计算节点。因此,在一个实施例中,当一个或多个作业消耗的功率被降低时,所挽回的功率可以与未分配功率结合并被用于起动新作业或恢复挂起的作业。
参考图1,示出了接收各种输入的HPC系统的示例性框图。HPC系统100包括一个或多个操作系统(OS)节点101、一个或多个计算节点102、一个或多个输入/输出(I/O)节点103和存储器104。高速结构通信地连接OS节点101、计算节点102和I/O节点103。高速结构可以是经由一个或多个交换机互连的节点的网络拓扑。在一个实施例中,如图1中所示,I/O节点103被通信地连接到存储器104。存储器104可以是非永久性存储器,诸如易失性存储器(例如,任何类型的随机存取存储器“RAM”);永久性存储器,诸如非易失性存储器(例如,只读存储器“ROM”、电源支持的RAM、闪存、相变存储器等)、固态驱动器、硬盘驱动器、光盘驱动器或便携式存储器设备。
OS节点101可以提供网关来访问计算节点102。例如,在提交作业以在计算节点102上进行处理之前,可能需要用户登录到HPC系统100,这可能要通过OS节点101。在本公开的实施例中,OS节点101可以接受由用户提交的作业并且帮助启动和管理由计算节点102正处理着的作业。在一个实施例中,OS节点101包括:功率监视器(未示出),它被描述在标题为“用于剖析在多个节点中运行并使用分布式计算机系统(HPC)的共享资源的作业的功率和能量消耗的方法和装置(Methods and apparatus to profile power and energyconsumption by a job running in multiple nodes and uses shared resources of adistributed computer system(HPC))”的美国专利申请(14/582,756)(代理人案号42P74568)中;功率估计器(未示出);以及功率校准器(未示出),它被描述在标题为“用于生成和使用节点的功率、热量和性能特性以改善能量效率并降低对队列中作业的等待时间的方法和装置(Methods and apparatus to generate and use power,thermal andperformance characteristics of nodes to improve energy efficiency andreducing wait time for jobs in the queue)”的美国专利申请(14/582,783)(代理人案号42P74562)中。
在一个实施例中,计算节点102提供大部分处理和计算功率。I/O节点103可以提供计算节点102和外部设备(例如,单独的计算机)之间的接口,外部设备可以向HPC系统100提供输入或接收来自HPC系统100的输出。
系统的功率分配(PSYS)可以被例如公共设施管理设施(utility managementfacility)(例如按照系统管理员或管理软件(诸如数据中心管理器)确定的)提供给HPC系统100。通常,Psys将是分配给HPC系统100的有限量的功率, HPC系统100将使用该有限量的功率来运行作业120中的一个或多个。作业120包括一个或多个用户请求由HPC系统100运行的一个或多个作业。每个作业包括 “功率策略”,这将在下面深入讨论。“功率策略”将帮助HPC系统100为作业分配功率,并且帮助来管理由HPC系统100正在运行的一个或多个作业120。
此外,管理策略130将通过提供定义HPC系统100的操作的全局(overarching)策略来指导运行作业120的管理。可以包括在管理策略130中的策略的示例包括但不限于或限制为:(1)最大化所有硬件和软件资源的利用(例如,代替在高功率下运行较少的作业并且让资源不被使用,运行尽可能多的作业以使用尽可能多的资源);(2)在所有运行的作业中,没有功率限制的作业被给予最高优先级;和/或(3)挂起的作业处于较高的优先级以便恢复。这样的管理策略控制HPC系统100可以调度、启动、挂起和重新启动一个或多个作业的方式。
术语
在下面的描述中,某些术语用于描述本发明的特征。例如,在某些情况下,术语“逻辑”和“引擎”表示被配置为执行一个或多个功能的硬件、固件和/或软件。作为硬件,逻辑(或引擎)可以包括具有数据处理或存储功能的电路。这样的电路的示例可以包括但不限于或限制于微处理器、一个或多个处理器核心、可编程门阵列、微控制器、专用集成电路、无线接收器、发射器和/或收发器电路、半导体存储器,或组合逻辑。
逻辑(或引擎)可以是采用一个或多个软件模块形式的软件,所述一个或多个软件模块诸如采用可执行应用形式的可执行代码、应用编程接口(API)、子程序、函数、过程、小应用程序、小服务程序、例程、源代码、目标代码、共享库/动态加载库或一个或多个指令。这些软件模块可以存储在任何类型的合适的非暂时性存储介质或暂时性存储介质(例如,电,光,声或其他形式的传播信号,诸如载波,红外信号或数字信号)中。非暂时性存储介质的示例可以包括但不限于或受限于可编程电路;半导体存储器;非永久性存储器,诸如易失性存储器(例如,任何类型的随机存取存储器“RAM”);永久性存储器,诸如非易失性存储器(例如,只读存储器“ROM”,电源支持的RAM,闪存,相变存储器等),固态驱动器,硬盘驱动器,光盘驱动器,或便携式存储器设备。作为固件,可执行代码存储在永久性存储器中。
术语“功率监视”应当被解释为动态地测量构成HPC系统的一个或多个组件的功率消耗。所取得的测量可以用于计算例如单个作业和/或一组作的功率消耗,以及用于提供关于HPC系统的总功率消耗的统计。
术语“功率策略”应当被解释为提供给HPC系统的输入(例如,一个或多个参数),输入为给定作业的功率的分配和管理提供指导。输入可以作为作业请求提交的一部分提供和/或可以作为单独的输入(例如,经由用户界面屏幕或配置文件)提供。例如,输入可以特别指示(i)作业是否可以经受功率限制,(ii)作业可以运行在的最大和/或最小功率和/或(iii)处理作业的一个或多个节点可以操作在最小和/或最大频率。
术语“节点”应当被解释为一个或多个处理器,可选地至少被与系统存储器和/或一个或多个输入/输出(I/O)组件编组在一起。在整个说明书和权利要求书中,一个或多个处理器、系统存储器和一个或多个I/O组件可以被称为节点的“组件”。在整个说明书和权利要求书中,术语“处理器”,“计算机处理单元(CPU)”和“核心”将可互换地使用。
术语“作业”应当解释为在HPC系统上执行的预先确定的计算。例如,用户(例如,作业的所有者)可以请求作业由HPC运行,这意味着用户正在请求让一个或多个计算节点根据用户提供的输入参数和/或数据来执行计算。作业请求可以指定将被用于处理作业的一个或多个计算(例如,应用)。
术语“系统功率(PSYS)”应被解释为由例如设施或数据中心管理器提供给HPC系统的功率量。PSYS是HPC系统所具有的功率总量,用于在任何给定时间分配给一个或多个作业。
术语“保护带”应当被解释为帮助管理HPC系统的功率预算的机制。在一个实施例中,保护带可以是额外功率分配,额外功率分配可以是分配给作业的功率的预定百分比。例如,如果HPC系统具有3 MW的功率要分配给作业,那么HPC系统可能只分配2.8 MW并保持0.2MW作为保护带,以防止计算上的突增(spike)导致作业的功耗超过3 MW。保护带的一个目的是保持作业有一致的功耗。
最后,本文所使用的术语“或”和“和/或”将被解释为包含性的或意指任何一个或任一组合。因此,“A,B或C”或“A,B和/或C”意指“以下任何一种:A; B; C; A和B; A和C; B和C; A,B和C”。该定义的例外仅在元件、功能、步骤或动作的组合以某种方式固有地相互排斥时才会发生。
本发明可以用于诸如高性能计算(HPC)系统的分布式计算机系统的功率管理。具体地,本公开的实施例涉及基于作为HPC系统内的节点的校准结果的、每个作业的功耗的估计来管理对在HPC系统中运行的一个或多个作业的功率分配。由于本发明容许许多不同形式的实施例,因此本公开旨在被认为是本发明的原理的示例,并且不旨在将本发明限制于所示出和描述的具体实施例。
功率感知的分布式计算机系统
参考图2,示出了构成HPC系统100的逻辑的示例性框图。图2中所示的HPC系统100的逻辑包括用于HPC系统100的功率管理,并且包括资源管理器210(资源管理器210包括功率感知作业调度器211和功率感知作业启动器212)、校准器220、估计器230、一个或多个作业管理器240(每个作业将具有其自己的作业管理器)、作业250、用户策略205和管理策略130。在一个实施例中,资源管理器210和作业管理器240被配置为收集作业功率数据。
校准器220校准HPC系统100内的每个节点的功率、热耗散和性能。校准器220可以提供用于校准HPC系统100内的节点的多个方法。在一个实施例中,校准器100可以提供第一校准方法,其中HPC系统100内的每个节点运行样本工作负载(例如,小型应用、应用的一部分和/或测试脚本),因此校准器220可以以预定时间间隔对一个或多个测量(例如,消耗的功率)进行采样,以便尤其确定每个节点的(1)平均功率、(2)最大功率和(3)最小功率。此外,样本工作负载可以在每个节点上以所述节点的每个操作频率运行。在另一实施例中,校准器220可以提供第二校准方法,其中在作业的运行时期间发生一个或多个节点的校准。在这种情况下,校准器220可以对作业正在其上运行(例如,处理)的一个或多个节点进行采样。在第二个方法中,校准器220获得每个节点在实际运行时期间的功率测量。
估计器230向资源管理器210提供每个作业的功耗的估计,使得资源管理器210能够高效地调度和监视由一个或多个作业所有者(例如,用户)请求的每个作业。估计器220可以基于例如存储在校准器数据库中的最大和平均功率值来提供功耗估计,其中通过校准器220的处理来填充校准器数据库。另外,每个作业所需的最小功率可以被考虑。可以由估计器230使用以创建功耗估计的其他因素包括但不限于或限制于:作业的所有者是否允许作业受到功率限制的约束、限制提供给作业的功率的作业功率策略(例如,作业将运行在的预定的固定频率、作业所需的最小功率,或由资源管理器210确定的变化频率和/或供给功率)、作业的起动功率、作业将运行在的频率、HPC系统100的可用功率和/或分配给HPC系统100的功率。
由用户(例如,作业的所有者)请求的每个作业伴随有用户策略205(也在图1中示出)。用户策略包括至少关于作业250是否可以受功率限制的约束(在功率限制被允许的情况下,有限制功率的策略(例如,固定频率,所需的最小功率或由资源管理器210确定的变化频率和/或功率)以及作业250是否可以被挂起的决策。
在一个实施例中,功率感知作业调度器211被配置为接收对作业的模式(例如,被包括在用户策略205内)的选择,以基于该模式确定作业的可用功率并且基于可用功率分配用于作业的功率。在一个实施例中,功率感知作业调度器211被配置为基于可用功率确定作业的统一频率。在一个实施例中,功率感知作业调度器211被配置为基于监视的功率,估计的功率和校准的功率中的至少一个来确定作业的可用功率。功率感知作业调度器211和资源管理器210被配置为接收关于功率消耗的信息,以将功率预算分布到每个作业并且实现统一频率机制来限制功率,如下面进一步详细描述的。
资源管理器210使用功率感知作业调度器211和功率感知作业启动器212以基于接收到的功率输入(例如用户策略205和管理策略206)来调度和启动作业。在一个实施例中,资源管理器210是软件对象,所述软件对象负责为一个或多个用户想要运行的交互式和批处理作业分配计算和IO资源。通常,资源管理器210还负责将作业调度到作业队列之外并启动作业以按调度运行。作业管理器240被配置为控制作业以保持在该作业的分配的功率预算内,如下面进一步详细描述的。在一个实施例中,作业管理器240负责在作业已经启动之后在一个或多个功率策略的约束下操作作业。在一个实施例中,作业管理器240用于按照由用户和/或管理员中的至少一个指定的策略来控制在作业的执行中涉及的所有组件(例如,节点或其它组件)的功率性能。功率感知作业调度器211和作业管理器240。
参考图3,示出了当所述系统消耗的功率超过分配给所述系统的功率时管理HPC系统100内的作业的样例方法的流程图。图3中示出的每个块表示在通过挂起一个或多个作业和/或终止一个或多个作业来管理HPC系统100内的作业的方法300中执行的操作。方法300示出了由作业调度器211、作业管理器240和估计器220在计算节点102上实施的操作,所述操作试图完成当分配给HPC系统100的功率被减少时在没有人类交互的情况下自动地管理HPC系统100的作业。
在操作301中,方法300开始。在操作302中,确定消耗到HPC系统100功率(PCSYS)是否小于或等于分配到HPC系统100的功率(PSYS)。当PSYS大于PCSYS(在操作302为 “是”)时,HPC系统100监视给HPC系统100的功率分配上的任何进一步波动是否导致PCSYS大于PSYS。当PSYS小于在PCSYS(在操作302为 “否”)时,确定是否所有当前作业都在其最低功率状态下操作(操作303)。在一个实施例中,当作业的所有者请求用于处理的最小功率并且作业正以所请求的最小功率处理时,作业可以在其最低功率状态下操作。在另一个实施例中,用户可能已经请求计算节点102要处理作业的特定频率,并且在计算节点102以所请求的频率操作时的计算节点102的功率状态可以是用于给定作业的最低功率状态。在作业管理器240自动调整作业的频率(例如,将频率降低到计算节点102的最低操作频率)的另一实施例中,作业可能就正在以其最低功率状态操作(例如,为所述作业消耗最少功率量)。
当所有当前作业都没有正在以其最低功率状态操作(在操作303为否)时,HPC系统100降低一个或多个作业的操作功率状态或功率分配(操作304)。在一个实施例中,,由资源管理器210在分析与HPC系统100和/或单个作业相关联的功率策略时确定每个作业的最低频率(例如,在一个实施例中,以最低频率的操作可消耗将作业置于其最低功率状态的最少功率量)。在另一实施例中,作业可以具有没有任何功率限制应当对作业的处理施加的功率策略。在这种情况下,处理作业的计算节点102要总是在其最高频率下操作并消耗可能的最大功率量;因此,不能降低操作频率和功率状态。在第二实施例中,作业可以具有允许HPC系统100设置分配给作业的功率和/或设置处理作业的计算节点102的操作频率的功率策略。在这种情况下,HPC系统100可以确定计算节点102的操作频率是否可以被降低,从而降低功率状态。接着, PCSYS被重新计算(操作305),并且该方法300返回到操作302以确定PCSYS是否小于或等于PSYS
当所有当前作业在其最低功率状态下操作时(在操作303为是),识别可以被挂起的最低优先级的运行作业(操作306)。在一些实施例中,作业是否可被挂起取决于作业的所有者是否选择了这样的策略,HPC系统100是否具有关于作业挂起的某些策略(例如,所有作业都可以被挂起)和/或作业是否支持检查点设置。检查点设置涉及保存作业的状态以保留处理作业的进度。在硬件或软件出现故障的情况下,检查点设置允许作业被从上一个已知的工作状态恢复。在一些实施例中,检查点设置可以以预定义的间隔发生,紧接在作业挂起之前发生,或两者都发生。在操作307,所识别的作业经历检查点设置,并且在操作308,挂起所识别的作业。
在操作309,考虑到最近挂起的作业, PCSYS被重新计算。术语“重新计算”可以意味着测量计算节点102中的一个或多个的一个或多个组件,参考校准器数据库,向估计器230请求新的功率估计和/或基于一个或多个测量执行计算。在操作310,确定PCSYS是否小于或等于PSYS。如果PCSYS小于或等于PSYS(在操作310为是),方法300结束(311)。
如果Pcsys不小于或等于PSYS(在操作310为否),则确定是否所有可被挂起的作业都已经被挂起了(操作312)。当所有可被挂起的作业还尚未被挂起(在操作312为否)时,方法300返回到操作306,在操作306中识别最低优先级的运行作业。可替换地,当所有可被挂起的作业都已经被挂起时(在操作312处为是),识别具有最低优先级的当前作业(操作313)。在操作314,终止所识别的作业。
在操作315,考虑到最近终止的作业, Pcsys被重新计算。在操作316,确定Pcsys是否小于或等于Psys的确定。如果Pcsys小于或等于PSYS(在操作316为是),方法300完成(操作317)。
如果Pcsys不小于或等于PSYS(在操作316为否),则确定所有作业是否都已经被终止(操作318)。当所有作业都还尚未被终止时(在操作318为否),方法300返回到操作313以识别不能被挂起的最低优先级作业。当所有作业都已经被终止时(在操作318为是),HPC系统被强制关闭电源(操作319)。
图4A-4C示出了用于在由HPC系统100所消耗的功率(Pcsys)小于或近似等于分配给HPC系统100的功率(PSYS)时管理一个或多个作业的方法400的一个实施例。参考图4A,确定所消耗的功率是否在分配给所述系统的功率加上第一系统保护带和分配给所述系统的功率减去第二系统保护带之间(操作401)。当操作401的确定产生肯定回答时(在操作401为是),方法400进行到操作428,这将在图4C中详细讨论。当操作401的确定产生否定回答时(在操作401为否),确定所消耗的功率是否小于所分配的功率减去第一系统保护带(操作402)。应当注意,Pcsys和Psys是平均值,例如,能量消耗随时间的平均速率。系统保护带服务于对功率消耗的小波动负责的目的。
当在操作402的确定产生肯定结果(在操作402为是)时,方法400进行到操作417,这将在图4B中详细讨论。当操作402处的确定产生否定结果时(在操作402处为否),确定是否能够为(例如,当前在HPC系统100上运行的)当前作业中的一个或多个降低功率(操作403)。当针对一个或多个当前作业功率能够降低时(在操作403为是),识别要为其降低功率的一个或多个当前作业(操作404)。降低功率的示例在上面讨论了。在操作405,降低一个或多个识别的当前作业的功率,并且方法400随后返回到操作401。
当一个或多个当前作业的功率不能被降低时(在操作403为否),则确定任何当前作业是否可以被挂起(操作406)。当一个或多个当前作业可以被挂起时(在操作406为是),则产生可挂起作业的级别优先化列表(操作407)。在操作408中,所生成的列表上的最低优先级的可挂起作业被指示实施检验点设置。当检查点设置已完成时,最低优先级的可挂起作业将被挂起(操作409)。在操作410,确定所消耗的功率是否小于或等于分配的功率减去第一系统保护带。当所消耗的功率小于或等于分配的功率减去第一系统保护带时(在操作410为是),则方法400返回至操作401。当所消耗的功率不小于分配的功率减去第一系统保护带时(在操作410为否),则方法400返回至操作406,以确定是否有任何当前作业可以被挂起。
当没有任何当前作业可以被挂起(例如,用户策略和/或系统策略阻止这种动作和/或没有任何当前作业支持检查点设置)(在操作406为否),确定是否一个或多个作业当前正在运行(操作411)。当没有作业当前正在HPC系统100上运行时, HPC系统100被强制断电(操作412),并随后,方法400结束(操作413)。
当一个或多个作业当前正在运行(在操作411 为是)时,产生当前作业的级别优先化列表(操作414)。在操作415,产生的列表上的最低优先级作业被终止(在一实施例中,该列表可以在一个列表上对当前正在运行的作业和挂起的作业二者进行级别优先化)。在操作416,确定所消耗的功率是否小于或等于分配的功率减去第一系统保护带。当所消耗的功率小于或等于分配的功率减去第一系统保护带时(在操作416为是),则方法400返回至操作401。当所消耗的功率不小于或等于分配的功率减去第一系统保护带时(在操作416为否),则方法400返回至操作411,以确定是否有任何当前运行的作业。
参照图4B中,当在图4A的操作402的确定产生肯定结果时(在操作402为是),则确定是否有给当前作业分配额外功率的偏好(操作417)。在一个实施例中,偏好可从用户策略和/或系统策略中导出。当存在要给当前作业分配额外功率的偏好时(在操作417为是),额外功率被分配给当前运行的作业(操作420),并且该方法400返回至操作401。
额外功率可以被以多种方式分配给当前运行的作业。资源管理器210可以分配额外功率的方式的例子包括但不局限于或受限制于:在每个当前运行的作业之间相等地给具有最长运行时间的当前运行的作业,然后给第二最长(一旦第一作业正以其最高功率状态操作)等等,给具有最高优先级的当前运行的作业,然后是给第二最高优先级(一旦第一作业正以其最高功率状态操作)等等,或者成比例地给每个当前运行的作业(例如与每个作业的运行时间成比例,与每个作业的优先级成比例,等等)。对要分配额外功率的作业进行级别优先化的方式的示例包括但并不限制或限定于:当前运行作业的级别优先化列表,每个当前运行的作业一直在运行的时间量,每个当前运行的作业的功率状态(例如,在其最低功率状态运行的作业与那些在其最高功率状态附近运行的作业相比较),当前正在处理每个当前运行的作业的计算节点102的数量和/或每个当前运行的作业要在其下一个功率状态运行可能需要的附加功率量。
当不存在给当前作业分配额外功率的偏好时(在操作417为否),确定是否有任何未分配的资源是可用的(操作418)。资源的例子包括但不局限于或受限于:一个或多个计算节点和/或一个或多个存储设备。当未分配的资源不可用时(在操作418为否),额外功率被分配给当前运行的作业(操作419),并且该方法400返回至操作401。当未分配的资源可用来开始处理另一个作业时(在操作418为是),确定作业队列是否为空(操作420)。HPC系统100维持等待要由所述系统处理的作业的作业队列。在一个实施方案中,作业队列可以包含仍然必须要在所述系统上开始处理的新作业以及先前正在所述系统上处理但已被挂起的作业这二者。可替换的实施例可以包括独立的队列,一个用于新作业,一个用于挂起的作业。本公开将假定:作业队列是可以包括新作业和/或挂起作业的单个队列。
当作业队列是空的时(在操作420为是),额外功率被分配给当前运行的作业(操作421),并且该方法400返回至操作401。
当作业队列不为空时(在操作420为否),JNEXT(它是队列中的下一最高优先级的作业)被检索(操作422)。在操作423,确定是否有充足的资源可用于JNEXT(例如,计算节点102中是否足够的计算节点可用)。当充足的资源不可用于JNEXT时(在操作423为否),则确定是否有附加的作业在队列中(操作427)。当有更多的作业在队列中存在时(在操作427为是),则方法400返回至操作422,以从队列中检索下一最高优先级的作业。当没有附加的作业在队列中时(在操作427为否),额外功率被分配给当前运行的作业(操作419),并且该方法400随后返回到操作401。
然而,当有充足的资源可用于JNEXT时(在操作423为是),用于JNEXT的功率估计被检索(操作424)。功率估计可由估计器230产生。当已经产生功率估计时,确定是否有充足的未分配功率来在未分配的资源上运行JNEXT(操作425)。当有充足的未分配功率来运行JNEXT时(在操作425为是),当JNEXT是新作业时JNEXT被起动或当JNEXT是挂起的作业时JNEXT被恢复(操作426)。当没有充足的未分配功率来运行JNEXT时(在操作425为否),则确定是否有附加的作业在队列中(操作427),如以上所讨论的。
参照图4C,当操作401的确定产生肯定的回答时(在操作401为是),则确定作业当前是否在队列中(操作428)。当作业当前并不在队列中时(在操作428为否),方法400返回到操作401。当作业当前在队列中时(在操作428为是),确定是否有任何当前运行的作业可被以较低功率操作(操作429)。关于是否有任何当前运行的作业可被以较低功率操作的确定被作出以确定功率是否能够被再分配来运行附加的作业(例如,在队列中等待的一个或多个作业)。
当没有任何当前作业能被以较低的功率处理时(在操作429为否),则方法400返回至操作401。然而,当有一个或多个当前作业能够被以较低功率操作(在操作429为是),确定能够通过以在较低功率状态操作当前作业而变为可用的功率量(Pfreed)。Pfreed加上所述系统未分配的任何功率可以被再分配给新的或挂起的作业。
在操作431,确定可通过降低给一个或多个作业的功率而变为可用的附加资源。接着,在操作432,JNEXT被从作业队列检索,并且在操作433,功率估计(PNEXT)被根据JNEXT生成。作业队列和检索(例如,基于优先级的组织和检索)在上论述了。类似地,功率估计的产生也在上面论述了。
在操作434,确定是否有可用于运行JNEXT的充足的未分配资源。当没有可用于运行JNEXT的充足的未分配资源时(在操作434为否),则确定是否有附加的作业在队列中(操作435),如以上所讨论。当没有附加的作业存在于队列中时(在操作435为否),则方法400返回至操作400。当有附加作业存在于队列中时(在操作435为是),则方法400返回到操作432以从队列中检索下一最高优先级的作业。
然而,当有可用于运行作业的资源(例如,可用的节点和未分配功率)时(在操作434为是),确定能够通过降低一个或多个作业所消耗的功率而变为可用的附加资源(操作432 )。在操作433,具有下一最高优先级的作业被从队列中检索。在操作434,用于JNEXT的功率估计(例如,通过向估计器230请求估计)被获得。在操作435,确定在不降低一个或多个作业所消耗的功率的情况下是否有用于运行JNEXT的充足资源。
当有充足的资源可用于运行JNEXT时(在操作434为是),则确定起动JNEXT所需的功率(用部分功率估计PNEXT表示)是否是小于或等于Pfeed加上未分配功率。当PNEXT大于Pfreed加上未分配功率时(在操作436为否),则方法400返回至操作435,以确定当前在队列中是否有正在等待的附加作业。当PNEXT小于或等于Pfeed加上未分配功率时(在操作436为是),一个或多个作业的功率被按照至多PNEXT降低(操作437),并随后, 当JNEXT是新作业时,JNEXT被起动,或当JNEXT是挂起的作业时,JNEXT被恢复(操作438)。当在操作438起动JNEXT时,方法400就返回到操作401。
下面的示例涉及到进一步实施例:
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或多个处理器执行以执行操作,所述操作包括:确定由所述分布式计算机系统消耗的功率是否大于分配给分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率大于分配给所述分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或多个计算,和响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或多个处理器执行以执行操作,操作包括:确定由所述分布式计算机系统所消耗的功率是否大于分配给分布式计算机系统的功率,响应于确定由所述分布式计算机系统所消耗的功率大于分配给分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或多个计算,并且响应于确定由所述分布式计算机系统处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中为具有最低优先级的作业设置检查点,响应于为具有最低优先级的作业设置检查点,在由所述分布式计算机系统正在处理所有作业中挂起具有最低优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定由所述分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率大于分配给分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或多个计算,并且响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,其中,由所述分布式计算机系统正在处理的所有作业的第一作业的最低功率状态不同于由所述分布式计算机系统正在处理的所有作业的第二作业的最低功率状态。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定由所述分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率大于分配给分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,并且在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业之后,重新计算由分布式计算机系统所消耗的功率,其中,由所述分布式计算机系统正在处理的所有作业的第一作业的最低功率状态不同于由所述分布式计算机系统正在处理的所有作业的第二作业的最低功率状态。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定由所述分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率大于分配给分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业之后,重新计算由分布式计算机系统所消耗的功率,并且在重新计算由分布式计算机系统所消耗的功率之后,挂起具有第二最低优先级的第二作业,其中,由所述分布式计算机系统正在处理的所有作业的第一作业的最低功率状态不同于由所述分布式计算机系统正在处理的所有作业的第二作业的最低功率状态。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定由所述分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率大于分配给分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,并响应于在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,确定由所述分布式计算机系统消耗的功率是否大于分配给该系统的功率,并且响应于确定由所述分布式计算机系统消耗的功率大于分配给该系统的功率,终止具有第二最低优先级的第二作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定由分布式计算机系统消耗的功率是否小于分配给所述分布式计算机系统的功率,响应于确定由所述分布式计算机系统消耗的功率小于分配给所述分布式计算机系统的功率,确定未分配的资源是否可用,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否是可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由分布式计算机系统消耗的功率,响应于确定分配给所述分布式计算机系统的功率小于由分布式计算机系统消耗的功率,确定是否存在给作业队列中的作业分配额外功率的偏好,响应于确定不存在给作业队列中的作业分配额外功率的偏好,确定未分配的资源是否是可用的,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由所述分布式计算机系统消耗的功率,响应于确定分配给分布式计算机系统的功率小于由所述分布式计算机系统消耗的功率,确定是否存在向作业队列中的作业分配额外功率的偏好,响应于确定存在向作业队列中的作业分配额外功率的偏好,向由所述分布式计算机系统正在处理的一个或多个作业分配额外功率。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由所述分布式计算机系统消耗的功率,响应于确定分配给分布式计算机系统的功率小于由所述分布式计算机系统消耗的功率,确定未分配的资源是否是可用的,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否是可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业,其中确定处理最高优先级的作业的功率是否是可用的包括:确定处理最高优先级的作业所需要的功率是否小于分配给分布式计算机系统的功率减去由分布式计算机系统消耗的功率减去第一系统保护带。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由所述分布式计算机系统消耗的功率,响应于确定分配给分布式计算机系统的功率小于由所述分布式计算机系统消耗的功率,确定未分配的资源是否是可用的,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业,其中确定处理最高优先级的作业的功率是否是可用的包括:确定处理最高优先级的作业所需要的功率是否小于分配给分布式计算机系统的功率减去由分布式计算机系统消耗的功率减去第一系统保护带,并且第一系统保护带包括为了防止分布式计算机系统的功率消耗的波动超过分配给所述分布式计算机系统的功率而不分配给一个或多个作业的预定量功率。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由所述分布式计算机系统消耗的功率,响应于确定分配给分布式计算机系统的功率小于由所述分布式计算机系统消耗的功率,确定未分配的资源是否是可用的,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否是可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业,其中起动最高优先级的作业包括从作业队列中起动新作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由所述分布式计算机系统消耗的功率,响应于确定分配给分布式计算机系统的功率小于由所述分布式计算机系统消耗的功率,确定未分配的资源是否是可用的,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否是可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业,其中起动最高优先级的作业包括恢复作业队列挂起的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由一个或者多个处理器执行以执行操作,操作包括确定分配给分布式计算机系统的功率是否小于由所述分布式计算机系统消耗的功率,响应于确定分配给分布式计算机系统的功率小于由所述分布式计算机系统消耗的功率,确定未分配的资源是否是可用的,响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否是可用的,并且当处理最高优先级的作业的功率是可用的之时,起动最高优先级的作业,其中,所述作业队列是级别优先级化的队列,级别优先级化的队列被配置为包括:(1)一个或多个新作业或(2)一个或多个挂起的作业这两项中的一个或者二者。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带,计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于计算所述释放功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率,响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,和响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率并且降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带,计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于计算所述释放功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率,响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,和响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率并且降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业,其中起动最高优先级的作业包括从作业队列中起动新作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带,计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于计算所述释放功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率,响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,和响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率并且降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业,其中起动最高优先级的作业包括恢复作业队列中挂起的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带,计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,在计算所述释放功率之后,为最高优先级的作业产生功率估计,响应计算功率估计,确定作业队列中最高优先级作业所需的功率是否小于所述释放功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率,响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,和响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率并且降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带,计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于计算所述释放功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率,响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,和响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率并且降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业,当充足资源不可用于处理最高优先级的作业并且充足资源可用于处理第二最高优先级的作业时,起动第二最高优先级的作业。
一种非临时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或者多个处理器执行以执行操作,操作包括确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带,计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,响应于计算所述释放功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率,响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,和响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放功率加上未分配功率并且降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业,当最高优先级的作业所需要的功率大于释放功率加上未分配功率并且第二最高优先级的作业所需要的功率小于所述释放功率加上未分配功率之时,起动第二最高优先级的作业。
在前面的描述中,本发明是参考其特定示例性实施例予以描述的。然而将很明显的是:在不违背所附权利要求中阐述的本发明的更宽的精神和范围的情况下,可以对本发明作出各种修改和改变。

Claims (40)

1.一种非暂时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或多个处理器执行以执行操作,所述操作包括:
确定由所述分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率;
响应于确定由所述分布式计算机系统消耗的功率大于分配给所述分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理,其中,作业包括由所述分布式计算机系统的一个或多个处理器执行的一个或多个计算,其中每个作业包括由作业所有者提出的用户功率策略,其中每个作业的用户功率策略包括指示每个作业能够运行的最小功率的参数,其中每个作业的最低功率状态受所述作业的用户功率策略约束,并且其中用户功率策略指示所述作业是否可挂起;以及
响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,
在分布式计算机系统正在处理的所有作业中,根据所述策略识别可挂起的一个或多个作业;
从最低优先级开始,挂起用户策略指示为可挂起的一个或多个作业; 以及
向当前正在运行的作业分配由于挂起一个或多个作业而获得的额外功率,并且按均等,按比例或根据作业优先级进行分配。
2.如权利要求1所述的非暂时性计算机可读存储介质,还包括:
在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业之前并且响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中对具有最低优先级的作业设置检查点。
3.如权利要求1所述的非暂时性计算机可读存储介质,其中由所述分布式计算机系统正在处理的所有作业的第一作业的最低功率状态不同于由所述分布式计算机系统正在处理的所有作业的第二作业的最低功率状态。
4.如权利要求3所述的非暂时性计算机可读存储介质,还包括:
在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业之后,重新计算由分布式计算机系统所消耗的功率。
5.如权利要求4所述的非暂时性计算机可读存储介质,还包括:
在重新计算由分布式计算机系统所消耗的功率之后,挂起具有第二最低优先级的第二作业。
6.如权利要求1所述的非暂时性计算机可读存储介质,还包括:
响应于在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,确定由所述分布式计算机系统消耗的功率是否大于分配给所述系统的功率;以及
响应于确定由所述分布式计算机系统消耗的功率大于分配给所述系统的功率,终止具有第二最低优先级的第二作业。
7.一种非暂时性计算机可读存储介质,其上存储有指令,所述指令可由一个或多个处理器执行以执行操作,所述操作包括:
确定由分布式计算机系统消耗的功率是否小于分配给所述分布式计算机系统的功率;
响应于确定由所述分布式计算机系统消耗的功率小于分配给所述分布式计算机系统的功率,确定未分配的资源是否是可用的;
响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,并且其中每个作业包括由作业所有者提出的用户功率策略,其中每个作业的用户功率策略包括指示每个作业能够运行的最小功率的参数,其中每个作业的最低功率状态由所述作业的用户功率策略约束,并且其中用户功率策略指示所述作业是否可挂起;
当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否可用的;以及
当处理最高优先级的作业的功率是可用的之时,起动最高优先级作业。
8.如权利要求7所述的非暂时性计算机可读存储介质,还包括:
在确定未分配的资源是否可用之前并且响应于确定由分布式计算机系统消耗的功率小于分配给所述分布式计算机系统的功率,确定是否存在给作业队列中的作业分配额外功率的偏好。
9.如权利要求8所述的非暂时性计算机可读存储介质,还包括:
响应于确定存在向作业队列中的作业分配额外功率的偏好,向由所述分布式计算机系统正在处理的一个或多个作业分配额外功率。
10.如权利要求7所述的非暂时性计算机可读存储介质,其中确定要处理最高优先级的作业的功率是否可用包括:确定处理最高优先级的作业所需要的功率是否小于分配给分布式计算机系统的功率减去由分布式计算机系统消耗的功率减去第一系统保护带。
11.如权利要求10所述的非暂时性计算机可读存储介质,其中第一系统保护带包括为了防止分布式计算机系统的功率消耗的波动超过分配给所述分布式计算机系统的功率而不分配给一个或多个作业的预定量功率。
12.如权利要求7所述的非暂时性计算机可读存储介质,其中起动最高优先级的作业包括从作业队列中起动新作业。
13.如权利要求7所述的非暂时性计算机可读存储介质,其中起动最高优先级的作业包括恢复作业队列中挂起的作业。
14.如权利要求7所述的非暂时性计算机可读存储介质,其中,所述作业队列是级别优先级化的队列,所述级别优先级化的队列被配置为包括:(1)一个或多个新作业 或(2)一个或多个挂起的作业这两项中的一个或者二者。
15.一种非暂时性计算机可读存储介质,其上存储有指令,所述指令可由分布式计算机系统的一个或多个处理器执行以执行操作,所述操作包括:
确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率 和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带;
计算释放的功率,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,并且其中每个作业包括由作业所有者提出的用户功率策略,其中每个作业的用户功率策略包括指示每个作业能够运行的最小功率的参数,其中每个作业的最低功率状态由所述作业的用户功率策略约束,并且其中用户功率策略指示所述作业是否可挂起;
响应于计算所述释放的功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放的功率加上未分配功率,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率;
响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放的功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量;以及
响应于降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业。
16.如权利要求15所述的非暂时性计算机可读存储介质,其中起动最高优先级的作业包括从作业队列中起动新作业。
17.如权利要求15所述的非暂时性计算机可读存储介质,其中起动最高优先级的作业包括恢复作业队列中的挂起作业。
18.如权利要求15所述的非暂时性计算机可读存储介质,还包括:
在确定最高优先级的作业所需要的功率小于所述释放的功率加上未分配功率之前,为最高优先级的作业产生功率估计。
19.如权利要求15所述的非暂时性计算机可读存储介质,还包括:
当充足资源不可用于处理最高优先级的作业并且充足资源可用于处理第二最高优先级的作业时,起动第二最高优先级的作业。
20.如权利要求15所述的非暂时性计算机可读存储介质,还包括:
当最高优先级的作业所需要的功率大于释放的功率加上未分配功率并且第二最高优先级的作业所需要的功率小于所述释放的功率加上未分配功率之时,起动第二最高优先级的作业。
21.一种用于管理作业的装置,所述装置包括:
用于确定由分布式计算机系统消耗的功率是否大于分配给所述分布式计算机系统的功率的部件;
用于响应于确定由所述分布式计算机系统消耗的功率大于分配给所述分布式计算机系统的功率,确定由所述分布式计算机系统正在处理的所有作业是否正在以每个作业的最低功率状态处理的部件,其中,作业包括由所述分布式计算机系统的一个或多个处理器执行的一个或多个计算,并且其中每个作业包括由作业所有者提出的用户功率策略,其中每个作业的用户功率策略包括指示每个作业能够运行的最小功率的参数,其中每个作业的最低功率状态由所述作业的用户功率策略约束,并且其中用户功率策略指示所述作业是否可挂起;以及
部件,用于响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在分布式计算机系统正在处理的所有作业中,根据所述策略识别可挂起的一个或多个作业;从最低优先级开始,挂起用户策略指示为可挂起的一个或多个作业; 以及向当前正在运行的作业分配由于挂起一个或多个作业而获得的额外功率,并且按均等,按比例或根据作业优先级进行分配。
22.如权利要求21所述的装置,还包括:
用于在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业之前并且响应于确定由所述分布式计算机系统正在处理的所有作业正在以每个作业的最低功率状态处理,在由所述分布式计算机系统正在处理的所有作业中对具有最低优先级的作业设置检查点的部件。
23.如权利要求21所述的装置,其中由所述分布式计算机系统正在处理的所有作业的第一作业的最低功率状态不同于由所述分布式计算机系统正在处理的所有作业的第二作业的最低功率状态。
24.如权利要求23所述的装置,还包括:
用于在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业之后,重新计算由分布式计算机系统所消耗的功率的部件。
25.如权利要求24所述的装置,还包括:
用于在重新计算由分布式计算机系统所消耗的功率之后,挂起具有第二最低优先级的第二作业的部件。
26.如权利要求21所述的装置,还包括:
用于响应于在由所述分布式计算机系统正在处理的所有作业中挂起具有最低优先级的作业,确定由所述分布式计算机系统消耗的功率是否大于分配给所述系统的功率的部件;以及
用于响应于确定由所述分布式计算机系统消耗的功率大于分配给所述系统的功率,终止具有第二最低优先级的第二作业的部件。
27.一种用于管理作业的装置,所述装置包括:
用于确定由分布式计算机系统消耗的功率是否小于分配给所述分布式计算机系统的功率的部件;
用于响应于确定由分布式计算机系统消耗的功率小于分配给所述分布式计算机系统的功率,确定未分配的资源是否是可用的的部件;
用于响应于确定未分配的资源是可用的,确定用于作业队列中最高优先级的作业的充足资源是否是可用的部件,其中,作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,并且其中每个作业包括由作业所有者提出的用户功率策略,其中每个作业的用户功率策略包括指示每个作业能够运行的最小功率的参数,其中每个作业的最低功率状态由所述作业的用户功率策略约束,并且其中用户功率策略指示所述作业是否可挂起;
用于当用于作业队列中最高优先级的作业的充足资源是可用的之时,确定要处理最高优先级作业的功率是否可用的部件;以及
用于当处理最高优先级的作业的功率是可用的之时,起动最高优先级作业的部件。
28.如权利要求27所述的装置,还包括:
用于在确定未分配的资源是否可用之前并且响应于确定由分布式计算机系统消耗的功率小于分配给所述分布式计算机系统的功率,确定是否存在给作业队列中的作业分配额外功率的偏好的部件。
29.如权利要求28所述的装置,还包括:
用于响应于确定存在向作业队列中的作业分配额外功率的偏好,向由所述分布式计算机系统正在处理的一个或多个作业分配额外功率的部件。
30.如权利要求27所述的装置,其中用于确定要处理最高优先级的作业的功率是否可用的部件包括:用于确定处理最高优先级的作业所需要的功率是否小于分配给分布式计算机系统的功率减去由分布式计算机系统消耗的功率减去第一系统保护带的部件。
31.如权利要求30所述的装置,其中第一系统保护带包括为了防止分布式计算机系统的功率消耗的波动超过分配给所述分布式计算机系统的功率而不分配给一个或多个作业的预定量功率。
32.如权利要求27所述的装置,其中用于起动最高优先级的作业的部件包括用于从作业队列中起动新作业的部件。
33.如权利要求27所述的装置,其中用于起动最高优先级的作业的部件包括用于恢复作业队列中挂起的作业的部件。
34.如权利要求27所述的装置,其中,所述作业队列是级别优先级化的队列,所述级别优先级化的队列被配置为包括:(1)一个或多个新作业 或(2)一个或多个挂起的作业这两项中的一个或者二者。
35.一种用于管理作业的装置,所述装置包括:
用于确定(1)分配给分布式计算机系统的功率减去第一系统保护带小于由分布式计算机系统消耗的功率和(2)由分布式计算机系统所消耗的功率小于分配给所述系统的功率加第二系统保护带的部件;
用于计算释放的功率的部件,其中,所述释放的功率是可以通过降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量而变为可用来给作业队列中的一个或多个作业分配的功率量,其中作业包括由分布式计算机系统的一个或多个处理器执行的一个或者多个计算,并且其中每个作业包括由作业所有者提出的用户功率策略,其中每个作业的用户功率策略包括指示每个作业能够运行的最小功率的参数,其中每个作业的最低功率状态由所述作业的用户功率策略约束,并且其中用户功率策略指示所述作业是否可挂起;
用于响应于计算所述释放的功率,确定作业队列中最高优先级的作业所需要的功率是否小于所述释放的功率加上未分配功率的部件,其中,所述未分配功率是分配给了分布式计算机系统但是未分配给由所述分布式计算机系统正在处理的作业的功率;
用于响应于确定作业队列中最高优先级的作业所需要的功率小于所述释放的功率加上未分配功率,降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量的部件;以及
用于响应于降低由分布式计算机系统正在处理的一个或多个作业所消耗的功率量,起动最高优先级的作业的部件。
36.如权利要求35所述的装置,其中用于起动最高优先级的作业的部件包括用于从作业队列中起动新作业的部件。
37.如权利要求35所述的装置,其中用于起动最高优先级的作业的部件包括用于恢复作业队列中的挂起作业的部件。
38.如权利要求35所述的装置,还包括:
用于在确定最高优先级的作业所需要的功率小于所述释放的功率加上未分配功率之前,为最高优先级的作业产生功率估计的部件。
39.如权利要求35所述的装置,还包括:
用于当充足资源不可用于处理最高优先级的作业并且充足资源可用于处理第二最高优先级的作业时,起动第二最高优先级的作业的部件。
40.如权利要求35所述的装置,还包括:
用于当最高优先级的作业所需要的功率大于释放的功率加上未分配功率并且第二最高优先级的作业所需要的功率小于所述释放的功率加上未分配功率之时,起动第二最高优先级的作业的部件。
CN201580040030.8A 2014-08-22 2015-06-18 非暂时性计算机可读存储介质和用于管理作业的装置 Active CN107003706B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462040576P 2014-08-22 2014-08-22
US62/040576 2014-08-22
US14/582,772 US10289183B2 (en) 2014-08-22 2014-12-24 Methods and apparatus to manage jobs that can and cannot be suspended when there is a change in power allocation to a distributed computer system
US14/582772 2014-12-24
PCT/US2015/036403 WO2016028374A1 (en) 2014-08-22 2015-06-18 Methods and apparatus to manage jobs that can and cannot be suspended when there is a change in power allocation to a distributed computer system

Publications (2)

Publication Number Publication Date
CN107003706A CN107003706A (zh) 2017-08-01
CN107003706B true CN107003706B (zh) 2021-06-08

Family

ID=55348281

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201580040949.7A Active CN106537348B (zh) 2014-08-22 2015-06-17 用于数据处理系统的功率感知作业调度器和管理器
CN201580040030.8A Active CN107003706B (zh) 2014-08-22 2015-06-18 非暂时性计算机可读存储介质和用于管理作业的装置
CN201580040005.XA Active CN106537287B (zh) 2014-08-22 2015-06-18 估计在分布式计算机系统的多个节点上运行的作业的功率性能的方法和装置
CN201911128004.7A Active CN111176419B (zh) 2014-08-22 2015-06-18 估计在分布式计算机系统的多个节点上运行的作业的功率性能的方法和装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580040949.7A Active CN106537348B (zh) 2014-08-22 2015-06-17 用于数据处理系统的功率感知作业调度器和管理器

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201580040005.XA Active CN106537287B (zh) 2014-08-22 2015-06-18 估计在分布式计算机系统的多个节点上运行的作业的功率性能的方法和装置
CN201911128004.7A Active CN111176419B (zh) 2014-08-22 2015-06-18 估计在分布式计算机系统的多个节点上运行的作业的功率性能的方法和装置

Country Status (6)

Country Link
US (6) US20160054779A1 (zh)
EP (5) EP3183654A4 (zh)
JP (2) JP6701175B2 (zh)
KR (2) KR102213555B1 (zh)
CN (4) CN106537348B (zh)
WO (3) WO2016028371A1 (zh)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8601473B1 (en) 2011-08-10 2013-12-03 Nutanix, Inc. Architecture for managing I/O and storage for a virtualization environment
CN103959198B (zh) * 2011-11-30 2017-09-12 英特尔公司 降低3d工作负荷的功率
US11243707B2 (en) 2014-03-12 2022-02-08 Nutanix, Inc. Method and system for implementing virtual machine images
US9870037B2 (en) * 2015-04-01 2018-01-16 Dell Products, L.P. Method and apparatus for collaborative power and thermal control of fan run time average power limiting
US9900164B2 (en) * 2015-06-10 2018-02-20 Cisco Technology, Inc. Dynamic power management
US10042410B2 (en) * 2015-06-11 2018-08-07 International Business Machines Corporation Managing data center power consumption
US10073659B2 (en) 2015-06-26 2018-09-11 Intel Corporation Power management circuit with per activity weighting and multiple throttle down thresholds
US10503230B2 (en) * 2015-11-25 2019-12-10 Electronics And Telecommunications Research Institute Method and apparatus for power scheduling
US10437304B2 (en) * 2016-03-15 2019-10-08 Roku, Inc. Brown out condition detection and device calibration
US10613947B2 (en) 2016-06-09 2020-04-07 Nutanix, Inc. Saving and restoring storage devices using application-consistent snapshots
CN106200612B (zh) * 2016-07-07 2019-01-22 百度在线网络技术(北京)有限公司 用于测试车辆的方法和系统
WO2018030924A1 (en) * 2016-08-11 2018-02-15 Telefonaktiebolaget Lm Ericsson (Publ) Method and cloud management node for managing a data processing task
US10545560B2 (en) 2016-10-10 2020-01-28 International Business Machines Corporation Power management and utilization detection of computing components
US10401940B2 (en) * 2016-10-10 2019-09-03 International Business Machines Corporation Power management in disaggregated computing systems
US10838482B2 (en) 2016-10-10 2020-11-17 International Business Machines Corporation SLA-based power management in disaggregated computing systems
US10819599B2 (en) 2016-10-10 2020-10-27 International Business Machines Corporation Energy consumption as a measure of utilization and work characterization in a system
US11169592B2 (en) 2016-10-10 2021-11-09 International Business Machines Corporation SLA-based backup power management during utility power interruption in disaggregated datacenters
US10360077B2 (en) * 2016-10-10 2019-07-23 International Business Machines Corporation Measuring utilization of resources in datacenters
CN106779295A (zh) * 2016-11-18 2017-05-31 南方电网科学研究院有限责任公司 供电方案生成方法和系统
US20180165772A1 (en) * 2016-12-14 2018-06-14 Palo Alto Research Center Incorporated Tiered greening for large business operations with heavy power reliance
IT201700034731A1 (it) * 2017-03-29 2018-09-29 St Microelectronics Srl Modulo e metodo di gestione dell'accesso ad una memoria
WO2018190785A1 (en) * 2017-04-10 2018-10-18 Hewlett-Packard Development Company, L.P. Delivering power to printing functions
US10656700B2 (en) * 2017-07-10 2020-05-19 Oracle International Corporation Power management in an integrated circuit
CN110945457B (zh) * 2017-07-12 2021-09-14 Wiliot有限公司 能量感知计算系统
US10831252B2 (en) 2017-07-25 2020-11-10 International Business Machines Corporation Power efficiency-aware node component assembly
JP6874594B2 (ja) * 2017-08-24 2021-05-19 富士通株式会社 電源管理装置,ノード電源管理方法およびノード電源管理プログラム
US10917496B2 (en) * 2017-09-05 2021-02-09 Amazon Technologies, Inc. Networked storage architecture
JP6996216B2 (ja) * 2017-10-16 2022-01-17 コニカミノルタ株式会社 シミュレート装置、情報処理装置、装置設定方法および装置設定プログラム
KR102539044B1 (ko) * 2017-10-30 2023-06-01 삼성전자주식회사 시스템 온 칩의 구동 방법, 이를 수행하는 시스템 온 칩 및 이를 포함하는 전자 시스템
US10824522B2 (en) * 2017-11-27 2020-11-03 Nutanix, Inc. Method, apparatus, and computer program product for generating consistent snapshots without quiescing applications
US10725834B2 (en) 2017-11-30 2020-07-28 International Business Machines Corporation Job scheduling based on node and application characteristics
CN108052394B (zh) * 2017-12-27 2021-11-30 福建星瑞格软件有限公司 基于sql语句运行时间的资源分配的方法及计算机设备
US10627885B2 (en) 2018-01-09 2020-04-21 Intel Corporation Hybrid prioritized resource allocation in thermally- or power-constrained computing devices
JP2019146298A (ja) * 2018-02-16 2019-08-29 富士ゼロックス株式会社 情報処理装置及びプログラム
KR102663815B1 (ko) * 2018-06-01 2024-05-07 삼성전자주식회사 컴퓨팅 장치 및 이의 동작 방법
US10936039B2 (en) * 2018-06-19 2021-03-02 Intel Corporation Multi-tenant edge cloud system power management
US11226667B2 (en) 2018-07-12 2022-01-18 Wiliot Ltd. Microcontroller operable in a battery-less wireless device
US11366753B2 (en) * 2018-07-31 2022-06-21 Marvell Asia Pte Ltd Controlling performance of a solid state drive
US11031787B2 (en) 2018-09-14 2021-06-08 Lancium Llc System of critical datacenters and behind-the-meter flexible datacenters
WO2020102930A1 (en) * 2018-11-19 2020-05-28 Alibaba Group Holding Limited Power management method
CA3183109A1 (en) 2019-05-15 2020-11-19 Upstream Data Inc. Portable blockchain mining system and methods of use
US11073888B2 (en) * 2019-05-31 2021-07-27 Advanced Micro Devices, Inc. Platform power manager for rack level power and thermal constraints
US11314558B2 (en) * 2019-07-23 2022-04-26 Netapp, Inc. Methods for dynamic throttling to satisfy minimum throughput service level objectives and devices thereof
US11809252B2 (en) * 2019-07-29 2023-11-07 Intel Corporation Priority-based battery allocation for resources during power outage
US11868106B2 (en) 2019-08-01 2024-01-09 Lancium Llc Granular power ramping
US11397999B2 (en) 2019-08-01 2022-07-26 Lancium Llc Modifying computing system operations based on cost and power conditions
CN110958389B (zh) * 2019-12-05 2021-12-14 浙江大华技术股份有限公司 一种摄像机的负载启动方法、设备、装置及存储介质
JP7367565B2 (ja) 2020-03-03 2023-10-24 富士通株式会社 電力制御装置および電力制御プログラム
US11307627B2 (en) * 2020-04-30 2022-04-19 Hewlett Packard Enterprise Development Lp Systems and methods for reducing stranded power capacity
US20210397476A1 (en) * 2020-06-18 2021-12-23 International Business Machines Corporation Power-performance based system management
KR102176028B1 (ko) * 2020-08-24 2020-11-09 (주)에오스와이텍 실시간 통합 모니터링 시스템 및 그 방법
KR102432007B1 (ko) * 2020-10-08 2022-08-12 인하대학교 산학협력단 모바일 엣지 컴퓨팅에서 엣지 서버 한도 전력 하에서 보상을 최대화하는 작업 오프로딩
CN114816025A (zh) * 2021-01-19 2022-07-29 联想企业解决方案(新加坡)有限公司 功率管理方法和系统
US20220342469A1 (en) * 2021-04-23 2022-10-27 Hewlett-Packard Development Company, L.P. Power budget profiles of computing devices
CN113434034B (zh) * 2021-07-08 2023-04-18 北京华恒盛世科技有限公司 利用深度学习调整计算任务cpu频率的大型集群节能方法
EP4137913A1 (en) * 2021-08-17 2023-02-22 Axis AB Power management in processing circuitry which implements a neural network
KR20230036589A (ko) * 2021-09-06 2023-03-15 삼성전자주식회사 시스템-온-칩 및 그의 동작 방법
KR102458919B1 (ko) * 2021-11-15 2022-10-26 삼성전자주식회사 적응적인 파워 조절을 수행하는 메모리 컨트롤러, 이를 포함하는 메모리 시스템 및 메모리 시스템의 동작방법
US11720256B2 (en) * 2021-12-15 2023-08-08 Dell Products L.P. Maximizing power savings using IO monitoring
US11972267B2 (en) * 2022-10-04 2024-04-30 International Business Machines Corporation Hibernation of computing device with faulty batteries
US11714688B1 (en) * 2022-11-17 2023-08-01 Accenture Global Solutions Limited Sustainability-based computing resource allocation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101694631A (zh) * 2009-09-30 2010-04-14 曙光信息产业(北京)有限公司 实时作业调度系统及方法
CN101836190A (zh) * 2007-10-31 2010-09-15 国际商业机器公司 用于将多个作业分配给多个计算机的方法、系统和计算机程序
CN103229125A (zh) * 2010-11-29 2013-07-31 思科技术公司 机箱内的刀片服务器之间的动态功率平衡

Family Cites Families (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2264794B (en) 1992-03-06 1995-09-20 Intel Corp Method and apparatus for automatic power management in a high integration floppy disk controller
US5483656A (en) 1993-01-14 1996-01-09 Apple Computer, Inc. System for managing power consumption of devices coupled to a common bus
US5598537A (en) 1994-03-25 1997-01-28 Advanced Micro Devices, Inc. Apparatus and method for driving a bus to a docking safe state in a dockable computer system including a docking station and a portable computer
US5752050A (en) 1994-10-04 1998-05-12 Intel Corporation Method and apparatus for managing power consumption of external devices for personal computers using a power management coordinator
US5784628A (en) 1996-03-12 1998-07-21 Microsoft Corporation Method and system for controlling power consumption in a computer system
KR100285949B1 (ko) 1996-12-12 2001-04-16 윤종용 배터리 충전회로
US6125450A (en) 1996-12-19 2000-09-26 Intel Corporation Stop clock throttling in a computer processor through disabling bus masters
US5905900A (en) 1997-04-30 1999-05-18 International Business Machines Corporation Mobile client computer and power management architecture
JP2001109729A (ja) 1999-10-12 2001-04-20 Nec Corp マルチプロセッサシステムにおける消費電力制御装置および方法
US20020194251A1 (en) 2000-03-03 2002-12-19 Richter Roger K. Systems and methods for resource usage accounting in information management environments
US6760852B1 (en) 2000-08-31 2004-07-06 Advanced Micro Devices, Inc. System and method for monitoring and controlling a power-manageable resource based upon activities of a plurality of devices
US7143300B2 (en) 2001-07-25 2006-11-28 Hewlett-Packard Development Company, L.P. Automated power management system for a network of computers
AU2002317618A1 (en) * 2001-08-06 2003-02-24 Mercury Interactive Corporation System and method for automated analysis of load testing results
US6839854B2 (en) 2001-08-27 2005-01-04 Intel Corporation Voltage regulation for computer system components that increases voltage level when a component enters a sleep state as indicated by a power state status signal
US7111179B1 (en) 2001-10-11 2006-09-19 In-Hand Electronics, Inc. Method and apparatus for optimizing performance and battery life of electronic devices based on system and application parameters
DE60106467T2 (de) 2001-12-14 2006-02-23 Hewlett-Packard Development Co., L.P., Houston Verfahren zum Installieren Überwachungsagenten, System und Computerprogramm von Objekten in einem IT-Netz Überwachung
US20030163745A1 (en) 2002-02-27 2003-08-28 Kardach James P. Method to reduce power in a computer system with bus master devices
US7028200B2 (en) 2002-05-15 2006-04-11 Broadcom Corporation Method and apparatus for adaptive power management of memory subsystem
GB0211764D0 (en) 2002-05-22 2002-07-03 3Com Corp Automatic power saving facility for network devices
US7093146B2 (en) 2002-07-31 2006-08-15 Hewlett-Packard Development Company, L.P. Power management state distribution using an interconnect
US7403511B2 (en) 2002-08-02 2008-07-22 Texas Instruments Incorporated Low power packet detector for low power WLAN devices
US6971033B2 (en) 2003-01-10 2005-11-29 Broadcom Corporation Method and apparatus for improving bus master performance
US7418517B2 (en) 2003-01-30 2008-08-26 Newisys, Inc. Methods and apparatus for distributing system management signals
EP1480378A1 (en) * 2003-05-23 2004-11-24 Alcatel Method for setting up a generic protocol relationship between network elements in a telecom network
US6965776B2 (en) 2003-11-21 2005-11-15 Motorola, Inc. Portable communication device and network and methods therefore
US20050136961A1 (en) 2003-12-17 2005-06-23 Telefonaktiebolaget Lm Ericsson (Publ), Power control method
US7363517B2 (en) 2003-12-19 2008-04-22 Intel Corporation Methods and apparatus to manage system power and performance
US7406691B2 (en) 2004-01-13 2008-07-29 International Business Machines Corporation Minimizing complex decisions to allocate additional resources to a job submitted to a grid environment
US7272741B2 (en) 2004-06-02 2007-09-18 Intel Corporation Hardware coordination of power management activities
US7418608B2 (en) 2004-06-17 2008-08-26 Intel Corporation Method and an apparatus for managing power consumption of a server
US7908313B2 (en) 2004-07-21 2011-03-15 The Mathworks, Inc. Instrument-based distributed computing systems
US7386739B2 (en) * 2005-05-03 2008-06-10 International Business Machines Corporation Scheduling processor voltages and frequencies based on performance prediction and power constraints
US7444526B2 (en) * 2005-06-16 2008-10-28 International Business Machines Corporation Performance conserving method for reducing power consumption in a server system
US7475262B2 (en) 2005-06-29 2009-01-06 Intel Corporation Processor power management associated with workloads
US7562234B2 (en) 2005-08-25 2009-07-14 Apple Inc. Methods and apparatuses for dynamic power control
US7861068B2 (en) 2006-03-07 2010-12-28 Intel Corporation Method and apparatus for using dynamic workload characteristics to control CPU frequency and voltage scaling
US20070220293A1 (en) 2006-03-16 2007-09-20 Toshiba America Electronic Components Systems and methods for managing power consumption in data processors using execution mode selection
US8190682B2 (en) * 2006-03-31 2012-05-29 Amazon Technologies, Inc. Managing execution of programs by multiple computing systems
US7539881B2 (en) 2006-04-15 2009-05-26 Hewlett-Packard Development Company, L.P. System and method for dynamically adjusting power caps for electronic components based on power consumption
US7555666B2 (en) 2006-05-04 2009-06-30 Dell Products L.P. Power profiling application for managing power allocation in an information handling system
US7827738B2 (en) * 2006-08-26 2010-11-09 Alexander Abrams System for modular building construction
US7694160B2 (en) * 2006-08-31 2010-04-06 Ati Technologies Ulc Method and apparatus for optimizing power consumption in a multiprocessor environment
EP2070024B1 (en) * 2006-09-22 2018-11-14 Koninklijke Philips N.V. Methods for feature selection using classifier ensemble based genetic algorithms
US8370929B1 (en) * 2006-09-28 2013-02-05 Whitehat Security, Inc. Automatic response culling for web application security scan spidering process
US8055343B2 (en) 2006-10-20 2011-11-08 Cardiac Pacemakers, Inc. Dynamic battery management in an implantable device
US7844838B2 (en) 2006-10-30 2010-11-30 Hewlett-Packard Development Company, L.P. Inter-die power manager and power management method
US7793126B2 (en) 2007-01-19 2010-09-07 Microsoft Corporation Using priorities and power usage to allocate power budget
JP4370336B2 (ja) 2007-03-09 2009-11-25 株式会社日立製作所 低消費電力ジョブ管理方法及び計算機システム
US7941681B2 (en) 2007-08-17 2011-05-10 International Business Machines Corporation Proactive power management in a parallel computer
JP5029823B2 (ja) * 2007-09-06 2012-09-19 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、消費電力管理システム、消費電力管理方法およびプログラム
JP4935595B2 (ja) 2007-09-21 2012-05-23 富士通株式会社 ジョブ管理方法、ジョブ管理装置およびジョブ管理プログラム
CN101419495B (zh) * 2007-10-22 2012-05-30 国际商业机器公司 降低计算机系统中i/o功率的方法和装置,以及计算机系统
US8046600B2 (en) 2007-10-29 2011-10-25 Microsoft Corporation Collaborative power sharing between computing devices
US8041521B2 (en) 2007-11-28 2011-10-18 International Business Machines Corporation Estimating power consumption of computing components configured in a computing system
US7971084B2 (en) * 2007-12-28 2011-06-28 Intel Corporation Power management in electronic systems
US8595516B2 (en) 2008-01-03 2013-11-26 Broadcom Corporation System and method for global power management in a power over ethernet chassis
US8793786B2 (en) * 2008-02-08 2014-07-29 Microsoft Corporation User indicator signifying a secure mode
US8001403B2 (en) 2008-03-14 2011-08-16 Microsoft Corporation Data center power management utilizing a power policy and a load factor
US8301742B2 (en) 2008-04-07 2012-10-30 International Business Machines Corporation Systems and methods for coordinated management of power usage and runtime performance in performance-managed computing environments
KR20110007205A (ko) 2008-04-21 2011-01-21 어댑티브 컴퓨팅 엔터프라이즈 인코포레이티드 컴퓨트 환경에서 에너지 소비를 관리하기 위한 시스템 및 방법
US9405348B2 (en) 2008-04-21 2016-08-02 Adaptive Computing Enterprises, Inc System and method for managing energy consumption in a compute environment
US7756652B2 (en) 2008-04-24 2010-07-13 Oracle America, Inc. Estimating a power utilization of a computer system
US8296773B2 (en) * 2008-06-30 2012-10-23 International Business Machines Corporation Systems and methods for thread assignment and core turn-off for integrated circuit energy efficiency and high-performance
US8255709B2 (en) * 2009-02-06 2012-08-28 Hewlett-Packard Development Company, L.P. Power budgeting for a group of computer systems using utilization feedback for manageable components
US8365175B2 (en) 2009-03-10 2013-01-29 International Business Machines Corporation Power management using dynamic application scheduling
US8589931B2 (en) 2009-03-18 2013-11-19 International Business Machines Corporation Environment based node selection for work scheduling in a parallel computing system
US9015726B2 (en) * 2009-04-03 2015-04-21 International Business Machines Corporation Scheduling jobs of a multi-node computer system based on environmental impact
WO2010138031A1 (en) 2009-05-26 2010-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Method and scheduler in an operating system
US8904394B2 (en) 2009-06-04 2014-12-02 International Business Machines Corporation System and method for controlling heat dissipation through service level agreement analysis by modifying scheduled processing jobs
US8276012B2 (en) 2009-06-30 2012-09-25 International Business Machines Corporation Priority-based power capping in data processing systems
JP2011013764A (ja) * 2009-06-30 2011-01-20 Hitachi Ltd 消費電力管理方法、消費電力管理システムおよびプログラム
US8589709B2 (en) 2009-07-23 2013-11-19 Carnegie Mellon University Systems and methods for managing power consumption and performance of a processor
US8443209B2 (en) * 2009-07-24 2013-05-14 Advanced Micro Devices, Inc. Throttling computational units according to performance sensitivity
US8224993B1 (en) 2009-12-07 2012-07-17 Amazon Technologies, Inc. Managing power consumption in a data center
US8336056B1 (en) 2009-12-22 2012-12-18 Gadir Omar M A Multi-threaded system for data management
US8341441B2 (en) * 2009-12-24 2012-12-25 International Business Machines Corporation Reducing energy consumption in a cloud computing environment
US8429433B2 (en) * 2010-01-15 2013-04-23 International Business Machines Corporation Dynamically adjusting an operating state of a data processing system running under a power cap
US8627123B2 (en) * 2010-03-25 2014-01-07 Microsoft Corporation Managing power provisioning in distributed computing
US9052895B2 (en) 2010-04-07 2015-06-09 International Business Machines Power budget allocation in multi-processor systems
US8612984B2 (en) 2010-04-28 2013-12-17 International Business Machines Corporation Energy-aware job scheduling for cluster environments
US8412479B2 (en) * 2010-06-29 2013-04-02 Intel Corporation Memory power estimation by means of calibrated weights and activity counters
US8589932B2 (en) 2010-07-02 2013-11-19 International Business Machines Corporation Data processing workload control
US8464080B2 (en) * 2010-08-25 2013-06-11 International Business Machines Corporation Managing server power consumption in a data center
US8694810B2 (en) 2010-09-22 2014-04-08 International Business Machines Corporation Server power management with automatically-expiring server power allocations
US8627322B2 (en) * 2010-10-29 2014-01-07 Google Inc. System and method of active risk management to reduce job de-scheduling probability in computer clusters
KR20120072224A (ko) 2010-12-23 2012-07-03 한국전자통신연구원 전력 획득 예측에 기반한 센서 노드의 전원 제어 장치 및 방법
US8645733B2 (en) 2011-05-13 2014-02-04 Microsoft Corporation Virtualized application power budgeting
US8904209B2 (en) 2011-11-14 2014-12-02 Microsoft Corporation Estimating and managing power consumption of computing devices using power models
US9244721B2 (en) 2011-11-24 2016-01-26 Hitachi, Ltd. Computer system and divided job processing method and program
CN103136055B (zh) 2011-11-25 2016-08-03 国际商业机器公司 用于在数据库服务中控制对计算资源的使用的方法和装置
US8689220B2 (en) * 2011-11-30 2014-04-01 International Business Machines Corporation Job scheduling to balance energy consumption and schedule performance
US9218035B2 (en) 2012-02-10 2015-12-22 University Of Florida Research Foundation, Inc. Renewable energy control systems and methods
US9262232B2 (en) 2012-02-29 2016-02-16 Red Hat, Inc. Priority build execution in a continuous integration system
KR20160114195A (ko) 2012-05-14 2016-10-04 인텔 코포레이션 컴퓨팅 시스템의 동작 관리
CN104335137B (zh) 2012-05-17 2017-10-24 英特尔公司 管理计算系统的功耗和性能
CN102685808A (zh) * 2012-05-18 2012-09-19 电子科技大学 一种基于功率控制的分布式聚簇方法
US8843773B2 (en) 2012-06-13 2014-09-23 Cisco Technology, Inc. System and method for automated service profile placement in a network environment
US9342376B2 (en) 2012-06-27 2016-05-17 Intel Corporation Method, system, and device for dynamic energy efficient job scheduling in a cloud computing environment
CN102819460B (zh) * 2012-08-07 2015-05-20 清华大学 一种基于预算功率指导的高能效gpu集群系统调度方法
JP5787365B2 (ja) * 2012-09-18 2015-09-30 Necフィールディング株式会社 電力制御装置、電力制御システム、電力制御方法及びプログラム
US8939654B2 (en) 2012-09-27 2015-01-27 Adc Telecommunications, Inc. Ruggedized multi-fiber fiber optic connector with sealed dust cap
GB2506626B (en) 2012-10-03 2018-02-07 Imperial Innovations Ltd Frequency estimation
US20140137121A1 (en) 2012-10-05 2014-05-15 Hitachi, Ltd. Job management system and job control method
US20140114107A1 (en) 2012-10-24 2014-04-24 Lummus Technology Inc. Use of hydrocarbon diluents to enhance conversion in a dehydrogenation process at low steam/oil ratios
US9110972B2 (en) 2012-11-07 2015-08-18 Dell Products L.P. Power over ethernet dynamic power allocation system
US9250858B2 (en) * 2013-02-20 2016-02-02 International Business Machines Corporation Dual-buffer serialization and consumption of variable-length data records produced by multiple parallel threads
US9009677B2 (en) 2013-03-18 2015-04-14 Microsoft Technology Licensing, Llc Application testing and analysis
US9329910B2 (en) * 2013-06-20 2016-05-03 Seagate Technology Llc Distributed power delivery
US9335751B1 (en) * 2013-08-28 2016-05-10 Google Inc. Dynamic performance based cooling control for cluster processing devices
JP6201530B2 (ja) * 2013-08-30 2017-09-27 富士通株式会社 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法
US9753520B2 (en) 2013-12-23 2017-09-05 Dell Products, L.P. Predictive power capping and power allocation to computing nodes in a rack-based information handling system
US9189273B2 (en) * 2014-02-28 2015-11-17 Lenovo Enterprise Solutions PTE. LTD. Performance-aware job scheduling under power constraints
US9336106B2 (en) * 2014-04-17 2016-05-10 Cisco Technology, Inc. Dynamically limiting bios post for effective power management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101836190A (zh) * 2007-10-31 2010-09-15 国际商业机器公司 用于将多个作业分配给多个计算机的方法、系统和计算机程序
CN101694631A (zh) * 2009-09-30 2010-04-14 曙光信息产业(北京)有限公司 实时作业调度系统及方法
CN103229125A (zh) * 2010-11-29 2013-07-31 思科技术公司 机箱内的刀片服务器之间的动态功率平衡

Also Published As

Publication number Publication date
CN111176419A (zh) 2020-05-19
WO2016028371A1 (en) 2016-02-25
CN106537348B (zh) 2020-04-14
US20160054779A1 (en) 2016-02-25
JP2017531245A (ja) 2017-10-19
US9575536B2 (en) 2017-02-21
EP3183628A4 (en) 2018-06-13
US20160054783A1 (en) 2016-02-25
CN111176419B (zh) 2024-04-19
KR102213555B1 (ko) 2021-02-08
US9927857B2 (en) 2018-03-27
US20160054775A1 (en) 2016-02-25
JP6386165B2 (ja) 2018-09-05
US20160054780A1 (en) 2016-02-25
EP3183654A1 (en) 2017-06-28
EP3183654A4 (en) 2018-04-18
CN106537287B (zh) 2019-12-17
EP3183628A1 (en) 2017-06-28
JP6701175B2 (ja) 2020-05-27
WO2016028374A1 (en) 2016-02-25
US20160054774A1 (en) 2016-02-25
CN107003706A (zh) 2017-08-01
KR102207050B1 (ko) 2021-01-25
US9921633B2 (en) 2018-03-20
CN106537287A (zh) 2017-03-22
JP2017530449A (ja) 2017-10-12
KR20170021864A (ko) 2017-02-28
US10289183B2 (en) 2019-05-14
CN106537348A (zh) 2017-03-22
EP3627285A1 (en) 2020-03-25
KR20170021338A (ko) 2017-02-27
US20160054781A1 (en) 2016-02-25
EP3183629A1 (en) 2017-06-28
EP3183629B1 (en) 2023-05-31
EP3183629A4 (en) 2018-05-02
WO2016028375A1 (en) 2016-02-25
EP4016248A1 (en) 2022-06-22
US10712796B2 (en) 2020-07-14

Similar Documents

Publication Publication Date Title
CN107003706B (zh) 非暂时性计算机可读存储介质和用于管理作业的装置
US11582166B2 (en) Systems and methods for provision of a guaranteed batch
US9405563B2 (en) Resource management method and apparatus for virtual machine system, and virtual machine system
US8301742B2 (en) Systems and methods for coordinated management of power usage and runtime performance in performance-managed computing environments
US8020161B2 (en) Method and system for the dynamic scheduling of a stream of computing jobs based on priority and trigger threshold
JP5946068B2 (ja) 演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム
WO2017045576A1 (en) System and method for resource management
RU2697700C2 (ru) Равноправное разделение системных ресурсов в исполнении рабочего процесса
JP2011258119A (ja) クラスタ構成管理方法、管理装置及びプログラム
US20140137122A1 (en) Modified backfill scheduler and a method employing frequency control to reduce peak cluster power requirements
JP5428772B2 (ja) 電力制御装置,コンピュータシステム,電力制御方法,コンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant