CN108694088A - 在机柜式架构中的调节、子节点组合和平衡处理 - Google Patents

在机柜式架构中的调节、子节点组合和平衡处理 Download PDF

Info

Publication number
CN108694088A
CN108694088A CN201810216974.1A CN201810216974A CN108694088A CN 108694088 A CN108694088 A CN 108694088A CN 201810216974 A CN201810216974 A CN 201810216974A CN 108694088 A CN108694088 A CN 108694088A
Authority
CN
China
Prior art keywords
resource
sla
core
adjusting
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810216974.1A
Other languages
English (en)
Inventor
M·J·库玛尔
M·K·纳奇姆苏
V·斯里尼瓦桑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN108694088A publication Critical patent/CN108694088A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2425Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3296Power saving characterised by the action undertaken by lowering the supply or operating voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5022Ensuring fulfilment of SLA by giving priorities, e.g. assigning classes of service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/80Actions related to the user profile or the type of traffic
    • H04L47/805QOS or priority aware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Power Sources (AREA)

Abstract

一种包括多个节点的机架系统可以实现热/功率调节、子节点组合和基于电压/频率的处理平衡。在热/功率调节中,至少部分地基于热事件或功率事件,至少一个资源被调节。在子节点组合中,多个计算核心被划分为目标数量的域。在基于电压/频率的处理平衡中,第一核心以第一电压或频率来执行第一处理作业,并且第二核心以与第一电压或频率不同的第二电压或频率来执行第二处理作业。

Description

在机柜式架构中的调节、子节点组合和平衡处理
技术领域
本公开总体上涉及包括多个节点的计算机机架系统(也称为刀片式或SLED式),并且更具体地涉及基于这样的机架系统中的热/功率调节、子节点组合和处理平衡。
背景技术
分解计算是基于资源池的新兴领域。一种分解计算解决方案已知为机柜式架构(RSA)。
在当今的系统中,在机架中发生功率预算或热事件时,系统线性地调节机架组件(例如,计算节点)。对于大多数系统,该线性调节可能影响服务等级协议(SLA)的实现。例如,如果关键组件(例如存储节点)被调节,则调节会影响节点中的所有节点的性能。
此外,在常规机柜式架构中,计算节点是以裸金属级别构成的。因此,机架所有者向构成的系统用户提供计算节点中的至少一个以及池化的系统组件,例如存储装置或网络带宽。另外,随着技术的进步,系统中的处理器中的处理核心的数量不断增加。因此,构成的系统用户中的一些用户可能不需要处理器中的核心中的所有核心。
另外,由于固有的制造变化,单独的核心可以以不同的电压进行操作。常规的操作系统(OS)调度器不能感知单独的核心中的这些变化。
因此,常规地,系统将插槽或管芯内的核心中的所有核心限制为以可用核心中的所有核心的最低通用核心电压和频率进行工作。因此,OS调度器跨管芯空间均匀地放置工作负载。
作为结果,相邻的核心可能过热。这种过热会导致引起发生性能瓶颈的核心温度。
附图说明
图1示出了根据本公开的一个实现的机架的实现;
图2示出了根据本公开的一个实现的由用于调节的编排层或BMC基于热/功率区域执行的示例性算法;
图3示出了根据本公开的一个实现的示例处理核心;
图4示出了常规的计算节点的示例;
图5示出了根据本公开的实现的计算节点的示例;
图6示出了根据本公开的一个实现的计算节点的另一示例;
图7示出了根据本公开的一个实现的用于确定计算节点的配置的算法;
图8示出了根据本公开的一个实现的用于选择子域以满足SLA的作业的算法;
图9示出了根据本公开的一个实现的机架的抽屉内的计算节点的频率的示例;以及
图10示出了根据本公开的一个实现的用于基于V-F图来指派节点的算法。
具体实施方式
图1示出了根据本公开的一个实现的机架100的实现。
在许多实现中,机架100在软件定义的基础架构(SDI)中操作。在SDI中,执行的应用及其服务等级定义了系统要求。SDI通过能够动态使应用资源分配“达到最佳”、实现在几分钟内供应服务并且显著减少成本,从而使数据中心能够实现更大的灵活性和效率。
机架100与编排层接合。编排层是在所公开的机柜式设计上下文中的POD管理器的顶层运行的软件中被实现的。POD管理器管理POD,该POD是通常由POD管理器管理的一个或多个机架的分组。
编排软件基于由服务保证层提供给编排软件的数据来提供、管理和指派资源。更具体地,编排软件负责提供以下资源,例如计算资源、网络资源、存储资源、和数据库资源,以及组成和启动应用或工作负载并且监测硬件和软件。尽管编排层不需要被包括在机架100中,但是编排层的确被包括在至少一个实现中。编排层包括硬件逻辑或由硬件逻辑执行。硬件逻辑是编排单元的示例。
基础架构容量和应用资源的智能监测帮助编排软件基于实际的、当前数据而不是基于历史数据的估计或平均消耗需求的静态模型来做出关于工作负载放置的决定。
机架包括多个抽屉110。每个抽屉110包括节点槽120、传感器和节点130。机架100中的节点中的每一个至少部分地在硬件中被实现。在本示例中,节点130是计算节点。然而,节点可以是存储节点、现场可编程门阵列(FPGA)等。
节点槽120接受计算节点130以用于插入。图1示出了两个抽屉110,其总共包括一个空的节点槽120和由计算节点130占用的三个节点槽。当然,这个示出仅仅是为了示例性的目的,并不以任何方式限制本公开的实现。例如,节点槽中的所有节点槽都可以由计算节点130来填充。另外,每个抽屉110可以具有更少或更多的槽。
节点槽120包括用于将计算节点130安装在抽屉110内的结构。节点槽120另外包括导线以用于提供电力并且用于与计算节点130传送信号。
节点槽120包括传感器140,其指示计算节点130何时以及是否已经插入到相应的节点槽120中。传感器140可以将信号发送到编排层指示计算节点130的插入。
传感器包括传感器150和160。图2示出了安装在节点130上的传感器150和160。附加地或可替代地,传感器150和160也可以安装在节点槽120上。传感器150测量计算节点130附近的温度。传感器150将其测量发送到控制器170。传感器150是温度感测单元的示例。
传感器160测量抽屉110内的电特性。这些电特性可以是电压、电阻、电流或其组合(例如,功率)。传感器160可以位于多个位置。作为结果,传感器160可以测量例如在相同的抽屉中或在一些其他位置中的任何两个节点之间的电压差或跨任何两个节点的电阻。类似地,传感器160可以确定跨例如抽屉110内或整个机架100内的任何导线的电阻或通过任何导线的电流。
控制器170从传感器150和160接收所发送的测量。控制器170基于由传感器150和160感测的测量来控制计算节点130的各方面。例如,控制器可以实现如下所述的算法的至少一部分。控制器170还执行指派给SLA中的计算节点130的作业的处理。控制器170可以将数据(例如,来自传感器150和160的信号)传送到机架的编排层。
控制器170可以是基带管理控制器(BMC)或编排层的一部分。控制器170包括高速缓冲存储器。控制器170是处理单元的示例。
在一个实现中,计算节点130包括被实现为附加存储器180的非易失性存储器或固态驱动器。计算节点130还可以包括联网资源。存储器180是存储单元的示例。
基于热/功率区域的调节
服务提供商提供例如与用户签订合同云服务以提供在定义的服务等级处的计算机机架服务。得到的合同被称为SLA。这些SLA的条款可以像人类的创造力许可一样复杂。然而,在一些实例中,机架的编排层或BMC可以强制执行这些SLA的条款作为策略。
例如,机架所有者可以在计算节点的基础上定义SLA。在这样的情况中,机架所有者将机架的一个或多个计算节点的至少一部分指派给用户以执行作业。可选地或可替代地,机架所有者可以基于作业持续时间来定义SLA,其中机架所有者同意允许用户在限定的持续时间(例如,30分钟)内执行作业。这个作业可以用于在持续时间内自身使用至少一个计算节点。这个作业也可以是在持续时间内完成特定的任务无论节点的数量。可选地或可替代地,SLA可以需要带宽的量、或者每秒处理的帧的数量、或者每秒执行的指令的数量。
可选地或可替代地,机架所有者可以在错误的处置的基础上来定义SLA。例如,错误可以被定义为中断的上传,并且相对应的处置可以是重新执行该上传。在另一种情况下,错误可以被定义为程序在作业期间内没有连续运行;该错误的相对应的处置可以是重新执行该作业。在另一情况下,这个过程可以被指定为关键任务。在这种情况下,如果发生任何指定的错误,则机架所有者可以对用户有责任以补偿经济损失。
在这些SLA的实现期间,可以发生错误(尤其是基于功率的错误)或热事件,针对错误或热事件,调节编排层、BMC、基本输入/输出系统(BIOS)、微代码或OS对资源。这些资源可以是例如存储器带宽、处理器互连带宽、应用于处理核心的电压、应用于处理核心的频率、或者处理器操作或存储器存取的数量。
带宽的减少通常涉及在计算节点与外部网络(例如因特网)之间提供的带宽。然而,带宽的减少还可以与内部网络带宽或者节点或机架内部的总线带宽有关。
BMC、BIOS、编排层或OS调度器可以以多种方式来执行调节。作为一个示例,BMC、BIOS编排层或OS调度器可以减少或减慢存储器存取带宽。也就是说,BMC、BIOS编排层或OS调度器可以减少处理器核心时钟。作为另一示例,BMC、BIOS、编排层或OS调度器可以降低应用于处理器核心的电压。系统电压或频率的中的这种降低可以引起在一段时间内执行的访问或操作的数量的减少,并因此减少了系统所需的带宽或功率。
通常调节处理器、存储器或网络资源。在BMC或编排层调节处理器的情况下,对处理器的访问与在预定时间内由处理器执行的指令的速率相关。在BMC或编排层调节存储器存取的数量的情况下,这些存取与在预定时间段内由存储器执行的读取和写入的数量相关。
在一个实施例中,POD管理器或编排层首先基于从抽屉(例如,抽屉110)中的传感器(例如,传感器140)接收的信号来在机架(例如,机架100)中创建节点(例如,节点130)的映射。例如,POD管理器或编排层确定机架中抽屉的数量以及每个抽屉中的每个占用的节点的位置。接下来,POD管理器或编排层将每个占用的节点与该节点相应的SLA的条款相关联。在许多情况下,POD管理器或编排层本身将SLA指派给节点。然后,POD管理器或编排层确定在不违反该节点的SLA的条款的情况下由每个节点可以容忍的错误。
当系统是可操作的时,POD管理器或编排层基于从传感器(例如,传感器150和/或160)接收的信号,生成机架的热量和/或功率映射。POD管理器或编排层可以定期地生成映射。例如,BMC或编排层可以每五秒钟生成(或更新)映射。当然,POD管理器或编排层可以更频繁地或更不频繁地、以随机间隔、或以动态调整的间隔来生成(或更新)映射。
图2示出了由用于调节的编排层或BMC基于热/功率区域执行的示例性算法。图2的主题可以是但不一定是结合图1的主题来实现的。
该算法在S200开始并进行到S210。在S210中,POD管理器、编排层或传感器确定在机架的区域中是否发生调节事件。另外,POD管理器或编排层确定调节事件发生在其中的区域。该区域可以是抽屉、节点、离节点最近的最近部分(例如,一半、三分之一、四分之一)、或者一些其他定义的区域。
调节事件可以是热事件或功率事件。热事件是其中编排层、POD管理器或传感器确定传感器150已经感测到抽屉的区域中的温度已经超过预定阈值的事件。功率事件是其中编排层、POD管理器或传感器确定传感器160已经感测到在机架的区域中电压差或电阻变为零或电流或功率超过预定阈值的事件。在任何情况下,调节事件不一定是热事件或功率事件,也可能是不同的事件。
如果POD管理器、编排层或传感器确定在区域中没有发生调节事件,则算法返回到S210。相反,如果POD管理器、编排层或传感器确定调节事件已经发生,则算法进行到S230。
在S220处,编排层或POD管理器或BMC确定什么资源将被调节。如上所述,这些资源可以是带宽、功率或对存储器或处理器的存取的数量。该算法然后进行到S230。
在S230中,系统确定该区域中的每个SLA的条款。这些SLA的条款通常可以减少为带宽、功耗或对存储器或处理器的存取的数量。因此,系统确定负责调节的特定资源。该算法然后进行到S240。
在S240中,系统确定计算节点的资源。在一个实现中,系统确定执行非关键任务作业的每个计算节点的资源。更具体地,系统确定带宽、功耗或计算节点执行的对存储器或处理器的存取的数量。然后该算法进行到S250。
在S250中,系统确定用于区域中每个计算节点的资源的余裕空间(head room)。该确定是关于在S230中确定的条款以及在S240中确定的资源而作出的。更具体地,系统确定在S240中确定的资源是否超过在S230中确定的SLA的条款。如果是,则这些过多的资源可以由系统调节。然后该算法进行到S260。
在S260中,系统基于在S250中确定的余裕空间来调节该区域中的计算节点的适合的资源。例如,系统调节带宽、功耗或由计算节点执行的对存储器或处理器的存取的数量。在一个实现中,这种调节是通过减少系统时钟或系统电压来执行的。然后该算法进行到S270。
在S270中,POD管理器、BMC或编排层确定是否已经发生充分的调节。在一个实现中,POD管理器、BMC或编排层确定热事件或功率事件是否已经结束。如果热事件或功率事件尚未结束,则POD管理器、BMC或编排层可以决定没有发生足够的调节。如果系统确定没有发生足够的调节,则算法返回到S220。另一方面,如果POD管理器、BMC、编排层或传感器确定已经已发生足够的调节,则算法在S280处结束。
在图2的算法的一些实现中,BMC由管理控制器替换。管理控制器的示例包括PCH中的管理引擎(ME)和创新引擎(IE)。
因此,在调节事件的情况下,可以保持某些节点的足够的性能。作为结果,来自调节事件的对SLA的影响可以被最小化,或甚至可以被避免。
子域组合
根据本公开的实现将计算节点划分为允许多个OS在裸金属级被引导的子域。将计算节点划分为子域可以是基于容量的,例如存储器的量、处理器速度和高速缓存大小。
平台控制器集线器(PCH)是先前的北桥/南桥设计的演变。PCH通常指向南桥功能。然而,PCH还可以包含一些北桥功能,例如时钟。PCH还可以控制数据路径和支持功能,例如直接媒体接口(DMI)。在一些实现中,PCH可以控制灵活显示接口(FDI)。PCH的一个实现是PCH。
PCH功能的至少一部分可以由一个或多个处理器核心和/或系统管理中断(SMI)和一些现场可编程门阵列(FPGA)组件内的微代码来仿真,以将管理程序嵌入到BIOS本身。
在转向与本公开相关联的附加活动之前,提供一些基础信息以帮助理解。系统中的核心的数量不一定等于插槽的数量。插槽与物理板(例如印刷电路板[PCB])的物理部分相对应。因此,SLED可以托管各种数量的插槽。插槽包括多个处理核心、输入/输出控制器、存储器控制器以及链路控制器。
图3示出了根据本公开的一个实现的示例性处理器300。处理器300包括集成存储器控制器(IMC)310、平台控制器集线器(PCH)320、BIOS 330、管理程序340以及处理核心350。许多实现包括多于一个的处理核心350。
IMC 310控制用于处理核心350的存储器。如果处理核心350被拆分为多个子域,则IMC 310控制用于子域中的每一个的存储器。
平台控制器集线器(PCH)320支持子域。通常,每处理核心350一个PCH。在本公开的一些实现中,PCH可以被仿真。因此,可以创建虚拟子域而不需要附加的PCH。
BIOS 330是由处理器执行的存储在存储器中的一组指令。更具体地,BIOS 330是在引导过程(例如,上电启动)期间执行硬件初始化的一类固件。BIOS 330还提供用于操作系统和程序的运行时服务。
BIOS 330可以用于嵌入式管理程序340。当管理程序340被嵌入在BIOS中时,BIOS充当其中可以加载多个OS的可信虚拟机监控器(VMM)。BIOS 330被认为是可信的组件。一旦新的BIOS映像被签名,则管理程序340也被签名以确保嵌入式管理程序340的完整性不被损害。由管理程序340利用BIOS 330建立的内部通道是可信的。因此,管理程序340的这种嵌入准许建立到BMC的可信的通信。
图4示出了常规计算SLED 400的示例。计算SLED 400包括处理插槽405、415、425和435。处理插槽405、415、425和435中的每一个在硬件中被实现并且可以具有多个核心。
处理插槽405经由交联410与处理插槽415通信,经由交联430与处理插槽435通信,并且经由交联420与处理插槽425通信。处理插槽415经由交联445与处理插槽435通信并且经由交联440与处理插槽425通信。处理插槽435经由交联450与处理插槽425通信。交联410、420、430、440、445以及450是处理器内交联。
虽然计算SLED 400被示出有四个处理插槽,但是计算SLED 400可以包括附加的或更少的处理插槽。在这种情况下,每个单独的处理插槽可以经由交联与每个其他处理插槽通信。然而,特定的处理插槽不需要经由交联与每个其他处理插槽通信。
图5示出了根据本公开的实现的计算SLED 500的示例。计算SLED 500包括处理插槽505、515、525和535。处理插槽505、515、525和535中的每一个在硬件中被实现。
在图5中,交联510、520、530、540和545已由管理程序340禁用。因此,处理插槽505不经由交联510与处理插槽515通信、不经由交联530与处理插槽535通信,并且不经由交联520与处理插槽525通信。处理插槽515不经由交联545与处理插槽535通信,并且不经由交联540与处理插槽525通信。然而,如图5所示,处理插槽535经由交联550与处理插槽525通信。交联510、520、530、540、545和550是处理器内交联。
以这种方式,处理插槽505和515彼此独立以及独立于处理插槽525和535来进行操作。处理插槽525和535协同地进行操作。因此,图5示出了三个域,第一个是处理插槽505,第二个是处理插槽515,并且第三个是处理插槽525和535。因为这三个域彼此不通信,所以它们被认为是隔离的。
图5示出了由管理程序340禁用的交联的一个实现。在另一个实现中,交联510、520、530、540、545和550全部由管理程序340禁用。因此,处理插槽505、515、525和535中的每一个彼此独立地操作。在又一个实现中,交联520、530、540和545由管理程序340禁用,但是交联510和550不由管理程序340禁用。因此,计算SLED 500可以包括两个域,第一个是处理插槽550和515,第二个是处理插槽525和535。
图6示出了根据本公开的一个实现的计算SLED 600的示例。计算SLED 600包括处理插槽605、615、625和635。处理插槽605、615、625和635中的每一个都以硬件实现。
此外,处理插槽605、615、625和635中的每一个包括管理程序。因此,计算SLED 600有效地具有五个域。交联610、620、630、640、645和650是处理器内交联。
图6的管理程序实现被示为在由管理程序340对图5的交联禁用之后发生。然而,这样的示出仅仅是用于解释的目的。图6的管理程序实现可以在图5的交联禁用之前或与其同时发生。此外,包括由管理程序340对图5的交联禁用的实现不需要包括图6的管理程序实现。类似地,包括图6的管理程序实现的实现不需要包括由管理程序340对图5的交叉禁用。
处理器插槽605、615、625和635的核心中的每一个都可以在系统被划分时被进一步细分。例如,假设处理器插槽605、615、625和635中的每一个都包含10个核心。在这种情况下,计算SLED 600可以协同地操作为包括4个插槽每插槽10个核心的单个实体。计算SLED600也可以操作为两个实体,其中每个实体包括2个插槽,每插槽10个核心。另外,计算SLED600可以操作为四个实体,其中每个实体包括1个插槽,每插槽10个核心。这样的实现是插槽级别划分的示例。另外,插槽可以被细分。因此,在一个示例中,计算SLED 600可以操作为八个实体,其中实体中的每个包括一个插槽五个核心。当然,插槽可以被细分为任意数量的核心。可以在每个细分的插槽上运行操作系统。
图7示出了根据本公开的一个实现的用于确定计算节点的配置的算法。
算法开始于S700并进行到S710,其中BMC或编排层接收域的目标数量。在一些实现中,机架所有者指定域的目标数量。在各种实现中,应用或作业本身可以提供域的目标数量。
在其他实现中,BMC或编排层接收SLA。BMC或编排层可以从SLA确定一组资源,例如核心的数量、存储器的量或网络带宽的量。在至少一个实现中,BMC或编排层接收一组资源,例如核心的数量、存储器的量或网络带宽的量。然后计算节点确定最小的一组资源(例如,处理器核心)以提供这些资源。
此外,在许多实施例中,域的目标数量是2的幂。然而,域的目标数量不限于此。然后该算法进行到S720。
在S720中,管理程序340确定要被禁用的交联(例如,交联510、520、530、540、545和550)。然后该算法进行到S730。
在S730中,管理程序340禁用多个交联。然后该算法进行到S740。
在S740中,BMC或编排层确定处理核心以实现管理程序。管理程序的使用会略微降低整体性能。因此,与用于改变子域的数量的其他操作相比,管理程序的使用具有较低的优先级。所识别的处理核心实现管理程序。然后该算法进行到S750。
在S750中,BMC或编排层确定用于使其IMC被拆分的处理核心,并拆分多个IMC。这些处理核心是使用管理程序进行分的核心。然后该算法进行到S760。
因此,通过在S730中在插槽级别细分处理器核心并在S740处实现管理程序,处理器核心被划分为在S710处接收的目标数量的子域。
在S760中,处理核心使用上述处理器、IMC和管理程序来处理数据(例如,执行在SLA中定义的作业)。然后该算法在S770结束。
图8示出了根据本公开的一个实现的用于选择子域以满足SLA的作业的算法。
算法开始于S800并进行到S810,其中服务器接收与SLA相关联的作业请求。然后该算法进行到S820。
在S820中,机柜式设计(RSD)服务器接收资源请求。例如,作业可以使用预定义的处理或存储器资源(例如,8个核心或2TB的存储器)。RSD服务器从应用接收这些资源的指示。因此,取决于作业,系统知道要被提供的处理器的数量。然后该算法进行到S830。
在S830中,RSD服务器向BMC通知作业和要被提供的资源。然后该算法进行到S840。
在S840中,BMC确定可用资源,如稍后关于图9所描述的。然后,该算法进行到S840。
在S850中,选择资源。在一个实现中,BMC选择最小资源。更具体地,BMC选择具有满足SLA的最少资源的子域。在另一实现中,BMC将可用资源的列表提供给POD管理器。然后,POD管理器选择资源。因此,该算法可以将更少的资源用于每个SLA。然后该算法进行到S860,其中该算法结束。
因此,本公开的一些实现允许计算节点将系统显露为实现多个子域的可配置系统。用户可以请求某种配置,如核心的数量和存储器的量。系统可以被重新配置,例如通过使用管理程序,来匹配该请求并且将系统作为裸金属组件显露为机柜式组成的系统用户。
本公开还使机架所有者通过不将资源过度用于任何一个用户来有效地使用其机架。
显露核心的V-F图
制造良率的缺陷阻止计算节点的插槽内的一些处理核心以与其他处理核心相同的最大电压来进行操作。通常,插槽的核心中的所有核心都以相同的最大电压和频率为上限以避免损坏处理核心中的一些。
通常,OS调度器或管理程序调度器随机选择核心以运行作业。此外,POD管理器(PODM)假设用于核心中的所有核心的最大电压和频率是相同的。因此,只要PODM知道最大电压和频率,PODM就可以计算出插槽的总体性能。例如,如果核心性能cp=V x F且存在10个核心,则总体性能为10x cp。
POD管理器包括固件和软件应用接口(API),其实现管理资源和策略并且将标准接口显露给POD管理器之下的硬件以及其上方的编排层。POD管理器API允许以灵活的方式使用机柜式架构(RSA)系统资源,并允许与其中使用RSA的生态系统集成。POD管理器实现健康监测和故障排除(例如,故障定位和隔离)以及物理定位特征。
本公开的实现收集BIOS中每个处理器核心的操作状态的可能电压和频率,并将该数据提供给PODM以有效地调度工作负载从而获得更好的性能。因此,在本公开的一个实现中,评估了处理核心的P-状态(或性能状态)。通过将每个处理器核心的电压和频率显露给OS或管理程序以及PODM,每个核心可以以不同的电压和/或频率执行处理作业以提高性能,而不是对所有核心固定用于作业性能的相同的电压/频率。
系统感知处理核心的几何结构以及在计算节点内处理核心的位置。因此,一些实施例通过将作业拆分在较高电压处理核心当中来避免过热。例如,不是OS调度器选择彼此相邻的高电压核心,而是OS调度器可以选择彼此定位较远的核心以减少热效应从而产生插槽级别的热平衡。
图9示出了根据本公开的一个实现的用于机架的计算节点内的核心的频率的示例。如图9所示,较上一行的核心可以处理范围从3.8到4.0GHz的最大频率。相反,较低一行的核心可以处理范围从3.7到4.0GHz的最大频率。因此,在常规节点中,核心以3.7GHz为上限进行工作。减少的上限可阻止核心中的大多数核心以其全部容量来操作。
图10示出了根据本公开的一个实现的用于基于V-F图来将处理作业指派给处理核心的算法。
在引导时,处理器执行BIOS。由处理器执行的BIOS确定抽屉中每个SLED的位置。由处理器执行的BIOS可以基于例如从监测SLED的每个位置的传感器接收到的信号来确定这些位置。
对于每个SLED,在S1110中,由处理器执行的BIOS收集由节点的多个处理器核心中的每个处理器核心容许的操作状态的电压或频率、由处理器核心容许的每秒最多事务(TPCC)、以及处理核心的位置。BIOS将这些信息发送到编排层。
每个核心的最大频率是在制造时确定的,并且最大设置在制造期间被熔合。PCU(功率控制单元)或类似的功率控制器可以读取熔合的设置并控制到每个核心的功率。通常情况下,性能状态会显露给OS,并且OS可以通过在每个核心中设置模型特定寄存器(MSR)来设置单个核心的性能状态。
在S1120,POD管理器编排选择计算节点,并基于第一SLA或TPCC能力将工作负载推送到计算节点。然而,POD管理器编排并不一定能够控制插槽中的哪个核心将执行工作负载。
在S1130,所选择的计算节点内的OS或管理程序接收第一处理作业和与第一作业相对应的第一SLA。因此,OS调度器或管理程序调度器将第一处理作业指派给插槽中的第一核心。具体地,OS调度器或管理程序调度器基于第一SLA以及由每个核心容许的电压或频率,来确定将第一处理作业指派给第一处理核心。更具体地,OS调度器或管理程序调度器基于SLA中的持续时间(例如,分钟的数量)或TPCC来确定将第一处理作业指派给第一核心。
另外,OS或管理程序试图使高于第一SLA中所同意的持续时间和/或TPCC最小化。例如,处理作业可以需要每秒75万条指令。第一处理核心能够处理每秒1亿个事务。第二处理核心能够处理每秒8千万个事务。在这种情况下,OS或管理程序选择第二处理核心,因为其每秒500万个事务比第一处理核心每秒附加2000万个事务少。
类似地,第一处理核心能够在10分钟内完成作业。相比之下,第二处理核心能够在12分钟内完成作业。在这种情况下,OS或管理程序选择第一处理核心,因为第一处理核心可以在更短的时间内完成作业。
当然,OS或管理程序可以针对完成时间来权衡TPCC。这种权衡可以以许多方式发生,并且在本公开的范围之外。
在将第一处理作业指派给第一核心时,OS或管理程序通过在相应核心中设置MSR来设置第一核心的性能状态。
在S1140,如前所述,POD管理器编排选择计算节点并且基于第二SLA和TPCC能力来推送工作负载。同样,POD管理器编排不一定控制插槽中的哪个核心来执行工作负载。
在S1150中,所选择的计算节点中的OS或管理程序接收第二处理作业和与第二处理作业相对应的第二SLA,该计算节点可以与被选择用于第一处理作业的节点相同或不相同。当然,第二SLA可以与第一SLA是相同的SLA。因此,OS调度器或管理程序调度器基于第二SLA、第二核心的频率以及第一核心和第二核心的位置将第二处理作业指派给第二核心。
特别地,OS调度器或管理程序调度器可以基于与OS或管理程序将第一处理作业指派给第一核心相似的SLA和电压和频率标准,来将第二处理作业指派给第二核心。另外,OS调度器或管理程序调度器可以基于第一核心和第二核心的位置将第二处理作业指派给第二核心。特别地,OS调度器调度相同管芯上的非相邻核心以运行工作负载,从而避免由在相同管芯上彼此相邻的核心上运行工作负载而导致的过热。
在将第二处理作业指派给第二核心时,OS或管理程序通过设置相应的核心中的MSR,来设置第二核心的性能状态。
然后该算法在S1160结束。
本公开的一些实现使得每个核心能够单独地通告其操作的最大电压和频率以及管芯内的核心的位置。因此,与跨管芯内的所有核心的最低频率为上限的传统插槽相比,本公开的一些实现可以给出更好的性能。
OS调度器本身可以感知这些数据并且可以以它们相应的最大电压或频率来运行核心,或者使得单独的核心自动地以它们相应的最大电压或频率运行以获得更好的性能。例如,POD管理器可以将总体性能计算为,如cpl+cp2+...+cp10(=V1xF1+V2xF2+...+V10xF10)。这种方法可以实现额外的性能并且POD管理器可以准确地确定性能,而不是针对所有处理器以电压和频率为上限的传统的方法。
另外,OS可以知晓每个核心的位置并且可以调度作业使得OS均匀地分布作业以保持温度均匀地分布。
因此,说明核心V-F信息的基准数据(例如TPC-C、TPC[事务处理性能委员会]基准E、TPCx-V、SPECVirt、SPECjExt)可以被显露给OS或管理程序。因此,OS或管理程序可以选择系统以运行工作负载,这可以使总体性能最大化并且降低TCO。
修改
本公开的教导的许多修改是可能的。例如,图2将S230阐述为在S240之前发生。在本公开的一些实现中,S240是在S230之前执行的。
在一个示例实施例中,附图的电路可以在电子设备的板上被实现。板可以是通用的电路板,其保持电子设备的内部电子系统的各种组件,并且进一步提供用于其他外围设备的连接器。更具体地,板可以提供电连接,系统的其他部件可以通过所述电连接进行电通信。处理器(包括数字信号处理器、微处理器以及支持芯片组)和计算机可读非暂时性存储器元件可以基于配置需求、处理需求和计算机设计耦合到该板上。其他组件(如,外部存储装置、附加传感器、用于音频/视频显示的控制器以及外围设备)可以经由电缆附接到该板上作为插卡或者集成到该板本身上。在各种实施例中,本文中所描述的功能可以以仿真形式被实现作为在布置在支持这些仿真功能的结构中的一个或多个可配置(例如,可编程)元件内运行的软件或固件。提供仿真的软件或固件可以被提供在包括用于允许处理器执行那些功能的指令的非暂时性计算机可读存储介质上。
在另一示例实施例中,附图的电路可以被实现为独立模块(例如,具有用于执行特定应用或功能的组件和电路的设备),或者被实现为到电子设备的应用专用硬件的插入模块。本公开的特定实施例可以部分地或完整地被包括在片上系统(SOC)封装中。SOC表示将计算机或其他电子系统的组件集成到单个芯片中的IC。SOC可以包含数字、模拟、混合信号以及通常包含射频功能,所有这些功能都可以被提供在单个芯片基板上。其他实施例可以包括多芯片模块(MCM),其具有位于单个电子封装内的多个独立的IC并且通过电子封装彼此紧密地进行交互。在各种其他实施例中,数字滤波器可以被实现在专用集成电路(ASIC)、现场可编程门阵列(FPGA)以及其他半导体芯片中的一个或多个硅核心中。
本文中概述的规定、尺寸和关系(例如,处理器的数量、逻辑操作)仅仅出于示例和教导的目的而提供。在不脱离本公开的精神或所附权利要求的范围的情况下,这些信息可以有相当大的变化。这些规定仅应用于一个非限制性的示例,并因此其应该被这样理解。在前面的描述中,已经参考特定处理器和/或组件布置描述了示例实施例。在不脱离所附权利要求的范围的情况下,可以对这样的实施例进行各种修改和改变。因此,描述和附图被认为是示出性的而不是限制性的。
利用本文提供的许多示例,交互可以在两个、三个、四个或更多个电子部件的方面来描述。然而,仅出于清楚和示例的目的做出了这种描述。系统可以以任何方式进行合并。连通类似的设计替代方案,附图的所示的组件、模块和元件中的任何一个可以以各种可能的配置来进行组合,所有这些都清楚地在本公开的范围内。在某些情况下,通过仅参考有限数量的电气元件来描述给定一组流程的功能中的一个或多个可能更容易。附图的电路及其教导是易于缩放的并且可以容纳大量组件以及更难懂/复杂的布置和配置。因此,所提供的示例不应该限制电路的范围或者将电路的教导限制为潜在地应用于大量其他体系结构。
在本公开中,对包括在“一个实现”、“示例实现”、“实现”、“另一个实现”、“一些实现”、“各种实现”、“其他实现”等中的各种特征(例如,元素、结构、模块、组件、步骤、操作、特性等)旨在表示任何这样的特征被包括在本公开的一个或多个实现中,但是可以或可以不必在相同的实现中进行组合。
在不偏离本公开的范围的情况下,在适当的情况下操作中的一些可以被删除或移除,或者这些操作可以进行相当的修改或改变。另外,这些操作的时机可以进行相当的改变。为了示例和讨论的目的,提供了前述的操作流。大量的灵活性是由本文描述的实现提供的,因为在不脱离本公开的教导的情况下,可以提供任何合适的布置、时间顺序、配置和定时机制。
对于本领域技术人员而言,其他改变、代替、变化、替换和修改可以是确定的,并且本公开包括落入权利要求范围内的所有这些改变、代替、变化、替换和修改。以上描述的装置和方法的可选特征也可以关于本文所描述的方法或过程来实现,并且示例中的细节可以在一个或多个实现中的任何地方使用。
示例1是一种用于执行事件调节的装置,所述装置包括:多个资源;一个或多个传感器;以及控制器,其用于如果所述控制器确定热事件或功率事件已发生,则调节所述资源中的至少一个资源,其中,所述调节是至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)的。
在示例2中,示例1所述的装置可以可选地包括以下特征:调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
在示例3中,示例1-2中的任一项所述的装置可以可选地包括以下特征:所述控制器用于确定多个计算节点中的被指派给所述一个或多个SLA的一个计算节点的能力。
在示例4中,示例1-3中的任一项所述的装置可以可选地包括以下特征:所述控制器用于确定区域中的多个计算节点中的一个计算节点的所述至少一个资源。
在示例5中,示例1-4中的任一项所述的装置可以可选地包括以下特征:所述控制器用于确定所述至少一个资源的能够用于调节的余裕空间。
在示例6中,示例1-5中的任一项所述的装置可以可选地包括以下特征:所述控制器是BMC、管理控制器、或者是编排层的部分。
在示例7中,示例1-6中的任一项所述的装置可以可选地包括以下特征:所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
在示例8中,示例1-7中的任一项所述的装置可以可选地包括编排器,其用于跟踪工作于被指派给所述一个或多个SLA的任务上的多个资源,并将所述多个资源分组到区域中。
在示例9中,示例1-8中的任一项所述的装置可以可选地包括以下特征:调节的资源全部在具有第一SLA的区域中,所述具有第一SLA的区域低于与第二SLA相关联的其他区域中的资源,所述第二SLA高于所述第一SLA。
在示例10中,示例9中所述的装置可以可选地包括以下特征:在资源被调节在具有较高SLA的区域中之前,具有所述第一SLA的所述区域中的所有资源被调节。
在示例11中,示例1-10中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例12是一种用于执行事件调节的一种装置,所述装置包括:多个资源;一个或多个传感器;以及用于如果所述用于调节的单元确定热事件或功率事件已发生,则调节所述资源中的至少一个的单元,其中,所述调节至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)。
在示例13中,示例12所述的装置可以可选地包括以下特征:调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
在示例14中,示例12-13中的任一项所述的装置可以可选地包括以下特征:用于调节的单元确定多个计算节点中的被指派给所述一个或多个SLA的一个计算节点的能力。
在示例15中,示例12-14中的任一项所述的装置可以可选地包括以下特征:用于调节的单元确定区域中的多个计算节点中的一个计算节点的所述至少一个资源。
在示例16中,示例12-15中的任一项所述的装置可以可选地包括以下特征:用于调节的单元确定所述至少一个资源的能够用于调节的余裕空间。
在示例17中,示例12-16中的任一项所述的装置可以可选地包括以下特征:用于调节的单元是BMC、管理控制器、或者是编排层的部分。
在示例18中,示例12-17中的任一项所述的装置可以可选地包括以下特征:所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
在示例19中,示例12-18中的任一项所述的装置可以可选地包括用于跟踪工作于被指派给所述一个或多个SLA的任务上的所述多个资源并且用于将所述多个资源分组到区域中的编排单元。
在示例20中,示例12-17中的任一项所述的装置可以可选地包括以下特征:调节的资源全部在具有第一SLA的区域中,所述具有第一SLA的区域低于与第二SLA相关联的其他区域中的资源,所述第二SLA高于所述第一SLA。
在示例21中,示例20中的任一项所述的装置可以可选地包括以下特征:在具有较高SLA的区域中的资源被调节之前,在具有所述第一SLA的所述区域中的所有资源被调节。
在示例22中,示例12-21中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例23是一种用于执行事件调节的方法,所述方法包括:如果控制器确定热事件或功率事件已发生,则调节多个资源中的至少一个资源,其中所述调节至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)。
在示例24中,示例23所述的方法可以可选地包括以下特征:调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
在示例25中,示例23-24中的任一项所述的方法可以可选地包括确定多个计算节点中的被指派给所述一个或多个SLA的一个计算节点的能力。
在示例26中,示例23-25中的任一项所述的方法可以可选地包括确定区域中的多个计算节点中的一个计算节点的至少一个资源。
在示例27中,示例23-26中的任一项所述的方法可以可选地包括确定所述至少一个资源的能够用于调节的余裕空间。
在示例28中,示例23-27中的任一项所述的方法可以可选地包括以下特征:所述控制器是BMC、管理控制器、或者是编排层的部分。
在示例29中,示例23-28中的任一项所述的方法可以可选地包括以下特征:所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
在示例30中,示例23-29中的任一项所述的方法可以可选地包括利用编排器跟踪工作于被指派给所述一个或多个SLA的任务上的所述多个资源;以及利用编排器将所述多个资源分组到区域中。
在示例31中,示例23-30中的任一项所述的方法可以可选地包括以下特征:调节的资源全部在具有第一SLA的区域中,所述具有第一SLA的区域低于与第二SLA相关联的其他区域中的资源,所述第二SLA高于所述第一SLA。
在示例32中,示例31所述的方法可以可选地包括以下特征:在具有较高SLA的区域中的资源被调节之前,在具有所述第一SLA的所述区域中的所有资源被调节。
示例33是一种包括代码的机器可读介质,所述代码当被执行时使得机器执行根据示例23-32中的任一项所述的方法。
示例34是一种包括用于执行根据23-32中的任一项所述的方法的单元的装置。
在示例35中,示例34所述的装置可以可选地包括以下特征:用于执行所述方法的单元包括处理器和存储器。
在示例36中,示例35所述的装置可以可选地包括以下特征:所述存储器包括机器可读指令,所述指令当被执行时使得所述装置执行所述方法。
在示例37中,示例34-36中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例38是至少一个包括指令的计算机可读介质,所述指令当被执行时实现根据示例23-32中的任一项所述的方法,或者实现根据示例34-37中的任一项所述的装置。
示例39是一种编码有指令的非暂时性、有形的计算机可读存储介质,所述指令当被执行时使得处理单元执行包括以下的方法:如果所述处理单元确定热事件或功率事件已发生,则调节多个资源中的至少一个资源,其中,所述调节至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)。
在示例40中,示例39所述的介质可以可选地包括以下特征:调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
在示例41中,示例39-40中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:确定多个计算节点中的被指派给所述一个或多个SLA的一个计算节点的能力。
在示例42中,示例39-41中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:确定区域中的多个计算节点中的一个的至少一个资源。
在示例43中,示例39-42中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:确定所述至少一个资源的能够用于调节的余裕空间。
在示例44中,示例39-43中的任一项所述的介质可以可选地包括以下特征:所述处理单元是BMC、管理控制器、或者是编排层的部分。
在示例45中,示例39-44中的任一项所述的介质可以可选地包括以下特征:所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
在示例46中,示例39-45中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:利用编排器跟踪工作于被指派给所述一个或多个SLA的任务上的所述多个资源;以及利用编排器将所述多个资源分组到区域中。
在示例47中,示例39-46中的任一项所述的介质可以可选地包括以下特征:调节的资源全部在具有第一SLA的区域中,所述具有第一SLA的区域低于与第二SLA相关联的其他区域中的资源,所述第二SLA高于所述第一SLA。
在示例48中,示例47所述的介质可以可选地包括以下特征:在具有较高SLA的区域中的资源被调节之前,在具有所述第一SLA的所述区域中的所有资源被调节。
示例49是一种用于子节点组合的装置,包括:存储器元件,其可操作的用于存储电子代码;以及多个处理核心,其可操作用于执行与所述电子代码相关联的指令,其中编排层或BMC接收用于所述多个核心的域的目标数量,并且将所述多个计算核心划分为目标数量的域。
在示例50中,示例49所述的装置可以可选地包括以下特征:所述多个处理核心用于经由多个连接进行通信,并且所述多个连接中的至少一个被禁用以创建所述目标数量的域中的一个。
在示例51中,示例49-50中的任一项所述的装置可以可选地包括以下特征:所述多个处理单元中的一个执行管理程序以创建所述目标数量的域中的一个。
在示例52中,示例49-51中的任一项所述的装置可以可选地包括以下特征:所述目标数量的域中的每一个同时执行来自不同服务等级协议的作业。
在示例53中,示例49-52中的任一项所述的装置可以可选地包括以下特征:所述多个处理核心中的一个包括集成的存储器控制器,所述集成的存储器控制器支持由所述多个处理核心中的一个执行的所述目标数量的域中的两个域。
在示例54中,示例49-53中的任一项所述的装置可以可选地包括以下特征:至少部分地基于服务等级协议,作业被指派给所述目标数量的域中的一个。
在示例55中,示例49-54中的任一项所述的装置可以可选地包括以下特征:平台控制器集线器被仿真以用于支持所述目标数量的域中的至少一个。
在示例56中,示例49-55中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例57是一种用于子节点组合的装置,所述装置包括:用于执行与电子代码相关联的指令的执行单元;以及用于接收用于所述执行单元的域的目标数量并且用于将所述执行单元划分为所述目标数量的域的处理单元。
在示例58中,示例57所述的装置可以可选地包括以下特征:所述执行单元经由多个连接进行通信,并且所述多个连接中的至少一个被禁用以创建所述目标数量的域中的一个。
在示例59中,示例57-58中的任一项所述的装置可以可选地包括以下特征:一个执行单元执行管理程序以创建所述目标数量的域中的一个。
在示例60中,示例57-59中的任一项所述的装置可以可选地包括以下特征:所述目标数量的域中的每一个同时执行来自不同服务等级协议的作业。
在示例61中,示例57-60中的任一项所述的装置可以可选地包括以下特征:所述执行单元中的一个包括用于支持由所述执行单元中的一个执行的所述目标数量的域中的两个的单元。
在示例62中,示例57-61中的任一项所述的装置可以可选地包括以下特征:至少部分地基于服务等级协议,作业被指派给所述目标数量的域中的一个。
在示例63中,示例57-62中的任一项所述的装置可以可选地包括以下特征:平台控制集线器被仿真以用于支持所述目标数量的域中的至少一个。
在示例64中,示例57-63中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例65是一种用于子节点组合的方法,包括:由BMC或编排层接收用于所述多个处理核心的目标数量的域;并且由所述BMC或所述编排层将多个计算核心划分为所述目标数量的域。
在示例66中,示例65所述的方法可以可选地包括经由多个连接与所述多个处理核心通信;并且禁用所述多个连接中的至少一个以创建所述目标数量的域中的一个。
在示例67中,示例65-66中的任一项所述的方法可以可选地包括利用所述多个处理核心中的一个来执行管理程序以创建所述目标数量的域中的一个。
在示例68中,示例65-67中的任一项所述的方法可以可选地包括以下特征:所述目标数量的域中的每一个同时执行来自不同服务等级协议的作业。
在示例69中,示例65-68中的任一项所述的方法可以可选地包括以下特征:所述多个处理核心中的一个包括集成的存储器控制器,其用于支持由所述多个处理核心中的一个执行的所述目标数量的域中的两个。
在示例70中,示例65-69中的任一项所述的方法可以可选地包括以下特征:至少部分地基于服务等级协议,作业被指派给所述目标数量的域中的一个。
在示例71中,示例65-70中的任一项所述的方法可以可选地包括以下特征:平台控制集线器被仿真以用于支持所述目标数量的域中的至少一个。
示例72是一种包括代码的机器可读介质,所述代码当被执行时使得机器执行示例65-71中的任一项所述的方法。
示例73是一种包括用于执行示例65-71中的任一项所述的方法的单元的装置。
在示例74中,示例73所述的装置可以可选地包括以下特征:所述用于执行所述方法的单元包括处理器和存储器。
在示例75中,示例74所述的装置可以可选地包括以下特征:所述存储器包括机器可读指令,所述指令当被执行时使得所述装置执行所述方法。
在示例76中,示例73-75中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例77是至少一个包括指令的计算机可读介质,所述指令当被执行时实现示例65-71中的任一项所述的方法或实现示例73-76中的任一项所述的装置。
示例78是一种被编码有指令的非暂时性、有形的计算机可读存储介质,所述指令当被执行时使得处理单元执行方法,包括:接收用于多数多个处理核心的目标数量的域;并且将多个计算核心划分为所述目标数量的域。
在示例79中,示例78所述的介质可以可选地包括以下特征:所述方法还包括经由多个连接与所述多个处理核心通信;并且禁用所述多个连接中的至少一个以用于创建所述目标数量的域中的一个。
在示例80中,示例78-79中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:利用所述多个处理核心中的一个执行管理程序以创建所述目标数量的域中的一个。
在示例81中,示例78-80中的任一项所述的介质可以可选地包括以下特征:所述目标数量的域中的每一个同时执行来自不同服务等级协议的作业。
在示例82中,示例78-81中的任一项所述的介质可以可选地包括以下特征:所述多个处理核心中的一个包括集成的存储器控制器,其用于支持由所述多个处理核心中的一个执行的所述目标数量的域中的两个。
在示例83中,示例78-82中的任一项所述的介质可以可选地包括以下特征:至少部分地基于服务等级协议,所述作业被指派给所述目标数量的域中的一个。
在示例84中,示例78-83中的任一项所述的介质可以可选地包括以下特征:平台控制集线器被仿真以用于支持所述目标数量的域中的至少一个。
示例85是一种用于平衡的处理的装置,所述装置包括:存储器元件,其可操作用于存储电子代码;第一核心,其用于以第一电压或频率进行操作;第二核心,其用于以与所述第一电压或频率不同的第二电压或频率进行操作;以及处理器,其可操作用于执行与所述电子代码相关联的指令以接收所述第一电压或频率的指示并且接收所述第二电压或频率的指示,其中,所述第一核心以所述第一电压或频率执行第一处理作业,并且所述第二核心以所述第二电压或频率执行第二处理作业。
在示例86中,示例85所述的装置可以可选地包括以下特征:所述处理器用于至少部分地基于所述第一电压或频率将所述第一处理作业指派给所述第一核心。
在示例87中,示例85-86中的任一项所述的装置可以可选地包括以下特征:所述第一核心和所述第二核心在所述装置的计算节点中的相同的插槽中。
在示例88中,示例85-87中的任一项所述的装置可以可选地包括以下特征:所述装置包括多个计算节点,并且所述第一核心和所述第二核心在所述多个计算节点中的不同的计算节点中。
在示例89中,示例85-88中的任一项所述的装置可以可选地包括以下特征:所述处理器用于接收所述第一核心的第一位置和所述第二核心的第二位置,并且用于至少部分地基于所述第一位置和所述第二位置来将所述第二处理作业指派给所述第二核心。
在示例90中,示例85-89中的任一项所述的装置可以可选地包括以下特征:所述处理器用于至少部分地基于第一服务等级协议来将所述第一处理作业指派给所述第一核心,并且用于至少部分地基于第二服务等级协议将所述第二处理作业指派给所述第二核心,并且所述第一服务等级协议限定了比由所述第二服务等级协议限定的每秒事务的数量更大的每秒事务的数量。
在示例91中,示例85-90中的任一项所述的装置可以可选地包括以下特征:所述第一核心和所述第二核心的性能是通过将所述第一电压和所述第一频率的乘积与所述第二电压和所述第二频率的乘积进行求和来计算的。
在示例92中,示例85-91中的任一项所述的装置可以可选地包括以下特征:存储每个存储器核心的操作状态的一组电压和频率对。
在示例93中,示例92所述的装置可以可选地包括以下特征:所述一组电压和频率对被存储在BIOS中,并且所述一组电压和频率对被提供给至少部分地基于所述一组电压和频率对来调度工作负载的POD管理器。
在示例94中,示例85-93中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例95是一种用于平衡的处理的装置,所述装置包括:用于以第一电压或频率进行操作的第一单元;用于以与所述第一电压或频率不同的第二电压或频率进行操作的第二单元;以及用于接收所述第一电压或频率的指示和用于接收所述第二电压或频率的指示的处理单元,其中,所述第一单元以所述第一电压或频率来执行第一处理作业,并且所述第二单元以所述第二电压或频率来执行第二处理作业。
在示例96中,示例95所述的装置可以可选地包括以下特征:所述处理单元至少部分地基于所述第一电压或频率来将所述第一处理作业指派给所述第一单元。
在示例97中,示例95-96中的任一项所述的装置可以可选地包括以下特征:所述第一单元和所述第二单元在所述装置的计算节点中的相同的插槽中。
在示例98中,示例95-97中的任一项所述的装置可以可选地包括以下特征:所述装置包括多个计算节点,并且所述第一单元和所述第二单元在所述多个计算节点中的不同的计算节点中。
在示例99中,示例95-98中的任一项所述的装置可以可选地包括以下特征:所述处理单元接收所述第一单元的第一位置和所述第二单元的第二位置,并且至少部分地基于所述第一位置和所述第二位置将所述第二处理作业指派给所述第二单元。
在示例100中,示例95-99中的任一项所述的装置可以可选地包括以下特征:所述处理单元至少部分地基于第一服务等级协议将所述第一处理作业指派给所述第一单元,并且至少部分地基于第二服务等级协议将所述第二处理作业指派给所述第二单元,并且所述第一服务等级协议限定了比由所述第二服务等级协议限定的每秒事务的数量更大的每秒事务的数量。
在示例101中,示例95-100中的任一项所述的装置可以可选地包括以下特征:所述第一单元和所述第二单元的性能是通过将所述第一电压和所述第一频率的乘积与所述第二电压和所述第二频率的乘积进行求和来计算的。
在示例102中,示例95-101中的任一项所述的装置可以可选地包括以下特征:存储每个存储器核心的操作状态的一组电压和频率对。
在示例103中,示例95-102中的任一项所述的装置可以可选地包括以下特征:所述一组电压和频率对被存储在BIOS中,并且所述一组电压和频率对被提供给至少部分地基于所述一组电压和频率对来调度工作负载的POD管理器。
在示例104中,示例95-103中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例105是一种由机架实现的用于平衡的处理的方法,所述方法包括:以第一电压或频率来操作第一核心;以与所述第一电压或频率不同的第二电压或频率来操作第二核心;接收所述第一电压或频率的指示;并且接收所述第二电压或频率的指示,其中,所述第一核心以所述第一电压和频率来执行第一处理作业,并且所述第二核心以所述第二电压或频率来执行第二处理作业。
在示例106中,示例105所述的方法可以可选地包括至少部分地基于所述第一电压或频率将所述第一处理作业指派给所述第一核心。
在示例107中,示例105-106中的任一项所述的方法可以可选地包括以下特征:所述第一核心和所述第二核心在所述机架的计算节点中的相同的插槽中。
在示例108中,示例105-107中的任一项所述的方法可以可选地包括以下特征:所述机架包括多个计算节点,并且所述第一核心和所述第二核心在所述多个计算节点中的不同的计算节点中。
在示例109中,示例105-108中的任一项所述的方法可以可选地包括接收所述第一核心的第一位置和所述第二核心的第二位置;并且至少部分地基于所述第一位置和所述第二位置来将所述第二处理作业指派给所述第二核心。
在示例110中,示例105-109中的任一项所述的方法可以可选地包括至少部分地基于第一服务等级协议将所述第一处理作业指派给所述第一核心;并且至少部分地基于第二服务等级协议将所述第二处理作业指派给所述第二核心,其中,所述第一服务等级协议限定了比由所述第二服务等级协议限定的每秒事务的数量更大的每秒事务的数量。
在示例111中,示例105-110中的任一项所述的方法可以可选地包括通过将所述第一电压和所述第一频率的乘积与所述第二电压和所述第二频率的乘积进行求和来计算所述第一核心和所述第二核心的性能。
在示例112中,示例105-111中的任一项所述的方法可以可选地包括以下特征:存储每个存储器核心的操作状态的一组电压和频率对。
在示例113中,示例112中所述的方法可以可选地包括以下特征:所述一组电压和频率对被存储在BIOS中,并且所述一组电压和频率对被提供给至少部分地基于所述一组电压和频率对来调度工作负载的POD管理器。
示例114是一种包括代码的机器可读介质,所述代码当被执行时使得机器执行示例105-113中的任一项所述的方法。
示例115是一种包括用于执行示例105-113中的任一项所述的方法的单元的装置。
在示例116中,示例115所述的装置可以可选地包括以下特征:用于执行所述方法的单元包括处理器和存储器。
在示例117中,示例116所述的装置可以可选地包括以下特征:所述存储器包括机器可读指令,所述指令当被执行时使得所述装置执行所述方法。
在示例118中,示例115-117中的任一项所述的装置可以可选地包括以下特征:所述装置是计算系统。
示例119是至少一个包括指令的计算机可读介质,所述指令当被执行时实现示例105-113中的任一项所述的方法或实现示例115-118中的任一项所述的装置。
示例120是一种被编码有指令的非暂时性、有形的计算机可读存储介质,所述指令当被执行时使得处理单元执行方法,包括:以第一电压或频率来操作机架的第一核心;以与所述第一电压或频率不同的第二电压或频率来操作第二核心;接收所述第一电压或频率的指示;并且接收所述第二电压或频率的指示,其中,所述第一核心以所述第一电压或频率来执行第一处理作业,并且所述第二核心以所述第二电压或频率来执行第二处理作业。
在示例121中,示例120所述的介质可以可选地包括以下特征:所述方法还包括:至少部分地基于所述第一电压或频率来将所述第一处理作业指派给所述第一核心。
在示例122中,示例120-121中的任一项所述的介质可以可选地包括以下特征:所述第一核心和所述第二核心在所述机架的计算节点中的相同的插槽中。
在示例123中,示例120-122中的任一项所述的介质可以可选地包括以下特征:所述机架包括多个计算节点,并且所述第一核心和所述第二核心在所述多个计算节点中的不同的计算节点中。
在示例124中,示例120-123中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:接收所述第一核心的第一位置和所述第二核心的第二位置;并且至少部分地基于所述第一位置和所述第二位置将所述第二处理作业指派给所述第二核心。
在示例125中,示例120-124中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:至少部分地基于第一服务等级协议将所述第一处理作业指派给所述第一核心;并且至少部分地基于第二服务等级协议将所述第二处理作业指派给所述第二核心,其中,所述第一服务等级协议限定了比由所述第二服务等级协议限定的每秒事务的数量更大的每秒事务的数量。
在示例126中,示例120-125中的任一项所述的介质可以可选地包括以下特征:所述方法还包括:通过将所述第一电压和所述第一频率的乘积与所述第二电压和所述第二频率的乘积进行求和来计算所述第一核心和所述第二核心的性能。
在示例127中,示例120-126中的任一项所述的介质可以可选地包括以下特征:存储每个存储器核心的操作状态的一组电压和频率对。
在示例128中,示例127所述的介质可以可选地包括以下特征:所述一组电压和频率对被存储在BIOS中,并且所述一组电压和频率对被提供给至少部分地基于所述一组电压和频率对来调度工作负载的POD管理器。

Claims (25)

1.一种用于执行事件调节的装置,所述装置包括:
多个资源;
一个或多个传感器;以及
控制器,其用于如果所述控制器确定热事件或功率事件已发生,则调节所述资源中的至少一个资源,其中,所述调节是至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)的。
2.根据权利要求1所述的装置,其中,调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
3.根据权利要求1-2中的任一项所述的装置,其中,所述控制器用于确定多个计算节点中的被指派给所述一个或多个SLA的一个计算节点的能力。
4.根据权利要求1-2中的任一项所述的装置,其中,所述控制器用于确定区域中的多个计算节点中的一个计算节点的至少一个资源。
5.根据权利要求1-2中的任一项所述的装置,其中,所述控制器用于确定所述至少一个资源的能够用于调节的余裕空间。
6.根据权利要求1-2中的任一项所述的装置,其中,所述控制器是BMC、管理控制器、或者是编排层的部分。
7.根据权利要求1-2中的任一项所述的装置,其中,所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
8.根据权利要求1-2中的任一项所述的装置,还包括:
编排器,其用于跟踪工作于被指派给所述一个或多个SLA的任务上的所述多个资源,并且将所述多个资源分组到区域中。
9.根据权利要求1-2中的任一项所述的装置,其中,调节的资源全部在具有第一SLA的区域中,所述具有第一SLA的区域低于与第二SLA相关联的其他区域中的资源,所述第二SLA高于所述第一SLA。
10.根据权利要求9所述的装置,其中,在具有较高SLA的区域中资源被调节之前,在具有所述第一SLA的区域中的所有资源被调节。
11.根据权利要求1-2中的任一项所述的装置,其中,所述装置是计算系统。
12.一种用于执行事件调节的装置,所述装置包括:
多个资源;
一个或多个传感器;以及
用于如果用于调节的单元确定热事件或功率事件已发生,则调节所述资源中的至少一个资源的单元,其中,所述调节是至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)的。
13.一种用于执行事件调节的方法,所述方法包括:
如果控制器确定热事件或功率事件已发生,则调节多个资源中的至少一个资源,其中,所述调节是至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)的。
14.根据权利要求13所述的方法,其中,调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
15.根据权利要求13-14中的任一项所述的方法,还包括:
确定区域中的多个计算节点中的一个计算节点的至少一个资源。
16.根据权利要求13-14中的任一项所述的方法,还包括:
确定所述至少一个资源的能够用于调节的余裕空间。
17.根据权利要求13-14中的任一项所述的方法,其中,所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
18.根据权利要求13-14中的任一项所述的方法,还包括:
利用编排器跟踪工作于被指派给所述一个或多个SLA的任务上的所述多个资源;以及
利用所述编排器将所述多个资源分组到区域中。
19.根据权利要求13-14中的任一项所述的方法,其中,调节的资源全部在具有第一SLA的区域中,所述具有第一SLA的区域低于与第二SLA相关联的其他区域中的资源,所述第二SLA高于所述第一SLA。
20.一种编码有指令的非暂时性、有形的计算机可读存储介质,所述指令当被执行时使得处理单元用于执行方法,所述方法包括:
如果所述处理单元确定热事件或功率事件已发生,则调节多个资源中的至少一个资源,其中,所述调节是至少部分地基于与所述资源相关联的一个或多个服务等级协议(SLA)的。
21.根据权利要求20所述的介质,其中,调节的至少一个资源与服务的较低级别相关联,所述服务的较低级别低于与未被调节的资源相关联的服务的级别。
22.根据权利要求20-21中的任一项所述的介质,所述方法还包括:
确定区域中的多个计算节点中的一个计算节点的至少一个资源。
23.根据权利要求20-21中的任一项所述的介质,所述方法还包括:
确定所述至少一个资源的能够用于调节的余裕空间。
24.根据权利要求20-21中的任一项所述的介质,其中,所述至少一个资源是网络带宽、对存储器存取的数量、或者由处理器执行的操作的数量。
25.根据权利要求20-21中的任一项所述的介质,所述方法还包括:
利用编排器跟踪工作于被指派给所述一个或多个SLA的任务上的所述多个资源;以及
利用所述编排器将所述多个资源分组到区域中。
CN201810216974.1A 2017-03-29 2018-03-16 在机柜式架构中的调节、子节点组合和平衡处理 Pending CN108694088A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/472,910 2017-03-29
US15/472,910 US20180287949A1 (en) 2017-03-29 2017-03-29 Throttling, sub-node composition, and balanced processing in rack scale architecture

Publications (1)

Publication Number Publication Date
CN108694088A true CN108694088A (zh) 2018-10-23

Family

ID=61163495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810216974.1A Pending CN108694088A (zh) 2017-03-29 2018-03-16 在机柜式架构中的调节、子节点组合和平衡处理

Country Status (3)

Country Link
US (1) US20180287949A1 (zh)
EP (1) EP3382500A1 (zh)
CN (1) CN108694088A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11223606B2 (en) * 2018-06-29 2022-01-11 Intel Corporation Technologies for attesting a deployed workload using blockchain
US10944644B2 (en) 2019-04-30 2021-03-09 Intel Corporation Technologies for thermal and power awareness and management in a multi-edge cloud networking environment
US11782713B1 (en) * 2019-08-27 2023-10-10 Amazon Technologies, Inc. Security vulnerability mitigation using address space co-execution
CN112558740B (zh) * 2019-09-26 2024-02-13 戴尔产品有限公司 组件节流电力备用设备充电系统
US11977496B1 (en) 2022-09-29 2024-05-07 Amazon Technologies, Inc. Security vulnerability mitigation using hardware-supported context-dependent address space hiding

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289362A1 (en) * 2004-06-24 2005-12-29 Merkin Aaron E Maintaining server performance in a power constrained environment
US20100037073A1 (en) * 2008-08-11 2010-02-11 International Business Machines Corporation Apparatus and Method for Selective Power Reduction of Memory Hardware
US20100313203A1 (en) * 2009-06-04 2010-12-09 International Business Machines Corporation System and method to control heat dissipitation through service level analysis
US20110239015A1 (en) * 2010-03-25 2011-09-29 International Business Machines Corporation Allocating Computing System Power Levels Responsive to Service Level Agreements
US20120054771A1 (en) * 2010-08-31 2012-03-01 International Business Machines Corporation Rescheduling workload in a hybrid computing environment
US20130178999A1 (en) * 2012-01-09 2013-07-11 International Business Machines Corporation Managing workload distribution among computing systems to optimize heat dissipation by computing systems
US20150177813A1 (en) * 2013-12-23 2015-06-25 Dell, Inc. Global throttling of computing nodes in a modular, rack-configured information handling system
CN105549715A (zh) * 2014-10-28 2016-05-04 邻客音公司 Cpu工作频率的动态调节
US9436258B1 (en) * 2013-11-21 2016-09-06 Google Inc. Dynamic service level objective power control in distributed process
US20170083065A1 (en) * 2015-09-22 2017-03-23 Advanced Micro Devices, Inc. Thermally-aware throttling in a three-dimensional processor stack

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7054943B1 (en) * 2000-04-28 2006-05-30 International Business Machines Corporation Method and apparatus for dynamically adjusting resources assigned to plurality of customers, for meeting service level agreements (slas) with minimal resources, and allowing common pools of resources to be used across plural customers on a demand basis
US20080184044A1 (en) * 2007-01-31 2008-07-31 Leech Phillip A Method of managing power consumption for collections of computer systems
WO2010127365A1 (en) * 2009-05-01 2010-11-04 Citrix Systems, Inc. Systems and methods for establishing a cloud bridge between virtual storage resources
US8856333B2 (en) * 2009-06-16 2014-10-07 Microsoft Corporation Datacenter execution templates
US8429097B1 (en) * 2009-08-12 2013-04-23 Amazon Technologies, Inc. Resource isolation using reinforcement learning and domain-specific constraints
US20150012113A1 (en) * 2013-07-03 2015-01-08 Medex International, Inc. Apparatus for coupling prosthetic components having angular and translational offset
US9800087B2 (en) * 2013-10-28 2017-10-24 Virtual Power Systems, Inc. Multi-level data center consolidated power control
US10833940B2 (en) * 2015-03-09 2020-11-10 Vapor IO Inc. Autonomous distributed workload and infrastructure scheduling
US10042697B2 (en) * 2015-05-28 2018-08-07 Oracle International Corporation Automatic anomaly detection and resolution system
US9959146B2 (en) * 2015-10-20 2018-05-01 Intel Corporation Computing resources workload scheduling
US10305747B2 (en) * 2016-06-23 2019-05-28 Sap Se Container-based multi-tenant computing infrastructure
US10334334B2 (en) * 2016-07-22 2019-06-25 Intel Corporation Storage sled and techniques for a data center
US11150950B2 (en) * 2016-12-01 2021-10-19 Vmware, Inc. Methods and apparatus to manage workload domains in virtual server racks
US10782757B2 (en) * 2017-08-09 2020-09-22 Equinix, Inc. Rack level power control

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289362A1 (en) * 2004-06-24 2005-12-29 Merkin Aaron E Maintaining server performance in a power constrained environment
US20100037073A1 (en) * 2008-08-11 2010-02-11 International Business Machines Corporation Apparatus and Method for Selective Power Reduction of Memory Hardware
US20100313203A1 (en) * 2009-06-04 2010-12-09 International Business Machines Corporation System and method to control heat dissipitation through service level analysis
US20110239015A1 (en) * 2010-03-25 2011-09-29 International Business Machines Corporation Allocating Computing System Power Levels Responsive to Service Level Agreements
US20120054771A1 (en) * 2010-08-31 2012-03-01 International Business Machines Corporation Rescheduling workload in a hybrid computing environment
US20130178999A1 (en) * 2012-01-09 2013-07-11 International Business Machines Corporation Managing workload distribution among computing systems to optimize heat dissipation by computing systems
US9436258B1 (en) * 2013-11-21 2016-09-06 Google Inc. Dynamic service level objective power control in distributed process
US20150177813A1 (en) * 2013-12-23 2015-06-25 Dell, Inc. Global throttling of computing nodes in a modular, rack-configured information handling system
CN105549715A (zh) * 2014-10-28 2016-05-04 邻客音公司 Cpu工作频率的动态调节
US20170083065A1 (en) * 2015-09-22 2017-03-23 Advanced Micro Devices, Inc. Thermally-aware throttling in a three-dimensional processor stack

Also Published As

Publication number Publication date
EP3382500A1 (en) 2018-10-03
US20180287949A1 (en) 2018-10-04

Similar Documents

Publication Publication Date Title
CN108694088A (zh) 在机柜式架构中的调节、子节点组合和平衡处理
Chen et al. Integrated management of application performance, power and cooling in data centers
US10841241B2 (en) Intelligent placement within a data center
US10838482B2 (en) SLA-based power management in disaggregated computing systems
WO2019091387A1 (en) Method and system for provisioning resources in cloud computing
CN102822801B (zh) 响应于服务水平协议而分配计算系统功率水平
US20180026908A1 (en) Techniques to configure physical compute resources for workloads via circuit switching
US8996192B2 (en) Thermal management for integrated circuits
Guzek et al. HEROS: Energy-efficient load balancing for heterogeneous data centers
US8826203B2 (en) Automating current-aware integrated circuit and package design and optimization
US10666570B2 (en) Computing infrastructure resource-workload management methods and apparatuses
Ghasemi-Gol et al. An optimization framework for data centers to minimize electric bill under day-ahead dynamic energy prices while providing regulation services
Guleria et al. Quadd: Quantifying accelerator disaggregated datacenter efficiency
Arroba et al. Heuristics and metaheuristics for dynamic management of computing and cooling energy in cloud data centers
US20210182194A1 (en) Processor unit resource exhaustion detection and remediation
US20150304177A1 (en) Processor management based on application performance data
US20130144587A1 (en) Scalability evaluation device, scalability evaluation method, and scalability evaluation program
Anwar et al. Towards managing variability in the cloud
US20140082580A1 (en) Current-aware floorplanning to overcome current delivery limitations in integrated circuits
Tsai et al. Thermal-throttling server: A thermal-aware real-time task scheduling framework for three-dimensional multicore chips
Singh et al. Analysis and mapping for thermal and energy efficiency of 3-D video processing on 3-D multicore processors
US20230137191A1 (en) Mechanism to recompose workload packages in a computing environment
US11886901B2 (en) VM performance guaranteeing system and VM performance guaranteeing method
Ficco et al. Live migration in emerging cloud paradigms
Cheng et al. High resource utilization auto-scaling algorithms for heterogeneous container configurations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination