CN104516478B - 对设备功率进行节流 - Google Patents

对设备功率进行节流 Download PDF

Info

Publication number
CN104516478B
CN104516478B CN201410642310.3A CN201410642310A CN104516478B CN 104516478 B CN104516478 B CN 104516478B CN 201410642310 A CN201410642310 A CN 201410642310A CN 104516478 B CN104516478 B CN 104516478B
Authority
CN
China
Prior art keywords
equipment
obff
critical
power
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410642310.3A
Other languages
English (en)
Other versions
CN104516478A (zh
Inventor
J·朱斯基
R·斯旺森
A·库马
M·奥里奥
W·皮奥特雷维茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN104516478A publication Critical patent/CN104516478A/zh
Application granted granted Critical
Publication of CN104516478B publication Critical patent/CN104516478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Control By Computers (AREA)

Abstract

本发明涉及对设备功率进行节流。提供一种用于对计算机系统中的I/O设备进行节流的装置和系统。在示例中,一种用于在关键功率事件期间对设备功率需求进行节流的方法。该方法包括检测关键功率事件,以及向系统设备发出信号以在关键功率事件期间推迟可选的事务。

Description

对设备功率进行节流
技术领域
本技术通常涉及对设备进行节流以在关键功率事件(critical power event)期间节省功率。
背景技术
计算机系统的标准系统设计参数是,AC功率输入的一个周期(例如,对于60赫兹功率供应大约17毫秒)的功率丧失不会使系统操作中断。为了支持这个参数,当前的功率供应通常具有用于在AC输入过低时将功率供应给系统的较大的电容器。此外,功率供应被设计具有对系统上的最坏情况(worse-case)负载状况进行处理所需的某个量的额定余量(margin)。实际使用中的负载状况低得多,并且较高的负载仅存在短的持续时间。
各种系统被用于在诸如欠功率(under power)、热偏移(thermal excursion)、平台功率约束、网络功率约束等等之类的关键功率事件期间降低功率需求。然而,目前还没有用于当需求加大时对外围组件接口(PCI)设备的功率使用进行节流的机制。PCI设备通常消耗多达总功率的15%。此外,随着如通用(GP)中央处理单元(CPU)、图形处理单元(GPU)、基于网络的卸载处理器等等的更多高功率设备安装在服务器中,作为总服务器功率百分比的PCI和I/O功率将增长。如果平台包括多个这些较高功率设备,那么这些设备的功率消耗可以构成平台所需的总功率的多于50%。
发明内容
一种用于在关键功率事件期间对设备功率需求进行节流的方法,包括:检测关键功率事件;以及向系统设备发出信号以在所述关键功率事件期间推迟可选的事务,以指示机会缓冲器冲洗及填充(OBFF)状况,以及在所述系统设备的本地缓冲器之外操作,其中所述系统设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且其中所述系统设备响应于所述关键中断来执行来自主系统存储器的直接存储器访问。
一种用于控制功率使用的系统,包括:功率故障检测系统;以及控制系统,其中所述控制系统被配置成从所述功率故障检测系统接收指示功率故障的信号,并向所述系统外围的设备发送信号以推迟可选的事务,以指示机会缓冲器冲洗及填充(OBFF)状况,以及在对于所述系统外围的所述设备是本地的本地缓冲器之外操作,其中发送到所述系统外围的所述设备的信号引致所述系统外围的所述设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且响应于所述关键中断来执行来自主系统存储器的直接存储器访问。
一种对计算机系统中的外围设备中的功率使用进行向后节流的系统,包括:系统管理引擎,其包括:功率检测系统;和机会缓冲器冲洗及填充(OBFF)控制器;将所述OBFF控制器耦合到外围设备的信号线;将所述OBFF控制器耦合到第二外围设备的通信总线;以及包括代码的模块,所述代码被配置成引导所述系统管理引擎以检测功率故障并向所述系统外围的设备发出OBFF命令,以在对于所述系统外围的设备是本地的本地缓冲器之外操作,其中发送到所述系统外围的所述设备的信号引致所述系统外围的所述设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且响应于所述关键中断来执行来自所述系统的主系统存储器的直接存储器访问。
附图说明
图1是使用诸如机会缓冲器冲洗及填充(opportunistic buffer flush andfill,OBFF)之类的信号系统以在关键功率事件期间对设备的功率需求进行节流的计算机系统100的示图。
图2是其中管理引擎(ME)通过信号线向I/O设备发出OBFF命令的系统的另一个图示。
图3是可以用于将操作状态传送给设备的OBFF线上的状态转换图。
图4是示出了在I/O节流期间对数据和功率使用进行节流的转换图。
图5是能够通过互连的切换器使用OBFF信号来对辅助设备进行节流的所使用的系统的框图。
图6是用于使用OBFF信号来对功率需求进行节流的方法。
本公开和附图由始至终使用相同的数字来标记相同的组件和特征。100系列的数字是指最初在图1中出现的特征;200系列的数字是指最初在图2中出现的特征,等等。
具体实施方式
一些实施例可以以硬件、固件和软件中的一个或者它们的组合来实现。一些实施例也可以被实现为存储在机器可读介质上的指令,所述指令可以通过计算平台来读取并运行以执行此处所描述的操作。机器可读介质可以包括用于以由机器(例如,计算机)可读的形式存储或传输信息的任何机制。例如,除其它外,机器可读介质尤其可以包括只读存储器(ROM);随机存取存储器(RAM);磁盘储存介质;光学储存介质;闪速存储器设备或者电、光、声或其它形式的传播信号,例如,载波、红外信号、数字信号、或者发送和/或接收信号的接口。
实施例是实现方式或示例。说明书中对“实施例”、“一个实施例”、“一些实施例”、“各种实施例”或者“其它实施例”的提及意为关于实施例描述的特定特征、结构、或特性包括在本技术的至少一些实施例中,但不一定在所有实施例中。“实施例”、“一个实施例”、或“一些实施例”的各种出现不一定都指相同实施例。来自一个实施例的元件或方面可以与另一个实施例中的元件或方面相组合。
不需要在一个或多个特定实施例中包含此处描述和图示的所有组件、特征、结构、特性等。如果说明书表述,例如,“可以”、“可能”、“能够”或“也许”包括组件、特征、结构、或特性,那么就不要求包括特定的组件、特征、结构、或特性。如果说明书或权利要求书提到“一”或“一个”元件,这并不意为仅存在元件之一。如果说明书或权利要求书提到“一个附加”元件,那么并不排除存在多于一个的附加元件。
应注意的是,虽然已经参考特定实现方式描述了一些实施例,但是根据一些实施例的其它实现方式也是可能的。此外,附图中图示和/或此处描述的电路元件或其它特征的布置和/或次序不需要以所图示和描述的特定方式来布置。根据一些实施例的许多其它布置是可能的。
在附图所示的每个系统中,在一些情况下元件可以均具有相同的附图标记或不同的附图标记以表明所呈现的元件可以是不同和/或类似的。然而,元件可以足够灵活以具有不同的实现方式并与此处所示或所描述的一些或所有系统一起工作。附图中所示的各种元件可以相同或不同。哪一个被称为第一元件,以及哪一个被称为第二元件是任意的。
可以使用各种技术来在诸如AC丧失事件、热偏移或最坏情况负载场景之类的关键功率故障期间临时降低系统功率消耗。例如,如果系统功率供应过载,系统可以通过减小可用带宽来对存储器或处理器进行节流以便降低负载。例如,称为闭环系统节流(CLST®)的系统可以实现在可向Santa Clara, California的Intel® Corporation购买的系统中。类似地,在到功率供应的AC功率的临时丧失的情况下,系统可以以已知为智能穿越(SmartRide Through,SmaRT®)的技术来减小可用带宽以对功率需求进行节流。与位于功率供应中的电容器一起作用,这些技术可以使得系统能够安全渡过功率扰动,这可以避免导致系统停机的关键功率丧失。
类似地,可以由诸如节点管理器之类的控制系统来管理系统功率,其实现数个类型的平台功率封顶(capping)策略以将总平台功率消耗限制到定义的水平。为了实现这个效果,节点管理器技术使用可用处理器和存储器硬件节流机制并且与主机操作系统合作。
然而,这些技术没有一个能够直接对带宽进行节流,并且因此在关键功率事件期间对通过系统总线附接到系统的外围设备的功率需求进行节流。功率管理设备的当前实现方式可以使用称为机会冲洗及填充(OBFF)的技术来管理总体功率需求。OBFF是通过信号或命令来指示的系统状态,其通知外围设备在该系统状态期间应当推迟可选的事务(transaction)。如此处所使用的,事务是外围设备用来实现通信操作的通信,诸如中断或直接存储器存取(DMA)。在这些操作期间,系统功率使用随着通过总线或网络在各单元之间传递的数据而增加。当设备想要在操作期间获得数据或共享结果时,使用事务。如果外围设备包括缓冲器,该事务可以被视为可选的,只要缓冲器仍然保存以供外围设备使用的数据,或者具有存储结果或传入数据的空间。如果缓冲器在OBFF状态期间没有数据,则可能需要关键事务以防止外围设备进入空闲状态。OBFF状态通过仅对当外设需要数据继续起作用时的操作打开系统总线来辅助系统功率管理。
OBFF状态的潜在意图是调整由支持该技术的各种系统设备发起的系统业务并通过允许处于空闲状态的更长时间而节省功率。当通道或总线针对中断和DMA(直接存储器存取)业务打开时,参与的内部和外部设备从平台控制器接收周期性OBFF指示。当通道关闭时,参与的设备被请求拖延机会主义的周期,典型地是通过在本地缓冲器之外尽可能长时间地操作。最后,当通道再打开或当设备已经跨过内部阈值并且必须访问存储器或CPU以维持期望的服务质量时,设备发出其请求。
在此处所描述的实施例中,诸如通过节点管理器之类的通过系统管理引擎来使用OBFF信令以在关键功率约束期间快速对外围设备进行节流以确保系统能够防止灾难性的停机。需要注意的是,节点管理器或其它类型的类似控制器可以是任何数量的系统或板控制器的部分,包括来自Santa Clara, California的Intel® Corporation的ManagementEngine ®。这些关键事件包括如AC丧失、超出功率供应容量的暂态负载、功率供应的热过载等等这样的功率事件。此外,如果达到定义的策略限制,节点管理器能够快速将外围设备节流到具有OBFF状态的低功率消耗。
图1是计算机系统100的示图,其使用诸如机会缓冲器冲洗及填充(OBFF)之类的信号系统以在关键功率事件期间对设备的功率需求进行节流。图1所示的计算机系统100仅仅是示例,由于除了所示出的那些之外还可以使用任何数量的其它外围设备。此外,不是图1中所示的所有外设或设备都需要存在于计算机系统100中。此外,虽然总线通常被描述为PCIe总线,但是在此处所描述的技术中可以使用任何数量的其它总线和通信网络,除了许多其它的之外,尤其包括直接媒体接口(DMI)、以太网、光纤通道和PCI。
计算机系统100具有平台控制中心(PCH)102,其控制计算机系统100的其它节点和基本输入/输出(I/O)功能。第一中央处理单元(CPU)104可以通过诸如直接媒体接口(DMI)106之类的总线耦合到PCH 102,其允许与PCH 102进行高速通信。第二CPU 108和随后的CPU也可以通过DMI 106耦合到PCH 102。每个系统设备102、104和106都可以具有例如安装在本地卡上的内部设备。此外,每个系统设备102、104和106都可以具有通过本地总线接口附接的外围设备。
PCH 102通常用作计算机系统102的核心接口,并且能够提供多种功能。例如,除了其它的以外,PCH 102尤其可以包括集成控制器110,诸如USB控制器112。可以使用吉比特以太网(GbE)接口114来提供对因特网116的访问。可以使用串行ATA(SATA)118控制器与多个储存设备120进行对接。PCH 102还可以包括PCIe 120接口以访问本地PCIe总线122。各种设备可以耦合到PCIe 总线122,诸如,光纤通道适配器124、10吉比特以太网(GbE)卡126以及其它。
PCH 102还可以包括能够用于在管理引擎的控制下实现功率策略和紧急功率节流的节点管理器128,如此处所述。节点管理器128可以是用于控制系统的功率需求的管理引擎或者其它类型的板控制器的部分。此外,节点控制器128可以包括诸如只读存储器(ROM)、可编程只读存储器(PROM)等等之类的内部储存以保存被配置成引导处理器执行此处描述的功能的代码,例如,如关于图6所描述的。节点管理器128可以耦合到将OBFF状态的状态传送给内部控制器110的内部信号线130。如果OBFF状态被发信号通知,例如,在SmaRT或CLST情况下,则内部控制器110运行使用内部缓冲器存储器来存储传入和传出数据。
在实施例中,节点管理器128还耦合到能够耦合到各种PCIe设备以将OBFF信号传播到那些设备的外部信号线132。节点管理器128也可以通过DMI 106和本地PCIe 总线122发出OBFF命令作为命令串。在正常操作中,节点管理器128可以发出规则的间歇信号以首先打开然后关闭时间窗,在所述时间窗期间设备能够实现可选的事务,如参考图2和3所讨论的。
节点管理器128也可以通信地耦合到功率检测系统134。功率故障检测系统134可以检测关键功率事件,例如,欠电压状况、高功率汲取状况、热状况等等。例如,功率故障检测系统134可以与功率供应集成以监视电压和电流输入和输出。在实施例中,如果功率故障检测系统134将关键功率事件传送到节点管理器128,那么节点管理器128将系统保持在OBFF状态以对设备进行节流,降低功率消耗。这进一步关于图4进行讨论。
外部信号线132可以连接到本地PCIe总线122上的设备以及连接到耦合于其它单元的本地PCIe总线的设备。例如,如图1所示,外部信号线132耦合到附接于本地PCIe 总线122的10GbE卡126。此外,它还耦合到第一CPU 104,以及通过本地PCIe总线136耦合到附接于第一CPU 104的三个设备,所述本地PCIe总线136由第一CPU 104卡上的本地PCIe接口138驱动。在该示例中,本地设备是图形处理单元(GPU)140、10GbE卡142和iSCSI卡144。如将理解的是,本地设备可以连接到未示出的其它设备,诸如,监视器、网络、磁盘阵列等等。
例如,当窗口针对可选的事务打开或关闭时,外部信号线132 用于将OBFF状态通知第一CPU 104以及所有附接的设备140、142和144。当外部信号线132指示存在OBFF状况时,设备将推迟可选的事务,例如,除了其它的以外尤其包括使从第一CPU 104到附接的双列直插存储器模块(DIMM)146的存储器访问空闲。然而,接近关键状况(例如,缓冲器上溢(overflow)或下溢(underflow))的设备可以仍然进行中断或DMA以维持服务质量。
一些情况下,PCIe设备可以不包括监视外部信号线132的状态的系统。在该示例中,节点管理器128可以通过诸如DMI 106和外部PCIe总线122之类的耦合的总线发出OBFF状态命令。例如,光纤通道适配器124可以由通过关闭任何打开的窗口的本地PCIe总线122发送的命令进行节流。可以理解,这也对应于不针对可选的事务打开窗口,如关于图4所讨论的。类似地,命令可以通过其它总线发出,其通知附接的设备针对可选的事务的窗口已经打开或关闭。
例如,第二CPU 108及其本地控制的设备不附接到外部信号线132。节点管理器128可以通过DMI 106将命令发送到第二CPU 108,其通知第二CPU 108窗口何时针对可选的事务打开或关闭。当窗口关闭或者接收到空闲命令时,第二CPU 108可以限制去往附接的DIMM148的事务。此外,第二CPU 108可以使用内部PCIe接口150来向附接到本地PCIe总线152的设备发出OBFF命令。在该示例中,除了其它的以外,这尤其可以包括处理器卡154、iSCSI卡156和10GbE卡158。
所提出的解决方案的优点是在关键功率状况期间SmaRT和CLST技术的更高的效率和功率封顶范围,潜在地防止灾难性的功率供应失效。这将有助于节点管理器128将功率维持在定义的预算内,并降低系统的最坏情况功率汲取。此外,增强的控制可以降低用于利用该技术的平台的功率供应的成本和大小。
图2是系统200的另一个图示,其中管理引擎(ME)202通过信号线206向I/O设备204发出OBFF命令。在该简化的示例中,未示出总线。信号线206上的电压电平和转换可以用于指示窗口何时针对可选的事务打开,窗口何时关闭,以及附接的CPU是否处于空闲状况。这关于图3进一步讨论。
如图2所示,管理引擎202可以包括节点管理器208,其可以包括或利用储存系统210和处理器212。节点管理器208可以不具有专用处理器212,但可以是在管理引擎202内运行的处理。类似地,储存系统210可以包括属于管理引擎202以及在节点管理器208之外的其它功能。储存系统210可以包括任何数量的非临时性储存,诸如只读存储器(ROM)、可编程只读存储器(PROM)、电可编程只读存储器(EPROM)、硬盘驱动器、光学驱动器、固态磁盘等等。储存系统210可以包括检测器模块214,该检测器模块214包括被配置成引导处理器212确定是否已经发生诸如热偏移和欠功率之类的关键功率事件或者功率约束的代码。储存系统210还可以包括诸如OBFF模块216之类的模块,其被配置成引导处理器指示其它设备(例如,I/O设备204)在关键功率事件期间推迟可选的事务。在OBFF模块216内的代码的引导下,节点管理器208可以例如通过信号线206或通过总线通信来管理具有其它单元的OBFF通信系统。
在当前系统中,ME不具有直接控制I/O设备功率消耗的任何机制。该能力是使得ME能够控制通过I/O子系统(例如,附接到位于平台控制器中心外部的总线)的功率消耗的关键。在一些实施例中,OBFF信令将被大多数标准PCIe设备所支持,其允许整个系统的功率消耗被控制。
图3是OBFF线上的状态转换图,该OBFF线可以用于将操作状态传送给设备。该表中指示的转换假定三个状态:空闲状态302,其中系统处于空闲的、低功率模式;OBFF状态304,其中系统总线和存储器通道只可用于关键事务;以及CPU活动状态306,其中系统可用于所有事务。
在图3所示的实施例中,信号线上的高电平指示空闲状况302,而低电平可以指示OBFF状态或CPU活动状态。如果信号线处于低电压状态,那么状态改变可以由连续状态改变的数量来指示。在该示例中,使线处于低电压状态的两个连续向下转换指示CPU活动306状态,而使线处于低电压状态的单个向下转换指示OBFF状态。然而,图3所示的转换和状态仅仅是示例,由于可以使用任何数量的不同的转换来指示状态。
如果设备未准备好信号线,那么可以使用OBFF命令来指示状态。命令可以由识别命令作为OBFF命令并确定路线的初始位序列构成,其跟随有指示期望的状态类型的位序列。例如,四位序列“1111”可以用于指示CPU活动306状态,而四位序列“0001”可以用于指示OBFF状态304。类似地,四位序列“0000”可以用于指示已经进入空闲状态。
图4是示出了在I/O节流时段402期间数据和功率使用的节流的转换图400。转换图400假定两种状态之间的切换:OBFF状态404,其中窗口对可选的事务关闭;以及CPU活动状态406,其中窗口针对可选的事务打开。关键事务仍然可以在任何时间发生,但会增加系统功率需求。
在正常操作408期间,OBFF状态404通常是活动的,推迟关键事务。如关于图3所描述的,以规则的间隔进入CPU活动状态406。CPU活动状态406在充足的间隔410内保持打开以允许所有的I/O和外围单元完成DMA事务。然后重新进入OBFF状态404,降低功率需求。OBFF状态404的长度412可以通过I/O单元以最短的等待时间(例如最高的数据访问需求)来确定。通常,在正常操作408期间,额外中断会很少并且将是由异常事件引起的,例如,除了其它的之外尤其是大量数据的传递。
如果检测到关键功率故障,那么I/O节流时段402可以通过使系统处于OBFF状态404并且不打开用于中断和DMA业务的通道来实现。偶然的关键事务414可能来自于设备,其具有较短的等待时间段,但大部分中断和业务会被抑制,从而降低功率消耗。
此处所描述的技术不限于所示的时段410和412。可以对OBFF状态404和CPU活动状态406的长度和频率作其它改变以调节在I/O节流时段402或正常操作408期间的功率消耗。例如,I/O节流时段402可以不完全停止可选的事务,但是可以替代地,例如通过增加OBFF状态404的长度412来降低CPU活动状态406的频率。此外,可以通过在I/O节流时段402的开始或结束二者处增加OBFF状态404的长度来使节流渐缩(tapered)。可以至少部分地在偶然的关键事务414的频率上做出这些改变。
图5是能够通过互连的切换器使用OBFF信号来对辅助设备进行节流的所使用的系统500的框图。此处描述的技术不限于单个系统,但是可以用于控制较大系统中功率的节流。例如,系统集群中的关键功率事件可以指示对整个集群进行节流的需要。
作为示例,主系统502可以通过诸如以太网连接之类的网络506耦合到切换器A504。第二网络508可以将主系统502耦合到各种其它端点,诸如A 510。这些端点可以包括其它系统、处理器、I/O设备、储存设备等等。切换器A 504可以通过附加的网络连接514将主系统502耦合到其它端点,诸如B 512。主系统502可以包括控制信号线518的节点管理器516,该信号线能够将OBFF信号传送到切换器A 504以及端点A 510和B 512。例如,在如通过耦合到主系统502的功率检测模块520检测到的关键功率故障的情况下,OBFF信号可以用于对联网的单元进行节流。
切换器还可以耦合网络单元,例如,另一个切换器B 522。切换器B 522可以通过网络线528提供去往诸如C 524和D 526之类的其它端点的通信。切换器B 522还可以包括能够控制信号线532以将OBFF状态传送到端点C 524和D 526的本地节点管理器530。然而,切换器B 522可以位于与主系统502远程处,例如在数据中心的对侧的机柜中。
例如,如果由于到数据中心的反馈中的功率故障而需要板OBFF状态改变,则主系统502可以改变控制线518的状态以向本地设备指示OBFF状态,并通过切换器A 504将OBFF消息534发送到切换器B 522。然后切换器B 522通过本地控制线532指示OBFF状态。
可以理解的是图5提供了简化示例。较大系统不限于所示的单元,而是通常可以具有更加多的单元。此外,系统不必须具有所示的所有单元。例如,主系统502可以通过切换器排他地通信,并且不具有直接连接的端点,诸如A 510。此外,较大系统中可以存在多层切换器。还应该注意的是,该配置可以用于在主控系统502的控制下实现对网络500的某些区域的节流,而不对整个网络500进行节流。这可以通过只将命令发送到具有功率问题的区域来执行。
图6是用于使用OBFF信号来对功率需求进行节流的方法600。方法600可以通过例如上面所讨论的系统100或500来实现。在块602处方法开始于计算机系统处于正常操作中。在块604处,检测到功率故障。这可以通过轮询功率故障检测系统,或通过来自功率监视器中的处理器的中断来执行。如果没有检测到故障,则在块602处过程流程用正常操作继续。
如果检测到功率故障,则在块606处OBFF状态被改变成指示可以例如通过改变或保持OBFF状态中状态线的状态而推迟可选的事务。过程流程可以转到块608以将OBFF消息发送到未连接到状态线的单元。过程流程然后可以在块604处重新开始确定功率故障或问题是否已经结束。一旦功率故障结束,则过程流程在块602处用正常操作重新开始。
方法600不需要包括上面示出的所有块。例如,如果所有单元都耦合到信号线,则块608可以被消除。类似地,如果较旧的网络不具有实现信号线的物理硬件,则块606可以被消除。
示例1
在示例中,计算设备包括用于在关键功率事件期间对设备功率需求进行节流的方法,该方法包括:检测关键功率事件;以及向系统设备发出信号以推迟可选的事务。
示例2
在另一个示例中,用于控制功率使用的系统包括功率故障检测系统、多个外围设备和控制系统。该控制系统被配置成从功率故障检测系统接收指示功率故障的信号,并将信号发送到多个外围设备以推迟可选的事务。
示例3
在另一个示例中,对计算机系统中的外围设备中的功率使用进行向后节流的系统包括系统管理引擎,该系统管理引擎包括功率检测系统和机会缓冲器冲洗及填充(OBFF)控制器。信号线将OBFF控制器耦合到外围设备,并且通信总线将OBFF控制器耦合到第二外围设备。模块包括被配置成引导系统管理引擎以检测功率故障并向耦合的外围设备发出OBFF命令的代码。
应该理解的是,前文提及的示例中的细节可以用于一个或多个实施例中的任何地方。例如,上述计算设备的所有可选的特征还可以关于此处所描述的方法或者计算机可读介质来实现。此外,虽然此处可以已经使用流程图和/或状态图来描述实施例,但是本技术不限于此处的那些图解或者对应的描述。例如,流程不需要通过每个图示的方框或状态或者以如此处所图示和描述的确切相同的次序来移动。
本技术不限于此处所列出的特定细节。确实地,得益于本公开的本领域技术人员将认识到可以在本技术的范围内对前述描述和附图进行许多其它变型。因此,包括对其的任何修改的下述权利要求限定本技术的范围。

Claims (24)

1.一种用于在关键功率事件期间对设备功率需求进行节流的方法,包括:
检测关键功率事件;以及
向系统设备发出信号以在所述关键功率事件期间推迟可选的事务,以指示机会缓冲器冲洗及填充(OBFF)状况,以及在所述系统设备的本地缓冲器之外操作,其中所述系统设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且其中所述系统设备响应于所述关键中断来执行来自主系统存储器的直接存储器访问。
2.根据权利要求1所述的方法,包括:
确定所述关键功率事件是否已经结束,并且,如果是,
则重新开始正常操作。
3.根据权利要求1所述的方法,包括检测欠功率事件。
4.根据权利要求1所述的方法,包括检测功率供应的热偏移。
5.根据权利要求1所述的方法,包括改变信号线的状态以向系统设备指示机会缓冲器冲洗及填充(OBFF)状况。
6.根据权利要求1所述的方法,包括推迟来自系统设备的非关键中断。
7.根据权利要求1所述的方法,包括推迟来自系统设备的非关键动态存储器访问(DMA)。
8.根据权利要求1所述的方法,包括允许来自设备的关键中断。
9.一种用于控制功率使用的系统,包括:
功率故障检测系统;以及
控制系统,其中所述控制系统被配置成从所述功率故障检测系统接收指示功率故障的信号,并向所述系统外围的设备发送信号以推迟可选的事务,以指示机会缓冲器冲洗及填充(OBFF)状况,以及在对于所述系统外围的所述设备是本地的本地缓冲器之外操作,其中发送到所述系统外围的所述设备的信号引致所述系统外围的所述设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且响应于所述关键中断来执行来自主系统存储器的直接存储器访问。
10.根据权利要求9所述的系统,其中所述功率故障检测系统包括被配置成检测热偏移的功率供应。
11.根据权利要求9所述的系统,其中所述功率故障检测系统被配置成检测低电压状况。
12.根据权利要求9所述的系统,包括PCIe总线。
13.根据权利要求9所述的系统,包括耦合到所述控制系统和外围设备的信号线,其中所述信号线指示机会冲洗及填充(OBFF)状况的状态。
14.根据权利要求9所述的系统,包括耦合到信号线的外围设备,其中所述外围设备被配置成至少部分基于施加到所述信号线的电压电平而推迟可选的事务。
15.根据权利要求14所述的系统,其中所述外围设备包括图形处理单元(GPU)、吉比特以太网卡(GbE)、小型计算机系统接口(SCSI)、中央处理单元(CPU)、存储器设备、切换器或其任何组合。
16.一种对计算机系统中的外围设备中的功率使用进行向后节流的系统,包括:
系统管理引擎,其包括:
功率检测系统;和
机会缓冲器冲洗及填充(OBFF)控制器;
将所述OBFF控制器耦合到外围设备的信号线;
将所述OBFF控制器耦合到第二外围设备的通信总线;以及
包括代码的模块,所述代码被配置成引导所述系统管理引擎以检测功率故障并向所述系统外围的设备发出OBFF命令,以在对于所述系统外围的设备是本地的本地缓冲器之外操作,其中发送到所述系统外围的所述设备的信号引致所述系统外围的所述设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且响应于所述关键中断来执行来自所述系统的主系统存储器的直接存储器访问。
17.根据权利要求16所述的系统,其中所述OBFF命令包括所述信号线上电压电平中的改变。
18.根据权利要求16所述的系统,其中所述OBFF命令包括通过所述通信总线发送的命令。
19.根据权利要求16所述的系统,其中所述通信总线是PCIe总线。
20.一种用于控制节点管理器以在关键功率事件期间对设备功率需求进行节流的系统,包括:
用于检测关键功率事件的装置;以及
用于引导所述节点管理器以向系统设备发出信号以在所述关键功率事件期间推迟可选的事务,以指示机会缓冲器冲洗及填充(OBFF)状况,以及在所述系统设备的本地缓冲器之外操作的装置,其中所述系统设备响应于本地缓冲器上溢或本地缓冲器下溢中的至少一个来执行关键中断,并且其中所述系统设备响应于所述关键中断来执行来自主系统存储器的直接存储器访问。
21.根据权利要求20所述的系统,包括:
用于引导所述节点管理器以确定所述关键功率事件是否已经结束的装置,以及,如果是,
用于引导所述节点管理器以重新开始正常操作的装置。
22.根据权利要求20所述的系统,包括用于引导所述节点管理器以检测欠功率事件的装置。
23.根据权利要求20所述的系统,包括用于引导所述节点管理器以检测功率供应的热偏移的装置。
24.一种计算机可读介质,具有存储于其上的指令,所述指令在被执行时促使计算设备执行根据权利要求1-8中任一项所述的方法。
CN201410642310.3A 2013-09-26 2014-09-26 对设备功率进行节流 Active CN104516478B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/038,347 US9891686B2 (en) 2013-09-26 2013-09-26 Throttling device power
US14/038347 2013-09-26

Publications (2)

Publication Number Publication Date
CN104516478A CN104516478A (zh) 2015-04-15
CN104516478B true CN104516478B (zh) 2017-12-12

Family

ID=52692110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410642310.3A Active CN104516478B (zh) 2013-09-26 2014-09-26 对设备功率进行节流

Country Status (3)

Country Link
US (1) US9891686B2 (zh)
CN (1) CN104516478B (zh)
TW (1) TWI599875B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10144527B2 (en) 2015-03-25 2018-12-04 Skyfront Corp. Flight controller with generator control
US10496448B2 (en) * 2017-04-01 2019-12-03 Intel Corporation De-centralized load-balancing at processors
US10725532B1 (en) * 2018-04-18 2020-07-28 EMC IP Holding Company LLC Data storage system power shedding for vault
US11789512B2 (en) * 2019-01-08 2023-10-17 International Business Machines Corporation Increased data storage throttling during power failure
JP2021056550A (ja) * 2019-09-26 2021-04-08 キオクシア株式会社 メモリシステム、メモリシステムの制御方法、および情報処理システム
EP4270152A1 (en) * 2022-04-27 2023-11-01 DC Systems B.V. Computer power consumption management based on the state of the power supplying electrical grid

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096460A (zh) * 2009-12-14 2011-06-15 英特尔公司 在数据中心动态分配功率的方法和设备
CN102597912A (zh) * 2010-09-23 2012-07-18 英特尔公司 用于平台功率节省的协调设备和应用程序中断事件

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434562A (en) * 1991-09-06 1995-07-18 Reardon; David C. Method for limiting computer access to peripheral devices
US7340325B2 (en) 2005-08-03 2008-03-04 Texas Instruments Incorporated Priority powerdown system and method for power distribution systems
US7412570B2 (en) * 2005-11-15 2008-08-12 Sun Microsystems, Inc. Small and power-efficient cache that can provide data for background DNA devices while the processor is in a low-power state
JP4252593B2 (ja) 2006-09-19 2009-04-08 株式会社ソニー・コンピュータエンタテインメント オーディオ処理装置、入出力処理装置および情報処理装置
US8832416B2 (en) * 2007-05-24 2014-09-09 International Business Machines Corporation Method and apparatus for instruction completion stall identification in an information handling system
TW200917006A (en) 2007-10-01 2009-04-16 Inventec Corp Apparatus and method for power management
JP4973490B2 (ja) * 2007-12-26 2012-07-11 富士通株式会社 消費電力監視プログラム
US8495423B2 (en) * 2009-08-11 2013-07-23 International Business Machines Corporation Flash-based memory system with robust backup and restart features and removable modules
US8700925B2 (en) 2009-09-01 2014-04-15 Nvidia Corporation Regulating power using a fuzzy logic control system
CA2716646C (en) * 2010-10-14 2020-04-07 Ibm Canada Limited - Ibm Canada Limitee Coordinated approach between middleware application and sub-systems
US10817421B2 (en) * 2010-12-13 2020-10-27 Sandisk Technologies Llc Persistent data structures
US20120213118A1 (en) 2011-02-18 2012-08-23 Lindsay Steven B Method and system for network interface controller (nic) address resolution protocol (arp) batching
US8650427B2 (en) 2011-03-31 2014-02-11 Intel Corporation Activity alignment algorithm by masking traffic flows
TW201335739A (zh) 2012-02-29 2013-09-01 Quanta Comp Inc 伺服器系統
US9046570B2 (en) * 2012-08-03 2015-06-02 Freescale Semiconductor, Inc. Method and apparatus for limiting access to an integrated circuit (IC)
US9239601B2 (en) * 2013-04-10 2016-01-19 Dell Products, L.P. Power supply unit (PSU) right-sizing that supports power transients, with mechanism for dynamic curtailment of power transients during a PSU failure
US9223664B1 (en) * 2013-04-22 2015-12-29 Amazon Technologies, Inc. Energy storage for memory protection during power event
US9213633B2 (en) * 2013-04-30 2015-12-15 Seagate Technology Llc Flash translation layer with lower write amplification

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096460A (zh) * 2009-12-14 2011-06-15 英特尔公司 在数据中心动态分配功率的方法和设备
CN102597912A (zh) * 2010-09-23 2012-07-18 英特尔公司 用于平台功率节省的协调设备和应用程序中断事件

Also Published As

Publication number Publication date
CN104516478A (zh) 2015-04-15
TW201527948A (zh) 2015-07-16
US20150089255A1 (en) 2015-03-26
US9891686B2 (en) 2018-02-13
TWI599875B (zh) 2017-09-21

Similar Documents

Publication Publication Date Title
CN104516478B (zh) 对设备功率进行节流
US7584375B2 (en) Active state link power management
CN102307134B (zh) 用于运行平台功率状态的方法、设备和系统
CN103825830B (zh) 基于tuxedo中间件的系统实现流量管控的方法和装置
CN106339058A (zh) 动态管理电力供应的方法和系统
CN103262001A (zh) 具有自适应高速缓存清除的计算平台
US20140136829A1 (en) Method, Network Card, and Hard Disk Card for Accessing Shut-Down Hard Disk
CN104009976B (zh) 一种用于多主站系统之间的实时通信方法及其设备
CN107533352B (zh) 控制在标准状态和静态状态之间的转换
US11460908B2 (en) Storage system and method for transmitting signal in storage system
US10659376B2 (en) Throttling backbone computing regarding completion operations
EP2852113B1 (en) Load sharing method and device, and single board
CN110399034A (zh) 一种SoC系统的功耗优化方法及终端
CN102103471B (zh) 数据传输方法和系统
CN110209606A (zh) 一种基于PCIe的多接口存储设备的控制方法
US20160162421A1 (en) Ltr/obff design scheme for ethernet adapter application
CN106648851A (zh) 一种多控存储中io管理的方法和装置
CN103984390B (zh) 一种刀片及刀片服务器
CN113220107A (zh) PCIe链路的功耗管理方法以及终端设备和存储介质
CN103514115A (zh) 一种基于掉电保护的cpu及内存数据自动保存设计方法
CN101252372B (zh) 一种双星型系统中主备主控盘倒换方法
JPH10276224A (ja) スイッチングハブ
WO2016077948A1 (zh) 交换机端口控制方法、装置及系统
CN110175092A (zh) 一种基于PCIe的多接口存储设备
CN104394100A (zh) 信用分配方法和交换机

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant