CN108139791B - 功率监控的cpu功率网设计 - Google Patents
功率监控的cpu功率网设计 Download PDFInfo
- Publication number
- CN108139791B CN108139791B CN201680056610.0A CN201680056610A CN108139791B CN 108139791 B CN108139791 B CN 108139791B CN 201680056610 A CN201680056610 A CN 201680056610A CN 108139791 B CN108139791 B CN 108139791B
- Authority
- CN
- China
- Prior art keywords
- subsystem
- power
- cache memory
- domain
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/266—Arrangements to supply power to external peripherals either directly from the computer or under computer control, e.g. supply of power through the communication port, computer controlled power-strips
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0811—Multiuser, multiprocessor or multiprocessing cache systems with multilevel cache hierarchies
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/14—Power supply arrangements, e.g. power down, chip selection or deselection, layout of wirings or power grids, or multiple supply levels
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/60—Details of cache memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/62—Details of cache specific to multiprocessor cache arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0038—System on Chip
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Power Engineering (AREA)
- Computer Hardware Design (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Power Sources (AREA)
- Semiconductor Integrated Circuits (AREA)
Abstract
提供了一种用于提供功率网的方法和设备。该设备包括多个存储器单元,该多个存储器单元包括至少一个SoC存储器和至少一个高速缓存存储器。该设备包括被耦合至至少一个SoC存储器的第一子系统,该至少一个SoC存储器与第一功率域相关联。该设备还包括耦合至至少一个高速缓存存储器的第二子系统,该至少一个高速缓存存储器与第二功率域相关联。第二子系统可以是CPU子系统。因为第一功率域从共享的功率源获取功率,第一功率域可以在比存储器电路的操作所需要的电压水平更高的电压水平下进行操作。通过将至少一个高速缓存存储器从第一功率域移动至第二功率域,针对第一功率域中的部件的LDO效率损失可以得以减少。
Description
相关申请的交叉引用
本申请要求于2015年9月28日提交的名称为“POWER-AWARE CPU POWER GRIDDESIGN”(功率监控的CPU功率网设计)的印度专利申请No.5180/CHE/2015以及于2016年6月3日提交的名称为“POWER-AWARE CPU POWER GRID DESIGN”(功率监控的CPU功率网设计)的美国专利申请No.15/173,004的权益,其全部内容通过引用明确并入本文。
技术领域
本公开总体涉及集成电路的设计,并且更具体地涉及用于中央处理单元(CPU)子系统的功率网设计。
背景技术
诸如集成电路的半导体装置由形成在半导体材料上并与电路布线互连的电子部件构造而成。这些电路布线的网络可以连接一组部件,并向部件提供特定电压水平的功率。功率网(配电网络)通常指的是将电源连接至每个部件的电路布线网络。功率网设计包括这种网络的分析和设计。
集成电路(IC)可以具有多于一组的部件,其中每组部件被设计成在不同的电压水平下操作。例如,第一组部件可以被设计成在第一电压水平下操作,以及第二组部件可以被设计成在不同的第二电压水平下操作。被设计具有在多于一个的电压水平下操作的多组部件的集成电路被称为具有多个功率域,其中每个功率域与特定电压水平相关联。在操作中,特定的功率域可以通过控制连接该功率域中的部件组的电路布线网络的功率来选择性地通电或断电。
因为存储器电路和逻辑电路具有不同的电压要求,所以存储器电路和逻辑电路通常驻留在不同的功率域中。CPU高速缓存存储器是存储器电路的一种类型。因此,CPU高速缓存存储器驻留在具有其它类型的存储器电路的存储器功率域中。存储器功率域通常从由若干的其它部件共享的电源供应器中获取功率,若干的其它部件可能具有比CPU高速缓存存储器更高的电压要求。为了支持这些其它部件,共享的电源供应器需要保持比CPU高速缓存存储器所需的更高的电压水平。这导致了用于CPU高速缓存存储器的功率明显低效。
发明内容
在本公开的一个方面中,用于提供功率网的方法和装置被提供。装置包括多个存储器单元,该多个存储器单元包括至少一个片上系统(SoC)存储器和至少一个高速缓存存储器。装置包括被耦合至至少一个SoC存储器的第一子系统。至少一个SoC存储器可以与第一功率域相关联。装置包括被耦合至至少一个高速缓存存储器的第二子系统。至少一个高速缓存存储器可以与第二功率域相关联。
在本公开的另一个方面中,装置可以提供第一功率域至至少一个SoC存储器。至少一个SoC存储器可以被耦合至第一子系统。装置还可以提供第二功率域至至少一个高速缓存存储器。至少一个高速缓存存储器可以被耦合至第二子系统。
附图说明
图1是示出用于集成电路的功率网设计的示例的图。
图2是示出集成电路的功率网的示例的图。
图3是示出用于集成电路的功率网设计的示例的图。
图4是提供功率网的方法的流程图。
图5是示出被配置为实施图4的方法的集成电路的图。
具体实施方式
下文结合附图阐述的详细描述旨在作为对各种配置的描述,而并非旨在表示可以实践本文所描述的构思的唯一配置。详细描述包括用于提供对各种构思透彻理解的具体细节。然而,对于本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下实践这些构思。在一些情况下,为了避免模糊这些构思,众所周知的结构和部件以框图形式示出。
现在将参考各种装置和方法来呈现功率网设计的若干方面。这些装置和方法将在以下详细描述中进行描述,并且通过各种框、部件、电路、步骤、过程、算法等(共同被称为“要素”)在附图中示出。这些要素可以使用电子硬件、计算机软件或其任何组合来实现。这样的要素是以硬件还是软件来实现取决于特定的应用和对整个系统施加的设计限制。
作为示例,可以用包括一个或多个处理器的“处理系统”来实现要素或者要素的任何部分或者要素的任何组合。处理器的示例包括被配置为执行贯穿本公开描述的各种功能的微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、状态机、门控逻辑、分立硬件电路以及其它适当的硬件。处理系统中的一个或多个处理器可以执行软件。软件应被广泛地解释为指示指令、指令集、代码、代码段、程序代码、程序、子程序、软件组件、应用程序、软件应用程序、软件包、例程、子程序、对象、可执行程序、执行线程、过程、功能等等,而无论它们被称为软件、固件、中间件、微码、硬件描述语言或其它。
因此,在一个或多个示例性实施例中,所描述的功能可以以硬件、软件、固件或其任何组合来实现。如果以软件实现,则功能可以被存储或编码为计算机可读介质上的一个或多个指令或代码。计算机可读介质包括计算机存储介质。存储介质可以是任何可以被计算机访问的可用介质。作为示例而非限制,这样的计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程ROM(EEPROM)、光盘ROM(CD-ROM)或其它光盘存储设备、磁盘存储设备或其它磁性存储设备、前述类型的计算机可读介质的组合、或可以被用于以指令或数据结构的形式存储的可被计算机访问的计算机可执行代码的任何其它介质。
子系统是作为更大系统的一部分的单元或设备。本公开中的子系统指的是一个或多个硬件部件。CPU是计算机内的电子电路,通过执行指令指定的基本算术、逻辑、控制和输入/输出(I/O)操作来运行计算机程序的指令。大多数现代的CPU都被包含在单个IC芯片上。包含CPU的IC还可以包含计算机的内存、外围接口和其它部件;这样的集成设备被不同地称为微控制器或片上系统(SoC)。一些计算机采用多核处理器,多核处理器是包含两个或更多个被称为“内核”的CPU的单个芯片。
CPU子系统是执行CPU功能的一组电子部件。CPU子系统可以包括多个内核和高速缓存存储器电路。图1是示出用于集成电路150的功率网设计的示例的图100。在一种配置中,IC 150可以是SoC。IC150包括CPU子系统102。除了CPU子系统102之外,IC 150可以包括诸如GPU子系统、I/O子系统等的附加的子系统(未示出)。
如图所示,CPU子系统102包括两个四核集群110、130以及高速缓存一致性互连(CCI)104。四核集群110包括四个内核逻辑电路112、114、116、118以及二级(L2)高速缓存存储器120。四核集群130包括四个内核逻辑电路132、134、136、138和L2高速缓存存储器140。每个内核逻辑电路112、114、116、118、132、134、136和138分别被耦合至一级(L1)高速缓存存储器122、124、126、128、142、144、146和148。
CPU高速缓存存储器是在CPU内核上或接近CPU内核的小存储器。CPU高速缓存存储器可以比大很多的主存储器更快地操作。可以有多个级别的高速缓存存储器。L1高速缓存存储器是最快的高速缓存存储器,并且被紧密地耦合至内核逻辑电路。L2高速缓存存储器是仅次于最快的高速缓存存储器,并且仅在其低级别的L1高速缓存存储器上的查验未命中时才被查验。例如,L2高速缓存120仅在L1高速缓存存储器122、124、126或128上的查验未命中时才被查验。类似地,L2高速缓存140仅在L1高速缓存存储器142、144、146或148上的查验未命中时才被查验。
内核逻辑电路112、114、116、118、132、134、136和138中的每一个对其相应的内核执行操作,并且查验其相应的L1和L2高速缓存以用于数据访问。例如,内核逻辑电路112可以针对特定数据首先查验L1高速缓存122。如果L1高速缓存122上的查验未命中,则内核逻辑电路112可以针对该特定数据查验L2高速缓存120。
一个数据可以在不同的高速缓存存储器中具有多个副本。CCI 104管理冲突并维持四核集群110和130的高速缓存存储器之间的一致性。CCI 104可以将存储在四核集群110的高速缓存存储器中的数据与存储在四核集群130的高速缓存存储器中的数据进行同步。
在一种配置中,CPU子系统102可以将部件放置到三个功率域中:芯片逻辑域(例如,下文参照图2描述的芯片逻辑域208),存储器域(例如,下文参照图2描述的存储器域212),以及内核逻辑域(例如,下文参照图2描述的内核逻辑域210)。这三个功率域在图1中被示出具有不同的背景图案。例如,内核逻辑电路(112、114、116、118、132、134、136和138)、L1高速缓存存储器(122、124、126、128、142、144、146和148)和CCI104被分组到内核逻辑域中。L2高速缓存存储器120和140被分组到存储器域中。CPU子系统102的其它部件(例如CPU包装器106)被分组到芯片逻辑域中。在一种配置中,与IC 150上的附加子系统相关联的SoC存储器可以被放置到存储器域中。在这样的配置中,附加子系统的逻辑电路可以被放置到芯片逻辑域中。
相同功率域中的电子部件通常在相同的电压水平下操作并且被提供有相同的功率电压水平。在一种配置中,存储器电路(例如,L1和L2高速缓存存储器)和逻辑电路(例如,内核逻辑电路)在不同的电压水平下操作。因此,存储器电路和逻辑电路可以驻留在不同的功率域中。例如,L2高速缓存存储器驻留在存储器域中,以及内核逻辑电路驻留在内核逻辑域中。
在一种配置中,L1高速缓存存储器驻留在内核逻辑域中,而不是驻留在存储器域中。在这样的配置中,L1高速缓存存储器(例如,122、124、126、128、142、144、146和148)和内核逻辑电路(例如,112、114、116、118、132、134、136和138)被放置在相同的功率域(即内核逻辑域)中以满足CPU时序要求。
图2是示出集成电路250的功率网200的示例的图。在一种配置中,该IC 250可以是SoC,并且该示例可以示出SoC功率网的子集。如该示例中所示,功率网200包括三个功率源,即开关模式供电电源(SMPS)202、204和206,这三个功率源向三个功率域(芯片逻辑域208、内核逻辑域210和存储器域212)中部件、低功率双倍数据率同步DRAM(LPDDR)214和无线局域网(WLAN)的射频(RF)部件216提供功率。SMPS 202、204和206可以是用于管理主机系统的功率要求的功率管理集成电路(PMIC)的一部分。
芯片逻辑域208可以包括CPU子系统102中不是内核逻辑电路、高速缓存存储器或CCI的部件。芯片逻辑域208可以包括CPU子系统102外部的逻辑电路,例如,诸如I/O子系统、图形处理单元(GPU)子系统等的另一个子系统中的逻辑电路。在一种配置中,芯片逻辑域208中的部件在0.95V至1.25V范围的电压水平下操作。专用功率源SMPS 202向芯片逻辑域208中的部件提供功率。在一种配置中,SMPS202可以在0.95V至1.25V的范围的电压水平下将功率提供至芯片逻辑域208中的部件。
内核逻辑域210可以包括CPU子系统102中的内核逻辑电路(例如,112、114、116、118、132、134、136和138)、L1高速缓存存储器(例如,122、124、126、128、142、144、146和148)以及CCI(例如,104)。在一种配置中,内核逻辑域210中的部件在1.05V至1.25V的范围的电压水平下操作。内核逻辑电路可以在低至0.95V的电压水平下操作。因为L1高速缓存存储器驻留在内核逻辑域210中并且L1高速缓存存储器可能需要1.05V的最小电压来操作,所以内核逻辑域的最小电压可以被设定成1.05V。专用功率源SMPS 204将向内核逻辑域210中的部件提供功率。在一种配置中,SMPS 204可以在1.05V至1.25V的范围的电压水平下将功率提供至内核逻辑域210中的部件。
具有用于芯片逻辑域208和内核逻辑域210的专用功率源允许基于性能要求的无缝电压调节。为了节约功率,可以完成减小电压的动态电压调节;以及为了增大系统性能或增大可靠性,可以完成增大电压的动态调节。例如,具有用于内核逻辑域210的专用功率源(即SMPS 204)允许基于CPU性能要求的在内核逻辑域210中的部件上的动态电压调节。向内核逻辑域210中的所有部件提供的电压可以被减小,例如降小至1.05V以节约功率;或者可以被增大,例如增大至1.25V,以增大CPU子系统102的性能。
存储器域212可以包括L2高速缓存存储器(例如,120和140)以及其它SoC存储器。在一种配置中,其它SoC存储器可以是CPU子系统外部的片上静态随机存取存储器(SRAM)。在一种配置中,其它SoC存储器可以是调制解调器DSP L2高速缓存、音频DSP L2高速缓存、图形内部(SoC)RAM、显示器内部(SoC)RAM、相机内部(SoC)RAM、视频内部(SoC)RAM、外围设备(例如,USB、Crypto、eMMC)内部(SoC)RAM、共享存储器等中的一个或多个。在一种配置中,这些其它SoC存储器可以被耦合至CPU子系统102外部的部件(例如,被耦合至诸如I/O子系统、GPU子系统等的另一个子系统)。在一种配置中,存储器域212中的部件在1.05V至1.25V的范围的电压水平下操作。因为存储器可能需要1.05V的最小电压来操作,所以内核逻辑域的最小电压可以被设定成1.05V。
共享的功率源SMPS206向存储器域212中的部件提供功率。在一种配置中,存储器域212中的部件可以从SMPS 206经由低压差(LDO)调节器220来进行次级调节。IC 250的许多其它部件可以从SMPS 206经由其它LDO调节器来进行次级调节。例如,LPDDR 214可以从SMPS 206经由LDO调节器222来进行次级调节,以及WLAN RF部件216可以从SMPS 206经由LDO调节器224来进行次级调节。
LDO调节器220、222和224中的每一个都具有电压要求,以确保其供应功率的部件的正确操作。例如,因为存储器域212中的存储器可能需要1.05V的最小电压来操作,所以LDO调节器220的电压要求可以是1.05V。类似地,因为LPDDR 214可能需要1.2V的电压来操作,所以LDO调节器222的电压要求可以是1.2V。因为WLAN RF部件216可能需要1.35V的电压来操作,所以LDO调节器224的电压要求可以是1.35V。
SMPS 206可以将其电压设定成在LDO调节器220、222和224中所需要的最高电压,以确保LDO调节器220、222和224提供功率的所有部件都可以正常操作。在一种配置中,LDO调节器220、222和224可能需要至少62.5mV的净空余量以用于可靠的电压调整。因为LPDDR214总是开启的,所以SMPS 206的电压输出可以大于或等于1.27V,1.27V是LDO调节器222的电压要求(1.2V)和62.5mV净空余量的总和。在一个配置中,SMPS 206可以在1.27V至1.42V的范围的电压水平下提供功率。因为存储器域212中的存储器可以在低至1.05V的电压下操作,所以对于存储器域212中的存储器(例如,L2高速缓存存储器120和140)可能存在明显的LDO效率损失。
图3是示出用于集成电路360的功率网设计的示例的图300。IC 360包括CPU子系统302和附加子系统350。在一种配置中,IC 360可以是SoC。子系统350可以是GPU子系统、I/O子系统或除CPU子系统302以外的任何子系统。如图所示,CPU子系统302包括两个四核集群310、330和CCI 304。四核集群310包括四个内核逻辑电路312、314、316、318以及L2高速缓存存储器320。四核集群330包括四个内核逻辑电路332、334、336、338和L2高速缓存存储器340。内核逻辑电路312、314、316、318、332、334、336和338中的每一个分别被耦合至L1高速缓存存储器322、324、326、328、342、344、346和348。
子系统350包括SoC存储器352。在一种配置中,SoC存储器352可以是CPU子系统302外部的片上SRAM。在一种配置中,SoC存储器352可以是调制解调器DSP L2高速缓存、音频DSP L2高速缓存、图形内部(SoC)RAM、显示器内部(SoC)RAM、相机内部(SoC)RAM、视频内部(SoC)RAM、外围设备(例如,USB、Crypto、eMMC)内部(SoC)RAM、共享存储器等中的一个或多个。在一种配置中,SoC存储器352可以是子系统350的一部分。在另一种配置中,SoC存储器352可以在子系统350的外部,但是被耦合至子系统350的部件(例如逻辑电路354)或与子系统350的部件(例如逻辑电路354)相关联。
内核逻辑电路312、314、316、318、332、334、336和338中的每一个对其相应的内核执行操作,并查验其相应的L1和L2高速缓存以用于数据访问。例如,内核逻辑电路312可以针对特定数据首先查验L1高速缓存322。如果L1高速缓存322上的查验未命中,则内核逻辑电路322可以针对该特定数据查验L2高速缓存320。
一个数据可以在不同的高速缓存存储器中具有多个副本。CCI 304管理冲突并维持四核集群310和330的高速缓存存储器之间的一致性。CCI 304可以将存储在四核集群310的高速缓存存储器中的数据与存储在四核集群330中的高速缓存存储器中的数据进行同步。
在一种配置中,CPU子系统302和子系统350可以将部件放置到三个功率域中:芯片逻辑域(例如,上文参照图2描述的芯片逻辑域208)、存储器域(例如,上文参照图2描述的存储器域212)以及内核逻辑域(例如,上文参照图2描述的内核逻辑域210)。这三个功率域在图3中被示出,具有不同的背景图案。例如,内核逻辑电路(312、314、316、318、332、334、336和338)、L1高速缓存存储器(322、324、326、328、342、344、346和348)、L2高速缓存存储器(320和340)以及CCI 304被分组到内核逻辑域中。SoC存储器352被放置到存储器域中。CPU子系统302和子系统350的其它部件(例如,CPU子系统302的CPU包装器306、子系统350的逻辑电路354)被分组到芯片逻辑域中。
与上文在图1中描述的功率网设计相比,L2高速缓存存储器320和340从存储器域被迁移至内核逻辑域。由于L1高速缓存存储器(例如,322、324、326、328、342、344、346和348)已经在内核逻辑域中以及L2高速缓存存储器具有与L1高速缓存存储器类似的电压要求,所以这不会在内核逻辑域上施加额外的电压约束。
将L2高速缓存存储器从存储器域移动至内核逻辑域使得单个电压/功率域能够用于所有CPU逻辑和存储器,并且提供了更好的配电网络。将L2高速缓存存储器从存储器域移动至内核逻辑域还允许内核逻辑域成为独立于IC 360其余部分的“真正的电压岛”。因此,将L2高速缓存存储器从存储器域移动至内核逻辑域可以允许更好的针对内核逻辑域的电压隔离。
在一种配置中,因为L2高速缓存存储器320和340从存储器域被移动至内核逻辑域,所以L2高速缓存存储器320和340从SMPS 204而不是从SMPS 206中获取功率。如上文参照图2所述,SMPS 204在1.05V至1.25V的范围的电压水平下提供功率,以及SMPS 206在1.27V至1.42V的范围的电压水平下提供功率。因此,SMPS 204比SMPS 206提供了具有更低电压的功率。因此,通过从SMPS 204而不是SMPS 206中获取功率,由于相比较于SMPS 206的SMPS 204的更低的电压,L2高速缓存存储器320和340降低了电池的功耗。通过将L2高速缓存存储器320和340从存储器域切换至内核逻辑域,对于高速缓存存储器320和340可以有更少的LDO效率损失。
将L2高速缓存存储器从存储器域移动至内核逻辑域去除了内核逻辑域操作模式和存储器域电压之间的相依性。提供至存储器电路(例如,存储器域中的部件)的功率电压可以大于或等于提供至逻辑电路(例如,内核逻辑域和芯片逻辑域中的部件)的功率电压。当内核逻辑域或芯片逻辑域中的任一个的电压被拉的更高时,存储器域的电压也被拉高。如果L2高速缓存存储器被放置在存储器域中,则这会导致对于L2高速缓存存储器的更大的LDO效率损失。通过将L2高速缓存存储器从存储器域移动至内核逻辑域,将芯片逻辑域的电压拉的更高可以不再导致对于L2高速缓存存储器的更大的LDO效率损失,从而可以节省电池的功率。
由于更低的峰值电流要求,将L2高速缓存存储器从存储器域移动至内核逻辑域可以改善存储器域的LDO(例如LDO调节器220)净空余量。更低的LDO净空余量要求也导致了功率节省。
当CPU子系统302进入低功率模式时,所有的内核可以被关停。SMPS 204可以保持开启以将功率提供至L1和L2高速缓存存储器。SMPS 204的输出电压可以被降低至保留电压,保留电压刚好足以将内容保持在高速缓存存储器中。相比之下,如果L2高速缓存驻留在存储器域中,则由于其它相依性(例如LPDDR 214),SMPS 206的输出电压不能被降低。因此,将L2高速缓存存储器从存储器域移动至内核逻辑域导致了功率节省。
因为L2高速缓存存储器被移动至内核逻辑域,所以在内核逻辑域和L2高速缓存存储器之间的电平转换器可以被去除。去除电平转换器可以导致更小的裸片面积。由于电平转换器增加了延迟并使其更难以实现最大频率,因此去除电平转换器还可以改善时序约束以用于实现最大频率。在一种配置中,将L2高速缓存存储器从存储器域移动至内核逻辑域可以导致L2高速缓存存储器的功耗降低20%。
图4是提供功率网的方法的流程图400。方法可以由IC(例如,IC 150、250或360)执行。在一种配置中,执行该方法的IC可以是SoC。在402处,SoC提供第一功率域至至少一个SoC存储器。至少一个SoC存储器被耦合至SoC的第一子系统。在一种配置中,第一功率域可以是存储器域(例如,存储器域212或510)。在一种配置中,第一子系统可以是图3中的子系统350或图5中的子系统550。至少一个SoC存储器可以是图3中的SoC存储器352或图5中的SoC存储器552。在另一种配置中,第一子系统可以是附加子系统,以及至少一个SoC存储器可以是与上文参照图1描述的附加子系统相关联的存储器。
在一种配置中,第一功率域从共享的功率源(例如SMPS 206或508)获取功率。在这样的配置中,共享的功率源可以进一步被配置为向LPDDR(例如LPDDR 214)或WLAN RF部件(例如WLAN RF部件216)中的至少一个提供功率。
在404处,SoC提供第二功率域至至少一个高速缓存存储器和第二子系统的逻辑电路,该至少一个高速缓存存储器被耦合至第二子系统。在一种配置中,第二功率域可以是内核逻辑域(例如内核逻辑域210或506)。在一种配置中,第二子系统可以是图3中的CPU子系统302或图5中的CPU子系统530。在这样的配置中,被耦合至第二子系统的至少一个高速缓存存储器可以是参照图3或图5描述的L2高速缓存存储器和/或L1高速缓存存储器,以及第二子系统的逻辑电路可以是参照图3或图5描述的内核逻辑电路。在另一种配置中,第二子系统可以是CPU子系统102。在这样的配置中,被耦合至第二子系统的至少一个高速缓存存储器可以是上文参照图1描述的L1高速缓存存储器,以及第二子系统的逻辑电路可以是上文参照图1描述的内核逻辑电路(例如112、114、116、118、132、134、136和138)。
在一种配置中,第二功率域从专用功率源(例如SMPS 204或506)获取功率。在一种配置中,当第二子系统进入低功率模式时,第二功率域可以维持用于在至少一个高速缓存存储器中保持数据所需要的最小电压。
在406处,SoC提供第三功率域至第一子系统的逻辑电路。在一种配置中,第三功率域可以是芯片逻辑域(例如芯片逻辑域208或520)。在一种配置中,第一子系统的逻辑电路可以是上文参照图3描述的子系统350的逻辑电路354,或者下文参照图5描述的子系统550的逻辑电路554。在另一种配置中,第一子系统的逻辑电路可以是上文参照图1描述的附加子系统的逻辑电路。在一种配置中,第三功率域从专用功率源(例如SMPS 202或504)获取功率。
图5是示出被配置为实施图4的方法的集成电路502的图500。在一种配置中,IC502的每个部件执行与上文参照图2描述的IC 250、上文参照图3描述的IC 360以及上文参照图1描述的IC 150的对应部件相似的功能。在一种配置中,IC 502是SoC。
如图所示,IC 502可以包括CPU子系统530和附加子系统550。子系统550可以是GPU子系统、I/O子系统或除CPU子系统530以外的任何子系统。CPU子系统530包括若干内核逻辑电路(例如内核逻辑电路536)、若干L1高速缓存存储器(例如L1高速缓存存储器538)、L2高速缓存存储器540和542、以及CCI 534。子系统550包括SoC存储器552。在一种配置中,SoC存储器552可以是CPU子系统530外部的片上SRAM。在一种配置中,SoC存储器552可以是调制解调器DSP L2高速缓存、音频DSP L2高速缓存、图形内部(SoC)RAM、显示器内部(SoC)RAM、相机内部(SoC)RAM、视频内部(SoC)RAM、外围设备(例如USB、Crypto、eMMC)内部(SoC)RAM、共享存储器等中的一个或多个。在一种配置中,SoC存储器552可以是子系统550的一部分。在另一种配置中,SoC存储器552可以在子系统550的外部,但被耦合至子系统550的部件(例如逻辑电路554)或者与子系统550的部件(例如逻辑电路554)相关联。
IC 502包括将功率提供至三个功率域(芯片逻辑域520、内核逻辑域522和存储器域524)中的部件的SMPS 504、506和508。三个LDO调节器510、512和514从SMPS 508获取功率。在一种配置中,存储器域524中的部件可以从SMPS 508经由LDO调节器510来进行次级调节。IC 502的许多其它部件可以从SMPS 508经由LDO调节器512和514来进行次级调节。
在一个配置中,CPU子系统530和子系统550可以将部件放置到三个功率域中:芯片逻辑域520、存储器域524和内核逻辑域522。例如,内核逻辑电路(例如536)、L1高速缓存存储器(例如538)、L2高速缓存存储器(540和542)以及CCI 534被分组到内核逻辑域522中。SoC存储器552被放置到存储器域524中。CPU子系统530和子系统550的其它部件(例如,CPU子系统530的CPU包装器532、子系统550的逻辑电路554)被分组到芯片逻辑域520中。
IC 502可以包括用于提供第一功率域至至少一个SoC存储器的装置。至少一个SoC存储器被耦合至SoC的第一子系统。在一种配置中,第一功率域可以是存储器域524。在一种配置中,第一子系统可以是子系统550以及至少一个SoC存储器可以是SoC存储器552。在一种配置中,用于提供第一功率域至至少一个SoC存储器的装置可以是SMPS 508、LDO调节器510以及连接SMPS 508、LDO调节器510和至少一个SoC存储器的电路布线。在一种配置中,用于提供第一功率域的装置执行上文关于图4的402所描述的操作。
IC 502可以包括用于提供第二功率域至至少一个高速缓存存储器和第二子系统的逻辑电路的装置,该至少一个高速缓存存储器被耦合至第二子系统。在一种配置中,第二功率域可以是内核逻辑域522。在一种配置中,第二子系统可以是CPU子系统530。在这样的配置中,被耦合至第二子系统的至少一个高速缓存存储器可以是L2高速缓存存储器(例如540和/或542)和/或L1高速缓存存储器(例如538),以及第二子系统的逻辑电路可以是内核逻辑电路(例如536)。在一种配置中,用于提供第二功率域至至少一个高速缓存存储器和第二子系统的逻辑电路的装置可以是SMPS 506和将SMPS 506连接至第二子系统的至少一个高速缓存存储器和逻辑电路的电路布线,该至少一个高速缓存存储器被耦合至第二子系统。在一种配置中,用于提供第二功率域的装置执行上文关于图4的404所描述的操作。
IC 502可以包括用于提供第三功率域至第一子系统的逻辑电路的装置。在一种配置中,第三功率域可以是芯片逻辑域520。在一种配置中,第一子系统的逻辑电路可以是子系统550的逻辑电路554。在一种配置中,用于提供第三功率域至第一子系统的逻辑电路的装置可以是SMPS 504和将SMPS 504连接至第一子系统的逻辑电路的电路布线。在这样的配置中,用于提供第三功率域的装置执行上文关于图4的406所描述的操作。
应该理解,所公开的过程/流程图中框的具体顺序或层次是示例性方法的说明。基于设计偏好,可以理解的是,可以重新布置过程/流程图中框的具体顺序或层次。此外,一些框可以被组合或省略。所附方法权利要求以示例顺序呈现了各个框的要素,并非意味着限于所呈现的特定顺序或层次。
提供之前的描述是为了使本领域的任何技术人员能够实践本文描述的各个方面。这些方面的各种修改对于本领域技术人员而言将是显而易见的,并且这里定义的一般原理可以应用于其它方面。因此,权利要求并非旨在限于本文所示的方面,而是要符合与语言权利要求相一致的全部范围,其中以单数形式指代的要素并非意在表示“一个且仅一个”,除非具体如此陈述,而是“一个或多个”。词语“示例性”在本文中被用来表示“用作示例、实例或说明”。本文描述为“示例性”的任何方面不一定被解释为优选的或有利于其它方面。除非特别说明,否则术语“一些”是指一个或多个。诸如“A、B或C中的至少一个”、“A、B和C中的至少一个”以及“A、B、C或其任意组合”的组合包括A、B和/或C,并且可以包括多个A、多个B或多个C。具体地,诸如“A、B或C中的至少一个”、“A、B和C中的至少一个”、和“A、B、C或其任意组合”可以仅是A、仅是B、仅是C、A和B、A和C、B和C或A和B和C,其中任意这样的组合可以包含成员A、B或C的一个或多个成员。本领域普通技术人员已知或稍后将为本公开内容通篇描述的各个方面的要素的所有结构和功能等同物明确地通过引用并入本文,并且旨在被权利要求所涵盖。而且,本文公开的任何内容并非意在无偿提供至公众,不管这样的公开是否在权利要求中明确记载。除非使用短语“用于......的装置”明确限定要素,否则任何权利要求要素都不应被解释为装置加功能。
Claims (23)
1.一种电路设备,包括:
多个存储器单元,其包括至少一个片上系统(SoC)存储器和至少一个高速缓存存储器;
第一子系统,其被耦合至所述至少一个SoC存储器,其中所述至少一个SoC存储器是与第一功率域相关联的低功率双倍数据速率同步DRAM(LPDDR);以及
第二子系统,其被耦合至所述至少一个高速缓存存储器,所述至少一个高速缓存存储器包括至少一个一级(L1)高速缓存存储器和至少一个二级(L2)高速缓存存储器,其中所述至少一个L1高速缓存存储器和所述至少一个L2高速缓存存储器与第二功率域相关联,其中所述第二子系统包括第二逻辑电路,所述第二逻辑电路与所述第二功率域相关联,并且其中当所述第二子系统进入低功率模式时,所述第二功率域维持用于在所述至少一个高速缓存存储器中保持数据所需要的最小电压。
2.根据权利要求1所述的设备,其中所述第二子系统是中央处理单元(CPU)子系统。
3.根据权利要求2所述的设备,其中所述CPU子系统包括一个或多个处理器集群,其中所述L2高速缓存存储器被耦合至所述一个或多个处理器集群中的一个处理器集群。
4.根据权利要求2所述的设备,其中所述CPU子系统包括多个处理器,其中所述L1高速缓存存储器被耦合至所述多个处理器中的一个处理器。
5.根据权利要求1所述的设备,其中所述第一子系统包含第一逻辑电路,所述第一逻辑电路与第三功率域相关联。
6.根据权利要求1所述的设备,其中所述第一子系统和所述第二子系统驻留在SoC上。
7.根据权利要求1所述的设备,还包括第一功率源和第二功率源,其中所述第一功率源被配置为向所述第一功率域供应功率,并且所述第二功率源被配置为向所述第二功率域供应功率。
8.根据权利要求7所述的设备,还包括无线局域网(WLAN)射频(RF)部件,其中所述第一功率源进一步被配置为向所述LPDDR或所述WLAN RF部件供应功率。
9.一种提供功率网的方法,包括:
向至少一个片上系统(SoC)存储器提供第一功率域,所述至少一个SoC存储器是低功率双倍数据速率同步DRAM(LPDDR)并且被耦合至第一子系统;以及
向至少一个高速缓存存储器提供第二功率域,所述至少一个高速缓存存储器包括至少一个一级(L1)高速缓存存储器和至少一个二级(L2)高速缓存存储器,所述至少一个L1高速缓存存储器和所述至少一个L2高速缓存存储器被耦合至第二子系统,其中所述第二子系统包括第二逻辑电路,所述方法还包括向所述第二逻辑电路提供所述第二功率域,并且其中当所述第二子系统进入低功率模式时,所述第二功率域维持用于在所述至少一个高速缓存存储器中保持数据所需要的最小电压。
10.根据权利要求9所述的方法,其中所述第二子系统是中央处理单元(CPU)子系统。
11.根据权利要求10所述的方法,其中所述CPU子系统包括一个或多个处理器集群,其中所述L2高速缓存存储器被耦合至所述一个或多个处理器集群中的一个处理器集群。
12.根据权利要求10所述的方法,其中所述CPU子系统包括多个处理器,其中所述L1高速缓存存储器被耦合至所述多个处理器中的一个处理器。
13.根据权利要求9所述的方法,其中所述第一子系统包括第一逻辑电路,所述方法还包括向所述第一逻辑电路提供第三功率域。
14.根据权利要求9所述的方法,其中所述第一子系统和所述第二子系统驻留在SoC上。
15.根据权利要求9所述的方法,其中第一功率源被配置为向所述第一功率域供应功率,并且第二功率源被配置为向所述第二功率域供应功率。
16.根据权利要求15所述的方法,其中所述第一功率源进一步被配置为向所述低功率双倍数据速率同步DRAM(LPDDR)或无线局域网(WLAN)射频(RF)部件供应功率。
17.一种用于提供功率网的设备,包括:
用于向至少一个片上系统(SoC)存储器提供第一功率域的装置,所述至少一个SoC存储器是低功率双倍数据速率同步DRAM(LPDDR)并且被耦合至第一子系统;以及
用于向至少一个高速缓存存储器提供第二功率域的装置,所述至少一个高速缓存存储器包括至少一个一级(L1)高速缓存存储器和至少一个二级(L2)高速缓存存储器,所述至少一个L1高速缓存存储器和所述至少一个L2高速缓存存储器被耦合至第二子系统,其中所述第二子系统包含第二逻辑电路,其中用于向所述至少一个高速缓存存储器提供所述第二功率域的所述装置进一步被配置为向所述第二逻辑电路提供所述第二功率域,并且其中当所述第二子系统进入低功率模式时,所述第二功率域维持用于在所述至少一个高速缓存存储器中保持数据所需要的最小电压。
18.根据权利要求17所述的设备,其中所述第二子系统是中央处理单元(CPU)子系统。
19.根据权利要求18所述的设备,其中所述CPU子系统包括一个或多个处理器集群,其中所述L2高速缓存存储器被耦合至所述一个或多个处理器集群中的一个处理器集群。
20.根据权利要求18所述的设备,其中所述CPU子系统包括多个处理器,其中所述L1高速缓存存储器被耦合至所述多个处理器中的一个处理器。
21.根据权利要求17所述的设备,其中所述第一子系统包括第一逻辑电路,所述设备还包括用于向所述第一逻辑电路提供第三功率域的装置。
22.根据权利要求17所述的设备,其中所述第一子系统和所述第二子系统驻留在SoC上。
23.根据权利要求17所述的设备,其中用于提供所述第一功率域的所述装置包括被配置为向所述第一功率域供应功率的第一功率源,并且其中用于提供所述第二功率域的所述装置包括被配置为向所述第二功率域供应功率的第二功率源。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN5180/CHE/2015 | 2015-09-28 | ||
IN5180CH2015 | 2015-09-28 | ||
US15/173,004 US9658671B2 (en) | 2015-09-28 | 2016-06-03 | Power-aware CPU power grid design |
US15/173,004 | 2016-06-03 | ||
PCT/US2016/051470 WO2017058509A1 (en) | 2015-09-28 | 2016-09-13 | Power-aware cpu power grid design |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108139791A CN108139791A (zh) | 2018-06-08 |
CN108139791B true CN108139791B (zh) | 2020-07-03 |
Family
ID=58409235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680056610.0A Active CN108139791B (zh) | 2015-09-28 | 2016-09-13 | 功率监控的cpu功率网设计 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9658671B2 (zh) |
EP (1) | EP3356910B1 (zh) |
JP (2) | JP6567769B2 (zh) |
KR (1) | KR101910999B1 (zh) |
CN (1) | CN108139791B (zh) |
WO (1) | WO2017058509A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160306742A1 (en) * | 2013-12-23 | 2016-10-20 | Intel Corporation | Instruction and logic for memory access in a clustered wide-execution machine |
US10466766B2 (en) * | 2017-11-09 | 2019-11-05 | Qualcomm Incorporated | Grouping central processing unit memories based on dynamic clock and voltage scaling timing to improve dynamic/leakage power using array power multiplexers |
US11803472B2 (en) | 2021-07-30 | 2023-10-31 | Qualcomm Incorporated | Integrated circuits (IC) employing subsystem shared cache memory for facilitating extension of low-power island (LPI) memory and related methods |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6792551B2 (en) * | 2001-11-26 | 2004-09-14 | Intel Corporation | Method and apparatus for enabling a self suspend mode for a processor |
US6976181B2 (en) * | 2001-12-20 | 2005-12-13 | Intel Corporation | Method and apparatus for enabling a low power mode for a processor |
US7028196B2 (en) * | 2002-12-13 | 2006-04-11 | Hewlett-Packard Development Company, L.P. | System, method and apparatus for conserving power consumed by a system having a processor integrated circuit |
GB2457171A (en) * | 2008-02-11 | 2009-08-12 | Nvidia Corp | Control of power in an integrated circuit which has power domains having power islands |
CN102498451A (zh) * | 2009-06-22 | 2012-06-13 | 亚马逊技术股份有限公司 | 处理器的静态保留模式 |
US8335122B2 (en) * | 2007-11-21 | 2012-12-18 | The Regents Of The University Of Michigan | Cache memory system for a data processing apparatus |
US8977817B2 (en) * | 2012-09-28 | 2015-03-10 | Apple Inc. | System cache with fine grain power management |
CN104462011A (zh) * | 2013-09-24 | 2015-03-25 | 株式会社东芝 | 信息处理设备与半导体设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1855181A2 (en) * | 2006-05-10 | 2007-11-14 | Marvell World Trade Ltd. | System with high power and low power processors and thread transfer |
JP5237739B2 (ja) * | 2008-09-29 | 2013-07-17 | 株式会社日立製作所 | 情報処理装置 |
US20110103391A1 (en) | 2009-10-30 | 2011-05-05 | Smooth-Stone, Inc. C/O Barry Evans | System and method for high-performance, low-power data center interconnect fabric |
US9405357B2 (en) * | 2013-04-01 | 2016-08-02 | Advanced Micro Devices, Inc. | Distribution of power gating controls for hierarchical power domains |
JP6135276B2 (ja) * | 2013-04-23 | 2017-05-31 | 富士通株式会社 | ストレージ装置、制御装置、および制御プログラム |
US10523585B2 (en) * | 2014-12-19 | 2019-12-31 | Amazon Technologies, Inc. | System on a chip comprising multiple compute sub-systems |
-
2016
- 2016-06-03 US US15/173,004 patent/US9658671B2/en active Active
- 2016-09-13 EP EP16770168.9A patent/EP3356910B1/en active Active
- 2016-09-13 JP JP2018515778A patent/JP6567769B2/ja active Active
- 2016-09-13 CN CN201680056610.0A patent/CN108139791B/zh active Active
- 2016-09-13 WO PCT/US2016/051470 patent/WO2017058509A1/en active Application Filing
- 2016-09-13 KR KR1020187012231A patent/KR101910999B1/ko active IP Right Grant
-
2019
- 2019-06-05 JP JP2019105472A patent/JP2019192264A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6792551B2 (en) * | 2001-11-26 | 2004-09-14 | Intel Corporation | Method and apparatus for enabling a self suspend mode for a processor |
US6976181B2 (en) * | 2001-12-20 | 2005-12-13 | Intel Corporation | Method and apparatus for enabling a low power mode for a processor |
US7028196B2 (en) * | 2002-12-13 | 2006-04-11 | Hewlett-Packard Development Company, L.P. | System, method and apparatus for conserving power consumed by a system having a processor integrated circuit |
US8335122B2 (en) * | 2007-11-21 | 2012-12-18 | The Regents Of The University Of Michigan | Cache memory system for a data processing apparatus |
GB2457171A (en) * | 2008-02-11 | 2009-08-12 | Nvidia Corp | Control of power in an integrated circuit which has power domains having power islands |
CN102498451A (zh) * | 2009-06-22 | 2012-06-13 | 亚马逊技术股份有限公司 | 处理器的静态保留模式 |
US8977817B2 (en) * | 2012-09-28 | 2015-03-10 | Apple Inc. | System cache with fine grain power management |
CN104462011A (zh) * | 2013-09-24 | 2015-03-25 | 株式会社东芝 | 信息处理设备与半导体设备 |
Also Published As
Publication number | Publication date |
---|---|
EP3356910A1 (en) | 2018-08-08 |
US9658671B2 (en) | 2017-05-23 |
JP6567769B2 (ja) | 2019-08-28 |
KR101910999B1 (ko) | 2018-10-23 |
WO2017058509A1 (en) | 2017-04-06 |
CN108139791A (zh) | 2018-06-08 |
EP3356910B1 (en) | 2021-06-02 |
US20170090539A1 (en) | 2017-03-30 |
KR20180051648A (ko) | 2018-05-16 |
JP2019192264A (ja) | 2019-10-31 |
JP2018536214A (ja) | 2018-12-06 |
BR112018006274A2 (pt) | 2018-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9223383B2 (en) | Guardband reduction for multi-core data processor | |
Abdel-Majeed et al. | Warped register file: A power efficient register file for GPGPUs | |
CN100555227C (zh) | 用于控制多内核处理器的方法 | |
US8214662B2 (en) | Multiprocessor control unit, control method performed by the same, and integrated circuit | |
TWI470418B (zh) | 具有相同指令集架構(isa)之不對稱效能多核心架構 | |
CN104049715A (zh) | 平台不可知的功率管理 | |
KR102372786B1 (ko) | 아키텍처화된 상태 유지 | |
CN108139791B (zh) | 功率监控的cpu功率网设计 | |
US11360543B2 (en) | USB Type-C subsystem power management | |
US20160314024A1 (en) | Clearance mode in a multicore processor system | |
CN111052094B (zh) | 使用c状态和睿频加速提高用户空间的自旋锁效率 | |
US9772678B2 (en) | Utilization of processor capacity at low operating frequencies | |
Pyo et al. | 23.1 20nm high-K metal-gate heterogeneous 64b quad-core CPUs and hexa-core GPU for high-performance and energy-efficient mobile application processor | |
KR20190113809A (ko) | 클럭 디바이더 디바이스 및 그 방법 | |
US9760145B2 (en) | Saving the architectural state of a computing device using sectors | |
US20200133862A1 (en) | Asymmetric memory tag access and design | |
KR101863578B1 (ko) | 컴퓨팅 시스템의 적응적인 캐시 메모리 접근 장치 및 그 방법 | |
US11500444B2 (en) | Intelligent prediction of processor idle time apparatus and method | |
US11791819B2 (en) | Low power flip-flop with reduced parasitic capacitance | |
CN113841200A (zh) | 基于抑制的存储器刷新改进电池寿命 | |
BR112018006274B1 (pt) | Projeto de rede elétrica de cpu ciente de energia | |
WO2021056033A2 (en) | Apparatus and method of intelligent power and performance management | |
CN117581189A (zh) | 降低远存储器中的存储器功率使用 | |
Kim et al. | Power-aware Event-driven Cache Partitioning for high performance chip multiprocessor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |