CN111444025B - 一种提升计算子系统能效的资源分配方法、系统及介质 - Google Patents
一种提升计算子系统能效的资源分配方法、系统及介质 Download PDFInfo
- Publication number
- CN111444025B CN111444025B CN202010290699.5A CN202010290699A CN111444025B CN 111444025 B CN111444025 B CN 111444025B CN 202010290699 A CN202010290699 A CN 202010290699A CN 111444025 B CN111444025 B CN 111444025B
- Authority
- CN
- China
- Prior art keywords
- power consumption
- processor
- frequency
- node
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Power Sources (AREA)
Abstract
本发明公开了一种提升计算子系统能效的资源分配方法、系统及介质,本发明方法包括在给定的功耗限制值Ptarget下确定最优增加节点数目ΔN*、处理器频率f*;设置需要满足的功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上(ΔN*>=0),且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数(为每一个处理器核分配一个进程)。本发明能够针对系统上运行的访存受限型并行程序实现在满足功耗约束条件下程序执行时间的降低、能耗的减小,从而提高系统的能量有效性。
Description
技术领域
本发明涉及高性能计算集群的资源分配技术,具体涉及一种提升计算子系统能效的资源分配方法、系统及介质。
背景技术
高性能计算系统的计算能力越来越受到功耗的影响。尽管高性能计算中心的能耗增长迅速,高性能计算用户仍然需要更高的性能来运行更大数据规模下的更加复杂的模型。因此,迫切需要找到满足功耗约束条件下提高高性能计算程序性能的方法。目前在这一研究领域,有多种方法提高高性能计算系统的能量有效性,例如设计新的计算机体系结构、基于软件对高性能计算程序进行合理的资源调度。基于软件的资源调度方法,通过仔细确定计算资源设置,如计算节点数和处理器频率等,在满足功耗约束的条件下提高程序的性能。基于软件的资源调度方法的一个优势是,由于不需要进行硬件修改,因此它可以很容易地部署在现有硬件上。目前,大多数高性能计算中心的资源分配策略目标是最大限度地提高系统利用率,即分配尽可能少的计算节点。这种策略并没有考虑访存受限型并行程序的最佳性能和分配计算节点数之间的关系,因为处理器利用率最大化可能会导致访存受限型并行程序严重的内存争用,从而影响并行性能。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种提升计算子系统能效的资源分配方法、系统及介质,本发明能够针对系统上运行的访存受限型并行程序实现在满足功耗约束条件下程序执行时间降低、总功耗保持不变,能耗减小,从而提高系统的能量有效性。
为了解决上述技术问题,本发明采用的技术方案为:
一种提升计算子系统能效的资源分配方法,实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
2)利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程。
可选地,步骤1)之前还包括计算最优增加节点数目ΔN*的步骤,详细步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*。
可选地,所述利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN;
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否达到阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
可选地,所述利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核运行在fmid下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗,增加ΔN个计算节点会相应地增加总功耗,其中包括ΔN个计算节点的内存功耗和增加节点所产生的空闲处理器核的功耗,为了保证多节点总功耗不增加,所有处理器核的频率必须从最大频率fmax降至频率中间值fmid,取频率中间值fmid为最大频率fmax和最小频率fmin两者之间的平均值。
可选地,步骤1)之前还包括计算处理器频率f*的步骤,详细步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗。
可选地,步骤1)之前还包括计算功耗限制值Ptarget的步骤,且计算函数表达式如下:
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
此外,本发明还提供一种提升计算子系统能效的资源分配系统,包括:
参数初始程序单元,用于确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
资源分配程序单元,用于设置处理器动态频率调节工具的功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数(缺省资源分配下每一个处理器核运行一个进程),ΔN*为最优增加节点数目。
此外,本发明还提供一种提升计算子系统能效的资源分配系统,包括计算机设备,该计算机设备被编程或配置以执行前述提升计算子系统能效的资源分配方法的步骤,或该计算机设备的存储器上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
和现有技术相比,本发明具有下述优点:本发明能够针对系统上运行的访存受限型并行程序实现在满足功耗约束条件下程序执行时间降低、总功耗保持不变、能耗减小,从而提高系统的能量有效性。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例方法的详细流程示意图。
具体实施方式
如图1所示,本实施例提升计算子系统能效的资源分配方法的实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
2)设置处理器动态频率调节工具的功耗限制值Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数(缺省资源分配下每一个处理器核运行一个进程)。本实施例中,处理器动态频率调节工具采用Intel RAPL,利用Intel RAPL进行动态处理器频率调节,保证实时总功耗不超过功耗限制值Ptarget。
如图2所示,本实施例需要预先测量并建立不同处理器频率级别及处理器核功耗值之间的关系,前文记载的Pcpu()即用于获取不同处理器频率级别及处理器核功耗值之间的关系。本实施例中,以0.1GHZ划分频率级别,处理器可调频区间[fmin,fmax]可被划分为M级。利用测量得到的不同频率级别下的处理器功耗,构造处理器频率级别与处理器核功耗值之间的关系对应表,该表包括M组值。每组值包括两部分:处理器频率fi,对应的单个处理器核功耗Pcpu(fi)。本实施例中,在缺省的资源分配策略下运行程序,使用VTuneTMAmplifier采集性能分析数据,使用Intel RAPL测量功耗相关数据。性能相关分析数据包括不同时刻t程序的实际访存带宽,以及反映内存访问受限程度的bound值(实际访存带宽BN相对单个节点的物理内存带宽B的比值)。功耗相关的分析数据包括:单个处理器核处于空闲状态下的处理器功耗内存功耗Pmen,单个计算节点上除处理器和内存以外的其他功耗Pother。
如图2所示,本实施例步骤1)之前还包括计算最优增加节点数目ΔN*的步骤,详细步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*。
本实施例中,利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN;
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否超过阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
计算单节点平均实际访存带宽b(t)的函数表达式为:
上式中,N为并行程序运行需要的最少计算节点数(缺省资源分配下每一个处理器核运行一个进程),其中bi(t)为第i个计算节点上的实际访存带宽值。
受物理内存带宽的限制,在程序执行期间,实际访存带宽BN不会超过单个节点的物理内存带宽B,当两者比值bound超过阈值α时,我们认为程序是访存受限的。对于非访存受限的程序来说,当使用不同的计算节点数目时,所有节点的实际访存带宽总量可以认为是恒定的。而当程序受限于访存时,增加计算节点可以减少并行程序在单个计算节点上的计算量,降低单节点上访存次数,从而缓解单节点的访存受限情况,多节点的实际访存带宽总量随着节点数增多相应增加。(bound/α)·BN表示内存受限程序需要使用的访存带宽(单个节点平均值),访存受限程度越高,该值越大于BN,其中bound值反映访存受限程度。
按照总内存带宽不变,则有下述函数表达式:
因此,根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref]。
本实施例中,利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指,求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
上式中,n为进程数目,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核的中间频率fmid下对应的最大功耗,c为单个计算节点的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmen为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗,增加ΔN个计算节点会相应地增加总功耗,其中包括ΔN个计算节点的内存功耗和增加节点所产生的空闲处理器核的功耗,为了保证多节点总功耗不增加,所有处理器核的频率必须从最大频率fmax降至频率中间值fmid,取频率中间值fmid为最大频率fmax和最小频率fmin两者之间的平均值。
本实施例中,步骤1)之前还包括计算处理器频率f*的步骤,详细步骤包括将最优增加节点数目ΔN*代入式(1),令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*。
本实施例中,步骤1)之前还包括计算功耗限制值Ptarget的步骤,且计算函数表达式如下:
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
综上所述,本实施例提升计算子系统能效的资源分配方法针对集群系统上运行的访存受限型的程序,目的是实现在满足功耗约束条件下程序执行时间降低、总功耗保持不变,能耗减小,从而提高系统的能量有效性。技术方案是首先测量系统在不同频率级别下对应的处理器功耗;运行程序得到与性能和功耗相关的分析数据,建立资源分配(使用的计算节点数)、单节点内存带宽受限程度与并行程序的执行时间三者之间的关系,在不增加总功耗(指所有计算节点的总峰值功耗不超过缺省资源分配策略时的总功耗)的条件下,获得最优节点增加数目和处理器初始频率值;在程序运行之前,本资源调度方法确定新的分配节点数、每个节点处理器的初始频率和受限的目标总峰值功耗(由Intel RAPL的目标功耗值设定),在程序运行过程中,利用Intel RAPL工具进行总峰值功耗的实时控制。采用本实施例提升计算子系统能效的资源分配方法同时实现了功耗约束和显著的性能提升,提高了并行程序运行时系统的能量有效性。
此外,本实施例还提供一种提升计算子系统能效的资源分配系统,包括:
参数初始程序单元,用于确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
资源分配程序单元,用于设置处理器动态频率调节工具的功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程,ΔN*为最优增加节点数目。
此外,本实施例还提供一种提升计算子系统能效的资源分配系统,包括计算机设备,该计算机设备被编程或配置以执行前述提升计算子系统能效的资源分配方法的步骤,或该计算机设备的存储器上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
以上所述仅是本实施例的优选实施方式,本实施例的保护范围并不仅局限于上述实施例,凡属于本实施例思路下的技术方案均属于本实施例的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本实施例原理前提下的若干改进和润饰,这些改进和润饰也应视为本实施例的保护范围。
Claims (6)
1.一种提升计算子系统能效的资源分配方法,其特征在于实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
2)利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程;
步骤1)中确定最优增加节点数目ΔN*的步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*;
步骤1)中确定处理器频率f*的步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗;
步骤1)中确定功耗限制值Ptarget的计算函数表达式如下:
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
2.根据权利要求1所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN,其中bi(t)为第i个计算节点上的实际访存带宽值;
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否达到阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
3.根据权利要求1所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指,求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核运行在fmid下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗,增加ΔN个计算节点会相应地增加总功耗,其中包括ΔN个计算节点的内存功耗和增加节点所产生的空闲处理器核的功耗,为了保证多节点总功耗不增加,所有处理器核的频率必须从最大频率fmax降至频率中间值fmid,取频率中间值fmid为最大频率fmax和最小频率fmin两者之间的平均值。
4.一种提升计算子系统能效的资源分配系统,其特征在于包括:
参数初始程序单元,用于确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
资源分配程序单元,用于利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程;
所述参数初始程序单元确定最优增加节点数目ΔN*的步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*;
所述参数初始程序单元确定处理器频率f*的步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗;
所述参数初始程序单元确定功耗限制值Ptarget的函数表达式如下:
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
5.一种提升计算子系统能效的资源分配系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行权利要求1~3中任意一项所述提升计算子系统能效的资源分配方法的步骤,或该计算机设备的存储器上存储有被编程或配置以执行权利要求1~3中任意一项所述提升计算子系统能效的资源分配方法的计算机程序。
6.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有被编程或配置以执行权利要求1~3中任意一项所述提升计算子系统能效的资源分配方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010290699.5A CN111444025B (zh) | 2020-04-14 | 2020-04-14 | 一种提升计算子系统能效的资源分配方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010290699.5A CN111444025B (zh) | 2020-04-14 | 2020-04-14 | 一种提升计算子系统能效的资源分配方法、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111444025A CN111444025A (zh) | 2020-07-24 |
CN111444025B true CN111444025B (zh) | 2022-11-25 |
Family
ID=71651687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010290699.5A Active CN111444025B (zh) | 2020-04-14 | 2020-04-14 | 一种提升计算子系统能效的资源分配方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111444025B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104375899B (zh) * | 2014-11-21 | 2016-03-30 | 北京应用物理与计算数学研究所 | 高性能计算机numa感知的线程和内存资源优化方法与系统 |
US10095434B2 (en) * | 2015-01-02 | 2018-10-09 | Reservoir Labs, Inc. | Systems and methods for efficient determination of task dependences after loop tiling |
US10048740B2 (en) * | 2015-07-31 | 2018-08-14 | International Business Machines Corporation | Controlling power consumption |
CN109298918A (zh) * | 2018-07-10 | 2019-02-01 | 东南大学 | 一种基于线性规划的并行任务节能调度方法 |
-
2020
- 2020-04-14 CN CN202010290699.5A patent/CN111444025B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111444025A (zh) | 2020-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9983792B2 (en) | Dynamic cache sharing based on power state | |
US7818594B2 (en) | Power efficient resource allocation in data centers | |
Beckmann et al. | Talus: A simple way to remove cliffs in cache performance | |
Sarood et al. | Maximizing throughput of overprovisioned hpc data centers under a strict power budget | |
JP5564564B2 (ja) | 計算ユニットの性能を性能感度に従い不均等に変化させる方法及び装置 | |
US8190795B2 (en) | Memory buffer allocation device and computer readable medium having stored thereon memory buffer allocation program | |
US20160239213A1 (en) | Memory resource optimization method and apparatus | |
KR101356033B1 (ko) | 하이브리드 주메모리 시스템 및 이를 위한 태스크 스케줄링 방법 | |
Hanson et al. | What computer architects need to know about memory throttling | |
US20120290789A1 (en) | Preferentially accelerating applications in a multi-tenant storage system via utility driven data caching | |
US20130080809A1 (en) | Server system and power managing method thereof | |
CN103885838A (zh) | 一种获取虚拟机内存工作集的方法及内存优化分配方法 | |
Zhang et al. | Toward qos-awareness and improved utilization of spatial multitasking gpus | |
Lin et al. | PPT: joint performance/power/thermal management of DRAM memory for multi-core systems | |
WO2022052479A1 (zh) | 一种功耗调控方法、装置、设备及可读存储介质 | |
CN111444025B (zh) | 一种提升计算子系统能效的资源分配方法、系统及介质 | |
Korkmaz et al. | Towards Dynamic Green-Sizing for Database Servers. | |
CN110308991B (zh) | 一种基于随机任务的数据中心节能优化方法及系统 | |
CN106569728B (zh) | 多磁盘阵列raid共享写缓存的处理方法及装置 | |
Albericio et al. | ABS: A low-cost adaptive controller for prefetching in a banked shared last-level cache | |
CN114356588B (zh) | 一种数据预加载方法和装置 | |
CN108920254B (zh) | 一种基于细粒度的内存分配方法 | |
Awasthi et al. | Managing data placement in memory systems with multiple memory controllers | |
US9389919B2 (en) | Managing workload distribution among computer systems based on intersection of throughput and latency models | |
Karyakin | Memory Power Consumption in Main-Memory Database Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |