CN111444025B - 一种提升计算子系统能效的资源分配方法、系统及介质 - Google Patents

一种提升计算子系统能效的资源分配方法、系统及介质 Download PDF

Info

Publication number
CN111444025B
CN111444025B CN202010290699.5A CN202010290699A CN111444025B CN 111444025 B CN111444025 B CN 111444025B CN 202010290699 A CN202010290699 A CN 202010290699A CN 111444025 B CN111444025 B CN 111444025B
Authority
CN
China
Prior art keywords
power consumption
processor
frequency
node
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010290699.5A
Other languages
English (en)
Other versions
CN111444025A (zh
Inventor
陈娟
齐新新
董勇
袁远
吴菲豪
孙晓乐
欧祉辛
张云放
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010290699.5A priority Critical patent/CN111444025B/zh
Publication of CN111444025A publication Critical patent/CN111444025A/zh
Application granted granted Critical
Publication of CN111444025B publication Critical patent/CN111444025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明公开了一种提升计算子系统能效的资源分配方法、系统及介质,本发明方法包括在给定的功耗限制值Ptarget下确定最优增加节点数目ΔN*、处理器频率f*;设置需要满足的功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上(ΔN*>=0),且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数(为每一个处理器核分配一个进程)。本发明能够针对系统上运行的访存受限型并行程序实现在满足功耗约束条件下程序执行时间的降低、能耗的减小,从而提高系统的能量有效性。

Description

一种提升计算子系统能效的资源分配方法、系统及介质
技术领域
本发明涉及高性能计算集群的资源分配技术,具体涉及一种提升计算子系统能效的资源分配方法、系统及介质。
背景技术
高性能计算系统的计算能力越来越受到功耗的影响。尽管高性能计算中心的能耗增长迅速,高性能计算用户仍然需要更高的性能来运行更大数据规模下的更加复杂的模型。因此,迫切需要找到满足功耗约束条件下提高高性能计算程序性能的方法。目前在这一研究领域,有多种方法提高高性能计算系统的能量有效性,例如设计新的计算机体系结构、基于软件对高性能计算程序进行合理的资源调度。基于软件的资源调度方法,通过仔细确定计算资源设置,如计算节点数和处理器频率等,在满足功耗约束的条件下提高程序的性能。基于软件的资源调度方法的一个优势是,由于不需要进行硬件修改,因此它可以很容易地部署在现有硬件上。目前,大多数高性能计算中心的资源分配策略目标是最大限度地提高系统利用率,即分配尽可能少的计算节点。这种策略并没有考虑访存受限型并行程序的最佳性能和分配计算节点数之间的关系,因为处理器利用率最大化可能会导致访存受限型并行程序严重的内存争用,从而影响并行性能。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种提升计算子系统能效的资源分配方法、系统及介质,本发明能够针对系统上运行的访存受限型并行程序实现在满足功耗约束条件下程序执行时间降低、总功耗保持不变,能耗减小,从而提高系统的能量有效性。
为了解决上述技术问题,本发明采用的技术方案为:
一种提升计算子系统能效的资源分配方法,实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget
2)利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程。
可选地,步骤1)之前还包括计算最优增加节点数目ΔN*的步骤,详细步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*。
可选地,所述利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否达到阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
可选地,所述利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
Figure BDA0002450283890000022
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核运行在fmid下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,
Figure BDA0002450283890000023
为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗,增加ΔN个计算节点会相应地增加总功耗,其中包括ΔN个计算节点的内存功耗和增加节点所产生的空闲处理器核的功耗,为了保证多节点总功耗不增加,所有处理器核的频率必须从最大频率fmax降至频率中间值fmid,取频率中间值fmid为最大频率fmax和最小频率fmin两者之间的平均值。
可选地,步骤1)之前还包括计算处理器频率f*的步骤,详细步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
Figure BDA0002450283890000032
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,
Figure BDA0002450283890000033
为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗。
可选地,步骤1)之前还包括计算功耗限制值Ptarget的步骤,且计算函数表达式如下:
Figure BDA0002450283890000034
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
此外,本发明还提供一种提升计算子系统能效的资源分配系统,包括:
参数初始程序单元,用于确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget
资源分配程序单元,用于设置处理器动态频率调节工具的功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数(缺省资源分配下每一个处理器核运行一个进程),ΔN*为最优增加节点数目。
此外,本发明还提供一种提升计算子系统能效的资源分配系统,包括计算机设备,该计算机设备被编程或配置以执行前述提升计算子系统能效的资源分配方法的步骤,或该计算机设备的存储器上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
和现有技术相比,本发明具有下述优点:本发明能够针对系统上运行的访存受限型并行程序实现在满足功耗约束条件下程序执行时间降低、总功耗保持不变、能耗减小,从而提高系统的能量有效性。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例方法的详细流程示意图。
具体实施方式
如图1所示,本实施例提升计算子系统能效的资源分配方法的实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget
2)设置处理器动态频率调节工具的功耗限制值Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数(缺省资源分配下每一个处理器核运行一个进程)。本实施例中,处理器动态频率调节工具采用Intel RAPL,利用Intel RAPL进行动态处理器频率调节,保证实时总功耗不超过功耗限制值Ptarget
如图2所示,本实施例需要预先测量并建立不同处理器频率级别及处理器核功耗值之间的关系,前文记载的Pcpu()即用于获取不同处理器频率级别及处理器核功耗值之间的关系。本实施例中,以0.1GHZ划分频率级别,处理器可调频区间[fmin,fmax]可被划分为M级。利用测量得到的不同频率级别下的处理器功耗,构造处理器频率级别与处理器核功耗值之间的关系对应表,该表包括M组值。每组值包括两部分:处理器频率fi,对应的单个处理器核功耗Pcpu(fi)。本实施例中,在缺省的资源分配策略下运行程序,使用
Figure BDA0002450283890000041
VTuneTMAmplifier采集性能分析数据,使用Intel RAPL测量功耗相关数据。性能相关分析数据包括不同时刻t程序的实际访存带宽,以及反映内存访问受限程度的bound值(实际访存带宽BN相对单个节点的物理内存带宽B的比值)。功耗相关的分析数据包括:单个处理器核处于空闲状态下的处理器功耗
Figure BDA0002450283890000042
内存功耗Pmen,单个计算节点上除处理器和内存以外的其他功耗Pother
如图2所示,本实施例步骤1)之前还包括计算最优增加节点数目ΔN*的步骤,详细步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*。
本实施例中,利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否超过阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
计算单节点平均实际访存带宽b(t)的函数表达式为:
Figure BDA0002450283890000051
上式中,N为并行程序运行需要的最少计算节点数(缺省资源分配下每一个处理器核运行一个进程),其中bi(t)为第i个计算节点上的实际访存带宽值。
受物理内存带宽的限制,在程序执行期间,实际访存带宽BN不会超过单个节点的物理内存带宽B,当两者比值bound超过阈值α时,我们认为程序是访存受限的。对于非访存受限的程序来说,当使用不同的计算节点数目时,所有节点的实际访存带宽总量可以认为是恒定的。而当程序受限于访存时,增加计算节点可以减少并行程序在单个计算节点上的计算量,降低单节点上访存次数,从而缓解单节点的访存受限情况,多节点的实际访存带宽总量随着节点数增多相应增加。(bound/α)·BN表示内存受限程序需要使用的访存带宽(单个节点平均值),访存受限程度越高,该值越大于BN,其中bound值反映访存受限程度。
按照总内存带宽不变,则有下述函数表达式:
Figure BDA0002450283890000052
上式中,
Figure BDA0002450283890000053
因此,根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref]。
本实施例中,利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指,求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
Figure BDA0002450283890000054
上式中,n为进程数目,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核的中间频率fmid下对应的最大功耗,c为单个计算节点的处理器核数目,
Figure BDA0002450283890000055
为单个处理器核处于空闲状态下的处理器功耗,Pmen为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗,增加ΔN个计算节点会相应地增加总功耗,其中包括ΔN个计算节点的内存功耗和增加节点所产生的空闲处理器核的功耗,为了保证多节点总功耗不增加,所有处理器核的频率必须从最大频率fmax降至频率中间值fmid,取频率中间值fmid为最大频率fmax和最小频率fmin两者之间的平均值。
本实施例中,步骤1)之前还包括计算处理器频率f*的步骤,详细步骤包括将最优增加节点数目ΔN*代入式(1),令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*。
本实施例中,步骤1)之前还包括计算功耗限制值Ptarget的步骤,且计算函数表达式如下:
Figure BDA0002450283890000061
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
综上所述,本实施例提升计算子系统能效的资源分配方法针对集群系统上运行的访存受限型的程序,目的是实现在满足功耗约束条件下程序执行时间降低、总功耗保持不变,能耗减小,从而提高系统的能量有效性。技术方案是首先测量系统在不同频率级别下对应的处理器功耗;运行程序得到与性能和功耗相关的分析数据,建立资源分配(使用的计算节点数)、单节点内存带宽受限程度与并行程序的执行时间三者之间的关系,在不增加总功耗(指所有计算节点的总峰值功耗不超过缺省资源分配策略时的总功耗)的条件下,获得最优节点增加数目和处理器初始频率值;在程序运行之前,本资源调度方法确定新的分配节点数、每个节点处理器的初始频率和受限的目标总峰值功耗(由Intel RAPL的目标功耗值设定),在程序运行过程中,利用Intel RAPL工具进行总峰值功耗的实时控制。采用本实施例提升计算子系统能效的资源分配方法同时实现了功耗约束和显著的性能提升,提高了并行程序运行时系统的能量有效性。
此外,本实施例还提供一种提升计算子系统能效的资源分配系统,包括:
参数初始程序单元,用于确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget
资源分配程序单元,用于设置处理器动态频率调节工具的功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程,ΔN*为最优增加节点数目。
此外,本实施例还提供一种提升计算子系统能效的资源分配系统,包括计算机设备,该计算机设备被编程或配置以执行前述提升计算子系统能效的资源分配方法的步骤,或该计算机设备的存储器上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行前述提升计算子系统能效的资源分配方法的计算机程序。
以上所述仅是本实施例的优选实施方式,本实施例的保护范围并不仅局限于上述实施例,凡属于本实施例思路下的技术方案均属于本实施例的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本实施例原理前提下的若干改进和润饰,这些改进和润饰也应视为本实施例的保护范围。

Claims (6)

1.一种提升计算子系统能效的资源分配方法,其特征在于实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget
2)利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程;
步骤1)中确定最优增加节点数目ΔN*的步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*;
步骤1)中确定处理器频率f*的步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
Figure FDA0003798727280000011
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,
Figure FDA0003798727280000012
为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗;
步骤1)中确定功耗限制值Ptarget的计算函数表达式如下:
Figure FDA0003798727280000013
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
2.根据权利要求1所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN,其中bi(t)为第i个计算节点上的实际访存带宽值;
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否达到阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
3.根据权利要求1所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指,求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
Figure FDA0003798727280000021
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核运行在fmid下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,
Figure FDA0003798727280000022
为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗,增加ΔN个计算节点会相应地增加总功耗,其中包括ΔN个计算节点的内存功耗和增加节点所产生的空闲处理器核的功耗,为了保证多节点总功耗不增加,所有处理器核的频率必须从最大频率fmax降至频率中间值fmid,取频率中间值fmid为最大频率fmax和最小频率fmin两者之间的平均值。
4.一种提升计算子系统能效的资源分配系统,其特征在于包括:
参数初始程序单元,用于确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget
资源分配程序单元,用于利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程;
所述参数初始程序单元确定最优增加节点数目ΔN*的步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*;
所述参数初始程序单元确定处理器频率f*的步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
Figure FDA0003798727280000031
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,
Figure FDA0003798727280000032
为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗;
所述参数初始程序单元确定功耗限制值Ptarget的函数表达式如下:
Figure FDA0003798727280000033
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
5.一种提升计算子系统能效的资源分配系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行权利要求1~3中任意一项所述提升计算子系统能效的资源分配方法的步骤,或该计算机设备的存储器上存储有被编程或配置以执行权利要求1~3中任意一项所述提升计算子系统能效的资源分配方法的计算机程序。
6.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有被编程或配置以执行权利要求1~3中任意一项所述提升计算子系统能效的资源分配方法的计算机程序。
CN202010290699.5A 2020-04-14 2020-04-14 一种提升计算子系统能效的资源分配方法、系统及介质 Active CN111444025B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010290699.5A CN111444025B (zh) 2020-04-14 2020-04-14 一种提升计算子系统能效的资源分配方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010290699.5A CN111444025B (zh) 2020-04-14 2020-04-14 一种提升计算子系统能效的资源分配方法、系统及介质

Publications (2)

Publication Number Publication Date
CN111444025A CN111444025A (zh) 2020-07-24
CN111444025B true CN111444025B (zh) 2022-11-25

Family

ID=71651687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010290699.5A Active CN111444025B (zh) 2020-04-14 2020-04-14 一种提升计算子系统能效的资源分配方法、系统及介质

Country Status (1)

Country Link
CN (1) CN111444025B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104375899B (zh) * 2014-11-21 2016-03-30 北京应用物理与计算数学研究所 高性能计算机numa感知的线程和内存资源优化方法与系统
US10095434B2 (en) * 2015-01-02 2018-10-09 Reservoir Labs, Inc. Systems and methods for efficient determination of task dependences after loop tiling
US10048740B2 (en) * 2015-07-31 2018-08-14 International Business Machines Corporation Controlling power consumption
CN109298918A (zh) * 2018-07-10 2019-02-01 东南大学 一种基于线性规划的并行任务节能调度方法

Also Published As

Publication number Publication date
CN111444025A (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
US9983792B2 (en) Dynamic cache sharing based on power state
US7818594B2 (en) Power efficient resource allocation in data centers
Beckmann et al. Talus: A simple way to remove cliffs in cache performance
Sarood et al. Maximizing throughput of overprovisioned hpc data centers under a strict power budget
JP5564564B2 (ja) 計算ユニットの性能を性能感度に従い不均等に変化させる方法及び装置
US8190795B2 (en) Memory buffer allocation device and computer readable medium having stored thereon memory buffer allocation program
US20160239213A1 (en) Memory resource optimization method and apparatus
KR101356033B1 (ko) 하이브리드 주메모리 시스템 및 이를 위한 태스크 스케줄링 방법
Hanson et al. What computer architects need to know about memory throttling
US20120290789A1 (en) Preferentially accelerating applications in a multi-tenant storage system via utility driven data caching
US20130080809A1 (en) Server system and power managing method thereof
CN103885838A (zh) 一种获取虚拟机内存工作集的方法及内存优化分配方法
Zhang et al. Toward qos-awareness and improved utilization of spatial multitasking gpus
Lin et al. PPT: joint performance/power/thermal management of DRAM memory for multi-core systems
WO2022052479A1 (zh) 一种功耗调控方法、装置、设备及可读存储介质
CN111444025B (zh) 一种提升计算子系统能效的资源分配方法、系统及介质
Korkmaz et al. Towards Dynamic Green-Sizing for Database Servers.
CN110308991B (zh) 一种基于随机任务的数据中心节能优化方法及系统
CN106569728B (zh) 多磁盘阵列raid共享写缓存的处理方法及装置
Albericio et al. ABS: A low-cost adaptive controller for prefetching in a banked shared last-level cache
CN114356588B (zh) 一种数据预加载方法和装置
CN108920254B (zh) 一种基于细粒度的内存分配方法
Awasthi et al. Managing data placement in memory systems with multiple memory controllers
US9389919B2 (en) Managing workload distribution among computer systems based on intersection of throughput and latency models
Karyakin Memory Power Consumption in Main-Memory Database Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant