CN103279449A - 大规模异构众核处理器平台的效率核算方法 - Google Patents

大规模异构众核处理器平台的效率核算方法 Download PDF

Info

Publication number
CN103279449A
CN103279449A CN2013102354684A CN201310235468A CN103279449A CN 103279449 A CN103279449 A CN 103279449A CN 2013102354684 A CN2013102354684 A CN 2013102354684A CN 201310235468 A CN201310235468 A CN 201310235468A CN 103279449 A CN103279449 A CN 103279449A
Authority
CN
China
Prior art keywords
general processor
coprocessor
platform
processor
floating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013102354684A
Other languages
English (en)
Inventor
吕文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2013102354684A priority Critical patent/CN103279449A/zh
Publication of CN103279449A publication Critical patent/CN103279449A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种大规模异构众核处理器平台的效率核算方法,包括如下步骤:S10:针对固定的并行问题w,获取仅使用通用处理器运行的情况下的并行运行时间
Figure 2013102354684100004DEST_PATH_IMAGE002
以及通用处理器和协处理器共同进行处理情况下的运行时间为
Figure 2013102354684100004DEST_PATH_IMAGE004
;S11:得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比
Figure 2013102354684100004DEST_PATH_IMAGE006
;S12:分别计算出通用处理器的浮点运算性能
Figure 2013102354684100004DEST_PATH_IMAGE008
以及协处理器的浮点运算性能
Figure 2013102354684100004DEST_PATH_IMAGE010
;S13:计算得到使用通用处理器和协处理器共同进行处理问题的效率
Figure 2013102354684100004DEST_PATH_IMAGE012
。本发明可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。

Description

大规模异构众核处理器平台的效率核算方法
技术领域
本发明属于高性能计算技术领域,涉及一种大规模异构众核处理器平台的效率核算方法。
背景技术
上世纪 90 年代以来,以高性能计算机为基础的计算科学得到了长足的发展,其与理论科学和实验科学相辅相成,成为人类科学研究必不可少的方法之一。高性能计算主要运用在许多工业领域和教育、科研领域,如汽车、航空航天器的设计制造,石油勘探、地震资料处理及生命科学、基因对比、材料设计、气象气候研究、宇宙演变、量子物理学、运算化学、分子模型、天体物理模拟等方面。目前,高性能计算已成为科学研究的必备工具。
此外,随着硬件系统朝着多核异构体系和众核体系的发展趋势和大规模密集型计算日益增长的性能可扩展需求,应用软件如何在新架构平台上获得好的性能已经成为软件工作者关注的焦点,因此,需要进行效率计算。针对由通用处理器与协处理器构成的异构平台,其中协处理器一般为众核微处理器,内部包含若干个处理核心,提供了比通用处理器更强大的处理能力和更高的并行性。但由于制造工艺技术和体系结构的差异,通用处理器和协处理器的主频往往不同,在相对加速比值的基础上,已经不适宜使用通用的效率计算方式进行计算。故需要开发提供一种核算方法,以便高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
发明内容
为解决上述问题,本发明的目的在于提供一种大规模异构众核处理器平台的效率核算方法,可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
为实现上述目的,本发明的技术方案为:
大规模异构众核处理器平台的效率核算方法,包括如下步骤:
S10:针对固定的并行问题w,获取仅使用通用处理器运行的情况下的并行运行时间                                               以及获取使用通用处理器和协处理器共同进行处理情况下的运行时间为
S11:根据相对加速比计算公式,得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比
Figure 2013102354684100002DEST_PATH_IMAGE006
S12:根据浮点性能计算公式,分别计算出通用处理器的浮点运算性能
Figure 2013102354684100002DEST_PATH_IMAGE008
以及协处理器的浮点运算性能
Figure 2013102354684100002DEST_PATH_IMAGE010
S13:计算得到使用通用处理器和协处理器共同进行处理问题的效率
Figure 2013102354684100002DEST_PATH_IMAGE012
进一步地,步骤S10中,固定的并行问题w是指运行相同的应用程序及其固定算例,所述应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。
进一步地,当运行平台仅为通用处理器时,应用程序全部运行在通用处理器上,而当运行平台为通用处理器和协处理器时,应用程序中的通用处理器代码部分运行在通用处理器上,协处理器代码部分运行在协处理器上。
进一步地,步骤S13中,
Figure 2013102354684100002DEST_PATH_IMAGE014
表示增加协处理器后的浮点计算能力较增加之前的性能提升。
相较于现有技术,本发明大规模异构众核处理器平台的效率核算方法可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
附图说明
图1是本发明的方法流程图示。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明大规模异构众核处理器平台的效率核算方法适用的架构为由通用处理器与协处理器构成的异构平台,其中协处理器一般为众核微处理器,内部包含若干个处理核心,提供了比通用处理器更强大的处理能力和更高的并行性。通用处理器和协处理器分别执行各自的指令集,协同计算,共同完成应用程序的运行。
如图1所示,本发明大规模异构众核处理器平台效率核算方法包括如下步骤:
S10:针对固定的并行问题w,在仅使用通用处理器运行的情况下,获取并行运行时间
Figure 159222DEST_PATH_IMAGE002
;而在使用通用处理器和协处理器共同进行处理的情况下,获取运行时间为
Figure 911277DEST_PATH_IMAGE004
S11:根据相对加速比概念,得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比
S12:根据浮点性能计算公式:浮点峰值=处理器主频×处理器每个时钟周期执行浮点运算的次数×系统处理器数目,分别计算出通用处理器的浮点运算性能
Figure 773DEST_PATH_IMAGE008
以及协处理器的浮点运算性能
Figure 635891DEST_PATH_IMAGE010
S13:得到使用通用处理器和协处理器共同进行处理问题的效率
Figure 304770DEST_PATH_IMAGE012
;一般情况下,0<E<1,E值越大,表示该应用在异构平台上发挥的性能越好。
步骤S10中,固定的并行问题w是指运行相同的应用程序及其固定算例。并且此应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。其中,当运行平台仅为通用处理器时,应用程序全部运行在通用处理器上,而当运行平台为通用处理器和协处理器时,应用程序中的通用处理器代码部分运行在通用处理器上,协处理器代码部分运行在协处理器上。
步骤S11中,相对加速比的值为:没有采用改进措施前执行某任务的时间除于采用改进措施后执行某任务的时间。
步骤S13中,表示增加协处理器后的浮点计算能力较增加之前的性能提升情况;一般情况下,0<E<1,E值越大,表示该应用在异构平台上发挥的性能越好。
本发明以平台浮点运算性能为基准的效率核算方式,更加科学的衡量应用在异构架构平台上的性能表现,可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.大规模异构众核处理器平台的效率核算方法,其特征在于,包括如下步骤:
S10:针对固定的并行问题w,获取仅使用通用处理器运行的情况下的并行运行时间                                                
Figure 2013102354684100001DEST_PATH_IMAGE001
以及获取使用通用处理器和协处理器共同进行处理情况下的运行时间为
Figure 359432DEST_PATH_IMAGE002
S11:根据相对加速比计算公式,得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比
Figure 2013102354684100001DEST_PATH_IMAGE003
S12:根据浮点性能计算公式,分别计算出通用处理器的浮点运算性能
Figure 276573DEST_PATH_IMAGE004
以及协处理器的浮点运算性能
Figure 2013102354684100001DEST_PATH_IMAGE005
S13:计算得到使用通用处理器和协处理器共同进行处理问题的效率
Figure 993993DEST_PATH_IMAGE006
2.根据权利要求1所述大规模异构众核处理器平台的效率核算方法,其特征在于:步骤S10中,固定的并行问题w是指运行相同的应用程序及其固定算例,所述应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。
3.根据权利要求2所述大规模异构众核处理器平台的效率核算方法,其特征在于:当运行平台仅为通用处理器时,应用程序全部运行在通用处理器上,而当运行平台为通用处理器和协处理器时,应用程序中的通用处理器代码部分运行在通用处理器上,协处理器代码部分运行在协处理器上。
4.根据权利要求3所述大规模异构众核处理器平台的效率核算方法,其特征在于:步骤S13中,
Figure 2013102354684100001DEST_PATH_IMAGE007
表示增加协处理器后的浮点计算能力较增加之前的性能提升。
CN2013102354684A 2013-06-14 2013-06-14 大规模异构众核处理器平台的效率核算方法 Pending CN103279449A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013102354684A CN103279449A (zh) 2013-06-14 2013-06-14 大规模异构众核处理器平台的效率核算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013102354684A CN103279449A (zh) 2013-06-14 2013-06-14 大规模异构众核处理器平台的效率核算方法

Publications (1)

Publication Number Publication Date
CN103279449A true CN103279449A (zh) 2013-09-04

Family

ID=49061974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013102354684A Pending CN103279449A (zh) 2013-06-14 2013-06-14 大规模异构众核处理器平台的效率核算方法

Country Status (1)

Country Link
CN (1) CN103279449A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902387A (zh) * 2014-04-29 2014-07-02 浪潮电子信息产业股份有限公司 一种cpu+gpu协同并行计算动态负载均衡方法
CN105487634A (zh) * 2015-11-24 2016-04-13 无锡江南计算技术研究所 一种面向异构众核芯片的量化功耗控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894046A (zh) * 2009-07-27 2010-11-24 浪潮电子信息产业股份有限公司 一种应用软件最优化运行方案的寻找方法
CN103049245A (zh) * 2012-10-25 2013-04-17 浪潮电子信息产业股份有限公司 一种基于cpu多核平台的软件性能优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894046A (zh) * 2009-07-27 2010-11-24 浪潮电子信息产业股份有限公司 一种应用软件最优化运行方案的寻找方法
CN103049245A (zh) * 2012-10-25 2013-04-17 浪潮电子信息产业股份有限公司 一种基于cpu多核平台的软件性能优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘豪123: "《加速比》", 《百度百科》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902387A (zh) * 2014-04-29 2014-07-02 浪潮电子信息产业股份有限公司 一种cpu+gpu协同并行计算动态负载均衡方法
CN105487634A (zh) * 2015-11-24 2016-04-13 无锡江南计算技术研究所 一种面向异构众核芯片的量化功耗控制方法
CN105487634B (zh) * 2015-11-24 2018-04-10 无锡江南计算技术研究所 一种面向异构众核芯片的量化功耗控制方法

Similar Documents

Publication Publication Date Title
Pan et al. Bit-level optimization of adder-trees for multiple constant multiplications for efficient FIR filter implementation
Wu et al. A heterogeneous platform with GPU and FPGA for power efficient high performance computing
Hu et al. Toward improved aeromechanics simulations using recent advancements in scientific computing
CN103246541B (zh) 一种自动并行化多级并行代价评估方法
CN103345580A (zh) 基于格子Boltzmann方法的并行CFD方法
Dzafic et al. High performance power flow algorithm for symmetrical distribution networks with unbalanced loading
Solis-Vasquez et al. Evaluating the energy efficiency of OpenCL-accelerated AutoDock molecular docking
Anzt et al. Optimization of power consumption in the iterative solution of sparse linear systems on graphics processors
CN101894046A (zh) 一种应用软件最优化运行方案的寻找方法
CN103279449A (zh) 大规模异构众核处理器平台的效率核算方法
Scrofano et al. Preliminary investigation of advanced electrostatics in molecular dynamics on reconfigurable computers
Moustafa et al. 3D cartesian transport sweep for massively parallel architectures with PARSEC
Svirin et al. BigPanDA: panda workload management system and its applications beyond ATLAS
Jalili-Marandi et al. Large-scale transient stability simulation on graphics processing units
Dubey et al. Software abstractions and methodologies for HPC simulation codes on future architectures
Xu et al. Parallelizing a high-order CFD software for 3D, multi-block, structural grids on the TianHe-1A supercomputer
CN102938009A (zh) 车身主断面参数计算方法及装置
Duan et al. Bio-ESMD: A Data Centric Implementation for Large-Scale Biological System Simulation on Sunway TaihuLight Supercomputer
Hasanov et al. High-level topology-oblivious optimization of MPI broadcast algorithms on extreme-scale platforms
Chabalko et al. Implementation and benchmarking of two-dimensional vortex interactions on a graphics processing unit
Ismail et al. Evaluation of CFD Computing Performance on Multi-Core Processors for Flow Simulations
CN104375971A (zh) 一种便携的可移动积分计算器设备实现方法
CN102890642A (zh) 基于匹配矩阵的异构重构计算的性能分析方法
Thrasher et al. Shifting the bioinformatics computing paradigm: A case study in parallelizing genome annotation using maker and work queue
Sukhwani et al. Effective floating point applications on FPGAs: Examples from molecular modeling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130904