CN103279449A - 大规模异构众核处理器平台的效率核算方法 - Google Patents
大规模异构众核处理器平台的效率核算方法 Download PDFInfo
- Publication number
- CN103279449A CN103279449A CN2013102354684A CN201310235468A CN103279449A CN 103279449 A CN103279449 A CN 103279449A CN 2013102354684 A CN2013102354684 A CN 2013102354684A CN 201310235468 A CN201310235468 A CN 201310235468A CN 103279449 A CN103279449 A CN 103279449A
- Authority
- CN
- China
- Prior art keywords
- general processor
- coprocessor
- platform
- processor
- floating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
技术领域
本发明属于高性能计算技术领域,涉及一种大规模异构众核处理器平台的效率核算方法。
背景技术
上世纪 90 年代以来,以高性能计算机为基础的计算科学得到了长足的发展,其与理论科学和实验科学相辅相成,成为人类科学研究必不可少的方法之一。高性能计算主要运用在许多工业领域和教育、科研领域,如汽车、航空航天器的设计制造,石油勘探、地震资料处理及生命科学、基因对比、材料设计、气象气候研究、宇宙演变、量子物理学、运算化学、分子模型、天体物理模拟等方面。目前,高性能计算已成为科学研究的必备工具。
此外,随着硬件系统朝着多核异构体系和众核体系的发展趋势和大规模密集型计算日益增长的性能可扩展需求,应用软件如何在新架构平台上获得好的性能已经成为软件工作者关注的焦点,因此,需要进行效率计算。针对由通用处理器与协处理器构成的异构平台,其中协处理器一般为众核微处理器,内部包含若干个处理核心,提供了比通用处理器更强大的处理能力和更高的并行性。但由于制造工艺技术和体系结构的差异,通用处理器和协处理器的主频往往不同,在相对加速比值的基础上,已经不适宜使用通用的效率计算方式进行计算。故需要开发提供一种核算方法,以便高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
发明内容
为解决上述问题,本发明的目的在于提供一种大规模异构众核处理器平台的效率核算方法,可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
为实现上述目的,本发明的技术方案为:
大规模异构众核处理器平台的效率核算方法,包括如下步骤:
S10:针对固定的并行问题w,获取仅使用通用处理器运行的情况下的并行运行时间 以及获取使用通用处理器和协处理器共同进行处理情况下的运行时间为;
进一步地,步骤S10中,固定的并行问题w是指运行相同的应用程序及其固定算例,所述应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。
进一步地,当运行平台仅为通用处理器时,应用程序全部运行在通用处理器上,而当运行平台为通用处理器和协处理器时,应用程序中的通用处理器代码部分运行在通用处理器上,协处理器代码部分运行在协处理器上。
相较于现有技术,本发明大规模异构众核处理器平台的效率核算方法可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
附图说明
图1是本发明的方法流程图示。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明大规模异构众核处理器平台的效率核算方法适用的架构为由通用处理器与协处理器构成的异构平台,其中协处理器一般为众核微处理器,内部包含若干个处理核心,提供了比通用处理器更强大的处理能力和更高的并行性。通用处理器和协处理器分别执行各自的指令集,协同计算,共同完成应用程序的运行。
如图1所示,本发明大规模异构众核处理器平台效率核算方法包括如下步骤:
S11:根据相对加速比概念,得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比;
步骤S10中,固定的并行问题w是指运行相同的应用程序及其固定算例。并且此应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。其中,当运行平台仅为通用处理器时,应用程序全部运行在通用处理器上,而当运行平台为通用处理器和协处理器时,应用程序中的通用处理器代码部分运行在通用处理器上,协处理器代码部分运行在协处理器上。
步骤S11中,相对加速比的值为:没有采用改进措施前执行某任务的时间除于采用改进措施后执行某任务的时间。
步骤S13中,表示增加协处理器后的浮点计算能力较增加之前的性能提升情况;一般情况下,0<E<1,E值越大,表示该应用在异构平台上发挥的性能越好。
本发明以平台浮点运算性能为基准的效率核算方式,更加科学的衡量应用在异构架构平台上的性能表现,可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算,高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
2.根据权利要求1所述大规模异构众核处理器平台的效率核算方法,其特征在于:步骤S10中,固定的并行问题w是指运行相同的应用程序及其固定算例,所述应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。
3.根据权利要求2所述大规模异构众核处理器平台的效率核算方法,其特征在于:当运行平台仅为通用处理器时,应用程序全部运行在通用处理器上,而当运行平台为通用处理器和协处理器时,应用程序中的通用处理器代码部分运行在通用处理器上,协处理器代码部分运行在协处理器上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013102354684A CN103279449A (zh) | 2013-06-14 | 2013-06-14 | 大规模异构众核处理器平台的效率核算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013102354684A CN103279449A (zh) | 2013-06-14 | 2013-06-14 | 大规模异构众核处理器平台的效率核算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103279449A true CN103279449A (zh) | 2013-09-04 |
Family
ID=49061974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013102354684A Pending CN103279449A (zh) | 2013-06-14 | 2013-06-14 | 大规模异构众核处理器平台的效率核算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103279449A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902387A (zh) * | 2014-04-29 | 2014-07-02 | 浪潮电子信息产业股份有限公司 | 一种cpu+gpu协同并行计算动态负载均衡方法 |
CN105487634A (zh) * | 2015-11-24 | 2016-04-13 | 无锡江南计算技术研究所 | 一种面向异构众核芯片的量化功耗控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894046A (zh) * | 2009-07-27 | 2010-11-24 | 浪潮电子信息产业股份有限公司 | 一种应用软件最优化运行方案的寻找方法 |
CN103049245A (zh) * | 2012-10-25 | 2013-04-17 | 浪潮电子信息产业股份有限公司 | 一种基于cpu多核平台的软件性能优化方法 |
-
2013
- 2013-06-14 CN CN2013102354684A patent/CN103279449A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894046A (zh) * | 2009-07-27 | 2010-11-24 | 浪潮电子信息产业股份有限公司 | 一种应用软件最优化运行方案的寻找方法 |
CN103049245A (zh) * | 2012-10-25 | 2013-04-17 | 浪潮电子信息产业股份有限公司 | 一种基于cpu多核平台的软件性能优化方法 |
Non-Patent Citations (1)
Title |
---|
刘豪123: "《加速比》", 《百度百科》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902387A (zh) * | 2014-04-29 | 2014-07-02 | 浪潮电子信息产业股份有限公司 | 一种cpu+gpu协同并行计算动态负载均衡方法 |
CN105487634A (zh) * | 2015-11-24 | 2016-04-13 | 无锡江南计算技术研究所 | 一种面向异构众核芯片的量化功耗控制方法 |
CN105487634B (zh) * | 2015-11-24 | 2018-04-10 | 无锡江南计算技术研究所 | 一种面向异构众核芯片的量化功耗控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan et al. | Bit-level optimization of adder-trees for multiple constant multiplications for efficient FIR filter implementation | |
Wu et al. | A heterogeneous platform with GPU and FPGA for power efficient high performance computing | |
Hu et al. | Toward improved aeromechanics simulations using recent advancements in scientific computing | |
CN103246541B (zh) | 一种自动并行化多级并行代价评估方法 | |
CN103345580A (zh) | 基于格子Boltzmann方法的并行CFD方法 | |
Dzafic et al. | High performance power flow algorithm for symmetrical distribution networks with unbalanced loading | |
Solis-Vasquez et al. | Evaluating the energy efficiency of OpenCL-accelerated AutoDock molecular docking | |
Anzt et al. | Optimization of power consumption in the iterative solution of sparse linear systems on graphics processors | |
CN101894046A (zh) | 一种应用软件最优化运行方案的寻找方法 | |
CN103279449A (zh) | 大规模异构众核处理器平台的效率核算方法 | |
Scrofano et al. | Preliminary investigation of advanced electrostatics in molecular dynamics on reconfigurable computers | |
Moustafa et al. | 3D cartesian transport sweep for massively parallel architectures with PARSEC | |
Svirin et al. | BigPanDA: panda workload management system and its applications beyond ATLAS | |
Jalili-Marandi et al. | Large-scale transient stability simulation on graphics processing units | |
Dubey et al. | Software abstractions and methodologies for HPC simulation codes on future architectures | |
Xu et al. | Parallelizing a high-order CFD software for 3D, multi-block, structural grids on the TianHe-1A supercomputer | |
CN102938009A (zh) | 车身主断面参数计算方法及装置 | |
Duan et al. | Bio-ESMD: A Data Centric Implementation for Large-Scale Biological System Simulation on Sunway TaihuLight Supercomputer | |
Hasanov et al. | High-level topology-oblivious optimization of MPI broadcast algorithms on extreme-scale platforms | |
Chabalko et al. | Implementation and benchmarking of two-dimensional vortex interactions on a graphics processing unit | |
Ismail et al. | Evaluation of CFD Computing Performance on Multi-Core Processors for Flow Simulations | |
CN104375971A (zh) | 一种便携的可移动积分计算器设备实现方法 | |
CN102890642A (zh) | 基于匹配矩阵的异构重构计算的性能分析方法 | |
Thrasher et al. | Shifting the bioinformatics computing paradigm: A case study in parallelizing genome annotation using maker and work queue | |
Sukhwani et al. | Effective floating point applications on FPGAs: Examples from molecular modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130904 |