CN103279449A

CN103279449A - 大规模异构众核处理器平台的效率核算方法

Info

Publication number: CN103279449A
Application number: CN2013102354684A
Authority: CN
Inventors: 吕文静
Original assignee: Inspur Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2013-06-14
Filing date: 2013-06-14
Publication date: 2013-09-04

Abstract

本发明公开了一种大规模异构众核处理器平台的效率核算方法，包括如下步骤：S10：针对固定的并行问题w，获取仅使用通用处理器运行的情况下的并行运行时间

以及通用处理器和协处理器共同进行处理情况下的运行时间为

Figure 2013102354684100004DEST_PATH_IMAGE004

；S11：得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比

Figure 2013102354684100004DEST_PATH_IMAGE006

；S12：分别计算出通用处理器的浮点运算性能

Figure 2013102354684100004DEST_PATH_IMAGE008

以及协处理器的浮点运算性能

；S13：计算得到使用通用处理器和协处理器共同进行处理问题的效率

Figure 2013102354684100004DEST_PATH_IMAGE012

。本发明可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算，高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。

Description

大规模异构众核处理器平台的效率核算方法

技术领域

本发明属于高性能计算技术领域，涉及一种大规模异构众核处理器平台的效率核算方法。

背景技术

上世纪 90 年代以来，以高性能计算机为基础的计算科学得到了长足的发展，其与理论科学和实验科学相辅相成，成为人类科学研究必不可少的方法之一。高性能计算主要运用在许多工业领域和教育、科研领域，如汽车、航空航天器的设计制造，石油勘探、地震资料处理及生命科学、基因对比、材料设计、气象气候研究、宇宙演变、量子物理学、运算化学、分子模型、天体物理模拟等方面。目前，高性能计算已成为科学研究的必备工具。

此外，随着硬件系统朝着多核异构体系和众核体系的发展趋势和大规模密集型计算日益增长的性能可扩展需求，应用软件如何在新架构平台上获得好的性能已经成为软件工作者关注的焦点，因此，需要进行效率计算。针对由通用处理器与协处理器构成的异构平台，其中协处理器一般为众核微处理器，内部包含若干个处理核心，提供了比通用处理器更强大的处理能力和更高的并行性。但由于制造工艺技术和体系结构的差异，通用处理器和协处理器的主频往往不同，在相对加速比值的基础上，已经不适宜使用通用的效率计算方式进行计算。故需要开发提供一种核算方法，以便高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。

发明内容

为解决上述问题，本发明的目的在于提供一种大规模异构众核处理器平台的效率核算方法，可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算，高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。

为实现上述目的，本发明的技术方案为：

大规模异构众核处理器平台的效率核算方法，包括如下步骤：

S10：针对固定的并行问题w，获取仅使用通用处理器运行的情况下的并行运行时间以及获取使用通用处理器和协处理器共同进行处理情况下的运行时间为；

S11：根据相对加速比计算公式，得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比

Figure 2013102354684100002DEST_PATH_IMAGE006

；

S12：根据浮点性能计算公式，分别计算出通用处理器的浮点运算性能

Figure 2013102354684100002DEST_PATH_IMAGE008

以及协处理器的浮点运算性能

；

S13：计算得到使用通用处理器和协处理器共同进行处理问题的效率

Figure 2013102354684100002DEST_PATH_IMAGE012

。

进一步地，步骤S10中，固定的并行问题w是指运行相同的应用程序及其固定算例，所述应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。

进一步地，当运行平台仅为通用处理器时，应用程序全部运行在通用处理器上，而当运行平台为通用处理器和协处理器时，应用程序中的通用处理器代码部分运行在通用处理器上，协处理器代码部分运行在协处理器上。

进一步地，步骤S13中，

Figure 2013102354684100002DEST_PATH_IMAGE014

表示增加协处理器后的浮点计算能力较增加之前的性能提升。

相较于现有技术，本发明大规模异构众核处理器平台的效率核算方法可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算，高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。

附图说明

图1是本发明的方法流程图示。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明大规模异构众核处理器平台的效率核算方法适用的架构为由通用处理器与协处理器构成的异构平台，其中协处理器一般为众核微处理器，内部包含若干个处理核心，提供了比通用处理器更强大的处理能力和更高的并行性。通用处理器和协处理器分别执行各自的指令集，协同计算，共同完成应用程序的运行。

如图1所示，本发明大规模异构众核处理器平台效率核算方法包括如下步骤：

S10：针对固定的并行问题w，在仅使用通用处理器运行的情况下，获取并行运行时间

；而在使用通用处理器和协处理器共同进行处理的情况下，获取运行时间为

；

S11：根据相对加速比概念，得到使用通用处理器和协处理器共同进行处理与仅使用通用处理器处理的加速比；

S12：根据浮点性能计算公式：浮点峰值=处理器主频×处理器每个时钟周期执行浮点运算的次数×系统处理器数目，分别计算出通用处理器的浮点运算性能

以及协处理器的浮点运算性能

；

S13：得到使用通用处理器和协处理器共同进行处理问题的效率

；一般情况下，0<E<1，E值越大，表示该应用在异构平台上发挥的性能越好。

步骤S10中，固定的并行问题w是指运行相同的应用程序及其固定算例。并且此应用程序包含运行在通用处理器上的代码部分和运行在协处理器上的代码部分。其中，当运行平台仅为通用处理器时，应用程序全部运行在通用处理器上，而当运行平台为通用处理器和协处理器时，应用程序中的通用处理器代码部分运行在通用处理器上，协处理器代码部分运行在协处理器上。

步骤S11中，相对加速比的值为：没有采用改进措施前执行某任务的时间除于采用改进措施后执行某任务的时间。

步骤S13中，表示增加协处理器后的浮点计算能力较增加之前的性能提升情况；一般情况下，0<E<1，E值越大，表示该应用在异构平台上发挥的性能越好。

本发明以平台浮点运算性能为基准的效率核算方式，更加科学的衡量应用在异构架构平台上的性能表现，可以在大规模异构众核处理器平台上快速准确的进行应用运行的实际效率核算，高效、准确的反映一款应用软件在大规模异构众核处理器平台上的运行效率。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。