CN101520748A

CN101520748A - 一种测试Intel多核CPU加速比的方法

Info

Publication number: CN101520748A
Application number: CN200910013920A
Authority: CN
Inventors: 王友升
Original assignee: Langchao Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2009-01-12
Filing date: 2009-01-12
Publication date: 2009-09-02

Abstract

一种测试Intel多核CPU加速比的方法，即是测试单CPU上的运行时间与并行算法在多CPU上的运行时间之比，用户可以根据测试的需求灵活设置计算量，从而达到控制测试时间的目的，具有更大的灵活性。单线程应用已经造成了多核CPU资源的严重浪费，而开发多线程应用，充分发挥多核CPU协调运作的优势，CPU用户最关心的一个指标也是CPU加速比。该方法正基于软件，提出了一个高效的测试CPU加速比的方法。

Description

一种测试Intel多核CPU加速比的方法

1、技术领域

本发明涉及服务器应用测试领域，具体涉及一种测试Intel多核CPU加速比的方法。

2、技术背景

加速比定义为串行算法在单CPU上的运行时间与并行算法在多CPU上的运行时间之比。加速比可以告诉我们CPU的运算性能是否与CPU核心数目的增长同步。站在服务器产品在研发角度上看，需要对服务器性能进行评估，譬如使用2颗双核的CPU运算能力强还是使用一颗4核的CPU，为确保开发出性价比更高的产品，其中CPU加速比就是一个很重要的评价指标；PWscf(Plane-Wave Self-Consistent Field)是意大利国际理论物理研究中心主持开发的一个基于平面波的第一性原理计算软件包，目前PWscf是Quantum ESPRESSO(ESPRESSO：Open-SourcePackage for Research in Electron Structure，Simulation and Optimization)的一部分，主要集成了pwscf.cpmd和fpmd这三个模块，可以进行总能相关计算和分子动力学模拟，其次是基于多线程编写的，属于CPU密集型软件，计算量比较大，可以让CPU一致处于饱和状态；最后是用户可以根据测试的需求灵活设置计算量，从而达到控制测试时间的目的，具有更大的灵活性。站在应用角度上讲，单线程应用已经造成了多核CPU资源的严重浪费，而开发多线程应用，充分发挥多核CPU协调运作的优势，CPU用户最关心的一个指标也是CPU加速比。该方法正基于上述软件，提出了一个高效的测试CPU加速比的方法。

3、发明内容

对Intel多核CPU的加速比进行评估测试，必须保证在同一个测试基准下进行，而且每次进行测试前都要进行机器的充启，这样可以避免缓存对测试结果的影响。该测试方案的具体实施包括并行环境的配置、intel编译器的安装，intel MKL库的安装，intel mpi并行软件的安装，pwscf软件的安装运行测试这五大部分组成.

4.附图说明

图1为一种测试Intel多核CPU加速比的方法的加速比折线图

5.具体实施方式

本发明的一种测试Intel多核CPU加速比的方法具体实施详细介绍如下：

1)、并行环境的配置

1.1)、配置rsh，开启用户对所有节点的rsh权限，具体如下：

a)、编辑/etc/hosts，加入所有(包括本机的)节点的ip地址和对应的计算机名；

b)、编辑/root/.rhosts和/etc/hosts.equiv，加入所有节点的计算机名；

c)、开启rsh服务：setup→system services→[*]rsh[*]rlogin[*]rexec；

d)、编辑/etc/securetty，加入rsh，rexec，rlogin；

e)、重起服务service xinetd restart；

上述步骤要重复在各节点配置。

1.2)、配置ssh，实现所有节点之间的无密码互访，具体配置步骤如下：

a)、在每个节点上以root登录，然后运行ssh-keygen-t dsa

b)、在每个节点上将生成的/root/.ssh/id_dsa和/root/.ssh/id_dsa.pub都导入到同一个文件authorized_keys2中；

c)、将生成的包含所有节点信息的authorized_keys2文件拷贝到其他所有节点上；

d)、测试ssh配置是否成功；

1.3)、进行NFS的配置，开启nfs和portmap服务，建立共享文件目录，具体配置如下：

a)、在管理端建立文件/etc/exports，并且设置共享目录属性；

b)、在管理端激活nfs和portmap服务；

c)、在被管理端建立需要挂载的目录，并进行本地挂载；

1.4)、进行NIS配置，建立域名解析服务，具体实施如下：

a)、在管理端开启服务yppasswd和ypserv；

b)、在管理端配置NIS域名；

c)、在被管理端开启服务ypbind：

d)、在被管理端修改/etc/passwd在末尾加入+；

到此并行环境配置完成，如果是在单机下进行intel CPU的多核测试，可以直接跳过并行环境配置这一步。

2)、Intel编译器

我们选用intel编译器主要是一方面是由于PWSCF软件才后期安装时，需要进行调用Intel编译器进行编译，另一个方面也是由于可以使用Intel编译器对Intel的CPU进行不同程度的优化，以获取更高的性能。

a)、Intel C++编译器的安装

解压intel C++编译器压缩包，运行./install.sh文件，按照默认方式进行安装，默认安装路径是/opt/intel/cc/.

b)、Intel Fortran编译器的安装

解压intel Fortran编译器压缩包，运行./install.sh，按照默认方式进行安装，默认安装路径是/opt/intel/fc/.

3)Intel MKL数学核心库安装

PWSCF软件中含有大量的数学运算，Intel MKL库针对数学运算进行了大量的优化，这样可以保证PWSCF软件高效运行。

具体安装步骤如下：

解压Intel MKL库压缩包，运行./install.sh按照默认的安装方式进行安装，默认的安装路径是/opt/intel/mkl.

注意要保证集群上的所有节点的安装目录都相同，这样才保证应用软件运行时出现不必要的错误。

4)、Intel MPI软件

在安装Intel MPI软件时，首先要创建machines.LINUX文件，在该文件中加入所有节点，这样在安装时可以避免每个节点进行安装。在MPI安装完成后，需要进行MPI的测试，启动MPD，配置mpd.host文件，确保MPI运行成功。

5)基准测试软件pwscf

安装PWscf软件时，可以根据测试系统的CPU信息，设置Intel C++和Fortran编译器的优化参数，进行优化编译。编译成功后，进行安装，安装成功后会出现一个PW.x(电子和离子优化)的执行档，我们通过运行PW.x来计算不同的元素来测试CPU的加速比。具体的安装步骤如下：

a)、运行下列命令

./configure ARCH＝ia32 MPIF90＝mpiifort LIBDIRS＝”/opt/intel/mkl/

9.1.023/lib/32/usr/lib/math”注意不同的版本可能命令参数不太一样；

b)、设置环境intel编译器，mkl库，mpi环境变量；

c)、编译

使用命令make all；

d)、编译成功进行测试；

6)测试

在测试时，利用MPI的工作原理来控制参与运算的CPU核数，从而得到不同的核数计算相同的元素所需要的CPU时间，进而计算出CPU的加速比。加速比定义为串行算法在单CPU上的运行时间与并行算法在多CPU上的运行时间之比，加速比可以告诉我们性能是否与核心数目的增长同步。

测试时，先要启动mpdboot，如果是集群时需要把所有节点全部启动，mpdboot启动成功后，再运行mpiexe进行测试。

例如：a)启动单个节点

Mpdboot-n1

其中n表示启动的节点数

b)、运行1个核心

mpiexec-n 1 bin/pw.x<mgal2o4-cf.scf.in

其中n表示参与运算的核数pw.x为可执行档，mgal2o4-cf.scf.in包含有相应的配置信息和待计算的元素。

c)、运行2个核心

mpi exec-n 2 bin/pw.x<mgal2o4-cf.scf.in

d)、运行4个核心

mpiexec-n 4 bin/pw.x<mgal2o4-cf.scf.in

测试完成，进行数据的收集。

7)测试数据的收集

数据的收集分为两类：

a)、系统性能数据

系统性能数据主要收集CPU和内存的信息，使用TOP或者VMSTAT命令。

b)、CPU运行数据

CPU运行数据主要是收集cpu time和wall time这两项数据。

8)测试数据的整理

测试数据的整理主要是将数据进行标准化，以便于用户分析。我们主要是借助于excel进行分析。由于测试的次数比较多，收集的数据量比较大，容易造成混淆，可以采用便于记忆的命名规范进行，譬如以参与运算的核数进行命名等。根据系统性能数据的分析，我们可以判定CPU在当前基准下是否运行处于饱和状态。根据cpu time和wall time数据我们计算CPU的加速比。整理后的测试数据应该包括如下内容：硬件信息(CPU，内存，硬盘)，软件信息(应用软件，操作系统)，负载量，编译信息，CPU Time，加速比等。下面给Intel Xeon 7120为例介绍一下成果数据的展现形式：

a)、图标形式

系统概要信息：

配置	详细描述
配置	详细描述	硬件信息	Intel Xeon 7120*2/2G/SAS 73G
软件信息	OS(Redhat4 update 5，32bit)，intel complier 9.1，intel mkl9.1 intel mpi 3.0	硬件信息	Intel Xeon 7120*2/2G/SAS 73G
软件信息		负载量	Mgsa.scf.in

CPU测试信息

CPU core	Nodes	Cpu time(s)	Speed_up	Wall time(s)	Idealizedspeed_up
CPU core	Nodes	Cpu time(s)	Speed_up	Wall time(s)	Idealizedspeed_up	1	1	895.44	1.0000	935.70	1.0000
2	1	484.90	1.8466	539.55	1.7342	1	1	895.44	1.0000	935.70	1.0000
2	1	484.90	1.8466	539.55	1.7342	4	1	173.86	5.1500	202.09	6.6301

CPU time的加速比speed_up为单核CPU time/多核CPU time的结果；CPU wall time的加速比Indealized speed_up为单核Wall time/多核Wall time的结果。

Claims

1、一种测试Intel多核CPU性能加速比的方法，其特征在于基于多核CPU同时进行多任务处理和多任务计算方面的优势，通过选用多线程、CPU高密集型应用软件，使CPU的多核一直处于饱和的运行状态，真实测试CPU各个核运算性能能力，获得一组准确可靠的加速比数据。

2、根据权利要求1所述的方法，其特征在于该测试方案的具体实施包括并行环境的配置、intel编译器的安装，intel MKL库的安装，intel mpi并行软件的安装，pwscf软件的安装运行测试这五大部分组成，下面就每一部分的具体步骤如下：

1)、并行环境的配置

1.1)、配置rsh，开启用户对所有节点的rsh权限，具体如下：

c)、开启rsh服务：setup→system services→[*]rsh[*]rlogin[*]rexec；

d)、编辑/etc/securetty，加入rsh，rexec，rlogin；

e)、重起服务service xinetd restart；

上述步骤要重复在各节点配置；

a)、在每个节点上以root登录，然后运行ssh-keygen-t dsa

d)、测试ssh配置是否成功；

a)、在管理端建立文件/etc/exports，并且设置共享目录属性；

b)、在管理端激活nfs和portmap服务；

c)、在被管理端建立需要挂载的目录，并进行本地挂载；

1.4)、进行NIS配置，建立域名解析服务，具体实施如下：

a)、在管理端开启服务yppasswd和ypserv；

b)、在管理端配置NIS域名；

c)、在被管理端开启服务ypbind；

d)、在被管理端修改/etc/passwd在末尾加入+；

到此并行环境配置完成，如果是在单机下进行intel CPU的多核测试，可以直接跳过并行环境配置这一步；

2)、Intel编译器

我们选用intel编译器主要是一方面是由于PWSCF软件才后期安装时，需要进行调用Intel编译器进行编译，另一个方面也是由于可以使用Intel编译器对Intel的CPU进行不同程度的优化，以获取更高的性能；

a)、Intel C++编译器的安装

解压intel C++编译器压缩包，运行./install.sh文件，按照默认方式进行安装，

默认安装路径是/opt/intel/cc/.

b)、Intel Fortran编译器的安装

解压intel Fortran编译器压缩包，运行./install.sh，按照默认方式进行安装，

默认安装路径是/opt/intel/fc/.

3)Intel MKL数学核心库安装

PWSCF软件中含有大量的数学运算，Intel MKL库针对数学运算进行了大量的优化，

这样可以保证PWSCF软件高效运行；

具体安装步骤如下：

注意要保证集群上的所有节点的安装目录都相同，这样才保证应用软件运行时出现不必要的错误；

4)、Intel MPI软件

在安装Intel MPI软件时，首先要创建machines.LINUX文件，在该文件中加入所有节点，这样在安装时可以避免每个节点进行安装。在MPI安装完成后，需要进行MPI的测试，启动MPD，配置mpd.host文件，确保MPI运行成功；

5)基准测试软件pwscf

a)、运行下列命令

/configure ARCH＝ia32 MPIF90＝mpiifort LIBDIRS＝”/opt/intel/mkl/9.1.023/lib/32/usr/lib/math”注意不同的版本可能命令参数不太一样；

b)、设置环境intel编译器，mkl库，mpi环境变量；

c)、编译

使用命令make all；

d)、编译成功进行测试；

6)测试

在测试时，利用MPI的工作原理来控制参与运算的CPU核数，从而得到不同的核数计算相同的元素所需要的CPU时间，进而计算出CPU的加速比。加速比定义为串行算法在单CPU上的运行时间与并行算法在多CPU上的运行时间之比，加速比可以告诉我们性能是否与核心数目的增长同步；

测试时，先要启动mpdboot，如果是集群时需要把所有节点全部启动，mpdboot启动成功后，再运行mpiexe进行测试；

例如：a)启动单个节点

Mpdboot-n1

其中n表示启动的节点数

b)、运行1个核心

mpiexec-n 1 bin/pw.x<mgal2o4-cf.scf.in

其中n表示参与运算的核数pw.x为可执行档，mgal2o4-cf.scf.in包含有相应的配置信息和待计算的元素；

c)、运行2个核心

mpiexec-n 2 bin/pw.x<mgal2o4-cf.scf.in

d)、运行4个核心

mpiexec-n 4 bin/pw.x<mgal2o4-cf.scf.in

测试完成，进行数据的收集；

7)测试数据的收集

数据的收集分为两类：

a)、系统性能数据

系统性能数据主要收集CPU和内存的信息，使用TOP或者VMSTAT命令；

b)、CPU运行数据

CPU运行数据主要是收集cpu time和wall time这两项数据；

8)测试数据的整理

测试数据的整理主要是将数据进行标准化，以便于用户分析。我们主要是借助于excel进行分析。由于测试的次数比较多，收集的数据量比较大，容易造成混淆，可以采用便于记忆的命名规范进行，譬如以参与运算的核数进行命名等。根据系统性能数据的分析，我们可以判定CPU在当前基准下是否运行处于饱和状态。根据cpu time和wall time数据我们计算CPU的加速比。整理后的测试数据应该包括如下内容：硬件信息(CPU，内存，硬盘)，软件信息(应用软件，操作系统)，负载量，编译信息，CPU Time，加速比等。