CN103049329A

CN103049329A - 一种基于cpu/mic异构体系结构的高效能系统

Info

Publication number: CN103049329A
Application number: CN2012104758480A
Authority: CN
Inventors: 张清; 张广勇
Original assignee: Inspur Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2012-11-22
Filing date: 2012-11-22
Publication date: 2013-04-17

Abstract

本发明提供了一种基于CPU/MIC异构体系结构的高效能系统，涉及到计算机高性能计算领域。本发明的整个系统设计包括三个方面：硬件部分设计、系统环境配置及软件部分设计；该系统实现软硬件一体化设计，采用CPU/MIC异构体系结构，融合了CPU平台的多核计算能力与MIC的众核计算能力，其中CPU参加逻辑计算和密集核心计算，而MIC仅参与核心密集计算，通过CPU与MIC共同计算，实现性能最大化。本发明的有益效果是：该系统通过CPU与MIC协同计算，解决了高性能计算应用的性能瓶颈和功耗问题，具有高性能、低功耗的特点，且降低了机房构建成本和管理、运行、维护费用。

Description

一种基于CPU/MIC异构体系结构的高效能系统

技术领域

本发明涉及高性能计算领域，具体地说是一种基于CPU/MIC异构体系结构的

高效能系统。

背景技术

高性能计算是信息领域的前沿高技术，随着信息化社会的飞速发展，人类对信息处理能力的要求越来越高，不仅石油勘探、气象预报、航天国防、科学研究等需求高性能计算，而金融、政府信息化、教育、企业、网络游戏等更广泛的领域对高性能计算的需求迅猛增长。

计算速度对于高性能计算尤为重要，高性能计算将朝多核、众核发展，采用异构并行提升应用计算速度，目前CPU+GPU是非常成熟的异构协同计算模式，但由于GPU在编程效率、细粒度并行算法、大规模并行性能上都存在巨大挑战。

MIC（Many Integrated Core)是Intel公司开发的，用于高性能并行计算的众核芯片。它是从已有的Xeon处理器产品基础上发展而来，它专为超高性能计算而生的新架构。MIC在计算机体系中，作为CPU的协处理器而存在。MIC芯片通常有50个以上精简的x86核心，每个core支持4个硬件线程，可并行执行的任务数达到200以上，提供高度并行的计算能力，其双精峰值性能达到1TFlops。MIC技术将加快高性能计算的发展，快速解决高性能计算应用的性能瓶颈。

发明内容

本发明鉴于现有计算机异构并行提升效能中存在的不足之处，及MIC众核芯片具有高性能并行计算的特点，提供一种基于CPU/MIC异构体系结构的高效能系统。

本发明所提出的系统针对高性能计算应用，采用CPU/MIC异构体系结构，融合了CPU平台的多核计算能力与MIC的众核计算能力，解决了高性能计算应用的性能瓶颈。该系统是按如下方式解决所述技术问题的：整个系统设计包括三个方面：硬件部分设计、系统环境配置及软件部分设计；该系统实现软硬件一体化设计，采用CPU/MIC异构体系结构，其中CPU参加逻辑计算和密集核心计算，而MIC仅参与核心密集计算，通过CPU与MIC共同计算，实现性能最大化。

下面对该系统的组成部分分别进行说明：

（1）硬件部分设计

a) 系统的每个节点采用双路，能支持两块CPU同时工作；

b) 系统带有两个以上PCIE插槽，能插两块MIC卡；

c) 系统的内存配置要大，是原有CPU系统的2倍以上；

d) 系统的每个节点功耗能支持1300w以上；

（2）系统环境配置

a) 操作系统能支持MIC，需要安装Linux操作系统；

b) 编译器能支持MIC，采用Intel的icc、icpc、ifort编译器；

c) 支持MIC的驱动；

（3）软件部分设计

a) 选择高性能计算应用算法；

b) 对原有应用分析，若原有程序实现是采用单线程运行在CPU平台，则首先利用CPU多核平台，采用OpenMP编程模型把应用程序以多线程方式实现；

c) 然后在CPU多线程程序基础上在MIC卡上实现线程扩展，采用120个线程并行，使其在MIC上并行执行；

d) 把整个系统的计算能力划分为3个设备：第一块MIC卡作为设备0，第二块MIC卡作为设备1，两块CPU作为设备2；

e) 把整个计算任务按照这三个设备的计算能力进行划分，使三个设备同时并行计算，实现CPU与MIC同时计算，并保证负载均衡。

本发明的一种基于CPU/MIC异构体系结构的高效能系统的有益效果是：该系统通过CPU与MIC协同计算，解决了高性能计算应用的性能瓶颈和功耗问题，具有高性能、低功耗的特点，且降低了机房构建成本和管理、运行、维护费用。

附图说明

附图1为本发明所述系统的计算设备划分示意图。

具体实施方式

为了使本发明的目的、技术方案更加清晰，下面结合附图和实施例，对本发明作进一步详细说明。

本发明的目的在于利用CPU/MIC异构体系结构实现一种高效能系统，整个系统设计主要由硬件部分设计、系统环境配置及软件部分设计三部分组成。该系统通过实现软硬件一体化设计，采用CPU/MIC异构体系结构，融合了CPU平台的多核计算能力与MIC的众核计算能力，其中CPU参加逻辑计算和密集核心计算，而MIC仅参与核心密集计算，CPU与MIC共同计算，实现性能最大化。

下面对本发明的整个系统设计的各个部分进行说明：

（1）硬件部分设计

a) 系统的每个节点采用双路，支持两块CPU同时工作；

b) 系统带有两个以上PCIE插槽，能够插两块MIC卡；

c) 系统的内存配置要大，是原有CPU系统的2倍以上；

d) 系统的每个节点功耗支持1300w以上；

（2）系统环境配置

d) 操作系统要求支持MIC，需要安装Linux操作系统；

e) 编译器支持MIC，采用Intel的icc、icpc、ifort编译器；

f) 支持MIC的驱动；

（3）软件部分设计

此系统要实现高效，必须软硬件一体化设计，让应用软件运行跑在此系统上效率最高，整个软件部分设计如下：

a) 选择高性能计算应用算法，此算法有高并行任务，并行任务之间数据无依赖，并行性好，整个应用对系统性能要求高；

b) 对原有应用分析，当原有程序实现是采用单线程运行在CPU平台上时，则首先利用CPU多核平台；采用OpenMP编程模型把应用程序以多线程方式实现，使其两块CPU的所有核的计算能力全部发挥出来；

c) 然后在CPU多线程程序基础上在MIC卡上实现线程扩展，采用120各线程并行，使其在MIC上并行执行，发挥出MIC众核的计算能力；

d) 把整个系统的计算能力划分为3个设备：第一块MIC卡作为设备0，第二块MIC卡作为设备1，两块CPU作为设备2；如图1所示；

e) 把整个计算任务按照这三个设备的计算能力进行划分，使三个设备同时并行计算，实现CPU与MIC同时计算，并保证负载均衡，整个系统实现高性能。

实施例：

下面通过一个实施例来详细说明该高效能系统的技术特点和优点。该实施例中高效能系统如下设计。

（1）硬件部分设计

a) 系统的每个节点采用双路，支持两块CPU同时工作，本实施过程系统采用2块intel Xeon56756核CPU，主频为3.07GHz；

b) 系统带有两个以上PCIE插槽，能够插2块MIC卡，本系统采用2块MIC卡，每个卡上有30个核心；

c) 系统的内存配置要大，本系统每个节点配置96GB内存；

d) 系统的每个节点功耗支持1300w以上，保证整个系统正常运转，本系统最大功率支持1300w。

（2）系统环境配置

a) 操作系统要求支持MIC，本实施过程采用Red Hat Enterprise Linux 6.0 GA 64-bit kernel 2.6.32-71；

b) 编译器支持MIC，采用Intel编译器l_ccompxe_2013_beta.0.047；

c) 支持MIC的驱动，采用KNC-AlphaUpdate1-2.1.2430-9。

（3）软件部分设计

a) 选择地震叠前时间偏移（PSTM）作为我们应用的实施的高性能计算应用，此应用算法的并行任务达到几十万，并行任务之间数据无依赖，并行性好，其对性能要求高；

b) 原有PSTM程序以单线程运行在CPU平台，首先利用CPU多核平台，采用OpenMP编程模型把它以多线程方式实现，把所用计算任务采用16个线程并行起来，使2块CPU的所有核的计算能力全部发挥出来；

c) 然后在PSTM CPU多线程并行程序基础上在MIC卡上实现线程扩展，把所有计算任务数采用120个线程并行起来，使其在MIC上并行执行，发挥出MIC众核的计算能力；

d) 把整个系统的计算能力划分为3个设备，第一块MIC卡作为设备0，启动120个线程，第二块MIC卡作为设备1，启动120个线程，2块CPU作为设备2，启动16个线程；如附图1所示；

e) 把整个PSTM的计算任务按照这三个设备的计算能力进行划分，使三个设备同时并行计算，即这256个线程会共同参与计算，达到CPU与MIC同时计算的效果，并且保证负载均衡，整个系统实现高性能。

（4）性能及正确性测试

测试91条测线，每条测线上963个CMP点，输入110000道数据进行偏移，在原有CPU同构系统下，PSTM以单线程串行方式花费的时间为76053s，而本系统运行时间为1075s，性能大大提升。CPU串行版PSTM运行的效果与本系统运行的效果基本一致，运行结果正确。

从实施例可以看出整个系统实现高性能、低功耗，大大满足了高性能应用的科研要求和工业生产要求，并且减少了机房构建成本和管理、运行、维护费用。

除说明书所述技术特征之外，均为本专业技术人员的已知技术。

Claims

1.一种基于CPU/MIC异构体系结构的高效能系统，其特征在于整个系统设计包括三个方面：硬件部分设计、系统环境配置及软件部分设计；

该系统实现软硬件一体化设计，采用CPU/MIC异构体系结构，融合了CPU平台的多核计算能力与MIC的众核计算能力，其中CPU参加逻辑计算和密集核心计算，而MIC仅参与核心密集计算，通过CPU与MIC共同计算，实现性能最大化。

2.根据权利要求1所述的高效能系统，其特征在于所述硬件部分设计如下：

系统的每个节点采用双路，能支持两块CPU同时工作；

系统带有两个以上PCIE插槽，能插两块MIC卡；

系统的内存配置要大，是原有CPU系统的2倍以上；

系统的每个节点功耗能支持1300w以上。

3.根据权利要求1所述的高效能系统，其特征在于所述系统环境配置如下：

操作系统能支持MIC，需要安装Linux操作系统；

编译器能支持MIC，采用Intel的icc、icpc、ifort编译器；

支持MIC的驱动。

4.根据权利要求1所述的高效能系统，其特征在于所述软件部分设计如下：

选择高性能计算应用算法；

对原有应用分析，若原有程序实现是采用单线程运行在CPU平台，则首先利用CPU多核平台，采用OpenMP编程模型把应用程序以多线程方式实现；

然后在CPU多线程程序基础上在MIC卡上实现线程扩展，采用120个线程并行，使其在MIC上并行执行；

把整个系统的计算能力划分为3个设备：第一块MIC卡作为设备0，第二块MIC卡作为设备1，两块CPU作为设备2；

把整个计算任务按照这三个设备的计算能力进行划分，使三个设备同时并行计算，实现CPU与MIC同时计算，并保证负载均衡。