WO2021098257A1

WO2021098257A1 - 一种基于异构计算平台的业务处理方法

Info

Publication number: WO2021098257A1
Application number: PCT/CN2020/103650
Authority: WO
Inventors: 赵雅倩; 朱效民
Original assignee: 浪潮电子信息产业股份有限公司
Priority date: 2019-11-24
Filing date: 2020-07-23
Publication date: 2021-05-27
Also published as: CN110990151A

Abstract

一种基于异构计算平台及其业务处理方法、装置和主核，该方案可以在一个统一的计算框架下，在业务处理过程中仅启动、结束线程一次，避免频繁线程启动关闭导致的开销，提高异构计算的效率；而且，利用主从核通信框架与同步机制，实现了主从核之间计算进度的通信，从而保证主核在从核计算完成后才进行下一步的操作，保证从核在不同的时刻启动对应的从核计算模块执行相应的计算操作，保证了计算的正确性。

Description

一种基于异构计算平台的业务处理方法

本申请要求于2019年11月24日提交中国专利局、申请号为201911161201.9、发明名称为“一种基于异构计算平台的业务处理方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别涉及一种基于异构计算平台及其业务处理方法、装置和主核。

背景技术

利用大型超级计算机进行仿真和模拟，是支撑科学研究工作的展开的一种重要的甚至不可替代的方法，计算模拟与仿真已经成为科学研究的第三范式。

近几年，随着诸多应用对计算速度的更高要求，具有更强浮点计算能力的加速器成为构建超级计算机的重要部件。通过将原来在传统CPU上运行的计算密集型部分卸载到专门为提高计算速度而设计的加速器上，以提高应用的计算速度。典型的加速器包括GPU、国产SW26010等。

为了充分利用这些加速部件的计算性能，一般需要将传统的在CPU上运行的计算密集型部分移植到众核架构上去，其中最高效的方法为利用加速器支持的库进行编程、编译、运行，如GPU支持的CUDA、SW26010支持的Athread等。目前的编程方法是在对应的计算密集型模块位置，利用对加速器函数的调用，完成将计算部分卸载到加速器的目标。待到计算完成后，也就是从调用的函数返回后，主核CPU继续进行非计算密集型的部分，比如通信等。

但是，一般情形下，一个应用中涉及的计算密集型模块不是单一，且这些计算模块并不是连续的，计算模块之间需要CPU进行诸如通信等事务处理，这也就导致对每一个模块都需要进行线程的启动，然后经过从核计算后，线程结束，返回主进程。线程相关的启停等开销并非总是可以忽略不计的，尤其是在数据量较少且计算访存比较低(即单个数据导致的计算量较少)的情形下，计算带来的额外的收益并不明显，线程相关的开销导致的计算性能提升并不明显，因此有必要针对线程开销进行优化。

基于上述对线程相关开销的分析，以及在实际移植优化ROMS过程中的实际性能测试与分析，可以看出，线程开销会导致异构计算加速不够理想。而目前，大多数的应用移植只考虑在计算层面的优化，对于这种系统层面的开销，并没有相关的公开可见的方法。

可见，如何避免异构计算加速系统在业务处理过程中的线程开销，提升系统性能，是亟待本领域技术人员解决的问题。

发明内容

本申请的目的是提供一种基于异构计算平台及其业务处理方法、装置和主核，用以解决传统的异构计算加速系统在业务处理过程中受到线程开销的影响，导致系统性能较低的问题。其具体方案如下：

第一方面，本申请提供了一种基于异构计算平台的业务处理方法，应用于主核，包括：

在开始执行当前任务时，控制从核启动目标线程；

在达到所述当前任务的预设执行状态时，生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。

优选的，所述在达到所述当前任务的预设执行状态时，生成调度信息之前，还包括：

在共享存储空间分配共享内存，以存储所述当前任务执行过程中的所述调度信息和所述计算进度信息。

优选的，在所述在共享存储空间分配共享内存之后，还包括：

在所述共享内存设置第一共享变量和第二共享变量，并对所述第一共享变量和所述第二共享变量进行初始化，其中所述第一共享变量用于存储所述调度信息，所述第二共享变量用于存储所述计算进度信息。

优选的，所述生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，包括：

将所述第一共享变量赋值为目标计算模块的标识信息，以作为调度信息，以便于所述从核利用所述目标线程根据所述调度信息调用所述目标计算模块执行相应的计算操作。

优选的，所述在所述计算进度信息为计算完成时，继续执行所述当前任务，包括：

每隔预设时长，查询所述第二共享变量，直至所述计算进度信息为计算完成时，继续执行所述当前任务。

优选的，所述在达到所述当前任务的预设执行状态时，生成调度信息之后，还包括：

以显示通信的方式，将所述调度信息传递至所述从核。

优选的，包括多种任务类型的从核，所述在达到所述当前任务的预设执行状态时，生成调度信息，包括：

在达到所述当前任务的预设执行状态时，根据任务类型生成对目标从核的调度信息。

第二方面，本申请提供了一种基于异构计算平台的业务处理装置，应用于主核，包括：

线程启动模块：用于在开始执行当前任务时，控制从核启动目标线程；

调度模块：用于在达到所述当前任务的预设执行状态时，生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

线程关闭模块：用于在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。

第三方面，本申请提供了一种异构计算平台的主核，包括：

存储器：用于存储计算机程序；

处理器：用于执行所述计算机程序，以实现如上所述的一种基于异构计算平台的业务处理方法的步骤。

第四方面，本申请提供了一种异构计算平台，包括：主核和从核；

所述主核用于在开始执行当前任务时，控制从核启动目标线程；在达到所述当前任务的预设执行状态时，生成调度信息；

所述从核用于利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

所述主核用于在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。

本申请所提供的一种基于异构计算平台的业务处理方法，应用于主核，包括：在开始执行当前任务时，控制从核启动目标线程；在达到当前任务的预设执行状态时，生成调度信息，以便于从核利用目标线程根据调度信息执行相应的计算操作，并生成计算进度信息；在计算进度信息为计算完成时，继续执行当前任务，直至当前任务执行结束时控制从核关闭所述目标线程。

可见，该方法可以在一个统一的计算框架下，仅启动、结束线程一次，避免频繁线程启动关闭导致的开销，提高异构计算的效率；而且，通过设计主从核通信框架与同步机制，实现了主从核之间计算进度的通信，从而保证主核在从核计算完成后才进行下一步的操作，保证从核在不同的时刻启动对应的从核计算模块执行相应的计算操作，也就保证了计算的正确性。

此外，本申请还提供了一种基于异构计算平台的业务处理装置、主核和异构计算平台，其技术效果与上述方法的技术效果相对应，这里不再赘述。

附图说明

为了更清楚的说明本申请实施例或现有技术的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请所提供的一种基于异构计算平台的业务处理方法实施例一的实现流程图；

图2为本申请所提供的一种基于异构计算平台的业务处理方法实施例二的实现流程图；

图3为本申请所提供的一种基于异构计算平台的业务处理装置实施例的功能框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为保证计算性能，主核在计算密集型模块位置(一般而言是代码层的for循环)利用对加速器函数的调用，完成将计算部分卸载到加速器的目标；待到计算完成后，也就是从调用的函数返回后，主核CPU继续进行非计算密集型的部分。但是，一般情形下，应用中涉及的计算密集型模块不是单一(如海洋模式ROMS的step2d模块中，有超过50个这样的for循环模块)，且这些计算模块并不是连续的，所以需要频繁的启动和关闭线程，使计算性能受到影响。

针对上述问题，本申请提供一种基于异构计算平台及其业务处理方法、装置和主核，面对异构计算中多个不连续模块卸载到加速器中这一场景，该方案可以在一个统一的计算框架下，仅启动、结束线程一次，避免频繁线程启动关闭导致的开销，提高异构计算的效率。

下面对本申请提供的一种基于异构计算平台的业务处理方法实施例一进行介绍，参见图1，实施例一应用于主核，包括：

S101、在开始执行当前任务时，控制从核启动目标线程；

S102、在达到所述当前任务的预设执行状态时，生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

上述预设执行状态具体可以为执行到某个计算模块，或者达到某个时间节点。

S103、在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。

本实施例中，就异构计算平台的系统框架而言，采用主从异构计算模式。具体的，主核在计算密集型部分通过调用从核完成对应的计算划分，从核完成分配的计算任务返回，然后主核继续执行从核无需参与的非密集计算部分，诸如通信等事务。从核计算结束后不停止，而是进行阶段性状态查询，查询到需要启动下一阶段计算时，即启动下一次的计算。按照上述方式，循环反复，直到所有的需要卸载到从核的计算都完成时，即通知从核停止等待下一步的计算，从核则返回，计算阶段完成。

需要说明的是，本实施例中主核对从核的函数调用并非显式的，而是通过主从核之间的通信及共享实现的。主核监测从核状态，从核端则针对所有的计算密集型部分，分别以从核支撑的库实现对应的计算，如GPU支持的CUDA(Compute Unified Device Architecture，统一计算设备架构)，SW26010(申威26010)支持的Athread(SW26010处理器支持的线程库)等。

为了实现主核获取从核计算进度消息，从而决定是否启动下一步的计算及事务处理，以及从核获取到主核的调度信息，从而决定启动对应的计算，需要设计主从核之间的通信机制。

本实施例中，就异构计算平台的主从核通信机制而言。主从核之间的通信可以通过两种方法实现。一是隐式通信，即主从核之间有可以直接访问的共享内存，通过对共享变量的赋值和取值操作，实现通信。需要注意的是，以该方式实现通信时，需要对变量进行设置，防止其在缓存中进行操作，而是直接对变量进行读写。二为显式通信，即主从核之间没有可以共享的内存，或者需要通信的数据量较大，可以通过主从核可访问存储区域之间的显式通信实现主从核之间的消息交换。

本实施例中，就异构计算平台的主核同步保证机制而言，在主核调用从核进行计算时，需要确保所有的从核都已经计算完成，然后才进行下一步的流程。在前文提及的主从核通信机制的基础上，可以通过由主核查询所有从核的计算状态对应的变量实现，也就是当所有变量被从核都设置完成后，主核即可进行下一步的流程。从核在计算完成当前的模块后，需要对对应的属于当前从核的变量进行设置。而且，主核在获取到所有从核对应的变量都已经被设置，从而进行下一步流程时，要对所有变量进行复原，从而使得下一个计算模块可以复用这些变量进行状态的更新。

本实施例中，就异构计算平台的从核启动计算机制基于前述主从核通信机制实现。具体的，从核每当完成一个计算模块时，并不立即启动下一个计算模块，而是等待主核计算状态的更新，即主核需要从核启动对应的计算时才进行下一个模块的计算。具体实现则由从核利用通信或共享机制，实现对主核计算状态的查询，在对应的计算模块变量被设置后，即进行对应模块的计算。

综上，本实施例所提供一种基于异构计算平台的业务处理方法，应用于主核，该方法可以在一个统一的计算框架下，仅启动、结束线程一次，避免频繁线程启动关闭导致的开销，提高异构计算的效率；而且，通过设计主从核通信框架与同步机制，实现了主从核之间计算进度的通信，从而保证主核在从核计算完成后才进行下一步的操作，保证从核在不同的时刻启动对应的从核计算模块执行相应的计算操作，也就保证了计算的正确性。

下面开始详细介绍本申请提供的一种基于异构计算平台的业务处理方法实施例二，实施例二基于前述实施例一实现，并在实施例一的基础上进行了一定程度上的拓展。

参见图2，实施例二具体应用于主核，包括：

S201、在共享存储空间分配共享内存，以存储所述当前任务执行过程中的所述调度信息和所述计算进度信息；

S202、在所述共享内存设置第一共享变量和第二共享变量，并对所述第一共享变量和所述第二共享变量进行初始化，其中所述第一共享变量用于存储所述调度信息，所述第二共享变量用于存储所述计算进度信息；

S203、在开始执行当前任务时，控制从核启动目标线程；

S204、将所述第一共享变量赋值为目标计算模块的标识信息，以作为调度信息，以便于所述从核利用所述目标线程根据所述调度信息调用所述目标计算模块执行相应的计算操作，并生成计算进度信息；

具体的，本实施例的异构计算平台包括多种任务类型的从核，在达到所述当前任务的预设执行状态时，主核根据具体的任务类型生成对目标从核的调度信息。

S205、在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。

需要说明的是，本实施例以异构计算平台支持共享存储的情形为例进行说明，当系统支持共享内存时，由主核来开辟并管理共享内存空间。在实际应用场景中，若不支持共享存储，则分别在各自的存储空间中开辟空间，后续的数据访问则非直接访问而是显式的数据传输。

下面分别就本实施例中异构计算平台的主从核异构计算框架、主从核通信机制、主核计算调度机制、从核计算同步机制进行说明。

对于主从核异构计算框架，主要包括：主核端在计算密集部分通过调用从核函数进行实现，并不进行显式的函数调用，而是由从核主动探测主核执行状态自主启动计算，计算完成后设置对应的计算进度信息，主核根据所有从核的计算进度信息设置再启动下一步的计算。从核针对不同的计算密集型模块，分别完成对应的计算任务。在从核编码实现方面，利用从核支持的库，针对各个计算密集型子模块，分别实现对应的计算模块的从核代码。对于主核的编码实现，针对卸载需要到从核的计算密集型部分，预先在主核执行代码中删除对应的部分。

对于主从核通信机制，主要包括：在共享存储空间中开辟空间，分别存储主核的计算状态和各从核的计算状态。具体的，主核的计算状态可以以一个整数代表即将启动的计算模块，由主核进行设置，从核进行查询；从核的计算状态用于表示各从核是否完成主核要求的计算，由从核进行设置，主核进行查询。

对于主核计算调度机制，主要包括：

存储空间初始化。对于分配的主核计算状态空间，初始化设置为-1，即从核查询为-1，不启动任何计算模块；对于分配的从核计算状态空间，初始化设置为-1，即从核尚未进行任何计算；

数据设置。当主核代码到达计算密集型模块时，将值设置为对应计算模块的ID(为不同的整数)，供从核进行查询；

数据查询。当主核设置完供从核访问的模块ID后，即对由从核设置的计算状态进行查询，从而获取到从核是否已经完成该计算模块，若已经完成，则继续代码执行；否则，循环等待，直到所有的从核都已经完成对应的计算。

对于从核计算同步机制，主要包括：

启停代码添加。即在从核代码所有的计算模块前，启动线程。在最后一个计算模块的末尾，添加线程停止的代码，从而使得整个计算过程中，线程只启动、停止一次；

从核数据查询。即从核直接查询共享存储的状态(或者发起数据传输)，查询主核设置的ID后，即启动对应ID的从核计算；

从核数据设置。从核计算完成后，即对该从核对应的存储位置的状态进行设置，使得主核可以查询该状态获取到从核的计算已经完成。

综上，本实施例提供的一种基于异构计算平台的业务处理方法，可以以共享内存或显式通信的方式实现主从核之间的通信，实现主从核的计算状态设置与查询，从而可以在对应的时刻启动计算任务，在计算任务完成后启动通信等流程，实现整体计算的同步，保证计算的正确；而这些并不以多次启停线程为代价，从而可以以较小代价的数据通信，避免传统异构计算模式中线程多次启停的额外开销，提高异构计算的加速比与效率。

可见，本实施例面向异构计算，如GPU、SW26010等，设计异构计算框架，通过主从核的通信机制，在主核端确保各计算模块按序进行，在加速器端确保在对应的时刻启动对应的计算子模块，保证异构计算的正确性，提高异构计算的效率。

下面对本申请实施例提供的一种基于异构计算平台的业务处理装置进行介绍，下文描述的一种基于异构计算平台的业务处理装置与上文描述的一种基于异构计算平台的业务处理方法可相互对应参照。

如图3所示，本实施例的业务处理装置，应用于主核，包括：

线程启动模块301：用于在开始执行当前任务时，控制从核启动目标线程；

调度模块302：用于在达到所述当前任务的预设执行状态时，生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

线程关闭模块303：用于在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。

本实施例的一种基于异构计算平台的业务处理装置用于实现前述的一种基于异构计算平台的业务处理方法，因此该装置中的具体实施方式可见前文中的一种基于异构计算平台的业务处理方法的实施例部分，例如，线程启动模块301、调度模块302、线程关闭模块303，分别用于实现上述一种基于异构计算平台的业务处理方法中步骤S101，S102，S103。所以，其具体实施方式可以参照相应的各个部分实施例的描述，在此不再展开介绍。

另外，由于本实施例的一种基于异构计算平台的业务处理装置用于实现前述的一种基于异构计算平台的业务处理方法，因此其作用与上述方法的作用相对应，这里不再赘述。

此外，本申请还提供了一种异构计算平台的主核，包括：

存储器：用于存储计算机程序；

处理器：用于执行所述计算机程序，以实现如上文所述的一种基于异构计算平台的业务处理方法的步骤。

最后，本申请提供了一种异构计算平台，包括：主核和从核；

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的方案进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种基于异构计算平台的业务处理方法，其特征在于，应用于主核，包括：

在开始执行当前任务时，控制从核启动目标线程；

在达到所述当前任务的预设执行状态时，生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。
如权利要求1所述的方法，其特征在于，所述在达到所述当前任务的预设执行状态时，生成调度信息之前，还包括：

在共享存储空间分配共享内存，以存储所述当前任务执行过程中的所述调度信息和所述计算进度信息。
如权利要求2所述的方法，其特征在于，在所述在共享存储空间分配共享内存之后，还包括：

在所述共享内存设置第一共享变量和第二共享变量，并对所述第一共享变量和所述第二共享变量进行初始化，其中所述第一共享变量用于存储所述调度信息，所述第二共享变量用于存储所述计算进度信息。
如权利要求3所述的方法，其特征在于，所述生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，包括：

将所述第一共享变量赋值为目标计算模块的标识信息，以作为调度信息，以便于所述从核利用所述目标线程根据所述调度信息调用所述目标计算模块执行相应的计算操作。
如权利要求3所述的方法，其特征在于，所述在所述计算进度信息为计算完成时，继续执行所述当前任务，包括：

每隔预设时长，查询所述第二共享变量，直至所述计算进度信息为计算完成时，继续执行所述当前任务。
如权利要求1所述的方法，其特征在于，所述在达到所述当前任务的预设执行状态时，生成调度信息之后，还包括：

以显示通信的方式，将所述调度信息传递至所述从核。
如权利要求1-6任意一项所述的方法，其特征在于，包括多种任务类型的从核，所述在达到所述当前任务的预设执行状态时，生成调度信息，包括：

在达到所述当前任务的预设执行状态时，根据任务类型生成对目标从核的调度信息。
一种基于异构计算平台的业务处理装置，其特征在于，应用于主核，包括：

线程启动模块：用于在开始执行当前任务时，控制从核启动目标线程；

调度模块：用于在达到所述当前任务的预设执行状态时，生成调度信息，以便于所述从核利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

线程关闭模块：用于在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。
一种异构计算平台的主核，其特征在于，包括：

存储器：用于存储计算机程序；

处理器：用于执行所述计算机程序，以实现如权利要求1-7任意一项所述的一种基于异构计算平台的业务处理方法的步骤。
一种异构计算平台，其特征在于，包括：主核和从核；

所述主核用于在开始执行当前任务时，控制从核启动目标线程；在达到所述当前任务的预设执行状态时，生成调度信息；

所述从核用于利用所述目标线程根据所述调度信息执行相应的计算操作，并生成计算进度信息；

所述主核用于在所述计算进度信息为计算完成时，继续执行所述当前任务，直至所述当前任务执行结束时控制所述从核关闭所述目标线程。