CN109857562A

CN109857562A - 一种众核处理器上访存距离优化的方法

Info

Publication number: CN109857562A
Application number: CN201910112849.0A
Authority: CN
Inventors: 张瑞; 田密
Original assignee: Beijing Institute of Technology BIT; Yanan University
Current assignee: Beijing Institute of Technology BIT; Yanan University
Priority date: 2019-02-13
Filing date: 2019-02-13
Publication date: 2019-06-07

Abstract

本发明公开了一种众核处理器上访存距离优化的方法，包括生成内核间的流水线调度表、根据内核间的流水线调度表进行众核处理器上访存距离优化、通信优化，生成内核间的流水线调度表的步骤具体为：首先，对同步数据流图进行进程级任务划分，确定每个计算任务分配到的对应集群节点；其次，对集群节点内的同步数据流图中的任务进行线程级任务划分，确定每个计算任务分配到的对应集群节点内的处理核，本发明针对众核处理器内部的缓存的使用进行了优化，提高数据访问的局部性和缓存利用率，增强程序的运行效率。

Description

一种众核处理器上访存距离优化的方法

技术领域

本发明涉及计算机编译领域，尤其是涉及一种众核处理器上访存距离优化的方法。

背景技术

数据运营和处理能力已成为一个企业乃至国家的核心竞争力，在中国，云计算、物联网、三网融合、宽带提速等等重大战略布局空前提速，又进一步扩大并深化了数据爆炸的范围和影响，从而加剧了对网络高性能、高稳定性的进一步需求。作为数据通信网的核心，路由器设备成为制约数据业务表现的关键要素；尤其是数据集中的云计算应用日益升温，对高端核心路由器的需求也与日俱增。众核是一个兼顾了性能和灵活性的产品，在路由器架构方面众核是未来的主流选择。

目前对于众核处理器上访存效率优化存在缺陷，造成各个核心之间存在过度相互独立的情况，使得整体的访存效率较差。

发明内容

本发明为克服上述情况不足，旨在提供一种能解决上述问题的技术方案。

一种众核处理器上访存距离优化的方法，包括生成内核间的流水线调度表、根据内核间的流水线调度表进行众核处理器上访存距离优化、通信优化；

生成内核间的流水线调度表的步骤具体为：首先，对同步数据流图进行进程级任务划分，确定每个计算任务分配到的对应集群节点；其次，对集群节点内的同步数据流图中的任务进行线程级任务划分，确定每个计算任务分配到的对应集群节点内的处理核；然后采用多层K路图划分算法对各个集群节点内部的计算单元进行初始划分；随后采用复制分裂算法对负载大的计算单元进行分裂，降低计算单元的粒度；最后，重新使用多层K路图划分算法对经过分裂后的图进行划分，保证处理核上的负载均衡和良好的局部性；

对数据流图中的结点进行拓扑排序，形成拓扑序列；其次，对拓扑序列中的每个节点将其结点的阶段号初始化为 0，然后，判断其与前驱结点是否在同一个处理核上，如果在，那么它与前驱节点的阶段相同，如果不在，那么其阶段号比前驱结点阶段号大 2，数据传输操作（DTA）的阶段号比前驱结点大 1，通过遍历整个拓扑序列，对所有结点和数据传输操作（DTA）进行阶段号赋值。

所述的众核处理器上访存距离优化步骤具体为：首先，计算流水线运行所需要的存储容量；然后，根据众核处理器上的层次性存储结构，将计算任务所需的数据进行优化分配，将尽可能多次访问的数据分配到片上便笺式存储器，溢出数据放在主存；最后，对软件流水调度中分配在主存的数据拷贝操作进行消除。

作为本发明进一步的方案：所述进行优化分配的具体过程为：首先，为每个处理核统计所分配到的所有缓冲区的总缓存容量，其中，如果两个计算任务节点分配到了同一个处理核上，两个计算任务节点之间缓冲区分配到该处理器上；其次，找出总缓存容量超出片上便笺式存储器容量的所有处理核，并对分配到其上的所有缓冲区按其缓存容量从大到小挑出分配到主存，直到该处理器的便笺式存储器容量能够容下所有剩下的所有缓冲区总缓存容量为止。

作为本发明进一步的方案：所述通信优化步骤中，采用模拟退火的方法确定通信量最小的映射方式，具体为：随机选择两个虚拟处理核并交换它们所对应的物理核，得到的映射状态即为当前映射状态的下一个映射状态；以模拟退火的指数退避函数作为概率接受函数，用以判断所述扰动函数生成的映射状态是否会被接受；确定代价函数，用于计算每一种映射状态下的通信和同步开销代价。

本发明的有益效果：本发明针对众核处理器内部的缓存的使用进行了优化，提高数据访问的局部性和缓存利用率，增强程序的运行效率。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中，一种众核处理器上访存距离优化的方法，包括生成内核间的流水线调度表、根据内核间的流水线调度表进行众核处理器上访存距离优化、通信优化；

所述进行优化分配的具体过程为：首先，为每个处理核统计所分配到的所有缓冲区的总缓存容量，其中，如果两个计算任务节点分配到了同一个处理核上，两个计算任务节点之间缓冲区分配到该处理器上；其次，找出总缓存容量超出片上便笺式存储器容量的所有处理核，并对分配到其上的所有缓冲区按其缓存容量从大到小挑出分配到主存，直到该处理器的便笺式存储器容量能够容下所有剩下的所有缓冲区总缓存容量为止。

所述通信优化步骤中，采用模拟退火的方法确定通信量最小的映射方式，具体为：随机选择两个虚拟处理核并交换它们所对应的物理核，得到的映射状态即为当前映射状态的下一个映射状态；以模拟退火的指数退避函数作为概率接受函数，用以判断所述扰动函数生成的映射状态是否会被接受；确定代价函数，用于计算每一种映射状态下的通信和同步开销代价。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

Claims

1.一种众核处理器上访存距离优化的方法，其特征在于，包括生成内核间的流水线调度表、根据内核间的流水线调度表进行众核处理器上访存距离优化、通信优化；

2.根据权利要求1所述的众核处理器上访存距离优化的方法，其特征在于，所述的众核处理器上访存距离优化步骤具体为：首先，计算流水线运行所需要的存储容量；然后，根据众核处理器上的层次性存储结构，将计算任务所需的数据进行优化分配，将尽可能多次访问的数据分配到片上便笺式存储器，溢出数据放在主存；最后，对软件流水调度中分配在主存的数据拷贝操作进行消除。

3.根据权利要求2所述的众核处理器上访存距离优化的方法，其特征在于，所述进行优化分配的具体过程为：首先，为每个处理核统计所分配到的所有缓冲区的总缓存容量，其中，如果两个计算任务节点分配到了同一个处理核上，两个计算任务节点之间缓冲区分配到该处理器上；其次，找出总缓存容量超出片上便笺式存储器容量的所有处理核，并对分配到其上的所有缓冲区按其缓存容量从大到小挑出分配到主存，直到该处理器的便笺式存储器容量能够容下所有剩下的所有缓冲区总缓存容量为止。

4.根据权利要求1所述的众核处理器上访存距离优化的方法，其特征在于，所述通信优化步骤中，采用模拟退火的方法确定通信量最小的映射方式，具体为：随机选择两个虚拟处理核并交换它们所对应的物理核，得到的映射状态即为当前映射状态的下一个映射状态；以模拟退火的指数退避函数作为概率接受函数，用以判断所述扰动函数生成的映射状态是否会被接受；确定代价函数，用于计算每一种映射状态下的通信和同步开销代价。