CN115480902A

CN115480902A - 关联周期任务的多核处理器节能调度方法、装置及介质

Info

Publication number: CN115480902A
Application number: CN202211177528.7A
Authority: CN
Inventors: 陈健; 赵振博; 邱实; 吴凡; 李化义
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2022-09-26
Filing date: 2022-09-26
Publication date: 2022-12-16

Abstract

本发明实施例公开了一种关联周期任务的多核处理器节能调度方法、装置及介质，该方法可以包括：将基于DAG建模的关联周期任务集映射到内核并选择工作电压/频率，采用拓扑排序算法重新计算每个任务的绝对截止期，以确定任务集映射的内核位置、调度顺序以及工作电压/频率的选择集合；通过DVFS调节工作电压/频率，生成初始化种群；根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解；基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解；根据最终最优解分配任务集的内核位置、调度顺序以及工作电压/频率，以获得最小化的系统能耗。

Description

关联周期任务的多核处理器节能调度方法、装置及介质

技术领域

本发明实施例涉及星务系统多核处理器节能调度领域，尤其涉及一种关联周期任务的多核处理器节能调度方法、装置及介质。

背景技术

星载计算机散热困难并且存在能量约束，需要考虑星务系统任务调度的能耗优化问题。关联周期任务集的节能实时调度是在给定系统模型的基础上，研究在任务集的超周期内，以系统能耗最优为指标，实现任务对处理器内核的映射以及电压/频率的选择，目前基于多核处理器的星务系统在任务调度问题上面临着诸多挑战并且现有节能调度算法均存在不同程度的能耗优化效果较差且不能兼顾系统总需求时间的问题。

发明内容

有鉴于此，本发明实施例期望提供一种关联周期任务的多核处理器节能调度方法、装置及存储介质，能够在保证关联周期任务实时性的条件下，利用动态电压/频率调节技术，得到系统能耗最小化的多核处理器内核与频率映射结果。

本发明实施例的技术方案是这样实现的：

第一方面，本发明实施例提供一种关联周期任务的多核处理器节能调度方法，包括：

将基于有向无环图建模的关联周期任务集映射到多核处理器内核并选择所述多核处理器内核的工作电压/频率，采用拓扑排序算法重新计算所述关联周期任务集中的每一个关联周期任务的最早开始执行时间、最晚开始执行时间以及绝对截止期，以确定所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合；

基于所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，通过DVFS调节所述多核处理器内核工作电压/频率，生成初始化种群；其中，所述初始化种群为关联周期任务集具有较低系统能耗与系统总需求时间的一组内核位置与电压/频率选择的集合；

根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解；

基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解，并将所述最终最优解作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，直至获得满足所述第一迭代条件时的最终最优解；

基于所述满足所述第一迭代停止条件时的最终最优解进行分配所述关联周期任务集的内核位置、调度顺序以及工作电压/频率的选择，以获得最小化的系统能耗和系统总需求时间。

第二方面，本发明实施例提供一种关联周期任务的多核处理器节能调度装置，所述装置包括：确定部分、调节部分、第一获取部分、第二获取部分、分配部分；其中，

所述确定部分，经配置为将基于有向无环图建模的关联周期任务集映射到多核处理器内核并选择所述多核处理器内核的工作电压/频率，采用拓扑排序算法重新计算所述关联周期任务集中的每一个关联周期任务的最早开始执行时间、最晚开始执行时间以及绝对截止期，以确定所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合；

所述调节部分，经配置为基于所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，通过DVFS调节所述多核处理器内核工作电压/频率，生成初始化种群；其中，所述初始化种群为关联周期任务集具有较低系统能耗与系统总需求时间的一组内核位置与电压/频率选择的集合；

所述第一获取部分，经配置为根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解；

所述第二获取部分，经配置为基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解，并将所述最终最优解作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，直至获得满足所述第一迭代条件时的最终最优解；

所述分配部分，经配置为基于所述满足所述第一迭代停止条件时的最终最优解进行分配所述关联周期任务集的内核位置、调度顺序以及工作电压/频率的选择，以获得最小化的系统能耗和系统总需求时间。

第三方面，本发明实施例提供了一种计算设备，所述计算设备包括：通信接口，存储器和处理器；各个组件通过总线系统耦合在一起；其中，

所述通信接口，用于在与其他外部网元之间进行收发信息过程中，信号的接收和发送；

所述存储器，用于存储能够在所述处理器上运行的计算机程序；

所述处理器，用于在运行所述计算机程序时，执行第一方面所述关联周期任务的多核处理器节能调度方法的步骤。

第四方面，本发明实施例提供了一种计算机存储介质，所述计算机存储介质存储有关联周期任务的多核处理器节能调度的程序，所述关联周期任务的多核处理器节能调度的程序被至少一个处理器执行时实现第一方面所述关联周期任务的多核处理器节能调度方法的步骤。

本发明实施例提供了一种关联周期任务的多核处理器节能调度方法、装置及介质，通过基于有向无环图(Directed Acyclic Graph，DAG)建模的任务模型，建立关联周期任务集与多核处理器内核的映射结果并在所述多核处理器内核上生成所述关联周期任务集的调度顺序，在此基础上，利用动态电压频率调节(Dynamic Voltage FrequencyScaling，DVFS)技术调节多核处理器内核的工作电压/频率，基于变邻域搜索的遗传算法进行迭代优化，以生成以系统能耗最优为指标的多核处理器内核与频率映射结果的初步最优解；然后，针对所述初步最优解，采用变邻域搜索算法，得到系统能耗最小化时的最终最优解，保证了关联周期任务实时性，同时兼顾了最小化系统总需求时间。

附图说明

图1为本发明实施例提供的一种关联周期任务的多核处理器节能调度方法流程图；

图2为本发明实施例提供的关联周期任务的多核处理器节能调度问题示意图；

图3为本发明实施例提供的变邻域搜索的遗传算法流程图；

图4为本发明实施例提供的变邻域搜索算法流程图；

图5为本发明实施例提供的关联周期任务示例；

图6为本发明实施例提供的基于变邻域搜索的遗传算法GA-VNS的节能调度示例；

图7为本发明实施例提供的基于最坏适应下降WFD算法的调度示例；

图8为本发明实施例提供的较小规模任务集合下基于算法GA、PSO以及GA-VNS测试集优化结果对比图；

图9为为本发明实施例提供的中等规模任务集合下基于算法GA、PSO以及GA-VNS测试集优化结果对比图；

图10为本发明实施例提供的较大规模任务集合下基于算法GA、PSO以及GA-VNS测试集优化结果对比图；

图11为本发明实施例提供的又一种组合任务测试集基于算法GA、PSO以及GA-VNS测试集优化结果对比图；

图12为本发明实施例提供的使用DVFS技术优化后的基于算法GA、PSO以及GA-VNS的能耗下降率对比图；

图13为本发明实施例提供的不同测试集下的基于算法GA、PSO以及GA-VNS的工作频率等级占比示意图；

图14为本发明实施例提供的基于算法GA、PSO以及GA-VNS的归一化系统总需求时间对比图；

图15为本发明实施例提供的一种关联周期任务的多核处理器节能调度装置示意图。

图16为本发明实施例提供的一种计算设备的硬件结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

星载计算机散热困难并且存在能量约束，因此需要考虑星务系统关联周期任务调度的能耗优化问题，现有节能调度算法均存在不同程度的能耗优化效果较差且不能兼顾系统总需求时间的问题。基于上述内容的阐述，本发明实施例期望针对关联周期任务在异构多核处理器上的节能调度问题，对根据有向无环图DAG建模的关联周期任务集，提出一种基于变邻域搜索的遗传算法，该算法在保证关联周期任务实时性的条件下，兼顾系统总需求时间的同时，可以得到具有更低系统能耗的多核处理器映射结果。基于此，参见图1，其示出了本发明实施例提供的一种关联周期任务的多核处理器节能调度方法流程图，该方法可以包括：

S101：将基于有向无环图建模的关联周期任务集映射到多核处理器内核并选择所述多核处理器内核的工作电压/频率，采用拓扑排序算法重新计算所述关联周期任务集中的每一个关联周期任务的最早开始执行时间、最晚开始执行时间以及绝对截止期，以确定所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合；

S102：基于所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，通过DVFS调节所述多核处理器内核工作电压/频率，生成初始化种群；其中，所述初始化种群为关联周期任务集具有较低系统能耗与系统总需求时间的一组内核位置与电压/频率选择的集合；

S103：根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解；

S104：基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解，并将所述最终最优解作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，直至获得满足所述第一迭代条件时的最终最优解；

S105：基于所述满足所述第一迭代停止条件时的最终最优解进行分配所述关联周期任务集的内核位置、调度顺序以及工作电压/频率的选择，以获得最小化的系统能耗和系统总需求时间。

需要说明的是，所述异构多核处理器是指在处理器芯片内部使用多种不同功能的内核，这些内核具有独特的体系结构与指令集，可以针对多种不同类型的需求，提高系统对应用的计算性能。所述关联周期任务，也可简称为任务，即为有优先约束并且释放间隔固定的任务；所述系统能耗是在固定时间间隔内，处理器执行作业产生的总能量开销，而对于一个可调度的周期任务集，通常考虑一个超周期内的系统总能耗；所述系统总需求时间是指任务集完成一次运行所需的最长处理器内核时间，也称为调度长度。

根据上述技术方案的描述，本发明实施例通过基于DAG建模的任务模型，建立关联周期任务集与多核处理器内核的映射结果并在所述多核处理器内核上生成所述关联周期任务集的调度顺序，在此基础上，利用DVFS技术调节多核处理器内核的工作电压/频率，基于变邻域搜索的遗传算法进行迭代优化，以生成以系统能耗最优为指标的多核处理器内核与频率映射结果的初步最优解；然后，针对所述初步最优解，采用变邻域搜索算法，得到系统能耗最小化时的最终最优解，保证了关联周期任务实时性，同时兼顾了最小化系统总需求时间。

对于图1所示的技术方案，在一些可能的实现方式中，所述将基于有向无环图建模的关联周期任务集映射到多核处理器内核并选择所述多核处理器内核的工作电压/频率，采用拓扑排序算法重新计算所述关联周期任务集中的每一个关联周期任务的最早开始执行时间、最晚开始执行时间以及绝对截止期，以确定所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，包括：

将基于DAG建模的关联周期任务集通过映射器将所述关联周期任务集中的每一个关联周期任务映射到多核处理器内核并选择其工作电压/频率等级，以确定所述关联周期任务集中的每一个关联周期任务的内核位置与工作电压/频率的选择结果；

采用拓扑排序算法重新计算所述关联周期任务集的每一个关联周期任务的绝对截止期，通过调度器生成新的调度顺序。

对于上述实现方式，在一些示例中，所述将基于DAG建模的关联周期任务集通过映射器将所述关联周期任务集中的每一个关联周期任务映射到多核处理器内核并选择其工作电压/频率等级，以确定所述关联周期任务集中的每一个关联周期任务的内核位置与工作电压/频率的选择结果，具体来说，参见图2，其示出了本发明实施例提供的关联周期任务的多核处理器节能调度问题示意图，其具体工作内容为：任务集T中包含N组关联周期任务，通过映射器把任意组中的每一组关联周期任务分别映射到多核处理器CPU 0、CPU 1…上；通过调度器将各关联周期任务在多核处理器内核上生成调度列表并且对所述关联周期任务按照所述调度列表的顺序进行调度；调节多核处理器内核的工作电压或频率，以减少系统动态功耗，同时对系统功耗性能指标进行评估，查看是否满足指标要求。

对于上述实现方式，在一些示例中，所述采用拓扑排序算法重新计算所述关联周期任务集的每一个关联周期任务的绝对截止期，通过调度器生成新的调度顺序，包括：

根据拓扑排序算法将基于DAG建模的每个关联周期任务排列成满足规则的拓扑排序列表；

根据所述拓扑排序列表，重新计算每个关联周期任务的绝对截止期。

具体来说，利用拓扑排序算法重新计算出基于DAG建模的每个关联周期任务的绝对截止期，重新确定关联周期任务作业调度顺序的优先级，可以保证最早时限优先(Earliest Deadline First，EDF)算法的调度效果。这是因为基于DAG建模的关联周期任务组TG中不同任务具有相同的绝对截止期，若使用EDF算法进行调度，则同一TG中的任务将具有相同的分配优先级，EDF算法会退化为速率单调(Rate-Monotonic，RM)算法，同时，由于任务间存在明显的优先约束，相同优先级不利于调度器对任务依赖关系的判断，会影响EDF算法的调度效果。因此，需要对TG中不同任务的绝对截止期进行重新计算。

需要说明的是，所述EDF算法是一种固定作业优先级调度算法，该算法根据任务绝对截止期分配作业优先级：绝对截止期越早，优先级越高；所述速率单调RM算法是一种固定任务优先级调度算法，其工作原理是根据任务周期分配作业优先级：周期越短，优先级越高。

在一些示例中，所述根据拓扑排序算法将基于DAG建模的每个关联周期任务排列成满足规则的拓扑排序列表，具体来说，所述拓扑排序是指将基于DAG建模的每个关联周期任务排列成满足如下规则的线性序列，其中，所述规则为：如果存在一条从τ_i到τ_j的路径，则在排序中τ_i出现在τ_j的后面。拓扑排序具体实施方式为首先寻找基于DAG建模的关联周期任务中入度为0的节点，然后将该节点邻接的所有节点入度减1。只要存在入度为0的节点，则将其取出进行排序。重复上述操作，直到所有节点完成排序，拓扑排序算法伪代码具体实施方式如下：

Input：TG＝{g(V,E),r,d,p}

Output：拓扑排序列表

需要说明的是，基于有向无环图DAG建模的任务模型，顶点即为关联周期任务；所述顶点的度(degree)就是指和该顶点相关联的边数。所述入度是以某顶点为弧头，终止于该顶点的弧的数目称为该顶点的入度，入度为0的顶点就是指该顶点输入的有向边数为0。

在一些示例中，所述根据所述拓扑排序列表，重新计算每个关联周期任务的绝对截止期，包括：

通过所述拓扑排序列表末端任务的绝对截止期从后向前利用如下公式递推出所述末端任务之前的其他任务的绝对截止期：

其中，τ_i(i＝1,…,n)为任务组TG的n个任务，τ_n表示拓扑排序列表中最后一个任务，d表示任务组TG中最晚释放任务的绝对截止期，d_i表示任务τ_i的绝对截止期，SUC(τ_i)表示任务τ_i所属任务组TG的后继任务集合，c_k表示任务τ_k的执行时间，e_ik表示任务τ_i和τ_k之间的有向边；所述otherwise是d_k-c_k-e_ik>＝0且τ_i不等于τ_n。

具体来说，依照拓扑排序的结果，在计算出每个任务绝对截止期的同时，可以计算出任务的最早开始执行时间EST与最晚开始执行时间LST，伪代码实施方式如下：

Input：TG＝{g(V,E),r,d}

Output：d_i，EST(τ_i)，LST(τ_i)，i＝1,…,n

对于图1所示的技术方案，在一些可能的实现方式中，所述基于所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，通过DVFS调节所述多核处理器内核工作电压/频率，生成初始化种群；其中，所述初始化种群为关联周期任务集具有较低系统能耗与系统总需求时间的一组内核位置与电压/频率选择的集合。具体来说，在异构多核环境下，对具有前后依赖关系的任务图进行能耗最优调度，可以描述为将任务分配到合理的处理器内核并确定该处理器内核的运行电压，满足所有任务的截止期的前提下，实现整体系统能耗最优。一般说来，在异构多核处理器上寻求能量最优的调度策略可分为三个阶段，分别是任务划分、任务调度和动态电压缩放，其中，所述任务划分是将任务分配到各处理器内核；任务调度在任务划分的基础上，确定任务的调度顺序；动态电压缩放是确定任务的执行电压。由于多核处理器的系统功耗主要包括容性负载充放电与逻辑门状态变化造成的动态功耗和晶体管漏电流造成的静态功耗。目前采用的动态节能调度技术包括但不限于动态电压/频率调节DVFS，关于DVFS技术是一种降低系统动态功耗的技术，通过调节多核处理器工作电压或频率减少系统动态功耗，但是降低工作频率会延长作业执行时间，可能会错失作业的截止期。这是因为DVFS技术是以延长任务执行时间为代价来达到减少系统能量消耗的目的，体现了功耗与性能之间的权衡。可以通过减少时钟频率来降低通用处理器的功耗。然而，仅仅降低时钟频率并不节约能量，因为性能的降低会带来任务执行时间的增加。调节电压需要以相同的比例调节频率以满足信号传播延迟要求，然而不管是电压调节还是频率调节，都会造成系统性能的损失，并增加系统的响应延迟。为了尽量减少可感知的系统性能负面影响同时又能最大程度地降低系统能耗，需要估计未来的工作负载并选择最合适的频率，准确地预测未来的工作负载对广泛使用的策略是至关重要的。预测错误可能会导致设置的频率太高降低节省能耗，或设置频率过低造成系统响应延迟过高，造成任务截止期错失，所以要想降低功耗，需要选择合适的供电电压和时钟频率。

由于关联周期任务调度是以超周期为单位进行循环，使用一个超周期内所有关联周期任务的总能耗作为目标函数。若记超周期为H，则一个超周期内的系统总能耗以及参数约束需要满足如下表达式：

其中，min E_total表示系统最小功耗，E(τ_i)为任务τ_i在内核P上的能耗，E_idle为内核P在空闲模式下的能耗，参数之间的关系为处理器架构由M个不同的异构处理器池Ψ＝{G₁，G₂，…，G_M}组成，其中任意处理器池G中含有m个同构处理器内核P，即G＝{P₁，P₂，…，P_m}，任意内核P上分配有j个不同的任务τ_i(i＝1，…，j)，每个任务的执行时间为c_i(i＝1，…，j)，周期为p_i(i＝1，…，j)，EST(τ_i)表示任务τ_i所属任意组关联周期任务组TG的最早开始执行时间，LST(τ_i)表示最晚开始执行时间，TS(τ_i)表示任务实际开始时间，TF(τ_i)表示为实际完成时间，d_i表示为绝对截止时间，u表示任务利用率，周期任务利用率可表示为执行时间与周期之比：u＝c/p，则每个关联周期任务的利用率可表示为u_i＝c_i/p_i。

需要说明的是，所述超周期即为系统中所有任务周期的最小公倍数；所述任务利用率是任务执行时间占总处理器时间的比率，周期任务利用率可表示为执行时间与周期之比；处理器利用率是在固定时间间隔内，处理器执行作业所占的比率，对于一个可调度的周期任务集，处理器利用率等于周期任务利用率的总和。

对于图1所示的技术方案，在一些可能的实现方式中，所述根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解，包括：

根据所述初始化种群随机生成若干初始解并按照设定的最大迭代次数作为第一迭代停止条件，通过遗传算法获得每次第一迭代过程的初步最优解集合；

针对所述每次第一迭代过程的初步最优解集合，使用目标函数计算所述初步最优解集合中的每一个个体的适应度并按照所述适应度大小进行排序；

针对所述初步最优解集合中的每一个个体的适应度及排序，利用适应度函数进行评估，以获取每次第一迭代过程的初步最优解。

参见图3，其示出了本发明实施例提供的变邻域搜索的遗传算法GA-VNS流程300。该算法的具体流程步骤如下：

S301：初始化种群G0，最大迭代次数N，随机生成n个初始解，i＝0；

首先对种群进行初始化，即将任务优先级转换为按一定顺序组织的染色体。其中染色体的编码采用一维位串形式，编码长度为基于DAG建模的任务图中任务节点数n，每个基因表示对应任务的调度优先级，取值范围为[0，n-1]，数值越低对应优先级越高，对于优先级相同的任务，则根据任务编号进行排序。对于关联周期任务的调度优先级基于前述采用拓扑排序算法重新计算绝对截止期，已完成EDF算法对作业调度顺序的确定。

S302：判断迭代次数i是否小于最大迭代次数N，若是，跳转到步骤S303；若否，跳转到步骤S308：输出最优个体BS；

S303：根据GA-VNS算法计算出种群G0中每个个体的适应度；

需要说明的是，所述适应度即为度量某个物种对于生存环境的适应程度，本发明中指一个超周期内系统总能耗开销与任务所需的总处理时间，评价个体适应度的一般过程为对个体编码串进行解码处理后，可得到个体的表现型；由个体的表现型可计算出对应个体的目标函数值；根据最优化问题的类型，由目标函数值按一定的转换规则求出个体的适应度。所述目标函数即为前述一个超周期内的系统总能耗以及参数约束的表达式。

S304：依据适应度的大小，执行遗传算法中的选择、交叉、变异操作；

所述操作即为邻域动作，该邻域动作是一个函数，通过此函数，对当前解产生其相应的邻居解集合，也可以理解为通过一定的规则，将一个解变换到另一个解；所述按照适应度的大小，执行算法中的选择、交叉、变异操作，可以理解为，例如使用选择函数，以一定的概率从种群中选择若干个个体。一般来说，选择过程是一种基于适应度的优胜劣汰的过程。对选择的若干个个体，进行交叉也称之为基因重组，复制时产生小概率的复制差错，以产生新的染色体。

S305：产生下一代种群Gi，筛选出最优个体BS；

新生成的种群是关联周期任务集具有较低系统能耗与系统总需求时间的一组内核位置与电压/频率选择的集合；根据系统总能耗相应的参数及其约束，使用适应性函数对每一个基因个体作一次适应度评估，以筛选出当前种群中的最优个体BS。所述系统能耗相应的参数及其约束是关联周期任务τ_i的最早开始执行时间为EST(τ_i)，最晚开始执行时间为LST(τ_i)，任务实际开始时间为TS(τ_i)，实际完成时间为TF(τ_i)，绝对截止期d_i以及关联周期任务集合能够在内核上调度的条件，详细参见前述内容的描述，此处不再赘述。

S306：对BS进行变邻域搜索；

基于变邻域搜索的遗传算法筛选出最优个体BS，也可称之为初步最优解，使用变邻域搜索算法获取更优个体BS。所述变邻域搜索算法是一种改进的局部搜索算法，将变邻域搜索的遗传算法筛选出的最优个体BS，作为新的初始解，运用一个邻域解产生器，持续地在当前解的邻域中搜索更优解，若找到比最优个体BS更优的解，则用这个更优解取代所述最优个体BS，成为新的当前解，继续上述过程，直到在当前解的邻域中找不到更优解为止。

S307：若本邻域内搜索找不到比当前最优个体BS更优解时，迭代次数依次+1，即i＝i+1，针对其他不同的邻域结构进行搜索；

所述邻域即是给定点附近其它点的集合，也可以理解为对当前解进行一个操作，可以得到的所有解的集合，这个操作可以称之为邻域动作。

S308：当i大于最大迭代次数迭代N时，输出最优个体BS。

判断迭代次数是否大于最大迭代次数N，若是，输出最优个体BS。

对于上述实现方式，具体来说，所述遗传算法(Genetic Algorithm，GA)是借鉴自然选择与遗传机制，具有自适应性、全局收敛性、可扩展性等优点。遗传算法在运行的过程中会进行N次迭代，每次迭代都会生成若干条染色体，适应度函数会给本次迭代中生成的所有染色体打分，来评判这些染色体的适应度，然后将适应度较低的染色体淘汰掉，只保留适应度较高的染色体，从而经过若干次迭代后染色体的质量将越来越优良。

需要说明的是，所述种群即为个体的集合，该集合内个体数称为种群，而个体是指染色体带有特征的实体；适应度函数也称评价函数，是根据目标函数确定的用于区分群体中个体好坏的标准。本发明实施例中的适应度函数有两个，第一个是一个超周期内系统的总能耗值：

其中，E(τ_i)为任务τ_i在内核P上的能耗，E_idle为内核P在空闲模式下的能耗。

第二个是系统在超周期内调度所需的系统总需求时间，由EDF算法实际调度后确定。上述两个适应度函数优先选择系统总能耗，当系统总能耗相同时，取系统总需求时间较小的结果作为最优解。另外，适应度函数总是非负的，而目标函数可能有正有负，故需要在目标函数与适应度函数之间按照一定的规则进行变换。

对于图1所示的技术方案，在一些可能的实现方式中，所述基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解，并将所述最终最优解作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，直至获得满足所述第一迭代条件时的最终最优解，包括：

根据所述每次第一迭代过程的初步最优解，将最大迭代次数作为第二迭代停止条件，通过变邻域搜索算法，遍历搜索所有邻域结构，获得每次第一迭代过程的最终最优解集合；

将所述最终最优解集合中的每个个体作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，使用目标函数计算每次第一迭代过程的最终最优解集合的每个个体的适应度并按照所述适应度大小进行排序；

根据每次第一迭代过程的最终最优解的适应度及排序，使用适应度函数对所述最终最优解的适应度进行评估，以获得满足所述第一迭代条件时的最终最优解。

参见图4，其示出了本发明实施例提供的变邻域搜索算法流程图S306’，其中，图3中步骤S306对最优个体BS进行变邻域搜索，此步骤对应于图4的S306’步骤，变邻域搜索算法具体工作流程如下所示：

S3060：初始化解最优解BS，最大迭代次数N，i’＝0；

基于上述变邻域搜索的遗传算法获得的第一迭代的初步最优解BS，根据关联周期任务的内核位置、调度优先级以及工作电压/频率的选择结果初始化所述最优解BS，设定最大迭代次数为N为第二迭代的停止条件。

S3061：判断迭代次数i是否小于最大迭代次数N；若是，跳转到步骤S3062；若否，跳转到步骤S3069：输出最优个体BS；

S3062：选择邻域结构k＝1；

所述邻域结构即为上述设计的三种邻域结构，逐个遍历搜索各邻域结构以获得最终最优解。

S3063：产生新解S’；

S3064：判断S’是否优于BS；若是，跳转到S3067：最优个体BS＝S’；若否，跳转到S3065；

所述判断S’是否优于BS，按照目标函数计算产生的新解S’的适应度，即一个超周期内的系统能耗与总需求时间，并使用适应度函数对所述适应度进行评估，若S’优于BS，则最优个体BS＝S’；若S’不优于BS，则继续在其他邻域结构中搜索。

S3065：遍历搜索其他邻域结构，即k＝k+1；

S3066：判断邻域结构k是否大于3；若是，跳转到S3068；若否，跳转到S3063；

根据前述设置的3中邻域结构，若对全部邻域结构均完成了搜索，则进入下一次迭代。若否，则继续遍历搜索其他邻域结构，获得最终最优解。

S3067：当产生的新解S’优于最优个体BS时，最优个体等于产生的新解，即BS＝S’；

根据系统总能耗相应的参数及其约束，使用适应性函数对产生的新解S’作一次适应度评估，以判断产生的新解S’是否优于最优个体BS，所述系统总能耗相应的参数及约束见前面内容所述，此处不再赘述。

S3068：当邻域结构k大于3时，迭代次数依次+1，即i’＝i’+1；

S3069：当迭代次数i’大于最大迭代次数N时，输出最优个体BS。

对于上述实现方式，具体来说，本发明实施例在标准遗传算法的基础上，增加变邻域搜索(Variable Neighborhood Search，VNS)算法来进一步改进算法性能。首先进行种群信息初始化，然后进入循环体。在循环体内先通过对遗传算法进行改进，确定任务优先级；再根据基于DAG建模的任务图和划分策略，确定任务在处理器上的调度顺序；最后根据任务与系统能耗以及系统总需求时间之间的关系，在可行的任务调度基础上进行动态电压缩放；接下来，计算当前群体适应度并排序；采用改进的遗传算法对种群进行更新，确定新的任务优先级，如果满足终止条件则退出，否则继续迭代。

变邻域搜索算法需要解决的关键问题是遗传算法GA最优解的邻域结构，根据关联周期任务节能调度问题的特点，可以设计以下三种邻域结构：

(1)随机选取一个任务，提高频率等级，降低工作电压/频率的相应值；

(2)随机选择一个任务，随机改变其内核位置；

(3)随机选择一个任务，随机改变频率等级与内核位置。

对于图1所示的技术方案，在一些可能的实现方式中，所述基于所述满足所述第一迭代停止条件时的最终最优解进行分配所述关联周期任务集的内核位置、调度顺序以及工作电压/频率的选择，以获得最小化的系统能耗和系统总需求时间。具体来说，根据第一迭代停止条件时的最终最优解，设定关联周期任务集的内核位置、调度顺序以及工作电压/频率的选择，按照系统能耗及其参数的约束，可以获得最小化的系统能耗和系统总需求时间。

基于上述技术方案或实现方式以及示例的阐述，通过对比采用GA-VNS算法和WFD算法的任务映射策略以及实时调度过程的节能调度效果，得出对比结论。

需要说明的是，所述GA-VNS算法是根据前述标准遗传算法GA的基础上增加变邻域搜索算法VNS得出的算法，可以称之为变邻域搜索的遗传算法，简称为GA-VNS算法；所述WFD算法是一种箱封装启发式映射算法，该算法首先将任务按照利用率降序排列，再按排列顺序依次映射到具有最大剩余利用率的内核中。

假设某系统有两个异构的处理器内核P₁和P₂，每个内核均支持两个电压/频率等级，即高频率等级f_H与低频率等级f_L。如图5所示，有三组运行在所述系统上的关联周期任务TG1/TG2/TG3，任务周期分别为60ms、60ms、30ms，相对截止时间等于周期，任务集分别在f_H与f_L等级下运行的任务总利用率为1.15和2.30，因此至少需要两个处理器内核才能完成调度，且所有任务不能同时工作于低频率等级，任务具体参数见表1-1所示：

表1-1任务参数及功耗信息

对比结论：如图6和图7分别显示了GA-VNS算法与WFD算法的调度结果。其中，GA-VNS算法的处理器内核利用率分别为U₀＝0.967和U₁＝1.0，WFD算法的处理器利用率分别为U₀＝0.60和U₁＝0.55，两种算法均是根据处理器内核利用率进行任务的映射，并且任务映射结果均具有负载均衡的特点。系统总需求时间分别为60ms与44ms，总能耗分别为97.718mJ与110.262mJ，GA-VNS算法较直接使用WFD算法节能约11.38％，体现出该算法在节能方面的有效性。同时，注意到使用GA-VNS算法得到的调度结果具有更少的总线通信时间与任务抢占次数，有助于进一步降低系统总能耗。

需要说明的是，所述负载均衡是对于一致(Uniform)多核处理器，若某算法得到的映射结果，存在任务从映射内核迁移到任意其他内核可以减少系统能耗，则称该映射是不均衡的，否则是均衡的。

为了验证基于变邻域搜索的遗传算法GA-VNS的有效性以及优越性，选择与标准遗传算法GA和粒子群算法(Particle Swarm Optimization，PSO)进行比较，通过仿真实验进行验证和分析。本发明实施例选用8组关联周期任务，将所述8组关联周期任务进行一定的组合形成11组任务集合，而所述11组任务集合可以划分为四种规模类型，分别为较小规模任务集合、中等规模任务集合、较大规模任务集合以及组合的任务集合，将其做为测试任务图进行系统能耗的仿真验证。

实验参数

使用标准70nm技术的处理器功率参数。具体功率参数见表1-2所示。

假设实验系统为一个具有4核的异构处理器，其中内核0和内核1位于同一处理器池，内核2和内核3分别位于不同处理器池。因此，内核0与内核1之间不考虑通信开销，而其他内核之间需要考虑通信开销。每个处理器内核均支持独立的DVFS节能技术，具有5个工作电压/频率等级，电压范围为0.65V到0.85V，每一级相差50mV，频率范围为1.01GHz到2.10GHz。由于工作电压/频率的切换时间开销典型值一般在10～150us之间，而任务的执行时间通常至少在ms量级，因此可以忽略工作电压/频率调节引起的时间开销。同时，假设处理器内核支持两种工作模式，即运行模式与空闲模式。内核执行任务时处于运行模式，当不存在就绪任务时，内核进入空闲模式。工作模式的切换时间与能耗开销也忽略不计。不考虑任务调度的切换时间开销，调度器时钟中断间隔取5ms。

表1-2处理器功耗模型参数

选用TG0-TG7表示的8组关联周期任务图作为测试任务图。其中TG0-TG4是标准任务图集中具有50个任务节点的随机任务图rand0000～rand0004。TG5-TG7是标准任务图集中三个源于实际应用程序的任务集。

假设任务在不同处理器内核上的最坏情况执行时间(Worst Case ExecutionTime，WCET)均相同，由于标准任务图中没有考虑关联任务间的通信开销，因此本文假设任务间通信开销为服从均匀分布U(0.5,2)的随机值，单位为ms。任务图仅考虑隐含截止期的情况。任务图具体参数见表1-3所示。

表1-3关联周期任务图参数

将这8组关联周期任务图进行一定组合，可以产生11个不同规模的任务集合，这些集合按总利用率升序排列。如表1-4所示，前九个集合为随机任务图TG0～TG4组合的测试集，其中STG0～STG2为具有100个任务节点的较小规模任务集合，MTG3～MTG5为具有150个任务节点的中等规模任务集合，LTG6～LTG8为具有200个任务节点的较大规模任务集合。后两个测试集RTG9～RTG10为实际应用程序TG5～TG7组合成的测试集，其中RTG9为TG5与TG6组合的测试集，RTG10为TG7单独组成的测试集。

表1-4测试集参数

为保证公平性，对比实验中算法所选用的种群规模与粒子群数目保持一致，所有算法均进行100次迭代。各算法的具体参数见表1-5所示。

表1-5算法参数

仿真结果

使用上述三种算法的系统能耗优化结果如图8、图9、图10与图11所示，在不同规模的测试集下，使用GA、PSO与GA-VNS算法均可以得到比初始值更低的系统能耗。表1-6、表1-7、表1-8与表1-9所示为三种算法的优化能耗相对于初始能耗的归一化能耗下降率，可以看到，三种算法的优化结果相近，其中，GA-VNS算法在所有测试集中均优于GA与PSO算法，平均优化结果高出GA算法1.56％，高出PSO算法1.24％；PSO算法在多数情况下优于GA算法，平均优化结果高出GA算法0.32％。同时注意到，由于GA-VNS算法在每次迭代的最优解邻域内进一步搜索更优解，因此，可以在更少的迭代次数下获得更好的优化结果。

表1-6 STG测试集归一化能耗下降率

表1-7 MTG测试集归一化能耗下降率

表1-8 LTG测试集归一化能耗下降率

表1-9 RTG测试集归一化能耗下降率

参见图12所示，其示出了本发明实施例提供的使用DVFS技术优化后的基于算法GA、PSO以及GA-VNS的能耗下降率对比图，相比于不使用DVFS技术的系统能耗E_org，GA、PSO与GA-VNS算法在使用DVFS技术的基础上，所得到的系统能耗E_opt相比于E_org的平均下降率分别为10.31％，10.61％与11.75％，GA-VNS算法的优化效果最好。同时，可以看到，三种算法的能耗下降率随着测试集总利用率的提高，呈现先逐渐上升再逐渐下降的趋势。这是因为，参见图13，在测试集总利用率较低时，系统可以充分利用DVFS技术来降低系统能耗，但随着总利用率的提高，在保证所有任务定时约束的同时，降低任务工作频率变得越来越有限，使用高频率等级的任务所占比重逐渐降低，因此系统能耗下降率也逐渐减少。

参见图14，其所示为GA、PSO与GA-VNS算法得到的归一化系统总需求时间对比图，即系统总需求时间DT与测试集超周期H的比值。可以看到，系统总需求时间随着任务总利用率的提高而逐渐增加。注意到，PSO算法与GA算法相比，虽然能够得到较好的能耗优化结果，但是归一化系统总需求时间最大。GA算法虽然在降低能耗的性能上不如PSO与GA-VNS算法，但是在较低规模的测试集中，归一化系统总需求时间最短。GA-VNS算法则兼顾了两种算法的优点，既可以得到较好的能耗优化结果，也可以保证在较低利用率的测试集下，系统总需求时间不会过长。

基于前述技术方案相同的发明构思，参见图15，其示出了一种关联周期任务的多核处理器节能调度装置1500，所述装置1500包括：确定部分1501、调节部分1502、第一获取部分1503、第二获取部分1504、分配部分1505；其中，

所述确定部分1501，经配置为将基于有向无环图建模的关联周期任务集映射到多核处理器内核并选择所述多核处理器内核的工作电压/频率，采用拓扑排序算法重新计算所述关联周期任务集中的每一个关联周期任务的最早开始执行时间、最晚开始执行时间以及绝对截止期，以确定所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合；

所述调节部分1502，经配置为基于所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，通过DVFS调节所述多核处理器内核工作电压/频率，生成初始化种群；其中，所述初始化种群为关联周期任务集具有较低系统能耗与系统总需求时间的一组内核位置与电压/频率选择的集合；

所述第一获取部分1503，经配置为根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解；

所述第二获取部分1504，经配置为基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解，并将所述最终最优解作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，直至获得满足所述第一迭代条件时的最终最优解；

所述分配部分1505，经配置为基于所述满足所述第一迭代停止条件时的最终最优解进行分配所述关联周期任务集的内核位置、调度顺序以及工作电压/频率的选择，以获得最小化的系统能耗和系统总需求时间。

在一些示例中，所述确定部分1501，经配置为：

在一些示例中，所述第一获取部分1503，经配置为：

在一些示例中，所述第二获取部分1504，经配置为：

可以理解地，在本实施例中，“部分”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是单元，还可以是模块也可以是非模块化的。

另外，在本实施例中的各组成部分可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

因此，本实施例提供了一种计算机存储介质，所述计算机存储介质存储有关联周期任务的多核处理器节能调度的程序，所述关联周期任务的多核处理器节能调度的程序被至少一个处理器执行时实现上述技术方案中所述关联周期任务的多核处理器节能调度方法的步骤。

根据上述一种关联周期任务的多核处理器节能调度装置1500以及计算机存储介质，参见图16，其示出了本发明实施例提供的一种能够实施上述关联周期任务的多核处理器节能调度装置1500的计算设备1600的具体硬件结构，该计算设备1600可以为无线装置、移动或蜂窝电话(包含所谓的智能电话)、个人数字助理(PDA)、视频游戏控制台(包含视频显示器、移动视频游戏装置、移动视频会议单元)、膝上型计算机、桌上型计算机、电视机顶盒、平板计算装置、电子书阅读器、固定或移动媒体播放器等。计算设备1600包括：通信接口1601，存储器1602和处理器1603；各个组件通过总线系统1604耦合在一起。可理解，总线系统1604用于实现这些组件之间的连接通信。总线系统1604除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图16中将各种总线都标为总线系统1604。其中，

所述通信接口1601，用于在与其他外部网元之间进行收发信息过程中，信号的接收和发送；

所述存储器1602，用于存储能够在所述处理器1603上运行的计算机程序；

所述处理器1603，用于在运行所述计算机程序时，执行前述技术方案中所述关联周期任务的多核处理器节能调度方法步骤。

可以理解，本发明实施例中的存储器1602可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本文描述的系统和方法的存储器1602旨在包括但不限于这些和任意其它适合类型的存储器。

而处理器1603可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1603中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1603可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1602，处理器1603读取存储器1602中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable LogicDevice，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

可以理解地，上述关联周期任务的多核处理器节能调度装置1500以及计算设备1600的示例性技术方案，与前述一种关联周期任务的多核处理器节能调度方法的技术方案属于同一构思，因此，上述对于关联周期任务的多核处理器节能调度装置1500以及计算设备1600的技术方案未详细描述的细节内容，均可以参见前述一种关联周期任务的多核处理器节能调度方法的技术方案的描述。本发明实施例对此不做赘述。

需要说明的是：本发明实施例所记载的技术方案之间，在不冲突的情况下，可以任意组合。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种关联周期任务的多核处理器节能调度方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将基于有向无环图建模的关联周期任务集映射到多核处理器内核并选择所述多核处理器内核的工作电压/频率，采用拓扑排序算法重新计算所述关联周期任务集中的每一个关联周期任务的最早开始执行时间、最晚开始执行时间以及绝对截止期，以确定所述关联周期任务集映射的内核位置、调度顺序以及多核处理器内核工作电压/频率的选择集合，包括：

3.根据权利要求2所述的方法，其特征在于，所述采用拓扑排序算法重新计算所述关联周期任务集的每一个关联周期任务的绝对截止期，通过调度器生成新的调度顺序，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述初始化种群按照设定的第一迭代停止条件通过遗传算法获取每次第一迭代过程的初步最优解，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述每次第一迭代过程的初步最优解按照设定的第二迭代停止条件通过变邻域搜索算法获得每次第一迭代过程的最终最优解，并将所述最终最优解作为下次第一迭代过程的初始解进行所述遗传算法的下一次第一迭代过程，直至获得满足所述第一迭代条件时的最终最优解，包括：

6.一种关联周期任务的多核处理器节能调度装置，其特征在于，所述装置包括：确定部分、调节部分、第一获取部分、第二获取部分、分配部分；其中，

7.根据权利要求6所述的装置，其特征在于，所述确定部分，经配置为：

8.根据权利要求6所述的装置，其特征在于，所述第二选取部分，经配置为：

9.一种计算设备，其特征在于，所述计算设备包括：通信接口，处理器，存储器；各个组件通过总线系统耦合在一起；其中，

所述处理器，用于在运行所述计算机程序时，执行权利要求1至5任一项所述关联周期任务的多核处理器节能调度方法的步骤。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有关联周期任务的多核处理器节能调度的程序，所述关联周期任务的多核处理器节能调度的程序被至少一个处理器执行时实现权利要求1至5任一项所述关联周期任务的多核处理器节能调度方法的步骤。