CN116033026A

CN116033026A - 一种资源调度方法

Info

Publication number: CN116033026A
Application number: CN202211564395.9A
Authority: CN
Inventors: 程良伦; 邓宇轩; 王涛
Original assignee: Guangdong Nengge Knowledge Technology Co ltd; Guangdong University of Technology
Current assignee: Guangdong Nengge Knowledge Technology Co ltd; Guangdong University of Technology
Priority date: 2022-12-07
Filing date: 2022-12-07
Publication date: 2023-04-28

Abstract

本发明公开了一种资源调度方法，通过获取用户提出的服务请求，根据服务请求建立服务请求模型；根据评价指标和约束条件构建所述服务请求模型的适应度函数，基于服务执行时间、服务执行成本来计算每个服务在服务组件的适应度值并选择合适的服务组件，在服务组件之间创建负载平衡，采用人工蜂群算法和Q‑learning算法解决云计算中多用户并发下的服务组件资源调度问题，可以帮助人工蜂群算法更快地收敛，有助于确定合适可用资源环境的服务顺序，简单高效地确定最合适的服务调度方案，并且本发明实施例还具有收敛精度高、收敛速度快，时间复杂度低、探索度高的有益效果。本发明实施例可以广泛应用于资源调度技术领域。

Description

一种资源调度方法

技术领域

本发明涉及资源调度技术领域，尤其是一种资源调度方法。

背景技术

工业网络物理系统支持组件化服务，从工业云计算的角度来看，软件组件应跨异构边缘设备动态组合，以执行各种功能。工业网络物理系统中一个重要应用是服务调度，多服务调度的最终目标是实现可持续的服务。然而，当多用户向服务管理器同时发送多个服务请求命令时，会出现一些服务资源冲突问题，即资源冲突管理问题，需要进行服务组件的资源调度。

目前有启发式算法、元启发式算法、混合元启发式算法甚至机器学习方法来解决云计算环境中的服务调度和负载平衡问题。Jena提出了一种基于人工蜂群算法的方法，用于云计算环境中的能效、处理时间、成本和计算资源利用。使用多目标人工蜂群算法将服务分配给数据中心。但启发式算法收敛精度低、收敛速度慢，时间复杂度较高。一些机器学习方法探索性行为较弱，易陷入局部最优解问题。

发明内容

有鉴于此，本发明实施例提供一种效率高、收敛快的资源调度方法。

本发明实施例提供了一种资源调度方法，包括：获取用户提出的服务请求，根据所述服务请求建立服务请求模型；根据评价指标和约束条件构建所述服务请求模型的适应度函数；其中，所述评价指标为服务执行时间和服务执行成本；所述约束条件为资源利用率和服务执行超时率；采用人工蜂群算法和Q-learning算法结合求解所述适应度函数，将所述适应度函数的值满足误差条件的调度方案确定为优化目标；根据所述优化目标进行服务组件资源调度。

可选地，所述获取用户提出的服务请求，根据所述服务请求建立服务请求模型，包括：获取用户提出的服务请求；根据所述服务请求的服务名称获取服务组件集和服务集；根据所述服务组件集和所述服务集构建服务请求模型。

可选地，所述根据评价指标和约束条件构建所述服务请求模型的适应度函数，包括：根据服务执行时间构建服务执行时间的适应度函数；根据服务执行成本构建服务执行成本的适应度函数；计算资源利用率以及超时率；根据所述服务执行时间的适应度函数、所述服务执行成本的适应度函数、所述资源利用率以及所述超时率构建所述服务请求模型的适应度函数。

可选地，所述根据服务执行时间构建服务执行时间的适应度函数，包括：计算每个服务组件中的服务执行总时间；根据所述服务执行时间总时间确定所有组件中执行总时间的最大值以及完成所有服务所需的最小完成时间；根据所述服务执行时间和所述最小完成时间构建服务请求模型中服务执行时间的适应度函数。

可选地，所述根据服务执行成本构建服务执行成本的适应度函数，包括：计算每个服务组件上处理的所有服务的服务执行成本总和；根据所述服务执行成本总和确定所述服务组件处理的服务执行成本最小值；根据所述服务执行成本总和以及所述服务执行成本最小值构建服务请求模型中服务执行成本的适应度函数。

可选地，所述计算每个服务组件中的服务执行总时间的计算公式为：

其中，所述v_i代表第i个服务组件；所述s_jki代表第j个用户中的服务s_jk被分配给服务组件v_i执行；所述ExtTime(s_jki)代表服务s_jk在v_i中处理服务的执行时间；所述length(s_jk)代表服务s_jk的长度；所述CPU(v_i)代表处理服务s_jk的CPU速率。

可选地，所述计算每个服务组件上处理的所有服务的服务执行成本总和，包括：计算在服务组件中执行单个服务时的单个服务执行成本；根据所述单个服务执行成本计算在所有组件上执行所有服务的总和，作为服务执行成本总和。

可选地，所述计算在服务组件中执行单个服务时的单个服务执行成本的计算公式为：

Cost(s_jki)＝(c₁·ExtTime(s_jki))+(c₂·ExtTime(s_jki))+(c₃·ExtTime(s_jki))

其中，s_jki代表第j个用户中的服务s_jk被分配给服务组件v_i执行；Cost(s_jki)代表第jk个服务在第i个服务组件中的服务执行成本；c₁代表在v_i中单位时间的CPU使用成本；c₂代表在v_i中单位时间的内存使用成本；c₃代表在v_i中单位时间的带宽使用成本；ExtTime(s_jki)代表s_jk在v_i中处理服务的执行时间；

所述根据所述单个服务执行成本计算在所有组件上执行所有服务的总和的计算公式为：

其中，TCost代表服务执行成本总和；m代表服务组件总数；i代表第i个服务组件；n代表用户总数；j代表第j个用户；p代表服务总数；k代表第k个服务；s_jki代表第j个用户中的服务s_jk被分配给服务组件v_i执行；Cost(s_jki)代表服务s_jk在第i个服务组件中的服务执行成本。

可选地，所述采用人工蜂群算法和Q-learning算法结合求解所述适应度函数，将所述适应度函数的值满足误差条件的调度方案确定为优化目标，包括：初始化蜂群、食物源并配置算法参数；根据Q-learning算法构建Q表；其中，所述Q表用于存储所有预期状态、行动以及Q值；所述Q值由所述状态以及所述行动组合确定。

在雇佣蜂阶段，雇佣蜂确定当前食物源的相邻食物源位置，根据所述相邻食物源的位置更新所述Q表；在跟随蜂阶段，跟随蜂从所述Q表中根据轮盘赌方法随机选取雇佣蜂食物源；根据所选取的雇佣蜂食物源获取新食物源；将所述新食物源替代所选取的所述雇佣蜂食物源；当所述新食物源适应度值超过所选取的所述雇佣蜂食物源，则更新Q值；在侦查蜂阶段，当获取适应度值超过所选取的所述雇佣蜂食物源的所述新食物源失败的次数超过预定阈值，则随机搜索新的食物来源，并更新Q表；其中，所述适应度值由适应度函数计算得到；重复所述在雇佣蜂阶段，雇佣蜂确定当前食物源的相邻食物源位置，根据所述相邻食物源的位置更新所述Q表，直至达到最大迭代次数或Q表中的行动方案的适应度值满足误差条件；将所述Q表中的最终行动方案确定为最佳服务组件资源调度方案。

可选地，所述Q值由所述状态以及所述行动组合确定，包括：所述Q值的计算公式为：

其中，Q_t+1(b_t，a_t)是在t+1时刻的Q值；α是学习率；a_t是在t时刻的行动；á_t是在t时刻的最优行动；γ是折扣系数；r_t是在状态b_t下执行行动所获得的惩罚或奖励；δ是过渡函数；

是对最佳值的估计。

本发明的实施例具有以下有益效果：当用户向目标系统提出服务请求时，对所述服务请求建立服务请求模型；根据评价指标和约束条件构建所述服务请求模型的适应度函数，基于服务执行时间、服务执行成本来计算每个服务在服务组件的适应度值并选择合适的服务组件，在服务组件之间创建负载平衡，采用人工蜂群算法和Q-learning算法解决云计算中多用户并发下的服务组件资源调度问题，可以帮助人工蜂群算法更快地收敛，有助于确定合适可用资源环境的服务顺序，简单高效地确定最合适的服务调度方案，并且本发明实施例还具有收敛精度高、收敛速度快，时间复杂度低、探索度高的有益效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的方法步骤流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有资源调度技术中存在的资源冲突管理问题，本发明实施例提供了一种资源调度方法，包括：获取用户提出的服务请求，根据服务请求建立服务请求模型；根据评价指标和约束条件构建服务请求模型的适应度函数；其中，评价指标为服务执行时间和服务执行成本；约束条件为资源利用率和服务执行超时率；采用人工蜂群算法和Q-learning算法结合求解适应度函数，将适应度函数的值满足误差条件的调度方案确定为优化目标；根据优化目标进行服务组件资源调度。

具体地，在本发明实施例中，目标系统为工业网络物理系统，该工业网络物理系统中的软件组件为跨异构面源设备动态组合，能够执行各种功能。参照图1，图1是本发明实施例提供的方法步骤流程图，本发明实施例包括以下步骤S100～S400：

S100、获取用户提出的服务请求，根据所述服务请求建立服务请求模型。

具体地，步骤S100包括以下步骤S110～S130：

S110、获取用户提出的服务请求。

具体地，获取用户提出的服务请求，该服务请求中的服务信息序列包括服务名称、服务指令数、服务所需内存、服务所需CPU资源，服务最晚执行时间等。

S120、根据服务请求的服务名称获取服务组件集和服务集。

具体地，通过服务名称分类查询服务组件库中的可用组件，获得服务组件集，并将所有的服务请求作为服务集。

S130、根据服务组件集和服务集构建服务请求模型。

根据服务组件集和服务集，本发明实施例服务组件集的表达式可以为：

V＝{v₁,v₂,…,v_i,…,v_m}

其中，V代表服务组件的集合；m代表云网络中可用服务组件的总数；v_i代表第i个组件节点。

服务组件库中的每个服务组件均有其自己的服务资源，例如CPU(中央处理器)、RAM(随机存取存储器)和带宽等。

用户集的表达式可以为：

U＝{u₁，u₂，...，u_j，...，u_n}

其中，U代表用户集；n代表总用户数；u_j代表第j个用户。

u_j中包含用户所需服务序列，如u_j＝{s_j1，s_j2，...，s_jp}；其中，p为单个用户的服务总数。总服务集为S，需要处理的服务请求数为q；其中用户u_j中服务s_jk被分配给组件v_i由s_jki表示，所以第i个服务组件的服务可以由v_i＝{s_abi，s_cdi，...，s_yzi}表示，服务集为S。将服务组件集和服务集构建为服务请求模型。

S200、根据评价指标和约束条件构建服务请求模型的适应度函数；其中，评价指标为服务执行时间和服务执行成本；约束条件为资源利用率和服务执行超时率。

具体地，服务执行时间即目标系统完成最后一个服务的时间，每一个服务组件都有不同的服务执行时间来完成由服务实行时间确定的服务；服务执行成本则可以根据CPU使用成本、内存使用成本以及带宽使用成本来确定；资源利用率是根据发送到不同服务节点的资源负载率和系统平均负载率的差异而确定的；超时率则由超过最晚完成时间的服务数以及服务集中的总服务数确定。步骤S200包括以下步骤S210～S280：

S210、计算每个服务组件中的服务执行总时间。

本发明实施例计算每个服务组件中服务执行总时间的表达式为：

其中，ET(v_i)是每个组件的服务执行总时间；ExtTime(s_jki)代表服务s_jk在组件v_i中处理的执行时间。length(s_jk)代表服务s_jk的长度，服务的长度根据其指令数确定；CPU(v_i)是处理服务s_jk的组件的CPU速率。

S220、根据服务执行时间总时间确定所有组件中执行总时间的最大值以及完成所有服务所需的最小完成时间。

具体地，根据服务执行总时间确定所有组件中执行总时间的最大值以及完成所有服务所需的最小完成时间，上述执行总时间最大值的表达式可以为：

Makespan＝Max(ET(v_i))，1≤i≤m

其中，Makespan代表执行总时间最大值；ET(v_i)代表每个组件的服务执行总时间；m代表云网络中可用服务组件的总数；v_i代表第i个组件节点。

上述最小完成时间是执行总时间最大值的下限，其表征目标系统完成所有服务所需的最短时间，最小完成时间的表达式可以为：

MinMakespan＝Min(ET(v_i))，1≤i≤m

其中，MinMakespan代表最小完成时间；ET(v_i)代表每个组件的服务执行总时间；m代表云网络中可用服务组件的总数；v_i代表第i个组件节点。

S230、根据服务执行时间和最小完成时间构建服务请求模型中服务执行时间的适应度函数。

具体地，根据上述服务执行时间和最小完成时间可以构建服务请求模型中服务执行时间的适应度函数，本发明实施例的服务执行时间适应度函数表达式可以为：

其中，F₁代表服务执行时间适应度函数值；Makespan代表执行总时间最大值；MinMakespan代表最小完成时间。

S240、计算每个服务组件上处理的所有服务的服务执行成本总和。

具体地，本发明实施例计算每个服务组件上处理的所有服务的服务执行成本总和表达式可以为：

其中，Cost(s_jki)代表每个服务组件上的服务执行成本总和；c1代表时间单位的CPU使用成本；c₂代表时间单位的内存使用成本；c₃代表单位时间的带宽使用成本。

根据每个服务组件上的服务执行成本总和计算在所有组件上处理所有服务的成本总和，表达式为：

其中，TCost代表所有组件的服务执行成本总和；Cost(s_jki)代表每个服务组件上的服务执行成本总和；m代表云网络上所有服务组件总数；n代表总用户数；p代表单个用户的服务数。

S250、根据服务执行成本总和确定服务组件处理的服务执行成本最小值。

具体地，根据服务执行成本总和确定服务组件处理的服务执行成本最小值，其表达式可以为：

其中，MinTCost代表服务执行成本最小值；Cost(s_jki)代表每个服务组件上的服务执行成本；m代表云网络上所有服务组件总数；v_i代表第f个组件节点。

S260、根据服务执行成本总和以及服务执行成本最小值构建服务请求模型中服务执行成本的适应度函数。

具体地，根据上述服务执行成本总和以及上述服务执行成本最小值构建服务请求模型中服务执行成本的适应度函数，该适应度函数的表达式可以为：

其中，F₂代表服务执行成本的适应度函数值；MinTCost代表服务执行成本最小值；Cost代表所有组件的服务执行成本总和。

S270、计算资源利用率以及超时率。

具体地，资源利用率是根据发送到不同服务节点的资源负载率和系统平均负载率的差异而确定的。v_i的节点负载率L_i的表达式可以为：

其中，L_i代表服务组件节点v_i的节点负载率；TC_i代表服务组件节点v_i上可用的总CPU资源；RC_i代表服务组件节点v_i上处理分配的服务所需的CPU资源；TM_i代表服务组件节点v_i上可用的总内存；RM_i代表服务组件节点v_i上处理分配的服务所需的内存；ω₁代表CPU的权重，ω₂代表内存的权重，ω₁+ω₂＝1。

目标系统的平均负载率AL的表达式可以为：

其中，AL代表目标系统的平均负载率；m为云网络中所有服务组件总数；L_i代表服务组件节点v_i的节点负载率。

根据上述表达式，本发明实施例的资源利用率表达式为：

其中，G₁代表资源利用率；AL代表目标系统的平均负载率；L_i代表服务组件节点v_i的节点负载率。

超时率则由超过最晚完成时间的服务数以及服务集中的总服务数确定，当资源分配超出最晚完成时间则会造成故障，即此服务分配失败。在本发明的实施例中，资源分配超时率的表达式可以为：

其中，G₂为超时率；l为超出最晚完成时间的服务数，q为服务集S中的总服务数。

S280、根据服务执行时间的适应度函数、服务执行成本的适应度函数、资源利用率以及超时率构建服务请求模型的适应度函数。

具体地，根据服务执行时间的适应度函数、服务执行成本的适应度函数、资源利用率以及超时率构建服务请求模型的适应度函数，该服务请求模型的适应度函数可以为：

F＝γ₁·F₁+γ₂·F₂

G₁＜μ

G₂＜σ

其中，F为服务请求的适应度函数，γ₁和γ₂是执行时间、总成本之间的平衡系数，μ和σ为约束函数系数。

通过求解该服务请求模型的适应度函数，可以在约束条件下最大化适应度函数F可以得到更好的服务组件资源调度序列。

S300、采用人工蜂群算法和Q-learning算法结合求解适应度函数，将适应度函数的值满足误差条件的调度方案确定为优化目标。

具体地，步骤S300包括以下步骤S310～S390：

S310、初始化蜂群、食物源并配置算法参数。

具体地，初始化蜂群，生成食物源，并配置算法参数；其中，算法参数包括蜂群总数、雇佣蜂数量、跟随蜂数量、最大迭代次数。食物源是随机生成的，其随机生成表达式为：

其中，

是第j个优化参数的下界，

是第j个优化参数的上界。

S320、根据Q-learning算法构建Q表；其中，Q表用于存储所有预期状态、行动以及Q值；Q值由状态以及行动组合确定。

具体地，Q-learning算法的主要目的是通过智能体和环境之间的试错学习，智能体能够通过状态接收环境状况，选择影响环境的行动以获得最佳回报，并从过去的错误中进行学习。由于环境的不确定性，智能体选择对相同的情况或状态执行相同的操作，但不一定能获得相同的结果。在本发明实施例中，环境中的状态集B＝{b₁，b₂，...，b_m}，则每个状态都有动作集A＝{a₁，a₂，...，a_m}，智能体在状态b_t的t时刻选择行动a_t，通过过渡过程进入下一个状态b_t+1，通过过渡过程，从环境中获得奖励r_t+1；其中b_t∈B，a_t∈A，b_t+1∈B。

创建一个Q表用于存储所有预期的状态、行动以及Q值；Q值由状态以及行动组合确定。要处理这些服务，必须选择适当的操作来最大化每个状态的Q值，Q值函数取决于状态中动作的选择。本发明实施例中的Q值计算公式可以为：

其中，Q_t+1(b_t，a_t)是在t+1时刻的Q值；α是学习率，由α＝1/(1+访问状态b_t的总次数)计算得出；a_t是在t时刻的学习率；γ(0＜γ＜1)是折扣系数，即前一个行动对后一个状态的影响；r_t是在状态b_t下执行行动所获得的惩罚或奖励；δ是过渡函数；

是对未来最佳值的估计，其通过调整a的值使得Q(b_t+1，a)最大化。

将Q表的初始值配置为0，蜂群通过Q值计算公式更新Q表值。

S330、在雇佣蜂阶段，雇佣蜂确定当前食物源的相邻食物源位置，根据相邻食物源的位置更新Q表。

具体地，在雇佣蜂阶段，雇佣蜂通过计算找到当前食物源

的相邻食物源

的位置。本发明实施例的雇佣蜂计算找到当前食物源的相邻食物源的位置的计算公式为：

其中，

是

均第j个优化参数；

是当前食物源

的第j个优化参数；k是食物来源的索引。

若新食物源

返回的适应度值大于当前食物源

即

则雇佣蜂用新的食物源代替当前食物来源，通过奖励选定的食物来源和惩罚当前的食物来源来更新Q表；其中，F是服务请求模型适应度函数。当新的食物源不能提供更好的适应度值，则新的食物源受到惩罚，当前食物源获得奖励。当雇佣蜂找到合适的食物源时，将更新Q表。

S340、在跟随蜂阶段，跟随蜂从Q表中根据轮盘赌方法随机选取雇佣蜂食物源；根据所选取的雇佣蜂食物源获取新食物源。

具体地，在跟随蜂阶段，跟随蜂从Q表中根据轮盘赌方法随机选择雇佣蜂的食物源，Q表中Q值越大的食物源被选择的概率越高。

在本发明实施例中，轮盘赌方法即表示食物源的Q值越大，轮盘面积越大，被选中的概率则越高。

S350、将新食物源替代所选取的雇佣蜂食物源。

S360、当新食物源适应度值超过所选取的雇佣蜂食物源，则更新Q值。

具体地，对于S350～S360，跟随蜂搜索新的食物源，用新的食物源取代当前的食物源，当新的食物源具有更高的适应度值，则更新Q值。在本发明实施例中，跟随蜂搜索食物源的计算公式为：

其中，

是邻近食物源

的优化参数；

是当前食物源

的第k个优化参数；

是区间[-1，1]上的随机数，

是随机选择引起的最佳食物源的优化参数。

S370、在侦查蜂阶段，当获取适应度值超过所选取的雇佣蜂食物源的新食物源失败的次数超过预定阈值，则随机搜索新的食物来源，并更新Q表；其中，适应度值由适应度函数计算得到。

S380、重复在雇佣蜂阶段，雇佣蜂确定当前食物源的相邻食物源位置，根据相邻食物源的位置更新Q表，直至达到最大迭代次数或Q表中的行动方案的适应度值满足误差条件。

具体地，重复步骤S330～S370，直至达到最大迭代次数或Q表中的行动方案适应度值满足误差条件。

S390、将Q表中的最终行动方案确定为最佳服务组件资源调度方案。

S400、根据优化目标进行服务组件资源调度。

本发明实施例具有如下有益效果：基于服务执行时间、服务执行成本来计算每个服务在服务组件的适应度值并选择合适的服务组件，在服务组件之间创建负载平衡，采用人工蜂群算法和Q-learning算法解决云计算中多用户并发下的服务组件资源调度问题，可以帮助人工蜂群算法更快地收敛，有助于确定合适可用资源环境的服务顺序，简单高效地确定最合适的服务调度方案，并且本发明实施例还具有收敛精度高、收敛速度快，时间复杂度低、探索度高的有益效果。

以下是本发明实施例提供的一个应用场景：

在本应用场景中，有服务组件集合V＝{v₁，v₂，v₃，v₄}，用户集U＝{u₁，u₂，u₃}，服务集S＝{s₁₁，s₁₂，s₁₃，s₂₁，s₂₂，s₃₁，s₃₂}。

根据评价指标和约束条件构建服务请求模型的适应度函数为：

F＝γ₁·F₁+γ₂·F₂

其中，

Makespan＝Max(ET(v_i))，1≤i≤m

MinMakespan＝Min(ET(v_i))，1≤i≤m

其中，F为服务请求的适应度函数，γ₁和γ₂是执行时间、总成本之间的平衡系数。ExtTime(s_jki)是服务s_jk在v_i中处理的执行时间，ET(v_i)是v_i上服务处理的总执行时间。length(s_jk)是服务s_jk的长度，服务的长度根据指令数确定，CPU(v_i)是用于处理服务s_jk的服务组件的CPU速率。Makespan是所有服务组件执行时间的最大值，MinMakespan是Makespan的下限，它是系统完成所有服务所需的最短时间。c1、c2、c3分别是v_i中时间单位的CPU使用成本、时间单位的内存使用成本和时间单位的带宽使用成本。总成本TCost计算为所有服务组件上处理的所有服务的执行成本的总和，MinTCost代表服务执行成本最小值。

约束条件为：

其中，L_i为每个组件节点之间的负载率，AL为系统的平均负载率，m是系统中的组件总数，l为超出最晚完成时间的服务数，q为服务集S中总服务数，μ和σ为约束函数系数。

在本应用场景中，采用人工蜂群算法和Q-learning算法结合求解适应度函数，将适应度函数满足误差条件的方案确定为优化目标，根据本发明实施例的步骤S300，具体为：

使用人工蜂群算法和Q-learning算法进行优化问题求解，初始化蜂群、食物源，随机生成食物源，如下式所示。设置Q表的初始值为0。

雇佣蜂使用下式找到当前食物源

的相邻食物源

的位置。

其中，

是

的第j个优化参数，k是食物来源的索引。

如果新食物源

返回的适合度值大于当前食物源

雇佣蜂用新的食物源代替当前食物，通过奖励选定的新食物来源和惩罚当前的食物来源来更新Q表值。

相反，如果新的食物源不能提供更好的适应度值，新的食物源就会受到惩罚，而当前的食物源就会得到奖励。每当雇佣蜂找到合适的食物源时，Q表就会更新。通过下式更新Q表值：

在跟随蜂阶段，跟随蜂根据轮盘赌方法，从Q表中的Q值中选择雇佣蜂的食物源，利用下式搜索新的食物源，用新的食物源取代当前的食物源，如果新的食物源具有更高的适应度值，那么Q值也将被更新。

其中

是邻近食物源

的优化参数，

是区间[-1，1]上的随机数，

是随机选择引起的最佳食物源的优化参数。

侦查蜂阶段：如果多次尝试寻找更好的附近食物源失败，该食物来源将被丢弃，雇佣蜂转为侦查蜂重新随机搜索新食物源，并更新Q表。

终止检验，求出本次迭代中最佳蜂群获取的最优解的适应度值，判断是否满足误差条件；若满足条件，则输出最优解；否则转步骤S4。所述终止条件为达到最大迭代次数或最优解的适应度值满足误差条件，满足适应度值最大值的解即为所求的最佳服务组件资源调度方案。

按照适应度函数最大值及其对应的全局最优服务组件调度方案对用户的请求提供组件服务。

其中t_a表示服务s_jki的执行时间。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims

1.一种资源调度方法，其特征在于，包括：

获取用户提出的服务请求，根据所述服务请求建立服务请求模型；

根据评价指标和约束条件构建所述服务请求模型的适应度函数；其中，所述评价指标为服务执行时间和服务执行成本；所述约束条件为资源利用率和服务执行超时率；

采用人工蜂群算法和Q-learning算法结合求解所述适应度函数，将所述适应度函数的值满足误差条件的调度方案确定为优化目标；

根据所述优化目标进行服务组件资源调度。

2.根据权利要求1所述的一种资源调度方法，其特征在于，所述获取用户提出的服务请求，根据所述服务请求建立服务请求模型，包括：

获取用户提出的服务请求；

根据所述服务请求的服务名称获取服务组件集和服务集；

根据所述服务组件集和所述服务集构建服务请求模型。

3.根据权利要求1所述的一种资源调度方法，其特征在于，所述根据评价指标和约束条件构建所述服务请求模型的适应度函数，包括：

根据服务执行时间构建服务执行时间的适应度函数；

根据服务执行成本构建服务执行成本的适应度函数；

计算资源利用率以及超时率；

根据所述服务执行时间的适应度函数、所述服务执行成本的适应度函数、所述资源利用率以及所述超时率构建所述服务请求模型的适应度函数。

4.根据权利要求3所述的一种资源调度方法，其特征在于，所述根据服务执行时间构建服务执行时间的适应度函数，包括：

计算每个服务组件中的服务执行总时间；

根据所述服务执行时间总时间确定所有组件中执行总时间的最大值以及完成所有服务所需的最小完成时间；

根据所述服务执行时间和所述最小完成时间构建服务请求模型中服务执行时间的适应度函数。

5.根据权利要求3所述的一种资源调度方法，其特征在于，所述根据服务执行成本构建服务执行成本的适应度函数，包括：

计算每个服务组件上处理的所有服务的服务执行成本总和；

根据所述服务执行成本总和确定所述服务组件处理的服务执行成本最小值；

根据所述服务执行成本总和以及所述服务执行成本最小值构建服务请求模型中服务执行成本的适应度函数。

6.根据权利要求4所述的一种资源调度方法，其特征在于，所述计算每个服务组件中的服务执行总时间的计算公式为：

7.根据权利要求5所述的一种资源调度方法，其特征在于，所述计算每个服务组件上处理的所有服务的服务执行成本总和，包括：

计算在服务组件中执行单个服务时的单个服务执行成本；

根据所述单个服务执行成本计算在所有组件上执行所有服务的总和，作为服务执行成本总和。

8.根据权利要求7所述的一种资源调度方法，其特征在于：

所述计算在服务组件中执行单个服务时的单个服务执行成本的计算公式为：

9.根据权利要求1所述的一种资源调度方法，其特征在于，所述采用人工蜂群算法和Q-learning算法结合求解所述适应度函数，将所述适应度函数的值满足误差条件的调度方案确定为优化目标，包括：

初始化蜂群、食物源并配置算法参数；

根据Q-learning算法构建Q表；其中，所述Q表用于存储所有预期状态、行动以及Q值；所述Q值由所述状态以及所述行动组合确定；

在雇佣蜂阶段，雇佣蜂确定当前食物源的相邻食物源位置，根据所述相邻食物源的位置更新所述Q表；

在跟随蜂阶段，跟随蜂从所述Q表中根据轮盘赌方法随机选取雇佣蜂食物源；根据所选取的雇佣蜂食物源获取新食物源；

将所述新食物源替代所选取的所述雇佣蜂食物源；

当所述新食物源适应度值超过所选取的所述雇佣蜂食物源，则更新Q值；

在侦查蜂阶段，当获取适应度值超过所选取的所述雇佣蜂食物源的所述新食物源失败的次数超过预定阈值，则随机搜索新的食物来源，并更新Q表；其中，所述适应度值由适应度函数计算得到；

重复所述在雇佣蜂阶段，雇佣蜂确定当前食物源的相邻食物源位置，根据所述相邻食物源的位置更新所述Q表，直至达到最大迭代次数或Q表中的行动方案的适应度值满足误差条件；

将所述Q表中的最终行动方案确定为最佳服务组件资源调度方案。

10.根据权利要求9所述的一种资源调度方法，其特征在于，所述Q值由所述状态以及所述行动组合确定，包括：

所述Q值的计算公式为：

其中，Q_t+1(b_t,a_t)是在t+1时刻的Q值；α是学习率；α_t是在t时刻的行动；á_t是在t时刻的最优行动；γ是折扣系数；r_t是在状态b_t下执行行动所获得的惩罚或奖励；δ是过渡函数；

是对最佳值的估计。