CN114490018A - 一种基于资源特征匹配的服务调度算法 - Google Patents

一种基于资源特征匹配的服务调度算法 Download PDF

Info

Publication number
CN114490018A
CN114490018A CN202111374590.0A CN202111374590A CN114490018A CN 114490018 A CN114490018 A CN 114490018A CN 202111374590 A CN202111374590 A CN 202111374590A CN 114490018 A CN114490018 A CN 114490018A
Authority
CN
China
Prior art keywords
service
resource
server
value
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111374590.0A
Other languages
English (en)
Inventor
刘博�
李玉金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202111374590.0A priority Critical patent/CN114490018A/zh
Publication of CN114490018A publication Critical patent/CN114490018A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

一种基于资源特征匹配的服务调度算法属于智能调度算法领域。本发明将资源特征匹配的机制引入服务调度算法中来解决在服务调度场景下面临的不能满足用户MQoS需求和不能充分利用资源的问题。通过引入资源特征匹配的概念,提高了执行效率,降低了能耗,并且支持动态调整优化方向。

Description

一种基于资源特征匹配的服务调度算法
技术领域
本发明属于智能调度算法领域,主要用来提高服务调度算法的执行效率和降低能源消耗。
背景技术
5G移动通信和物联网的发展带来运算和通信资源的供给量迅速提升,使得虚拟现实(VR)、自动驾驶等各类实时交互的应用飞速发展。人们在日常生活中的习以为常的很多需求,如车辆自动驾驶过程中对环境的识别和路径的规划,或者在云计算系统中面对纷繁复杂的各种用户请求,都是众多服务的集合。面对这些对数据吞吐量、用户密度、时延等指标要求都非常高的实时密集型服务,要保障它们在运行过程中的服务调度质量(QoS),服务调度算法的设计成为了关键问题。根据谷歌发布的调查报告,在数据中心中服务器的利用率仅在30%到60%之间,但是目前关于提高资源利用率的服务调度算法研究还比较少。传统的调度方法只考虑服务器是否满足服务的资源需求,没有考虑服务与服务器在资源特性上的匹配,在服务器资源动态变化的场景下,这会降低资源利用率和服务执行效率。另外,现有的算法仍然集中在保证用户的单一QoS要求,如执行时间、成本或能耗。这些研究都未能回答当前服务调度场景下面临的两个新挑战,即如何更有效地利用资源以及如何在实践中动态满足用户的MQoS要求。
以往的服务调度中,基于元启发式算法是常见的解决方案,这类算法的典型代表为遗传算法、蚁群算法和模拟退火算法等。虽然这类算法一般可以取得相对最优解,但是面对实时性和延迟敏感类服务时我们不仅需要更优解,还需要能够实时高效的调度算法。面对新的挑战,我们提出以资源特征匹配为核心的服务调度算法RFM-MQoS(ResourceFeature Matching)。该算法通过动态感知服务和资源集群的资源特征,提出了节能策略和效率策略两种调度策略,可以更合理地解决服务调度问题。首先,该算法根据一个服务的资源需求计算其资源倾向系数。而后,将服务画像进行分类,例如,将一个服务分为高计算能力和低带宽或低计算能力和高带宽两类。同样地,我们合理地评估当前闲置服务器的资源倾向,并根据两者的资源倾向合理地匹配服务和服务器。
据此,我们提出了两种基于资源适应性匹配的策略,即节能策略和效率策略。两者都是基于资源特征匹配的机制,但前者是基于"个体"的角度,通过优先考虑使用服务器自身当前资源利用率较高且与待调度服务有相同资源特征的服务器来减少服务资源的使用和能源消耗。后者基于服务和服务器在所有资源中的定位,为服务优先匹配资源更充足的服务器,减少服务调度中等待交换机带宽空闲的时间,提高调度过程中的负载均衡和时间性能。不仅如此,上述两种策略还可以结合使用,形成一个综合调度方案RFM-MQoS,可以适应用户不断变化的QoS需求。
发明内容
本发明的目的在于将资源特征匹配的机制引入服务调度算法中来解决在服务调度场景下面临的不能满足用户MQoS需求和不能充分利用资源的问题。通过引入资源特征匹配的概念,提高了执行效率,降低了能耗,并且支持动态调整优化方向。
对于服务调度过程中的能耗问题,关键的一点在于如何更有效地提高资源利用率,使得当前服务器能够承载更多服务,通过减少服务器的使用量来降低调度过程中的能量消耗。要实现这一点,我们应该从服务和服务器之间的资源特征因子适配的角度,找出如何在资源有限情况下实现服务器资源使用效率最大化,并为服务动态匹配最合适的服务器资源,以充分利用资源服务潜力。我们都知道,不同的服务有不同的资源要求。例如,数据库类型的服务要求高计算能力和低带宽,因为它们的数据量大,传输需求低。相反,传统web网络服务更关注能否快速响应,对计算能力的要求较低,这意味着它不太关注计算资源。我们不难看出,不同类型服务的资源需求有不同的倾向,如计算密集型或带宽密集型。同时,服务器中不同资源的剩余量也是随着托管服务的类型和数量而动态变化的,这意味着服务器的资源特性类型也在一直变化。为了给服务找到合适的服务器,在资源特征匹配中考虑服务的资源需求特征是否与服务器的剩余资源的特征匹配。这是一种基于个体的角度,希望通过为服务匹配相同资源特征并且当前资源利用率已经比较高的服务器。
如果我们要提高当前服务调度过程中执行效率,我们在服务与服务器资源特征匹配的情况下,还需要从一种“全局”的角度来调整资源的分配。在节能策略中,我们从"个体"的角度出发,希望提高当前使用的服务器的资源利用率。这种行为可能会使这部分资源被过度使用带来额外的时间负担。例如,在边缘计算环境下就可能会导致与高负荷服务器相连的交换机的带宽资源爆满,为分配给这些服务器的后续服务增加额外的延迟传输时间。因此,如果我们想优化整体执行时间,我们还需要一个新的服务调度策略,不仅要与资源特性相匹配,还要关注和保证服务调度过程的长期执行效率。在基于“全局”策略中,我们更加关注服务器的当前可用资源和整体可用资源之间的数值关系,以及在服务层面关注当前服务资源需求和所有执行服务的平均资源需求。在该策略中,我们希望通过在整个资源体系下通过更合理分配资源来保障其持续服务能力,从而提升整体的执行效率。
在上面,我们从"个体"和"全局"的角度设计了两种基于资源特征适应的新型高效资源分配策略。此外,我们还发现所提出的两种策略可以组合使用,组合后的算法可以满足用户在执行过程中的MQoS要求。此外,组合的算法还赋予了用户在调度过程中可以通过调整策略权重参数来改变优化方向的选择,从而灵活地适应用户的QoS要求。
上述机制解决了在服务调度过程中当前存在的实时性调度时不能满足用户的MQoS需求以及资源利用率不高的问题。例如在常见的边缘计算场景中,普遍由于边缘端的资源有限而不能有效处理时延敏感的服务而造成违反了服务调度质量的情况。原因就在于服务在调度时没有考虑与服务器在资源特征上是否匹配,也不能充分利用服务器的资源。该算法的通用性很强,结合资源特征匹配的策略可以对不同场景下的服务调度过程进行优化。
该算法的执行步骤如下:
步骤一:建立服务集群中的服务器拓扑结构
步骤二:接收服务信息,得到服务的资源倾向性系数。
步骤三:同步系统状态,得到当前所有可执行服务器的资源
步骤四:根据当前服务匹配策略为服务选择最佳主机
步骤五:反复执行步骤二到四直到处理完所有服务
附图说明
图1是服务类型图
图2是服务器集群拓扑结构图
图3是算法执行路径图
图4是资源特征匹配策略执行示意图
具体实施方式
以下结合实例与附图对本发明进行详细说明。
本发明的实施方式将以解决在边缘计算领域的服务调度难题为例,但算法本身广泛使用于各类服务调度问题。服务调度问题的典型场景有很多,如云计算资源或数据中心等领域,但是在这里我们选取难度比较大的边缘计算集群服务调度问题。这样选择的原因在于边缘计算集群中进行服务调度具有典型性和代表性,其本身能提供的资源有限,这意味着它作为最接近用户的资源提供点能否充分利用服务器资源和服务调度算法的高效与否,成为在整个网络体系中高效处理实时性服务并满足用户的QoS需求的关键。在该场景下,服务调度算法更需要高效决策和合理利用资源。
在该场景下的服务调度问题可以描述如下,服务分为很多类型,在这里我们以最常用的Web、Db、Proxy和App四种服务为例。如图1所示,不同服务对于资源的需求各不相同,不同类型服务按照时间顺序依次到来。在服务到来时,控制器(Controller)会收集当前所有可执行的服务器信息,然后按照当前选择调度算法策略为到来的服务匹配合适的服务器主机,最后经过交换机将服务传递到对应的服务器主机上执行。最终以服务调度过程中的能量消耗和服务的执行时间作为最终评判标准,并的出最佳的服务和服务器的对应调度关系,处理能耗和执行时间等信息。下面是详细的步骤说明。
步骤1:针对服务调度问题建模边缘服务集群
边缘计算的计算节点中要完成整体执行服务流程需要很多不同种类的物理资源,在这里我们进行了合理简化,主要考虑组成集群主要物理拓扑结构的交换机和服务器。待调度的服务在具体服务器中被分配到需要的资源后执行,服务的执行状态和所在的虚拟机通过交换机进行传递。如图2所示,整个边缘计算场景中,控制器是核心,它不仅连接到核心交换机而且在这里还产生承载服务的虚拟机,并最终决定为服务匹配到哪一个服务器。交换机是分级的,边缘交换机(Edge Switch)负责具体连接到具体执行的若干服务器主机。边缘交换机一方面从核心交换机中得到服务所在的虚拟机并根据分配结果将其放置到具体服务器中执行,另一方面不断收集和更新当前服务器中资源的使用状况为控制器的决策提供信息。
步骤2:接收服务信息,得到服务的资源倾向性系数。
当服务到来后,根据服务的资源需求和以往已执行服务的调度信息我们可以得到当前服务资源特征的两个系数,我们分别命名为资源倾向性系数和资源偏斜系数。其中,资源倾向性系数是从服务自身的资源需求出发,描述其资源需求特征的参数。相反的,资源偏斜系数会根据所有服务资源需求的整体资源分布来计算得到的一个描述当前服务资源需求特征,他们将被分别应用于不同的调度策略中。由于服务调度中的资源种类在不同场景下不尽相同,为了便于说明,在这里我们选择最常见的算力(Mips)和带宽(Bw)资源为例,其中服务j的资源倾向性系数
Figure BDA0003363380390000051
的公式如下:
Figure BDA0003363380390000052
在这里服务j的资源倾向性系数
Figure BDA0003363380390000053
的值由服务j的算力资源需求量
Figure BDA0003363380390000054
和带宽资源需求量
Figure BDA0003363380390000055
之比组成。这个比值可以对当前服务j自身的资源特征进行准确定位,该值大于1时我们可以将它划分为高算力低带宽需求类型的服务,否则为高带宽低算力需求的服务。我们可以根据服务j的资源倾向性系数对其进行资源特征画像,为后续匹配具体的服务器提供依据。
服务j的资源偏斜系数比率值
Figure BDA0003363380390000056
是我们对当前的服务j资源需求特征的“全局”评估值,该值是由服务j的不同资源偏置因子进行综合评估得到的。不同资源的偏置系数实质上是服务j在某资源的需求量与之前所有使用了该资源的服务对资源平均占用值的比值。假设要分配的服务是服务j,并且在此之前的所有服务数总量是M,服务j的资源偏斜系数公式如公
式2所示:
Figure BDA0003363380390000057
其中
Figure BDA0003363380390000058
Figure BDA0003363380390000059
分别是服务j的算力和带宽的资源需求量,它们分别减去之前所有服务算力
Figure BDA00033633803900000510
和带宽需求量
Figure BDA00033633803900000511
的平均值后,然后将两个差值的比值作为服务j的资源偏斜系数。服务j的资源偏斜系数与服务资源倾向性系数类似但不相同,前者是由服务自身资源需求决定的,后者则是服务j的资源需求量与所有执行服务的平均资源需求量的比例关系,显然资源偏斜系数会更加全面的为服务j的整体资源特征定位。两个不同的资源特征系数是为不同的调度策略服务,在下面的步骤四中会详细描述这一点。
步骤3:同步系统状态,得到当前所有可执行服务器的资源特征
每次服务到来后,要将服务调度到一个合适的服务器主机执行需要对服务器当前资源特征定位,以便用来与服务进行基于资源特征匹配。在此之前我们还需要更新当前系统中可执行服务器的资源使用情况,这些将会是我们对服务器资源特征定位的依据。与服务的资源特征评估过程类似,在服务器状态更新后,我们使用当前服务器各类资源使用率和集群中所有可执行服务器的资源使用率分别求得服务器的自身资源倾向性系数和在整体服务器中的资源偏斜系数。其中服务器i的倾向性系数
Figure BDA0003363380390000061
的公式如下所示:
Figure BDA0003363380390000062
从公式3中,我们可以看到服务的资源倾向性系数是服务器的算力资源剩余率Serveri freeMipsPer和带宽资源剩余率ServerfreeBwPer的比值。这个比值可以真实反映出当前服务剩余资源可服务能力的倾向性,当这个值大于1时我们认为服务器当前处于算法资源充足型,否则认为当前服务器处于带宽资源密集状态。后续我们可以根据服务器的资源倾向性为其分配同样类型需求的服务,这样可以有效提高服务器资源的使用效率,保持各类型资源消耗速度相对均衡,避免出现因为某种资源被过度使用后出现该服务器其他资源无法使用的现象。
从服务器自身资源的倾向性系数作为资源特征定位虽然合理的,但有时也会带来一些执行效率负担。例如若该服务器的资源偏向系数大于1(即处于算力资源相对充足状态),按照资源特征匹配规则我们应该为其分配算力资源需求密集型的服务。若当前服务器的带宽资源在整体服务器集群中仍然属于较多的,继续为其分配算力密集需求型服务将会降低整体系统对于非算力密集型服务的处理能力,不可避免造成整体服务执行时间和效率的降低。在这里我们提出了新的基于全局的资源偏斜系数
Figure BDA0003363380390000071
的概念来解决上面提到的挑战,服务器i的资源偏斜系数计算公式如公式4所示:
Figure BDA0003363380390000072
Figure BDA0003363380390000073
计算时需要将服务器的各类型剩余资源与服务器集群整体资源的剩余量,如总带宽剩余资源
Figure BDA0003363380390000074
或总算力剩余资源
Figure BDA0003363380390000075
进行除法运算,整理后再求得不同资源的偏斜系数的比值。这个比值可以从整体角度为更合理的利用集群资源提供依据,如果该值大于1 说明此时服务器i的剩余资源在整体系统中属于偏斜算力类型的服务器,后续应该更多的调度算力密集型服务在服务器i上处理,反之则应该更多的处理带宽密集型服务。注意,此处资源类型可以为其他类型,这里只是选取了常见的算力和带宽。
步骤4:根据服务匹配策略为服务选择最佳主机
在获得服务和服务器各自的资源倾向性系数和资源偏斜系数后,要合理分配资源使用和对服务调度还要经过服务策略的决策。在我们在提出具体的RFM-MQoS算法前,先分别介绍我们基于资源倾向性系数的“个体”视角和基于资源偏斜系数的“总体”视角提出的两种实时性服务调度策略:节能策略和效率策略。其中,节能策略匹配公式如下:
Figure BDA0003363380390000076
Figure BDA0003363380390000077
表示服务器i在节能策略下被服务j选择时的适配程度值,由服务器i的当前资源倾向参数
Figure BDA0003363380390000078
和服务j的资源需求倾向参数
Figure BDA0003363380390000079
的差值确定。两个资源需求倾向性系数差值越小,意味着服务器i和服务j的在资源特性上适配程度越高,服务在调度时会为其选择适配程度最高的服务器来执行。从公式5中可以看出,节能策略的本质是为服务j 选择资源特性相同且自身负载程度相对较高的服务器i,这样选择的目的是寻找既符合当前服务资源特征可以最大化资源利用效率同时提升该服务器的资源利用率。这种着力于提升服务器的服务承载率和资源利用率的调度策略可以有效降低整体能耗,因为如果同一个服务器能够处理比以往更多的服务意味着我们需要使用的服务器数量更少。
在节能政策中,我们采取“个体”的视角,更关注服务器的资源利用率和服务本身的资源需求偏向系数,并希望提高当前使用的服务器的资源利用率。这种行为可以有效降低调度过程中的能耗,但是会可能导致链接到这些高负载服务器的交换机的带宽资源需求量激增,从而为分配给这些服务器的后续服务增加额外的延迟传输时间。在带宽资源紧张且目标是解决延迟敏感服务的边缘计算环境中,这几乎是不可容忍的。因此,如果我们想要优化整体执行时间,我们还需要一种新的服务调度策略,该策略不仅要匹配资源特性,而且要确保服务调度过程的长期执行效率。事实上,当面对上述挑战时,使用“全局”观点并对服务调度执行过程优化的效率策略提出了一种可行的方法。在该策略中,我们更加关注服务器的当前可用资源与总体可用资源之间,以及当前服务资源需求和所有已执行服务的平均资源需求的比例关系。效率策略公式如公式6所示:
Figure BDA0003363380390000081
Figure BDA0003363380390000082
是在效率策略下服务器i对服务j的效率资源特征适配值,该值是服务器i的全局资源偏差系数
Figure BDA0003363380390000083
与服务j的资源偏差系数
Figure BDA0003363380390000084
的比值。该值越大,我们认为当前服务器i对服务j的“总体”资源偏差的适应度越高。通过计算服务j的当前服务器i的适应度值
Figure BDA0003363380390000085
我们试图从“全局”角度为当前服务j选择最适合的服务器 i。这种策略将会有效减少因为部分服务器被过度分配资源导致局部交换机的带宽满载的问题,并在调度过程中为服务器的负载平衡和执行效率提供保障。
在服务调度过程中,用户可以针对不同的QoS需求使用相应的资源调度策略,例如对于能耗更为敏感的用户可以选择使用节能调度策略来指导调度过程中服务的分配问题,不同服务调度策略的实质在于服务执行服务器的选择。应该注意的是,用户对服务质量的要求有时并不是单一的,而是多方面的,例如用户既希望能够适度降低能耗同时不带来额外的时间负担。面对用户这类MQoS需求,我们可以将节能策略和效率策略结合使用来解决此问题,我们将这种方法称为RFM-MQoS算法,即一种基于资源特征匹配可满足用户MQoS需求的算法。其公式如公式7所示:
Figure BDA0003363380390000091
在研究中,我们融合了这两个策略公式。通过将这两种策略相结合,我们同时对服务调度过程中的能耗、执行时间和负载均衡等方面同时进行了优化。
Figure BDA0003363380390000092
表示服务器i与服务j的综合适配值,该值是由两者的节能适配程度值
Figure BDA0003363380390000093
和效率适配程度值
Figure BDA0003363380390000094
得出的。注意此处α和β为两个适配公式值的权重参数,取值范围从0到1之间。在这里我们统一设定为0.5,这样可以在节能和效率之间取得均衡,此时与传统算法相比,RFM-MQoS可以兼顾降低能耗和提高效率。权重参数的增加可以调整优化方向,例如如果α逐渐趋近于1,则此时调度效果与节能策略的结果逐渐接近。
在资源动态变化的服务调度场景中,这些基于服务器和服务资源特征适应程度的策略能够有效提高服务器资源使用效率和整体服务执行效率。值得注意的是,RFM-MQoS算法不仅满足了用户的MQoS需求,而且支持通过调整策略的权重参数α和β来调整当前调度的优化方向,这一机制是对不断变化的用户QoS需求的动态适应。综上,我们提出并实现基于资源特征匹配的服务调度策略,它们可以充分利用边缘计算节点的服务潜力,解决了如何有效利用资源和动态适应FEC环境中用户QoS需求变化的挑战。
步骤5:反复执行步骤二到四直到处理完所有服务
如图3的算法执行流程图所示,每一个服务到来后都会经历步骤二到步 骤四,从服务器的分配决策开始依次经历交换机传输,服务器上执行,执行 结束释放服务器资源等阶段。根据资源特征匹配的服务调度后,可以有效提 高同一服务器的资源承载量和执行效率。在使用同样的Server1到Server4 服务器中且处理相同的待调度服务的情况下,传统的按照时间顺序依次分配 算法因为服务分配不合理,不能充分利用服务器资源而且整个过程的能耗更 高。相反,如果我们使用了提出的资源特征匹配的算法策略,不仅可以降低 能量消耗,而且提高了整体的执行效率。RFM-MQoS通过结合服务的历史调度 数据和服务器集群的不同资源利用率,从“个别”和“整体”的角度合理评 估服务器和服务的资源特性,并将服务调度到具有相同资源特性的服务器上 执行。此外,所提出的策略融合算法能够有效地响应用户动态变化的QoS需 求这些都有力的保障了服务调度过程中的用户的MQoS需求并赋予服务提供商 根据当前执行状态或者客户的服务需求动态调整优化方向的能力,最终使得 客服,服务提供商实现双赢,从而带来良好的经济和社会效益。
以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

Claims (1)

1.一种基于资源特征匹配的服务调度算法,其特征在于:
步骤1:针对服务调度问题建模边缘服务集群
整个边缘计算场景中,控制器是核心,它不仅连接到核心交换机而且在这里还产生承载服务的虚拟机,并最终决定为服务匹配到哪一个服务器;交换机是分级的,边缘交换机负责具体连接到具体执行的若干服务器主机;边缘交换机一方面从核心交换机中得到服务所在的虚拟机并根据分配结果将其放置到具体服务器中执行,另一方面不断收集和更新当前服务器中资源的使用状况为控制器的决策提供信息;
步骤2:接收服务信息,得到服务的资源倾向性系数;
当服务到来后,根据服务的资源需求和以往已执行服务的调度信息可以得到当前服务资源特征的两个系数,分别命名为资源倾向性系数和资源偏斜系数;
服务j的资源倾向性系数
Figure FDA0003363380380000011
的公式如下:
Figure FDA0003363380380000012
在这里服务j的资源倾向性系数
Figure FDA0003363380380000013
的值由服务j的算力资源需求量
Figure FDA0003363380380000014
和带宽资源需求量
Figure FDA0003363380380000015
之比组成;这个比值对当前服务j自身的资源特征进行准确定位,该值大于1时将它划分为高算力低带宽需求类型的服务,否则为高带宽低算力需求的服务;
服务j的资源偏斜系数比率值
Figure FDA0003363380380000016
是对当前的服务j资源需求特征的“全局”评估值,假设要分配的服务是服务j,并且在此之前的所有服务数总量是M,服务j的资源偏斜系数公式如公式2所示:
Figure FDA0003363380380000017
其中
Figure FDA0003363380380000018
Figure FDA0003363380380000019
分别是服务j的算力和带宽的资源需求量,它们分别减去之前所有服务算力
Figure FDA00033633803800000110
和带宽需求量
Figure FDA00033633803800000111
的平均值后,然后将两个差值的比值作为服务j的资源偏斜系数;
步骤3:同步系统状态,得到当前所有可执行服务器的资源特征
在服务器状态更新后,使用当前服务器各类资源使用率和集群中所有可执行服务器的资源使用率分别求得服务器的自身资源倾向性系数和在整体服务器中的资源偏斜系数;其中服务器i的倾向性系数
Figure FDA0003363380380000021
的公式如下所示:
Figure FDA0003363380380000022
从公式3中,服务的资源倾向性系数是服务器的算力资源剩余率Serveri freeMipsPer和带宽资源剩余率ServerfreeBwPer的比值;当这个值大于1时认为服务器当前处于算法资源充足型,否则认为当前服务器处于带宽资源密集状态;
提出了基于全局的资源偏斜系数
Figure FDA0003363380380000023
的概念,计算公式如公式4所示:
Figure FDA0003363380380000024
Figure FDA0003363380380000025
计算时需要将服务器的各类型剩余资源与服务器集群整体资源的剩余量,包括总带宽剩余资源
Figure FDA0003363380380000026
或总算力剩余资源
Figure FDA0003363380380000027
进行除法运算,整理后再求得不同资源的偏斜系数的比值;如果该值大于1说明此时服务器i的剩余资源在整体系统中属于偏斜算力类型的服务器,后续应该更多的调度算力密集型服务在服务器i上处理,反之则应该更多的处理带宽密集型服务;
步骤4:根据服务匹配策略为服务选择最佳主机
分别介绍基于资源倾向性系数的“个体”视角和基于资源偏斜系数的“总体”视角提出的两种实时性服务调度策略:节能策略和效率策略;其中,节能策略匹配公式如下:
Figure FDA0003363380380000028
Figure FDA0003363380380000029
表示服务器i在节能策略下被服务j选择时的适配程度值,由服务器i的当前资源倾向参数
Figure FDA00033633803800000210
和服务j的资源需求倾向参数
Figure FDA00033633803800000211
的差值确定;两个资源需求倾向性系数差值越小,意味着服务器i和服务j的在资源特性上适配程度越高,服务在调度时会为其选择适配程度最高的服务器来执行;
效率策略公式如公式6所示:
Figure FDA0003363380380000031
Figure FDA0003363380380000032
是在效率策略下服务器i对服务j的效率资源特征适配值,该值是服务器i的全局资源偏差系数
Figure FDA0003363380380000033
与服务j的资源偏差系数
Figure FDA0003363380380000034
的比值;该值越大,认为当前服务器i对服务j的“总体”资源偏差的适应度越高;通过计算服务j的当前服务器i的适应度值
Figure FDA0003363380380000035
试图从“全局”角度为当前服务j选择最适合的服务器i;
在服务调度过程中,用户针对不同的QoS需求使用相应的资源调度策略,如公式7所示:
Figure FDA0003363380380000036
在研究中,融合了这两个策略公式;通过将这两种策略相结合,同时对服务调度过程中的能耗、执行时间和负载均衡等方面同时进行了优化;
Figure FDA0003363380380000037
表示服务器i与服务j的综合适配值,该值是由两者的节能适配程度值
Figure FDA0003363380380000038
和效率适配程度值
Figure FDA0003363380380000039
得出的;注意此处α和β为两个适配公式值的权重参数,取值范围从0到1之间;在这里统一设定为0.5,
步骤5:反复执行步骤2到4直到处理完所有服务。
CN202111374590.0A 2021-11-19 2021-11-19 一种基于资源特征匹配的服务调度算法 Pending CN114490018A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111374590.0A CN114490018A (zh) 2021-11-19 2021-11-19 一种基于资源特征匹配的服务调度算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111374590.0A CN114490018A (zh) 2021-11-19 2021-11-19 一种基于资源特征匹配的服务调度算法

Publications (1)

Publication Number Publication Date
CN114490018A true CN114490018A (zh) 2022-05-13

Family

ID=81492244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111374590.0A Pending CN114490018A (zh) 2021-11-19 2021-11-19 一种基于资源特征匹配的服务调度算法

Country Status (1)

Country Link
CN (1) CN114490018A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115964184A (zh) * 2023-03-16 2023-04-14 北京大学 确定算力资源的方法,装置及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115964184A (zh) * 2023-03-16 2023-04-14 北京大学 确定算力资源的方法,装置及存储介质

Similar Documents

Publication Publication Date Title
Yi et al. A multi-user mobile computation offloading and transmission scheduling mechanism for delay-sensitive applications
Sun et al. Autonomous resource slicing for virtualized vehicular networks with D2D communications based on deep reinforcement learning
Qian et al. Survey on reinforcement learning applications in communication networks
Sun et al. Wireless channel allocation using an auction algorithm
Chen et al. Qoe-aware decentralized task offloading and resource allocation for end-edge-cloud systems: A game-theoretical approach
US20140229210A1 (en) System and Method for Network Resource Allocation Considering User Experience, Satisfaction and Operator Interest
CN107733689A (zh) 基于优先级的动态加权轮询调度策略方法
CN111614754B (zh) 面向雾计算的成本效率优化的动态自适应任务调度方法
CN108897606B (zh) 多租户容器云平台虚拟网络资源自适应调度方法及系统
CN108174397A (zh) 一种任务驱动的多网关协同方法
Zhou et al. Learning from peers: Deep transfer reinforcement learning for joint radio and cache resource allocation in 5G RAN slicing
CN111641973A (zh) 一种雾计算网络中基于雾节点协作的负载均衡方法
Guo et al. On-demand resource provision based on load estimation and service expenditure in edge cloud environment
WO2024094104A1 (zh) 一种动态反馈加权云存储资源调度方法、装置及设备
CN110519776A (zh) 一种雾计算系统中的均衡聚类和联合资源分配方法
CN113992677A (zh) 一种延迟与能耗联合优化的mec计算卸载方法
CN115629865A (zh) 一种基于边缘计算的深度学习推理任务调度方法
CN114490018A (zh) 一种基于资源特征匹配的服务调度算法
CN115714820A (zh) 一种分布式的微服务调度优化方法
Yuan et al. A computation offloading game for jointly managing local pre-processing time-length and priority selection in edge computing
CN108965168A (zh) 一种基于效用函数的车联网占优资源公平分配优化方法
CN113032146A (zh) 一种面向多接入边缘计算环境的健壮性服务供应方法
WO2023222061A1 (zh) 意图驱动的无线网络资源冲突解决方法及其装置
CN115604311B (zh) 一种面向服务网络的云端融合计算系统及自适应路由方法
Shuai et al. A cost-based distributed algorithm for load balancing in content delivery network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination