CN115208819A - 面向边缘服务系统的长效高性能服务调度与资源分配方法 - Google Patents
面向边缘服务系统的长效高性能服务调度与资源分配方法 Download PDFInfo
- Publication number
- CN115208819A CN115208819A CN202210817875.5A CN202210817875A CN115208819A CN 115208819 A CN115208819 A CN 115208819A CN 202210817875 A CN202210817875 A CN 202210817875A CN 115208819 A CN115208819 A CN 115208819A
- Authority
- CN
- China
- Prior art keywords
- service
- edge
- server
- delay
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013468 resource allocation Methods 0.000 title claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 43
- 230000005540 biological transmission Effects 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013439 planning Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/121—Shortest path evaluation by minimising delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
- H04L43/0864—Round trip delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及面向边缘服务系统的长效高性能服务调度与资源分配方法,包括:将成本效益高的边缘服务供应问题建模为一个组合优化问题,旨在在边缘计算环境中,在成本和资源限制的约束下,尽量减少平均服务响应时间。本发明的有益效果是:本发明实现了在线环境中,在满足成本和资源约束的情况下,长效平均服务响应时间的最小化,进而在边缘服务器资源受限的情况下,提升了用户的使用体验。
Description
技术领域
本发明涉及多接入边缘计算领域,更确切地说,它涉及面向边缘服务系统的长效高性能服务调度与资源分配方法。
背景技术
随着移动服务和移动设备的快速增长,我们现在正在拥抱智能移动计算的时代。根据全球移动通信系统协会的报告,全球约有51亿人订阅了移动服务,在2025年之前,这一数字将以平均年增长率1.9%的速度增长。与此同时,到2024年,全球蜂窝式物联网连接数预计将达到32亿次。
然而,由于信道的不稳定和移动设备资源的不充足,用户有时可能无法获得高效和无缝的体验。为了解决这些相关问题,研发人员提出了多接入边缘计算(Mobile EdgeComputing,MEC)这种计算范式。MEC优化了移动资源使用和无线网络,以提供上下文感知服务。在MEC范式中,用户可以通过无线网络低延迟地连接到附近的边缘服务器,并使用边缘服务器的资源来完成常规计算范式中或是使用本地资源或是使用云端资源来执行的任务。此外,借助群集管理技术(例如EdgeSite),边缘服务器可以相互协调以充分利用计算资源,如某一边缘服务器可以将用户的请求分派给另一个可以处理该用户请求的服务器。此外,借助Kubernetes等平台即服务(PaaS)技术,即可轻松将边缘服务器资源分配给以服务为载体的计算模块。但是,这些优点不能成为在MEC环境中进行粗糙的资源分配和服务调度的原因。假设基于MEC架构的服务供应系统中,我们为热门服务分配的资源很少(例如分配了较小带宽给热门视频),或者让不稳定的网络连接承担了大流量,又或者向拥有足够资源的服务只发送少量请求,那么该服务供应系统既不能满足用户的高质量体验需求,也不能满足服务供应方的高性能供给需求(尤其是当这些服务是使用广泛的计算密集、数据密集的AI服务时)。因此,我们必须谨慎的规划基于MEC架构的服务供应系统中的资源分配与服务调度方案。
发明内容
本发明的目的是克服现有技术中的不足,提供了面向边缘服务系统的长效高性能服务调度与资源分配方法。
第一方面,提供了面向边缘服务系统的长效高性能服务调度与资源分配方法,包括:
S1、获取边缘服务供应系统中边缘服务器到用户端的数据无线传输延迟矩阵lA;
S3、获取任意两台边缘服务器hj和hk之间的数据传输延迟和传播延迟进一步得到关于服务请求经过边缘服务器路由的有线传输延时lR与回传延时lB(都由三维矩阵表示)。其中,关于服务i的请求从服务器hj路由到服务器hk的有线传输延时为 回传延时为
S5、计算在单位时间内各边缘服务器所能够处理的各任务的平均处理数矩阵γ(其中,边缘服务器hk对服务i的处理能力记为γk,i);其中边缘服务器对所有任务的处理能力总和要满足资源上限约束;
S6、获取各服务的请求到达各个边缘服务器的到达率,根据每个服务请求经由接入边缘服务器路由到执行边缘服务器的概率计算出每个边缘服务器实际处理的平均请求到达率,并结合单位时间内各边缘服务器所能够处理的各任务的平均处理数矩阵γ,计算出系统对每个请求的处理时延矩阵lE;
S7、根据所述服务请求的无线传输延迟lA、有线传输延时lR、回传延时lB、处理时延lE和回调时延lU获得边缘服务供应系统中任意服务请求所需要的平均处理延迟三维矩阵l;
作为优选,S1中,数据传输延迟矩阵lA的每行对应一个服务,每列对应一台边缘服务器,每个元素由服务平均输入数据大小dI与边缘服务器和使用该服务的客户端间的数据传输速率v相除得到。
作为优选,S3中,lR与lB均为三维矩阵,其中每个元素为关于服务i的请求经由边缘服务器j路由到边缘服务器hk时所产生的数据传输延迟;lR为输入数据在边缘服务器之间的传输延迟,lB为输出数据的总传输延迟。
作为优选,S5中,矩阵γ的第k行第i列元素γk,i为边缘服务器hk对服务i的处理能力,其数值由边缘服务器hk分配给服务i的资源μk,i除以每个服务所需的资源数wi计算得到;μk,i满足约束条件:其中即为边缘服务器hk的负载上限。
作为优选,S7中,任意服务请求所需要的处理延迟li,j,k包括:用户发起请求至接入服务器的时间接入服务器选择路径p转发至执行服务器的时长请求的处理时延服务器hk至hj的回传时延和服务器hj回传至用户的时延
第二方面,提供了一种计算机存储介质,所述计算机存储介质内存储有计算机程序;所述计算机程序在计算机上运行时,使得计算机执行第一方面任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。
第三方面,提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行第一方面任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。
本发明的有益效果是:本发明将成本效益高的边缘服务供应问题建模为一个凸优化问题,实现了在线环境中,在满足成本和资源约束的情况下,长效平均服务响应时间的最小化,进而在边缘服务器资源受限的情况下,提升了用户的使用体验。
附图说明
图1为本申请提供的边缘服务供应系统结构示意图;
附图标记说明:用户端1、接入服务器2、执行服务器3。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例1:
为了解决现有技术中,在边缘服务器资源受限的情况下,边缘服务供应系统不能满足用户的高质量体验需求的问题,本申请提供了面向边缘服务系统的长效高性能服务调度与资源分配方法,同时考虑了资源分配和服务调度,包括:
S1、获取边缘服务供应系统中边缘服务器到用户端的数据传输延迟矩阵lA。
如图1所示,边缘服务供应系统包括用户端1、接入服务器2和执行服务器3,用户端1、接入服务器2和执行服务器3之间通信连接。在边缘服务供应系统中,用户端1首先向接入服务器2发起请求,该接入服务器2将接收到的请求通过某一路径路由到执行服务器3,执行服务器3在请求执行完毕后向接入服务器2回传返回数据,最后接入服务器2向用户端1返回数据。
此外,本申请不对获取数据传输延迟矩阵lA的方式进行限定,在一种可选的实现方式中,可以收集并统计边缘服务供应系统中所部署服务的平均所需输入数据量大小以及各边缘服务器与它们所服务用户的平均数据传输速度vj,并通过计算获取边缘服务供应系统中边缘服务器到用户端的数据传输延迟矩阵lA,表示为:
上述数据传输延迟矩阵lA的每行对应一个服务,每列对应一台边缘服务器,每个元素由服务平均输入数据大小dI与边缘服务器和使用该服务的客户端间的数据传输速率v相除得到。
S2、获取任意两个边缘服务器hj和hk之间的路径集合Φj,k。
需要说明的是,边缘服务供应系统包含多个边缘服务器,本发明将边缘服务供应系统中的边缘服务器集合用H进行表示,并将该边缘服务器集合H中的第j个边缘服务器和第k个边缘服务器分别用边缘服务器hj和边缘服务器hk进行表示。
此外,边缘服务供应系统具有服务器连接拓扑结构,可以根据该结构计算任意两个边缘服务器hj和hk之间的路径集合Φj,k,其中第p条路径可以表示为: 此外,|Φj,k|为路径数量,为对关于服务si的请求选择路径p进行从服务器hj路由至hk的概率,且
S3、获取任意两台边缘服务器hj和hp之间的数据传输延迟和传播延迟进一步得到关于服务i的请求从服务器hj路由到服务器hk的传输总延迟并根据各服务的输出数据大小Oi以及各边缘服务器之间的数据传输带宽Bj,k和边缘服务器到用户端的数据传输速度vj,计算出返回数据的传输延迟三维矩阵该返回数据的传输延迟三维矩阵也可以称为回传时间。
需要说明的是,本发明将边缘服务供应系统中的服务集合用S进行表示,该服务集合S中的第i个服务用服务i进行表示。
并且,lR与lB均为三维矩阵(M*N*N,其中M为服务数,N为边缘服务器数),其中每个元素为关于服务i的请求经由边缘服务器j路由到边缘服务器k时所产生的数据传输延迟;lR为输入数据在边缘服务器之间的传输延迟,lB为输出数据的总传输延迟,也就是边缘服务器之间的延迟加上边缘服务器到用户端之间的延迟。
S4、获取边缘服务器将服务请求结果返回给用户的回调时延lU。
S5、根据系统中处理每个服务对应的请求所需要的资源数矩阵μ/工作负载wi,以及各边缘服务器对系统中各个服务的处理能力μk,i,计算在单位时间内各边缘服务器所能够处理的各任务的数量其中边缘服务器对所有任务的处理能力总和要满足资源上限约束μ*,即
矩阵γ中,其中每行对应一个边缘服务器,每列对应一个服务。矩阵γ的第k行第i列元素γk,i为边缘服务器hk对服务i的处理能力,其数值由边缘服务器hk分配给服务i的资源μk,i除以每个服务所需的资源数wi计算得到;μk,i满足约束条件:其中即为边缘服务器hk的负载上限。
S6、获取各服务的请求到达各个边缘服务器的到达率Λj,i,根据每个服务请求经由接入边缘服务器j路由到执行边缘服务器hk的概率计算出每个边缘服务器实际处理的平均请求到达率即单位时间内关于各个服务的请求需要被边缘服务器hk进行处理的数量。并结合单位时间内边缘服务器对个服务请求的处理数量γk,i,计算出系统对每个请求的处理时延矩阵lE。示例地,在已知单位时间内边缘服务器对个服务请求的处理数量γk,i的情况下,可以根据M/M/1排队模型中的里特尔规则(Little’s law),计算系统对每个请求的处理时延矩阵lE。
S7、根据所述信息获得边缘服务供应系统中任意服务请求所需要的处理延迟li,j,k。
在S7中,任意服务请求所需要的处理延迟li,j,k包括:用户发起请求至接入服务器的时间接入服务器选择路径p转发至执行服务器的时长请求的处理时延服务器hk至hj的回传时延和服务器hj回传至用户的时延其中,li,j,k也可以称为单个请求的生命周期的所需的总时长为li,j,k。可以表示为:
S9、获取各服务请求的一个闭环处理在整个系统中所占的比重,并计算边缘服务供应系统的平均时延示例地,该比重可以根据各服务请求对边缘服务器的请求到达率以及各服务请求在边缘服务器之间的路由概率计算得到。比如,各服务请求的一个闭环处理在整个系统中所占的比重Pr(Ai,j,k)可以表示为:其中,由此计算出整个系统的平均时延
S11、对目标函数El进行最小化求解,以求得三维矩阵矩阵μ和矩阵也就是求取任意两台服务器之间数据传输的路径选择概率,每台边缘服务器针对每个服务所提供的处理能力,以及一个服务请求经由一台边缘服务器路由到另一台边缘服务器的概率。
为了简化问题求解,本发明将该问题分为两个子问题,第一个子问题求解最佳路径规划,第二个子问题对资源分配和请求路由进行优化。
通过一定数学推导,本发明将最佳路径规划子问题建模为如下:
此外,通过一定数学推导,结合李雅普诺夫优化框架,本发明可以得到资源分配和请求路由子问题的优化模型:
其中Fi,j,k为路径规划子问题中求解的最佳路径的最佳传输时延,c(t)为t时间片时李雅普诺夫优化框架中的积压队列长度。
S12、根据三维矩阵矩阵μ和矩阵进行对每个边缘服务器针对每一种服务提供处理能力的资源分配,设置将每种服务请求路由到其他边缘服务器的概率参数以及对路径的选择概率,即可在给定成本约束以及各边缘服务器负载上限的情况下,实现边缘服务供应系统的处理时延最小化。
综上所述,本发明提供的面向边缘服务系统的长效高性能服务调度与资源分配方法,实现了在线环境下,进行对每个边缘服务器针对每一种服务提供处理能力的资源分配,设置将每种服务请求路由到其他边缘服务器的概率参数以及对路径的选择概率进行决策,即可在给定成本约束以及各边缘服务器负载上限的情况下,实现边缘服务供应系统的处理时延最小化。
Claims (10)
1.面向边缘服务系统的长效高性能服务调度与资源分配方法,其特征在于,包括:
S1、获取边缘服务供应系统中边缘服务器到用户端的数据无线传输延迟矩阵lA;
S3、获取任意两台边缘服务器hj和hk之间的数据传输延迟和传播延迟进一步得到关于服务请求经过边缘服务器路由的有线传输延时lR与回传延时lB;其中,关于服务i的请求从服务器hj路由到服务器hk的有线传输延时为回传延时为
S4、获取不同边缘服务器将各类服务请求结果返回给用户的回调时延lU;
S5、计算在单位时间内各边缘服务器所能够处理的各任务的平均处理数矩阵γ;其中边缘服务器对所有任务的处理能力总和要满足资源上限约束;
S6、获取各服务的请求到达各个边缘服务器的到达率,根据每个服务请求经由接入边缘服务器路由到执行边缘服务器的概率θ,计算出每个边缘服务器实际处理的平均请求到达率,并结合单位时间内边缘服务器所能够处理的各任务的平均处理数矩阵γ,计算出系统对每个请求的处理时延矩阵lE;
S7、根据所述服务请求的无线传输延迟lA、有线传输延时lR、回传延时lR、处理时延lE和回调时延lU获得边缘服务供应系统中任意服务请求所需要的平均处理延迟三维矩阵l;
2.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法,其特征在于,S1中,数据传输延迟矩阵lA的每行对应一个服务,每列对应一台边缘服务器,每个元素由服务平均输入数据大小dI与边缘服务器和使用该服务的客户端间的数据传输速率v相除得到。
3.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法,其特征在于,S3中,lR与lB均为三维矩阵,其中每个元素为关于服务i的请求经由边缘服务器j路由到边缘服务器hk时所产生的数据传输延迟;lR为输入数据在边缘服务器之间的传输延迟,lB为输出数据的总传输延迟。
9.一种计算机存储介质,其特征在于,所述计算机存储介质内存储有计算机程序;所述计算机程序在计算机上运行时,使得计算机执行权利要求1至8任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。
10.一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得计算机执行权利要求1至8任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210817875.5A CN115208819A (zh) | 2022-07-13 | 2022-07-13 | 面向边缘服务系统的长效高性能服务调度与资源分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210817875.5A CN115208819A (zh) | 2022-07-13 | 2022-07-13 | 面向边缘服务系统的长效高性能服务调度与资源分配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115208819A true CN115208819A (zh) | 2022-10-18 |
Family
ID=83580013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210817875.5A Withdrawn CN115208819A (zh) | 2022-07-13 | 2022-07-13 | 面向边缘服务系统的长效高性能服务调度与资源分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115208819A (zh) |
-
2022
- 2022-07-13 CN CN202210817875.5A patent/CN115208819A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110365753B (zh) | 基于边缘计算的物联网服务低时延负载分配方法及装置 | |
CN104850450B (zh) | 一种面向混合云应用的负载均衡方法及系统 | |
Ge et al. | GA-based task scheduler for the cloud computing systems | |
CN108509276A (zh) | 一种边缘计算环境中的视频任务动态迁移方法 | |
CN110297699B (zh) | 调度方法、调度器、存储介质及系统 | |
CN108170530B (zh) | 一种基于混合元启发式算法的Hadoop负载均衡任务调度方法 | |
CN111614754B (zh) | 面向雾计算的成本效率优化的动态自适应任务调度方法 | |
CN113419867B (zh) | 一种面向边云协同计算环境中节能的服务供应方法 | |
CN113037877A (zh) | 云边端架构下时空数据及资源调度的优化方法 | |
CN109005211B (zh) | 一种无线城域网环境下的微云部署及用户任务调度方法 | |
CN113115252A (zh) | 延迟敏感任务分布式移动边缘计算资源调度方法及系统 | |
Delavar et al. | A synthetic heuristic algorithm for independent task scheduling in cloud systems | |
CN114024970A (zh) | 基于边缘计算的电力物联网工作负载分配方法 | |
CN106407007B (zh) | 面向弹性分析流程的云资源配置优化方法 | |
Xu et al. | Online learning algorithms for offloading augmented reality requests with uncertain demands in MECs | |
Chauhan et al. | Delay-aware application offloading in fog environment using multi-class Brownian model | |
CN114691372A (zh) | 一种多媒体端边云系统的群体智能控制方法 | |
Cao et al. | Distributed workflow mapping algorithm for maximized reliability under end-to-end delay constraint | |
CN113032146A (zh) | 一种面向多接入边缘计算环境的健壮性服务供应方法 | |
Tao et al. | Congestion-aware traffic allocation for geo-distributed data centers | |
CN113190342A (zh) | 用于云-边协同网络的多应用细粒度卸载的方法与系统架构 | |
Moreira et al. | Task allocation framework for software-defined fog v-RAN | |
CN116915869A (zh) | 基于云边协同的时延敏感型智能服务快速响应方法 | |
CN110430236B (zh) | 一种部署业务的方法以及调度装置 | |
CN115208819A (zh) | 面向边缘服务系统的长效高性能服务调度与资源分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20221018 |