CN115208819A

CN115208819A - 面向边缘服务系统的长效高性能服务调度与资源分配方法

Info

Publication number: CN115208819A
Application number: CN202210817875.5A
Authority: CN
Inventors: 向正哲; 郑宇航; 何梦竹; 郑增威
Original assignee: Hangzhou City University
Current assignee: Hangzhou City University
Priority date: 2022-07-13
Filing date: 2022-07-13
Publication date: 2022-10-18

Abstract

本发明涉及面向边缘服务系统的长效高性能服务调度与资源分配方法，包括：将成本效益高的边缘服务供应问题建模为一个组合优化问题，旨在在边缘计算环境中，在成本和资源限制的约束下，尽量减少平均服务响应时间。本发明的有益效果是：本发明实现了在线环境中，在满足成本和资源约束的情况下，长效平均服务响应时间的最小化，进而在边缘服务器资源受限的情况下，提升了用户的使用体验。

Description

面向边缘服务系统的长效高性能服务调度与资源分配方法

技术领域

本发明涉及多接入边缘计算领域，更确切地说，它涉及面向边缘服务系统的长效高性能服务调度与资源分配方法。

背景技术

随着移动服务和移动设备的快速增长，我们现在正在拥抱智能移动计算的时代。根据全球移动通信系统协会的报告，全球约有51亿人订阅了移动服务，在2025年之前，这一数字将以平均年增长率1.9％的速度增长。与此同时，到2024年，全球蜂窝式物联网连接数预计将达到32亿次。

然而，由于信道的不稳定和移动设备资源的不充足，用户有时可能无法获得高效和无缝的体验。为了解决这些相关问题，研发人员提出了多接入边缘计算(Mobile EdgeComputing，MEC)这种计算范式。MEC优化了移动资源使用和无线网络，以提供上下文感知服务。在MEC范式中，用户可以通过无线网络低延迟地连接到附近的边缘服务器，并使用边缘服务器的资源来完成常规计算范式中或是使用本地资源或是使用云端资源来执行的任务。此外，借助群集管理技术(例如EdgeSite)，边缘服务器可以相互协调以充分利用计算资源，如某一边缘服务器可以将用户的请求分派给另一个可以处理该用户请求的服务器。此外，借助Kubernetes等平台即服务(PaaS)技术，即可轻松将边缘服务器资源分配给以服务为载体的计算模块。但是，这些优点不能成为在MEC环境中进行粗糙的资源分配和服务调度的原因。假设基于MEC架构的服务供应系统中，我们为热门服务分配的资源很少(例如分配了较小带宽给热门视频)，或者让不稳定的网络连接承担了大流量，又或者向拥有足够资源的服务只发送少量请求，那么该服务供应系统既不能满足用户的高质量体验需求，也不能满足服务供应方的高性能供给需求(尤其是当这些服务是使用广泛的计算密集、数据密集的AI服务时)。因此，我们必须谨慎的规划基于MEC架构的服务供应系统中的资源分配与服务调度方案。

发明内容

本发明的目的是克服现有技术中的不足，提供了面向边缘服务系统的长效高性能服务调度与资源分配方法。

第一方面，提供了面向边缘服务系统的长效高性能服务调度与资源分配方法，包括：

S1、获取边缘服务供应系统中边缘服务器到用户端的数据无线传输延迟矩阵lA；

S2、获取任意两个边缘服务器h_j和h_k之间的路径集合Φ^j,k,其中

表示路径集合Φ^j,k中的第p条路径；

S3、获取任意两台边缘服务器h_j和h_k之间的数据传输延迟

和传播延迟

进一步得到关于服务请求经过边缘服务器路由的有线传输延时l^R与回传延时l^B(都由三维矩阵表示)。其中，关于服务i的请求从服务器h_j路由到服务器h_k的有线传输延时为

回传延时为

S4、获取不同边缘服务器将各类服务请求结果返回给用户的回调时延矩阵l^U(其中，

表示边缘服务器h_j将关于服务i的服务请求结果返回给用户的传输时延)；

S5、计算在单位时间内各边缘服务器所能够处理的各任务的平均处理数矩阵γ(其中，边缘服务器h_k对服务i的处理能力记为γ_k,i)；其中边缘服务器对所有任务的处理能力总和要满足资源上限约束；

S6、获取各服务的请求到达各个边缘服务器的到达率，根据每个服务请求经由接入边缘服务器路由到执行边缘服务器的概率

计算出每个边缘服务器实际处理的平均请求到达率，并结合单位时间内各边缘服务器所能够处理的各任务的平均处理数矩阵γ，计算出系统对每个请求的处理时延矩阵l^E；

S7、根据所述服务请求的无线传输延迟l^A、有线传输延时l^R、回传延时l^B、处理时延l^E和回调时延l^U获得边缘服务供应系统中任意服务请求所需要的平均处理延迟三维矩阵l；

S8、获取系统中各边缘服务器在单位时间内分配单位资源所需要消耗的成本η与总成本满足成本上限约束C^＊，结合各服务器分配的资源μ，得到该资源分配方案下的系统总成本

S9、获取各服务请求的一个闭环处理在整个系统中所占的比重，并计算边缘服务供应系统的平均时延

S10、将需要考察的连续时间区间分割为多个时间片(并以任意参数配合上标t表示该参数在第t时间片内的值)，对各个时间片的平均时延进行平均得到目标函数

S11、对目标函数

进行最小化求解，以求得三维矩阵

矩阵μ和矩阵

S12、根据三维矩阵

矩阵μ和矩阵

进行对每个边缘服务器针对每一种服务提供处理能力的资源分配，设置将每种服务请求路由到其他边缘服务器的概率参数以及对路径的选择概率。

作为优选，S1中，数据传输延迟矩阵l^A的每行对应一个服务，每列对应一台边缘服务器，每个元素由服务平均输入数据大小d^I与边缘服务器和使用该服务的客户端间的数据传输速率v相除得到。

作为优选，S3中，l^R与l^B均为三维矩阵，其中每个元素为关于服务i的请求经由边缘服务器j路由到边缘服务器h_k时所产生的数据传输延迟；l^R为输入数据在边缘服务器之间的传输延迟，l^B为输出数据的总传输延迟。

作为优选，S5中，矩阵γ的第k行第i列元素γ_k,i为边缘服务器h_k对服务i的处理能力，其数值由边缘服务器h_k分配给服务i的资源μ_k,i除以每个服务所需的资源数w_i计算得到；μ_k,i满足约束条件：

其中

即为边缘服务器h_k的负载上限。

作为优选，S6中，

为一个三维矩阵，其中元素

为关于服务i的请求经由边缘服务器j路由到边缘服务器h_k进行处理的概率且满足

并有约束

作为优选，S7中，任意服务请求所需要的处理延迟l_i,j,k包括：用户发起请求至接入服务器的时间

接入服务器选择路径p转发至执行服务器的时长

请求的处理时延

服务器h_k至h_j的回传时延

和服务器h_j回传至用户的时延

作为优选，S9中，各服务请求的一个闭环处理在整个系统中所占的比重Pr(A_i,j,k)可以表示为：

其中，

第二方面，提供了一种计算机存储介质，所述计算机存储介质内存储有计算机程序；所述计算机程序在计算机上运行时，使得计算机执行第一方面任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。

第三方面，提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行第一方面任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。

本发明的有益效果是：本发明将成本效益高的边缘服务供应问题建模为一个凸优化问题，实现了在线环境中，在满足成本和资源约束的情况下，长效平均服务响应时间的最小化，进而在边缘服务器资源受限的情况下，提升了用户的使用体验。

附图说明

图1为本申请提供的边缘服务供应系统结构示意图；

附图标记说明：用户端1、接入服务器2、执行服务器3。

具体实施方式

下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出，对于本技术领域的普通人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

实施例1：

为了解决现有技术中，在边缘服务器资源受限的情况下，边缘服务供应系统不能满足用户的高质量体验需求的问题，本申请提供了面向边缘服务系统的长效高性能服务调度与资源分配方法，同时考虑了资源分配和服务调度，包括：

S1、获取边缘服务供应系统中边缘服务器到用户端的数据传输延迟矩阵l^A。

如图1所示，边缘服务供应系统包括用户端1、接入服务器2和执行服务器3，用户端1、接入服务器2和执行服务器3之间通信连接。在边缘服务供应系统中，用户端1首先向接入服务器2发起请求，该接入服务器2将接收到的请求通过某一路径路由到执行服务器3，执行服务器3在请求执行完毕后向接入服务器2回传返回数据，最后接入服务器2向用户端1返回数据。

此外，本申请不对获取数据传输延迟矩阵l^A的方式进行限定，在一种可选的实现方式中，可以收集并统计边缘服务供应系统中所部署服务的平均所需输入数据量大小

以及各边缘服务器与它们所服务用户的平均数据传输速度v_j，并通过计算获取边缘服务供应系统中边缘服务器到用户端的数据传输延迟矩阵l^A，表示为：

上述数据传输延迟矩阵l^A的每行对应一个服务，每列对应一台边缘服务器，每个元素由服务平均输入数据大小d^I与边缘服务器和使用该服务的客户端间的数据传输速率v相除得到。

S2、获取任意两个边缘服务器h_j和h_k之间的路径集合Φ^j,k。

需要说明的是，边缘服务供应系统包含多个边缘服务器，本发明将边缘服务供应系统中的边缘服务器集合用H进行表示，并将该边缘服务器集合H中的第j个边缘服务器和第k个边缘服务器分别用边缘服务器h_j和边缘服务器h_k进行表示。

此外，边缘服务供应系统具有服务器连接拓扑结构，可以根据该结构计算任意两个边缘服务器h_j和h_k之间的路径集合Φ^j,k，其中第p条路径

可以表示为：

此外，|Φ^j,k|为路径数量，

为对关于服务s_i的请求选择路径p进行从服务器h_j路由至h_k的概率，且

S3、获取任意两台边缘服务器h_j和h_p之间的数据传输延迟

和传播延迟

进一步得到关于服务i的请求从服务器h_j路由到服务器h_k的传输总延迟

并根据各服务的输出数据大小O_i以及各边缘服务器之间的数据传输带宽B_j,k和边缘服务器到用户端的数据传输速度v_j，计算出返回数据的传输延迟三维矩阵

该返回数据的传输延迟三维矩阵也可以称为回传时间。

需要说明的是，本发明将边缘服务供应系统中的服务集合用S进行表示，该服务集合S中的第i个服务用服务i进行表示。

此外，在S3中，根据边缘服务供应系统中各个服务器之间的网络传输带宽矩阵B，以及各服务器物理距离矩阵D，以及选择各路径的概率

计算得到任意两台服务器h_j和h_k之间的数据传输延迟

和传播延迟

并且，l^R与l^B均为三维矩阵(M*N*N，其中M为服务数，N为边缘服务器数)，其中每个元素为关于服务i的请求经由边缘服务器j路由到边缘服务器k时所产生的数据传输延迟；l^R为输入数据在边缘服务器之间的传输延迟，l^B为输出数据的总传输延迟，也就是边缘服务器之间的延迟加上边缘服务器到用户端之间的延迟。

S4、获取边缘服务器将服务请求结果返回给用户的回调时延l^U。

示例地，根据服务i的输出数据，计算边缘服务器将服务请求结果返回给用户的传输时延l^U。比如，

S5、根据系统中处理每个服务对应的请求所需要的资源数矩阵μ/工作负载w_i，以及各边缘服务器对系统中各个服务的处理能力μ_k,i，计算在单位时间内各边缘服务器所能够处理的各任务的数量

其中边缘服务器对所有任务的处理能力总和要满足资源上限约束μ^*，即

矩阵γ中，其中每行对应一个边缘服务器，每列对应一个服务。矩阵γ的第k行第i列元素γ_k,i为边缘服务器h_k对服务i的处理能力，其数值由边缘服务器h_k分配给服务i的资源μ_k,i除以每个服务所需的资源数w_i计算得到；μ_k,i满足约束条件：

其中

即为边缘服务器h_k的负载上限。

S6、获取各服务的请求到达各个边缘服务器的到达率Λ_j,i，根据每个服务请求经由接入边缘服务器j路由到执行边缘服务器h_k的概率

计算出每个边缘服务器实际处理的平均请求到达率

即单位时间内关于各个服务的请求需要被边缘服务器h_k进行处理的数量。并结合单位时间内边缘服务器对个服务请求的处理数量γ_k,i，计算出系统对每个请求的处理时延矩阵l^E。示例地，在已知单位时间内边缘服务器对个服务请求的处理数量γ_k,i的情况下，可以根据M/M/1排队模型中的里特尔规则(Little’s law)，计算系统对每个请求的处理时延矩阵l^E。

在S6中，关于服务i的请求到达边缘服务器h_j的到达率为Λ_j,i，因此对于每个服务器所需要处理的请求到达率λ，有

此外，

为一个三维矩阵，其中元素

为关于服务i的请求经由边缘服务器h_j路由到边缘服务器k进行处理的概率且满足

并有约束

S7、根据所述信息获得边缘服务供应系统中任意服务请求所需要的处理延迟l_i,j,k。

在S7中，任意服务请求所需要的处理延迟l_i,j,k包括：用户发起请求至接入服务器的时间

接入服务器选择路径p转发至执行服务器的时长

请求的处理时延

服务器h_k至h_j的回传时延

和服务器h_j回传至用户的时延

其中，l_i,j,k也可以称为单个请求的生命周期的所需的总时长为l_i,j,k。可以表示为：

此外，对于一个关于服务i的请求，边缘服务器h_k的处理时延，根据里特尔规则可以计算为

S8、获取系统中各边缘服务器在单位时间内分配单位资源所需要消耗的成本η，结合各服务器分配的资源μ，得到总成本

总成本满足成本上限约束C^＊。

示例地，该比重可以根据各服务请求对边缘服务器的请求到达率以及各服务请求在边缘服务器之间的路由概率计算得到。比如，各服务请求的一个闭环处理在整个系统中所占的比重Pr(A_i,j,k)可以表示为：

其中，

由此计算出整个系统的平均时延

S10、考虑到服务请求是动态到来的，将一个较长的时间序列分割为多个较短的时间片，对各个时间片的平均时延进行平均得到目标函数

S11、对目标函数E_l进行最小化求解，以求得三维矩阵

矩阵μ和矩阵

也就是求取任意两台服务器之间数据传输的路径选择概率，每台边缘服务器针对每个服务所提供的处理能力，以及一个服务请求经由一台边缘服务器路由到另一台边缘服务器的概率。

为了简化问题求解，本发明将该问题分为两个子问题，第一个子问题求解最佳路径规划，第二个子问题对资源分配和请求路由进行优化。

通过一定数学推导，本发明将最佳路径规划子问题建模为如下：

此外，通过一定数学推导，结合李雅普诺夫优化框架，本发明可以得到资源分配和请求路由子问题的优化模型：

其中F_i,j,k为路径规划子问题中求解的最佳路径的最佳传输时延，c(t)为t时间片时李雅普诺夫优化框架中的积压队列长度。

对上述两个优化问题P_NR和

进行最小化求解，以求得三维矩阵

矩阵μ和矩阵

S12、根据三维矩阵

矩阵μ和矩阵

进行对每个边缘服务器针对每一种服务提供处理能力的资源分配，设置将每种服务请求路由到其他边缘服务器的概率参数以及对路径的选择概率，即可在给定成本约束以及各边缘服务器负载上限的情况下，实现边缘服务供应系统的处理时延最小化。

综上所述，本发明提供的面向边缘服务系统的长效高性能服务调度与资源分配方法，实现了在线环境下，进行对每个边缘服务器针对每一种服务提供处理能力的资源分配，设置将每种服务请求路由到其他边缘服务器的概率参数以及对路径的选择概率进行决策，即可在给定成本约束以及各边缘服务器负载上限的情况下，实现边缘服务供应系统的处理时延最小化。

Claims

1.面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，包括：

S1、获取边缘服务供应系统中边缘服务器到用户端的数据无线传输延迟矩阵l^A；

S2、获取任意两个边缘服务器h_j和h_k之间的路径集合Φ^j,k，其中

表示路径集合Φ^j,k中的第p条路径；

S3、获取任意两台边缘服务器h_j和h_k之间的数据传输延迟

和传播延迟

进一步得到关于服务请求经过边缘服务器路由的有线传输延时l^R与回传延时l^B；其中，关于服务i的请求从服务器h_j路由到服务器h_k的有线传输延时为

回传延时为

S4、获取不同边缘服务器将各类服务请求结果返回给用户的回调时延l^U；

S5、计算在单位时间内各边缘服务器所能够处理的各任务的平均处理数矩阵γ；其中边缘服务器对所有任务的处理能力总和要满足资源上限约束；

S6、获取各服务的请求到达各个边缘服务器的到达率，根据每个服务请求经由接入边缘服务器路由到执行边缘服务器的概率θ，计算出每个边缘服务器实际处理的平均请求到达率，并结合单位时间内边缘服务器所能够处理的各任务的平均处理数矩阵γ，计算出系统对每个请求的处理时延矩阵l^E；

S7、根据所述服务请求的无线传输延迟l^A、有线传输延时l^R、回传延时l^R、处理时延l^E和回调时延l^U获得边缘服务供应系统中任意服务请求所需要的平均处理延迟三维矩阵l；

S8、获取系统中各边缘服务器在单位时间内分配单位资源所需要消耗的成本η与总成本满足成本上限约束C^★，结合各服务器分配的资源μ，得到该资源分配方案下的系统总成本

S10、将需要考察的连续时间区间分割为多个时间片，并以任意参数配合上标t表示该参数在第t时间片内的值，对各个时间片的平均时延进行平均得到目标函数

S11、对目标函数

进行最小化求解，以求得三维矩阵

矩阵μ和矩阵θ；

S12、根据三维矩阵

矩阵μ和矩阵θ，进行对每个边缘服务器针对每一种服务提供处理能力的资源分配，设置将每种服务请求路由到其他边缘服务器的概率参数以及对路径的选择概率。

2.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S1中，数据传输延迟矩阵l^A的每行对应一个服务，每列对应一台边缘服务器，每个元素由服务平均输入数据大小d^I与边缘服务器和使用该服务的客户端间的数据传输速率v相除得到。

3.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S3中，l^R与l^B均为三维矩阵，其中每个元素为关于服务i的请求经由边缘服务器j路由到边缘服务器h_k时所产生的数据传输延迟；l^R为输入数据在边缘服务器之间的传输延迟，l^B为输出数据的总传输延迟。

4.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S5中，矩阵γ的第k行第i列元素γ_k,i为边缘服务器h_k对服务i的处理能力，其数值由边缘服务器h_k分配给服务i的资源μ_k,i除以每个服务所需的资源数w_i计算得到；μ_k,i满足约束条件：

其中

即为边缘服务器h_k的负载上限。

5.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S6中，θ为一个三维矩阵，其中元素θ_,j,k为关于服务i的请求经由边缘服务器j路由到边缘服务器h_k进行处理的概率且满足0≤θ_i,j,k≤1，并有约束

6.根据权利要求5所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S6中，服务i的请求到达边缘服务器j的到达率为Λ_j,i，对于每个服务器所需要处理的请求到达率λ，有

7.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S7中，任意服务请求所需要的处理延迟l_i,j,k包括：用户发起请求至接入服务器的时间

接入服务器选择路径p转发至执行服务器的时长

请求的处理时延

服务器h_k至h_j的回传时延

和服务器h_j回传至用户的时延

8.根据权利要求1所述的面向边缘服务系统的长效高性能服务调度与资源分配方法，其特征在于，S9中，各服务请求的一个闭环处理在整个系统中所占的比重Pr(A_i,j,k)可以表示为：

其中，

9.一种计算机存储介质，其特征在于，所述计算机存储介质内存储有计算机程序；所述计算机程序在计算机上运行时，使得计算机执行权利要求1至8任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。

10.一种计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得计算机执行权利要求1至8任一所述的面向边缘服务系统的长效高性能服务调度与资源分配方法。