CN111831445B - 边缘服务器优化部署方法 - Google Patents
边缘服务器优化部署方法 Download PDFInfo
- Publication number
- CN111831445B CN111831445B CN202010667440.8A CN202010667440A CN111831445B CN 111831445 B CN111831445 B CN 111831445B CN 202010667440 A CN202010667440 A CN 202010667440A CN 111831445 B CN111831445 B CN 111831445B
- Authority
- CN
- China
- Prior art keywords
- server
- deployment
- wireless access
- access point
- optimization problem
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1029—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
一种边缘服务器优化部署方法,根据历史数据预估无法访问服务器数量,并将服务器部署问题建模成关于服务器部署变量和请求服务变量的最大化的优化问题,然后将优化问题转化为只关于服务器部署的单变量优化问题,再将单变量优化问题转化为关于服务器部署变量的集合函数优化问题,最后通过鲁棒算法(Robust)得到服务器部署策略。本发明使用了两步贪心的方法,即目标函数最大和目标函数的边缘值最大的边缘服务器的部署方案,在面对可能出现的硬件和软件故障时,服务器仍能够提供可接受的计算服务水平。
Description
技术领域
本发明涉及的是一种移动边缘计算领域的方法,具体涉及一种边缘服务器优化部署方法。
背景技术
移动边缘计算是一种直接在网络边缘部署服务器(小型云数据中心)就近提供计算服务以有效缓解云上的压力并同时突破移动设备的物理限制的技术。移动边缘计算中的一个基本问题是边缘服务器的部署,即确定在何处部署边缘服务器以最大化整体性能。与移动云计算相比,移动边缘计算在服务器部署方面面临一些独特的不确定性:与移动云计算中高度可靠的大型数据中心不同,移动边缘计算网络通常是异构的,且边缘服务器的可靠性较差,例如,某些边缘服务器可能随时崩溃。其次,与一般采用可靠的有线链路传输迁移任务的移动云计算不同,由于边缘服务器通常与蜂窝基站或无线接入点部署在一起,移动边缘计算任务通常通过易发生故障的无线链路传输到边缘服务器。最近的一项实验工作表明,在某市区使用Wi-Fi网络的500万用户中,连接故障的比例高达45%。一旦传输链接或某些无线接入点发生故障,相应的边缘服务器将无法访问,即使服务器能正常工作,也可以视为服务器故障。上述不确定因素可能会使任何预先优化的服务器部署和调度策略失效。
发明内容
本发明针对现有服务器部署策略部署的边缘服务器在面临服务器故障时所能提供的计算服务水平往往会大幅降低、移动边缘计算服务器部署没有考虑发生故障的不确定性,也没有任何的冗余性设计的不足,提出一种边缘服务器优化部署方法,使用了两步贪心的方法,即目标函数最大和目标函数的边缘值最大的边缘服务器的部署方案,在面对可能出现的硬件和软件故障时,服务器仍能够提供可接受的计算服务水平。
本发明是通过以下技术方案实现的:
本发明涉及一种边缘服务器优化部署方法,根据历史数据预估无法访问服务器数量,并将服务器部署问题建模成关于服务器部署变量和请求服务变量的最大化的优化问题,然后将优化问题转化为只关于服务器部署的单变量优化问题,再将单变量优化问题转化为关于服务器部署变量的集合函数优化问题,最后通过鲁棒算法(Robust)得到服务器部署策略。
所述的根据历史数据预估是指:根据历史数据中发生服务器硬件软件故障的情况,使用逻辑线性回归等方法估计将来可能发生的服务器故障的数量。
所述的关于服务器部署变量和请求服务变量的最大化的优化问题包括:
限制条件:其中:xjs为是否在无线接入点j处部署服务器s的标识变量,表示服务器部署方案;yij为无线接入点j的工作负载分配给无线接入点i处的边缘服务器的比例,表示服务器的请求调度方案;wi为无线接入点i处的工作负载;ds为服务器s的计算能力;cjs为在无线接入点j处部署服务器s的费用,C0为总的部署预算;bi为在无线接入点i处的服务请求的带宽;为无线接入点j处的可用下行带宽;为无线接入点i处的可用上行带宽;qij为是否允许将用户请求从无线接入点i处分配到无线接入点j处的服务器的标识。
所述的只关于服务器部署的单变量优化问题,通过对于给定的服务器部署方案通过求解线性规划问题来得到最优的服务请求调度方案。其中线性规划目标仍为最大化限制条件为:通过得到的服务请求调度方案可以得到边缘服务器提供的总工作负载。
所述的集合函数优化问题,通过构建服务器部署集合A和服务器部署变量xjs之间的关系:A={(j,s)|xjs=1,j∈N,s∈S},将目标函数记为g(A);再将对变量xjs的约束转化为对集合A的约束其中:1(j,s)∈A为指示函数,当(j,s)∈A成立时函数值为1,否则为0,该两个约束构成p独立系统的约束条件,记为Gp。
所述的鲁棒算法,其具体步骤包括:
ii)重复步骤iii,iv,v直到集合A1的元素个数大于等于k或者Γ1等于Ω。
iv)更新集合A1=A1∪{e},Γ1=Γ1∪{e},Γ2=Γ2∪{e}。
vi)当集合Γ2不等于Ω时,重复步骤vii,viii,ix。
viii)更新集合A2=A2∪{e},Γ2=Γ2∪{e}。
x)取A=A1∪A2,输出算法结果为A,并对于A中的每一个元素(j,s),在无线接入点j处部署边缘服务器s。
本发明涉及一种实现上述方法的系统,包括:用于监测搜集系统中网络带宽、服务器计算能力、工作负载分布信息的工况采集单元、鲁棒算法单元以及部署单元,其中:工况采集单元与鲁棒算法单元相连并传输系统信息,鲁棒算法单元与部署单元相连并传输算法结果信息,部署单元根据算法结果,进行服务器的部署。
技术效果
本发明整体解决了边缘服务器的优化部署问题,使得在边缘服务器发生故障时,系统的服务性能不会大幅度的下降;本发明提出了边缘服务器的鲁棒部署方法,当存在不确定因素可能导致硬件和软件故障的情况下,服务器仍能够提供可接受的计算服务水平。
与现有技术相比,本发明能提供更稳定的计算服务水平,具有更强的鲁棒性。
附图说明
图1为边缘计算网络的示意图;
图2为模拟实验的服务器不可用数量变化情况下服务器能处理的总工作负载示意图;
图3为模拟实验的不同预算下服务器能处理的总工作负载示意图。
具体实施方式
如图1所示,为本实施例涉及一种边缘服务器优化部署方法,本实施例的模拟实验是一个拥有着200个无线接入点的边缘计算网络中进行的。在实验中,模拟部署50台边缘计算服务器。部署单个服务器的成本的相对值的范围设为[0.5,1],预算的相对值设置为30。无线接入点只允许将任务转发到两跳内的边缘服务器上。用λi表示无线接入点i处的请求速率,w作为单个任务的平均计算量,b作为每个任务传输需要的平均带宽,因此每个无线接入点i处的工作量和请求的带宽可以分别估计为λiw和λib。设λi的取值范围为3次每秒到5次每秒,w的取值范围为[0.5,1]MFLOPS,b的取值范围为[0.5,1]KB/s。取无线接入点i处的上行链路带宽下行链路带宽的取值范围为[16,24]KB/s。设置边缘服务器s的计算能力取值范围为[32,48]MFLOPS。设置随机算法(Random)、线性规划松弛算法(LP-Relaxation)、贪心算法(Greedy)作为对比项,一共取了11组进行对照,具体包括以下步骤:
第一步、根据历史数据预估可能发生服务器宕机数量k。预估无线接入点i处的工作负载记为wi。服务器s的计算能力。调研在无线接入点j处部署服务器s的费用记为cjs,总的部署预算记为C0。预估在无线接入点i处的服务请求的带宽记为bi。调研无线接入点j处的可用下行带宽记为调研无线接入点i处的可用上行带宽记为调研各无线接入点之间的网络跳数,并且设置请求转发的最远跳数,由此得到是否允许将用户请求从无线接入点i处分配到无线接入点j处的服务器的标识变量qij。
如图1所示,为解释这一标准的例子,图中有N个无线接入点,它们通过基于软件定义网络的蜂窝核心网络相连,在无线接入点可部署边缘服务器。
第二步、对服务器部署和服务请求调度进行建模,即把服务器部署问题建模成关于服务器部署变量和请求服务变量的最大化的优化问题。
服务器部署方案由变量xjs刻画,xjs为是否在无线接入点j处部署服务器s的标识变量。服务器请求调度的方案由yij刻画,yij为无线接入点j的工作负载分配给无线接入点i处的边缘服务器的比例。优化目标:最大化边缘服务器提供的总体工作负载
步骤3、将步骤2中的优化问题转化为只关于服务器部署的单变量优化问题,具体步骤包括:
3.2)通过3.1中得到的服务请求调度方案可以得到边缘服务器提供的总体工作负载。
步骤4、将步骤3中的优化问题转化为关于服务器部署变量的集合函数优化问题,具体步骤包括:
4.1)构建服务器部署集合A和服务器部署变量xjs之间的关系:A={(j,s)|xjs=1,j∈N,s∈S},将目标函数记为g(A)。
步骤5、通过鲁棒(Robust)算法得到服务器部署策略。该算法具体步骤包括:
ii)当集合A1的元素个数小于k或者Γ1不等于Ω时,重复步骤iii,iv,v。
iv)更新集合A1=A1∪{e},Γ1=Γ1∪{e},Γ2=Γ2∪{e}。
vi)当集合Γ2不等于Ω时,重复步骤vii,viii,ix。
viii)更新集合A2=A2∪{e},Γ2=Γ2∪{e}。
x)取A=A1∪A2,输出算法结果为A。
步骤6、对于A中的每一个元素(j,s),在无线接入点j处部署边缘服务器s。
如图2所示,为不同数目的服务器宕机情况下边缘服务器能处理的总工作负载图。可以看出,在不同的不可用服务器数量的情况下,本发明提出的鲁棒算法的性能明显优于其他的对比算法。具体来说,本发明所提鲁棒算法的效果分别超过随机算法、线性规划松弛算法、贪心算法97%、34%和7%。
如图3所示,为不同的预算情况下边缘服务器能服务的总工作负载图。在不同的预算的情况下,本发明所提鲁棒算法的服务器部署方案下,服务器能完成的总工作负载超过随机算法、线性规划松弛算法、贪心算法204%、23%和12%。
本实施例通过在200个无线接入点的边缘计算网络中部署50台边缘计算服务器的具体环境设置下,部署单个服务器的成本的相对值的范围设为[0.5,1],预算的相对值设置为30。无线接入点只允许将任务转发到两跳内的边缘服务器上。用λi表示无线接入点i处的请求速率,w作为单个任务的平均计算量,b作为每个任务传输需要的平均带宽,因此每个无线接入点i处的工作量和请求的带宽可以分别估计为λiw和λib。设λi的取值范围为3次每秒到5次每秒,w的取值范围为[0.5,1]MFLOPS,b的取值范围为[0.5,1]KB/s。取无线接入点i处的上行链路带宽下行链路带宽的取值范围为[16,24]KB/s。设置边缘服务器s的计算能力取值范围为[32,48]MFLOPS。以这些参数运行上述方法,能够得到的实验数据是:当发生故障的边缘服务器数量分别为1-4时,通过鲁棒部署算法部署的边缘服务器能提供的服务计算量分别为为42.3MFLOPS,39.6MFLOPS,37.4MFLOPS和35.3MFLOPS。
与现有技术相比,本方法在面临边缘服务器发生故障的情况下,该方法所能提供的服务计算处理量更大。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。
Claims (2)
1.一种边缘服务器优化部署方法,其特征在于,根据历史数据预估无法访问服务器数量,并将服务器部署问题建模成关于服务器部署变量和请求服务变量的最大化的优化问题,然后将优化问题转化为只关于服务器部署的单变量优化问题,再将单变量优化问题转化为关于服务器部署变量的集合函数优化问题,最后通过鲁棒算法得到服务器部署策略;
所述的关于服务器部署变量和请求服务变量的最大化的优化问题包括:
限制条件:其中:xjs为是否在无线接入点j处部署服务器s的标识变量,表示服务器部署方案;yij为无线接入点j的工作负载分配给无线接入点i处的边缘服务器的比例,表示服务器的请求调度方案;wi为无线接入点i处的工作负载;ds为服务器s的计算能力;cjs为在无线接入点j处部署服务器s的费用,C0为总的部署预算;bi为在无线接入点i处的服务请求的带宽;为无线接入点j处的可用下行带宽;为无线接入点i处的可用上行带宽;qij为是否允许将用户请求从无线接入点i处分配到无线接入点j处的服务器的标识;
所述的只关于服务器部署的单变量优化问题,通过对于给定的服务器部署方案通过求解线性规划问题来得到最优的服务请求调度方案;其中线性规划目标仍为最大化限制条件为:通过得到的服务请求调度方案可以得到边缘服务器提供的总工作负载;
所述的集合函数优化问题,通过构建服务器部署集合A和服务器部署变量xjs之间的关系:A={(j,s)|xjs=1,j∈N,s∈S},将目标函数记为g(A);再将对变量xjs的约束转化为对集合A的约束其中:1(j,s)∈A为指示函数,当(j,s)∈A成立时函数值为1,否则为0,该两个约束构成p独立系统的约束条件,记为Gp;
所述的鲁棒算法,其具体步骤包括:
ii)重复步骤iii,iv,v直到集合A1的元素个数大于等于k或者Γ1等于Ω;
iv)更新集合A1=A1∪{e},Γ1=Γ1∪{e},Γ2=Γ2∪{e};
vi)当集合Γ2不等于Ω时,重复步骤vii,viii,ix;
viii)更新集合A2=A2∪{e},Γ2=Γ2∪{e};
x)取A=A1∪A2,输出算法结果为A,并对于A中的每一个元素(j,s),在无线接入点j处部署边缘服务器s。
2.一种实现权利要求1所述方法的系统,其特征在于,包括:用于监测搜集系统中网络带宽、服务器计算能力、工作负载分布信息的工况采集单元、鲁棒算法单元以及部署单元,其中:工况采集单元与鲁棒算法单元相连并传输系统信息,鲁棒算法单元与部署单元相连并传输算法结果信息,部署单元根据算法结果,进行服务器的部署。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010667440.8A CN111831445B (zh) | 2020-07-13 | 2020-07-13 | 边缘服务器优化部署方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010667440.8A CN111831445B (zh) | 2020-07-13 | 2020-07-13 | 边缘服务器优化部署方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111831445A CN111831445A (zh) | 2020-10-27 |
CN111831445B true CN111831445B (zh) | 2022-05-10 |
Family
ID=72900592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010667440.8A Active CN111831445B (zh) | 2020-07-13 | 2020-07-13 | 边缘服务器优化部署方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111831445B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113296909B (zh) * | 2021-05-14 | 2022-11-11 | 上海交通大学 | 移动边缘计算中的优化服务部署方法 |
CN113296842B (zh) * | 2021-05-14 | 2022-05-06 | 上海交通大学 | 移动边缘计算中基于相关性的优化任务卸载调度方法 |
CN113259469B (zh) * | 2021-06-02 | 2022-10-14 | 西安邮电大学 | 智能制造中边缘服务器部署方法、系统及存储介质 |
CN115243303B (zh) * | 2022-07-25 | 2024-05-07 | 中国人民解放军63891部队 | 用于频谱监测的边缘计算设备的部署方法、系统以及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110187973A (zh) * | 2019-05-31 | 2019-08-30 | 浙江大学 | 一种面向边缘计算的服务部署优化方法 |
CN111090522A (zh) * | 2019-12-13 | 2020-05-01 | 南京邮电大学 | 一种移动边缘计算环境下服务部署与迁移的调度系统及决策方法 |
CN111291606A (zh) * | 2019-04-16 | 2020-06-16 | 北京潼荔科技有限公司 | 基于边缘计算的场景自适应目标识别人工智能方法及系统 |
-
2020
- 2020-07-13 CN CN202010667440.8A patent/CN111831445B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291606A (zh) * | 2019-04-16 | 2020-06-16 | 北京潼荔科技有限公司 | 基于边缘计算的场景自适应目标识别人工智能方法及系统 |
CN110187973A (zh) * | 2019-05-31 | 2019-08-30 | 浙江大学 | 一种面向边缘计算的服务部署优化方法 |
CN111090522A (zh) * | 2019-12-13 | 2020-05-01 | 南京邮电大学 | 一种移动边缘计算环境下服务部署与迁移的调度系统及决策方法 |
Non-Patent Citations (2)
Title |
---|
Edge server placement in mobile edge computing;Shangguang Wang et al.;《Parallel and Distributed Computing》;20190531;全文 * |
面向移动边缘计算的边缘服务器部署及资源分配研究;赵磊;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190215;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111831445A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111831445B (zh) | 边缘服务器优化部署方法 | |
CN111371603B (zh) | 应用于边缘计算的服务实例部署方法和装置 | |
Wu et al. | Online geographical load balancing for energy-harvesting mobile edge computing | |
CN105471759A (zh) | 数据中心的网络流量调度方法和装置 | |
CN105406459B (zh) | 利用基于一致性分布式处理估计电网中的最优潮流的方法 | |
Yang et al. | Timely coded computing | |
Munir et al. | Multi-agent meta-reinforcement learning for self-powered and sustainable edge computing systems | |
Nazemi et al. | A mixed-integer distributionally robust chance-constrained model for optimal topology control in power grids with uncertain renewables | |
CN111258824A (zh) | 一种云计算中基于人工势场的增量检查点容错方法 | |
CN112910723A (zh) | 边缘终端管理方法、装置、设备及存储介质 | |
CN112636961A (zh) | 网络切片下基于可靠性和分流策略的虚拟网资源分配方法 | |
US9614735B2 (en) | Bounded-budget monitor deployment in monitoring networks via end-to-end probes | |
CN114372581A (zh) | 基于区块链的联邦学习方法、装置和计算机设备 | |
CN114244713B (zh) | 一种电力5g网络切片的资源备份方法及装置 | |
Rust et al. | Resilient distributed constraint optimization in physical multi-agent systems | |
Li et al. | SFC-enabled reliable service provisioning in mobile edge computing via digital twins | |
Kim et al. | Partition placement and resource allocation for multiple DNN-based applications in heterogeneous IoT environments | |
Tinnaluri et al. | Edge-cloud computing systems for unmanned aerial vehicles capable of optimal work offloading with delay | |
Almuseelem | Energy-efficient and security-aware task offloading for multi-tier edge-cloud computing systems | |
Shang et al. | Greening reliability of virtual network functions via online optimization | |
CN117041053A (zh) | 业务部署方法、装置、设备及存储介质 | |
Sharifi et al. | Combing smart grid with community clouds: Next generation integrated service platform | |
Lei et al. | A heuristic services binding algorithm to improve fault-tolerance in microservice based edge computing architecture | |
Huang et al. | Learning-aided stochastic network optimization with imperfect state prediction | |
Liu et al. | Computation offloading and task scheduling with fault-tolerance for minimizing redundancy in edge computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |