CN112068964A - 一种切片式边缘算力管理方法 - Google Patents

一种切片式边缘算力管理方法 Download PDF

Info

Publication number
CN112068964A
CN112068964A CN202010969363.1A CN202010969363A CN112068964A CN 112068964 A CN112068964 A CN 112068964A CN 202010969363 A CN202010969363 A CN 202010969363A CN 112068964 A CN112068964 A CN 112068964A
Authority
CN
China
Prior art keywords
computing
computing power
slices
resources
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010969363.1A
Other languages
English (en)
Inventor
朱根俊
李月红
吴书杰
何俊
彭寿林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Wulian Technology Co ltd
Original Assignee
Hangzhou Wulian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Wulian Technology Co ltd filed Critical Hangzhou Wulian Technology Co ltd
Priority to CN202010969363.1A priority Critical patent/CN112068964A/zh
Publication of CN112068964A publication Critical patent/CN112068964A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种切片式边缘算力管理方法,通过将边缘节点计算资源切片,能够实现简化计算资源管理复杂度,满足多种场景下算力服务对象对于算力的诉求。本发明通过将分布式的算力资源基于边缘网络组装成多个算力资源池,按照算力规格分层后切片管理,降低了算力资源管理的复杂性,不同业务场景根据自身需求进行算力使用申请,由于边缘算力采用的是切片式算力资源管理,可以快速匹配需求并定位符合需求的切片内算力资源。

Description

一种切片式边缘算力管理方法
技术领域
本发明属于边缘计算、边缘算力管理及边缘算力之间调度相关技术领域,具体涉及一种切片式边缘算力管理方法。
背景技术
边缘计算是指在靠近物或数据源头的网络边缘侧提供边缘智能服务,提供智能服务的算力资源分散在边缘计算节点,边缘计算节点由于种种原因(比如历史原因、环境因素、财务因素等),部署的算力型号千差万别,从而造成边缘计算节点算力类型繁多:比如算力类型存在有CPU、GPU等,CPU算力类型存在有X86、ARM类型等;即使同为X86类型,也会分不同厂家,同一厂家存在不同时期,不同系列的CPU型号。
在算力管理中需要区分和处理不同的算力类型,各种类型的算力提升了算力管理的复杂程度,进而加大了边缘计算的算力调度难度。如何合理地区分算力类型,准确识别不同算力类型资源的容量,是算力管理中必须面对的难题,也是简化算力调度的关键。
边缘计算应用场景下,智能服务的服务对象存在多样化特性。不同场景下的服务对象对于算力的需求也是复杂多变的,比如某些场景服务对象对于GPU性能要求很高,而对CPU性能要求较低;某些场景的服务对象对于CPU性能要求较高,而对GPU没有要求;多变的算力需求会对于算力资源的细致化管理产生诉求,需要根据不同场景进行划分算力资源,以适应各种场景下的算力需求。
对于支持服务对象多样化的特性,全系统算力管理会变得越来越困难,往往增加一种服务对象的场景就需要增加对应的算力划分,并且必须考虑对于原有已经分好的算力资源的影响。探寻合适的能够自适应地满足服务对象对于计算资源多样性的诉求,能够减轻算力的管理压力,便捷地打通各种算力类型的关系,从而能够提升边缘计算智能服务的服务效率。
公开号为CN110995614A的中国专利提出了一种算力资源分配的方法及装置,其通过将不同业务单元占用的处理时间衡量为算力消耗的指标,根据不同业务单元算力资源的消耗情况,调度不同业务单元的算力资源,实现对不同业务单元算力资源的灵活分配,避免物理分割算力资源导致的算力资源利用率低的问题。公开号为CN111240836A的中国专利提出了一种算力资源管理方法、装置、电子设备及存储介质,其将算力资源以多集群的方式平台化,将有限的算力资源以更小的粒度、更灵活的方式、更加合理的分配给用户,并可通过策略将用户和算力资源解耦,一方面可以通过增减集群中的服务器及增减集群等方便地进行算力资源的扩缩容,实现算力资源的合理配置,另一方面可以在算力资源总量不变的情况,通过调整策略对算力资源进行调度,合理的分配用户所使用的算力资源,从而提升了算力资源分配的灵活性及资源利用率等。
但是,现有算力资源比较分散,算力管理异常复杂,同时不同场景下对于算力资源的需求千差万别,上述算力资源分配管理方法对于符合场景需求的算力资源调度仍旧面临着困难。
发明内容
鉴于上述,本发明提供了一种切片式边缘算力管理方法,通过将边缘节点计算资源切片,能够实现简化计算资源管理复杂度,满足多种场景下算力服务对象对于算力的诉求。
一种切片式边缘算力管理方法,包括如下步骤:
(1)通过分多层次对边缘算力进行切片;
(2)根据切片对边缘算力资源进行调度管理;
(3)使对应同一边缘算力的多个切片共享该算力资源并进行优先级管理;
(4)为切片提供对外接口并统一维护切片,使得外部可根据需求以及切片信息进行算力资源申请。
进一步地,所述步骤(1)的具体实现方式为:首先识别各边缘算力的类型,按性能、类型、厂家型号对算力进行分层分类设计;然后按照分层结果对边缘算力进行切片,将各算力资源置入对应的各个切片内,使得单个切片内的算力资源分布在各个边缘算力池内,一个边缘算力池内的算力资源归属于多个切片。
进一步地,对算力进行分层分类及切片的具体方式为:首先按照性能将所有算力划分成高性能算力、中性能算力、低性能算力三种类别,作为算力类型的顶层存在,并标识算力类别;然后按照算力类型和厂家型号进行底层划分(按照CPU类型,比如X86、ARM;按照GPU类型,比如PowerVR、Adreno、Mali、Tegra;按照不同厂家,比如Intel、AMD、华为、联发科、高通、英伟达等),作为算力类型的底层存在,并标识算力类别;在分布式算力资源上线后,将其汇入边缘算力池,同时根据前置的分层分类情况将其划入对应的切片中。因此,算力资源分层分类进行切片能够更好地将算力划分为灵活管理的颗粒。
所述切片即是将一块大规模的模块或者功能切成各个薄片,因为原有模块比较庞大或者功能比较复杂,切片后的模块或者功能会非常简单和灵活,容易管理。例如5G切片解决复杂场景功能下网络处理,切片极大简化了5G下网络功能,更加灵活地满足5G应用的需求。
如按照(高性能+PowerVR)以及(高性能+Intel)两种类型切片,那么对于高性能GPU类型为PowerVR且厂家为Intel的算力就会划入这2个切片中,如果以(高性能+PowerVR+Intel)一种类型切片,那么对于高性能GPU类型为PowerVR且厂家为Intel的算力就会划入这1个切片;实际应用中算力往往对应划入1个切片就够了,但也存在切成2片的情况,切成2片时就需要解决切片间逻辑管理配合的事情。
所述边缘算力池是将分布式的算力资源池化的一种形式,所谓资源池化就是将所有设备的运算能力都被放到一个池内,再进行统一分配。
进一步地,所述步骤(2)的具体实现方式为:当某一边缘算力闲置时,则包含该算力的所有切片内该算力对应的逻辑资源处于空闲状态,标记这些资源被分配使用;对于某一边缘算力,若包含该算力的其中一个切片内该算力对应的逻辑资源被使用,则包含该算力的其他切片内该算力对应的逻辑资源也会被标记为已使用状态,不再被分配给其他场景使用;对于新增上线的边缘算力,根据算力类型在其上线后将该算力资源划分入对应的切片内,根据需要可划入多个切片内,对应的切片内会增加新上线的算力逻辑资源;对于删除下线的边缘算力,则删除包含该算力的所有切片内该算力对应的逻辑资源。
进一步地,所述步骤(3)的具体实现方式为:当一个边缘算力加入多个切片时则默认会在这些切片内进行算力资源共享,当算力资源共享使用时,不同切片按照优先级对算力资源进行分配,若切片未做优先级管理或优先级相等情况下,算力资源按照FIFO(FirstInput First Output)原则在这些切片之间进行算力资源分配。
进一步地,在算力资源共享时,不同业务场景对于算力资源的申请需要在切片内进行分配,优先级是针对算力资源本身制定的策略,即某个场景对某个切片具有高优先级使用的权利,如果没有指定相应优先级,则按照先申请先获得的原则进行切片内的算力资源分配。
进一步地,所述步骤(4)的具体实现方式为:首先为容纳算力资源的切片提供统一的使用接口,算力资源申请时根据算力资源申请需求以及优先级进行切片算力的分配,对于算力资源申请,需要根据算力资源切片的信息;进而统一维护切片,使用切片管理代替算力资源全局管理,在边缘计算云中心侧和边缘节点侧进行切片内算力资源的维护和管理。
本发明通过将分布式的算力资源基于边缘网络组装成多个算力资源池,按照算力规格分层后切片管理,降低了算力资源管理的复杂性,不同业务场景根据自身需求进行算力使用申请,由于边缘算力采用的是切片式算力资源管理,可以快速匹配需求并定位符合需求的切片内算力资源。
附图说明
图1为本发明切片式边缘算力管理系统的层级示意图。
图2为本发明算力切片原理示意图。
图3为本发明切片管理流程示意图。
图4为本发明算力资源调度及分配流程示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,本发明将算力资源的处理框架分为三层:算力层、切片层、应用层,算力层和应用层是对算力和场景应用的管理,切片层是处于中间层,构建切片层是算力资源切片管理的模型实现。
算力资源分布式存在于各个边缘计算端,边缘计算端的算力资源通过网络连接构成了庞大的算力池,通过将算力池进行切片,算力资源划入对应切片内,通过对算力资源切片的管理提供场景应用对于算力资源的需求,算力需求场景下的应用申请算力资源时只关注算力资源切片的信息,算力资源切片满足算力资源的分配。
(1)切片分层。
切片化管理弱化算力管理复杂性,简化算力分组/算力共享/算力多场景应用;基于算力池进行算力切片,依赖算力类型信息进行算力切片;算力切片提供给场景应用使用,应用不直接和裸算力交互,只与算力切片交互,只关注到算力切片;算力切片屏蔽了算力池内部的算力信息,避免应用层对于算力池的交叉调用;具体实现过程如下:
Step1:分散的算力在性能上千差万别,按照算力性能划分高性能算力、中性能算力、低性能算力,根据现有主流算力性来进行划分类别,作为算力类型的顶层存在,标识算力类别。
Step2:按照算力类型和厂家进行底层划分,按照CPU类型进行划分(比如X86、ARM等),按照GPU类型进行划分(比如PowerVR、Adreno、Mali、Tegra等),按照不同厂家进行划分(比如Intel、AMD、华为、联发科、高通、英伟达等),作为算力类型的底层存在,标识算力类别。
Step3:分布式算力资源上线后,汇入边缘算力资源池,同时根据前置的分层切片情况被划入对应的算力切片中。
算力资源分层分类进行切片更好将算力划分为灵活管理的颗粒。
(2)切片原理及实现。
如图2所示,算力在切片后单个切片分散于不同的边缘算力池中,切片中包含所有算力资源的信息,具体实现方式如下:
Step1:按照上述方式对算力类型进行切片,示例中切成:切片1,切片2,切片3三片。
Step2:切片后单个切片内的资源分布在各个边缘算力池内,边缘算力池内的算力归属于多个切片,切片1包含边缘计算池1/2/3内的算力资源。
Step3:算力切片内的算力资源统一管理,切片和切片之间是相互隔离的,算力资源只属于一个切片,比如切片1和切片2不会同时拥有边缘算力池1的同一个算力资源,切片之间可以进行重新切片调配(可通过管理进行重置)。
算力切片内的算力资源统一管理,提供算力资源的逻辑层,同一个切片也是跟随算力池的变化进行调整
(3)切片管理。
如图3所示,切片管理包含对边缘算力池中的算力资源的全生命周期管理,具体实现过程如下:
Step1:新增算力资源;首先判断算力资源是否属于已有算力资源切片类型,如果是就直接划入算力资源切片,对应切片信息更改;如果不属于已有算力资源切片类型,新建算力资源切片,并将新增的算力资源加入新建的算力切片中。
Step2:删除算力资源;新增的划入算力资源切片中的算力资源,如果发生删除算力资源的行为,需要更新算力资源切片,如果被删除的算力资源切片中只包含了算力资源,那么算力资源切片也一并删除。
Step3:算力资源异常;算力资源新增之后,需要持续监测算力资源的状态,一单发生算力资源异常,需要在算力资源切片中标记,后续算力资源申请时不会分配异常的算力资源。
(4)算力资源的调度和分配。
如图4所示,场景应用通过调度选择合适的切片中的算力资源,并进行算力资源的分配,具体实现过程如下:
Step1:算力资源申请进行算力资源切片匹配,按照算力资源的顶层的类别匹配是高性能/中性能/低性能,按照算力资源的底层的类别匹配CPU类型、GPU类型、厂家;如算力资源申请不关注某个类别,就采用此类别的所有切片;如未找到匹配的算力切片,算力资源申请失败,此类属于未按照算力资源切片的规范进行算力资源申请。
Step2:算力资源切片资源余量管理,经过Step1,匹配出一个或者多个算力资源切片,对于多个算力资源切片,按照事前制定的优先级逻辑选择其中一个算力资源切片进行算力资源的分配。
Step3:算力资源切片内算力资源分配,给算力资源申请分配算力资源,标记此算力资源,更新切片的信息。
上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (8)

1.一种切片式边缘算力管理方法,包括如下步骤:
(1)通过分多层次对边缘算力进行切片;
(2)根据切片对边缘算力资源进行调度管理;
(3)使对应同一边缘算力的多个切片共享该算力资源并进行优先级管理;
(4)为切片提供对外接口并统一维护切片,使得外部可根据需求以及切片信息进行算力资源申请。
2.根据权利要求1所述的切片式边缘算力管理方法,其特征在于:所述步骤(1)的具体实现方式为:首先识别各边缘算力的类型,按性能、类型、厂家型号对算力进行分层分类设计;然后按照分层结果对边缘算力进行切片,将各算力资源置入对应的各个切片内,使得单个切片内的算力资源分布在各个边缘算力池内,一个边缘算力池内的算力资源归属于多个切片。
3.根据权利要求2所述的切片式边缘算力管理方法,其特征在于:对算力进行分层分类及切片的具体方式为:首先按照性能将所有算力划分成高性能算力、中性能算力、低性能算力三种类别,作为算力类型的顶层存在,并标识算力类别;然后按照算力类型和厂家型号进行底层划分,作为算力类型的底层存在,并标识算力类别;在分布式算力资源上线后,将其汇入边缘算力池,同时根据前置的分层分类情况将其划入对应的切片中。因此,算力资源分层分类进行切片能够更好地将算力划分为灵活管理的颗粒。
4.根据权利要求1所述的切片式边缘算力管理方法,其特征在于:所述步骤(2)的具体实现方式为:当某一边缘算力闲置时,则包含该算力的所有切片内该算力对应的逻辑资源处于空闲状态,标记这些资源被分配使用;对于某一边缘算力,若包含该算力的其中一个切片内该算力对应的逻辑资源被使用,则包含该算力的其他切片内该算力对应的逻辑资源也会被标记为已使用状态,不再被分配给其他场景使用;对于新增上线的边缘算力,根据算力类型在其上线后将该算力资源划分入对应的切片内,根据需要可划入多个切片内,对应的切片内会增加新上线的算力逻辑资源;对于删除下线的边缘算力,则删除包含该算力的所有切片内该算力对应的逻辑资源。
5.根据权利要求1所述的切片式边缘算力管理方法,其特征在于:所述步骤(3)的具体实现方式为:当一个边缘算力加入多个切片时则默认会在这些切片内进行算力资源共享,当算力资源共享使用时,不同切片按照优先级对算力资源进行分配,若切片未做优先级管理或优先级相等情况下,算力资源按照FIFO原则在这些切片之间进行算力资源分配。
6.根据权利要求5所述的切片式边缘算力管理方法,其特征在于:在算力资源共享时,不同业务场景对于算力资源的申请需要在切片内进行分配,优先级是针对算力资源本身制定的策略,即某个场景对某个切片具有高优先级使用的权利,如果没有指定相应优先级,则按照先申请先获得的原则进行切片内的算力资源分配。
7.根据权利要求1所述的切片式边缘算力管理方法,其特征在于:所述步骤(4)的具体实现方式为:首先为容纳算力资源的切片提供统一的使用接口,算力资源申请时根据算力资源申请需求以及优先级进行切片算力的分配,对于算力资源申请,需要根据算力资源切片的信息;进而统一维护切片,使用切片管理代替算力资源全局管理,在边缘计算云中心侧和边缘节点侧进行切片内算力资源的维护和管理。
8.根据权利要求1所述的切片式边缘算力管理方法,其特征在于:该方法通过将分布式的算力资源基于边缘网络组装成多个算力资源池,按照算力规格分层后切片管理,降低了算力资源管理的复杂性,不同业务场景根据自身需求进行算力使用申请,由于边缘算力采用的是切片式算力资源管理,可以快速匹配需求并定位符合需求的切片内算力资源。
CN202010969363.1A 2020-09-15 2020-09-15 一种切片式边缘算力管理方法 Pending CN112068964A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010969363.1A CN112068964A (zh) 2020-09-15 2020-09-15 一种切片式边缘算力管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010969363.1A CN112068964A (zh) 2020-09-15 2020-09-15 一种切片式边缘算力管理方法

Publications (1)

Publication Number Publication Date
CN112068964A true CN112068964A (zh) 2020-12-11

Family

ID=73696787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010969363.1A Pending CN112068964A (zh) 2020-09-15 2020-09-15 一种切片式边缘算力管理方法

Country Status (1)

Country Link
CN (1) CN112068964A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113037819A (zh) * 2021-02-26 2021-06-25 杭州雾联科技有限公司 一种边缘算力资源共享方法、装置及设备
CN115174619A (zh) * 2022-06-30 2022-10-11 重庆长安汽车股份有限公司 一种车辆算力共享方法、系统、电子设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113037819A (zh) * 2021-02-26 2021-06-25 杭州雾联科技有限公司 一种边缘算力资源共享方法、装置及设备
CN115174619A (zh) * 2022-06-30 2022-10-11 重庆长安汽车股份有限公司 一种车辆算力共享方法、系统、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN114741207B (zh) 一种基于多维度组合并行的gpu资源调度方法和系统
CN108762896A (zh) 一种基于Hadoop集群任务调度方法及计算机设备
Azizi et al. A priority-based service placement policy for fog-cloud computing systems
CN109783225B (zh) 一种多租户大数据平台的租户优先级管理方法及系统
CN112068964A (zh) 一种切片式边缘算力管理方法
CN104735095A (zh) 一种云计算平台作业调度方法及装置
CN111459641B (zh) 一种跨机房的任务调度和任务处理的方法及装置
CN107295090A (zh) 一种资源调度的方法和装置
CN114787830A (zh) 异构集群中的机器学习工作负载编排
CN108684075B (zh) 集中式基站架构下的处理资源分配方法
CN113490279B (zh) 一种网络切片配置方法及装置
Pandey et al. A heuristic method towards deadline-aware energy-efficient mapreduce scheduling problem in Hadoop YARN
CN115103450B (zh) 一种多业务时隙分配方法和设备
CN115460216A (zh) 算力资源调度方法和装置、算力资源调度设备、系统
Fiore et al. A cluster-based data-centric model for network-aware task scheduling in distributed systems
CN115562841B (zh) 一种云视频服务自适应资源调度系统和方法
CN105207952A (zh) 一种分层服务质量队列限速方法和装置
CN116841710A (zh) 任务调度方法、任务调度系统及计算机存储介质
Li et al. On scheduling of high-throughput scientific workflows under budget constraints in multi-cloud environments
CN116527674A (zh) 一种管理和调度异构算力资源的方法
Yang et al. An offloading strategy based on cloud and edge computing for industrial Internet
Wang et al. QoS-aware resource allocation for stream processing engines using priority channels
CN115543582A (zh) 超算算力网络统一调度方法、系统及设备
CN113784395A (zh) 一种5g网络切片资源分配方法及系统
CN109756981B (zh) 一种基于拍卖机制的战场无线频谱资源分配方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination