CN111800282B - 网络系统、实例管控方法、设备及存储介质 - Google Patents

网络系统、实例管控方法、设备及存储介质 Download PDF

Info

Publication number
CN111800282B
CN111800282B CN201910277465.4A CN201910277465A CN111800282B CN 111800282 B CN111800282 B CN 111800282B CN 201910277465 A CN201910277465 A CN 201910277465A CN 111800282 B CN111800282 B CN 111800282B
Authority
CN
China
Prior art keywords
edge cloud
instance
cloud node
edge
migrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910277465.4A
Other languages
English (en)
Other versions
CN111800282A (zh
Inventor
王广芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202310139017.4A priority Critical patent/CN116170316A/zh
Priority to CN201910277465.4A priority patent/CN111800282B/zh
Priority to PCT/CN2020/081570 priority patent/WO2020207266A1/zh
Publication of CN111800282A publication Critical patent/CN111800282A/zh
Application granted granted Critical
Publication of CN111800282B publication Critical patent/CN111800282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5051Service on demand, e.g. definition and deployment of services in real time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5054Automatic deployment of services triggered by the service manager, e.g. service implementation by automatic configuration of network components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1012Server selection for load balancing based on compliance of requirements or conditions with available server resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1021Server selection for load balancing based on client or server locations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0894Policy-based network configuration management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例提供一种网络系统、实例管控方法、设备及存储介质。在本申请实施例中,结合边缘计算的概念,考虑将云计算的能力放到距离终端更近的边缘侧,于是提供一种包括边缘云节点的网络系统,在该网络系统中,边缘云节点中部署有可为服务需求方提供云计算服务的实例,在中心管控设备的管控下,这些实例可以为服务需求方提供云计算服务,达到了借助边缘云节点中的资源为用户提供服务的目的,使得“将云计算放到距离终端更近的边缘云节点中处理”成为现实,有利于降低响应时延,降低带宽成本。

Description

网络系统、实例管控方法、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种网络系统、实例管控方法、设备及存储介质。
背景技术
目前,对云计算的概念都是基于集中式的资源管控来提出的,即使采用多个数据中心互联互通形式,依然将所有的软硬件资源视为统一的资源进行管理,调度和售卖。随着5G、物联网时代的到来以及云计算应用的逐渐增加,终端侧对云资源在时延、带宽等性能上的要求越来越高,集中式的云网络已经无法满足终端侧日渐增高的云资源需求。
发明内容
本申请的多个方面提供一种网络系统、实例管控方法、设备及存储介质,用以降低服务的响应时延,降低带宽成本。
本申请实施例提供一种实例管控方法,包括:确定部署于网络系统中至少一个边缘云节点中的至少一个实例,所述至少一个实例可为服务需求方提供云计算服务;对所述至少一个实例进行管控,以供所述至少一个实例为所述服务需求方提供云计算服务。
本申请实施例还提供一种网络系统,包括:中心管控设备,以及至少一个边缘云节点;所述至少一个边缘云节点中部署有至少一个实例,所述至少一个实例可为服务需求方提供云计算服务;所述中心管控设备,用于对所述至少一个实例进行管控,以供所述至少一个实例为所述服务需求方提供云计算服务。
本申请实施例还提供一种中心管控设备,包括:存储器和处理器;所述存储器,用于存储计算机程序;当所述计算机程序被所述处理器执行时,致使所述处理器实现本申请实施例提供的实例管控方法中的步骤。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现本申请实施例提供的实例管控方法中的步骤。
在本申请实施例中,结合边缘计算的概念,考虑将云计算的能力放到距离终端更近的边缘侧,于是提供一种包括边缘云节点的网络系统,在该网络系统中,边缘云节点中部署有提供云计算服务的实例,在中心管控设备的管控下,这些实例可以提供云计算服务,达到了借助边缘云节点中的资源为用户提供服务的目的,使得“将云计算放到距离终端更近的边缘云节点中处理”成为现实,有利于降低服务的响应时延,降低带宽成本。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1a为本申请示例性实施例提供的一种网络系统的结构示意图;
图1b为本申请示例性实施例提供的中心管控设备与边缘管控设备的一种结构示意图;
图1c为本申请示例性实施例提供的另一种网络系统的结构示意图;
图2a为本申请示例性实施例提供的一种实例管控方法的流程示意图;
图2b为本申请示例性实施例提供的一种实例升级方法的流程示意图;
图2c为本申请示例性实施例提供的一种实例迁移方法的流程示意图
图3为本申请示例性实施例提供的一种中心管控设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
针对现有集中式的云网络已经无法满足终端日渐增高的云资源需求的技术问题,在本申请一些实施例中,结合边缘计算的概念,考虑将云计算的能力放到距离终端更近的边缘侧,于是提供一种包括边缘云节点的网络系统,在该网络系统中,边缘云节点中部署有提供云计算服务的实例,在中心管控设备的管控下,这些实例可以提供云计算服务,达到了借助边缘云节点中的资源为用户提供服务的目的,使得“将云计算放到距离终端更近的边缘云节点中处理”成为现实,有利于降低服务的响应时延,降低带宽成本。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1a为本申请示例性实施例提供的一种网络系统的结构示意图。如图1a所示,该网络系统100包括:中心管控设备101和至少一个边缘云节点102;至少一个边缘云节点102均与中心管控设备101网络连接。
本实施例的网络系统100是基于云计算技术和边缘计算的能力,构筑在边缘基础设施之上的云计算平台,是一种边缘位置的具备计算、网络、存储以及安全等能力的云平台。
与中心云或者传统的云计算平台相对应,本实施例的网络系统100可以视为一种边缘云网络系统。边缘云是个相对概念,边缘云是指相对靠近终端的云计算平台,或者说,与中心云或者传统的云计算平台相区别,中心云或者传统的云计算平台可以包括资源规模化且位置集中的数据中心,而边缘云节点覆盖的网络范围更广泛,也因此具备距离终端更近的特性,单个边缘云节点的资源规模较小,但是边缘云节点的数量多,多个边缘云节点构成了本实施例中边缘云的组成部分。本实施例的终端是指云计算服务的需求端,例如可以是互联网中的终端或者用户端,或者物联网中的终端或用户端。边缘云网络是基于中心云或者传统的云计算系统与终端之间的基础设施构建的网络。其中,网络系统100包括至少一个边缘云节点102,每个边缘云节点102包括一系列的边缘基础设施,这些边缘基础设施包括但不限于:分布式数据中心(DC)、无线机房或集群,运营商的通信网络、核心网设备、基站、边缘网关、家庭网关、计算设备和/或存储设备等边缘设备及对应的网络环境等等。在此说明,不同边缘云节点102的位置、能力以及包含的基础设施可以相同,也可以不相同。
其中,本实施例的网络系统100与中心云或传统的云计算平台等中心网络、终端结合可形成“云边端三体协同”的网络架构,在该网络架构中,可以将网络转发、存储、计算和/或智能化数据分析等任务放在网络系统100中的各边缘云节点102中处理,由于各边缘云节点102更靠近终端,因此可以降低响应时延,减轻中心云或传统的云计算平台的压力,降低带宽成本。
如何合理地调度多个边缘云节点资源,以及如何管控好多个边缘云节点以正确和稳定的逻辑进行云计算服务,是一个重要的挑战。在本实施例的网络系统100中,部署有中心管控设备101,中心管控设备101以边缘云节点102为管控对象,在资源调度,镜像管理,实例管控,运维,网络,安全等各方面对网络系统100中的至少一个边缘云节点102进行统一管控,从而将云计算服务放到各边缘云节点102中处理。在部署实施上,中心管控设备101可以部署在一个或多个云计算数据中心中,或者,可以部署在一个或多个传统数据中心中,中心管控设备101也可以和其管控的至少一个边缘云节点共同构成边缘云网络,本实施例对此不做限定。
对一个边缘云节点102来说,可以对外提供各种资源,例如CPU、GPU等计算资源,内存、硬盘等存储资源,带宽等网络资源等。另外,边缘云节点102还可以根据镜像创建相应实例,通过实例对外提供各种云计算服务。其中,镜像是在边缘云节点中创建实例所需的基础文件,例如可以是为用户提供云计算服务所需的操作系统、应用、或操作配置等镜像文件,其可以是符合边缘云节点计算部署要求,根据特定的一系列文件按照一定的格式制作成的文件。另外,镜像的形态是多样的,可以是虚拟机(Virtual Machine,VM)镜像文件、容器(Docker)镜像文件或各类型的应用打包文件等,镜像形态可以与云计算服务需要使用的虚拟化技术有关,本实施例对此不做限定。与镜像对应,实例的实现形态可以是虚拟机、容器或应用程序等。
结合上述,在本实施例中,中心管控设备101可以根据资源需求对至少一个边缘云节点102进行资源调度,也可以根据镜像需求针对至少一个边缘云节点102进行镜像的管理和分发,当然,也可以根据云计算服务需求既对至少一个边缘云节点102进行资源调度,又为至少一个边缘云节点102提供镜像。其中,云计算服务需求包括了资源需求和镜像需求。可选地,中心管控设备101可以对外提供需求提交入口,该需求提交入口可以是web页面、应用页面或命令窗等。该需求提交入口的作用是供需求方向中心管控设备101提交自己的需求描述信息。
对于资源需求方,可以通过上述需求提交入口向中心管控设备101提交资源需求描述信息,该资源需求描述信息包括:边缘云节点选择参数和资源选择参数;边缘云节点选择参数包括调度域和/或对边缘云节点的性能要求等,资源选择参数包括资源类型、资源数量、以及对资源设备的性能要求等。中心管控设备101可根据资源需求描述信息,对至少一个边缘云节点进行资源调度。可选地,一种资源调度方式包括:中心管控设备101根据资源需求描述信息,从网络系统100的至少一个边缘云节点102中确定被调度的目标边缘云节点以及目标边缘云节点中被调度的资源信息;根据该资源信息控制目标边缘云节点中相应资源设备进行资源分配或预留。
对于镜像需求方,可以通过上述需求提交入口向中心管控设备101提交镜像需求描述信息,该镜像需求描述信息可指向需要使用的镜像,可以是镜像本身,也可以是镜像的名称、ID等标识类信息,还可以是一些对云计算服务的功能描述信息,这些信息可以反映出所需的镜像。中心管控设备101可根据镜像需求描述信息,获取镜像;将镜像提供给网络系统100中需要该镜像的边缘云节点,以供该边缘云节点根据该镜像创建相应实例,由该实例对外提供相应云计算服务。
对云计算服务需求方,可以通过上述需求提交入口向中心管控设备101提交服务需求描述信息,该服务需求描述信息包括资源需求描述信息和镜像需求描述信息。关于资源需求描述信息和镜像需求描述信息可参见前面的描述,在此不再赘述。值得的说明的是,服务需求描述信息中的资源需求描述信息和镜像需求描述信息可以是一并提交,也可以分开提交。中心管控设备101可根据服务需求描述信息,对网络系统100中至少一个边缘云节点102进行资源调度;为至少一个边缘云节点102中被调度的资源提供镜像,以利用至少一个边缘云节点中被调度的资源提供相应云计算服务。
关于上述资源调度和镜像管理与分发的详细过程,可参见下述实施例,在此暂不详述。
在本实施例中,中心管控设备101不仅可以为至少一个边缘云节点102提供镜像,供边缘云节点102创建相应实例,还可以对至少一个边缘云节点102中的实例进行管控。至少一个边缘云节点102中的实例可以是至少一个,即一个或多个。边缘云节点中的实例可以是根据中心管控设备101提供的镜像创建的,也可以是根据其它镜像创建的,也可以是从其它边缘云节点或其它系统中迁移过来的,对此不做限定。至少一个边缘云节点102中的实例可为服务需求方提供云计算服务,这里的服务需求方可以是任何需要使用边缘云节点中的实例提供的云计算服务的设备、应用、系统或另一服务。以系统为例,服务需求方可以是但不限于:在线视频系统、风险管控系统、客户信息管理系统、数据分发系统等。中心管控设备101可对至少一个边缘云节点102中的至少一个实例进行管控,便于这些实例为服务需求方提供云计算服务。
其中,中心管控设备101可以对至少一个实例进行各种管控,例如可以包括升级、迁移、关停、重启和释放等中的至少一种,但不限于此。下面将对实例升级和迁移进行详细说明。
实例升级:
在实际应用中,随着业务需求的变化或镜像版本的更新,有可能对镜像或相应实例进行升级。其中,中心管控设备101对实例进行升级管控主要包括:
中心管控设备101从至少一个实例中确定待升级实例,待升级实例可以是一个或多个;向服务需求方发送升级请求,以供服务需求方结合待升级实例上的业务情况为待升级实例确定升级策略。该升级请求携带有待升级实例的标识类信息,例如待升级实例的ID、名称等,也可以是待升级实例对应服务的ID、名称等,还可以是待升级实例对应镜像的ID、名称等信息。服务需求方在接收到升级请求后,可根据该升级请求确定待升级实例,结合待升级实例上的业务情况,例如待升级实例上的业务请求及业务请求的响应状态等,判断待升级实例是否适合升级,什么时间适合升级,采用什么方法进行升级等,进而可为该待升级实例生成升级策略并返回给中心管控设备101。中心管控设备101接收服务需求方发送的升级策略,依据升级策略对待升级实例进行升级。
在一可选实施例中,服务需求方可结合待升级实例上的业务情况,例如已接收到且尚未完成的业务请求(简称为存量业务请求)的数量,是否还有新增的业务请求(增量业务请求)等,判断什么时间可以对待升级实例进行升级,也就是说,升级策略中可以包括升级时间。如果待升级实例上的存量业务请求均已被响应,且不再有增量业务请求,在这种情况下,对待升级实例进行升级业务请求不会被中断,不会影响用户感受,则认为可以对待升级实例进行升级。对服务需求方来说,在认为可以对待升级实例进行升级时,可以向中心管控设备101返回升级通知,该升级通知携带有指示中心管控设备101在接收到升级通知后对待升级实例进行升级的时间信息,升级通知携带该时间信息的方式可以是显式的,也可以是隐式的。对中心管控设备101而言,在接收到升级通知后可对待升级实例进行升级。
当然,除此上述方式之外,服务需求方也可以结合待升级实例上的业务情况,预估出合适的升级时间,将该升级时间携带在升级通知中发送给中心管控设备101。中心管控设备101接收到升级通知后,从中获取升级时间,并在该升级时间开始对待升级实例进行升级。
升级策略可以包括升级时间,该升级时间由服务需求方结合待升级实例上的业务情况确定。当然,升级策略也可以不包括升级时间,升级时间可由中心管控设备101根据待升级实例的状态、中心管控设备101的负载情况等因素自行确定。除此之外,升级策略可以包括升级方法,这里的升级方法是指对待升级实例进行升级采用的方法,可由服务需求方结合待升级实例上的业务情况确定。根据镜像类型的不同,升级方法也不同。若升级策略包括升级时间,则中心管控设备101可以在升级策略中指定的升级时间开始对待升级实例进行升级;若升级策略包括升级方法,则中心管控设备101可以采用升级策略中指定的升级方法对待升级实例进行升级;若升级策略包括升级时间和升级方法,则中心管控设备101可以采用升级策略中指定的升级方法,在升级策略中指定的升级时间开始对待升级实例进行升级。
可选地,对实例进行升级,可由中心管控设备101发起。例如,中心管控设备101可以监控各实例对应镜像的版本信息,当发现新版本的镜像时,可以确定需要对与该新版本的镜像对应的实例进行升级;或者,也可以监控各实例的运行状态、生命周期等信息,当发现实例运行过程中出现漏洞、不稳定、功能不全、CPU或内存资源消耗过大等问题时,可以确定需要对出现这些问题的实例进行升级。
可选地,对实例进行升级,也可以由服务需求方发起。例如,根据业务需求,需要对实例进行升级时,服务需求方可以向中心管控设备101发送升级描述信息,该升级描述信息包括实例过滤条件,基于该实例过滤条件可以从众多实例中过滤出待升级实例。实例过滤条件可以是待升级实例的标识类信息,例如待升级实例的ID、名称,或者和待升级实例对应镜像的ID、名称,或者待升级实例对应服务的ID、名称等,这些信息均可确定出待升级实例。或者,若需要对全部实例进行升级,则实例过滤条件也可以是指示对全部实例进行升级的标识性信息,例如“all”、“1”等,该标识性信息可灵活设定。对中心管控设备101而言,可接收服务需求方发送的升级描述信息,从该升级描述信息中获取实例过滤条件,根据该实例过滤条件,从至少一个实例中确定待升级实例;然后向服务需求方发送升级请求,以请求服务需求方结合待升级实例上的业务情况为该升级实例确定升级策略;在服务需求方返回待升级实例的升级策略后,可依据升级策略对待升级实例进行升级。
其中,对待升级实例进行升级主要是指:关停待升级实例,根据相应版本(一般是指新版本)的镜像对待升级实例进行更新,更新完后再重启实例。其中,对待升级实例进行升级所需的镜像版本可以由中心管控设备101确定,例如将相应镜像的最新版本作为升级所需的镜像版本,也可以由服务需求方指定。可选地,服务需求方可以将升级所需的镜像版本携带在升级描述信息中提供给中心管控设备101,例如该升级描述信息可以包括“对所有或指定实例进行镜像版本A到镜像版本B的升级”等信息。基于此,中心管控设备101可以从升级描述信息中获取升级所需的镜像版本,然后,依据升级策略,利用该镜像版本对应的镜像对待升级实例进行升级。当待升级实例全部完成升级后,此次实例升级过程结束。
实例迁移:
在实际应用中,在一些情况下需要对实例进行迁移。例如,在整个边缘云节点故障或不可用的情况下,需要将该边缘云节点中的实例迁移到其它边缘云节点中。又例如,在承载某个实例的物理机出现故障或宕机的情况下,需要将该物理机上的实例迁移到其它物理机上。又例如,可能因为业务需要,需要将某个或某些实例从一个边缘云节点迁移到其它边缘云节点中。又例如,在需要进行资源归并的情况下,也需要对某个或某些实例进行迁移。在中心管控设备101的管控下,可对边缘云节点中的实例进行迁移,该迁移过程主要包括:
中心管控设备101从至少一个实例中确定待迁移实例。待迁移实例可以是一个或多个;若待迁移实例是多个,多个待迁移实例可部署于同一边缘云节点中,也可以部署于不同边缘云节点中。
在一些应用场景中,中心管控设备101可以监控至少一个边缘云节点102中部署的至少一个实例的状态,根据至少一个实例的状态,获取出现故障的实例和/或运行中发生指定事件的实例作为待迁移实例,进而对待迁移实例进行迁移。其中,出现故障的实例是指不能正常运行的实例,例如可以是发生宕机的物理机上的实例,也可以是本身宕机的实例等,这类实例需要进行迁移,以便能够继续为服务需求方提供云计算服务。指定事件主要是指一些出现后实例仍能正常运行的事件,可以根据应用需求灵活设定,对此不做限定。举例说明,指定事件可以是一些预警或告警事件等,虽然发生一些预警或告警事件,但实例并未产生实际问题,仍可运行(即未故障),但有故障隐患,可在故障前及时进行迁移,以避免故障引起的服务中断等问题。另外,中心管控设备101维护有各边缘云节点的信息以及各边缘云节点中部署的各实例的信息,基于此,可以确定待迁移实例所属的边缘云节点,为便于描述和区分,将待迁移实例在迁移前所属的边缘云节点记为第一边缘云节点。
在另一些应用场景中,随着时间的积累,边缘云节点中会出现一些资源碎片,或者需要部署一个资源规格较大的实例,但边缘云节点中的资源设备上可能已经没有满足资源规格要求的可用资源,这些情况下可以通过实例迁移对边缘云节点中的资源进行归并,这可以充分利用资源碎片,进而产出规格较大的资源块,有利于提高资源利用率。基于此,中心管控设备101可以根据资源归并需求,从至少一个实例中确定待迁移实例,进而对待迁移实例进行迁移。其中,资源归并主要是通过实例迁移对资源碎片进行整合的过程,经过整合后,边缘云节点中的资源碎片会减少甚至不存在,这有利于提高边缘云节点中的资源利用率。值得说明的是,资源归并需求可以是系统级的,也可以节点级的。系统级的资源归并是指从整个网络系统的维度考虑,通过实例迁移对整个网络系统中的资源碎片进行整合;节点级的资源归并是指从边缘云节点的维度考虑,通过实例迁移对边缘云节点中的资源碎片进行整合。
可选地,资源归并需求可以是服务需求方提供的。例如,服务需求方需要部署一个新的实例时,若为其服务的边缘云节点中各资源设备上的可用资源均不足以承载该新实例,可以要求对该边缘云节点中的实例进行迁移实现资源整合,从而为新实例提供足够的资源。或者,资源归并需求也可以是中心管控设备101的资源调度模块的定期行为。例如,中心管控设备101的资源调度模块定期执行资源碎片检查,当发现碎片率达到一定的阈值并可以执行实例迁移时,对各边缘云节点中的资源碎片进行整合,提高边缘云节点中的资源利用率。
其中,资源归并需求中包含有与资源归并相关的信息。例如,资源归并需求中可以包含为了达到资源归并目的需要迁移的实例的信息,基于此,可根据资源归并需求,直接确定待迁移实例。又例如,资源归并需求中可以包含需要资源归并的边缘云节点的信息。基于此,可根据资源归并需求,确定需要进行资源归并的边缘云节点,本实施例中将需要资源归并的边缘云节点称为第一边缘云节点;进而可以结合第一边缘云节点中各资源设备上剩余的可用资源和第一边缘云节点中各实例需要的资源,确定待迁移实例。
无论是哪种应用场景,在确定待迁移实例后,中心管控设备101可以判断待迁移实例所属的第一边缘云节点是否满足节点内迁移条件;若第一边缘云节点满足节点内迁移条件,则对待迁移实例进行边缘云节点内的迁移;若第一边缘云节点不满足节点内迁移条件,则对待迁移实例进行跨边缘云节点的迁移。
可选地,中心管控设备101可以判断第一边缘云节点当前是否处于可用状态;若第一边缘云节点当前处于可用状态,判断第一边缘云节点的可用资源是否足够承载待迁移实例;若第一边缘云节点的可用资源足够承载待迁移实例,确定第一边缘云节点满足节点内迁移条件;若第一边缘云节点当前处于不可用状态,或者第一边缘云节点的可用资源不足以承载待迁移实例,确定第一边缘云节点不满足节点内迁移条件。在本申请实施例中,将实例的迁移划分为两种类型:节点内迁移和跨节点迁移。其中,第一边缘云节点的可用资源主要是指第一边缘云节点中各台资源设备上的可用资源;相应地,判断第一边缘云节点的可用资源是否足够承载待迁移实例主要是指判断第一边缘云节点中是否存在可用资源足以承载待迁移实例的资源设备。
值得说明的是,在资源归并场景中,为了实现资源归并的实例迁移主要是节点内迁移,当然,也可以是跨节点迁移。可选地,在根据第一边缘云节点中各资源设备上剩余的可用资源和第一边缘云节点中各实例需要的资源确定待迁移实例的过程中,还可以确定待迁移实例需要迁移到的资源设备,该资源设备是第一边缘云节点中剩余的可用资源可以承载待迁移实例的资源设备。当然,若第一边缘云节点中不存在剩余的可用资源可以承载待迁移实例的资源设备,可以针对待迁移实例进行跨节点迁移。鉴于资源归并的目的,在针对待迁移实例进行跨节点迁移的过程中,优先考虑将待迁移实例迁移到其它边缘云节点中已经被使用且剩余的可用资源可以承载待迁移实例的资源设备上;进一步,在有多个已经被使用且剩余的可用资源可以承载待迁移实例的资源设备的情况下,可以以资源碎片最小为原则,从中选择剩余的可用资源与待迁移实例需要的资源的匹配度较高的资源设备,尽量产生较少的资源碎片或不产生资源碎片。
对于节点内迁移:可选地,可以通过热迁移技术保证实例所提供云计算服务的连续性,关于热迁移技术可参见现有技术,在此不再赘述。
对于跨节点迁移:中心管控设备101可以从至少一个边缘云节点选择第二边缘云节点,第二边缘云节点不同于第一边缘云节点,且第二边缘云节点中的可用资源足够承载待迁移实例,即有足够资源;将待迁移实例迁移到第二边缘云节点中,并将待迁移实例在第二边缘云节点中的属性信息发送给服务需求方,以供服务需求方基于该属性信息针对待迁移实例进行业务调度。其中,待迁移实例在第二边缘云节点中的属性信息是指在待迁移实例迁移到第二边缘云节点之后,外部(例如服务需求方或服务需求方授权的第三方)针对待迁移实例进行业务调度所需的信息,例如可以包括但不限于:第二边缘云节点所在的地区、运营商信息和/或公网IP等信息。以服务需求方为例,可以根据上述属性信息中第二边缘云节点所在的地区和运营商信息,结合发起业务请求的终端使用网络的运营商信息和所在地区等信息,判断是否将该业务请求分配到第二边缘云节点中的待迁移实例;若确定将业务请求分配到第二边缘云节点中的待迁移实例,则可以通过系统的调度能力,将上述属性信息中的公网IP提供给终端,终端的请求就可以访问到第二边缘云节点中的待迁移实例,达到将终端的业务请求调度到第二边缘云节点中的待迁移实例上的目的。
可选地,在选择第二边缘云节点时,可以采用但不限于以下方式:
方式1:可以根据其它边缘云节点与第一边缘云节点之间的距离,选择与第一边缘云节点的距离小于设定距离阈值的边缘云节点,或者选择与第一边缘云节点距离最近的边缘云节点,或者从与第一边缘云节点距离最近的N个边缘云节点中任意选择一个边缘云节点,作为第二边缘云节点。在方式1中,第二边缘云节点距离第一边缘云节点距离最近或较近,可节约数据传输时间,有利于提高迁移效率。可选地,其它边缘云节点与第一边缘云节点之间的距离可以是其它边缘云节点与第一边缘云节点之间的平均距离,也可以是其它边缘云节点与第一边缘云节点的中心之间的距离,还可以是其它边缘云节点与第一边缘云节点最靠近的外边缘之间的距离等,可根据需求适应性定义。
方式2:可以根据其它边缘云节点的带宽资源,从中选择带宽资源相对充足的边缘云节点,例如选择带宽资源最大的,或者选择带宽资源大于设定带宽阈值的,或者选择带宽使用率较低的边缘云节点,作为第二边缘云节点。在方式2中,第二边缘云节点的带宽资源充足,可提高数据传输速率,有利于提高迁移效率。
方式3:可以根据其它边缘云节点当前的负载情况,从中选择负载相对较轻的边缘云节点,例如选择负载量最小的,或者选择负载量小于设定负载量阈值的边缘云节点,作为第二边缘云节点。在方式3中,第二边缘云节点的负载较轻,可有足够资源且能够及时处理实例迁移,有利于提高迁移效率。
可选地,在将待迁移实例迁移到第二边缘云节点时,中心管控设备101可根据待迁移实例的资源需求,在第二边缘云节点中为待迁移实例进行资源预留或分配;在资源预留或分配成功后,将待迁移实例迁移到第二边缘云节点中预留或分配的资源上。例如,可结合待迁移实例的资源需求,确定待迁移实例需要的资源类型、资源量和/或对资源设备的性能要求等信息,根据这些信息在第二边缘云节点中进行资源预留或分配,可为实例成功迁移提供资源保障。关于中心管控设备101在第二边缘云节点中为待迁移实例进行资源预留或分配的过程,可参见后续资源调度部分的内容,在此不再赘述。
可选地,若待迁移实例是出现故障的实例,即不可正常运行的实例,中心管控设备101还可以将该迁移事件通知给服务需求方,这样服务需求方可以做出合适的响应动作,比如更新该实例在服务需求方中的信息,或针对实例迁移过程中的宕机情况做出容灾响应。进一步,可在通知迁移事件的过程中,一并将待迁移实例在第二边缘云节点中的属性信息提供给服务需求方。当然,也可以在将待迁移实例成功迁移至第二边缘云节点之后,将待迁移实例在第二边缘云节点中的属性信息提供给服务需求方。
可选地,若待迁移实例是运行过程中发生指定事件的实例,即虽发生指定事件但仍可正常运行的实例,中心管控设备101还可以向服务需求方发送迁移请求,以供服务需求方结合待迁移实例上的业务情况为待迁移实例确定迁移策略;接收服务需求方发送的迁移策略,依据迁移策略将待迁移实例迁移到第二边缘云节点中。该迁移策略主要包括是否迁移、迁移时间以及迁移方式中的至少一个信息。可选地,服务需求方可以根据待迁移实例上的存量业务请求和增量业务请求的数量以及响应状态,确定什么时间进行迁移,例如可以在待迁移实例上的存量业务请求均已被响应,且增量业务请求不多的情况下,确定进行实例迁移。
进一步可选地,中心管控设备101可以将待迁移实例在第二边缘云节点中的属性信息连同上述迁移请求一并发送给服务需求方。或者,也可以在将待迁移实例成功迁移至第二边缘云节点之后,将待迁移实例在第二边缘云节点中的属性信息提供给服务需求方。
进一步可选地,若待迁移实例是发生指定事件但仍可正常运行的实例,在迁移过程中,待迁移实例可继续运行在第一边缘云节点中,这样迁移过程中的业务请可继续调度到第一边缘云节点中的待迁移实例上,保证业务连续性。在待迁移实例成功迁移到第二边缘云节点中,且服务需求方在确保将新的业务请求全部调度到第二边缘云节点中,且第一边缘云节点中的业务请求逐步减少最终没有新的业务请求,即运行于第一边缘云节点中的待迁移实例上不再有任何业务请求的情况下,中心管控设备可将第一边缘云节点中的待迁移实例释放掉。可选地,服务需求方在确定运行于第一边缘云节点中的待迁移实例上不再有任何业务请求,既没有存量业务请求也没有增量业务请求之后,可以向中心管控设备101发送释放通知;中心管控设备101接收服务需求方发送的释放通知,根据该释放通知将运行在第一边缘云节点中的待迁移实例释放掉。进一步,中心管控设备101还可以将运行在第一边缘云节点中的待迁移实例的运行状态同步给第二边缘云节点中的待待迁移实例。
进一步,无论待迁移实例是哪种实例,将待迁移实例迁移到第二边缘云节点中,主要是控制第二边缘云节点中相应资源设备根据待迁移实例对应的镜像或实例快照在预留或分配的资源上创建待迁移实例的过程。可选地,中心管控设备101可以向第二边缘云节点中相应资源设备提供待迁移实例对应的应用镜像或实例快照,以供第二边缘云节点中相应资源设备根据应用镜像或实例快照在预留或分配的资源上创建待迁移实例,但不限于此。
可选地,本实施例的中心管控设备101可以将自己的实例升级、实例迁移等管控功能封装成一系列应用编程接口(Application Programming Interface,API)并开放给服务需求方使用。这些开放的API称为开放API(OpenAPI),中心管控设备101可通过OpenAPI与服务需求方进行交互。
值得说明的是,在网络系统100中,中心管控设备101可以直接对至少一个边缘云节点102进行管控和调度,但并不限于此。如图1b所示,在网络系统100中,除了包括中心管控设备101和至少一个边缘云节点102之外,还包括边缘管控设备103。其中,边缘管控设备103的数量可以是一个,也可以是多个。另外,边缘管控设备103可以部署在一个或多个边缘云节点102中。在一可选实施例中,如图1b所示,每个边缘云节点102中分别部署边缘管控设备103。进一步,每个边缘云节点包括一台或多台资源设备,可选地,边缘管控设备103可集中部署在一台资源设备上,也可以分散部署在多台资源设备上。另外,每个边缘云节点除了包括资源设备之外,还可以包括一台或多台专有设备,其中边缘管控设备103可以集中部署在一台专有设备上,或分散部署在多台专有设备上。其中,专有设备是指用来部署边缘管控设备103的物理设备,不同于资源设备。此外,边缘管控设备103也可以与中心管控设备101部署在一起,在此不作限定。另外,中心管控设备101可以部署在一个或多个云计算数据中心或传统数据中心中,也可以和至少一个边缘云节点一起部署在边缘云网络中。
在此说明,本实施例的中心管控设备可以是一台具有资源调度和镜像管理等能力的逻辑设备,这些功能可以部署一台物理机或虚拟机上实现,也可以分散性地部署在多台物理机或虚拟机上。当然,本实施例的中心管控设备也可以是一台或多台具有资源调度和镜像管理等能力的物理设备。本申请实施例并不限定中心管控设备101的实现结构,凡是具有上述能力的设备结构均适用于本申请实施例。
与中心管控设备101相类似,边缘管控设备103也可以是一台逻辑设备,其具有的能力可以部署一台物理机(例如边缘云节点中的资源设备或专有设备)或虚拟机上实现,也可以分散性地部署在多台物理机(例如边缘云节点中的资源设备或专有设备)或虚拟机上。当然,边缘管控设备也可以是一台或多台具有相应能力的物理设备。本申请实施例并不限定边缘管控设备103的实现结构,凡是具有相应能力的设备结构均适用于本申请实施例。
在本实施例中,边缘管控设备103可辅助、配合中心管控设备101对至少一个边缘云节点102进行管控和调度。在边缘管控设备103的协助下,中心管控设备101可以更加方便、高效地对至少一个边缘云节点102进行管控和调度,进而达到充分利用边缘资源的目的。
其中,中心管控设备101与边缘管控设备103之间可以建立安全、加密的通信通道,并基于该通信通道进行交互。该通信通道包括控制接口和数据接口,则中心管控设备101基于控制接口和数据接口与边缘管控设备103进行控制面和数据面的交互,完成对边缘云节点102的调度和管控。其中,数据接口用于在中心管控设备101与边缘管控设备103之间进行数据传输。控制接口具备但不限于以下功能:
1、资源调度能力:中心管控设备101通过具有资源调度能力的控制接口(可简称为资源调度接口)可从多个维度对边缘云节点进行资源调度,边缘云节点是中心管控设备101进行资源调度的对象;
2、镜像管理和分发能力:中心管控设备101通过具有镜像管理和分发能力的控制接口(简称为镜像管理接口)可将镜像提供给边缘云节点,这样,边缘云节点可根据收到的镜像创建相应实例,通过实例提供相应云计算服务;
3、运维管理能力:中心管控设备101通过具有运维管理能力的控制接口(简称为运维管理接口)对边缘云节点进行运维管理,运维管理包括但不限于:管控边缘云节点中的应用、虚拟化软件等,监控实例的状态、资源使用量以及基础设施等。
与上述控制接口具有的能力相对应,本实施例的中心管控设备101具有但不限于以下功能:
1、可根据服务需求描述信息,例如云计算服务的规格、需要部署云计算服务的区域、运营商网络的分布、网络时延、负载情况、带宽成本、需要的资源类型和/或资源设备的性能要求等,对边缘云节点进行调度;
2、可获取云计算服务所需的镜像,将镜像提供给边缘云节点中相应资源设备进行配置安装,以供相应资源设备创建相应实例来提供云计算服务;
3、可对边缘云节点进行运维管控,包括但不限于:对边缘云节点中应用、虚拟化组件、实例的状态、资源用量和/或基础设施情况等进行管控,实现远程运维、日志管理等。
除上述功能之外,中心管控设备也可以具有其它一些功能,例如安全保障功能,涉及对中心管控设备的安全、中心管控设备与边缘管控设备之间以及边缘云节点之间的链路安全、边缘云节点的安全;负责维护网络系统中组网信息等。
在网络系统100中,至少一个边缘云节点102可形成资源池,每个边缘云节点102作为调度对象,在中心管控设备101的调度下对外提供各种资源或云计算服务。其中,中心管控设备101与边缘管控设备102相互配合,可以对至少一个边缘云节点102进行资源调度,也可以针对至少一个边缘云节点102进行镜像的管理和分发,当然,也可以既对至少一个边缘云节点102进行资源调度,又为至少一个边缘云节点102提供镜像。除了针对边缘云节点102进行资源调度和镜像管理和分发之外,对边缘云节点102中的实例进行管控也是网络系统100需要解决的一个问题,成功地解决该问题也是“将云计算放到距离终端更近的边缘云节点中处理”的基础。为此,中心管控设备101与边缘管控设备103相互配合,还可以对至少一个边缘云节点102中的实例进行管控,例如升级、迁移、关停、重启和释放中的至少一种。
可选地,在对待升级实例进行升级的过程中,边缘管控设备103可协助中心管控设备101依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。例如,中心管控设备101可以将升级策略和镜像版本对应的镜像发送给边缘管控设备103,由边缘管控设备103依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。进一步,若每个边缘云节点中都部署有边缘管控设备103,则中心管控设备101可以将升级策略和镜像版本对应的镜像发送给待升级实例所属边缘云节点中的边缘管控设备103,由待升级实例所属边缘云节点中的边缘管控设备103依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。对边缘管控设备103来说,可采用升级策略指示的升级方法,在升级策略指示的升级时间,将镜像版本对应的镜像提供给待升级实例所在资源设备,由该资源设备利用该镜像对待升级实例进行升级。关于对待升级实例进行升级的其它描述,可参见前述实施例中的描述,在此不再赘述。
可选地,在对待迁移实例进行迁移的过程中,边缘管控设备103可协助中心管控设备101控制第二边缘云节点中相应资源设备为待迁移实例进行资源预留或分配。其中,中心管控设备101可以根据待迁移实例的资源需求,确定第二边缘云节点中被调度的资源信息,将该资源信息提供给边缘管控设备103,由边缘管控设备103根据该资源信息,控制第二边缘云节点中相应资源设备为待迁移实例进行资源预留或分配。进一步,若第二边缘云节点中部署有边缘管控设备103,则中心管控设备101可以将资源信息提供给第二边缘云节点中的边缘管控设备103,由第二边缘云节点中的边缘管控设备103根据该资源信息,控制第二边缘云节点中相应资源设备为待迁移实例进行资源预留或分配。
另外,在对待迁移实例进行迁移的过程中,边缘管控设备103还可协助中心管控设备101将待迁移实例迁移到第二边缘云节点中相应资源设备预留或分配的资源上。中心管控设备101可以向边缘管控设备103发送迁移指令,该迁移指令指示边缘管控设备103获取待迁移实例对应的镜像或实例快照并提供给第二边缘云节点中相应资源设备,供第二边缘云节点中相应资源设备根据该镜像或实例快照在预留或分配的资源上创建待迁移实例。进一步,若第二边缘云节点中部署有边缘管控设备103,则中心管控设备101可以向第二边缘云节点中的边缘管控设备103发送迁移指令,指示第二边缘云节点中的边缘管控设备103获取待迁移实例对应的镜像或快照并提供给第二边缘云节点中相应资源设备,供第二边缘云节点中相应资源设备根据该镜像或快照在预留或分配的资源上创建待迁移实例。
可选地,如果实例迁移过程使用的是快照,则根据快照的存储方式不同,边缘管控设备103获取快照的方式也会有所不同。如果快照存储在第一边缘云节点内,则要看第一边缘云节点的状态是否可用,如果第一边缘云节点处于不可用状态,则不适合使用快照进行实例迁移,需要改为使用镜像进行实例迁移;如果第一边缘云节点处于可用状态,则边缘管控设备可以从第一边缘云节点中获取快照。如果快照是分散存储在其它边缘云节点中,则获取快照的过程与第一边缘云节点的状态无关,边缘管控设备可以在其它边缘云节点处于可用状态的情况下从其它边缘云节点中获取快照。边缘管控设备在获取快照后,将快照拷贝提供给第二边缘云节点中相应资源设备,供相应资源设备通过快照创建待迁移实例。其中,通过快照创建实例能够恢复打快照时保存的数据。
可选地,如果实例迁移过程使用的是镜像,边缘管控设备103在获取镜像时,可以先判断第二边缘云节点中是否存储待迁移实例对应的镜像。如果第二边缘云节点有相应镜像,则边缘管控设备可以直接将第二边缘云节点中的相应镜像提供给第二边缘云节点中相应资源设备,供相应资源设备通过镜像创建出待迁移实例。如果第二边缘云节点没有相应镜像,边缘管控设备可以向中心管控设备请求相应镜像;中心管控设备可以从镜像库中获取镜像提供给边缘管控设备,或者指示边缘管控设备从其他存储有相应镜像的边缘云节点处获取镜像;边缘管控设备在获取相应镜像后提供给第二边缘云节点中相应资源设备,供相应资源设备通过镜像创建出待迁移实例。其中,中心管控设备指示边缘管控设备从其他存储有相应镜像的边缘云节点处获取镜像的过程可参见后续镜像管理与分发相关实施例中的描述,在此不再赘述。
在本申请下述实施例中,将对中心管控设备或者中心管控设备与边缘管控设备配合所实现的其它各种功能展开描述。
资源调度功能:
中心管控设备可对至少一个边缘云进行资源调度,主要是指根据服务需求描述信息,从网络系统100中的至少一个边缘云节点102中确定可被调度的目标边缘云节点及目标边缘云节点中被调度的资源信息;将该资源信息发送给边缘管控设备103,以供边缘管控设备103控制目标边缘云节点中相应资源设备进行资源分配或预留。可选地,目标边缘云节点的数量可以由用户指定,也可以由资源中心管控设备根据服务需求描述信息自主确定,可以是一个,也可以是多个。服务需求描述信息可以由服务需求方直接提交,也可以是从服务需求方提交的服务相关的信息中提取或计算得到的。服务需求方可以是用户,也可以是应用、物理机或需要某一服务的另一服务等。
这里所描述的资源调度功能主要包括边缘云节点的选择和边缘云节点内的资源调度两个方面,但不限于这两个方面。其中,边缘云节点内部的资源调度具体体现为确定目标边缘云节点中被调度的资源信息和提供资源信息的操作,主要目的是在每一个边缘云节点的粒度上把云计算服务分配到最终的基础资源,例如服务器等资源设备上。其中,中心管控设备可维护各边缘云节点包含的资源的信息,作为资源调度的基础。
可选地,服务需求描述信息中包括边缘云节点选择参数和资源选择参数。边缘云节点选择参数是指选择目标边缘云节点所需的参数;资源选择参数是指选择边缘云节点内被调度的资源所需的信息。基于此,中心管控设备可以从服务需求描述信息中解析出边缘云节点选择参数和资源选择参数;根据边缘云节点选择参数从至少一个边缘云节点中确定被调度的目标边缘云节点,并根据资源选择参数确定目标边缘云节点中被调度的资源信息。
例如,服务需求描述信息中可以包括调度域和/或云计算服务的QoS要求,这些参数可以作为边缘云节点选择参数。其中,调度域指向需要部署云计算服务的区域,这决定了应该被调度的边缘云节点的地理位置。云计算服务的QoS要求可以包括云计算服务对网络时延、负载情况和/或带宽成本等的要求。基于此,中心管控设备可以根据调度域和/或云计算服务的QoS要求,结合至少一个边缘云节点的地理位置和资源剩余量,选择能够满足调度域和/或QoS要求的边缘云节点作为目标边缘云节点。
例如,中心管控设备可以根据调度域,结合至少一个边缘云节点的地理位置,选择调度域指向的边缘云节点作为目标边缘云节点。或者,中心管控设备还可以根据云计算服务的QoS要求,例如网络时延、负载情况和/或带宽成本等要求,从边缘云节点中选择满足网络时延、负载情况和/或带宽成本要求的边缘云节点作为目标边缘云节点。当然,中心管控设备也可以同时根据调度域和云计算服务的QoS要求,结合至少一个边缘云节点的地理位置和资源剩余量,选择能够同时满足调度域和QoS要求的边缘云节点作为目标边缘云节点。
服务需求描述信息中除了包含调度域和/或云计算服务的QoS要求这些信息之外,还可以包括云计算服务所需的资源类型、资源数量和/或资源设备的性能等参数,这些参数可以作为资源选择参数。基于此,中心管控设备在确定目标边缘云节点之后,可以根据资源选择参数确定目标边缘云节点中被调度的资源信息。这里的资源信息可以包括:资源类型、资源数量和/或对资源设备的性能要求等信息,便于边缘管控设备据此控制目标边缘云节点中相应资源设备进行资源分配或预留。例如,资源类型可以包括但不限于:CPU、GPU等计算资源,内存、硬盘等存储资源,带宽资源等资源类型。以CPU资源为例,资源数量可以是12个CPU、24个CPU等,以内存资源为例,资源数量可以是16G内存、32G内存等;以带宽资源为例,资源数量可以是1M带宽,10M带宽等。
可选地,中心管控设备还可以具有算力编排的功能,算力编排是面向相对复杂一些的应用场景,将多个云计算服务绑定在一起作为最小的资源需求单元,这样,在资源调度过程中,可将绑定在一起的多个云计算服务作为整体,为它们选择同一个或几个边缘云节点,由同一个或几个边缘云节点为它们共同提供资源。算力编排完善了资源调度的多样性,增加了资源调度的灵活性,但未对资源调度的整体流程产生影响。
镜像管理与分发功能:
中心管控设备的镜像管理功能,主要是指对镜像进行管理,并为边缘云节点提供所需的镜像。这样,边缘云节点可根据镜像在相应资源设备上创建实例,进而由所创建的实例为用户提供所需的云计算服务。
在实际应用中,需要为边缘云节点提供镜像的场景是多种多样的。例如,在用户(例如服务需求方)提交服务需求描述信息的情况下,中心管控设备可以为被调度的目标边缘云节点提供相应镜像。又例如,在边缘云节点上已有实例为用户提供云计算服务的情况下,用户需要进行业务扩容时,可以向中心管控设备提交扩容需求,为了实现扩容目的,需要为目前正为用户提供云计算服务的边缘云节点提供相应镜像,以便该边缘云节点基于镜像创建新的实例,从而达到扩容的目的。为便于描述和区分,在下面描述中,将需要为其提供镜像的边缘云节点记为第三边缘云节点,第三边缘云节点可以是网络系统中的任一边缘云节点,具体视应用场景而定。下面以中心管控设备为第三边缘云节点提供镜像为例,对中心管控设备的镜像管理功能进行说明。
在需要为第三边缘云节点提供镜像时,中心管控设备可以先确定需要向第三边缘云节点提供的目标镜像;然后,为第三边缘云节点提供目标镜像,以供第三边缘云节点利用目标镜像提供云计算服务。
在本实施例的网络系统100中,维护有镜像库,该镜像库用于存储系统中的镜像。用户可以选择使用镜像库中的镜像。例如,可以向用户提供一个镜像配置界面,该界面上设有下拉菜单,下拉菜单包括很多可供用户选择的镜像,用户可以选择自己使用的镜像。基于此,在需要为第三边缘云节点提供镜像时,中心管控设备可以从镜像库中获取第三边缘云节点所需的镜像,然后将镜像提供给第三边缘云节点,并将镜像的使用权限开放给相应用户。可选地,中心管控设备可以直接将目标镜像下发给第三边缘云节点,也可以指示第三边缘云节点到指定存储位置下载目标镜像。
除此之外,中心管控设备还可以维护已下发镜像与已下发镜像所在边缘云节点的对应关系。该对应关系中可以包括已下发镜像的标识信息与已发下镜像所在边缘云节点的标识信息。已下发镜像是指中心管控设备已经提供(例如下发)给某个或某些边缘云节点的镜像;已下发镜像所在边缘云节点是指已下发镜像被提供给的边缘云节点。同一镜像可能被提供(例如下发)给一个边缘云节点,也可能被提供(例如下发)给多个边缘云节点。
基于所维护的已下发镜像与已下发镜像所在边缘云节点的对应关系,在需要为第三边缘云节点提供镜像时,中心管控设备还可以控制第三边缘云节点从已经具有该镜像的其它边缘云节点获取该镜像,无需直接向第三边缘云节点提供镜像,一定程度上可以减轻中心管控设备的处理负担,在控制合理的情况下,还可以提高镜像的获取效率。
详细地,在需要为第三边缘云节点提供镜像时,中心管控设备可以确定需要向第三边缘云节点提供的镜像,为了便于描述和区分,在本申请实施例中,将需要向第三边缘云节点提供的镜像记为目标镜像;根据目标镜像的信息,在所维护的已下发镜像与已下发镜像所在边缘云节点的对应关系中进行匹配;若在该对应关系中匹配到与目标镜像对应的第四边缘云节点,这说明该目标镜像已经被提供给第四边缘云节点,则可以将第四边缘云节点处的目标镜像提供给第三边缘云节点;其中,第四边缘云节点也可以网络系统中的边缘云节点,其数量可以是一个,也可以是多个。对第三边缘云节点来说,可在中心管控设备101的控制下,获取第四边缘云节点处的目标镜像。
在此说明,在网络系统100包括边缘管控设备103的情况下,中心管控设备具体可以将第四边缘云节点与目标镜像的信息发送给边缘管控设备;边缘管控设备103根据第四边缘云节点与目标镜像的信息,将第四边缘云节点处的目标镜像提供给第三边缘云节点中的相应资源设备,供相应资源设备根据目标镜像创建可提供云计算服务的实例,进而为服务需求方提供该云计算服务。其中,第四边缘云节点的信息可以是任何能够标识第四边缘云节点的信息,例如可以是第四边缘云节点的ID、名称或地理位置等信息。目标镜像的信息可以是任何能够标识目标镜像的信息,例如可以是目标镜像的ID、名称或编号等。
进一步,在第三边缘云节点和第四边缘云节点中均部署有边缘管控设备103的情况下,则中心管控设备101具体可以将第四边缘云节点与目标镜像的信息发送给第三边缘云节点中的边缘管控设备,供第三边缘云节点中的边缘管控设备通过其与第四边缘云节点中的边缘管控设备之间的通信通道从第四边缘云节点处获取目标镜像并提供给第三边缘云节点中的相应资源设备。对第三边缘云节点中的边缘管控设备103来说,可接收中心管控设备101发送的第四边缘云节点和目标镜像的信息,根据第四边缘云节点与目标镜像的信息,通过其与第四边缘云节点中的边缘管控设备之间的通信通道,从第四边缘云节点处获取目标镜像,将目标镜像提供给第三边缘云节点中相应资源设备,供相应资源设备根据目标镜像创建可提供云计算服务的实例,进而提供云计算服务。
更进一步,第三边缘云节点中的边缘管控设备103通过其与第四边缘云节点中的边缘管控设备之间的通信通道,从第四边缘云节点获取目标镜像的一种过程包括:第三边缘云节点中的边缘管控设备103通过其与第四边缘云节点中的边缘管控设备之间的通信通道,向第四边缘云节点中的边缘管控设备103发送获取目标镜像的请求,该请求中携带有目标镜像的信息。第四边缘云节点中的边缘管控设备103接收该请求,根据该请求中携带的目标镜像的信息,判断第四边缘云节点中是否存在目标镜像,在第四边缘云节点中存在目标镜像的情况下,通过其与第三边缘云节点中边缘管控设备103之间的通信通道,将目标镜像返回给第三边缘云节点中的边缘管控设备103,或者,将目标镜像在第四边缘云节点中的存储地址返回给第三边缘云节点中的边缘管控设备103。第三边缘云节点中的边缘管控设备103接收第四边缘云节点中的边缘管控设备103返回的目标镜像,或者接收第四边缘云节点中的边缘管控设备103返回的目标镜像在第四边缘云节点中的存储地址,根据该存储地址读取或下载目标镜像。
值得说明的是,第三边缘云节点中的边缘管控设备103与第四边缘云节点中的边缘管控设备103可以自行建立通信通道,也可以在中心管控设备101的控制下建立通道。可选地,中心管控设备还可以控制不同边缘管控设备之间建立通信通道,并负责维护边缘管控设备之间已有通信通道的信息,例如可以维护哪些边缘管控设备之间已经建立通信通道,通信通道何时建立,通信通道的状态,保持时长等信息。基于此,中心管控设备在确定目标镜像已经被提供给第四边缘云节点之后,且在将第四边缘云节点和目标镜像的信息提供给第三边缘云节点中的边缘管控设备之前,还可以根据所维护的边缘管控设备之间已有通信通道的信息,判断第三边缘云节点中的边缘管控设备与第四边缘云节点中的边缘管控设备之间是否已经存在通信通道;若判断结果为否,即第三边缘云节点中的边缘管控设备与第四边缘云节点中的边缘管控设备之间尚不存在通信通道,则可以控制第三边缘云节点中的边缘管控设备和第四边缘云节点中的边缘管控设备建立通信通道,以便于第三边缘云节点中的边缘管控设备能够通过该通信通道从第四边缘云节点处获取目标镜像。并且,在第三边缘云节点中的边缘管控设备与第四边缘云节点中的边缘管控设备建立通信通道之后,中心管控设备将第四边缘云节点和目标镜像的信息提供给第三边缘云节点中的边缘管控设备。当然,若判断结果为是,即第三边缘云节点中的边缘管控设备与第四边缘云节点中的边缘管控设备之间已经存在通信通道,则可以直接将第四边缘云节点和目标镜像的信息提供给第三边缘云节点中的边缘管控设备。
值得说明的是,中心管控设备也可以在将第四边缘云节点和目标镜像的信息提供给第三边缘云节点中的边缘管控设备之后,根据所维护的边缘管控设备之间已有通信通道的信息,判断第三边缘云节点中的边缘管控设备与第四边缘云节点中的边缘管控设备之间是否已经存在通信通道;若判断结果为否,即第三边缘云节点中的边缘管控设备与第四边缘云节点中的边缘管控设备之间尚不存在通信通道,则可以控制第三边缘云节点中的边缘管控设备和第四边缘云节点中的边缘管控设备建立通信通道,以便于第三边缘云节点中的边缘管控设备能够通过该通信通道从第四边缘云节点处获取目标镜像。
在一些可选实施例中,为了保证第三边缘云节点获取目标镜像的效率,中心管控设备在将第四边缘云节点处的目标镜像提供给第三边缘云节点之前,还可以根据第四边缘云节点的属性,判断第四边缘云节点是否适合为第三边缘云节点提供目标镜像;若判断结果为是,即第四边缘云节点适合为第三边缘云节点提供目标镜像,则可以将第四边缘云节点处的目标镜像提供给第三边缘云节点;若判断结果为否,则可以从镜像库中获取目标镜像并将目标镜像提供给第三边缘云节点。
值得说明的是,根据应用场景和应用需求的不同,可以结合第四边缘云节点的不同属性,从不同角度判断第四边缘云节点是否适合为第三边缘云节点提供目标镜像。下面举例说明:
例如,可以结合第四边缘云节点所属的运营商,判断第四边缘云节点所属的运营商与第一边缘云节点所属的运营商是否相同;若判断结果为是,说明第四边缘云节点与第一边缘云节点是同运营商下的边缘云节点,两者可以进行数据传输,且数据传输速率相对于跨运营商的数据传输速率要快,适合为第一边缘云节点提供目标镜像。
又例如,可以结合第四边缘云节点的位置属性,判断第四边缘云节点到第三边缘云节点之间的距离是否小于设定的距离阈值;若判断结果为是,说明第四边缘云节点与第三边缘云节点相距较近,适合为第三边缘云节点提供目标镜像,这样由与第三边缘云节点相距较近的第四边缘云节点为第三边缘云节点提供镜像,便于第三边缘云节点快速获取到镜像,提高效率。第四边缘云节点到第三边缘云节点之间的距离可以是两个边缘云节点之间的平均距离,也可以是两个边缘云节点的中心之间的距离,还可以是两个边缘云节点相距最近的外边缘之间的距离等,可根据需求灵活定义。
又例如,可以结合第四边缘云节点的带宽属性,判断第四边缘云节点的可用带宽是否大于设定带宽阈值;若判断结果为是,说明第四边缘云节点的带宽资源比较充裕,适合为第三边缘云节点提供目标镜像,这样由带宽资源比较充裕的第四边缘云节点为第三边缘云节点提供镜像,可保证镜像的传输速率,便于第三边缘云节点快速获取到镜像,提高效率。
又例如,可以结合第四边缘云节点的负载属性,判断第四边缘云节点的负载量是否小于设定负载量阈值;若判断结果为是,说明第四边缘云节点的负载较轻,适合为第三边缘云节点提供目标镜像,这样由负载较轻的第四边缘云节点为第三边缘云节点提供镜像,一方面可实现负载均衡,另一方面也便于第三边缘云节点快速获取到镜像,提高效率。
值得说明的是,上面列举的几种方式可以择一使用,也可以以任意组合方式组合使用,关于组合使用的情况,对此不做过多描述。
进一步,在第四边缘云节点为多个的情况下,可以结合第四边缘云节点的多个属性,对上述几种方式进行组合使用,进而从中选择出适合为第一边缘云节点提供目标镜像的第四边缘云节点。例如,若第四边缘云节点为多个,则可以结合多个第四边缘云节点所属的运营商,从多个第四边缘云节点中选择出与第一边缘云节点属于同一运营商的第四边缘云节点;进而,若选择出的第四边缘云节点仍为多个,则可以进一步根据选择出的第四边缘云节点的负载量,从中选择负载量最小或低于设定负载量阈值的第四边缘云节点,为第一边缘云节点提供目标镜像。
在一些可选实施例中,有可能已经向第三边缘云节点提供过目标镜像,例如,在业务扩容场景中,在目前正在为服务需求方提供云计算服务的边缘云节点中创建新实例需要使用的镜像与之前已有实例使用的镜像相同,如果该边缘云节点中还保存有之前已有实例使用的镜像,则可以不用重复为该边缘云节点提供镜像。针对这种情况,为了节约资源,中心管控设备在将第四边缘云节点处的目标镜像提供给第三边缘云节点之前,可以判断所维护的已下发镜像与已下发镜像所在边缘云节点的对应关系中是否包括第三边缘云节点;若判断结果为是,表明已经向第三边缘云节点提供过目标镜像,且第三边缘云节点中仍保存有目标镜像,则可以将目标镜像的信息提供给第三边缘云节点,供第三边缘云节点读取其中存储的目标镜像,无需再次传输目标镜像,这可节约传输目标镜像消耗的网络资源等;若判断结果为否,表明尚未向第三边缘云节点提供过目标镜像,或者第三边缘云节点中已经不存在目标镜像,则可以将第四边缘云节点处的目标镜像提供给第三边缘云节点。其中,在第三边缘云节点中部署有边缘管控设备的情况下,若中心管控设备判断出所维护的已下发镜像与已下发镜像所在边缘云节点的对应关系中包含目标镜像,可以将目标镜像的信息提供给第三边缘云节点中的边缘管控设备,第三边缘云节点中的边缘管控设备根据目标镜像的信息可以从第三边缘云节点中存储镜像的空间中获取目标镜像,将目标镜像提供给第三边缘云节点中的相应资源设备,以供相应资源设备根据目标镜像创建可提供云计算服务的实例。
进一步可选地,同一边缘云节点有可能为同一用户或不同用户提供多种云计算服务,也就可能接收到多个镜像,这些镜像会被存储在边缘云节点中。边缘云节点可以提供一定存储空间,用来存储镜像。考虑到边缘云节点中镜像的存储空间有一定限制,为了能有足够的存储空间存储新接收的镜像,边缘云节点需要对本地存储的镜像进行淘汰处理。在本实施例中,中心管控设备负责为边缘云节点提供镜像的淘汰策略。中心管控设备可以生成镜像的淘汰策略,将该淘汰策略下发至各边缘云节点,各边缘云节点按照该淘汰策略对所存储的镜像进行淘汰处理。其中,在网络系统中包括边缘管控设备的情况下,中心管控设备可以将淘汰策略下发至边缘管控设备,由边缘管控设备根据淘汰策略对各边缘云节点中存储的镜像进行淘汰处理。进一步,在每个边缘云节点中均部署有边缘管控设备的情况下,中心管控设备可以将淘汰策略下发给各边缘云节点中的边缘管控设备,由各边缘云节点中的边缘管控设备根据淘汰策略对其所属边缘云节点中存储的镜像进行淘汰处理。
可选地,淘汰策略可以是接收时间最早淘汰策略,即按照镜像的接收时间,优先淘汰接收时间最早的镜像。或者,淘汰策略可以是使用频次最少淘汰策略,即按照镜像的使用频率,优先淘汰使用频次最少的镜像。或者,淘汰策略可以是占用资源最大淘汰策略,即按照镜像占用的存储空间的大小,优先淘汰占用存储空间最大的镜像。
对边缘云节点来说,可以定期按照上述淘汰策略,对本节点中存储的镜像进行淘汰处理;或者,也可以在每当需要接收或获取新的镜像时,判断本节点中是否有足够存储空间存储新的镜像,并在本节点中没有足够存储空间时,按照上述淘汰策略,对本节点中存储的镜像进行淘汰处理,以便于存储新的镜像。以第三边缘云节点需要从第四边缘云节点获取目标镜像为例,在第三边缘云节点中的边缘管控设备从第四边缘云节点处获取目标镜像之前,第三边缘云节点中的边缘管控设备可以判断第三边缘云节点中是否有足够存储空间存储目标镜像;若第三边缘云节点中没有足够存储空间,则根据淘汰策略,对第三边缘云节点中存储的镜像进行淘汰处理,以便有足够存储空间存储目标镜像。可选地,若第三边缘云节点中有足够存储空间,则可以暂时不对第三边缘云节点中存储的镜像进行淘汰处理。
可选地,如图1c所示,该网络系统100还包括:镜像构建设备104。该镜像构建设备104可部署在一个或多个边缘云节点中,主要负责应用镜像的构建、验证等。镜像构建设备104可以提供边缘云环境,可以构建与边缘云环境适配的镜像,也可以验证镜像是否与边缘云环境适配,对于与边缘云环境不适配的镜像可以重构,或输出不适配的提示信息等。基于镜像构建设备104,用户可以向网络系统100中新增镜像。
在一种新增镜像的可选实施方式中,用户(例如服务需求方)可以向中心管控设备提交新增镜像的第三请求,该第三请求中包括镜像构建信息;中心管控设备向镜像构建设备发送构建请求,该构建请求包括镜像构建信息;镜像构建设备接收到构建请求之后,从中获取镜像构建信息,根据镜像构建信息构建与边缘云环境适配的镜像,将所构建的镜像返回给中心管控设备;中心管控设备接收镜像构建设备返回的新构建的镜像,并添加到镜像库中,不断丰富镜像库。
在另一种新增镜像的可选实施方式中,可以面向用户(例如服务需求方)提供一种镜像的规则和规范,让用户自己制作或生成镜像,用户生成或制作的镜像需要符合边缘云环境的安全、规范等相关要求。用户在制作或生成镜像之后,可以向中心管控设备发送新增镜像的第四请求,该第四请求中包括待新增镜像,该新增镜像是指用户制作或生成的镜像,本实施例并不限定用户制作或生成镜像的方式。中心管控设备接收第四请求,从第四请求中获取待新增镜像,将待新增镜像发送给镜像构建设备;镜像构建设备将待新增镜像与边缘云环境进行适配;若待新增镜像与边缘云环境适配,镜像构建设备向中心管控设备返回待新增镜像与边缘云环境适配的消息;若待新增镜像与边缘云环境不适配,镜像构建设备向中心管控设备返回待新增镜像与边缘云环境不适配的消息。
对中心管控设备来说,若接收到镜像构建设备返回的待新增镜像与边缘云环境适配的消息,则将待新增镜像添加至镜像库中;若接收到镜像构建服务镜像构建设备返回的待新增镜像与边缘云环境不适配的消息,或者通知用户对待新增镜像进行重构后重新提交,或者通知用户提供待新增镜像的重构方法,以供镜像构建服务镜像构建设备按照该重构方法将待新增镜像重构成与边缘云环境适配的镜像。若用户提供待新增镜像的重构方法,则中心管控设备可以将该重构方法提供给镜像构建设备,镜像构建设备按照该重构方法对待新增镜像进行重构,使之与边缘云环境相适配,并将重构后的镜像返回给中心管控设备;中心管控设备接收重构后的镜像并添加到镜像库中。
在此说明,镜像构建设备104可以是一台具有镜像构建、验证等功能的逻辑设备(例如可以是一个可提供镜像构建环境和资源,具备应用部署、镜像验证等功能的实例),这些功能可以部署一台物理机或虚拟机上实现,也可以分散性地部署在多台物理机或虚拟机上。当然,本实施例的镜像构建设备104也可以是一台或多台具有镜像构建、验证等功能的物理设备。本申请实施例并不限定镜像构建设备的实现结构,凡是具有上述功能的设备结构均适用于本申请实施例。
在本申请实施例中,不仅可以向镜像库中新增镜像,也可以删除没有用或长时间不用的镜像,以节约存储空间。例如,中心管控设备可以定期或实时地统计镜像库中各镜像的使用频次,将使用频次小于频次阈值的镜像作为待删除镜像,并执行镜像删除流程将其删除。又例如,中心管控设备也可以接收用户(例如服务需求方)提交的镜像删除请求,将该镜像删除请求指示删除的镜像作为待删除镜像,并执行镜像删除流程将其删除。其中,镜像删除请求中可以携带需要删除的镜像的信息,例如ID、名称或编号等。
对中心管控设备来说,可以采用但不限于上述任一方式确定待删除镜像,在确定待删除镜像之后,一方面可以将待删除镜像从镜像库中删除,另一方面可以指示存储有待删除镜像的边缘云节点将待删除镜像删除。其中,中心管控设备可以根据待删除镜像,在所维护的已下发镜像与已下发镜像所在边缘云节点的对应关系中进行匹配,根据匹配结果确定存储有待删除镜像的边缘云节点。若在该对应关系中匹配到与待删除镜像对应的第五边缘云节点,说明曾经向第五边缘云节点下发过待删除镜像,且第五边缘云节点中仍存储有待删除镜像,于是向第五边缘云节点发送删除指令,该删除指令中携带有待删除镜像的信息,以指示第五边缘云节点将其中存储的待删除镜像删除。第五边缘云节点可能是一个,也可能是多个。
在此说明,在网络系统100包括边缘管控设备103的情况下,中心管控设备具体可以将删除指令发送给边缘管控设备103;边缘管控设备103接收中心管控设备下发的删除指令,从该删除指令中获取待删除镜像的信息,根据待删除镜像的信息,判断第五边缘云节点中是否存储有待删除镜像;如果存储有待删除镜像,将第五边缘云节点中的待删除镜像删除。进一步,若第五边缘云节点中部署有边缘管控设备103,则中心管控设备101具体可以将删除指令发送给第五边缘云节点中的边缘管控设备103;第五边缘云节点中的边缘管控设备103接收中心管控设备下发的删除指令,从该删除指令中获取待删除镜像的信息,根据待删除镜像的信息,判断第五边缘云节点中是否存储有待删除镜像;如果存储有待删除镜像,将第五边缘云节点中的存储的待删除镜像删除。
当中心管控设备将待删除镜像从镜像库中删除,且存储有待删除镜像的边缘云节点也将其中存储的待删除镜像删除后,镜像删除流程完成。
对边缘云节点中的资源设备来说,无论是何种方式,在获取镜像后,在中心管控设备101或边缘管控设备103的控制下可通过硬件或软件支持的能力以虚拟化的形式为实例提供计算、网络和存储等资源,对应的镜像会以系统盘的形式挂载到对应的实例。在实例创建完成后,对实例尝试启动,在成功启动对应的实例后,就可以利用这些资源设备的能力提供云计算服务。其中,资源设备在边缘管控设备的控制下为实例提供计算、网络和存储等资源包括:边缘管控设备根据中心管控设备提供的资源模板从目标边缘节云点内分配或预留的资源中申请相关的计算资源、存储资源和/或网络资源;通过调用目标边缘云节点内的计算、存储、网络等执行器进行相关资源的创建动作。其中,资源的创建动作包括:处理存储相关的资源,根据镜像的配置信息及镜像内容创建实例的系统盘,根据资源模板创建对应的数据盘;创建实例依赖的网络资源,例如IP地址、虚拟交换机等;以及结合资源模板创建计算资源。
运维管理功能:
在本申请实施例中,中心管控设备可以在边缘管控设备的协助下,对至少一个边缘云节点进行运维管控。详细地,边缘管控设备可以对至少一个边缘云节点进行运维监控并将运维监控数据上报给中心管控设备,供中心管控设备根据运维监控数据对至少一个边缘云节点进行管控。中心管控设备可以根据边缘管控设备上报的运维监控数据对至少一个边缘云节点进行运维管控。可选地,对边缘管控设备来说,可在中心管控设备的控制下,对至少一个边缘云节点进行运维监控并将运维监控数据上报给中心管控设备,以供中心管控设备根据运维监控数据对至少一个边缘云节点进行运维管控。或者,边缘管控设备可以根据定时任务,周期性地对至少一个边缘云节点进行运维监控并将运维监控数据上报给中心管控设备。无论是在哪种实施方式中,边缘管控设备主要发挥监控、数据采集、上报等功能,而运维决策由中心管控设备决定。
其中,中心管控设备控制边缘管控设备对至少一个边缘云节点进行运维监控,可以采用但不限于以下可选实施方式:
在一可选实施方式中,中心管控设备可以向边缘管控设备发送第一类运维监控指令,以指示边缘管控设备从至少一个运维维度对至少一个边缘云节点进行运维监控并将至少一个运维维度上的运维监控数据上报给中心管控设备。第一类运维监控指令是一种指示边缘管控设备从至少一个运维维度对至少一个边缘云节点进行运维监控并上报至少一个运维维度上的运维监控数据的监控指令。对边缘管控设备来说,可以接收中心管控设备发送的第一类运维监控指令,根据第一类运维监控指令,从至少一个运维维度上对至少一个边缘云节点进行运维监控,并将至少一个运维维度上的运维监控数据上报给中心管控设备。中心管控设备根据边缘管控设备上报的至少一个运维维度上的运维监控数据对至少一个边缘云节点进行运维管控。值得说明的是,至少一个运维维度可根据应用需求灵活设定,并预置到边缘管控设备和中心管控设备中。关于运维维度的举例参见后续实施例。
在另一可选实施方式中,中心管控设备可以有选择地在某个或某些运维维度上对至少一个边缘云节点进行运维管控。基于此,中心管控设备可以向边缘管控设备发送第二类运维监控指令,第二类运维监控指令与指定运维维度对应,用于指示边缘管控设备在指定运维维度上对至少一个边缘云节点进行运维监控并上报指定运维维度上的运维监控数据。对边缘管控设备来说,可接收中心管控设备发送的第二类运维监控指令,根据第二类运维监控指令在指定运维维度上对至少一个边缘云节点进行运维监控,并将指定运维维度上的运维监控数据上报给中心管控设备,以供中心管控设备根据指定运维维度上的运维监控数据对至少一个边缘云节点进行运维管控。中心管控设备还用于接收边缘管控设备发送的指定运维维度上的运维监控数据,根据指定运维维度上的运维监控数据对至少一个边缘云节点进行运维管控。
可选地,边缘管控设备根据定时任务,周期性地对至少一个边缘云节点进行运维监控可以是根据定时任务,周期性地从至少一个运维维度对至少一个边缘云节点进行运维监控;进一步,可以将至少一个运维维度上的运维监控数据上报给中心管控设备。其中,不同运维维度上的监控周期可以相同,也可以不相同。例如,边缘管控设备可以每隔10分钟对边缘云节点进行一次安全漏洞扫描,或者每隔5分钟对边缘云节点进行流量监控。
值得说明的是,指定运维维度可以是一个,也可以是多个。在指定运维维度是多个的情况下,每个指定运维维度可以对应一个第二类运维监控指令,即中心管控设备可以向边缘管控设备发送多个第二类运维监控指令,每个第二类运维监控指令对应一个指定运维维度。或者,在指定运维为度为多个的情况,多个指定运维维度也可以对应同一个第二类运维监控指令,即中心管控设备可以向边缘管控设备发送一个第二类运维监控指令,该第二类运维监控指令对应多个指定运维维度。
上述至少一个运维维度或指定运维维度可以包括但不限于以下维度:处于运行态的对象维度,日志维度,安全维度,资源维度等。进一步,处于运行态的对象维度可包括对象的运行状态维度和/或对象的生命周期维度;安全维度可包括:流量攻击维度和/或安全漏洞维度。
结合上述列举的几个运维维度,中心管控设备在边缘管控设备协助下,对至少一个边缘云节点进行运维管控包括但不限于以下至少一种运维管控示例:
运维管控示例1:中心管控设备控制边缘管控设备对至少一个边缘云节点中处于运行态的对象进行状态监控。其中,控制方式包括向边缘管控设备发送第一类运维监控指令或发送与对象的运行状态维度对应的第二类运维监控指令。边缘管控设备在中心管控设备的控制下,或者,根据定时任务周期性地,对至少一个边缘云节点中处于运行态的对象进行状态监控,将监控到的处于运行态的对象的运行状态上报给中心管控设备。中心管控设备从边缘管控设备上报的处于运行态的对象的运行状态中识别出运行状态异常的对象,为便于描述和区分,将运行状态异常的对象称为目标对象,并针对目标对象进行异常处理。其中,边缘云节点中处于运行态的对象包括但不限于:实例、镜像、容器、其它虚拟组件、物理机、CPU和/或硬盘等。根据处于运行态的对象的不同,运行状态异常情况也会有所不同。例如,对实例来说,可能的异常情况包括但不限于:中断、报错和/或故障等。又例如,对物理机来说,可能的异常情况包括但不限于:死机、黑屏、报警和/或物理机上运行的应用程序出现闪退等。根据目标对象以及运行状态异常情况的不同,异常处理方式也会有所不同,例如可以包括但不限于:报警,停止或重启目标对象,迁移,删除并重建目标对象等。
运维管控示例2:中心管控设备控制边缘管控设备对至少一个边缘云节点中处于运行态的对象的生命周期进行监控。其中,控制方式包括向边缘管控设备发送第一类运维监控指令或发送与对象的生命周期维度对应的第二类运维监控指令。边缘管控设备在中心管控设备的控制下,或者,根据定时任务周期性地,监控至少一个边缘云节点中处于运行态的对象的生命周期,并将监控到的处于运行态的对象的生命周期上报给中心管控设备。中心管控设备根据边缘管控设备上报的处于运行态的对象的生命周期,控制处于运行态的对象停止、停止后重启,迁移或删除。
运维管控示例3:中心管控设备控制边缘管控设备采集至少一个边缘云节点中的日志数据。其中,控制方式包括向边缘管控设备发送第一类运维监控指令或发送与日志维度对应的第二类运维监控指令。边缘管控设备在中心管控设备的控制下,或者,根据定时任务周期性地,采集至少一个边缘云节点中的日志数据,并将采集到的日志数据上报给中心管控设备。中心管控设备接收边缘管控设备上报的日志数据,对日志数据进行数据分析,并根据数据分析结果执行后续动作,例如可以计费、风控和/或增减实例等。根据日志数据的不同,后续动作也会有所不同。可选地,日志数据可以包括但不限于:边缘云节点中各项性能、指标等数据,例如:实例的带宽流量、实例当前的运行情况、实例的IO负载、物理机的带宽流量、物理机当前的运行情况、物理机的IO负载、边缘管控设备的运行情况和/或其它虚拟化组件的运行情况等。
可选地,中心管控设备不仅可以收集边缘管控设备上报的各边缘云节点的日志数据,还具备数据巡检的能力,对于一些数据,若中心管控设备存储的与边缘云节点中的数据不一致,可以主动向该边缘云节点同步最新的数据,例如可以向边缘云节点同步最新版本的镜像等。
运维管控示例4:中心管控设备控制边缘管控设备对至少一个边缘云节点进行流量监控。其中,控制方式包括向边缘管控设备发送第一类运维监控指令或发送与流量攻击维度对应的第二类运维监控指令。边缘管控设备在中心管控设备的控制下,或者,根据定时任务周期性地,对至少一个边缘云节点进行流量监控,并将监控到的流量攻击事件上报给中心管控设备。中心管控设备对边缘云节点中出现的流量攻击事件进行阻断处理。可选地,边缘管控设备还可以将监控到的流量数据上报给中心管控设备,中心管控设备还可以根据流量数据对至少一个边缘云节点进行流量攻击防御等。
运维管控示例5:中心管控设备控制边缘管控设备对至少一个边缘云节点进行网络安全漏洞扫描。其中,控制方式包括向边缘管控设备发送第一类运维监控指令或发送与网络安全维度对应的第二类运维监控指令。边缘管控设备在中心管控设备的控制下,或者,根据定时任务周期性地,对至少一个边缘云节点进行网络安全漏洞扫描,并将扫描到的网络安全漏洞问题上报给中心管控设备。中心管控设备接收边缘管控设备上报的网络安全漏洞问题,对该网络安全漏洞问题进行修复。
运维管控示例6:中心管控设备控制边缘管控设备监控至少一个边缘云节点中的资源用量。其中,控制方式包括向边缘管控设备发送第一类运维监控指令或发送与资源维度对应的第二类运维监控指令。边缘管控设备在中心管控设备的控制下,或者,根据定时任务周期性地,监控至少一个边缘云节点中的资源用量,并将监控到的资源用量信息上报给中心管控设备。中心管控设备根据边缘管控设备上报的资源用量信息,对至少一个边缘云节点进行资源扩容或减容。这里的资源包括各种资源信息,例如物理机等设备资源,存储资源,CPU、GPU等计算资源,带宽等网络资源等等。
进一步,若每个边缘云节点中均部署有边缘管控设备,则每个边缘管控设备可以在中心管控设备的控制下,对其所属边缘云节点进行运维监控并将其所属边缘云节点中的运维监控数据上报给中心管控设备。中心管控设备可以接收每个边缘云节点中的边缘管控设备上报的运维监控数据,根据每个边缘云节点中的运维监控数据对每个边缘云节点进行运维管控。
本申请实施例并不限定中心管控设备与边缘管控设备的实现结构。可选地,一种中心管控设备的结构框架如图1b所示,包括:资源调度管控模块、镜像管控模块以及中心运维模块;该中心运维模块进一步包括:中心监控单元、中心日志单元以及中心安全单元等。相应地,一种边缘管控设备的结构框架如图1b所示,包括:资源调度服务模块、镜像服务模块以及边缘运维模块;该边缘运维模块进一步包括:边缘监控单元、边缘日志单元以及边缘安全单元等。
其中,中心管控设备中的资源调度管控模块与边缘管控设备中的资源调度服务模块相互配合,可对边缘云节点进行资源调度,资源调度功能可参见下文中的描述。中心管控设备中的镜像管控模块与边缘管控设备中的镜像服务模块相互配合,可针对边缘云节点进行镜像的管理与分发等,镜像管理与分发功能可参见下文中的描述。
中心管控设备中的中心运维模块与边缘管控设备中的边缘运维模块相互配合,可对边缘云节点进行运维管控。上述运维管控示例1-6可由图1b所示中心运维模块和边缘运维模块中的相应单元配合实施。运维管控示例3可由中心运维模块中的中心日志单元和边缘运维模块中的边缘日志单元配合实现。详细地,中心日志单元向边缘日志单元发送第一类运维监控指令或发送与日志维度对应的第二类运维监控指令;边缘日志单元根据第一类或第二类运维监控指令采集边缘云节点中的日志数据并上报给中心日志单元;中心日志单元对日志数据进行数据分析,并根据数据分析结果执行后续动作。运维管控示例4和5,可由中心运维模块中的中心安全单元和边缘运维模块中的边缘安全单元配合实现。详细地,中心安全单元向边缘安全单元发送第一类运维监控指令或发送与流量攻击或网络安全维度对应的第二类运维指令;边缘安全单元可以根据第一类或第二类运维指令对边缘云节点进行流量监控或网络安全漏洞扫描,并将监控到的流量攻击事件或网络漏洞安全问题上报给中心安全单元;中心安全单元对流量攻击事件进行阻断或对网络安全漏洞问题进行修复。运维管控示例1、2和6,可由中心运维模块中的中心监控单元和边缘运维模块中的边缘监控单元配合实现,详细实施过程不做赘述。
由上述可知,在边缘管控设备的协助下,中心管控设备可以了解边缘云节点中各实例的健康、资源用量、日志数据和/或基础设施的情况,可实现远程运维、日志管理等。
在本申请实施例中,除了中心管控设备可以对至少一个边缘云节点进行运维管控之外,在中心管控设备不对边缘云节点进行运维管控或者无法对边缘云节点进行运维管控的情况下,边缘管控设备可以自主地对至少一个边缘云节点进行运维管控。
例如,边缘管控设备可以监控其与中心管控设备之间的连接情况,在与中心管控设备失去连接的情况下,可以确定中心管控设备无法对边缘云节点进行运维管控,则可以自主地从至少一个运维维度对至少一个边缘云节点进行运维管控。
又例如,在中心管控设备通过向边缘管控设备发送第一类运维监控指令,以控制边缘管控设备对至少一个边缘云节点进行运维监控的方式下,边缘管控设备可以等待接收中心管控设备发送的第一类运维监控指令,若未接收到中心管控设备发送的第一类运维监控指令,可以确定中心管控设备不对或无法对至少一个边缘云节点进行运维管控,则可以自主地从至少一个运维维度对至少一个边缘云节点进行运维管控。可选地,边缘管控设备和中心管控设备可以预先约定第一类运维监控指令的等待时长,若超过了所述等待时长仍未接收到中心管控设备发送的第一类运维监控指令,则确定未接收到中心管控设备发送的第一类运维监控指令。
又例如,在中心管控设备通过向边缘管控设备发送与指定运维维度对应的第二类运维监控指令,以控制边缘管控设备从指定运维维度对至少一个边缘云节点进行运维监控的方式下,边缘管控设备可以等待接收中心管控设备发送的第二类运维监控指令,若在指定运维维度上未接收到中心管控设备发送的第二类运维监控指令,可以确定中心管控设备在指定运维维度上不对或无法对至少一个边缘云节点进行运维管控,则可以自主地从指定运维维度对至少一个边缘云节点进行运维管控。
进一步可选地,若边缘管控设备在与中心管控设备失去连接的情况下,自主地从至少一个运维维度对至少一个边缘云节点进行运维管控,则在与中心管控设备恢复连接后,还可以将失去连接期间的运维管控数据同步给中心管控设备。值得说明的是,运维管控数据主要包括运维管控的策略、方式、效果等数据,当然,也可以包括运维监控数据。
上述至少一个运维维度或指定运维维度可以包括但不限于以下几个维度:处于运行态的对象维度,日志维度,安全维度,资源维度等。进一步,处于运行态的对象维度可包括对象的运行状态维度和/或对象的生命周期维度;安全维度可包括:流量攻击维度和/或安全漏洞维度。
结合上述列举的几个运维维度,边缘管控设备自主地对至少一个边缘云节点进行运维管控包括但不限于以下至少一种运维管控示例:
运维管控示例a:自主地对至少一个边缘云节点中处于运行态的对象进行状态监控,并针对监控到的运行状态异常的目标对象进行异常处理。关于处于运行态的对象以及运行状态异常情况等,可参见上文中的描述,在此不再赘述。
可选地,在示例a中,边缘管控设备在针对目标对象进行异常处理时,具体用于:对目标对象的异常运行状态进行分析,根据分析结果确定至少一种候选处理方式;从至少一种候选处理方式中获取目标处理方式,根据目标处理方式对目标对象进行异常处理。
更进一步,边缘管控设备在获取目标处理方式时,具体用于:在边缘管控设备与中心管控设备保持连接的情况下,将至少一种候选处理方式上报给中心管控设备,以供中心管控设备从中选择处理方式;接收中心管控设备返回的处理方式作为目标处理方式;或者,在边缘管控设备与中心管控设备失去连接的情况下,输出至少一种候选处理方式至边缘运维管控人员,以供边缘运维人员从中选择处理方式;响应于边缘运维管控人员的选择操作,确定被选择的处理方式作为目标处理方式;或者,在与中心管控设备失去连接的情况下,按照设定的选择策略,从至少一种候选处理方式中选择目标处理方式。
运维管控示例b、自主地监控至少一个边缘云节点中处于运行态的对象的生命周期,并根据监控结果控制处于运行态的对象停止、停止后重启或删除。对于容器或实例,可以控制容器或实例停止执行、停止后重启,或者将容器或实例删除等。
运维管控示例c:自主地采集至少一个边缘云节点中的日志数据,对日志数据进行数据分析,并根据数据分析结果执行后续动作。日志数据包括但不限于边缘云节点中实例的带宽流量、实例当前的运行情况、实例的IO负载、物理机的带宽流量、物理机当前的运行情况、物理机的IO负载、边缘管控设备的运行情况和/或其它虚拟化组件的运行情况等。可选地,根据日志数据的分析结果可以进行计费、风控、资源重分配等后续动作,但不限于此。
运维管控示例d、自主地对至少一个边缘云节点进行流量监控,并针对监控到的流量攻击事件进行阻断处理。
运维管控示例e:自主地对至少一个边缘云节点进行网络安全漏洞扫描,并针对扫描到的网络安全漏洞问题进行修复。
运维管控示例f:自主地监控至少一个边缘云节点中的资源用量,并根据监控结果对至少一个边缘云节点进行资源扩容或减容。这里的资源包括但不限于:物理机等设备资源,内存、磁盘等存储资源,CPU、GPU等计算资源,带宽等网络资源。对这些资源来说,用量较高时,可以针对这些资源进行扩容,用量较低时,可以针对这些资源进行减容。
进一步,若每个边缘云节点中均部署有边缘管控设备,则每个边缘管控设备可以在中心管控设备不对或无法对其所属边缘云节点进行运维管控的情况下,自主地对其所属边缘云节点进行运维管控。
可选地,在上述边缘管控设备自主地对至少一个边缘云节点进行运维管控的示例a-示例e中,边缘管控设备可以根据定时任务,周期性地对至少一个边缘云节点进行运维管控。例如,在示例d中,边缘管控设备可以根据定时任务,每隔10分钟对至少一个边缘云节点进行流量监控,并针对监控到的流量攻击事件进行阻断处理。又例如,在示例e中,边缘管控设备可以根据定时任务,每隔5分钟对至少一个边缘云节点进行网络安全漏洞扫描,并针对扫描到的网络安全漏洞问题进行修复。当然,边缘管控设备也可以根据其它方式的自主策略,自主地对至少一个边缘云节点进行运维管控,例如可以在每天某个固定的时间点,自主地对至少一个边缘云节点进行运维管控。
结合上述示例1-6以及示例a-f可知,在本实施例中,中心管控设备与边缘管控设备相结合,中心管控设备可在边缘管控设备的协助下对至少一个边缘云节点进行运维管控,除此之外,边缘管控设备也具备一定的自行运维管控的能力,可以在中心管控设备不对或无法对边缘云节点进行运维管控的情况下,自主地对边缘云节点进行运维管控,实现两级运维管控,可以更加充分、全面地对边缘云节点进行运维管控,为“将云计算放到距离终端更近的边缘云节点中处理”提供了条件,进而可借助边缘云节点中的资源为用户提供云计算服务,有利于降低响应时延,减轻中心云或传统云计算平台的压力,降低带宽成本。
综上可知,在本申请实施例提供的网络系统中,基于集中管控的方式对边缘云节点的资源,镜像,实例,运维等进行统一管控,可以最大程度的对边缘云节点进行管理和协调,可降低出现单点自制或全网信息不同步而导致的错误,而且可以利用集中管控的特性达到资源调度的最优化,避免出现边缘局部资源浪费的情况。
除了上述网络系统之外,本申请实施例从中心管控设备的角度提供了实例管控方法,下面进行详细描述。
图2a为本申请示例性实施例提供的一种实例管控方法的流程示意图。如图2a所示,该方法包括:
21a、确定部署于网络系统中至少一个边缘云节点中的至少一个实例,其中,至少一个实例可为服务需求方提供云计算服务。
22a、对至少一个实例进行管控,以供至少一个实例为服务需求方提供云计算服务。
在本实施例中,网络系统包括至少一个边缘云节点,至少一个边缘云节点中部署有至少一个实例,至少一个实例可为服务需求方提供云计算服务。中心管控设备确定边缘云节点中的至少一个实例,对至少一个实例进行管控,以供至少一个实例为服务需求方提供云计算服务。这里的服务需求方可以任何需要使用边缘云节点中的实例提供的云计算服务的设备、应用、系统或另一服务。以系统为例,服务需求方可以是但不限于:在线视频系统、风险管控系统、客户信息管理系统或数据分发系统等。
可选地,中心管控设备可以对至少一个实例进行各种管控,例如可以包括升级、迁移、关停、重启和释放等中的至少一种,但不限于此。
如图2b所示,中心管控设备对实例进行升级管控的过程包括以下步骤:
21b、从至少一个实例中确定待升级实例;
22b、向服务需求方发送升级请求,以供服务需求方结合待升级实例上的业务情况为待升级实例确定升级策略;
23b、接收服务需求方返回的升级策略,依据升级策略对待升级实例进行升级。
在实际应用中,随着业务需求的变化或镜像版本的更新,有可能对镜像或相应实例进行升级。中心管控设备可以从至少一个实例中确定待升级实例,待升级实例可以是一个或多个;向服务需求方发送升级请求,以供服务需求方结合待升级实例上的业务情况为待升级实例确定升级策略。该升级请求携带有待升级实例的标识类信息,例如待升级实例的ID、名称等,也可以是待升级实例对应服务的ID、名称等,还可以是待升级实例对应镜像的ID、名称等信息。服务需求方在接收到升级请求后,可根据该升级请求确定待升级实例,结合待升级实例上的业务情况,例如待升级实例上的业务请求及响应状态等,判断待升级实例是否适合升级,什么时间适合升级,采用什么方法进行升级等,进而为该待升级实例生成升级策略并返回给中心管控设备。中心管控设备接收服务需求方发送的升级策略,依据升级策略对待升级实例进行升级。
在一可选实施例中,服务需求方可结合待升级实例上的业务情况,例如已接收到且尚未完成的业务请求(简称为存量业务请求)的数量,是否还有新增的业务请求(增量业务请求)等,判断什么时间可以对待升级实例进行升级,也就是说,升级策略中可以包括升级时间。基于此,中心管控设备可以在升级策略中指定的升级时间开始对待升级实例进行升级。除此之外,升级策略可以包括升级方法,基于此,中心管控设备可以采用升级策略中指定的升级方法对待升级实例进行升级。可选地,升级策略可以包括升级时间和升级方法,则中心管控设备可以采用升级策略中指定的升级方法,在升级策略中指定的升级时间开始对待升级实例进行升级。可选地,升级策略还可以包括是否升级等信息,并在升级的情况下,进一步包括升级时间和/或升级方法。
在一可选实施例中,对实例进行升级,可由中心管控设备发起。例如,中心管控设备可以监控各实例对应镜像的版本信息,当发现新版本的镜像时,可以确定需要对与该新版本的镜像对应的实例进行升级;或者,也可以监控各实例的运行状态、生命周期等信息,当发现实例运行过程中出现漏洞、不稳定、功能不全、CPU或内存资源消耗过大等问题时,可以确定需要对出现这些问题的实例进行升级。
在一可选实施例中,对实例进行升级,也可以由服务需求方发起。例如,根据业务需求,需要对实例进行升级时,服务需求方可以向中心管控设备发送升级描述信息,该升级描述信息包括实例过滤条件。在该情况下,步骤21b包括:接收服务需求方发送的升级描述信息;根据实例过滤条件,从至少一个实例中确定待升级实例。
其中,对待升级实例进行升级主要是指:关停待升级实例,根据相应版本(一般是指新版本)的镜像对待升级实例进行更新,更新完后再重启实例。其中,对待升级实例进行升级所需的镜像版本可以由中心管控设备确定,例如将相应镜像的最新版本作为升级所需的镜像版本,也可以由服务需求方指定。可选地,服务需求方可以将升级所需的镜像版本携带在升级描述信息中提供给中心管控设备,例如该升级描述信息可以包括“对所有或指定实例进行镜像版本A到镜像版本B的升级”等信息。基于此,依据升级策略对待升级实例进行升级,包括:依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。
更进一步,在网络系统包括边缘管控设备的情况下,依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级可以为:将升级策略和镜像版本对应的镜像发送给网络系统中的边缘管控设备,以供边缘管控设备依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。
如图2c所示,中心管控设备对实例进行迁移管控的过程包括以下步骤:
21c、从至少一个实例中确定待迁移实例,待迁移实例属于第一边缘云节点;
22c、判断第一边缘云节点满足节点内迁移条件;若判断结果为是,即第一边缘云节点满足节点内迁移条件,执行步骤23c;若判断结果为否,即第一边缘云节点不满足节点内迁移条件,执行步骤24c。
23c、对待迁移实例进行边缘云节点内的迁移。
24c、对待迁移实例进行跨边缘云节点的迁移。
在一些情况下需要对实例进行迁移。例如,在整个边缘云节点故障或不可用的情况下,需要将该边缘云节点中的实例迁移到其它边缘云节点中。又例如,在承载某个实例的物理机出现故障或宕机的情况下,需要将该物理机上的实例迁移到其它物理机上。又例如,可能因为业务需要,需要将某个或某些实例从一个边缘云节点迁移到其它边缘云节点中。又例如,在需要进行资源归并的情况下,也需要对某个或某些实例进行迁移。
在中心管控设备的管控下,可对边缘云节点中的实例进行迁移。中心管控设备从至少一个实例中确定待迁移实例。待迁移实例可以是一个或多个;若待迁移实例是多个,多个待迁移实例可部署于同一边缘云节点中,也可以部署于不同边缘云节点中。
可选地,中心管控设备可以监控至少一个边缘云节点中部署的至少一个实例的状态,根据至少一个实例的状态,获取出现故障的实例和/或运行中发生指定事件的实例作为待迁移实例。其中,出现故障的实例是指不能正常运行的实例,例如可以是发生宕机的物理机上的实例,也可以是本身宕机的实例等。指定事件主要是指一些出现后实例仍能正常运行的事件,可以根据应用需求灵活设定,对此不做限定。举例说明,指定事件可以是一些预警或告警事件等,虽然发生一些预警或告警事件,但实例并未产生实际问题,仍可运行(即未故障),但有故障隐患,可在故障前进行迁移。另外,中心管控设备维护有各边缘云节点的信息以及各边缘云节点中部署的各实例的信息,基于此,可以确定待迁移实例所属的边缘云节点,为便于描述和区分,将待迁移实例在迁移前所属的边缘云节点记为第一边缘云节点。
可选地,中心管控设备可以根据资源归并需求,从至少一个实例中确定待迁移实例,进而对待迁移实例进行迁移。其中,资源归并主要是通过实例迁移对资源碎片进行整合的过程,经过整合后,边缘云节点中的资源碎片会减少甚至不存在,这有利于提高边缘云节点中的资源利用率。值得说明的是,资源归并需求可以是系统级的,也可以节点级的。系统级的资源归并是指从整个网络系统的角度考虑,通过实例迁移对整个网络系统中的资源碎片进行整合;节点级的资源归并是指从边缘云节点的角度考虑,通过实例迁移对边缘云节点中的资源碎片进行整合。
可选地,资源归并需求可以是服务需求方提供的。例如,服务需求方需要部署一个新的实例时,若为其服务的边缘云节点中各资源设备上的可用资源均不足以承载该新实例,可以对该边缘云节点中的实例进行迁移实现资源整合,从而为新实例提供足够的资源。或者,资源归并需求也可以是中心管控设备的定期行为。例如,中心管控设备定期执行资源碎片检查,当发现碎片率达到一定的阈值并可以执行实例迁移时,对各边缘云节点中的资源碎片进行整合,提高边缘云节点中的资源利用率。
其中,资源归并需求中包含有与资源归并相关的信息。例如,资源归并需求中可以包含为了达到资源归并目的需要迁移的实例的信息,基于此,可根据资源归并需求,直接确定待迁移实例。又例如,资源归并需求中可以包含需要资源归并的边缘云节点的信息。基于此,可根据资源归并需求,确定需要进行资源归并的边缘云节点,本实施例中将需要资源归并的边缘云节点称为第一边缘云节点;进而可以结合第一边缘云节点中各资源设备上剩余的可用资源和第一边缘云节点中各实例需要的资源,确定待迁移实例。
无论是哪种应用场景,在确定待迁移实例后,中心管控设备可以判断待迁移实例所属的第一边缘云节点是否满足节点内迁移条件;若第一边缘云节点满足节点内迁移条件,则对待迁移实例进行边缘云节点内的迁移;若第一边缘云节点不满足节点内迁移条件,则对待迁移实例进行跨边缘云节点的迁移。
可选地,中心管控设备可以判断第一边缘云节点当前是否处于可用状态;若第一边缘云节点当前处于可用状态,判断第一边缘云节点的可用资源是否足够承载待迁移实例;若第一边缘云节点的可用资源足够承载待迁移实例,确定第一边缘云节点满足节点内迁移条件;若第一边缘云节点当前处于不可用状态,或者第一边缘云节点的可用资源不足以承载待迁移实例,确定第一边缘云节点不满足节点内迁移条件。在本申请实施例中,将实例的迁移划分为两种类型:节点内迁移和跨节点迁移。其中,第一边缘云节点的可用资源主要是指第一边缘云节点中各台资源设备上的可用资源;相应地,判断第一边缘云节点的可用资源是否足够承载待迁移实例主要是指判断第一边缘云节点中是否存在可用资源足以承载待迁移实例的资源设备。
值得说明的是,在资源归并场景中,为了实现资源归并的实例迁移主要是节点内迁移,当然,也可以是跨节点迁移。可选地,在根据第一边缘云节点中各资源设备上剩余的可用资源和第一边缘云节点中各实例需要的资源确定待迁移实例的过程中,还可以确定待迁移实例需要迁移到的资源设备,该资源设备是第一边缘云节点中剩余的可用资源可以承载待迁移实例的资源设备。当然,若第一边缘云节点中不存在剩余的可用资源可以承载待迁移实例的资源设备,可以针对待迁移实例进行跨节点迁移。鉴于资源归并的目的,在针对待迁移实例进行跨节点迁移的过程中,优先考虑将待迁移实例迁移到其它边缘云节点中已经被使用且剩余的可用资源可以承载待迁移实例的资源设备上;进一步,在有多个已经被使用且剩余的可用资源可以承载待迁移实例的资源设备的情况下,可以以资源碎片最小为原则,从中选择剩余的可用资源与待迁移实例需要的资源的匹配度较高的资源设备,尽量产生较少的资源碎片或不产生资源碎片。
对于节点内迁移:可选地,可以通过热迁移技术保证实例所提供云计算服务的连续性,关于热迁移技术可参见现有技术,在此不再赘述。
对于跨节点迁移:中心管控设备可以从至少一个边缘云节点选择第二边缘云节点,第二边缘云节点不同于第一边缘云节点,且第二边缘云节点中的可用资源足够承载待迁移实例,即有足够资源;将待迁移实例迁移到第二边缘云节点中,并将待迁移实例在第二边缘云节点中的属性信息发送给服务需求方,以供服务需求方基于该属性信息针对待迁移实例进行业务调度。其中,待迁移实例在第二边缘云节点中的属性信息是指在待迁移实例迁移到第二边缘云节点之后,外部(例如服务需求方或服务需求方授权的第三方)针对待迁移实例进行业务调度所需的信息,例如可以包括但不限于:第二边缘云节点所在的地区、运营商信息和/或公网IP等信息。
可选地,在选择第二边缘云节点时,可以采用但不限于以下方式:
方式1:可以根据其它边缘云节点与第一边缘云节点之间的距离,选择与第一边缘云节点的距离小于设定距离阈值的边缘云节点,或者选择与第一边缘云节点距离最近的边缘云节点,或者从与第一边缘云节点距离最近的N个边缘云节点中任意选择一个边缘云节点,作为第二边缘云节点。在方式1中,第二边缘云节点距离第一边缘云节点距离最近或较近,可节约数据传输时间,有利于提高迁移效率。
方式2:可以根据其它边缘云节点的带宽资源,从中选择带宽资源相对充足的边缘云节点,例如选择带宽资源最大的,或者选择带宽资源大于设定带宽阈值的,或者选择带宽使用率较低的边缘云节点,作为第二边缘云节点。在方式2中,第二边缘云节点的带宽资源充足,可提高数据传输速率,有利于提高迁移效率。
方式3:可以根据其它边缘云节点当前的负载情况,从中选择负载相对较轻的边缘云节点,例如选择负载量最小的,或者选择负载量小于设定负载量阈值的边缘云节点,作为第二边缘云节点。在方式3中,第二边缘云节点的负载较轻,可有足够资源且能够及时处理实例迁移,有利于提高迁移效率。
可选地,在将待迁移实例迁移到第二边缘云节点时,中心管控设备可根据待迁移实例的资源需求,在第二边缘云节点中为待迁移实例进行资源预留或分配;在资源预留或分配成功后,将待迁移实例迁移到第二边缘云节点中预留或分配的资源上。例如,可结合待迁移实例的资源需求,确定待迁移实例需要的资源类型、资源量和/或对资源设备的性能要求等信息,根据这些信息在第二边缘云节点中进行资源预留或分配,可为实例成功迁移提供资源保障。
可选地,若待迁移实例是出现故障的实例,即不可正常运行的实例,中心管控设备还可以将该迁移事件通知给服务需求方,服务需求方可以做出合适的响应动作,比如更新该实例在服务需求方中的信息,或针对实例迁移过程中的宕机情况做出容灾响应。进一步,可在通知迁移事件的过程中,一并将待迁移实例在第二边缘云节点中的属性信息提供给服务需求方。当然,也可以在将待迁移实例成功迁移至第二边缘云节点之后,将待迁移实例在第二边缘云节点中的属性信息提供给服务需求方。
可选地,若待迁移实例是运行过程中发生指定事件的实例,即虽发生指定事件但仍可正常运行的实例,中心管控设备还可以向服务需求方发送迁移请求,以供服务需求方结合待迁移实例上的业务情况为待迁移实例确定迁移策略;接收服务需求方发送的迁移策略,依据迁移策略将待迁移实例迁移到第二边缘云节点中。该迁移策略主要包括是否迁移、迁移时间以及迁移方式中的至少一个信息。
进一步可选地,中心管控设备可以将待迁移实例在第二边缘云节点中的属性信息连同上述迁移请求一并发送给服务需求方。或者,也可以在将待迁移实例成功迁移至第二边缘云节点之后,将待迁移实例在第二边缘云节点中的属性信息提供给服务需求方。
进一步可选地,若待迁移实例是发生指定事件但仍可正常运行的实例,在迁移过程中,待迁移实例继续运行在第一边缘云节点中,这样迁移过程中的业务请可继续调度到第一边缘云节点中的待迁移实例上,保证业务连续性。在将待迁移实例成功迁移到第二边缘云节点中,且服务需求方确保将新的业务请求全部调度到已迁移到第二边缘云节点中,且第一边缘云节点中的业务请求逐步减少最终没有新的业务请求,即运行于第一边缘云节点中的待迁移实例上不再有任何业务请求的情况下,中心管控设备可将第一边缘云节点中的待迁移实例释放掉。可选地,服务需求方在确定运行于第一边缘云节点中的待迁移实例上不再有任何业务请求,既没有存量业务请求也没有增量业务请求之后,可以向中心管控设备发送释放通知;中心管控设备接收服务需求方发送的释放通知,根据该释放通知将运行在第一边缘云节点中的待迁移实例释放掉。进一步,中心管控设备还可以将运行在第一边缘云节点中的待迁移实例的运行状态同步给第二边缘云节点中的待待迁移实例。
进一步,无论待迁移实例是哪种实例,将待迁移实例迁移到第二边缘云节点中,主要是控制第二边缘云节点中相应资源设备根据待迁移实例对应的镜像或快照在预留或分配的资源上创建待迁移实例的过程。
进一步,在网络系统中包括边缘管控设备的情况下,中心管控设备可以根据待迁移实例的资源需求,确定第二边缘云节点中被调度的资源信息,将该资源信息发送给边缘管控设备,由边缘管控设备根据该资源信息,控制第二边缘云节点中相应资源设备为待迁移实例进行资源预留或分配。然后,中心管控设备可以向边缘管控设备发送迁移指令,该迁移指令指示边缘管控设备获取待迁移实例对应的镜像或实例快照并提供给第二边缘云节点中相应资源设备,供第二边缘云节点中相应资源设备根据该镜像或实例快照在预留或分配的资源上创建待迁移实例。进一步,若第二边缘云节点中部署有边缘管控设备,则中心管控设备可以向第二边缘云节点中的边缘管控设备发送迁移指令,指示第二边缘云节点中的边缘管控设备获取待迁移实例对应的镜像或快照并提供给第二边缘云节点中相应资源设备,供第二边缘云节点中相应资源设备根据该镜像或快照在预留或分配的资源上创建待迁移实例。
在本申请方法实施例中,在中心管控设备的管控下,边缘云节点中的实例可以为服务需求方提供云计算服务,达到了借助边缘云节点中的资源为用户提供服务的目的,使得“将云计算放到距离终端更近的边缘云节点中处理”成为现实,有利于降低响应时延,减轻与边缘云节点对应的中心云或传统的云计算平台等的压力,降低带宽成本。
需要说明的是,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如21a、22a等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
图3为本申请示例性实施例提供的一种中心管控设备的结构示意图。如图3所示,该中心管控设备包括:存储器31和处理器32。
存储器31,用于存储计算机程序,并可被配置为存储其它各种数据以支持在中心管控设备上的操作。这些数据的示例包括用于在中心管控设备上操作的任何应用程序或方法的指令,消息,图片,视频等。
处理器32,与存储器31耦合,用于执行存储器31中的计算机程序,以用于:确定部署于网络系统中至少一个边缘云节点中的至少一个实例,至少一个实例可为服务需求方提供云计算服务;对至少一个实例进行管控,以供至少一个实例为服务需求方提供云计算服务。
可选地,对至少一个实例进行的管控包括:升级、迁移、关停、重启和释放中的至少一种。
在一可选实施例中,如图3所示,该中心管控设备还包括:通信组件33。基于此,处理器32在对至少一个实例进行升级时,具体用于:从至少一个实例中确定待升级实例;通过通信组件33向服务需求方发送升级请求,以供服务需求方结合待升级实例上的业务情况为待升级实例确定升级策略;通过通信组件33接收服务需求方返回的升级策略,依据升级策略对待升级实例进行升级。
进一步,处理器32在从至少一个实例中确定待升级实例时,具体用于:通过通信组件33接收服务需求方发送的升级描述信息,升级描述信息包括实例过滤条件;根据实例过滤条件,从至少一个实例中确定待升级实例。
进一步,升级描述信息还包括:升级所需的镜像版本。则,处理器32在依据升级策略对待升级实例进行升级时,具体用于:依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。
更进一步,处理器32在依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级时,具体用于:将升级策略和镜像版本对应的镜像发送给网络系统中的边缘管控设备,以供边缘管控设备依据升级策略,利用镜像版本对应的镜像对待升级实例进行升级。其中,升级策略包括但不限于:是否升级、升级时间和升级方法中的至少一个信息。
在一可选实施例中,处理器32在对至少一个实例进行迁移时,具体用于:从至少一个实例中确定待迁移实例,待迁移实例所属的边缘云节点记为第一边缘云节点;若第一边缘云节点满足节点内迁移条件,对待迁移实例进行边缘云节点内的迁移;若第一边缘云节点不满足节点内迁移条件,对待迁移实例进行跨边缘云节点的迁移。
可选地,处理器32在从至少一个实例中确定待迁移实例时,具体用于:根据至少一个实例的状态,将出现故障的实例和/或运行过程中发生指定事件的实例作为待迁移实例。
可选地,处理器32在从至少一个实例中确定待迁移实例时,具体用于:根据资源归并需求,从至少一个实例中确定待迁移实例。
进一步,处理器32在根据资源归并需求确定待迁移实例时,具体用于:根据资源归并需求,确定需要资源归并的第一边缘云节点;结合所述第一边缘云节点中各资源设备上剩余的可用资源和所述第一边缘云节点中各实例需要的资源,确定所述待迁移实例。
可选地,处理器32还用于:判断第一边缘云节点是否处于可用状态;若第一边缘云节点处于可用状态,判断第一边缘云节点的可用资源是否足够承载待迁移实例;若第一边缘云节点的可用资源足够承载待迁移实例,则确定第一边缘云节点满足节点内迁移条件;若第一边缘云节点处于不可用状态,或者第一边缘云节点的可用资源不足以承载待迁移实例,则确定第一边缘云节点不满足节点内迁移条件。
可选地,处理器32在对待迁移实例进行跨边缘云节点的迁移时,具体用于:从至少一个边缘云节点选择第二边缘云节点,第二边缘云节点不同于第一边缘云节点;将待迁移实例迁移到第二边缘云节点中,并将待迁移实例在第二边缘云节点中的属性信息发送给服务需求方,以供服务需求方基于该属性信息针对待迁移实例进行业务调度。
可选地,若待迁移实例是运行过程中发生指定事件的实例,即发生指定事件但仍可正常运行的示例,则,处理器32在将待迁移实例迁移到第二边缘云节点中时,具体用于:通过通信组件33向服务需求方发送迁移请求,以供服务需求方结合待迁移实例上的业务情况为待迁移实例确定迁移策略;通过通信组件33接收服务需求方发送的迁移策略,依据迁移策略,将待迁移实例迁移到第二边缘云节点中。
可选地,处理器32在将待迁移实例迁移到第二边缘云节点中时,具体用于:根据待迁移实例的资源需求,控制第二边缘云节点中相应资源设备为待迁移实例进行资源预留或分配;在资源预留或分配成功后,将待迁移实例迁移到第二边缘云节点中相应资源设备预留或分配的资源上。
可选地,处理器32在将待迁移实例迁移到第二边缘云节点中相应资源设备预留或分配的资源上时,具体用于:控制第二边缘云节点中相应资源设备根据待迁移实例对应的镜像或快照在预留或分配的资源上创建待迁移实例。
进一步可选地,处理器32具体用于:向网络系统中的边缘管控设备发送迁移指令,该迁移指令指示所述边缘管控设备获取所述待迁移实例对应的镜像或实例快照并提供给第二边缘云节点中相应资源设备,以供相应资源设备在预留或分配的资源上创建所述待迁移实例。
可选地,处理器32还用于:通过通信组件33接收服务需求方发送的释放通知,并依据释放通知将运行在第一边缘云节点中的待迁移实例释放掉;其中,在迁移过程中,待迁移实例继续运行在第一边缘云节点中;其中,释放通知是服务需求方在确定运行于第一边缘云节点中的待迁移实例上不再有任何业务请求之后发送的。
进一步,如图3所示,该中心管控设备还包括:显示器34、电源组件35和音频组件36等其它组件。图3中仅示意性给出部分组件,并不意味着中心管控设备只包括图3所示组件。另外,图3中虚线框内的组件为可选组件,具体可视中心管控设备实现形态而定。如果中心管控设备是服务器形态的设备,可选地,可以不包括显示器34和音频组件36;若中心管控设备是终端设备形态的设备,可选地,可以包括显示器34和音频组件36。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被一个或多个处理器执行时,致使一个或多个处理器实现上述方法实施例中可由中心管控设备执行的各步骤或操作。
上述图3中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还可以包括近场通信(NFC)模块,射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术等。
上述图3中的显示器包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
上述图3中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述图3中的音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (25)

1.一种实例管控方法,应用于网络系统,其特征在于,所述网络系统为边缘云系统,所述边缘云系统包括中心管控设备和至少一个边缘云节点,所述方法包括:
所述中心管控设备确定部署于网络系统中至少一个边缘云节点中的至少一个实例,所述至少一个实例可为服务需求方提供云计算服务;
所述中心管控设备对所述至少一个实例进行管控,以供所述至少一个实例为所述服务需求方提供云计算服务;
其中,对所述至少一个实例进行的管控至少包括在边缘云节点故障或不可用时、在边缘云节点中承载实例的物理机故障或宕机时、在实例故障时或在边缘云节点中出现待整合的资源碎片时,对所述至少一个实例进行迁移,所述迁移包括同一边缘云节点内的迁移,以及不同边缘云节点之间的迁移;
其中,在边缘云节点故障或不可用时,将所述边缘云节点中的实例迁移到其它边缘云节点中;在物理机故障或宕机时,将所述物理机上的实例迁移到所述物理机所属边缘云节点中的其它物理机上。
2.根据权利要求1所述的方法,其特征在于,对所述至少一个实例进行的管控还包括:升级、关停、重启和释放中的至少一种。
3.根据权利要求2所述的方法,其特征在于,对所述至少一个实例进行升级,包括:
从所述至少一个实例中确定待升级实例;
向所述服务需求方发送升级请求,以供所述服务需求方结合所述待升级实例上的业务情况为所述待升级实例确定升级策略;
接收所述服务需求方返回的升级策略,依据所述升级策略对所述待升级实例进行升级。
4.根据权利要求3所述的方法,其特征在于,从所述至少一个实例中确定待升级实例,包括:
接收所述服务需求方发送的升级描述信息,所述升级描述信息包括实例过滤条件;
根据所述实例过滤条件,从所述至少一个实例中确定所述待升级实例。
5.根据权利要求4所述的方法,其特征在于,所述升级描述信息还包括:升级所需的镜像版本;则,依据所述升级策略对所述待升级实例进行升级,包括:
依据所述升级策略,利用所述镜像版本对应的镜像对所述待升级实例进行升级。
6.根据权利要求5所述的方法,其特征在于,依据所述升级策略,利用所述镜像版本对应的镜像对所述待升级实例进行升级,包括:
将所述升级策略和所述镜像版本对应的镜像提供给所述网络系统中的边缘管控设备,以供所述边缘管控设备依据所述升级策略,利用所述镜像版本对应的镜像对所述待升级实例进行升级。
7.根据权利要求3-6任一项所述的方法,其特征在于,所述升级策略包括:是否升级、升级时间和升级方法中的至少一个信息。
8.根据权利要求1所述的方法,其特征在于,对所述至少一个实例进行迁移,包括:
从所述至少一个实例中确定待迁移实例,所述待迁移实例属于第一边缘云节点;
若所述第一边缘云节点满足节点内迁移条件,对所述待迁移实例进行边缘云节点内的迁移;
若所述第一边缘云节点不满足节点内迁移条件,对所述待迁移实例进行跨边缘云节点的迁移。
9.根据权利要求8所述的方法,其特征在于,从所述至少一个实例中确定待迁移实例,包括:
根据所述至少一个实例的状态,将出现故障的实例和/或运行过程中发生指定事件的实例作为所述待迁移实例;或者
根据资源归并需求,从至少一个实例中确定待迁移实例。
10.根据权利要求9所述的方法,其特征在于,根据资源归并需求,从至少一个实例中确定待迁移实例,包括:
根据资源归并需求,确定需要资源归并的第一边缘云节点;
结合所述第一边缘云节点中各资源设备上剩余的可用资源和所述第一边缘云节点中各实例需要的资源,确定所述待迁移实例。
11.根据权利要求8所述的方法,其特征在于,还包括:
判断所述第一边缘云节点是否处于可用状态;
若所述第一边缘云节点处于可用状态,判断所述第一边缘云节点的可用资源是否足够承载所述待迁移实例;
若所述第一边缘云节点的可用资源足够承载所述待迁移实例,则确定所述第一边缘云节点满足节点内迁移条件;
若所述第一边缘云节点处于不可用状态,或者所述第一边缘云节点的可用资源不足以承载所述待迁移实例,则确定所述第一边缘云节点不满足节点内迁移条件。
12.根据权利要求8-11任一项所述的方法,其特征在于,对所述待迁移实例进行跨边缘云节点的迁移,包括:
从所述至少一个边缘云节点选择第二边缘云节点,所述第二边缘云节点不同于所述第一边缘云节点;
将所述待迁移实例迁移到所述第二边缘云节点中,并将所述待迁移实例在所述第二边缘云节点中的属性信息发送给所述服务需求方,以供所述服务需求方基于所述属性信息针对所述待迁移实例进行业务调度。
13.根据权利要求12所述的方法,其特征在于,若所述待迁移实例是运行过程中发生指定事件的实例,则,将所述待迁移实例迁移到所述第二边缘云节点中,包括:
向所述服务需求方发送迁移请求,以供所述服务需求方结合所述待迁移实例上的业务情况为所述待迁移实例确定迁移策略;
接收所述服务需求方发送的迁移策略,依据所述迁移策略,将所述待迁移实例迁移到所述第二边缘云节点中。
14.根据权利要求12所述的方法,其特征在于,将所述待迁移实例迁移到所述第二边缘云节点中,包括:
根据所述待迁移实例的资源需求,控制所述第二边缘云节点中相应资源设备为所述待迁移实例进行资源预留或分配;
在资源预留或分配成功后,将所述待迁移实例迁移到所述第二边缘云节点中相应资源设备预留或分配的资源上。
15.根据权利要求14所述的方法,其特征在于,将所述待迁移实例迁移到所述第二边缘云节点中相应资源设备预留或分配的资源上,包括:
控制所述第二边缘云节点中相应资源设备根据所述待迁移实例对应的镜像或实例快照在预留或分配的资源上创建所述待迁移实例。
16.根据权利要求15所述的方法,其特征在于,控制所述第二边缘云节点中相应资源设备根据所述待迁移实例对应的镜像或实例快照在预留或分配的资源上创建所述待迁移实例,包括:
向所述网络系统中的边缘管控设备发送迁移指令,所述迁移指令指示所述边缘管控设备获取所述待迁移实例对应的镜像或实例快照并提供给所述第二边缘云节点中相应资源设备,以供所述相应资源设备在预留或分配的资源上创建所述待迁移实例。
17.根据权利要求12所述的方法,其特征在于,还包括:
接收所述服务需求方发送的释放通知,并依据所述释放通知将运行在所述第一边缘云节点中的所述待迁移实例释放掉;其中,在迁移过程中,所述待迁移实例继续运行在所述第一边缘云节点中;
其中,所述释放通知是所述服务需求方在确定运行于所述第一边缘云节点中的所述待迁移实例上不再有任何业务请求之后发送的。
18.一种网络系统,其特征在于,包括:中心管控设备,以及至少一个边缘云节点;
所述至少一个边缘云节点中部署有至少一个实例,所述至少一个实例可为服务需求方提供云计算服务;
所述中心管控设备,用于对所述至少一个实例进行管控,以供所述至少一个实例为所述服务需求方提供云计算服务;
其中,对所述至少一个实例进行的管控至少包括在边缘云节点故障或不可用时、在边缘云节点中承载实例的物理机故障或宕机时、在实例故障时或在边缘云节点中出现待整合的资源碎片时,对所述至少一个实例进行迁移,所述迁移包括同一边缘云节点内的迁移,以及不同边缘云节点之间的迁移;
其中,在边缘云节点故障或不可用时,将所述边缘云节点中的实例迁移到其它边缘云节点中;在物理机故障或宕机时,将所述物理机上的实例迁移到所述物理机所属边缘云节点中的其它物理机上。
19.根据权利要求18所述的网络系统,其特征在于,所述中心管控设备对所述至少一个实例的管控还包括:升级、关停、重启和释放中的至少一种。
20.根据权利要求19所述的网络系统,其特征在于,所述中心管控设备在对所述至少一个实例进行升级时,具体用于:
从所述至少一个实例中确定待升级实例;
向所述服务需求方发送升级请求,以供所述服务需求方结合所述待升级实例上的业务情况为所述待升级实例确定升级策略;
接收所述服务需求方发送的升级策略,依据所述升级策略对所述待升级实例进行升级。
21.根据权利要求18所述的网络系统,其特征在于,所述中心管控设备在对所述至少一个实例进行迁移时,具体用于:
从所述至少一个实例中确定待迁移实例,并确定所述待迁移实例所属的第一边缘云节点;
若所述第一边缘云节点满足节点内迁移条件,对所述待迁移实例进行边缘云节点内的迁移;
若所述第一边缘云节点不满足节点内迁移条件,对所述待迁移实例进行跨边缘云节点的迁移。
22.根据权利要求21所述的网络系统,其特征在于,所述中心管控设备在对所述待迁移实例进行跨边缘云节点的迁移时,具体用于:
从所述至少一个边缘云节点选择第二边缘云节点,所述第二边缘云节点不同于所述第一边缘云节点;
将所述待迁移实例迁移到所述第二边缘云节点中,并将所述待迁移实例在所述第二边缘云节点中的属性信息发送给所述服务需求方,以供所述服务需求方基于所述属性信息针对所述待迁移实例进行业务调度。
23.根据权利要求18-22任一项所述的网络系统,其特征在于,还包括:边缘管控设备;
所述边缘管控设备,用于配合所述中心管控设备对所述至少一个实例进行管控。
24.一种中心管控设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储计算机程序;当所述计算机程序被所述处理器执行时,致使所述处理器实现权利要求1-17任一项所述方法中的步骤。
25.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现权利要求1-17任一项所述方法中的步骤。
CN201910277465.4A 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质 Active CN111800282B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202310139017.4A CN116170316A (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质
CN201910277465.4A CN111800282B (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质
PCT/CN2020/081570 WO2020207266A1 (zh) 2019-04-08 2020-03-27 网络系统、实例管控方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277465.4A CN111800282B (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310139017.4A Division CN116170316A (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111800282A CN111800282A (zh) 2020-10-20
CN111800282B true CN111800282B (zh) 2023-03-28

Family

ID=72751930

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910277465.4A Active CN111800282B (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质
CN202310139017.4A Pending CN116170316A (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202310139017.4A Pending CN116170316A (zh) 2019-04-08 2019-04-08 网络系统、实例管控方法、设备及存储介质

Country Status (2)

Country Link
CN (2) CN111800282B (zh)
WO (1) WO2020207266A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112486667B (zh) * 2020-11-03 2022-03-18 深圳市中博科创信息技术有限公司 一种基于边缘计算精准处理数据的方法及装置
CN112769897B (zh) * 2020-12-21 2023-04-18 北京百度网讯科技有限公司 边缘计算消息的同步方法、装置、电子设备及存储介质
CN114760313B (zh) * 2020-12-29 2023-11-24 中国联合网络通信集团有限公司 业务调度方法和业务调度装置
CN113190378B (zh) * 2020-12-31 2024-04-02 华数云科技有限公司 一种基于分布式云平台的边缘云灾备方法
CN113296903A (zh) * 2021-02-01 2021-08-24 阿里巴巴集团控股有限公司 边缘云系统、边缘管控方法、管控节点及存储介质
CN112995682B (zh) * 2021-04-21 2021-08-03 军事科学院系统工程研究院网络信息研究所 一种对视频云服务进行部署迁移的方法和装置
CN113259359B (zh) * 2021-05-21 2022-08-02 重庆紫光华山智安科技有限公司 一种边缘节点能力补充方法、系统、介质及电子终端
CN113572821A (zh) * 2021-07-05 2021-10-29 山东师范大学 一种边缘云节点任务协同处理方法及系统
CN113342478B (zh) * 2021-08-04 2022-02-01 阿里云计算有限公司 资源管理方法、设备、网络系统及存储介质
CN113992675A (zh) * 2021-10-26 2022-01-28 云知声(上海)智能科技有限公司 Iot云平台与边缘网关协同工作的方法、系统及存储介质
CN114070851A (zh) * 2021-11-15 2022-02-18 中国电信集团系统集成有限责任公司 一种基于mec边缘云的业务恢复方法、存储介质及系统
CN113992499B (zh) * 2021-11-16 2023-08-15 中电信数智科技有限公司 一种基于业务动态迁移的灾备方法、存储介质及系统
CN114338166A (zh) * 2021-12-29 2022-04-12 支付宝(杭州)信息技术有限公司 一种边缘设备风险处理方法、装置、设备及云端服务器
CN114301809B (zh) * 2021-12-31 2024-02-09 郑州云海信息技术有限公司 一种边缘计算平台架构
CN114301775B (zh) * 2021-12-31 2023-07-28 中国联合网络通信集团有限公司 一种存量业务的纳管方法、装置及计算机可读存储介质
CN114401183A (zh) * 2022-01-17 2022-04-26 杭州瑞网广通信息技术有限公司 一种基于分布式云平台的边缘云灾备系统、方法和装置
CN114598654A (zh) * 2022-01-30 2022-06-07 阿里巴巴(中国)有限公司 基于内容分发网络cdn的流量均衡处理方法及装置
CN114553726B (zh) * 2022-02-23 2023-06-02 深圳市众功软件有限公司 一种基于功能、资源层面的网络安全运维方法及系统
CN114760304A (zh) * 2022-03-30 2022-07-15 中国电信股份有限公司 算力信息的处理方法、处理系统及算力网关
CN117640629A (zh) * 2022-08-17 2024-03-01 维沃移动通信有限公司 算力任务迁移方法、装置及设备
CN115361389B (zh) * 2022-10-20 2023-04-11 阿里巴巴(中国)有限公司 一种云计算实例创建方法及装置
CN116094923B (zh) * 2023-01-30 2023-08-25 杭州优云科技有限公司 云实例迁移后的网关更新方法及装置和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101977242A (zh) * 2010-11-16 2011-02-16 西安电子科技大学 一种分层分布式云计算体系结构及服务提供方法
CN109429284A (zh) * 2017-08-31 2019-03-05 华为技术有限公司 实例切换方法及相关装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244874B1 (en) * 2011-09-26 2012-08-14 Limelight Networks, Inc. Edge-based resource spin-up for cloud computing
CN107018539A (zh) * 2016-01-27 2017-08-04 中兴通讯股份有限公司 应用的移动性的处理方法及装置
CN107295699A (zh) * 2016-03-30 2017-10-24 中兴通讯股份有限公司 应用实例的终结方法及装置、应用、边缘计算平台、节点
CN113194157B (zh) * 2017-06-30 2022-10-28 华为技术有限公司 一种应用实例地址的转换方法和装置
KR101926394B1 (ko) * 2017-09-19 2018-12-07 경희대학교 산학협력단 클라우드 컴퓨팅 시스템 및 클라우드 시스템에서의 부하 분리 방법
CN108632813B (zh) * 2018-05-21 2021-05-28 北京邮电大学 移动边缘计算的移动性管理方法及系统
CN109302483B (zh) * 2018-10-17 2021-02-02 网宿科技股份有限公司 一种应用程序的管理方法及系统
CN110266744A (zh) * 2019-02-27 2019-09-20 中国联合网络通信集团有限公司 基于位置的边缘云资源调度方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101977242A (zh) * 2010-11-16 2011-02-16 西安电子科技大学 一种分层分布式云计算体系结构及服务提供方法
CN109429284A (zh) * 2017-08-31 2019-03-05 华为技术有限公司 实例切换方法及相关装置

Also Published As

Publication number Publication date
CN111800282A (zh) 2020-10-20
CN116170316A (zh) 2023-05-26
WO2020207266A1 (zh) 2020-10-15

Similar Documents

Publication Publication Date Title
CN111800282B (zh) 网络系统、实例管控方法、设备及存储介质
CN111800281B (zh) 网络系统、管控方法、设备及存储介质
CN111800283B (zh) 网络系统、服务提供与资源调度方法、设备及存储介质
CN115633050B (zh) 镜像管理方法、设备及存储介质
US10255110B2 (en) Node selection for a new application in a multi-tenant cloud hosting environment
WO2022161430A1 (zh) 边缘云系统、边缘管控方法、管控节点及存储介质
CN113342478B (zh) 资源管理方法、设备、网络系统及存储介质
CN113169952A (zh) 一种基于区块链技术的容器云管理系统
CN111800285B (zh) 实例迁移方法和装置以及电子设备
CN113726846A (zh) 边缘云系统、资源调度方法、设备及存储介质
CN110768807B (zh) 虚拟资源方法及装置、虚拟资源处理网元及存储介质
CN113296882A (zh) 容器编排方法、设备、系统及存储介质
CN113569987A (zh) 模型训练方法和装置
CN110865881A (zh) 一种资源调度的方法及装置
CN113301078A (zh) 网络系统、服务部署与网络划分方法、设备及存储介质
CN111045745A (zh) 管理配置信息的方法和系统
WO2020063550A1 (zh) 策略决策方法及装置、系统、存储介质、策略决策单元及集群
CN110908774A (zh) 一种资源调度方法、设备、系统及存储介质
CN109697112B (zh) 分布式集约化一站式作业系统和实现方法
CN112269647A (zh) 节点调度、切换与协调方法及其相应的装置、设备、介质
CN106550002B (zh) 一种paas云托管系统及方法
CN114301909B (zh) 边缘分布式管控系统、方法、设备及存储介质
CN113553194B (zh) 硬件资源管理方法、设备及存储介质
CN114296891A (zh) 任务的调度方法、系统、计算设备、存储介质及程序产品
CN113094053A (zh) 产品的交付方法及装置、计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant