CN116418876A - 一种算力网络服务的迁移方法、系统及云管理平台 - Google Patents

一种算力网络服务的迁移方法、系统及云管理平台 Download PDF

Info

Publication number
CN116418876A
CN116418876A CN202310470197.4A CN202310470197A CN116418876A CN 116418876 A CN116418876 A CN 116418876A CN 202310470197 A CN202310470197 A CN 202310470197A CN 116418876 A CN116418876 A CN 116418876A
Authority
CN
China
Prior art keywords
service
power
network
computing
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310470197.4A
Other languages
English (en)
Inventor
艾定军
陶鸿飞
卢彦魁
毛广
段建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Eastcom Software Technology Co ltd
Original Assignee
Hangzhou Eastcom Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Eastcom Software Technology Co ltd filed Critical Hangzhou Eastcom Software Technology Co ltd
Priority to CN202310470197.4A priority Critical patent/CN116418876A/zh
Publication of CN116418876A publication Critical patent/CN116418876A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/148Migration or transfer of sessions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Sources (AREA)

Abstract

一种算力网络的服务迁移方法、系统及云管理平台,方法包括:获取多个算力服务节点的资源利用率信息和网络传输状态信息;根据每个算力服务节点的资源利用率信息和网络传输状态信息确定每个算力服务节点的算力网络服务等级信息;判断多个算力网络服务等级信息是否符合预设阈值;本申请的实施例通过监控算力网络的服务等级,制定算力网络服务迁移策略,当网络SLA或者算力资源状态不再满足算力服务时,由算力网络控制器重新计算算路,如果有新的算路能保证服务质量,则根据一定的规则将原有服务在保证服务连续性的基础上迁移到新的算力资源池,或者沿新的网络路径调度。在保证算力服务连续性的基础上,依然能够提供高质量的算力服务,同时还提升了用户体验。

Description

一种算力网络服务的迁移方法、系统及云管理平台
技术领域
本发明涉及网络通信技术领域,尤其涉及一种算力网络的服务迁移方法、系统及云管理平台。
背景技术
算力网络(Compute First Networking,CFN)是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施。目前发展较为成熟的算力网络方案是基于软件定义网络(Software Defined Network,SDN)的集中式算力网络,通过对网络、计算、存储等多维度资源的统一管理和调度,为用户提供算力资源服务。算力资源节点边缘设备将搜集的算力资源上报给算力网络控制器,算力网络控制器根据掌控的完整的算力资源和网络信息,基于用户服务需求,结合实时的网络、计算资源状态信息,将服务请求沿最优路径调度到最优节点。
由于网络状态和算力资源是时刻动态变化的,网络的时延、带宽等都可能不再满足算力服务对网络服务级别协议(Service Level Agreement,SLA)的要求,同时算力资源池所能提供的算力资源或不再满足算力服务对算力资源的需求。此时,为了保证算力服务的业务连续性,该方案选择了忽略服务等级要求的策略,即使在业务服务质量变得很差的情况下,依然坚持初始的调度路径和最终服务目的地。一方面除了不能很好的保证算力服务的质量,同时也可能加重服务质量变差的网络或者算力资源池的负担,使得网络和算力资源池的服务质量继续恶化。
发明内容
本发明实施例提供了一种算力网络的服务迁移方法、系统及云管理平台,通过监控算力网络的服务等级,制定算力网络服务迁移策略,当网络SLA或者算力资源状态不再满足算力服务时,由算力网络控制器重新计算算路,如果有新的算路能保证服务质量,则根据一定的规则将原有服务在保证服务连续性的基础上迁移到新的算力资源池,或者沿新的网络路径调度。在保证算力服务连续性的基础上,依然能够提供高质量的算力服务,在提高算力网络工作效率的同时还提升了用户体验。
第一方面,本发明实施例提供了一种算力网络的服务迁移方法,其中算力网络包括多个算力服务节点,方法包括:获取多个算力服务节点的资源利用率信息和网络传输状态信息;根据每个算力服务节点的资源利用率信息和网络传输状态信息确定每个算力服务节点的算力网络服务等级信息;判断多个算力网络服务等级信息是否符合预设阈值;当任意算力服务节点的算力网络服务等级信息不符合预设的阈值时,将算力网络服务迁移至符合预设阈值的算力服务节点。
在一种可能的实现方式中,资源利用率信息包括CPU利用率信息和存储资源利用率信息,网络传输状态信息包括网络时延信息。
在一种可能的实现方式中,算力网络的服务迁移方法还包括:在判断多个算力网络服务等级信息是否符合预设阈值之前,确定算力网络服务等级的容忍度阈值;其中:容忍度阈值包括资源利用率阈值,和/或网络时延阈值。
在一种可能的实现方式中,获取多个算力服务节点的资源利用率信息和网络传输状态信息包括:获取多个算力服务节点的链路信息;通过定期状态拨测获取多个算力服务节点的算力资源信息;通过网络协议获取多个链路的网络传输状态信息。
在一种可能的实现方式中,算力网络服务等级为预先设置的,其中:算力网络服务等级包括至少一个级别,至少一个级别包括预先设置的资源利用率信息,和/或网络时延信息。
在一种可能的实现方式中,通过定期状态拨测获取多个算力服务节点的算力资源信息包括:基于SDN网络,通过定期状态拨测获取算力服务节点的算力资源信息,其中包括:算力网络控制器向算力服务Agent发起拨测任务;算力服务Agent与算力服务代理交互,获取算力资源信息,并将算力资源信息反馈给算力服务控制器。
在一种可能的实现方式中,算力服务Agent还实时监控算力服务节点的算力资源状态,并将算力服务节点的算力资源异常状态上报给算力网络控制器。
在一种可能的实现方式中,获取多个算力服务节点的资源利用率信息和网络传输状态信息还包括:通过算力网络服务的随流检测技术监控多个链路上的网络状态,并将监控结果上报给算力网络控制器。
在一种可能的实现方式中,判断多个算力网络服务等级信息是否符合预设阈值包括:判断多个算力服务节点的资源利用率是否符合资源利用率阈值;以及判断多个算力服务节点的网络时延是否符合网络时延阈值。
在一种可能的实现方式中,当任意算力服务节点的算力网络服务等级信息不符合预设的阈值时,将算力网络服务迁移至符合预设阈值的算力服务节点包括:当任意算力服务节点的资源利用率不符合资源利用率阈值,和/或当任意算力服务节点的网络时延不符合网络时延阈值时,将算力网络服务迁移至符合预设的资源利用率阈值以及网络时延阈值的算力服务节点。
另一方面,本申请实施例提供了一种算力网络服务的迁移装置,应用于具有多个算力服务节点的算力网络,装置包括:算力网络控制器,根据多个算力服务节点的资源利用率信息和网络传输状态信息控制算力网络服务的迁移策略;算力服务代理,用于收集多个算力服务节点的资源利用率信息和网络传输状态信息,并将资源利用率信息和网络传输状态信息上报给算力网络控制器。
再一方面,本申请实施例提供了一种云管理平台,包括:至少一个存储器,用于存储程序;至少一个处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行如上所述的算力网络的服务迁移方法。
再一方面,本申请实施例提供了一种计算机存储介质,计算机存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行如上所述的算力网络的服务迁移方法。
再一方面,本申请实施例提供了一种包含指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行如上所述的算力网络的服务迁移方法。
附图说明
图1是本发明实施例提供的一种算力网络的服务迁移系统的系统架构图;
图2是本发明实施例提供的一种算力网络的服务迁移方法的流程示意图;
图3是本发明实施例提供的一种算力服务状态和网络状态监控流程示意图;
图4是本发明实施例提供的一种算力网络服务等级监控流程示意图;
图5是本发明实施例提供的一种算力网络服务迁移交互示意图;
图6是本发明实施例提供的另一种算力网络服务迁移方法的流程示意图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本发明实施例中的技术方案进行描述。
在本发明实施例的描述中,“示例性的”、“例如”或者“举例来说”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”、“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”、“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
在本发明实施例的描述中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B这三种情况。另外,除非另有说明,术语“多个”的含义是指两个或两个以上。例如,多个系统是指两个或两个以上的系统,多个终端是指两个或两个以上的终端。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
目前发展较为成熟的算力网络方案为基于SDN的集中式算力网络,通过对网络、计算、存储等多维度资源的统一管理和调度,为用户提供算力资源服务。算力资源节点边缘设备将搜集的算力资源上报给算力网络控制器,算力网络控制器根据掌控的完整的算力资源和网络信息,基于用户服务需求,结合实时的网络、计算资源状态信息,将服务请求沿最优路径调度到最优节点。其中算力资源的位置分布信息和其具备的资源量是动态变化的,算力资源以服务的方式提供给用户,同样的算力服务会有多个算力资源池提供,算力网络根据用户需求将服务调度和卸载到不同的服务节点。
在此算力网络架构和技术方案中,一旦首包探路成功形成算力服务转发表(Forward Information dataBase,FIB),算力服务后续数据包在保证业务连续性的要求下会自动按算力服务转发表FIB处理数据包,优势是效率大大提高,不再需要进行算路计算,但问题在于网络状态和算力资源是在时刻动态变化的,网络的时延、带宽等都可能不再满足算力服务对网络SLA的要求,同时算力资源池能提供的算力资源也不再满足算力服务对算力资源的需求。
现有技术方案只考虑保证算力服务的业务连续性,即使在业务服务质量变得很差的情况下,依然坚持初始的调度路径和最终服务目的地。一方面除了不能很好的保证算力服务的质量,同时也可能加重服务质量变差的网络或者算力资源池的负担,使得网络和算力资源池的服务质量继续恶化。
基于上述问题,本申请实施例提供了一种算力网络的服务迁移方法、装置及云管理平台,通过监控算力网络的服务等级,制定算力网络服务迁移策略,当网络SLA或者算力资源状态不再满足算力服务时,由算力网络控制器重新计算算路,如果有新的算路能保证服务质量,则根据一定的规则将原有服务在保证服务连续性的基础上迁移到新的算力资源池,或者沿新的网络路径调度。在保证算力服务连续性的基础上,依然能够提供高质量的算力服务,在提高算力网络工作效率的同时还提升了用户体验。
需要说明的是,本发明实施例中提到的云资源可以为公有云中的云资源。其中,公有云是指第三方提供商通过公共网络提供的服务,面向希望使用或购买的任何人。本发明实施例将在公有云注册有账号密码,且希望或已经购买云资源的人称为租户。另外,本发明实施例中涉及的云资源可以理解为任一云产品。云资源包括计算资源、网络资源、存储资源,计算资源例如为虚拟机、容器、裸金属服务器等,网络资源例如为带宽包、弹性网卡、防火墙、弹性网卡等,存储资源例如为云磁盘和对象存储桶等,其中,云资源还包括用于管理计算资源、网络资源、或存储资源的云服务,例如针对计算资源的扩容或缩容服务,本发明实施例对此不做具体限定,具体可结合实际需求确定。若云产品不一样,比如,不同规格的虚拟机,则可认为是不同种类的云资源,即多种云资源。当然,若云产品可以按照数量购买,则可认为云资源有多个,即云资源的数量为多个。
下面描述算力网络的服务迁移系统。图1是本发明实施例提供的一种算力网络的服务迁移系统的系统架构图。如图1所示,系统包括算力网络控制器101和算力服务代理102终端,算力网络控制器101用于根据多个算力服务节点的资源利用率信息和网络传输状态信息控制算力网络服务的迁移策略;算力服务代理102用于收集多个算力服务节点的资源利用率信息和网络传输状态信息,并将资源利用率信息和网络传输状态信息上报给算力网络控制器101。
算力网络是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施,利用云网融合技术以及SDN/NFV等新型网络技术,将边缘计算节点、云计算节点以及含广域网在内的各类网络资源深度融合在一起,减少边缘计算节点的管控复杂度,并通过集中控制或者分布式调度方法与云计算节点的计算和存储资源、广域网的网络资源进行协同,组成新一代信息基础设施,为客户提供包含计算、存储和连接的整体算力服务,并根据业务特性提供灵活、可调度的按需服务。
其中,算力网络具有多个资源池,并对这些资源池进行监控,得到资源使用信息。如图1所示,云资源包括计算资源、网络资源、存储资源,对应的,多个资源池可以包括计算资源池、存储资源池、网络资源池,本发明实施例对此不做具体限定,具体可结合实际需求设计资源池的数量,比如,还可以设置软件资源池。
其中,计算资源池可以包括计算节点1、计算节点2、…等多个计算节点(用于计算的计算机,比如服务器,在一些可能的情况,一个计算节点可以部署多个计算机),以及对这些计算节点虚拟化得到的云资源,比如虚拟机、数据库、大数据服务。
存储资源池可以包括存储节点1、存储节点2、…等多个存储节点(用于存储的存储设备,比如云硬盘,在一些可能的情况,一个存储节点可以部署多个存储设备),以及,以及对这些存储节点虚拟化得到的云资源,比如云硬盘、分布式缓存服务、分布式消息服务、云备份等。
网络资源池可以包括网络节点1、网络节点2、…等多个网络节点(用于数据转发的网络设备,比如网关、交换机、路由器),以及,以及对这些网络节点虚拟化得到的云资源,比如带宽、网关、流量包、云连接、网卡等。
在一种实施例中,算力网络还可以由多个算力服务节点构建,每个算力服务节点均具有计算资源、网络资源和存储资源,可以单独为用户提供算力服务。可以理解的是,算力服务节点可以是单独的服务器,也可以是多个服务器的集群,即算力资源池。算力网络控制器101可以根据用户的需求分配为用户服务的算力服务节点或算力资源池中的任意算力服务节点,当某算力服务节点出现异常时,可将用户的算力服务迁移至其他算力服务节点。若出现异常状态的算力服务节点位于其中一个算力资源池内,可以在该算力资源池内寻找其他算力服务节点来承担算力任务,也可以在该算力资源池外的其他算力资源池中寻找算力服务节点承担算力任务。
在基于SDN的算力网络中,一般在算力资源的边缘存在算力服务代理102,协助管理和维护算力网络中的计算资源,同时负责处理其背后代理的节点的计算任务,管理节点的硬件资源、收集节点的性能数据等工作。算力网络控制器101可以通过定期状态拨测获取算力服务状态,算力服务状态包括资源利用率信息和网络传输状态信息,在定期状态拨测模式下,算力网络控制器101向算力服务Agent发起拨测任务,算力服务Agent与其背后代理的算力资源交互获取算力服务状态,并将结果返回给拨测任务。同时,算力服务Agent也布有Deamon进程实时监控其代理的算力资源的状态,对于异常状态,算力服务Agent会主动发起数据上报给算力网络控制器101。
其中,资源利用率信息用于说明云资源的实际使用信息。比如,云资源为虚拟机,则实际应用情况可以为虚拟机在当前时刻的使用数量,以及占用的CPU核数、内存占用大小、云硬盘的占用大小等。
网络传输状态信息用于说明算力网络的带宽大小、网络时延、网络波动等状态信息。
下文将详细描述通过图1所示的算力网络服务的迁移方法。图2示出了本发明实施例提供的一种算力网络的服务迁移方法的流程示意图。如图2所示,本申请实施例提供了一种算力网络服务的迁移方法,其中算力网络包括多个算力服务节点,方法包括:
步骤S201,获取多个算力服务节点的资源利用率信息和网络传输状态信息。
具体的,资源利用率信息包括CPU利用率信息和存储资源利用率信息,网络传输状态信息包括网络时延信息。
算力网络控制器可以通过定期状态拨测获取算力服务状态,在定期状态拨测模式下,算力网络控制器向算力服务Agent发起拨测任务,算力服务Agent与其背后算力服务代理的算力资源交互获取资源利用率信息,并将结果返回给拨测任务。同时,算力服务Agent也布有Deamon进程实时监控其代理的算力资源的状态,对于异常状态,算力服务Agent会主动发起数据上报给算力网络控制器。
网络传输状态信息可以通过两种手段获取,第一种手段为算力网络控制器通过各种网络协议比如BGP-LS等获取网络传输状态信息,第二种手段为通过算力网络服务的随流检测技术,在业务流中通过随流检测技术监控当前算力服务路径节点上的网络状态,并上报算力网络控制器。
图3为本发明实施例提供的一种算力服务状态和网络状态监控流程示意图。如图3所示,算力网络控制器可以通过定期状态拨测和算力Agent的主动上报获取算力服务状态,同时算力网络控制器通过各种网络协议获取网络实时状态信息,也通过业务随流检测机制获取算力服务路径的状态信息。
在一种实施例中,首先获取多个算力服务节点的链路信息,链路信息指承担当前算力服务的算力服务节点在算力网络中的路径信息,算力网络控制器再通过定期状态拨测获取多个算力服务节点的算力资源信息。其中,算力网络控制器向算力服务Agent发起拨测任务;算力服务Agent与算力服务代理交互,获取算力资源信息,并将算力资源信息反馈给算力服务控制器。算力服务Agent还实时监控算力服务节点的算力资源状态,并将算力服务节点的算力资源异常状态上报给算力网络控制器。同时,算力网络控制器还可以通过算力网络服务的随流检测技术监控多个链路上的网络状态,并将监控结果上报给算力网络控制器,以获取各个链路的实时网络传输状态信息。
步骤S203,根据每个算力服务节点的资源利用率信息和网络传输状态信息确定每个算力服务节点的算力网络服务等级信息。
算力网络服务等级可根据对算力网络服务质量的要求预先设置,算力网络服务等级包括至少一个级别,每个级别可以包括预先设置的资源利用率信息,和/或网络时延信息。也就是说每个算力网络服务等级包括算力网络节点的资源利用率和网络时延信息。在某一时刻,根据算力网络控制器获取的算力网络节点资源利用率和网络时延信息来确定这一时刻的算力网络服务等级。需要说明的是资源利用率和网络时延可以是某一数值,也可以规定为某一数值范围。
步骤S205,判断多个算力网络服务等级信息是否符合预设阈值;
首先,在判断多个算力网络服务等级信息是否符合预设阈值之前,确定算力网络服务等级的容忍度阈值;其中:容忍度阈值包括资源利用率阈值,和/或网络时延阈值。
在一种实施例中,可以定义算力服务对带宽、时延、抖动等网络也即服务路径的服务等级需求,从计算维度看,我们可以定义服务对资源利用率(如CPU利用率、存储利用率)、资源池空闲率等服务等级需求。同时,在算力服务中我们可以定义对服务等级的容忍度,也即对服务迁移的灵敏度,比如服务等级要求网络小于5ms,当网络时延大于10ms才触发服务迁移决策,网络时延在5ms到10ms之间为我们定义的对服务等级的容忍度。
将算力网络控制器获取的算力网络节点资源利用率和网络时延信息,与定义的资源利用率、网络时延进行比对,若某一时刻算力网络控制器获取的算力网络节点资源利用率和网络时延信息不符合定义的服务等级的容忍度,将触发算力服务迁移决策。
具体的,如图4所示,算力网络服务等级监控器实时监控当前算力服务的状态,当监测到服务等级不满足或者低于基于规则定义的阈值时,触发服务迁移决策。服务迁移决策机制需要根据当前的算力资源状态信息和网络传输状态信息,以及用户算力服务的服务等级保障需求,重新计算算力服务提供方和路径。如无可用的算力服务提供方和路径,迁移决策器判断服务迁移不可行则继续监控等待时机,如有新的可用的算力服务或路径能保障算力服务等级,迁移服务决策开始进入执行流程。
步骤S207,当任意算力服务节点的算力网络服务等级信息不符合预设的阈值时,将算力网络服务迁移至符合预设阈值的算力服务节点。
当算力服务迁移决策算力服务需要被迁移时,包括两种方式,第一种方式,算力资源池保持不变,只需要调整算力服务路径,在本实施例中,只需算力网络控制器重新计算算路并下发给首节点,首节点调整缓存路径,使后续算力服务数据包沿新路径路由到算力服务目的地。
第二种方式,除了算力服务路径需要重新计算下发,还需要在算力服务池间迁移算力服务,为保障算力业务的连续性,算力资源池间算力服务的迁移还包括业务数据的迁移。
具体的,如图5所示,首先算力网络控制器与原算力服务提供方继续交互维持服务,同时通知新算力服务提供方和原算力服务方开始迁移准备;准备就绪完成,算力网络控制器开始执行迁移,迁移执行会同时下发和通知原算力服务提供方和新算力服务提供方,迁移执行的主要工作在于业务数据在原算力服务提供方和新算力服务提供方之前的迁移;一旦数据迁移完成,算力网络控制器下发算路更新策略,将算力服务数据包从原算力服务提供方导流到新的算力服务提供方。
在一种实施例中,判断多个算力网络服务等级信息是否符合预设阈值包括:判断多个算力服务节点的资源利用率是否符合资源利用率阈值;以及判断多个算力服务节点的网络时延是否符合网络时延阈值。
当任意算力服务节点的资源利用率不符合资源利用率阈值,和/或当任意算力服务节点的网络时延不符合网络时延阈值时,将算力网络服务迁移至符合预设的资源利用率阈值以及网络时延阈值的算力服务节点。
在本实施例中,判断算力网络服务等级是否符合预设阈值时,只要算力服务节点的资源利用率或网络时延的其中一个不符合预设的资源利用率阈值或网络时延阈值,即判断为算力网络服务等级不符合预设阈值。
在另一种实施例中,如图6所示,算力网络服务的迁移方法可以包括如下步骤:
步骤S601,定义算力网络服务级别。
在本步骤中预先定义算力网络服务级别,为后续步骤提供依据。具体的,算力网络服务等级包括算力网络节点的资源利用率和网络时延信息。需要说明的是资源利用率和网络时延可以是某一数值,也可以规定为某一数值范围。
定义了算力网络服务级别后,确定算力网络服务等级的容忍度阈值;其中:容忍度阈值包括资源利用率阈值,和/或网络时延阈值。具体的,可以定义算力服务对带宽、时延、抖动等网络也即服务路径的服务等级需求,从计算维度看,我们可以定义服务对资源利用率(如CPU利用率、存储利用率)、资源池空闲率等服务等级需求。同时,在算力服务中我们可以定义对服务等级的容忍度,也即对服务迁移的灵敏度,比如服务等级要求网络小于5ms,当网络时延大于10ms才触发服务迁移决策,网络时延在5ms到10ms之间为我们定义的对服务等级的容忍度。
步骤S602,算力网络服务级别监控。
首先获取多个算力服务节点的链路信息,链路信息指承担当前算力服务的算力服务节点在算力网络中的路径信息,算力网络控制器再通过定期状态拨测获取多个算力服务节点的算力资源信息。其中,算力网络控制器向算力服务Agent发起拨测任务;算力服务Agent与算力服务代理交互,获取算力资源信息,并将算力资源信息反馈给算力服务控制器。算力服务Agent还实时监控算力服务节点的算力资源状态,并将算力服务节点的算力资源异常状态上报给算力网络控制器。同时,算力网络控制器还可以通过算力网络服务的随流检测技术监控多个链路上的网络状态,并将监控结果上报给算力网络控制器。
步骤S603,算力网络服务迁移决策。
将算力网络控制器获取的算力网络节点资源利用率和网络时延信息,与定义的资源利用率、网络时延进行比对,若某一时刻算力网络控制器获取的算力网络节点资源利用率和网络时延信息不符合定义的服务等级的容忍度,将触发算力服务迁移决策。
步骤S604,算力网络服务迁移执行。
当算力服务迁移决策算力服务需要被迁移时,包括两种方式,第一种方式,算力资源池保持不变,只需要调整算力服务路径,在本实施例中,只需算力网络控制器重新计算算路并下发给首节点,首节点调整缓存路径,使后续算力服务数据包沿新路径路由到算力服务目的地。
第二种方式,首先算力网络控制器与原算力服务提供方继续交互维持服务,同时通知新算力服务提供方和原算力服务方开始迁移准备;准备就绪完成,算力网络控制器开始执行迁移,迁移执行会同时下发和通知原算力服务提供方和新算力服务提供方,迁移执行的主要工作在于业务数据在原算力服务提供方和新算力服务提供方之前的迁移;一旦数据迁移完成,算力网络控制器下发算路更新策略,将算力服务数据包从原算力服务提供方导流到新的算力服务提供方。
本申请实施例还提供了一种云管理平台,包括:至少一个存储器,用于存储程序;至少一个处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行如上所述的方法。
其中,云管理平台进行云资源的管理。更为具体地,云管理平台为网络上存储数据和提供数据的运转空间,能够为租户提供可购买的各种云资源,在租户购买云资源后能够释放云资源给租户使用,从而使得租户使用该云资源实现不同业务;进一步地,在租户主动释放云资源后,能够对云资源进行中断回收。这里,云管理平台作为服务端,对应的,租户通过客户端与云管理平台进行通信。
在实际应用中,云管理平台作为服务端,可以发布可购买的云资源至客户端,对应的,客户端会向租户显示这些云资源,以使租户通过客户端了解可购买的云资源。在实际应用中,租户可以在用户设备上安装客户端,或者,安装浏览器,在浏览器输入网址从而访问客户端。
本申请实施例中还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述图2和相应描述内容中记载的任一项方法。
本申请实施例中还提供了一种计算机程序产品,所述计算机程序产品存储有指令,所述指令在由计算机执行时,使得所述计算机实施上述图2和相应描述内容中记载的任一项方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
此外,本申请实施例的各个方面或特征可以实现成方法、装置或使用标准编程和/或工程技术的制品。本申请中使用的术语“制品”涵盖可从任何计算机可读器件、载体或介质访问的计算机程序。例如,计算机可读介质可以包括,但不限于:磁存储器件(例如,硬盘、软盘或磁带等),光盘(例如,压缩盘(compact disc,CD)、数字通用盘(digital versatiledisc,DVD)等),智能卡和闪存器件(例如,可擦写可编程只读存储器(erasableprogrammable read-only memory,EPROM)、卡、棒或钥匙驱动器等)。另外,本文描述的各种存储介质可代表用于存储信息的一个或多个设备和/或其它机器可读介质。术语“机器可读介质”可包括但不限于,无线信道和能够存储、包含和/或承载指令和/或数据的各种其它介质。
在上述实施例中,算力网络的服务迁移系统可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,高密度数字视频光盘(digital video disc,DVD))、或者半导体介质(例如,固态硬盘(solid statedisk,SSD))等。
应当理解的是,在本申请实施例的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者接入网设备等)执行本申请实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请实施例的具体实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (14)

1.一种算力网络服务的迁移方法,其中算力网络包括多个算力服务节点,其特征在于,所述方法包括:
获取多个算力服务节点的资源利用率信息和网络传输状态信息;
根据每个算力服务节点的资源利用率信息和网络传输状态信息确定每个算力服务节点的算力网络服务等级信息;
判断多个算力网络服务等级信息是否符合预设阈值;
当任意算力服务节点的算力网络服务等级信息不符合预设的阈值时,将算力网络服务迁移至符合预设阈值的算力服务节点。
2.根据权利要求1所述的方法,其特征在于,所述资源利用率信息包括CPU利用率信息和存储资源利用率信息,所述网络传输状态信息包括网络时延信息。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在判断多个算力网络服务等级信息是否符合预设阈值之前,确定算力网络服务等级的容忍度阈值;其中:
所述容忍度阈值包括资源利用率阈值,和/或网络时延阈值。
4.根据权利要求1所述的方法,其特征在于,所述获取多个算力服务节点的资源利用率信息和网络传输状态信息包括:
获取多个算力服务节点的链路信息;
通过定期状态拨测获取多个算力服务节点的算力资源信息;
通过网络协议获取多个所述链路的网络传输状态信息。
5.根据权利要求3所述的方法,其特征在于,所述算力网络服务等级为预先设置的,其中:
所述算力网络服务等级包括至少一个级别,所述至少一个级别包括预先设置的资源利用率信息,和/或网络时延信息。
6.根据权利要求4所述的方法,其特征在于,所述通过定期状态拨测获取多个算力服务节点的算力资源信息包括:
基于SDN网络,通过定期状态拨测获取算力服务节点的算力资源信息,其中包括:
算力网络控制器向算力服务Agent发起拨测任务;
算力服务Agent与算力服务代理交互,获取算力资源信息,并将所述算力资源信息反馈给算力服务控制器。
7.根据权利要求6所述的方法,其特征在于,算力服务Agent还实时监控算力服务节点的算力资源状态,并将算力服务节点的算力资源异常状态上报给算力网络控制器。
8.根据权利要求4所述的方法,其特征在于,所述获取多个算力服务节点的资源利用率信息和网络传输状态信息还包括:
通过算力网络服务的随流检测技术监控所述多个链路上的网络状态,并将监控结果上报给算力网络控制器。
9.根据权利要求3所述的方法,其特征在于,所述判断多个算力网络服务等级信息是否符合预设阈值包括:
判断多个算力服务节点的资源利用率是否符合资源利用率阈值;以及
判断多个算力服务节点的网络时延是否符合网络时延阈值。
10.根据权利要求1所述的方法,其特征在于,所述当任意算力服务节点的算力网络服务等级信息不符合预设的阈值时,将算力网络服务迁移至符合预设阈值的算力服务节点包括:
当任意算力服务节点的资源利用率不符合资源利用率阈值,和/或当任意算力服务节点的网络时延不符合网络时延阈值时,将算力网络服务迁移至符合预设的资源利用率阈值以及网络时延阈值的算力服务节点。
11.一种算力网络服务的迁移系统,应用于具有多个算力服务节点的算力网络,其特征在于,包括:
算力网络控制器,根据多个算力服务节点的资源利用率信息和网络传输状态信息控制算力网络服务的迁移策略;
算力服务代理,用于收集多个算力服务节点的资源利用率信息和网络传输状态信息,并将所述资源利用率信息和网络传输状态信息上报给算力网络控制器。
12.一种云管理平台,其特征在于,包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于执行所述存储器存储的程序,当所述存储器存储的程序被执行时,所述处理器用于执行如权利要求1-10任一项所述的方法。
13.一种计算机存储介质,所述计算机存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-10任一项所述的方法。
14.一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1-10任一项所述的方法。
CN202310470197.4A 2023-04-27 2023-04-27 一种算力网络服务的迁移方法、系统及云管理平台 Pending CN116418876A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310470197.4A CN116418876A (zh) 2023-04-27 2023-04-27 一种算力网络服务的迁移方法、系统及云管理平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310470197.4A CN116418876A (zh) 2023-04-27 2023-04-27 一种算力网络服务的迁移方法、系统及云管理平台

Publications (1)

Publication Number Publication Date
CN116418876A true CN116418876A (zh) 2023-07-11

Family

ID=87049469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310470197.4A Pending CN116418876A (zh) 2023-04-27 2023-04-27 一种算力网络服务的迁移方法、系统及云管理平台

Country Status (1)

Country Link
CN (1) CN116418876A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582547A (zh) * 2023-07-14 2023-08-11 浪潮通信信息系统有限公司 算力网络数据传输方法、装置、电子设备及存储介质
CN117170870A (zh) * 2023-09-05 2023-12-05 国网智能电网研究院有限公司 一种面向新能源消纳的数据中心算力的迁移方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582547A (zh) * 2023-07-14 2023-08-11 浪潮通信信息系统有限公司 算力网络数据传输方法、装置、电子设备及存储介质
CN116582547B (zh) * 2023-07-14 2023-10-20 浪潮通信信息系统有限公司 算力网络数据传输方法、装置、电子设备及存储介质
CN117170870A (zh) * 2023-09-05 2023-12-05 国网智能电网研究院有限公司 一种面向新能源消纳的数据中心算力的迁移方法及装置
CN117170870B (zh) * 2023-09-05 2024-04-26 国网智能电网研究院有限公司 一种面向新能源消纳的数据中心算力的迁移方法及装置

Similar Documents

Publication Publication Date Title
EP3072260B1 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
US8977886B2 (en) Method and apparatus for rapid disaster recovery preparation in a cloud network
US9219691B2 (en) Source-driven switch probing with feedback request
CN116418876A (zh) 一种算力网络服务的迁移方法、系统及云管理平台
US20150215228A1 (en) Methods, systems, and computer readable media for a cloud-based virtualization orchestrator
Tran et al. Eqs: An elastic and scalable message queue for the cloud
US20060200469A1 (en) Global session identifiers in a multi-node system
US11792275B2 (en) Dynamic connection capacity management
CN111858054A (zh) 一种异构环境下基于边缘计算的资源调度系统及方法
WO2013063083A1 (en) System and method for cloud-based implementation of control of focused overload of service element (cofo-se) via explicit (or virtualized) machine-to-machine (m2m) gateway element
CN113517985B (zh) 文件数据处理方法、装置、电子设备及计算机可读介质
WO2018103665A1 (zh) 基于l2tp的设备管理方法、设备及系统
US20220014438A1 (en) Shared bandwidth speed limiting method, device, and storage medium
CN111769997A (zh) 网络监测的方法、服务器、设备和计算机可读介质
WO2022016969A1 (zh) 一种数据处理方法及装置
CN112448987A (zh) 一种熔断降级的触发方法、系统和存储介质
Sharma et al. Dynamic network slicing using utility algorithms and stochastic optimization
US11595471B1 (en) Method and system for electing a master in a cloud based distributed system using a serverless framework
US11943284B2 (en) Overload protection for edge cluster using two tier reinforcement learning models
US20210234802A1 (en) Network system and network band control management method
US7212533B2 (en) Method of managing a telecommunication network and a network management unit for implementing the method
WO2024004102A1 (ja) キューに格納されている性能指標値データに基づく通信システムの状態判定
CN114268568B (zh) 一种网络流量监控方法、装置及设备
WO2024024106A1 (ja) ネットワーク負荷の予測開始タイミングの制御
WO2024004104A1 (ja) 通信システムに含まれる要素の適切なスケールアウトの実行

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination