CN108009016B - 一种资源负载均衡控制方法及集群调度器 - Google Patents

一种资源负载均衡控制方法及集群调度器 Download PDF

Info

Publication number
CN108009016B
CN108009016B CN201610933991.8A CN201610933991A CN108009016B CN 108009016 B CN108009016 B CN 108009016B CN 201610933991 A CN201610933991 A CN 201610933991A CN 108009016 B CN108009016 B CN 108009016B
Authority
CN
China
Prior art keywords
cluster
application
resource load
cluster node
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610933991.8A
Other languages
English (en)
Other versions
CN108009016A (zh
Inventor
杜树宝
金锡波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610933991.8A priority Critical patent/CN108009016B/zh
Priority to PCT/CN2017/092809 priority patent/WO2018076791A1/zh
Priority to EP17866109.6A priority patent/EP3525096B1/en
Publication of CN108009016A publication Critical patent/CN108009016A/zh
Priority to US16/397,674 priority patent/US10924535B2/en
Application granted granted Critical
Publication of CN108009016B publication Critical patent/CN108009016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1029Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5022Workload threshold

Abstract

本发明实施例公开了一种资源负载均衡控制方法及集群调度器。其中,该方法包括:预测每个所述集群节点上部署的应用在预设时间段内的性能数据;根据预测的每个所述集群节点的性能数据,计算所述集群系统的第一标准差;在所述集群系统的第一标准差大于预设阈值的情况下,根据资源负载均衡规则,确定应用迁移方案;将所述应用迁移方案发送给所述集群应用管理器,以触发所述集群应用管理器根据所述应用迁移方案对所述集群系统的资源负载进行均衡控制。实施本发明实施例可以提高迁移的有效性,同时,更准确地对集群系统的资源负载进行均衡控制。

Description

一种资源负载均衡控制方法及集群调度器
技术领域
本发明涉及通信技术领域,尤其涉及一种资源负载均衡控制方法及集群调度器。
背景技术
随着虚拟化、云计算的发展,云中心的使用日益广泛。云中心包括至少一个集群系统,每个集群系统包括集群调度器、集群应用管理器以及多个集群节点。集群调度器接收到应用部署请求后,可以将应用部署到不同的集群节点中。为了使资源(比如计算资源、存储资源以及网络资源)的使用更加均衡和合理,集群应用管理器需要监控每个集群节点的资源负载情况,以对集群系统的资源负载进行均衡控制。
目前,存在两种方式来对集群系统的资源负载进行均衡控制。第一种:依据历史数据使用情况进行判断,如VMWare DRS(Distributed Resource Scheduler,分布式资源调度器)根据历史记录中集群节点的资源使用情况来评估集群系统的标准差(也即资源负载均衡度),在集群系统的标准差大于设置的阈值的情况下,进行虚拟机的动态迁移。第二种:依据集群节点的历史性能数据以及结合集群节点的预测数据,判断是否需要对该集群节点进行虚拟机迁移。然而,上述两种方式中,第一种方式在某些情况下会产生无效的迁移,比如:在T1时刻集群节点的负载偏高,而在T1+1时刻集群节点的负载恢复到合理水平,这种情况下,不需要进行虚拟机迁移。第二种方式中集群节点作为虚拟机的载体,集群节点上部署的虚拟机是变化的,故集群节点的负载数据不具备规律性。因此,基于集群节点的负载数据进行预测是不正确的,可能会导致错误的决策。
可见,上述两种方式均无法准确地对集群系统的资源负载进行均衡控制。
发明内容
本发明实施例提供了一种资源负载均衡控制方法及集群调度器,可以提高迁移的有效性,同时,更准确地对集群系统的资源负载进行均衡控制。
本发明实施例第一方面公开了一种资源负载均衡控制方法,可以应用于集群系统包括的集群调度器,所述集群系统还包括集群应用管理器以及多个集群节点,所述集群应用管理器用于管理所述多个集群节点上部署的应用,所述方法包括:
预测每个集群节点上部署的应用在预设时间段内的性能数据,所述性能数据用于表征所述集群节点上部署的应用在所述预设时间段内的资源使用情况;根据预测的每个所述集群节点的性能数据,计算所述集群系统的第一标准差,所述第一标准差用于表征所述集群系统在所述预设时间段内的资源负载均衡度;在所述集群系统的第一标准差大于预设阈值的情况下,根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡。
在一些实现方式下,所述集群调度器将所述应用迁移方案发送给所述集群应用管理器,以触发所述集群应用管理器根据所述应用迁移方案对所述集群系统的资源负载进行均衡控制。在其他一些实现方式下,所述集群调度器和所述集群应用管理器也可以位于同一台物理设备上,或者上述方法也可以应用于所述集群应用管理器。
其中,所述应用迁移方案用于指示将第一集群节点上部署的第一应用迁移至第二集群节点,或者,所述应用迁移方案用于指示将第一集群节点上部署的第一应用与第二集群节点上部署的第二应用进行交换,所述第一集群节点、所述第二集群节点均为所述多个集群节点中的一个集群节点。
其中,集群节点上可以部署多个应用,每个应用可以占用不同类型的资源,比如:计算资源(如CPU、内存)、存储资源(如磁盘)以及网络资源(如网络带宽)。
其中,部署在集群节点上的应用稳定性强,应用运行有规律,此外,应用所占的资源也具有较强的规律性。本发明实施例中,以集群节点上的应用为对象,对应用的性能数据进行预测,这种方式的可预测性更强,预测的结果也更准确。集群调速器根据预测的结果来决策是否迁移,能够避免无效的迁移,提高迁移的有效性,此外,在确定应用需要迁移之后,集群调速器根据资源负载均衡规则,制定应用迁移方案,能够更准确地对集群系统的资源负载进行均衡控制。
在一种可能的实施方式中,所述方法还包括:
针对每个所述集群节点,使用所述集群节点上部署的应用的历史性能数据构造训练数据;使用所述训练数据进行训练,获得数据模型;所述预测每个所述集群节点上部署的应用在预设时间段内的性能数据包括:针对每个所述集群节点,确定所述集群节点上部署的多个应用;针对每个所述应用,构造以当前周期为基准的第一数量的应用的历史性能数据作为输入数据;将所述输入数据代入所述数据模型,以预测所述应用在预设时间段内的性能数据;将所述集群节点上预测的所有应用的性能数据相加,获得所述集群节点在所述预设时间段内的性能数据。
其中,模型训练可以采用离线训练或在线训练,训练一次即可。其中,集群节点的每个应用在每个周期有多种资源的性能数据,每种资源的性能数据都可以建立一个机器学习模型来预测该资源下个周期的数据。每种资源的历史性能数据可以看成一个时间序列{Xr(t),t=1,2,…T},下一周期的性能数据可以由前k个历史性能数据预测得出。
在一种可能的实施方式中,所述使用所述训练数据进行训练,获得数据模型包括:
根据支持向量机SVM算法,使用所述训练数据进行训练,获得数据模型;或,
根据线性回归算法,使用所述训练数据进行训练,获得数据模型。
其中,可以选择使用支持向量机(Support Vector Machine,SVM)算法来做回归,或者,可选的,可以使用线性回归(LinearRegression)算法来做预测。
在一种可能的实施方式中,所述预设时间段以周期为单位,在所述预设时间段为多个周期的情况下,所述根据预测的每个所述集群节点的性能数据,计算在所述预设时间段内所述集群节点的资源负载包括:
针对每个所述集群节点,根据预测的所述集群节点的性能数据,计算所述集群节点在每个所述周期内的资源负载;对所述集群节点的多个所述资源负载求平均,获得资源负载平均值;将所述资源负载平均值确定作为在所述多个周期内所述集群节点的资源负载。
在一种可能的实施方式中,所述根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡包括:
根据资源负载均衡规则,使用每个所述集群节点上部署的应用当前的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡;或,
根据资源负载均衡规则,使用每个所述集群节点上部署的应用在预设时间段内的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统在所述预设时间段内的资源负载均衡。
在该实施方式中,可以使用应用当前的性能数据来确定应用迁移方案,以使集群系统当前的资源负载均衡,或者,也可以使用应用在预设时间段内的性能数据来确定应用迁移方案,以使得集群系统在预设时间段内的资源负载均衡。
在一种可能的实施方式中,所述确定应用迁移方案包括:
从所述多个集群节点中选择资源负载最高的集群节点作为第一集群节点;遍历所述第一集群节点上的应用,以选择第一应用,其中,所述第一应用被模拟迁出后所述第一集群节点的资源负载与所述第一应用被模拟迁出前所述集群系统的平均资源负载的差值最小;遍历所述多个集群节点中除所述第一集群节点之外的集群节点,以选择第二集群节点,其中,所述第一应用被模拟迁移至所述第二集群节点后,所述集群系统的第二标准差最小、且所述集群系统的第二标准差小于所述预设阈值。生成用于指示将所述第一集群节点上部署的第一应用迁移至所述第二集群节点的应用迁移方案。
其中,可以使用应用当前的性能数据或应用在预设时间段内的性能数据来计算第一集群节点的资源负载、集群系统的平均资源负载以及集群系统的第二标准差。该可能的实施方式中的应用迁移方案可以称为单步迁移方案,可以快速地使集群系统达到资源负载均衡。
在一种可能的实施方式中,所述确定应用迁移方案包括:
根据每个所述集群节点的资源负载,对所有所述集群节点进行排序;将排序后的集群节点分成高负载集群节点和低负载集群节点;遍历所述高负载集群节点上部署的应用以及所述低负载集群节点上部署的应用,以将所述高负载集群节点上部署的应用与所述低负载集群节点上部署的应用进行交换;确定所述高负载集群节点中第一集群节点上部署的第一应用以及所述低负载集群节点中第二集群节点上部署的第二应用,其中,应用交换前的所述集群系统的第三标准差与应用交换后的所述集群系统的第四标准差的差值最大,且所述第三标准差大于所述第四标准差;生成用于指示将所述第一集群节点上部署的第一应用与所述第二集群节点上部署的第二应用进行交换的应用迁移方案。
其中,可以使用应用当前的性能数据或应用在预设时间段内的性能数据来计算每个集群节点的资源负载、集群系统的第三标准差以及集群系统的第四标准差。该可能的实施方式中的应用迁移方案可以称为交换迁移方案,可以快速地使集群系统达到资源负载均衡。其中,上述的单步迁移方案与该交换迁移方案可以互相补充,比如:在上述单步迁移方案中如果找不到待迁入应用的第二集群节点,可以采用交换迁移方案。
本发明实施例第二方面公开了一种集群调度器,该集群调度器包括用于执行本发明实施例第一方面任一方法的部分或全部步骤的功能单元。其中,该集群调度器执行第一方面任一方法的部分或全部步骤时可以提高迁移的有效性,同时,更准确地对集群系统的资源负载进行均衡控制。
本发明实施例第三方面公开了一种资源调度器,该资源调度器包括处理器、通信接口以及存储器,所述存储器被配置用于存储指令,所述处理器被配置用于运行所述指令,所述处理器运行所述指令以执行本发明实施例第一方面任一方法的部分或全部步骤。其中,该资源调度器执行第一方面任一方法的部分或全部步骤时可以提高迁移的有效性,同时,更准确地对集群系统的资源负载进行均衡控制。
本发明实施例第四方面公开了一种计算机存储介质,所述计算机存储介质存储有程序,所述程序具体包括用于执行本发明实施例第一方面任一方法的部分或全部步骤的指令。
在一些可能的实施方式中,所述方法还包括:
在检测到满足进行资源调度的预设条件的情况下,获取每个集群节点上部署的应用在历史时间段内的历史性能数据;根据所有集群节点在历史时间段内的历史性能数据,计算集群系统的第五标准差;在第五标准差大于预设阈值的情况下,确定集群系统的历史资源负载不均衡。具体的,根据所有集群节点在历史时间段内的历史性能数据,计算集群系统的第五标准差的方式可以为:根据集群节点在历史时间段内的历史性能数据,计算所述集群节点的历史资源负载;对所有集群节点的历史资源负载求平均,获得集群系统在历史时间段内的历史平均资源负载;根据每个集群节点的历史资源负载以及集群系统的历史平均资源负载,计算所述集群系统的第五标准差,其中,该第五标准差用于表征集群系统在历史时间段内的资源负载均衡度。其中,该进行资源调度的预设条件可以包括但不限于定时事件以及典型触发事件(比如新增集群、删除集群、部署应用、删除应用等)。集群调度器可以每隔一定周期触发资源调度,也可以当检测到上述典型触发事件时,触发资源调度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种集群系统的网络架构示意图;
图2是本发明实施例公开的一种资源负载均衡控制方法的流程示意图;
图2A是本发明实施例公开的一种应用迁移方案的示意图;
图2B是本发明实施例公开的另一种应用迁移方案的示意图;
图3是本发明实施例公开的一种集群调度器的结构示意图;
图4是本发明实施例公开的另一种集群调度器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。
1)标准差(Standard Deviation),系统内各个体的标准值与其平均数之差的平方的算术平均数的平方根。标准差反映系统内各个体间的离散程度。在概率统计中,常使用标准差作为统计分布程度(statistical dispersion)上的测量。
2)资源负载均衡:在特定的资源环境下,根据一定的资源使用规则,在不同的资源使用者之间进行资源调整,使得资源的使用更加均衡和合理,从而达到资源负载均衡的目的。其中,资源可以包括但不限于计算资源(如CPU、内存)、存储资源(如磁盘)以及网络资源(如网络带宽)。通常,可以使用标准差来衡量系统的资源负载均衡度。可以预先设定一个用于表征系统的资源负载均衡的临界值(即预设阈值),如果计算出的系统的标准差超过该预设阈值时,表明系统内个体间的离散程度比较大,比如:物理资源A的使用率远高于物理资源B的使用率,这种情况下,可以确定系统的资源负载不均衡,反之,如果计算出的系统的标准差未超过该预设阈值时,表明系统内个体间的离散程度比较小,可以确定系统的资源负载均衡。
3)集群系统当前的资源负载均衡:具体的,基于集群系统中每个集群节点上部署的应用当前的性能数据,计算该集群系统当前的标准差,如果计算出的集群系统当前的标准差小于预设阈值,则可以确定集群系统当前的资源负载均衡。
4)集群系统在所述预设时间段内的资源负载均衡:具体的,基于集群系统中每个集群节点上部署的应用在预设时间段内的性能数据,计算该集群系统在预设时间段内的标准差,如果计算出的集群系统在预设时间段内的标准差小于预设阈值,则可以确定集群系统在预设时间段内的资源负载均衡。需要说明的是,本发明实施例中所述的“集群系统在预设时间段内的资源负载均衡”是基于集群系统中每个集群节点上部署的应用在预设时间段内的性能数据确定的。
本发明实施例公开了一种资源负载均衡控制方法及集群调度器,可以提高迁移的有效性,同时,更准确地对集群系统的资源负载进行均衡控制。以下分别进行详细说明。
为了更好的理解本发明实施例,下面先对本发明实施例公开的一种集群系统的网络架构示意图进行描述。
请参阅图1,图1是本发明实施例公开的一种集群系统的网络架构示意图。如图1所示,该集群系统包括上层管理服务、集群管理插件、多个集群节点以及Macro-PaaSRegistry,其中,图1所示的网络架构可以实现平台即服务(Platform as a Serivce,PaaS)层上的管理服务对集群节点进行资源调度管理。
上层管理服务可以为PaaS层上的管理服务,具体的,该上层管理服务可以是一个进程或线程,该上层管理服务主要用于向集群管理插件下发应用部署请求以及资源调度请求。
集群管理插件由上层管理服务集成,主要由集群调度器和集群应用管理器组成,集群调度器和集群应用管理器可以为两个虚拟的应用程序模块。其中,集群调度器可以接收管理服务器发送的应用部署请求,响应该应用部署请求,确定应用部署的位置,即将应用部署在哪个集群节点上,同时,还可以监控每个集群节点的资源负载情况,确定应用迁移方案,以实现集群系统的资源负载均衡;集群应用管理器负责应用部署和应用迁移方案的执行。
集群节点可以是Kubernetes集群,每个集群节点上可以部署多个应用(比如应用1、应用2、应用3),一个Kubernetes集群是由PaaS层供给的一组资源组成,Kubernetes集群再把资源分配给Kubernetes集群上部署的应用。其中,该资源可以包括但不限于计算资源、存储资源以及网络资源。相对于基础设施即服务(Infrastructure as a Serivce,IaaS)来说,一个Kubernetes集群等价于提供CPU、内存、存储、网络资源的物理机。
Macro-PaaS Registry是基于数据库实现的注册表式的数据存储机制,主要用于存储集群节点上部署的应用的性能数据,该应用的性能数据用于表征应用的资源使用情况,比如:占用CPU 30核,内存10kB。其中,集群节点可以通过Kubernetes Heapster/cAdvisor等采集组件周期性采集应用的性能数据,并将该性能数据保存到Macro-PaaSRegistry中,集群调度器可以以应用的历史性能数据为依据进行计算以及预测下一个周期该应用的性能数据。
在图1所示的网络架构中,集群调度器可以预测每个集群节点上部署的应用在预设时间段内的性能数据,该性能数据用于表征集群节点上部署的应用在预设时间段内的资源使用情况;进一步地,集群调度器可以根据预测的每个集群节点的性能数据,计算集群系统的第一标准差,该第一标准差用于表征集群系统的资源负载均衡度;在集群系统的第一标准差大于预设阈值的情况下,集群调度器还可以根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡;更进一步地,集群调度器还可以将应用迁移方案发送给集群应用管理器,以触发集群应用管理器根据应用迁移方案对集群系统的资源负载进行均衡控制。
本发明中,通常,部署在集群节点上的应用稳定性强,运行有规律,应用所占的资源也具有规律性,比如:根据用户的使用习惯,应用在第一阶段(如10点-12点)被使用的时间较长,而在第二阶段(如12点-14点)被使用的时间较短,相应地,在第一阶段应用所占的资源比较多,而在第二阶段应用所占的资源比较少,在图1所示的网络架构中,以集群节点上的应用为对象,对应用的性能数据进行预测,这种方式的可预测性更强,预测的结果也更准确。集群调速器根据预测的结果来决策是否迁移,能够避免无效的迁移,提高迁移的有效性,此外,在确定需要迁移之后,集群调速器根据资源负载均衡规则,制定应用迁移方案,能够更准确地对集群系统的资源负载进行均衡控制。
需要说明的是,本发明实施例不限于图1所公开的一种集群系统的网络架构,本发明实施例所描述的方法还可以适用于其他涉及负载均衡的场景,例如:基础设施即服务(Infrastructure as a Serivce,IaaS)层的虚拟机调度、大数据集群的负载均衡等。
请参见图2,图2是本发明实施例公开的一种资源负载均衡控制方法的流程示意图。其中,该方法应用于集群系统包括的集群调度器,集群系统还包括集群应用管理器以及多个集群节点,集群应用管理器用于管理多个集群节点上部署的应用。如图2所示,该方法可以包括以下步骤。
201、集群调度器预测每个集群节点上部署的应用在预设时间段内的性能数据。
其中,该性能数据用于表征集群节点上部署的应用在预设时间段内的资源使用情况。在集群系统的历史资源负载不均衡的情况下,集群调度器可以预测每个集群节点上部署的应用在预设时间段内的性能数据;或者,在集群系统的历史资源负载均衡的情况下,集群调度器也可以预测每个集群节点上部署的应用在预设时间段内的性能数据。其中,该历史资源负载是指在当前时间之前的一段时间内的平均资源负载,该预设时间段内可以为一个周期,也可以为多个周期。
作为一种可选的实施方式,在步骤201之前,所述方法还包括以下步骤:
11)在检测到满足进行资源调度的预设条件的情况下,获取每个集群节点上部署的应用在历史时间段内的历史性能数据;
12)根据所有集群节点在历史时间段内的历史性能数据,计算集群系统的第五标准差;
13)在第五标准差大于预设阈值的情况下,确定集群系统的历史资源负载不均衡。
在该可选的实施方式中,该进行资源调度的预设条件可以包括但不限于定时事件以及典型触发事件(比如新增集群、删除集群、部署应用、删除应用等)。集群调度器可以每隔一定周期触发资源调度,也可以当检测到上述典型触发事件时,触发资源调度。
在检测到满足进行资源调度的预设条件的情况下,集群调度器可以获取每个集群节点上部署的应用在历史时间段内的历史性能数据,其中,该历史时间段内可以为用户设定的在当前周期之前的预设数量的周期,该历史性能数据用于表征每个集群节点上部署的应用在历史时间段内的资源使用情况,比如:应用1的计算资源使用情况、存储资源使用情况以及网络资源使用情况,应用2的的计算资源使用情况、存储资源使用情况以及网络资源使用情况等。其中,该历史时间段可以以周期为单位。
具体的,可以针对每个所述集群节点,根据集群节点在历史时间段内的历史性能数据,计算集群节点的历史资源负载,以及对所有集群节点的历史资源负载求平均,获得集群系统在历史时间段内的历史平均资源负载;进一步地,根据每个集群节点的历史资源负载以及集群系统的历史平均资源负载,计算集群系统的第五标准差。其中,该第五标准差用于表征集群系统在历史时间段内的资源负载均衡度,在第五标准差大于预设阈值的情况下,可以确定集群系统的历史资源负载不均衡。其中,该预设阈值可以为用户设定的,也可以为系统默认设定的,本发明实施例不做限定。
其中,标准差的计算公式如下:
Figure BDA0001138051390000111
x1,x2…xN为集群节点的资源负载,μ为集群系统的平均资源负载。
作为另一种可选的实施方式,所述方法还包括以下步骤:
21)针对每个集群节点,使用集群节点上部署的应用的历史性能数据构造训练数据;
22)使用训练数据进行训练,获得数据模型。
具体的,集群调度器预测每个所述集群节点上部署的应用在预设时间段内的性能数据的方式具体可以为:
31)针对每个集群节点,确定集群节点上部署的多个应用;
32)针对每个应用,构造以当前周期为基准的应用的历史性能数据作为输入数据;
33)将输入数据代入数据模型,以预测应用在预设时间段内的性能数据;
34)将集群节点上预测的所有应用的性能数据相加,获得集群节点在预设时间段内的性能数据。
其中,上述步骤22)的方式具体可以为:
根据支持向量机SVM算法,使用所述训练数据进行训练,获得数据模型;或,
根据线性回归算法,使用所述训练数据进行训练,获得数据模型。
在该可选的实施方式中,模型训练采用离线独立训练,训练一次即可。其中,集群节点的每个应用在每个周期有多种资源的性能数据,每种资源的性能数据都可以建立一个机器学习模型来预测该资源下个周期的数据。每种资源的历史性能数据可以看成一个时间序列{Xr(t),t=1,2,…T},下一周期的性能数据可以由前k个历史性能数据预测得出,预测模型的描述形式可以有2种,分别如下:
第一种预测模型可以描述为:
Figure BDA0001138051390000112
(1)式中:r为资源类型,比如:CPU、内存、磁盘以及网络带宽,
Figure BDA0001138051390000113
为非线性函数,k为嵌入维数。
由以上预测模型,根据历史性能数据的采集周期选择合适的参数k,依据历史性能数据构造T-k个数据集,作为模型训练的输入数据集(即训练数据)。其中,k可以为一个经验值,也可以通过训练获得。
请参见如下表1,表1是基于该预测模型的输入数据与输出数据之间的关系。
表1
输入数据 输出数据
X<sub>r</sub>(1),X<sub>r</sub>(2),...,X<sub>r</sub>(k) X<sub>r</sub>(k+1)
…… ……
X<sub>r</sub>(t-k),...,X<sub>r</sub>(t-2),X<sub>r</sub>(t-1) X<sub>r</sub>(t)
…… ……
X<sub>r</sub>(T-k),...,X<sub>r</sub>(T-2),X<sub>r</sub>(T-1) X<sub>r</sub>(T)
针对第一种预测模型,可以选择使用支持向量机(Support Vector Machine,SVM)算法来做回归,选取径向基核函数RBF作为SVM的核函数,其中,该RBF函数可以将样本非线性地规划到更高维的空间中,对于标签和属性间非线性的关系问题效果更好。SVM预测模型共有3个参数:不敏感损失函数的参数ε,惩罚参数C,RBF核函数参数γ。可以将输入数据集以3:1的比例划分为训练集和测试集。SVM参数的择优方法有很多,常用的有网格搜索双线性等方法,下面使用最简单排列组合来选取参数,步骤如下:
a)确定一个要训练ε,γ,C参数的取值范围,和每个参数的步长;
b)每个参数以步长为单位循环递增;
c)以ε,γ,C为参数,对训练集进行训练,得到数据模型;
d)以测试集数据作为为输入数据,通过数据模型预测出每条测试数据的预测值;
e)计算测试集的平均绝对百分比误差e,公式如下:
Figure BDA0001138051390000121
其中:Xi'为预测值,Xi为真实值,n为测试集大小。
循环执行步骤a)~e),直到参数超出取值范围。选取e最小的ε,γ,C值作为最优参数组合,将最优参数组合代入上述预设模型,就可以确定数据模型。
第二种预测模型可以描述为:
Figure BDA0001138051390000122
(2)式中:其中:
Figure BDA0001138051390000123
为线性函数,k为嵌入维数,r为资源类型,比如:计算资源、存储资源以及网络资源。
同样,可以由以上模型,根据历史性能数据的采集周期选择合适的参数k,依据历史数据构造T-k个数据集,作为模型训练的输入数据集(即训练数据)。具体可以参照上述表1。
与上述第一种预测模型不同的是,可以使用线性回归(LinearRegression)算法来做预测,线性回归模型比较简单,不需要训练参数。直接将训练集带入,就可以得到数据模型。
在确定数据模型之后,集群调度器就可以针对每个集群节点,确定集群节点上部署的多个应用,假设当前周期为t,可以针对每个应用,构造每种资源类型的历史性能数据{Xr(t-k),...,Xr(t-1),Xr(t)}作为输入数据,通过上述获得的数据模型预测出该资源下个周期的性能数据Xr(t+1)。依据预测出的每个应用每种资源的性能数据,可以计算每个集群节点的每种资源的下个周期的性能数据,公式如下:
Figure BDA0001138051390000131
式(3)中,p表示该集群节点中的应用个数,r为资源类型,t为当前周期。
202、集群调度器根据预测的每个集群节点的性能数据,计算集群系统的第一标准差。
具体的,可以根据预测的每个集群节点的性能数据,计算在预设时间段内集群节点的资源负载,以及计算在预设时间段内集群系统的平均资源负载;
根据每个集群节点的资源负载以及集群系统的平均资源负载,计算集群系统的第一标准差。
其中,可以通过如下公式计算集群节点的资源负载:
x=ω1×(D1/C)+ω2×(D2/M)+ω3×(D3/I) (4)
其中,D1、D2、D3分别为应用所占的各种类型的资源(比如计算资源、存储资源以及网络资源),C、M、I分别表示各种资源的总数,ω12,表示权重ω12=1。需要说明的是,上式(4)中只是示例性的表示三种类型的资源,此外,本领域技术人员可以理解,还可以包括比式(4)中更多或更少的资源类型。
进一步地,可以将上述计算获得的所有集群节点的资源负载求平均,获得集群系统的平均资源负载,并根据每个集群节点的资源负载以及集群系统的平均资源负载,计算集群系统的第一标准差,该第一标准差用于表征集群系统在预设时间段内的资源负载均衡度。
203、在集群系统的第一标准差大于预设阈值的情况下,集群调度器根据资源负载均衡规则,确定应用迁移方案,以使得应用迁移方案被执行后集群系统当前的资源负载均衡或集群系统在预设时间段内的资源负载均衡。
其中,集群系统的第一标准差大于预设阈值,表明集群系统在预设时间段内的资源负载不均衡,需要进行应用的迁移,即需要决策应用迁移方案。
作为一种可选的实施方式,集群调度器根据资源负载均衡规则,确定应用迁移方案,以使得应用迁移方案被执行后集群系统当前的资源负载均衡或集群系统在预设时间段内的资源负载均衡的方式具体可以为:
根据资源负载均衡规则,使用每个所述集群节点上部署的应用当前的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡;或,
根据资源负载均衡规则,使用每个所述集群节点上部署的应用在预设时间段内的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统在所述预设时间段内的资源负载均衡。
在该可选的实施方式中,可以使用应用当前的性能数据来确定应用迁移方案,以使集群系统当前的资源负载均衡,或者,也可以使用应用在预设时间段内的性能数据来确定应用迁移方案,以使得集群系统在预设时间段内的资源负载均衡。
其中,无论是使用应用当前的性能数据来确定应用迁移方案,还是使用应用在预设时间段内的性能数据来确定应用迁移方案,集群调度器确定应用迁移方案的方式可以有两种实现方式:
第一种实现方式具体包括以下步骤:
41)从多个集群节点中选择资源负载最高的集群节点作为第一集群节点;
42)遍历第一集群节点上的应用,以选择第一应用,其中,第一应用被模拟迁出后第一集群节点的资源负载与第一应用被模拟迁出前集群系统的平均资源负载的差值最小;
43)遍历多个集群节点中除第一集群节点之外的集群节点,以选择第二集群节点,其中,第一应用被模拟迁移至第二集群节点后,集群系统的第二标准差最小、且集群系统的第二标准差小于预设阈值。
44)生成用于指示将第一集群节点上部署的第一应用迁移至第二集群节点的应用迁移方案。
在该第一种实现方式中的应用迁移方案可以称为单步迁移方案,可以快速地使集群系统达到资源负载均衡。其中,可以使用应用当前的性能数据或应用在预设时间段内的性能数据来计算第一集群节点的资源负载、集群系统的平均资源负载以及集群系统的第二标准差。
请一并参见图2A,图2A是本发明实施例公开的一种应用迁移方案的示意图,其中,如图2A所示,集群系统包括5个集群节点(即集群节点1、集群节点2、集群节点3、集群节点4以及集群节点5),其中,集群节点1可以作为资源负载最高的集群节点,即第一集群节点,集群节点2、集群节点3、集群节点4以及集群节点5可以作为5个集群节点中除第一集群节点之外的集群节点。
在该第一种实现方式中,在确定第一集群节点之后,可以将第一集群节点上部署的应用(即应用1、应用2以及应用3)确定作为可迁出应用,进一步地,可以遍历应用1、应用2以及应用3,每次遍历时,可以计算应用被模拟迁出后第一集群节点的资源负载与应用被模拟迁出前集群系统的平均资源负载的差值,最终可以选择差值最小的应用作为第一应用(即待迁出的应用),举例来说,假设应用被模拟迁出前集群系统的平均资源负载为40%,应用1被迁出第一集群节点的资源负载降为55%,应用2被迁出第一集群节点的资源负载降为50%,应用3被迁出第一集群节点的资源负载降为45%,那么和模拟迁出前集群系统的平均资源负载的差值分别为15%,10%,5%,从而可以将应用3确定作为第一应用。
在确定第一应用为应用3之后,可以遍历集群节点2、集群节点3、集群节点4以及集群节点5,将应用3依次模拟迁移至集群节点2、集群节点3、集群节点4以及集群节点5中,每次模拟迁移后,可以计算集群系统的第二标准差,在遍历完所有的集群节点后,可以比较计算得到的多个第二标准差的大小,从中确定最小的第二标准差,以及确定该最小的第二标准差对应的集群节点为第二集群节点。进一步地,可以判断选择出的第二标准差是否小于预设阈值,若是,则可以生成用于指示将第一集群节点上部署的第一应用迁移至第二集群节点的应用迁移方案,若否,则表示该第一应用未找到最优的迁入集群节点,这种情况下,可以删除该第一应用,再重复执行上述42)~44)的步骤,直到确定应用迁移方案为止,或者,直到第一集群上的应用为空为止。
第二种实现方式具备包括以下步骤:
51)根据每个集群节点的资源负载,对所有集群节点进行排序;
52)将排序后的集群节点分成高负载集群节点和低负载集群节点;
53)遍历高负载集群节点上部署的应用以及低负载集群节点上部署的应用,以将高负载集群节点上部署的应用与低负载集群节点上部署的应用进行交换;
54)确定高负载集群节点中第一集群节点上部署的第一应用以及低负载集群节点中第二集群节点上部署的第二应用,其中,应用交换前的集群系统的第三标准差与应用交换后的集群系统的第四标准差的差值最大,且第三标准差大于第四标准差;
55)生成用于指示将第一集群节点上部署的第一应用与第二集群节点上部署的第二应用进行交换的应用迁移方案。
在该第二种实现方式中的应用迁移方案可以称为交换迁移方案,可以快速地找到使集群系统达到资源负载均衡的应用迁移方案。其中,上述的单步迁移方案与该交换迁移方案可以互相补充,比如:在上述单步迁移方案中如果找不到待迁入应用的第二集群节点,可以采用交换迁移方案。其中,可以使用应用当前的性能数据或应用在预设时间段内的性能数据来计算每个集群节点的资源负载、集群系统的第三标准差以及集群系统的第四标准差。
具体的,可以根据每个集群节点的资源负载从高到底或者从低到高的顺序,对所有集群节点进行排序;将排序后的集群节点分成高负载集群节点和低负载集群节点,其中,可选的,可以将排序后的集群节点均等化分成高负载集群节点和低负载集群节点,或者,可选的,可以设定一个负载阈值,将资源负载大于负载阈值的集群节点确定为高负载集群节点,以及将资源负载小于负载阈值的集群节点确定为低负载集群节点,其中,高负载集群节点和低负载集群节点均包括多个集群节点。进一步地,可以遍历高负载集群节点上部署的应用以及低负载集群节点上部署的应用,以将高负载集群节点上部署的应用与低负载集群节点上部署的应用进行交换,每次遍历交换时可以计算应用交换前的集群系统的第三标准差与应用交换后的集群系统的第四标准差,以及计算二者的差值,从所有的差值中选择差值最大,且第三标准差大于第四标准差的高负载集群节点中第一集群节点上部署的第一应用以及低负载集群节点中第二集群节点上部署的第二应用。这样就可以生成用于指示将所述第一集群节点上部署的第一应用与所述第二集群节点上部署的第二应用进行交换的应用迁移方案。
请一并参见图2B,图2B是本发明实施例公开的另一种应用迁移方案的示意图,其中,高负载集群节点包括多个集群节点(未示出),高负载集群节点上部署多个应用(比如应用1、应用2、应用3以及应用4),低负载集群节点包括多个集群节点(未示出),低负载集群节点上部署多个应用(比如应用5、应用6、应用7以及应用8)。可以遍历高负载集群节点上部署的应用以及低负载集群节点上部署的应用,将高负载集群节点上部署的应用与低负载集群节点上部署的应用进行交换。举例来说,将高负载集群节点上部署的应用1与低负载集群节点上部署的应用5、应用6、应用7以及应用8依次进行交换,将高负载集群节点上部署的应用2与低负载集群节点上部署的应用5、应用6、应用7以及应用8依次进行交换,将高负载集群节点上部署的应用3与低负载集群节点上部署的应用5、应用6、应用7以及应用8依次进行交换,将高负载集群节点上部署的应用4与低负载集群节点上部署的应用5、应用6、应用7以及应用8依次进行交换。每次交换时可以计算应用交换前的集群系统的第三标准差与应用交换后的集群系统的第四标准差,以及计算二者的差值,从所有的差值中选择差值最大,且第三标准差大于第四标准差的高负载集群节点中第一集群节点上部署的第一应用以及低负载集群节点中第二集群节点上部署的第二应用。
可见,上述两种实现方式均可以快速地找到使集群系统达到资源负载均衡的应用迁移方案。需要说明的是,上述两种实现方式可以互相补充,即当第一种实现方式失败的情况下,可以使用第二种实现方式。
作为另一种可选的实施方式,所述方法还可以包括以下步骤:
集群调度器将应用迁移方案发送给集群应用管理器,以触发集群应用管理器根据应用迁移方案对集群系统的资源负载进行均衡控制。
本发明实施例中,在确定应用迁移方案之后,集群调度器就可以将应用迁移方案发送给集群应用管理器,集群应用管理器接收到该应用迁移方案后,就可以根据应用迁移方案对集群系统的资源负载进行均衡控制。
可见,在图2所描述的方法流程中,部署在集群节点上的应用稳定性强,应用运行有规律,此外,应用所占的资源也具有较强的规律性。本发明实施例中,以集群节点上的应用为对象,对应用的性能数据进行预测,这种方式的可预测性更强,预测的结果也更准确。集群调速器根据预测的结果来决策是否迁移,能够避免无效的迁移,提高迁移的有效性,此外,在确定需要迁移之后,集群调速器根据资源负载均衡规则,制定应用迁移方案,能够更准确地对集群系统的资源负载进行均衡控制。
请参见图3,图3是本发明实施例公开的一种集群调度器的结构示意图。其中,该集群调度器300用于执行图2所描述方法的部分或全部步骤,具体请参见图2中的描述,在此不再赘述。如图3所示,该集群调度器300包括:
预测单元301,用于预测每个所述集群节点上部署的应用在预设时间段内的性能数据,所述性能数据用于表征所述集群节点上部署的应用在所述预设时间段内的资源使用情况;
计算单元302,用于根据预测的每个所述集群节点的性能数据,计算所述集群系统的第一标准差,所述第一标准差用于表征所述集群系统在所述预设时间段内的资源负载均衡度;
确定单元303,用于在所述集群系统的第一标准差大于预设阈值的情况下,根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡;
其中,所述应用迁移方案用于指示将第一集群节点上部署的第一应用迁移至第二集群节点,或者,所述应用迁移方案用于指示将第一集群节点上部署的第一应用与第二集群节点上部署的第二应用进行交换,所述第一集群节点、所述第二集群节点均为所述多个集群节点中的一个集群节点;
可选的,还可以将所述应用迁移方案发送给所述集群应用管理器,以触发所述集群应用管理器根据所述应用迁移方案对所述集群系统的资源负载进行均衡控制。
其中,可选的,所述确定单元303具体用于:
根据资源负载均衡规则,使用每个所述集群节点上部署的应用当前的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡;或,
根据资源负载均衡规则,使用每个所述集群节点上部署的应用在预设时间段内的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统在所述预设时间段内的资源负载均衡。
可选的,所述确定单元303确定应用迁移方案的方式具体为:
从所述多个集群节点中选择资源负载最高的集群节点作为第一集群节点;
遍历所述第一集群节点上的应用,以选择第一应用,其中,所述第一应用被模拟迁出后所述第一集群节点的资源负载与所述第一应用被模拟迁出前所述集群系统的平均资源负载的差值最小;
遍历所述多个集群节点中除所述第一集群节点之外的集群节点,以选择第二集群节点,其中,所述第一应用被模拟迁移至所述第二集群节点后,所述集群系统的第二标准差最小、且所述集群系统的第二标准差小于所述预设阈值。
生成用于指示将所述第一集群节点上部署的第一应用迁移至所述第二集群节点的应用迁移方案。
可选的,所述确定单元303确定应用迁移方案的方式具体为:
根据每个所述集群节点的资源负载,对所有所述集群节点进行排序;
将排序后的集群节点分成高负载集群节点和低负载集群节点;
遍历所述高负载集群节点上部署的应用以及所述低负载集群节点上部署的应用,以将所述高负载集群节点上部署的应用与所述低负载集群节点上部署的应用进行交换;
确定所述高负载集群节点中第一集群节点上部署的第一应用以及所述低负载集群节点中第二集群节点上部署的第二应用,其中,应用交换前的所述集群系统的第三标准差与应用交换后的所述集群系统的第四标准差的差值最大,且所述第三标准差大于所述第四标准差;
生成用于指示将所述第一集群节点上部署的第一应用与所述第二集群节点上部署的第二应用进行交换的应用迁移方案。
作为一种可选的实施方式,图3所示的集群调度器300还可以包括:
构造单元304,用于针对每个所述集群节点,使用所述集群节点上部署的应用的历史性能数据构造训练数据;
训练单元305,用于使用所述训练数据进行训练,获得数据模型;
所述预测单元301具体用于:
针对每个所述集群节点,确定所述集群节点上部署的多个应用;
针对每个所述应用,构造以当前周期为基准的第一数量的应用的历史性能数据作为输入数据;
将所述输入数据代入所述数据模型,以预测所述应用在预设时间段内的性能数据;
将所述集群节点上预测的所有应用的性能数据相加,获得所述集群节点在所述预设时间段内的性能数据。
其中,训练单元305使用所述训练数据进行训练,获得数据模型的方式具体为:
根据支持向量机SVM算法,使用所述训练数据进行训练,获得数据模型;或,
根据线性回归算法,使用所述训练数据进行训练,获得数据模型。
可选的,所述预设时间段以周期为单位,在所述预设时间段为多个周期的情况下,所述计算单元302具体用于:
针对每个所述集群节点,根据预测的所述集群节点的性能数据,计算所述集群节点在每个所述周期内的资源负载;
对所述集群节点的多个所述资源负载求平均,获得资源负载平均值;
将所述资源负载平均值确定作为在所述多个周期内所述集群节点的资源负载。
在图3所描述的集群调度器300中,部署在集群节点上的应用稳定性强,应用运行有规律,此外,应用所占的资源也具有较强的规律性。本发明实施例中,以集群节点上的应用为对象,对应用的性能数据进行预测,这种方式的可预测性更强,预测的结果也更准确。集群调速器根据预测的结果来决策是否迁移,能够避免无效的迁移,提高迁移的有效性,此外,在确定需要迁移之后,集群调速器根据资源负载均衡规则,制定应用迁移方案,能够更准确地对集群系统的资源负载进行均衡控制。
需要说明的是,上述图3中所描述的单元可以集成在一个进程或一个线程上。此外,在一种实现方式下,上述图3所描述的单元中,预测单元301、计算单元302、确定单元303、构造单元304以及训练单元305可以由图4中的处理器401实现。
请参见图4,图4是本发明实施例公开的另一种集群调度器的结构示意图。其中,该集群调度器400用于执行图2所描述方法的部分或全部步骤,具体请参见图2中的描述,在此不再赘述。如图4所示,该集群调度器400可以包括:至少一个处理器401,例如CPU,至少一个通信接口402,存储器403等组件。其中,这些组件可以通过一条或多条通信总线404进行通信连接。本领域技术人员可以理解,图4中示出的集群调度器400的结构并不构成对本发明实施例的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
本发明实施例中,存储器403可以是高速RAM存储器,也可以是非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。存储器403可选的还可以是至少一个位于远离前述处理器401的存储装置。
在图4所示的集群调度器400中,处理器401可以用于调用存储器403中存储的应用程序以执行以下操作:
预测每个所述集群节点上部署的应用在预设时间段内的性能数据,所述性能数据用于表征所述集群节点上部署的应用在所述预设时间段内的资源使用情况;
根据预测的每个所述集群节点的性能数据,计算所述集群系统的第一标准差,所述第一标准差用于表征所述集群系统在所述预设时间段内的资源负载均衡度;
在所述集群系统的第一标准差大于预设阈值的情况下,根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡。
其中,所述应用迁移方案用于指示将第一集群节点上部署的第一应用迁移至第二集群节点,或者,所述应用迁移方案用于指示将第一集群节点上部署的第一应用与第二集群节点上部署的第二应用进行交换,所述第一集群节点、所述第二集群节点均为所述多个集群节点中的一个集群节点。
可选的,所述处理器401还可以用于调用存储器403中存储的应用程序以执行以下操作:
通过所述通信接口402将所述应用迁移方案发送给所述集群应用管理器,以触发所述集群应用管理器根据所述应用迁移方案对所述集群系统的资源负载进行均衡控制。
可选的,所述处理器401还可以用于调用存储器403中存储的应用程序以执行以下操作:
针对每个所述集群节点,使用所述集群节点上部署的应用的历史性能数据构造训练数据;
使用所述训练数据进行训练,获得数据模型;
所述处理器401预测每个所述集群节点上部署的应用在预设时间段内的性能数据包括:
针对每个所述集群节点,确定所述集群节点上部署的多个应用;
针对每个所述应用,构造以当前周期为基准的第一数量的应用的历史性能数据作为输入数据;
将所述输入数据代入所述数据模型,以预测所述应用在预设时间段内的性能数据;
将所述集群节点上预测的所有应用的性能数据相加,获得所述集群节点在所述预设时间段内的性能数据。
其中,所述处理器401使用所述训练数据进行训练,获得数据模型的方式具体为:
根据支持向量机SVM算法,使用所述训练数据进行训练,获得数据模型;或,
根据线性回归算法,使用所述训练数据进行训练,获得数据模型。
可选的,在所述预设时间段为多个周期的情况下,所述处理器401根据预测的每个所述集群节点的性能数据,计算在所述预设时间段内所述集群节点的资源负载包括:
针对每个所述集群节点,根据预测的所述集群节点的性能数据,计算所述集群节点在每个所述周期内的资源负载;
对所述集群节点的多个所述资源负载求平均,获得资源负载平均值;
将所述资源负载平均值确定作为在所述多个周期内所述集群节点的资源负载。
可选的,所述处理器401根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡包括:
根据资源负载均衡规则,使用每个所述集群节点上部署的应用当前的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡;或,
根据资源负载均衡规则,使用每个所述集群节点上部署的应用在预设时间段内的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统在所述预设时间段内的资源负载均衡。
可选的,所述处理器401确定应用迁移方案包括:
从所述多个集群节点中选择资源负载最高的集群节点作为第一集群节点;
遍历所述第一集群节点上的应用,以选择第一应用,其中,所述第一应用被模拟迁出后所述第一集群节点的资源负载与所述第一应用被模拟迁出前所述集群系统的平均资源负载的差值最小;
遍历所述多个集群节点中除所述第一集群节点之外的集群节点,以选择第二集群节点,其中,所述第一应用被模拟迁移至所述第二集群节点后,所述集群系统的第二标准差最小、且所述集群系统的第二标准差小于所述预设阈值。
生成用于指示将所述第一集群节点上部署的第一应用迁移至所述第二集群节点的应用迁移方案。
可选的,所述处理器401确定应用迁移方案包括:
根据每个所述集群节点的资源负载,对所有所述集群节点进行排序;
将排序后的集群节点分成高负载集群节点和低负载集群节点;
遍历所述高负载集群节点上部署的应用以及所述低负载集群节点上部署的应用,以将所述高负载集群节点上部署的应用与所述低负载集群节点上部署的应用进行交换;
确定所述高负载集群节点中第一集群节点上部署的第一应用以及所述低负载集群节点中第二集群节点上部署的第二应用,其中,应用交换前的所述集群系统的第三标准差与应用交换后的所述集群系统的第四标准差的差值最大,且所述第三标准差大于所述第四标准差;
生成用于指示将所述第一集群节点上部署的第一应用与所述第二集群节点上部署的第二应用进行交换的应用迁移方案。
在图4所描述的集群调度器400中,部署在集群节点上的应用稳定性强,应用运行时有规律,此外,应用所占的资源也具有较强的规律性。本发明实施例中,以集群节点上的应用为对象,对应用的性能数据进行预测,这种方式的可预测性更强,预测的结果也更准确。集群调速器根据预测的结果来决策是否迁移,能够避免无效的迁移,提高迁移的有效性,此外,在确定需要迁移之后,集群调速器根据资源负载均衡规则,制定应用迁移方案,能够更准确地对集群系统的资源负载进行均衡控制。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种资源负载均衡控制方法,其特征在于,包括:
预测每个集群节点上部署的应用在预设时间段内的性能数据,所述性能数据用于表征所述集群节点上部署的应用在所述预设时间段内的资源使用情况;
根据预测的每个所述集群节点的性能数据,计算所述集群系统的第一标准差,所述第一标准差用于表征所述集群系统在所述预设时间段内的资源负载均衡度;
在所述集群系统的第一标准差大于预设阈值的情况下,根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡,
其中,所述确定应用迁移方案包括:
从多个集群节点中选择资源负载最高的集群节点作为第一集群节点;
遍历所述第一集群节点上的应用,以选择第一应用,其中,所述第一应用被模拟迁出后所述第一集群节点的资源负载与所述第一应用被模拟迁出前所述集群系统的平均资源负载的差值最小;
遍历所述多个集群节点中除所述第一集群节点之外的集群节点,以选择第二集群节点,其中,所述第一应用被模拟迁移至所述第二集群节点后,所述集群系统的第二标准差最小、且所述集群系统的第二标准差小于所述预设阈值;
生成用于指示将所述第一集群节点上部署的第一应用迁移至所述第二集群节点的应用迁移方案;
或者,所述确定应用迁移方案包括:
根据每个所述集群节点的资源负载,对所有所述集群节点进行排序;
将排序后的集群节点分成高负载集群节点和低负载集群节点;
遍历所述高负载集群节点上部署的应用以及所述低负载集群节点上部署的应用,以将所述高负载集群节点上部署的应用与所述低负载集群节点上部署的应用进行交换;
确定所述高负载集群节点中第一集群节点上部署的第一应用以及所述低负载集群节点中第二集群节点上部署的第二应用,其中,应用交换前的所述集群系统的第三标准差与应用交换后的所述集群系统的第四标准差的差值最大,且所述第三标准差大于所述第四标准差;
生成用于指示将所述第一集群节点上部署的第一应用与所述第二集群节点上部署的第二应用进行交换的应用迁移方案。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对每个所述集群节点,使用所述集群节点上部署的应用的历史性能数据构造训练数据;
使用所述训练数据进行训练,获得数据模型;
所述预测每个集群节点上部署的应用在预设时间段内的性能数据包括:
针对每个所述集群节点,确定所述集群节点上部署的多个应用;
针对每个所述应用,构造以当前周期为基准的应用的历史性能数据作为输入数据;
将所述输入数据代入所述数据模型,以预测所述应用在预设时间段内的性能数据;
将所述集群节点上预测的所有应用的性能数据相加,获得所述集群节点在所述预设时间段内的性能数据。
3.根据权利要求2所述的方法,其特征在于,所述使用所述训练数据进行训练,获得数据模型包括:
根据支持向量机SVM算法,使用所述训练数据进行训练,获得数据模型;或,
根据线性回归算法,使用所述训练数据进行训练,获得数据模型。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述预设时间段以周期为单位,在所述预设时间段为多个周期的情况下,所述根据预测的每个所述集群节点的性能数据,计算在所述预设时间段内所述集群节点的资源负载包括:
针对每个所述集群节点,根据预测的所述集群节点的性能数据,计算所述集群节点在每个所述周期内的资源负载;
对所述集群节点的多个所述资源负载求平均,获得资源负载平均值;
将所述资源负载平均值确定作为在所述多个周期内所述集群节点的资源负载。
5.根据权利要求1~3任一项所述的方法,其特征在于,所述根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡包括:
根据资源负载均衡规则,使用每个所述集群节点上部署的应用当前的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡;或,
根据资源负载均衡规则,使用每个所述集群节点上部署的应用在预设时间段内的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统在所述预设时间段内的资源负载均衡。
6.一种集群调度器,其特征在于,包括:
预测单元,用于预测每个集群节点上部署的应用在预设时间段内的性能数据,所述性能数据用于表征所述集群节点上部署的应用在所述预设时间段内的资源使用情况;
计算单元,用于根据预测的每个所述集群节点的性能数据,计算所述集群系统的第一标准差,所述第一标准差用于表征所述集群系统在所述预设时间段内的资源负载均衡度;
确定单元,用于在所述集群系统的第一标准差大于预设阈值的情况下,根据资源负载均衡规则,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡或所述集群系统在所述预设时间段内的资源负载均衡;
其中,所述确定单元确定应用迁移方案的方式具体为:
从多个集群节点中选择资源负载最高的集群节点作为第一集群节点;
遍历所述第一集群节点上的应用,以选择第一应用,其中,所述第一应用被模拟迁出后所述第一集群节点的资源负载与所述第一应用被模拟迁出前所述集群系统的平均资源负载的差值最小;
遍历所述多个集群节点中除所述第一集群节点之外的集群节点,以选择第二集群节点,其中,所述第一应用被模拟迁移至所述第二集群节点后,所述集群系统的第二标准差最小、且所述集群系统的第二标准差小于所述预设阈值;
生成用于指示将所述第一集群节点上部署的第一应用迁移至所述第二集群节点的应用迁移方案;
或者,所述确定单元确定应用迁移方案的方式具体为:
根据每个所述集群节点的资源负载,对所有所述集群节点进行排序;
将排序后的集群节点分成高负载集群节点和低负载集群节点;
遍历所述高负载集群节点上部署的应用以及所述低负载集群节点上部署的应用,以将所述高负载集群节点上部署的应用与所述低负载集群节点上部署的应用进行交换;
确定所述高负载集群节点中第一集群节点上部署的第一应用以及所述低负载集群节点中第二集群节点上部署的第二应用,其中,应用交换前的所述集群系统的第三标准差与应用交换后的所述集群系统的第四标准差的差值最大,且所述第三标准差大于所述第四标准差;
生成用于指示将所述第一集群节点上部署的第一应用与所述第二集群节点上部署的第二应用进行交换的应用迁移方案。
7.根据权利要求6所述的集群调度器,其特征在于,所述集群调度器还包括:
构造单元,用于针对每个所述集群节点,使用所述集群节点上部署的应用的历史性能数据构造训练数据;
训练单元,用于使用所述训练数据进行训练,获得数据模型;
所述预测单元具体用于:
针对每个所述集群节点,确定所述集群节点上部署的多个应用;
针对每个所述应用,构造以当前周期为基准的第一数量的应用的历史性能数据作为输入数据;
将所述输入数据代入所述数据模型,以预测所述应用在预设时间段内的性能数据;
将所述集群节点上预测的所有应用的性能数据相加,获得所述集群节点在所述预设时间段内的性能数据。
8.根据权利要求7所述的集群调度器,其特征在于,所述训练单元使用所述训练数据进行训练,获得数据模型的方式具体为:
根据支持向量机SVM算法,使用所述训练数据进行训练,获得数据模型;或,
根据线性回归算法,使用所述训练数据进行训练,获得数据模型。
9.根据权利要求6~8任一项所述的集群调度器,其特征在于,所述预设时间段以周期为单位,在所述预设时间段为多个周期的情况下,所述计算单元具体用于:
针对每个所述集群节点,根据预测的所述集群节点的性能数据,计算所述集群节点在每个所述周期内的资源负载;
对所述集群节点的多个所述资源负载求平均,获得资源负载平均值;
将所述资源负载平均值确定作为在所述多个周期内所述集群节点的资源负载。
10.根据权利要求6~8任一项所述的集群调度器,其特征在于,所述确定单元具体用于:
根据资源负载均衡规则,使用每个所述集群节点上部署的应用当前的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统当前的资源负载均衡;或,
根据资源负载均衡规则,使用每个所述集群节点上部署的应用在预设时间段内的性能数据,确定应用迁移方案,以使得所述应用迁移方案被执行后所述集群系统在所述预设时间段内的资源负载均衡。
CN201610933991.8A 2016-10-31 2016-10-31 一种资源负载均衡控制方法及集群调度器 Active CN108009016B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201610933991.8A CN108009016B (zh) 2016-10-31 2016-10-31 一种资源负载均衡控制方法及集群调度器
PCT/CN2017/092809 WO2018076791A1 (zh) 2016-10-31 2017-07-13 一种资源负载均衡控制方法及集群调度器
EP17866109.6A EP3525096B1 (en) 2016-10-31 2017-07-13 Resource load balancing control method and cluster scheduler
US16/397,674 US10924535B2 (en) 2016-10-31 2019-04-29 Resource load balancing control method and cluster scheduler

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610933991.8A CN108009016B (zh) 2016-10-31 2016-10-31 一种资源负载均衡控制方法及集群调度器

Publications (2)

Publication Number Publication Date
CN108009016A CN108009016A (zh) 2018-05-08
CN108009016B true CN108009016B (zh) 2021-10-22

Family

ID=62024355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610933991.8A Active CN108009016B (zh) 2016-10-31 2016-10-31 一种资源负载均衡控制方法及集群调度器

Country Status (4)

Country Link
US (1) US10924535B2 (zh)
EP (1) EP3525096B1 (zh)
CN (1) CN108009016B (zh)
WO (1) WO2018076791A1 (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710540B (zh) * 2018-05-23 2021-05-04 深信服科技股份有限公司 一种分布式集群中的资源调度方法、装置及设备
CN108848157A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种Kubernetes集群容器监控的方法和装置
CN108762912A (zh) * 2018-07-04 2018-11-06 郑州云海信息技术有限公司 一种容器集群弹性伸缩的方法和装置
CN110888733B (zh) * 2018-09-11 2023-12-26 三六零科技集团有限公司 集群资源使用情况处理方法、装置及电子设备
CN109284871A (zh) * 2018-09-30 2019-01-29 北京金山云网络技术有限公司 资源调整方法、装置和云平台
CN110971646A (zh) * 2018-09-30 2020-04-07 浙江大学 一种集群控制装置、系统及方法
US11159446B2 (en) * 2018-10-30 2021-10-26 Red Hat, Inc. Cloud resource management using externally-sourced data
US11567809B2 (en) * 2018-10-31 2023-01-31 International Business Machines Corporation Accelerating large-scale image distribution
CN109492774B (zh) * 2018-11-06 2021-10-26 北京工业大学 一种基于深度学习的云资源调度方法
CN109710376A (zh) * 2018-12-12 2019-05-03 中国联合网络通信集团有限公司 容器集群管理系统的动态调度方法和装置
CN109451056A (zh) * 2018-12-20 2019-03-08 中国软件与技术服务股份有限公司 多集群间服务器动态分配方法及系统
CN109885397B (zh) * 2019-01-15 2023-04-07 长安大学 一种边缘计算环境中时延优化的负载任务迁移算法
CN109947567B (zh) * 2019-03-14 2021-07-20 深圳先进技术研究院 一种多智能体强化学习调度方法、系统及电子设备
CN110008199B (zh) * 2019-03-25 2023-02-14 华南理工大学 一种基于访问热度的数据迁移部署方法
CN110191159B (zh) * 2019-05-09 2021-05-25 网宿科技股份有限公司 一种资源服务器的负载调节方法及系统、设备
CN110213358A (zh) * 2019-05-23 2019-09-06 深圳壹账通智能科技有限公司 集群资源调度的方法、节点、设备及存储介质
CN110347503B (zh) * 2019-06-27 2021-07-30 杭州数梦工场科技有限公司 资源重调度方法及装置
CN110597682B (zh) * 2019-07-18 2022-07-12 平安科技(深圳)有限公司 一种应用部署方法、装置、计算机设备及存储介质
CN110928836A (zh) * 2019-10-18 2020-03-27 苏州浪潮智能科技有限公司 一种基于hdfs的数据均衡优化方法、系统终端及存储介质
CN111046091B (zh) * 2019-10-24 2023-12-08 杭州数梦工场科技有限公司 数据交换系统的运行方法、装置及设备
CN112748853B (zh) * 2019-10-30 2024-04-16 伊姆西Ip控股有限责任公司 用于管理盘的方法、设备和计算机可读介质
CN112751896A (zh) * 2019-10-31 2021-05-04 中国电信股份有限公司 资源部署方法、资源部署装置以及存储介质
WO2021111516A1 (ja) * 2019-12-03 2021-06-10 日本電信電話株式会社 通信管理装置及び通信管理方法
CN111045820B (zh) * 2019-12-03 2024-02-09 浩鲸云计算科技股份有限公司 一种基于时序预测的容器调度方法
CN110933701B (zh) * 2019-12-12 2022-07-26 新华三大数据技术有限公司 网络负载状态检测方法及装置
CN113051067B (zh) * 2019-12-27 2022-12-02 顺丰科技有限公司 资源分配方法、装置、计算机设备和存储介质
CN113051025A (zh) * 2019-12-27 2021-06-29 阿里巴巴集团控股有限公司 容器集群资源管理方法、装置与设备
CN111431740B (zh) * 2020-03-16 2023-07-14 深信服科技股份有限公司 数据的传输方法、装置、设备及计算机可读存储介质
CN111694636B (zh) * 2020-05-11 2022-08-23 国网江苏省电力有限公司南京供电分公司 一种面向边缘网络负载均衡的电力物联网容器迁移方法
CN111611228B (zh) * 2020-05-27 2024-03-08 北京明略昭辉科技有限公司 一种基于分布式数据库的负载均衡调整方法及装置
JP2021192159A (ja) * 2020-06-05 2021-12-16 富士通株式会社 資源調整装置、資源調整プログラム、及び資源調整方法
CN111970326B (zh) * 2020-07-22 2023-06-09 深圳市欢太科技有限公司 集群流量平衡方法、装置、存储介质及终端
CN111913670B (zh) * 2020-08-07 2024-04-02 北京百度网讯科技有限公司 负载均衡的处理方法、装置、电子设备及存储介质
CN111897865A (zh) * 2020-08-13 2020-11-06 工银科技有限公司 一种etl工作负载的动态调整方法及装置
CN112118314B (zh) * 2020-09-18 2023-05-05 北京百度网讯科技有限公司 负载均衡方法和装置
CN112565399B (zh) * 2020-12-02 2022-12-09 天翼电子商务有限公司 一种在线学习的自适应流量负载均衡方法
CN112860403B (zh) * 2021-02-22 2023-11-07 中国联合网络通信集团有限公司 集群负载资源调度方法、装置、设备、介质及产品
TWI773196B (zh) * 2021-03-16 2022-08-01 和碩聯合科技股份有限公司 分配運算資源的方法和使用所述方法的電子裝置
CN113010270A (zh) * 2021-04-08 2021-06-22 桂林电子科技大学 基于Kubernetes平台资源动态负载均衡调度方法及系统
CN113093682B (zh) * 2021-04-09 2022-07-05 天津商业大学 一种非集中递归式动态负载均衡计算系统
CN115309538A (zh) * 2021-05-08 2022-11-08 戴尔产品有限公司 存储资源之间的基于多指标的工作负荷平衡
US11469944B1 (en) 2021-06-14 2022-10-11 Oracle International Corporation Techniques for migrating worker nodes to a new manager instance
CN113364878B (zh) * 2021-06-17 2022-11-29 北京百度网讯科技有限公司 数据调度方法及其装置、电子设备以及存储介质
US20220407816A1 (en) * 2021-06-21 2022-12-22 International Business Machines Corporation Service-to-service scheduling in container orchestrators
CN113608876B (zh) * 2021-08-12 2024-03-29 中国科学技术大学 基于负载类型感知的分布式文件系统元数据负载均衡方法
CN115774615A (zh) * 2021-09-08 2023-03-10 中兴通讯股份有限公司 资源调度方法、装置、计算机设备和可读介质
US20230092253A1 (en) * 2021-09-17 2023-03-23 International Business Machines Corporation Interpolating performance data
US11797410B2 (en) * 2021-11-15 2023-10-24 Advanced Micro Devices, Inc. Chiplet-level performance information for configuring chiplets in a processor
CN114979154B (zh) * 2022-06-06 2023-10-03 北京月新时代科技股份有限公司 一种负载均衡方法及系统
CN115543577B (zh) * 2022-08-08 2023-08-04 广东技术师范大学 基于协变量的Kubernetes资源调度优化方法、存储介质及设备
CN115686381B (zh) * 2022-12-29 2023-03-14 苏州浪潮智能科技有限公司 存储集群运行状态的预测方法及装置
CN117707742A (zh) * 2024-02-05 2024-03-15 山东省计算中心(国家超级计算济南中心) 基于负载预测的能耗均衡作业调度方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102469023A (zh) * 2010-11-19 2012-05-23 中国移动通信集团公司 基于云计算的调度方法、单元及系统
CN102571986A (zh) * 2012-02-27 2012-07-11 浙江大学 一种基于向量映射的负载均衡方法
CN102694868A (zh) * 2012-06-07 2012-09-26 浪潮电子信息产业股份有限公司 一种集群系统实现及任务动态分配方法
CN103984588A (zh) * 2014-02-21 2014-08-13 中国科学院计算技术研究所 一种基于温度的虚拟机迁移方法及其系统
CN104850450A (zh) * 2015-05-14 2015-08-19 华中科技大学 一种面向混合云应用的负载均衡方法及系统
CN106020934A (zh) * 2016-05-24 2016-10-12 浪潮电子信息产业股份有限公司 一种基于虚拟集群在线迁移的优化部署方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8813048B2 (en) * 2009-05-11 2014-08-19 Accenture Global Services Limited Single code set applications executing in a multiple platform system
CN102866915B (zh) * 2012-08-21 2015-08-26 华为技术有限公司 虚拟化集群整合方法、装置及虚拟化集群系统
US20140173623A1 (en) * 2012-12-17 2014-06-19 Mediatek Inc. Method for controlling task migration of task in heterogeneous multi-core system based on dynamic migration threshold and related computer readable medium
CN103218261A (zh) 2013-03-12 2013-07-24 浙江大学 一种基于性能预测的虚拟机动态迁移方法
US10318882B2 (en) * 2014-09-11 2019-06-11 Amazon Technologies, Inc. Optimized training of linear machine learning models
CN105320559B (zh) * 2014-07-30 2019-02-19 中国移动通信集团广东有限公司 一种云计算系统的调度方法和装置
CN104317658B (zh) * 2014-10-17 2018-06-12 华中科技大学 一种基于MapReduce的负载自适应任务调度方法
CN104834569B (zh) * 2015-05-11 2018-01-16 北京京东尚科信息技术有限公司 一种基于应用类型的集群资源调度方法及系统
CN105607948A (zh) * 2015-12-18 2016-05-25 国云科技股份有限公司 一种基于sla的虚拟机迁移预测方法
US10382535B2 (en) * 2016-10-05 2019-08-13 Vmware, Inc. Pairwise comparison for load balancing

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102469023A (zh) * 2010-11-19 2012-05-23 中国移动通信集团公司 基于云计算的调度方法、单元及系统
CN102571986A (zh) * 2012-02-27 2012-07-11 浙江大学 一种基于向量映射的负载均衡方法
CN102694868A (zh) * 2012-06-07 2012-09-26 浪潮电子信息产业股份有限公司 一种集群系统实现及任务动态分配方法
CN103984588A (zh) * 2014-02-21 2014-08-13 中国科学院计算技术研究所 一种基于温度的虚拟机迁移方法及其系统
CN104850450A (zh) * 2015-05-14 2015-08-19 华中科技大学 一种面向混合云应用的负载均衡方法及系统
CN106020934A (zh) * 2016-05-24 2016-10-12 浪潮电子信息产业股份有限公司 一种基于虚拟集群在线迁移的优化部署方法

Also Published As

Publication number Publication date
EP3525096B1 (en) 2020-11-04
EP3525096A4 (en) 2019-08-28
WO2018076791A1 (zh) 2018-05-03
CN108009016A (zh) 2018-05-08
US20190253490A1 (en) 2019-08-15
US10924535B2 (en) 2021-02-16
EP3525096A1 (en) 2019-08-14

Similar Documents

Publication Publication Date Title
CN108009016B (zh) 一种资源负载均衡控制方法及集群调度器
US20200287961A1 (en) Balancing resources in distributed computing environments
CN106326002B (zh) 资源调度方法、装置及设备
CN112685170B (zh) 备份策略的动态优化
CN112153700A (zh) 一种网络切片资源管理方法及设备
CN113168569A (zh) 去中心化分布式深度学习
CN104123189A (zh) 一种基于IaaS层应用感知的Web多层应用动态资源调整方法
CN106326000A (zh) 一种云计算系统中的资源调度方法及装置
US11055139B2 (en) Smart accelerator allocation and reclamation for deep learning jobs in a computing cluster
WO2016040699A1 (en) Computing instance launch time
Riahi et al. A multi-objective decision support framework for virtual machine placement in cloud data centers: a real case study
CN111143039B (zh) 一种虚拟机的调度方法、装置及计算机存储介质
CN114896068A (zh) 资源分配方法、资源分配装置、电子设备及存储介质
Manikandan et al. Virtualized load balancer for hybrid cloud using genetic algorithm
CN112000460A (zh) 一种基于改进贝叶斯算法的服务扩缩容的方法及相关设备
CN111061618B (zh) 云平台仿真系统、云平台性能测试方法和计算机设备
CN112819258A (zh) 银行网点到店客户数量预测方法及装置
US20160342899A1 (en) Collaborative filtering in directed graph
JP2017091001A (ja) 仮想インスタンス配置位置決定装置、仮想インスタンス配置位置決定方法および仮想インスタンス配置位置決定プログラム
Tan et al. Heavy-traffic analysis of cloud provisioning
De Grande et al. Measuring communication delay for dynamic balancing strategies of distributed virtual simulations
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质
Zhanikeev Optimizing virtual machine migration for energy-efficient clouds
JP2014206805A (ja) 制御装置
JP2021105772A (ja) リソース利用量の予測管理システム、リソース利用量の予測管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant