CN107483643A - 一种基于云平台的自动管理节点负载的方法 - Google Patents

一种基于云平台的自动管理节点负载的方法 Download PDF

Info

Publication number
CN107483643A
CN107483643A CN201710878066.4A CN201710878066A CN107483643A CN 107483643 A CN107483643 A CN 107483643A CN 201710878066 A CN201710878066 A CN 201710878066A CN 107483643 A CN107483643 A CN 107483643A
Authority
CN
China
Prior art keywords
node
management
management node
calculate
calculate node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710878066.4A
Other languages
English (en)
Inventor
汪深海
陈海钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen God Cloud Technology Co Ltd
Original Assignee
Shenzhen God Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen God Cloud Technology Co Ltd filed Critical Shenzhen God Cloud Technology Co Ltd
Priority to CN201710878066.4A priority Critical patent/CN107483643A/zh
Publication of CN107483643A publication Critical patent/CN107483643A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers

Abstract

本发明提供一种基于云平台的自动管理节点负载的方法,所述云平台包括由多个所述管理节点形成的管理节点集群,每个所述管理节点均对应管理一个由计算节点集合而成的计算节点集群,通过本发明,当某个管理节点出现故障而无法通讯时,其他管理节点能把该管理节点对应的计算节点重新分配,从而保证云平台的正常运作;其次,当增加、删除计算节点时,管理节点之间自动重新分配计算节点,保证管理节点的负载平衡。

Description

一种基于云平台的自动管理节点负载的方法
技术领域
本发明涉及云计算领域,特别是一种云平台自动管理节点负载的方法。
背景技术
在大规模的云平台上,一般都会采用多个管理节点,让每个管理节点管理一部分的计算节点,这样可以分摊管理节点的负载。但是,这种方式会使得管理节点与计算节点的对应关系固定,云平台并不会自动重新分配管理节点。在这种情况下,当批量增加或者删除节点时,会形成管理节点负载不平衡的现象,即部分管理节点对应的计算节点数量多、部分管理节点对应的计算节点数量少。
因此亟需一种能够动态调整管理节点与计算节点的对应关系,自动平衡管理节点的负载的方法。
发明内容
为了解决上述问题,本发明提供了一种云平台中自动管理节点负载的方法,该方法包括:
所述云平台包括由多个所述管理节点形成的管理节点集群,每个所述管理节点均对应管理一个由计算节点集合而成的计算节点集群,
当云平台管理系统检测到所述管理节点集群或所述计算节点集群发生变动时,将所述管理节点集群中所拥有的计算节点数量最小的管理节点选为主管理节点;所述主管理节点向各所述管理节点获取各自的计算节点列表,将计算节点进行重新分配从而得出当前的管理节点与计算节点的映射关系表;
所述主管理节点将所述映射关系表发送到各所述管理节点,各所述管理节点根据所述关系表得出属于自身的新计算节点列表,再根据新计算节点列表对其管理的计算节点集群进行处理。
进一步,所述主管理节点向各所述管理节点获取各自的计算节点列表,将计算节点进行重新分配从而得出当前的管理节点与计算节点的映射关系表包括:
根据各管理节点各自所拥有的计算节点的数量进行排序;
将尚未分配的计算节点优先分配给排序小的管理节点;
计算各管理节点所拥有的计算节点数量的平均值,其中,若某一管理节点所拥有的计算节点数量超过该平均值,则将超出该平均值的计算节点分配给排序小的管理节点,使得每一管理节点所拥有的计算节点数量在‘平均值—1’到
‘平均值+1’的范围内;
将各管理节点与各自所拥有的计算节点的对应关系形成映射关系表。
进一步,所述管理节点根据新计算节点列表对其管理的计算节点集群进行处理包括:
若某个计算节点在新的列表中不存在,则不作处理;
若某个计算节点在旧的列表中不存在,在新的列表中存在,则表示管理该计算节点的管理节点已变更,此时将管理节点已变更的消息通知该所述计算节点,计算节点接收到消息后,在内存中将原来的管理节点设为旧管理节点并记录新管理节点。
进一步,检测所述管理节点集群或所述计算节点集群发生变动包括:
所述云平台管理系统定期查询云平台中各管理节点,通过检测各管理节点是否及时反馈消息包来检测所述管理节点集群或所述计算节点集群是否发生变动。
本发明的优点在于,当某个管理节点出现故障而无法通讯时,其他管理节点能把该管理节点对应的计算节点重新分配,从而保证云平台的正常运作;其次,当增加、删除计算节点时,管理节点之间自动重新分配计算节点,保证管理节点的负载平衡。
附图说明
图1为本发明流程图。
具体实施方式
如图1所示,本发明提供一种基于云平台的自动管理节点负载的方法,其中,云平台包括由多个管理节点形成的管理节点集群,每个管理节点均对应管理一个由计算节点集合而成的计算节点集群,包括:
S101:选主管理节点,具体为,当云平台管理系统检测到所述管理节点集群或所述计算节点集群发生变动时,将所述管理节点集群中所拥有的计算节点数量最小的管理节点选为主管理节点;
S102:计算映射关系表,具体为,所述主管理节点向各所述管理节点获取各自的计算节点列表,将计算节点进行重新分配从而得出当前的管理节点与计算节点的映射关系表;
S103:根据新计算节点列表对其管理的计算节点集群进行处理,即:所述主管理节点将所述映射关系表发送到各所述管理节点,各所述管理节点根据所述关系表得出属于自身的新计算节点列表,再根据新计算节点列表对其管理的计算节点集群进行处理。
步骤S101中,云平台管理系统会定期查询云平台中各管理节点,通过检测各管理节点是否及时反馈消息包来检测所述管理节点集群或所述计算节点集群是否发生变动。当管理系统收到集群内其他节点的消息包时,说明节点运行正常;若连续多次(例如3次)超过一定时间(例如10秒)没有收到某一个节点的消息包,则认为该节点出现问题,此时集群需要重新进行负载平衡。
步骤S102中,根据各管理节点各自所拥有的计算节点的数量进行排序;
将尚未分配的计算节点优先分配给排序小的管理节点;
计算各管理节点所拥有的计算节点数量的平均值,其中,若某一管理节点所拥有的计算节点数量超过该平均值,则将超出该平均值的计算节点分配给排序小的管理节点,使得每一管理节点所拥有的计算节点数量在‘平均值—1’到‘平均值+1’的范围内;
将各管理节点与各自所拥有的计算节点的对应关系形成映射关系表。
下面,通过如下的例子来说明映射关系表的计算过程:
(1)当前关系:
管理节点A 管理节点B 管理节点C 管理节点D 未分配
计算节点数 10 2 4 9 5
(2)根据管理节点所拥有的计算节点的数量进行排序(从小到大)
例子 管理节点B 管理节点C 管理节点D 管理节点A 未分配
计算节点数 2 4 9 10 5
(3)将尚未分配的计算节点优先分配给排序小的管理节点
例子 管理节点B 管理节点C 管理节点D 管理节点A 未分配
计算节点数 5 6 9 10 0
(4)计算平均数,并将管理节点所拥有的计算节点数量分摊(以平均数上下加1为限)
平均数=(5+6+9+10)/4=7.5约等于8,上下限即为7到9
例子 管理节点B 管理节点C 管理节点D 管理节点A 未分配
计算节点数 7 7 9 7 0
在这个映射表的计算过程中,会影响到原来管理节点与计算节点关系的只有步骤(4)。在步骤(4)的例子中,由于A拥有的计算节点数量最多(10个) 且超出了上限,所以优先从A里面抽出计算节点分配给B和C,结果是D的映射关系没有发生变动,所以这样能够尽可能降低变动。
步骤S103中,管理节点根据接收到的新的映射关系,得出属于该管理节点的新的计算节点列表,并与旧的计算节点列表进行比较。其中,映射关系表的每一列即为每个管理节点的计算节点列表。比较结果有三种:某个计算节点没有变更,不作处理;某个计算节点在新的列表中不存在(即删除),不作处理;某个计算节点在旧的列表中不存在、在新的列表中存在(即新增),则通知这个新的计算节点,告诉它进行消息通讯的管理节点已变更。计算节点接收到消息后,在内存中将原来的管理节点设为旧管理节点,记录新管理节点。原来还在执行的任务,操作结果还是会汇报给旧管理节点;新的任务,或者之后的汇报信息(包括虚拟机状态、监控信息等)则会与新管理节点交互;当某个管理节点接收到需要转发给计算节点的任务时,若计算节点不属于该管理节点,则根据映射关系表,将任务转发给相应的管理节点。
通过本发明,当某个管理节点出现故障而无法通讯时,其他管理节点能把该管理节点对应的计算节点重新分配,从而保证云平台的正常运作;其次,当增加、删除计算节点时,管理节点之间自动重新分配计算节点,保证管理节点的负载平衡。

Claims (4)

1.一种基于云平台的自动管理节点负载的方法,所述云平台包括由多个所述管理节点形成的管理节点集群,每个所述管理节点均对应管理一个由计算节点集合而成的计算节点集群,其特征在于,所述方法包括:
当云平台管理系统检测到管理节点集群或计算节点集群发生变动时,将所述管理节点集群中所拥有的计算节点数量最小的管理节点选为主管理节点;
所述主管理节点向各所述管理节点获取各自的计算节点列表,将计算节点进行重新分配从而得出当前的管理节点与计算节点的映射关系表;
所述主管理节点将所述映射关系表发送到各所述管理节点,各所述管理节点根据所述关系表得出属于自身的新计算节点列表,再根据新计算节点列表对其管理的计算节点集群进行处理。
2.如权利要求1所述的基于云平台的自动管理节点负载的方法,其特征在于,所述主管理节点向各所述管理节点获取各自的计算节点列表,将计算节点进行重新分配从而得出当前的管理节点与计算节点的映射关系表包括:
根据各管理节点各自所拥有的计算节点的数量进行排序;
将尚未分配的计算节点优先分配给排序小的管理节点;
计算各管理节点所拥有的计算节点数量的平均值,其中,若某一管理节点所拥有的计算节点数量超过该平均值,则将超出该平均值的计算节点分配给排序小的管理节点使得每一管理节点所拥有的计算节点数量在‘平均值—1’到‘平均值+1’的范围内;
将各管理节点与各自所拥有的计算节点的对应关系形成映射关系表。
3.如权利要求1所述的基于云平台的自动管理节点负载的方法,其特征在于,所述管理节点根据新计算节点列表对其管理的计算节点集群进行处理包括:
若某个计算节点在新的列表中不存在,则不作处理;
若某个计算节点在旧的列表中不存在,在新的列表中存在,则表示管理该计算节点的管理节点已变更,此时将管理节点已变更的消息通知该所述计算节点,计算节点接收到消息后,在内存中将原来的管理节点设为旧管理节点并记录新管理节点。
4.如权利要求1所述的基于云平台的自动管理节点负载的方法,其特征在于,检测所述管理节点集群或所述计算节点集群发生变动包括:
所述云平台管理系统定期查询云平台中各管理节点,通过检测各管理节点是否及时反馈消息包来检测所述管理节点集群或所述计算节点集群是否发生变动。
CN201710878066.4A 2017-09-26 2017-09-26 一种基于云平台的自动管理节点负载的方法 Pending CN107483643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710878066.4A CN107483643A (zh) 2017-09-26 2017-09-26 一种基于云平台的自动管理节点负载的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710878066.4A CN107483643A (zh) 2017-09-26 2017-09-26 一种基于云平台的自动管理节点负载的方法

Publications (1)

Publication Number Publication Date
CN107483643A true CN107483643A (zh) 2017-12-15

Family

ID=60585901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710878066.4A Pending CN107483643A (zh) 2017-09-26 2017-09-26 一种基于云平台的自动管理节点负载的方法

Country Status (1)

Country Link
CN (1) CN107483643A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111756833A (zh) * 2020-06-22 2020-10-09 北京字节跳动网络技术有限公司 节点处理方法、装置、电子设备及计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103036800A (zh) * 2012-12-14 2013-04-10 北京高森明晨信息科技有限公司 虚拟机负载均衡系统、节点及方法
US20150227318A1 (en) * 2014-02-13 2015-08-13 Netapp, Inc. Distributed control protocol for high availability in multi-node storage cluster
CN104902444A (zh) * 2014-03-04 2015-09-09 普天信息技术有限公司 一种集群系统的动态重组方法及系统
CN104935482A (zh) * 2015-06-26 2015-09-23 曙光信息产业(北京)有限公司 分布式监控系统及方法
CN106610870A (zh) * 2016-12-28 2017-05-03 北京奇艺世纪科技有限公司 一种处理节点数量调整方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103036800A (zh) * 2012-12-14 2013-04-10 北京高森明晨信息科技有限公司 虚拟机负载均衡系统、节点及方法
US20150227318A1 (en) * 2014-02-13 2015-08-13 Netapp, Inc. Distributed control protocol for high availability in multi-node storage cluster
CN104902444A (zh) * 2014-03-04 2015-09-09 普天信息技术有限公司 一种集群系统的动态重组方法及系统
CN104935482A (zh) * 2015-06-26 2015-09-23 曙光信息产业(北京)有限公司 分布式监控系统及方法
CN106610870A (zh) * 2016-12-28 2017-05-03 北京奇艺世纪科技有限公司 一种处理节点数量调整方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111756833A (zh) * 2020-06-22 2020-10-09 北京字节跳动网络技术有限公司 节点处理方法、装置、电子设备及计算机可读介质
CN111756833B (zh) * 2020-06-22 2023-04-28 抖音视界有限公司 节点处理方法、装置、电子设备及计算机可读介质

Similar Documents

Publication Publication Date Title
CN105007312A (zh) 一种云计算服务器自适应负载均衡控制方法及控制系统
CN108768877B (zh) 一种突发流量的分配方法、装置及代理服务器
WO2019100921A1 (zh) 消息推送方法及装置
CN106789362A (zh) 一种设备管理方法及网管系统
CN108322345A (zh) 一种故障修复数据包的发布方法及服务器
CN109104377B (zh) 长连接负载均衡方法、设备、系统及计算机可读存储介质
CN106294073B (zh) 服务调用方法及装置
CN108989352B (zh) 防火墙实现方法、装置、计算机设备及存储介质
CN104243337A (zh) 一种跨集群负载均衡的方法及装置
US10425273B2 (en) Data processing system and data processing method
US20130346513A1 (en) Migrating a chat message service provided by a chat server to a new chat server
CN106775953A (zh) 实现OpenStack高可用的方法与系统
US20170214598A1 (en) Test device, network system, and test method
CN105450716A (zh) 动态业务分发方法及系统
CN105447110A (zh) 一种数据库集群批量快速加载数据的方法及加载系统
CN105592551A (zh) 一种信道分配方法及装置
CN104410511B (zh) 一种服务器管理方法及系统
CN108737543B (zh) 一种分布式物联网中间件及工作方法
CN107483643A (zh) 一种基于云平台的自动管理节点负载的方法
CN112671813A (zh) 服务器确定方法、装置、设备及存储介质
CN112612631B (zh) 一种消息队列堆积检测方法以及相关装置
CN111262783B (zh) 一种动态路由的方法及装置
CN102845023B (zh) 用于在宽带接入网中登记传输容量的装置和方法
CN106776034A (zh) 一种任务批处理计算方法、主站计算机及系统
CN112532467B (zh) 用于实现故障检测的方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171215