CN113472849B - 一种节点的管理方法、系统、设备以及介质 - Google Patents

一种节点的管理方法、系统、设备以及介质 Download PDF

Info

Publication number
CN113472849B
CN113472849B CN202110599104.9A CN202110599104A CN113472849B CN 113472849 B CN113472849 B CN 113472849B CN 202110599104 A CN202110599104 A CN 202110599104A CN 113472849 B CN113472849 B CN 113472849B
Authority
CN
China
Prior art keywords
active agents
node
working state
agent node
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110599104.9A
Other languages
English (en)
Other versions
CN113472849A (zh
Inventor
贾金刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Jinan data Technology Co ltd
Original Assignee
Inspur Jinan data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Jinan data Technology Co ltd filed Critical Inspur Jinan data Technology Co ltd
Priority to CN202110599104.9A priority Critical patent/CN113472849B/zh
Publication of CN113472849A publication Critical patent/CN113472849A/zh
Application granted granted Critical
Publication of CN113472849B publication Critical patent/CN113472849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种节点的管理方法,包括以下步骤:获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;响应于创建新的代理节点,根据新的代理节点的资源创建第三数量的主动代理;将第一数量和第三数量相加后乘以比例系数得到在创建新的代理节点后应当处于工作状态的主动代理的第四数量;将第四数量减去第二数量得到的值作为新的代理节点中应当处于工作状态的主动代理的第五数量,以进行管理。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案使得服务器管理平台更好地部署在服务网格。

Description

一种节点的管理方法、系统、设备以及介质
技术领域
本发明涉及集群管理领域,具体涉及一种节点的管理方法、系统、设备以及存储介质。
背景技术
对于服务器管理平台来说,普通的单体架构开发周期长,维护和升级的过程复杂且易出错。并且在对节点进行管理时,无法具有很高的横向扩展能力和灵活性,例如当需要安装部署新的型号的普通节点的时候,无法快速实现对该节点的管理,并且需要整个服务器管理平台重启,不仅影响服务器管理平台本身和原有的代理节点,升级不平滑,对客户不友好。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种节点的管理方法,包括以下步骤:
获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
在一些实施例中,还包括:
将所述新的代理节点中剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
创建多个代理节点;
根据每一个所述代理节点的硬件资源创建对应数量的主动代理;
利用每一个所述代理节点上的若干个主动代理分别对相应的待管理节点进行管理。
在一些实施例中,还包括:
将每一个所述代理节点上剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
处于工作状态的代理节点每隔预设时间段向数据库中更新时间戳。
在一些实施例中,还包括:
响应于检测到若干个代理节点的时间戳超时未更新,判定发生异常;
将处于空闲状态的主动代理转化为工作状态并对相应的待管理节点继续进行管理。
在一些实施例中,还包括:
所述当前每一个代理节点中的每一个处于工作状态的主动代理生成一个预设范围内的随机数;
将生成的随机数小于阈值的所述第五数量的主动代理转化为空闲状态。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种节点的管理系统,包括:
获取模块,配置为获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
统计模块,配置为统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
创建模块,配置为响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
计算模块,配置为将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
确定模块,配置为将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如上所述的任一种节点的管理方法的步骤。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种节点的管理方法的步骤。
本发明具有以下有益技术效果之一:本发明提出的方案采用有统一的标准接口的主动代理,可以独立地开发且独立地部署运行,并且主动代理独立于服务器管理平台而自主运行,一个主动代理只负责监控一个普通节点,而主动代理之间通过约定好的算法相互协调,这样通过主动代理共同保证管理活动持续地正常进行,进而可以使得服务器管理平台更好地部署在服务网格,让服务器管理平台具有很高的横向扩展能力和灵活性,更容易开发和维护,而且使得服务器管理平台具有高可用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明的实施例提供的节点的管理方法的流程示意图;
图2为本发明的实施例提供的主动代理与服务器管理平台的通信架构示意图;
图3为本发明的实施例提供的节点的管理系统的结构示意图;
图4为本发明的实施例提供的计算机设备的结构示意图;
图5为本发明的实施例提供的计算机可读存储介质的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
根据本发明的一个方面,本发明的实施例提出一种节点的管理方法,如图1所示,其可以包括步骤:
S1,获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
S2,统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
S3,响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
S4,将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
S5,将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
本发明提出的方案可以使得服务器管理平台更好地部署在服务网格,让服务器管理平台具有很高的横向扩展能力和灵活性,更容易开发和维护,而且使得服务器管理平台具有高可用性。
在一些实施例中,还包括:
将所述新的代理节点中剩余的主动代理标记为空闲状态。
具体的,代理节点上的主动代理个数与代理节点的计算能力(即资源多少)大致成正相关关系,代理节点的计算能力越高、可以承载的负荷符合越高,那么部署的到其中的主动代理个数也就越多。为了系统的高可用性,每个代理节点都部署一定数量的空闲节点,使得当有主动代理变为异常状态的时候,空闲节点可以接替其管理活动。
在一些实施例中,当有新的代理节点创建后,可以通过原有的代理节点的主动代理个数以及处于工作状态的主动代理的个数确定新加进来的代理节点的处于工作状态的主动代理的个数。例如,原有的代理节点个数为n,其中的主动代理个数为分别为P1、P2、……、Pn,工作状态的主动代理个数分别为A1、A2、……、An,新部署的代理节点中的主动代理个数为Pn+1。
考虑到每一个代理节点的资源不同,因此为了保持负载均衡,新部署的代理节点中的工作状态的主动代理个数An+1可以是:
Figure BDA0003092152220000051
即利用所有处于工作状态的主动代理的第二数量
Figure BDA0003092152220000061
除以所有主动代理的第一数量
Figure BDA0003092152220000062
得到比例系数,然后利用新的代理节点中创建的主动代理的第三数量加上第二数量(即
Figure BDA0003092152220000063
)后乘以该比例系数得到应当处于工作状态的主动代理的第四数量,利用第四数量减去第二数量,即可得到新的代理节点中处于工作状态的主动代理的数量。
在一些实施例中,还包括:
创建多个代理节点;
根据每一个所述代理节点的硬件资源创建对应数量的主动代理;
利用每一个所述代理节点上的若干个主动代理分别对相应的待管理节点进行管理。
具体的,每一个代理节点中的每一个主动代理都是一个服务器管理平台的独立组件,可以不依赖服务器管理平台而独立活动。一个主动代理是一个自主运行的独立实体,可以是一个进程、线程或者协程等等。一个主动代理只负责管理一个普通节点。这里把需要被管理的服务器节点称为普通节点,而把主动代理所在的服务器节点称为代理节点。
在一些实施例中,如图2所示,每一个主动代理均有统一的指令接口,以将服务器管理平台发来的指令转化为自己所知的协议的指令,这个协议可以是SNMP、IPMI或者Redfish等等。一个主动代理只会负责自己所知道的普通节点型号,并且服务器管理平台只通过主动代理来管理普通节点,不直接和普通节点通信。
这样,由于主动代理有统一的标准接口,可以独立地开发且独立地部署运行。这种架构方法具有很高的横向扩展能力和灵活性,当需要安装部署新的型号的普通节点的时候,开发人员只需要编写新的主动代理,然后部署启动即可;服务器管理平台本身和原有的代理节点都不受影响,不需要升级也不需要重启,因此整个服务器管理平台没有宕机时间,升级非常平滑,对客户非常友好。
在一些实施例中,还包括:
将每一个所述代理节点上剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
处于工作状态的代理节点每隔预设时间段向数据库中更新时间戳。
在一些实施例中,还包括:
响应于检测到若干个代理节点的时间戳超时未更新,判定发生异常;
将处于空闲状态的主动代理转化为工作状态并对相应的待管理节点继续进行管理。
具体的,可以将普通节点的IP、型号、以及所对应的主动代理等信息放在ETCD数据库中。利用该数据库进行主动代理状态的标记以及状态的监控。ETCD数据库是高可用的分布式key-value存储系统,可以用于配置共享和服务的注册和发现。ETCD数据库具有以下特点:完全复制,集群中的每个节点都可以使用完整的存档;高可用性,Etcd可用于避免硬件的单点故障或网络问题;一致性,每次读取都会返回跨多主机的最新写入;简单,包括一个定义良好、面向用户的API(gRPC);快速,每秒10000次写入的基准速度;可靠,使用Raft算法实现强一致性、高可用服务存储目录。
在一些实施例中,可以将正在执行管理任务的主动代理标记为工作状态,并且每隔一段时间更新ETCD中的时间戳,代表自己仍在正常活动。当ETCD中的时间戳在一定的时间内不再被更新,就代表主动代理发生了异常情况比如代理节点断电了等等,那么对应的主动代理就进入了异常状态。ETCD有租约(lease)机制,生存时间(TTL),也可以实现类似的功能,可以明确哪些主动代理的状态为正常、哪些主动代理的状态为异常。
当一些主动代理的状态转化为异常的时候,处于空闲状态的主动代理把自己的信息写入ETCD,继续中断了的管理活动。这个过程可以是抢占式的、也可以是协调式的。
在一些实施例中,还包括:
所述当前每一个代理节点中的每一个处于工作状态的主动代理生成一个预设范围内的随机数;
将生成的随机数小于阈值的所述第五数量的主动代理转化为空闲状态。
具体的,当加入新的代理节点的时候,可以选择原有的代理节点上的一些主动代理,停止其管理活动。这样可以使得各个代理节点的管理负荷尽量一致。可选地,部分原有的主动代理自动停止管理活动转化为空闲状态,并把自己的管理状态信息从ETCD中删除;而新的主动代理接替这些管理活动,转化为工作状态;这样的策略可以均衡代理节点的负载,让新加入的代理节点更快地加入管理工作。
在一些实施例中,可以使原有的每个主动代理生成一个在[0,1)范围的随机数R,当R小于一定值的时候,那么这个主动代理标记为即将退出;在被标记为即将退出的主动代理之中随机选择An+1个(即新创建的代理节点的处于工作状态的主动代理的数量),然后将其状态从正常转化为空闲。
本发明提出的方案采用有统一的标准接口的主动代理,可以独立地开发且独立地部署运行,并且主动代理独立于服务器管理平台而自主运行,一个主动代理只负责监控一个普通节点,而主动代理之间通过约定好的算法相互协调,这样通过主动代理共同保证管理活动持续地正常进行,进而可以使得服务器管理平台更好地部署在服务网格,让服务器管理平台具有很高的横向扩展能力和灵活性,更容易开发和维护,而且使得服务器管理平台具有高可用性。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种节点的管理系统400,如图3所示,包括:
获取模块401,获取模块401配置为获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
统计模块402,统计模块402配置为统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
创建模块403,创建模块403配置为响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
计算模块404,计算模块404配置为将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
确定模块405,确定模块405配置为将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
在一些实施例中,还包括标记模块,配置为:
将所述新的代理节点中剩余的主动代理标记为空闲状态。
在一些实施例中,还包括初始化模块,配置为:
创建多个代理节点;
根据每一个所述代理节点的硬件资源创建对应数量的主动代理;
利用每一个所述代理节点上的若干个主动代理分别对相应的待管理节点进行管理。
在一些实施例中,所述标记模块还配置为:
将每一个所述代理节点上剩余的主动代理标记为空闲状态。
在一些实施例中,还包括数据库模块,配置为:
处于工作状态的代理节点每隔预设时间段向数据库中更新时间戳。
在一些实施例中,数据库模块还配置为:
响应于检测到若干个代理节点的时间戳超时未更新,判定发生异常;
将处于空闲状态的主动代理转化为工作状态并对相应的待管理节点继续进行管理。
在一些实施例中,随机数模块,配置为:
所述当前每一个代理节点中的每一个处于工作状态的主动代理生成一个预设范围内的随机数;
将生成的随机数小于阈值的所述第五数量的主动代理转化为空闲状态。
本发明提出的方案采用有统一的标准接口的主动代理,可以独立地开发且独立地部署运行,并且主动代理独立于服务器管理平台而自主运行,一个主动代理只负责监控一个普通节点,而主动代理之间通过约定好的算法相互协调,这样通过主动代理共同保证管理活动持续地正常进行,进而可以使得服务器管理平台更好地部署在服务网格,让服务器管理平台具有很高的横向扩展能力和灵活性,更容易开发和维护,而且使得服务器管理平台具有高可用性。
基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机设备501,包括:
至少一个处理器520;以及
存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行以下步骤:
S1,获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
S2,统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
S3,响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
S4,将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
S5,将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
在一些实施例中,还包括:
将所述新的代理节点中剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
创建多个代理节点;
根据每一个所述代理节点的硬件资源创建对应数量的主动代理;
利用每一个所述代理节点上的若干个主动代理分别对相应的待管理节点进行管理。
在一些实施例中,还包括:
将每一个所述代理节点上剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
处于工作状态的代理节点每隔预设时间段向数据库中更新时间戳。
在一些实施例中,还包括:
响应于检测到若干个代理节点的时间戳超时未更新,判定发生异常;
将处于空闲状态的主动代理转化为工作状态并对相应的待管理节点继续进行管理。
在一些实施例中,还包括:
所述当前每一个代理节点中的每一个处于工作状态的主动代理生成一个预设范围内的随机数;
将生成的随机数小于阈值的所述第五数量的主动代理转化为空闲状态。
本发明提出的方案采用有统一的标准接口的主动代理,可以独立地开发且独立地部署运行,并且主动代理独立于服务器管理平台而自主运行,一个主动代理只负责监控一个普通节点,而主动代理之间通过约定好的算法相互协调,这样通过主动代理共同保证管理活动持续地正常进行,进而可以使得服务器管理平台更好地部署在服务网格,让服务器管理平台具有很高的横向扩展能力和灵活性,更容易开发和维护,而且使得服务器管理平台具有高可用性。
基于同一发明构思,根据本发明的另一个方面,如图5所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序指令610,计算机程序指令610被处理器执行时执行以下步骤:
S1,获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
S2,统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
S3,响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
S4,将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
S5,将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
在一些实施例中,还包括:
将所述新的代理节点中剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
创建多个代理节点;
根据每一个所述代理节点的硬件资源创建对应数量的主动代理;
利用每一个所述代理节点上的若干个主动代理分别对相应的待管理节点进行管理。
在一些实施例中,还包括:
将每一个所述代理节点上剩余的主动代理标记为空闲状态。
在一些实施例中,还包括:
处于工作状态的代理节点每隔预设时间段向数据库中更新时间戳。
在一些实施例中,还包括:
响应于检测到若干个代理节点的时间戳超时未更新,判定发生异常;
将处于空闲状态的主动代理转化为工作状态并对相应的待管理节点继续进行管理。
在一些实施例中,还包括:
所述当前每一个代理节点中的每一个处于工作状态的主动代理生成一个预设范围内的随机数;
将生成的随机数小于阈值的所述第五数量的主动代理转化为空闲状态。
本发明提出的方案采用有统一的标准接口的主动代理,可以独立地开发且独立地部署运行,并且主动代理独立于服务器管理平台而自主运行,一个主动代理只负责监控一个普通节点,而主动代理之间通过约定好的算法相互协调,这样通过主动代理共同保证管理活动持续地正常进行,进而可以使得服务器管理平台更好地部署在服务网格,让服务器管理平台具有很高的横向扩展能力和灵活性,更容易开发和维护,而且使得服务器管理平台具有高可用性。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种节点的管理方法,其特征在于,包括以下步骤:
获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
2.如权利要求1所述的方法,其特征在于,还包括:
将所述新的代理节点中剩余的主动代理标记为空闲状态。
3.如权利要求1所述的方法,其特征在于,还包括:
创建多个代理节点;
根据每一个所述代理节点的硬件资源创建对应数量的主动代理;
利用每一个所述代理节点上的若干个主动代理分别对相应的待管理节点进行管理。
4.如权利要求3所述的方法,其特征在于,还包括:
将每一个所述代理节点上剩余的主动代理标记为空闲状态。
5.如权利要求2或4所述的方法,其特征在于,还包括:
处于工作状态的代理节点每隔预设时间段向数据库中更新时间戳。
6.如权利要求5所述的方法,其特征在于,还包括:
响应于检测到若干个代理节点的时间戳超时未更新,判定发生异常;
将处于空闲状态的主动代理转化为工作状态并对相应的待管理节点继续进行管理。
7.如权利要求1所述的方法,其特征在于,还包括:
所述当前每一个代理节点中的每一个处于工作状态的主动代理生成一个预设范围内的随机数;
将生成的随机数小于阈值的所述第五数量的主动代理转化为空闲状态。
8.一种节点的管理系统,其特征在于,包括:
获取模块,配置为获取当前每一个代理节点中主动代理的数量和处于工作状态的主动代理的数量;
统计模块,配置为统计所有主动代理的第一数量和所有处于工作状态的主动代理的第二数量,并利用第二数量除以第一数量得到比例系数;
创建模块,配置为响应于创建新的代理节点,根据所述新的代理节点的资源创建第三数量的主动代理;
计算模块,配置为将所述第一数量和第三数量相加后乘以所述比例系数得到在创建所述新的代理节点后应当处于工作状态的主动代理的第四数量;
确定模块,配置为将所述第四数量减去第二数量得到的值作为所述新的代理节点中应当处于工作状态的主动代理的第五数量,并利用所述第五数量的主动代理对相应的待管理节点进行管理。
9.一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如权利要求1-7任意一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1-7任意一项所述的方法的步骤。
CN202110599104.9A 2021-05-31 2021-05-31 一种节点的管理方法、系统、设备以及介质 Active CN113472849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110599104.9A CN113472849B (zh) 2021-05-31 2021-05-31 一种节点的管理方法、系统、设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110599104.9A CN113472849B (zh) 2021-05-31 2021-05-31 一种节点的管理方法、系统、设备以及介质

Publications (2)

Publication Number Publication Date
CN113472849A CN113472849A (zh) 2021-10-01
CN113472849B true CN113472849B (zh) 2022-10-28

Family

ID=77871906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110599104.9A Active CN113472849B (zh) 2021-05-31 2021-05-31 一种节点的管理方法、系统、设备以及介质

Country Status (1)

Country Link
CN (1) CN113472849B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114726665B (zh) * 2022-04-02 2024-04-09 深圳绿米联创科技有限公司 掉电处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559093A (zh) * 2013-11-15 2014-02-05 北京中指实证数据信息技术有限公司 一种服务器资源的配置方法及装置
CN105159752A (zh) * 2015-09-22 2015-12-16 中国人民解放军国防科学技术大学 虚拟化云中机器启动时间感知的实时任务与资源调度方法
CN111629028A (zh) * 2020-04-10 2020-09-04 清华大学 面向分布式多云存储的数据传输调度系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9743309B2 (en) * 2015-10-17 2017-08-22 Macau University Of Science And Technology MAC design for wireless hot-spot networks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559093A (zh) * 2013-11-15 2014-02-05 北京中指实证数据信息技术有限公司 一种服务器资源的配置方法及装置
CN105159752A (zh) * 2015-09-22 2015-12-16 中国人民解放军国防科学技术大学 虚拟化云中机器启动时间感知的实时任务与资源调度方法
CN111629028A (zh) * 2020-04-10 2020-09-04 清华大学 面向分布式多云存储的数据传输调度系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
集群扩容的流程;lxpqxl;《CSDN》;20191108;全文 *

Also Published As

Publication number Publication date
CN113472849A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN108604202B (zh) 并行处理系统的工作节点重建
Povedano-Molina et al. DARGOS: A highly adaptable and scalable monitoring architecture for multi-tenant Clouds
US8209417B2 (en) Dynamic resource profiles for clusterware-managed resources
CN111405055A (zh) 多集群管理方法、系统、服务器、存储介质
CN107544783B (zh) 一种数据更新方法、装置及系统
CN113382077B (zh) 微服务调度方法、装置、计算机设备和存储介质
CN111064626B (zh) 配置更新方法、装置、服务器及可读存储介质
CN113949707A (zh) 基于OpenResty和K8S的容器云服务发现和负载均衡方法
US20160092537A1 (en) Polling based synchronization in managed networks
CN105357042A (zh) 一种高可用集群系统及其主节点和从节点
WO2016115896A1 (zh) 虚拟网络功能vnf的管理方法及装置
CN112527507A (zh) 集群部署方法、装置、计算机设备和存储介质
CN113472849B (zh) 一种节点的管理方法、系统、设备以及介质
JP6304499B2 (ja) 相互接続ネットワークを管理する方法およびシステム
CN114615268B (zh) 基于Kubernetes集群的服务网络、监控节点、容器节点及设备
CN114565502A (zh) Gpu资源管理方法、调度方法、装置、电子设备及存储介质
JP2009086741A (ja) 異種ノード混在の分散環境における分散処理制御方法、そのシステム及びそのプログラム
CN112540827A (zh) 一种基于k8s平台的负载均衡系统及实现方法
US9973569B2 (en) System, method and computing apparatus to manage process in cloud infrastructure
CN112181049A (zh) 集群时间同步方法、装置、系统、设备及可读存储介质
US10110502B1 (en) Autonomous host deployment in managed deployment systems
CN111314114A (zh) 一种提高RabbitMQ高可用性的部署方法和系统
CN114500289B (zh) 控制平面恢复方法、装置、控制节点及存储介质
US11777810B2 (en) Status sharing in a resilience framework
WO2024021471A1 (zh) 一种服务更新方法、装置、系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant