CN112269694A - 一种管理节点确定方法、装置、电子设备及可读存储介质 - Google Patents

一种管理节点确定方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112269694A
CN112269694A CN202011147895.3A CN202011147895A CN112269694A CN 112269694 A CN112269694 A CN 112269694A CN 202011147895 A CN202011147895 A CN 202011147895A CN 112269694 A CN112269694 A CN 112269694A
Authority
CN
China
Prior art keywords
node
management
determining
delay
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011147895.3A
Other languages
English (en)
Other versions
CN112269694B (zh
Inventor
王永超
闫冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Inspur Data Technology Co Ltd
Original Assignee
Beijing Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Inspur Data Technology Co Ltd filed Critical Beijing Inspur Data Technology Co Ltd
Priority to CN202011147895.3A priority Critical patent/CN112269694B/zh
Publication of CN112269694A publication Critical patent/CN112269694A/zh
Application granted granted Critical
Publication of CN112269694B publication Critical patent/CN112269694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种管理节点确定方法、装置、电子设备及计算机可读存储介质,该方法包括:获取对管理系统进行容器化处理后得到的容器镜像,并将容器镜像在本地部署;若检测到管理节点故障,则在各个节点中确定目标节点,并判断目标节点是否为本节点;节点均部署有容器镜像;若目标节点为本节点,则启动容器镜像,并作为管理节点提供服务;若目标节点不为本节点,则接受目标节点的管理;该方法通过部署容器镜像,可以保证数据隔离,防止出现安全隐患;同时,在全部节点上部署容器镜像,可以在发生故障后实现集群的快速恢复。

Description

一种管理节点确定方法、装置、电子设备及可读存储介质
技术领域
本申请涉及云计算技术领域,特别涉及一种管理节点确定方法、管理节点确定装置、电子设备及计算机可读存储介质。
背景技术
私有云,是相对于公有云的另一个概念,指的是云计算的一种特殊模式,IT服务通过专用IT基础架构进行配置,以供单个组织专用。私有云通常通过内部资源进行管理。它涉及独特且安全的基于云的环境,其中只有指定的客户端可以运行。用户可以利用私有云管理系统对私有云集群进行控制和管理,私有云的管理系统采用硬件设备提供云管服务,相关技术将管理系统与某一个节点设备的计算系统部署在一起,以便减少资源浪费。但是这样会使得计算系统所需的用户业务数据与管理系统无法隔离,造成数据安全隐患。由于存在数据安全隐患,因此相关技术仅在一个节点上部署管理系统,在管理系统发生故障后需要在其他节点上重新部署管理系统以便恢复服务,因此集群故障后恢复速度较慢。
因此,相关技术存在数据安全隐患,集群故障后恢复速度较慢的问题,是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本申请的目的在于提供一种管理节点确定方法、管理节点确定装置、电子设备及计算机可读存储介质,解决了相关技术存在数据安全隐患,集群故障后恢复速度较慢的问题。
为解决上述技术问题,本申请提供了一种管理节点确定方法,包括:
获取对管理系统进行容器化处理后得到的容器镜像,并将所述容器镜像在本地部署;
若检测到管理节点故障,则在各个节点中确定目标节点,并判断所述目标节点是否为本节点;所述节点均部署有所述容器镜像;
若所述目标节点为所述本节点,则启动所述容器镜像,并作为所述管理节点提供服务;
若所述目标节点不为所述本节点,则接受所述目标节点的管理。
可选地,所述在各个节点中确定目标节点,并判断所述目标节点是否为本节点,包括:
获取各个所述节点与邻居节点之间的网络延时;
利用所述网络延时和权重值计算各个所述节点对应的延时加权值,并确定最小延时加权值;
若所述最小延时加权值为本节点延时加权值,则确定所述目标节点为所述本节点;
若所述最小延时加权值不为本节点延时加权值,则确定所述目标节点不为所述本节点。
可选地,所述利用所述网络延时和权重值计算各个所述节点对应的延时加权值,包括:
利用所述网络延时确定各个所述节点对应的网络环境检测结果;
将所述网络环境检测结果为合格的所述节点确定为候选节点;
利用所述候选节点对应的所述网络延时和所述权重值计算各个所述候选节点对应的所述延时加权值;
相应的,所述确定最小延时加权值,包括:
将各个所述候选节点对应的所述延时加权值进行大小比对,得到所述最小延时加权值。
可选地,所述利用所述候选节点对应的所述网络延时和所述权重值计算各个所述候选节点对应的所述延时加权值,包括:
获取各个所述候选节点对应的初始权重值;
利用所述初始权重值除以所述候选节点对应的节点数量,得到所述权重值;
利用所述网络延时计算各个所述候选节点对应的延时和,并利用所述延时和与所述权重值得到所述延时加权值。
可选地,还包括:
获取所述管理系统对应的服务及配置信息;
对所述服务及配置信息进行容器镜像编译打包处理,得到所述容器镜像。
可选地,在检测到管理节点故障之后,在各个节点中确定目标节点之前,还包括:
判断所述本节点是否为仲裁节点;
若不为所述仲裁节点,则获取所述仲裁节点发送的管理节点确定信息,并利用所述管理节点确定信息确定所述目标节点;
若为所述仲裁节点,则执行所述在各个节点中确定目标节点,并判断所述目标节点是否为本节点的步骤。
可选地,所述启动所述容器镜像,以便作为管理节点提供服务,包括:
获取目标浮动IP并进行绑定;
启动所述容器镜像,以便通过目标浮动IP提供服务。
本申请还提供了一种管理节点确定装置,包括:
获取模块,用于获取对管理系统进行容器化处理后得到的容器镜像,并将所述容器镜像在本地部署;
判断模块,用于若检测到管理节点故障,则在各个节点中确定目标节点,并判断所述目标节点是否为本节点;所述节点均部署有所述容器镜像;
启动模块,用于若所述目标节点为所述本节点,则启动所述容器镜像,并作为所述管理节点提供服务;
接受模块,用于若所述目标节点不为所述本节点,则接受所述目标节点的管理。
本申请还提供了一种电子设备,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现上述的管理节点确定方法。
本申请还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的管理节点确定方法。
本申请提供的管理节点确定方法,获取对管理系统进行容器化处理后得到的容器镜像,并将容器镜像在本地部署;若检测到管理节点故障,则在各个节点中确定目标节点,并判断目标节点是否为本节点;节点均部署有容器镜像;若目标节点为本节点,则启动容器镜像,并作为管理节点提供服务;若目标节点不为本节点,则接受目标节点的管理。
可见,该方法并不直接在某一个节点上部署管理系统,而是将管理系统进行容器化处理后得到容器镜像,集群中各个节点均获取容器镜像并将其在本地部署。容器化处理将管理系统作为单独的单元进行打包,得到的容器镜像具有隔离性的特性,在节点上部署容器镜像不会造成数据无法隔离的问题,解决了存在数据安全隐患的问题。在检测到管理节点故障后,可以在节点中确定目标节点,以便将目标节点作为新的管理节点对外提供服务,若目标节点为本节点,则启动容器镜像,作为管理节点提供服务。若目标节点不为本节点,则将目标节点确定为管理节点,接受目标节点的管理。通过部署容器镜像,可以保证数据隔离,防止出现安全隐患;同时,在全部节点上部署容器镜像,可以在发生故障后实现集群的快速恢复,解决了相关技术存在数据安全隐患,集群故障后恢复速度较慢的问题。
此外,本申请还提供了一种管理节点确定装置、电子设备及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种管理节点确定方法流程图;
图2为本申请实施例提供的一种具体的私有云系统的结构示意图;
图3为本申请实施例提供的一种管理节点确定装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例提供的一种管理节点确定方法流程图。该方法包括:
S101:获取对管理系统进行容器化处理后得到的容器镜像,并将容器镜像在本地部署。
容器化处理也可以称为容器化,是软件开发的一种方法,通过该方法可将应用程序或服务、其依赖项及其配置(抽象化为部署清单文件后)一起打包为容器映像(即容器镜像)。容器化处理后的应用程序可以作为一个单独的单元进行测试,并可以作为容器映像实例部署到主机操作系统(OS)中。容器化后的应用程序具有隔离性、可移植性、灵活性等特点。在本实施例中,通过对管理系统进行容器化处理得到容器镜像,可以使管理系统与节点原本计算业务的数据之间相互隔离,解决了数据安全隐患,同时其灵活性等特点允许其在各个节点上部署,为后续发生管理节点故障后进行管理节点以及集群的快速恢复打下基础。
具体的,本实施例提供的管理节点确定方法的全部或部分步骤可以由电子设备执行,该电子设备即为节点,可以为称为本节点。电子设备可以为单个设备,例如为单个服务器,或者可以为多个,例如包括服务器和计算机。在本节点初始化过程中,或者在整个集群初始化过程中,整个集群中的全部或部分节点(包括本节点)均可以获取容器镜像,并将容器镜像在本地部署。需要说明的是,在本地部署容器镜像并不说明本节点即为管理节点,只有在启动容器镜像后节点才能够作为管理节点提供服务。在本地部署容器镜像的具体方式不做限定,例如将容器镜像在本地存储即为在本地部署;或者在本地存储容器镜像后进行相应的配置,使容器镜像在需要时可以启动,在配置后完成容器镜像在本地的部署。
可以理解的是,本实施例并不限定在集群初始化完成后如何正常选择管理节点。在一种可行的实施方式中,由于集群中存在多个节点(或称为计算节点),各个节点获取容器镜像并进行初始化所需的时间无法完全相同,或者按照预设顺序,因此必然会存在第一个完成容器镜像在本地部署的节点,此时可以启动该节点上的容器镜像,选择其作为管理节点,在其他节点完成初始化后对其进行管理控制。请参考图2,图2为本申请实施例提供的一种具体的私有云系统的结构示意图。可以看到,计算节点1至n中均部署了私有云管理系统容器镜像(即容器镜像)。在初始化时,可以同时向各个计算节点发送容器镜像,按照收到容器镜像的顺序对计算节点进行编号。各个节点获取容器镜像后在本地部署,若计算节点1第一个部署完成,则启动容器镜像,作为管理节点运行管理系统服务。或者可以按照顺序分别向各个计算节点发送容器镜像,例如可以按照计算节点的编号从1开始由小到大向计算节点发送容器镜像。
可以理解的是,在各个节点获取容器镜像之前,还需要生成容器镜像。在一种实施方式中,容器镜像可以由本节点生成,即先生成容器镜像,再将该容器镜像发送给其他节点,并将该容器镜像在本地部署。容器镜像的生成过程可以包括:
步骤11:获取管理系统对应的服务及配置信息。
步骤12:对服务及配置信息进行容器镜像编译打包处理,得到容器镜像。
在本实施例中,可以利用服务及配置信息表示管理系统运行所必须的服务以及服务对应的配置信息,其具体内容本实施例不做限定。在对其进行容器镜像编译和打包后,即可得到对应的容器镜像。
S102:若检测到管理节点故障,则在各个节点中确定目标节点,并判断目标节点是否为本节点。
管理节点故障可以包括管理节点网络通信断开、管理节点死机或关机等故障。在集群运行中若检测到管理节点故障,则可以利用其他部署有容器镜像的节点作为新的管理节点对外提供服务,以便高效地解决管理节点故障的问题。本实施例并不限定管理节点故障的具体检测方式,例如在一种实施方式中,可以判断是否接收到管理节点发送的故障通知,若接收到该故障通知,则可以确定检测到管理节点故障。或者在另一种实施方式中,可以检测与管理节点的通信是否正常,若检测到通信异常,则可以确定管理节点故障。或者在另一种实施方式中,还可以检测是否接收到其他节点发送的管理节点异常通知,若接收到该管理节点异常通知,则可以确定检测到管理节点故障。
需要说明的是,节点均部署有容器镜像,因为只有部署有容器镜像才能够启动管理系统,才能够作为管理节点。本实施例并不限定在节点中确定目标节点的方式,例如可以各个节点中编号最小的节点作为目标节点。或者可以根据各个节点的网络连接情况,选择网络连接情况最好的节点作为目标节点。在确定目标节点后,本节点需要判断选择出来的目标节点是否为本节点,根据本节点是否为目标节点的结果决定执行的步骤。
在一种可行的实施方式中,整个集群中包括多个节点,各个节点分别确定目标节点会造成计算资源的浪费,因此可以指定一个仲裁节点,并利用该仲裁节点进行目标节点的确定,其余节点等待仲裁节点的仲裁结果即可。在这种情况下,在检测到管理节点故障之后,在各个节点中确定目标节点之前还可以包括:
步骤21:判断本节点是否为仲裁节点。
步骤22:若不为仲裁节点,则获取仲裁节点发送的管理节点确定信息,并利用管理节点确定信息确定目标节点。
步骤23:若为仲裁节点,则执行在各个节点中确定目标节点,并判断目标节点是否为本节点的步骤。
具体的,在检测到管理节点故障后,可以先判断本节点是否为需要选择目标节点的仲裁节点,若本节点为仲裁节点,则执行后续步骤,在各个节点中确定目标节点。若不为仲裁节点,则等待获取仲裁节点发送的管理节点确定信息,并在获取到管理节点仲裁信息后确定目标节点,进而判断目标节点是否为本节点。
在一种可行的实施方式中,为了提高集群的可用性,可以基于各个节点之间的网络延时确定目标节点。具体的,S102步骤可以包括:
步骤31:获取各个节点与邻居节点之间的网络延时。
步骤32:利用网络延时和权重值计算各个节点对应的延时加权值,并确定最小延时加权值。
步骤33:若最小延时加权值为本节点延时加权值,则确定目标节点为本节点。
步骤34:若最小延时加权值不为本节点延时加权值,则确定目标节点不为本节点。
需要说明的是,集群中的各个节点之间两两相连,即任意一个节点的邻居节点即为集群中的全部其他节点。网络延时的获取方式不做限定,由于各个节点均存在心跳机制,心跳机制用于统计本节点与其他节点之间的网络延时及网络状态,因此在获取各个节点与邻居节点之间的网络延时时,可以直接获取各个节点上一次心跳机制获取的网络延时,不需要重新获取网络延时。在得到网络延时后,利用各个节点对应的网络延时和权重值计算各个节点对应的延时加权值。权重值可以体现该节点在确定目标节点时的优先级。延时加权值利用网络延时计算得到,其可以体现节点的网络状态,通过确定最小延时加权值,可以确定网络状态最好的节点,或者在多个网络状态较好的节点中确定一个作为目标节点。在确定最小延时加权值后,判断其是否为本节点延时加权值,即是否为利用本节点的网络延时计算得到的延时加权值,若是,则确定本节点为目标节点,若不是,则确定本节点不是目标节点。
进一步的,为了提高确定目标节点的速度,进而提高集群恢复速度,利用网络延时计算各个节点对应的延时加权值的步骤可以包括:
步骤41:利用网络延时确定各个节点对应的网络环境检测结果。
步骤42:将网络环境检测结果为合格的节点确定为候选节点。
步骤43:利用候选节点对应的网络延时和权重值计算各个候选节点对应的延时加权值。
相应的,确定最小延时加权值的步骤可以包括:
步骤44:将各个候选节点对应的延时加权值进行大小比对,得到最小延时加权值。
具体的,在获取网络延时后利用其确定网络环境检测结果,对于网络环境较差的节点,即网络环境检测结果为不合格的节点,可以直接排除筛选,以便减少计算延时加权值的时间。本实施例并不限定确定网络环境检测结果的具体方式,例如可以计算各个节点与邻居节点之间的平均时延,并在平均时延大于预设阈值时确定网络环境检测结果为不合格。在另一种实施方式中,可以统计与节点之间网络延时大于预设阈值的邻居节点的数量,并在数量大于数量阈值时确定网络环境检测结果为不合格。网络延时检测结果为不合格的节点可以被称为不可达节点,通过将网络延时检测结果为不合格的节点滤除,可以减少候选节点的数量,进而减少确定目标节点所需的时间。相应的,在确定目标节点时,仅在各个候选节点对应的延时加权值进行大小比对,并在候选节点中确定目标节点。
在一种可行的实施方式中,在得到候选节点后,计算延时加权值的过程可以包括:
步骤51:获取各个候选节点对应的初始权重值。
步骤52:利用初始权重值除以候选节点对应的节点数量,得到权重值。
步骤53:利用网络延时计算各个候选节点对应的延时和,并利用延时和与权重值得到延时加权值。
具体的,各个候选节点均具有对应的初始权重值,该初始权重值用于区分各个节点,以便在两个或以上的节点的网络延时相同时可以从其中确定出一个目标节点。初始权重值的具体内容不做限定,例如可以为各个节点的节点编号。利用初始权重值除以候选节点对应的节点数量,可以得到在当前情况下的权重值,在得到权重值后利用其与延时和相乘得到延时加权值。
例如,计算节点的数量为m其中D(i,j)为计算节点i到计算节点j的网络延时。例如对于编号为1到m的计算节点,则各个计算节点的网络延时如下:
计算节点1:D(1,2)D(1,3)D(1,4)…D(1,m)
计算节点2:D(2,1)D(2,3)D(2,4)…D(2,m)
计算节点m:D(m,1)D(m,2)D(m,3)…D(m,m-1)
因此对于计算节点i来说,其对应的延时加权值为:
Figure BDA0002740280770000091
其中,Totali为计算节点i的延时加权值,wi为初始权重值。
需要说明的是,上述计算延时加权值的方式可以用于计算候选节点对应的延时加权值,也可以用于直接计算各个节点的延时加权值,即不根据网络环境检测结果对节点进行筛选而直接计算各个节点的延时加权值。
S103:启动容器镜像,并作为管理节点提供服务。
若目标节点为本节点,即说明由本节点作为管理节点对外提供服务。因此可以启动容器镜像,进而启动管理系统服务,作为管理节点对外提供服务。本实施例并不限定启动容器镜像的具体方式,可以参考相关技术。
在一种可行的实施方式中,可以采用浮动IP的方式实现无代理模式,可以在用户无感知的情况下进行管理服务的恢复,增强了易用性,减少了私有云管理系统维护成本。具体的,S103步骤可以包括:
步骤61:获取目标浮动IP并进行绑定。
步骤62:启动容器镜像,以便通过目标浮动IP提供服务。
目标浮动IP为一固定IP,其对应于管理节点,即不管管理节点具体为哪一个节点,在其作为管理节点时,均可以将IP地址修改为目标浮动IP,即获取目标浮动IP并进行绑定,将本节点的IP地址修改为目标浮动IP。通过与目标浮动IP相绑定,用户可以仅对目标浮动IP发送操作请求,无需在管理节点发生变化后修改操作请求的发送对象。请参考图2,图2中的浮动IP即为目标浮动IP,用户操作请求发送浮动IP,通过由不同的计算节点绑定浮动IP,可以利用不同的节点作为管理节点。在绑定目标浮动IP后,可以启动容器镜像,以便通过目标浮动IP对外提供服务。
S104:接受目标节点的管理。
若本节点不是目标节点,则接收目标节点的管理,具体过程可以参考相关技术,在此不再赘述。
应用本申请实施例提供的管理节点确定方法,并不直接在某一个节点上部署管理系统,而是将管理系统进行容器化处理后得到容器镜像,集群中各个节点均获取容器镜像并将其在本地部署。容器化处理将管理系统作为单独的单元进行打包,得到的容器镜像具有隔离性的特性,在节点上部署容器镜像不会造成数据无法隔离的问题,解决了存在数据安全隐患的问题。在检测到管理节点故障后,可以在节点中确定目标节点,以便将目标节点作为新的管理节点对外提供服务,若目标节点为本节点,则启动容器镜像,作为管理节点提供服务。若目标节点不为本节点,则将目标节点确定为管理节点,接受目标节点的管理。通过部署容器镜像,可以保证数据隔离,防止出现安全隐患;同时,在全部节点上部署容器镜像,可以在发生故障后实现集群的快速恢复,解决了相关技术存在数据安全隐患,集群故障后恢复速度较慢的问题。
下面对本申请实施例提供的管理节点确定装置进行介绍,下文描述的管理节点确定装置与上文描述的管理节点确定方法可相互对应参照。
请参考图3,图3为本申请实施例提供的一种管理节点确定装置的结构示意图,包括:
获取模块110,用于获取对管理系统进行容器化处理后得到的容器镜像,并将容器镜像在本地部署;
判断模块120,用于若检测到管理节点故障,则在各个节点中确定目标节点,并判断目标节点是否为本节点;节点均部署有容器镜像;
启动模块130,用于若目标节点为本节点,则启动容器镜像,并作为管理节点提供服务;
接受模块140,用于若目标节点不为本节点,则接受目标节点的管理。
可选地,判断模块120,包括:
网络延时获取单元,用于获取各个节点与邻居节点之间的网络延时;
最小值确定单元,用于利用网络延时和权重值计算各个节点对应的延时加权值,并确定最小延时加权值;
第一确定单元,用于若最小延时加权值为本节点延时加权值,则确定目标节点为本节点;
第二确定单元,用于若最小延时加权值不为本节点延时加权值,则确定目标节点不为本节点。
可选地,最小值确定单元,包括:
环境检测子单元,用于利用网络延时确定各个节点对应的网络环境检测结果;
候选节点确定子单元,用于将网络环境检测结果为合格的节点确定为候选节点;
延时加权值计算子单元,用于利用候选节点对应的网络延时和权重值计算各个候选节点对应的延时加权值;
相应的,最小值确定单元为将各个候选节点对应的延时加权值进行大小比对,得到最小延时加权值的单元。
可选地,延时加权值计算子单元,包括:
处置权重值获取子单元,用于获取各个候选节点对应的初始权重值;
权重值计算子单元,用于利用初始权重值除以候选节点对应的节点数量,得到权重值;
计算子单元,用于利用网络延时计算各个候选节点对应的延时和,并利用延时和与权重值得到延时加权值。
可选地,还包括:
服务及配置信息获取模块,用于获取管理系统对应的服务及配置信息;
编译打包模块,用于对服务及配置信息进行容器镜像编译打包处理,得到容器镜像。
可选地,还包括:
仲裁判断模块,用于判断本节点是否为仲裁节点;
管理节点确定信息获取模块,用于若不为仲裁节点,则获取仲裁节点发送的管理节点确定信息,并利用管理节点确定信息确定目标节点;
相应的,判断模块120为确定本节点为仲裁节点,在各个节点中确定目标节点,并判断目标节点是否为本节点的模块。
可选地,启动模块130,包括:
浮动IP绑定单元,用于获取目标浮动IP并进行绑定;
启动单元,用于启动容器镜像,以便通过目标浮动IP提供服务。
下面对本申请实施例提供的电子设备进行介绍,下文描述的电子设备与上文描述的管理节点确定方法可相互对应参照。
请参考图4,图4为本申请实施例提供的一种电子设备的结构示意图。其中电子设备100可以包括处理器101和存储器102,还可以进一步包括多媒体组件103、信息输入/信息输出(I/O)接口104以及通信组件105中的一种或多种。
其中,处理器101用于控制电子设备100的整体操作,以完成上述的管理节点确定方法中的全部或部分步骤;存储器102用于存储各种类型的数据以支持在电子设备100的操作,这些数据例如可以包括用于在该电子设备100上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,SRAM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、只读存储器(Read-OnlyMemory,ROM)、磁存储器、快闪存储器、磁盘或光盘中的一种或多种。
多媒体组件103可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或通过通信组件105发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口104为处理器101和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件105用于电子设备100与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件105可以包括:Wi-Fi部件,蓝牙部件,NFC部件。
电子设备100可以被一个或多个应用专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述实施例给出的管理节点确定方法。
下面对本申请实施例提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的管理节点确定方法可相互对应参照。
本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的管理节点确定方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语包括、包含或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种管理节点确定方法,其特征在于,包括:
获取对管理系统进行容器化处理后得到的容器镜像,并将所述容器镜像在本地部署;
若检测到管理节点故障,则在各个节点中确定目标节点,并判断所述目标节点是否为本节点;所述节点均部署有所述容器镜像;
若所述目标节点为所述本节点,则启动所述容器镜像,并作为所述管理节点提供服务;
若所述目标节点不为所述本节点,则接受所述目标节点的管理。
2.根据权利要求1所述的管理节点确定方法,其特征在于,所述在各个节点中确定目标节点,并判断所述目标节点是否为本节点,包括:
获取各个所述节点与邻居节点之间的网络延时;
利用所述网络延时和权重值计算各个所述节点对应的延时加权值,并确定最小延时加权值;
若所述最小延时加权值为本节点延时加权值,则确定所述目标节点为所述本节点;
若所述最小延时加权值不为所述本节点延时加权值,则确定所述目标节点不为所述本节点。
3.根据权利要求2所述的管理节点确定方法,其特征在于,所述利用所述网络延时和权重值计算各个所述节点对应的延时加权值,包括:
利用所述网络延时确定各个所述节点对应的网络环境检测结果;
将所述网络环境检测结果为合格的所述节点确定为候选节点;
利用所述候选节点对应的所述网络延时和所述权重值计算各个所述候选节点对应的所述延时加权值;
相应的,所述确定最小延时加权值,包括:
将各个所述候选节点对应的所述延时加权值进行大小比对,得到所述最小延时加权值。
4.根据权利要求3所述的管理节点确定方法,其特征在于,所述利用所述候选节点对应的所述网络延时和所述权重值计算各个所述候选节点对应的所述延时加权值,包括:
获取各个所述候选节点对应的初始权重值;
利用所述初始权重值除以所述候选节点对应的节点数量,得到所述权重值;
利用所述网络延时计算各个所述候选节点对应的延时和,并利用所述延时和与所述权重值得到所述延时加权值。
5.根据权利要求1所述的管理节点确定方法,其特征在于,还包括:
获取所述管理系统对应的服务及配置信息;
对所述服务及配置信息进行容器镜像编译打包处理,得到所述容器镜像。
6.根据权利要求1所述的管理节点确定方法,其特征在于,在检测到管理节点故障之后,在各个节点中确定目标节点之前,还包括:
判断所述本节点是否为仲裁节点;
若不为所述仲裁节点,则获取所述仲裁节点发送的管理节点确定信息,并利用所述管理节点确定信息确定所述目标节点;
若为所述仲裁节点,则执行所述在各个节点中确定目标节点,并判断所述目标节点是否为本节点的步骤。
7.根据权利要求1所述的管理节点确定方法,其特征在于,所述启动所述容器镜像,以便作为管理节点提供服务,包括:
获取目标浮动IP并进行绑定;
启动所述容器镜像,以便通过目标浮动IP提供服务。
8.一种管理节点确定装置,其特征在于,包括:
获取模块,用于获取对管理系统进行容器化处理后得到的容器镜像,并将所述容器镜像在本地部署;
判断模块,用于若检测到管理节点故障,则在各个节点中确定目标节点,并判断所述目标节点是否为本节点;所述节点均部署有所述容器镜像;
启动模块,用于若所述目标节点为所述本节点,则启动所述容器镜像,并作为所述管理节点提供服务;
接受模块,用于若所述目标节点不为所述本节点,则接受所述目标节点的管理。
9.一种电子设备,其特征在于,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的管理节点确定方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的管理节点确定方法。
CN202011147895.3A 2020-10-23 2020-10-23 一种管理节点确定方法、装置、电子设备及可读存储介质 Active CN112269694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011147895.3A CN112269694B (zh) 2020-10-23 2020-10-23 一种管理节点确定方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011147895.3A CN112269694B (zh) 2020-10-23 2020-10-23 一种管理节点确定方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN112269694A true CN112269694A (zh) 2021-01-26
CN112269694B CN112269694B (zh) 2023-12-22

Family

ID=74342110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011147895.3A Active CN112269694B (zh) 2020-10-23 2020-10-23 一种管理节点确定方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112269694B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726553A (zh) * 2021-07-29 2021-11-30 浪潮电子信息产业股份有限公司 一种节点故障恢复方法、装置、电子设备及可读存储介质
CN113961314A (zh) * 2021-12-16 2022-01-21 苏州浪潮智能科技有限公司 一种容器应用调度方法、装置、电子设备及存储介质
CN115348157A (zh) * 2021-05-14 2022-11-15 中国移动通信集团浙江有限公司 分布式存储集群的故障定位方法、装置、设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122718A1 (en) * 2012-11-01 2014-05-01 Netapp, Inc. Lock state synchronization for non-disruptive persistent operation
CN103945396A (zh) * 2014-03-27 2014-07-23 电子科技大学 一种不甚发达网络环境下的云计算服务节点选取方法
CN106878385A (zh) * 2016-12-30 2017-06-20 新华三技术有限公司 私有云部署方法及装置
CN106911777A (zh) * 2017-02-24 2017-06-30 郑州云海信息技术有限公司 一种数据处理方法及服务器
CN107431720A (zh) * 2015-12-31 2017-12-01 华为技术有限公司 镜像部署方法和装置
CN107590033A (zh) * 2017-09-07 2018-01-16 网宿科技股份有限公司 一种创建docker容器的方法、装置和系统
CN108984349A (zh) * 2018-08-17 2018-12-11 杭州朗和科技有限公司 主节点选举方法及装置、介质和计算设备
CN109302483A (zh) * 2018-10-17 2019-02-01 网宿科技股份有限公司 一种应用程序的管理方法及系统
CN110333930A (zh) * 2019-04-29 2019-10-15 中国联合网络通信集团有限公司 数字化平台系统
CN110445662A (zh) * 2019-08-29 2019-11-12 上海仪电(集团)有限公司中央研究院 OpenStack控制节点自适应切换为计算节点的方法及装置
CN110673924A (zh) * 2019-09-06 2020-01-10 北京浪潮数据技术有限公司 一种多架构容器云镜像选择方法、装置、设备及存储介质
CN111131449A (zh) * 2019-12-23 2020-05-08 华中科技大学 一种水资源管理系统服务集群化框架构建方法
CN111552483A (zh) * 2020-04-29 2020-08-18 深信服科技股份有限公司 一种云服务部署方法、装置、设备、介质
CN111625316A (zh) * 2020-05-15 2020-09-04 苏州浪潮智能科技有限公司 一种环境部署方法、装置及电子设备和存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122718A1 (en) * 2012-11-01 2014-05-01 Netapp, Inc. Lock state synchronization for non-disruptive persistent operation
CN103945396A (zh) * 2014-03-27 2014-07-23 电子科技大学 一种不甚发达网络环境下的云计算服务节点选取方法
CN107431720A (zh) * 2015-12-31 2017-12-01 华为技术有限公司 镜像部署方法和装置
CN106878385A (zh) * 2016-12-30 2017-06-20 新华三技术有限公司 私有云部署方法及装置
CN106911777A (zh) * 2017-02-24 2017-06-30 郑州云海信息技术有限公司 一种数据处理方法及服务器
CN107590033A (zh) * 2017-09-07 2018-01-16 网宿科技股份有限公司 一种创建docker容器的方法、装置和系统
CN108984349A (zh) * 2018-08-17 2018-12-11 杭州朗和科技有限公司 主节点选举方法及装置、介质和计算设备
CN109302483A (zh) * 2018-10-17 2019-02-01 网宿科技股份有限公司 一种应用程序的管理方法及系统
CN110333930A (zh) * 2019-04-29 2019-10-15 中国联合网络通信集团有限公司 数字化平台系统
CN110445662A (zh) * 2019-08-29 2019-11-12 上海仪电(集团)有限公司中央研究院 OpenStack控制节点自适应切换为计算节点的方法及装置
CN110673924A (zh) * 2019-09-06 2020-01-10 北京浪潮数据技术有限公司 一种多架构容器云镜像选择方法、装置、设备及存储介质
CN111131449A (zh) * 2019-12-23 2020-05-08 华中科技大学 一种水资源管理系统服务集群化框架构建方法
CN111552483A (zh) * 2020-04-29 2020-08-18 深信服科技股份有限公司 一种云服务部署方法、装置、设备、介质
CN111625316A (zh) * 2020-05-15 2020-09-04 苏州浪潮智能科技有限公司 一种环境部署方法、装置及电子设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
左德承;张展;董剑;刘宏伟;杨孝宗;: "面向事务处理的容错计算机系统结构设计与实现", 高技术通讯, no. 02 *
张琦;: "基于Docker的CaaS管理平台架构研究与设计", 计算机应用与软件, no. 11 *
陈雪门;: "容器化部署调度策略的分析与改进", 电信快报, no. 08 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115348157A (zh) * 2021-05-14 2022-11-15 中国移动通信集团浙江有限公司 分布式存储集群的故障定位方法、装置、设备及存储介质
CN115348157B (zh) * 2021-05-14 2023-09-05 中国移动通信集团浙江有限公司 分布式存储集群的故障定位方法、装置、设备及存储介质
CN113726553A (zh) * 2021-07-29 2021-11-30 浪潮电子信息产业股份有限公司 一种节点故障恢复方法、装置、电子设备及可读存储介质
CN113961314A (zh) * 2021-12-16 2022-01-21 苏州浪潮智能科技有限公司 一种容器应用调度方法、装置、电子设备及存储介质
CN113961314B (zh) * 2021-12-16 2022-03-04 苏州浪潮智能科技有限公司 一种容器应用调度方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112269694B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN112269694A (zh) 一种管理节点确定方法、装置、电子设备及可读存储介质
US9858177B2 (en) Automated test generation for multi-interface enterprise virtualization management environment
US9942087B2 (en) Application resiliency using APIs
US20160335066A1 (en) System and method for automatically deploying cloud
US10592399B2 (en) Testing web applications using clusters
CN110138577B (zh) 集群创建方法、第一服务器以及可读存储介质
WO2014025966A2 (en) Immediately launching applications
US10884885B2 (en) Proactively predicting failure in data collection devices and failing over to alternate data collection devices
US10552306B2 (en) Automated test generation for multi-interface and multi-platform enterprise virtualization management environment
US20220103555A1 (en) Service deployment method, device, system, and computer-readable storage medium
US10027692B2 (en) Modifying evasive code using correlation analysis
CN116302352A (zh) 集群灾备处理方法、装置、电子设备和存储介质
CN111770174A (zh) 一种云平台部署方法、装置、设备及可读存储介质
CN111131131B (zh) 一种漏洞扫描方法、装置、服务器及可读存储介质
CN113626183A (zh) 一种基于超融合基础架构的集群构建方法和装置
US10896093B2 (en) System reboot maintenance
CN115237441A (zh) 一种基于云平台的升级测试方法、装置及介质
CN114221878A (zh) 一种故障节点检测方法、系统、电子设备及存储介质
CN114615285A (zh) 一种物理机的部署方法、装置、电子设备及存储介质
CN114124521A (zh) 云原生安全编排方法及装置、电子设备、计算机可读介质
US20170097874A1 (en) Enhanced console assisted recovery for a coordinated timing network
CN108845845B (zh) 一种快捷键创建方法、装置、电子设备及存储介质
KR20210068968A (ko) 보안 os 이미지 관리 방법 및 이 방법을 이용하는 인터넷 서버
US9424120B1 (en) Prioritizing first failure data capture (FFDC) data for analysis
US11886283B2 (en) Automatic node crash detection and remediation in distributed computing systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant