CN102571452B - 多节点管理的方法和系统 - Google Patents

多节点管理的方法和系统 Download PDF

Info

Publication number
CN102571452B
CN102571452B CN201210038326.4A CN201210038326A CN102571452B CN 102571452 B CN102571452 B CN 102571452B CN 201210038326 A CN201210038326 A CN 201210038326A CN 102571452 B CN102571452 B CN 102571452B
Authority
CN
China
Prior art keywords
node
system management
administration subsystem
module
host node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210038326.4A
Other languages
English (en)
Other versions
CN102571452A (zh
Inventor
郑力
李迪挺
张羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210038326.4A priority Critical patent/CN102571452B/zh
Publication of CN102571452A publication Critical patent/CN102571452A/zh
Application granted granted Critical
Publication of CN102571452B publication Critical patent/CN102571452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例提供了一种多节点管理的系统和方法。系统包括:通过局域网连接的多个节点;多个节点中的一个节点为主节点,除主节点外的其余节点为排序后的从节点,并且当主节点异常时,从节点中的一个节点作为新的主节点,其中每个节点包括BMC管理子系统,BMC管理子系统用于执行本节点的监控管理并生成监控信息,且当节点作为主节点时,还用于通过局域网与从节点连接,执行多个节点的系统管理并与外网交互所生成的系统管理信息,或者当节点作为从节点时,还用于向主节点发送监控信息或接收主节点发送的系统管理信息。上述技术方案通过利用BMC的处理能力,从而降低系统成本,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。

Description

多节点管理的方法和系统
技术领域
本发明涉及系统管理领域,并且更具体地,涉及多节点管理的方法和系统。
背景技术
随着信息的不断增长,各类企业对数据存储与处理的能力需求也越来越迫切,节点增加的同时系统越来越庞大,集成度相应地也越来越高,而一种低成本,组网简单,能快速部署并且处理能力较强的系统显然会拥有极大的市场。为便于管理,多节点的服务器通常需要一个管理系统来进行整个系统的监控,当前技术存在成本高等弊病。
发明内容
本发明实施例提供一种多节点管理的系统和方法,能够降低系统组网成本。
一方面,提供了一种多节点管理的系统,包括:通过局域网连接的多个节点;多个节点中的一个节点为主节点,除主节点外的其余节点为排序后的从节点,并且当主节点异常时,从节点中的一个节点作为新的主节点,其中每个节点包括BMC管理子系统,BMC管理子系统,用于执行本节点的监控管理并生成监控信息,且当节点作为主节点时,BMC管理子系统还用于通过局域网与从节点连接,执行多个节点的系统管理并与外网交互所生成的系统管理信息,或者当节点作为从节点时,BMC管理子系统还用于向主节点发送监控信息或接收主节点发送的系统管理信息。
另一方面,提供了一种多节点管理的方法,包括:多个节点通过局域网连接;从多个节点中确定一个节点作为主节点,排序从节点,从节点为除主节点外的其余节点;并且当主节点异常时,确定从节点中的一个节点作为新的主节点,其中每个节点包括BMC管理子系统,BMC管理子系统,执行本节点的监控管理并生成监控信息,且当节点作为主节点时,BMC管理子系统通过局域网与从节点连接,执行多个节点的系统管理并与外网交互所生成的系统管理信息,或者当节点作为从节点时,BMC管理子系统向主节点发送监控信息或接收主节点发送的系统管理信息。
上述技术方案通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的多节点管理的系统的示意框图。
图2是本发明实施例的一个节点的示意框图。
图3是本发明的一个实施例的示意流程图。
图4是本发明的另一个实施例的示意流程图。
图5是本发明实施例的多节点管理的方法的示意流程图。
图6是本发明另一实施例的多节点管理的方法的示意流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
针对相关技术中系统管理存在的成本高、组网复杂、维护不方便,或者可靠性存在问题等不足,鉴于处理器技术的发展,BMC(BaseboardManagement Controller,基板管理控制器)芯片的处理能力越来越强,可供选择的芯片方案也越来越多,本发明实施例提供了一种利用BMC技术的低成本,组网简单,能快速部署并且处理能力较强的多节点管理的系统,以及多节点管理的方法。
BMC是一种嵌入式控制器,集成在例如服务器等节点的主板之上,BMC上的管理系统与主机系统独立,主要用于管理和监控容错计算机主板上的各类传感器,收集故障信息,提供远程控制台(SOL,Serial On Line)和KVM功能,以及管理风扇、电源、分区等功能。其中KVM是键盘(Keyboard)、远程视频(Video)和鼠标(Mouse)的英文首字母的组合。在上下文中BMC上的管理系统,作为节点的一部分,也称为BMC管理子系统。
图1是本发明实施例的多节点管理的系统10的示意框图。
系统10包括通过局域网连接的多个节点11,例如图中的第一节点、第二节点和第N个节点,每个节点11都包括BMC管理子系统12。N为自然数。此外,通常系统10还可以包括多个主机业务子系统,例如基本输入输出子系统(BIOS,Basic Input Output System)和操作系统等,此处为突出本发明实施例将其省略。
所述多个节点中的一个节点为主节点,除所述主节点外的其余节点为排序后的从节点,并且当所述主节点异常时,所述从节点中的一个节点作为新的主节点。
此外,BMC管理子系统12,用于执行本节点的监控管理并生成监控信息,且当所述节点作为主节点时,还通过所述局域网与从节点连接,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息,或者当所述节点作为从节点时,还向主节点发送所述监控信息或接收所述主节点发送的系统管理信息。
作为主节点的BMC管理子系统12执行所述多个节点的系统管理包括但不限于系统信息、配置管理、分区管理、节点管理、固件升级、用户管理、上下电控制、故障告警与处理、电源功率管理等,通过自己处理与向各从节点分发命令,以及接收各从节点上报信息方式来实现内部节点的系统管理,提供给用户或上层设备。
本发明实施例通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
图2是本发明另一实施例的系统20的示意框图。
为方便说明,本发明实施例中以包括3个节点201至203的系统为例。节点201至203与系统10中的节点11相同或相似,包括的BMC管理子系统21与节点11的BMC管理子系统12相同或相似。不同之处在于,其中BMC管理子系统21具体包括系统管理模块22、节点监控模块23和网络处理模块24。
所述系统管理模块22,与本节点的所述节点监控模块和所述网络处理模块连接,用于接收所述节点监控模块23执行本节点的监控管理生成的监控信息,且当所述本节点作为主节点时,通过所述网络处理模块24,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息;
所述节点监控模块23,与本节点的所述系统管理模块连接,用于执行本节点的监控管理,并向所述系统管理模块22发送执行本节点的监控管理生成的监控信息,且接收所述系统管理模块22发送的系统管理信息;且
所述网络处理模块24,与本节点的所述系统管理模块和其节点的网络处理模块24连接,用于建立所述多个节点201至203之间的局域网。
本发明实施例通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
此外,可选的,所述主节点的BMC管理子系统的系统管理模块还用于通过所述网络处理模块以网络组播方式与所述从节点的BMC管理子系统的系统管理模块同步所述系统的配置信息,其中所述配置信息包括所述多个节点的主从关系和国际互联网IP地址。所述从节点的BMC管理子系统的系统管理模块还用于存储所述配置信息。
可选的,所述主节点的BMC管理子系统的网络处理模块还用于与所述从节点的BMC管理子系统的网络处理模块建立心跳机制。当所述从节点的BMC管理子系统的网络处理模块通过所述心跳机制确定所述主节点的BMC管理子系统异常时,所述从节点的BMC管理子系统的系统管理模块还用于根据所述配置信息中的主从关系确定生成新的主节点。
可选的,所述新的主节点的BMC管理子系统的系统管理模块还用于根据所述配置信息中的IP地址将所述新的主节点的IP地址更新为之前的所述主节点的IP地址。
可选的,所述节点的BMC管理子系统的系统管理模块具体用于根据所述节点的类型或性能制定的主从策略确定所述主节点和排序所述从节点。
出于简洁,在上下文中,节点的BMC管理子系统的系统管理模块、节点的BMC管理子系统的节点监控模块和节点的BMC管理子系统的网络处理模块也分别简称为节点的系统管理模块、节点的节点监控模块和节点的网络处理模块。
图3是本发明的一个实施例30的示意流程图。实施例30可以适用如图1所示的系统10,具体执行的节点可以是图1中的节点11或图2中的节点201至203。实施例30包括的具体内容如下。
31,节点上电。
节点上电可以包括几种场景,例如,搭建系统时各节点上电、系统建立后加入新节点或已有节点异常退出系统后,重新加入系统,异常可以包括例如网络异常、电源异常、元器件异常和/或软件系统异常等。
32,检查是否为主节点。
当搭建系统时,通常依据主从策略人为配置以及软件仲裁方式确定主节点。可选的,可以根据UUID(通用唯一识别码,Universally Unique Identifier)进行大小排序,确定主节点。还可以根据节点的类型或性能制定主从策略以选择主节点和从节点。节点可以是包括BMC子管理系统的服务器或输入输出(Input/Output,缩写为IO)扩展框等节点。IO扩展框是用于对IO设备进行扩展的设备,例如硬盘阵列框等。举例来说,根据类型,服务器既可以作为主节点也可以作为从节点,而IO扩展框只能作为从节点。此外,根据不同服务器的性能,例如处理速度的快慢、处理能力的高低等可以将不同服务器进行排序。主节点通常可以是能力和处理速度资源最优的一个。
如果确定本节点是主节点,则节点执行步骤33,也就是步骤32的“是”。
33,主节点扫描其他节点。
扫描的过程中,主节点轮流询问从节点,从节点应答。主节点的系统管理模块通过主节点的网络处理模块向从节点发送轮询,例如节点类型、处理速度,各个节点的IP地址和分区信息等,接收从节点的应答。如果确认本节点是从节点,则节点直接执行步骤34,也就是步骤32的“否”。
34,从节点等待主节点扫描。
从节点的系统管理模块通过从节点的网络处理模块,接收主节点发送的轮询,并向主节点发送应答。
35,从节点等待时间是否超时。
若等待时间超时,也就是步骤35的“是”,则执行步骤33。
可能的情况是,主节点异常,也就是主节点的系统管理模块的系统管理功能异常,从节点接收不到轮询。此时,从节点自主扫描其他节点。
如等待时间没有超时,也就是步骤35的“否”,则节点执行步骤36。
36,主节点确认从节点排序。
主节点基于接收的从节点的应答,基于主从策略,对从节点进行排序,并在配置文件中存储主从关系,此外还可以存储各个节点的IP地址和分区信息等。主从关系包括主节点、从节点以及从节点的排序关系。
以图2的系统为例,如果节点201为主节点则扫描从节点。扫描后,根据从节点202和203的应答,确定节点202的排序优先级高于节点203,为第一从节点。
37,主节点与从节点同步配置信息。
节点可以以网络组播方式,向从节点发送配置信息,该配置信息包括主从关系和各个节点的IP地址,以及分区信息等。从节点收到上述配置信息后,存储在本节点的系统管理模块中。
38,建立心跳机制。
心跳机制简单地说就是发送方定时发送一个自定义的结构体,也称为心跳包,让接收方知道自己还活着,以确保连接的有效性,同时制定异常侧的判定机制。可以包括一些情形,例如如果接收方规定时间内没有收到发送方的心跳包则视发送方异常,和/或如果发送方规定时间内没有收到接收方的回复则视接收方异常。
此时,如果是搭建系统,则优选的,在主节点的网络处理模块和从节点的网络处理模块之间建立心跳机制,由此系统搭建完成。当然,也可以在各个节点之间都建立心跳机制。同时,各个节点通过网络处理模块建立局域网连接。
可选的,如果是新加入或重新加入系统的节点,则该节点的网络处理模块与其他节点网络处理模块之间建立心跳机制,由此该节点加入系统。
39、主节点和从节点之间交互信息。
随后,各节点的节点监控处理模块将本节点的监控信息发送给本节点的系统管理模块,并接收本节点系统管理模块发送的系统管理信息。
主节点的系统管理模块通过局域网与从节点的系统管理模块交互信息,包括向从节点发送配置信息的更新以及重要告警与日志信息,以及用户信息等,以保证在主管理节点异常时,其他节点能组成系统。此外,主节点的系统管理模块还可以通过网络处理模块,经系统中的网络交换设备,作为系统的唯一对外接口与外网交互信息。此外,主节点执行多节点的管理时,主节点的BMC管理子系统提供的上述信息包括但不限于系统信息、配置管理、分区管理、节点管理、固件升级、用户管理、上下电控制、故障告警与处理、电源功率管理等。
各节点的网络处理模块通过之前建立的心跳机制,当检测到主节点心跳丢失时,可以确定主节点是否异常。在图4的实施例中说明了上述多节点管理的系统经心跳机制发现主节点异常时的管理方法。
本发明实施例通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
图4是本发明另一实施例40的流程图,包括以下内容。
41,主节点心跳丢失。
从节点的网络处理模块通过心跳机制,确定主节点的心跳丢失,进一步可以确定主节点的系统管理功能异常。
42,确定是否为第一从节点。
在实施例30中节点已经从存储的配置信息中获知从节点的排序关系,此时各节点通过排序关系可以确认自己是否为第一从节点。
如果是第一从节点,也就是步骤42的“是”,则该节点升级为新的主节点,执行步骤43。此时,新的主节点的系统管理模块根据原配置信息中的IP地址将本节点的IP地址更新为之前的主节点的IP地址。由此可以保证用户或上层设备管理不中断。
参考图3的实施例,则节点202确认本节点为第一从节点,进而升级为新的主节点。
43,主节点扫描其他节点。
参考图3的实施例,则节点202作为新的主节点向其他节点发送轮询请求。
如果是不是第一从节点,也就是步骤42的“否”,则该节点仍为从节点,执行步骤44。
44,等待主节点扫描。
参考图3的实施例,则节点203等待主节点扫描,接收到轮询请求后,发送应答。
45,等待时间是否超时。
若等待时间超时,也就是步骤45的“是”,则节点执行步骤43。
如等待时间没有超时,也就是步骤45的“否”,则节点执行步骤46。
46,主节点确认从节点排序。
主节点基于接收的从节点的应答,基于主从策略,对从节点进行排序,并在配置文件中存储更新的主从关系,此外还可以存储更新的各个节点的IP地址和分区信息等。
47,主节点与从节点同步配置信息。
主节点可以以网络组播方式,向从节点发送包括主从关系和各个节点的IP地址的配置信息。从节点收到上述配置信息后,存储在本节点的系统管理模块中。
48,建立心跳机制。
此时,在新的主节点的网络处理模块和从节点的网络处理模块之间建立心跳机制。心跳机制建立后,多节点管理的系统重组完毕。参考图3的实施例,则节点202和节点203之间的网络处理模块建立心跳机制。
49、主节点和从节点之间交互信息。
步骤49与实施例30的步骤39相同,此处为了简洁,不再赘述。参考图3的实施例,则节点202和203的BMC管理子系统交互信息,且节点202的BMC管理子系统还可以向用户、上层或外网提供上述信息。本发明实施例通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
图5是本发明实施例的多节点系统管理的方法50的示意流程图,包括以下内容。
51,多个节点通过局域网连接。
52,从多个节点中确定一个节点作为主节点,排序从节点,所述从节点为除所述主节点外的其余节点。
53,当所述主节点异常时,确定从节点中的一个节点作为新的主节点。
上述每个节点都包括BMC管理子系统,所述BMC管理子系统,执行本节点的监控管理并生成监控信息,且当所述节点作为主节点时,所述BMC管理子系统通过所述局域网与从节点连接,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息,或者当所述节点作为从节点时,所述BMC管理子系统向主节点发送所述监控信息或接收所述主节点发送的系统管理信息。
参考实施例30或实施例40,装置10或20实现了方法50,出于简洁,此处具体细节不再赘述。
本发明实施例通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
图6是本发明另一实施例的多节点系统管理的方法60的示意流程图。在方法60中,每个所述节点都包括BMC管理子系统,且所述BMC管理子系统包括系统管理模块、节点监控模块和网络处理模块,所述方法包括以下内容。
61,多个节点通过局域网连接。
其中多个节点通过所述网络处理模块建立所述多个节点之间的局域网。
62,从多个节点中确定一个节点作为主节点,排序从节点,所述从节点为除所述主节点外的其余节点。
所述节点的BMC管理子系统的系统管理模块根据节点的类型或性能制定的主从策略确定主节点和排序从节点。
63,主节点与从节点建立心跳机制。
所述主节点的BMC管理子系统的网络处理模块与所述从节点的BMC管理子系统的网络处理模块建立心跳机制。
64,主节点与从节点同步系统的配置信息,从节点存储配置信息。
所述主节点的BMC管理子系统的系统管理模块通过所述网络处理模块以网络组播方式与所述从节点的BMC管理子系统的系统管理模块同步所述系统的配置信息,其中所述配置信息包括所述多个节点的主从关系和国际互联网IP地址。
所述从节点的BMC管理子系统的系统管理模块存储所述配置信息。
65,当所述主节点异常时,确定从节点中的一个节点作为新的主节点。
当所述从节点的BMC管理子系统的网络处理模块通过所述心跳机制确定所述主节点的BMC管理子系统异常时,所述从节点的BMC管理子系统的系统管理模块根据所述配置信息中的主从关系确定生成新的主节点。
66、将新的主节点的IP地址更新为之前的主节点的IP地址。
所述新的主节点的BMC管理子系统的系统管理模块根据所述配置信息中的IP地址将所述新的主节点的IP地址更新为之前的所述主节点的IP地址。
67,执行本节点的监控管理并生成监控信息;当节点作为主节点时,执行多个节点的系统管理并与外网交互所生成的系统管理信息;当节点作为从节点时,还用于向主节点发送监控信息或接收主节点发送的系统管理信息
其中,节点的BMC管理子系统的所述系统管理模块接收所述节点监控模块执行本节点的监控管理生成的监控信息,且当所述本节点作为主节点时,通过所述网络处理模块,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息;所述节点监控模块执行本节点的监控管理,并向所述系统管理模块发送执行本节点的监控管理生成的监控信息,且接收所述系统管理模块发送的系统管理信息;且所述网络处理模块建立所述多个节点之间的局域网。
所述主节点包括服务器,且所述从节点包括服务器和/或输入输出IO扩展框。
参考实施例30或实施例40,本发明实施例的装置10或20实现了方法60,为了简洁,此处具体细节不再赘述。
本发明实施例通过利用BMC的处理能力,实现多节点系统中,一个节点完成整个系统的管理,可以不增加额外的硬件设备,从而降低系统成本、节省空间,且降低复杂度,此外多节点之间形成的主从关系能够提高系统可靠性与容错特性。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种多节点管理的系统,其特征在于,所述系统包括:
通过局域网连接的多个节点;
所述多个节点中的一个节点为主节点,除所述主节点外的其余节点为排序后的从节点,并且当所述主节点异常时,所述从节点中的一个节点作为新的主节点,其中
每个所述节点包括BMC管理子系统,所述BMC管理子系统,用于执行本节点的监控管理并生成监控信息,且
当所述节点作为主节点时,所述BMC管理子系统还用于通过所述局域网与从节点连接,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息,或
当所述节点作为从节点时,所述BMC管理子系统还用于向主节点发送所述监控信息或接收所述主节点发送的系统管理信息;
所述BMC管理子系统包括系统管理模块,所述系统管理模块用于根据所述节点的类型或性能制定的主从策略确定所述主节点和排序所述从节点。
2.根据权利要求1所述的系统,其特征在于:
所述BMC管理子系统还包括节点监控模块和网络处理模块,其中
所述系统管理模块,与本节点的所述节点监控模块和所述网络处理模块连接,用于接收所述节点监控模块执行本节点的监控管理生成的监控信息,且当所述本节点作为主节点时,通过所述网络处理模块,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息;
所述节点监控模块,与本节点的所述系统管理模块连接,用于执行本节点的监控管理,并向所述系统管理模块发送执行本节点的监控管理生成的监控信息,且接收所述系统管理模块发送的系统管理信息;且
所述网络处理模块,与本节点的所述系统管理模块和其他节点的网络处理模块连接,用于建立所述多个节点之间的局域网。
3.根据权利要求2所述的系统,其特征在于:
所述主节点的BMC管理子系统的系统管理模块还用于通过所述网络处理模块以网络组播方式与所述从节点的BMC管理子系统的系统管理模块同步所述系统的配置信息,其中所述配置信息包括所述多个节点的主从关系和国际互联网IP地址;
所述从节点的BMC管理子系统的系统管理模块还用于存储所述配置信息。
4.根据权利要求3所述的系统,其特征在于:
所述主节点的BMC管理子系统的网络处理模块还用于与所述从节点的BMC管理子系统的网络处理模块建立心跳机制,
当所述从节点的BMC管理子系统的网络处理模块通过所述心跳机制确定所述主节点的BMC管理子系统异常时,所述从节点的BMC管理子系统的系统管理模块还用于根据所述配置信息中的主从关系确定生成新的主节点。
5.根据权利要求4所述的系统,其特征在于:
所述新的主节点的BMC管理子系统的系统管理模块还用于根据所述配置信息中的IP地址将所述新的主节点的IP地址更新为之前的所述主节点的IP地址。
6.根据权利要求1至5中任一项所述的系统,其特征在于:
所述主节点包括服务器,且所述从节点包括服务器和/或输入输出IO扩展框。
7.一种多节点管理的方法,其特征在于,所述方法包括:
多个节点通过局域网连接;
从所述多个节点中确定一个节点作为主节点,排序从节点,所述从节点为除所述主节点外的其余节点;并且
当所述主节点异常时,确定所述从节点中的一个节点作为新的主节点,其中
每个所述节点包括BMC管理子系统,所述BMC管理子系统,执行本节点的监控管理并生成监控信息,且
当所述节点作为主节点时,所述BMC管理子系统通过所述局域网与从节点连接,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息,或
当所述节点作为从节点时,所述BMC管理子系统向主节点发送所述监控信息或接收所述主节点发送的系统管理信息;
所述从所述多个节点中确定一个节点作为主节点,排序从节点,包括:
所述节点的BMC管理子系统的系统管理模块根据所述节点的类型或性能制定的主从策略确定所述主节点和排序所述从节点。
8.根据权利要求7所述的方法,其特征在于,当所述BMC管理子系统包括系统管理模块、节点监控模块和网络处理模块时,所述方法包括:
所述系统管理模块接收所述节点监控模块执行本节点的监控管理生成的监控信息,且当所述本节点作为主节点时,通过所述网络处理模块,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息;
所述节点监控模块执行本节点的监控管理,并向所述系统管理模块发送执行本节点的监控管理生成的监控信息,且接收所述系统管理模块发送的系统管理信息;且
所述网络处理模块建立所述多个节点之间的局域网。
9.根据权利要求8所述的方法,其特征在于,所述系统管理模块接收所述节点监控模块执行本节点的监控管理生成的监控信息,且当所述本节点作为主节点时,通过所述网络处理模块,执行所述多个节点的系统管理并与外网交互所生成的系统管理信息,包括:
所述主节点的BMC管理子系统的系统管理模块通过所述网络处理模块以网络组播方式与所述从节点的BMC管理子系统的系统管理模块同步所述系统的配置信息,其中所述配置信息包括所述多个节点的主从关系和国际互联网IP地址;
所述从节点的BMC管理子系统的系统管理模块存储所述配置信息。
10.根据权利要求9所述的方法,其特征在于,所述当所述主节点异常时,从所述从节点中的一个节点选择作为新的主节点,包括:
所述主节点的BMC管理子系统的网络处理模块与所述从节点的BMC管理子系统的网络处理模块建立心跳机制,
当所述从节点的BMC管理子系统的网络处理模块通过所述心跳机制确定所述主节点的BMC管理子系统异常时,所述从节点的BMC管理子系统的系统管理模块根据所述配置信息中的主从关系确定生成新的主节点。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
所述新的主节点的BMC管理子系统的系统管理模块根据所述配置信息中的IP地址将所述新的主节点的IP地址更新为之前的所述主节点的IP地址。
12.根据权利要求7至11中任一项所述的方法,其特征在于:
所述主节点包括服务器,且所述从节点包括服务器和/或输入输出IO扩展框。
CN201210038326.4A 2012-02-20 2012-02-20 多节点管理的方法和系统 Active CN102571452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210038326.4A CN102571452B (zh) 2012-02-20 2012-02-20 多节点管理的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210038326.4A CN102571452B (zh) 2012-02-20 2012-02-20 多节点管理的方法和系统

Publications (2)

Publication Number Publication Date
CN102571452A CN102571452A (zh) 2012-07-11
CN102571452B true CN102571452B (zh) 2015-04-08

Family

ID=46415978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210038326.4A Active CN102571452B (zh) 2012-02-20 2012-02-20 多节点管理的方法和系统

Country Status (1)

Country Link
CN (1) CN102571452B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3697026A4 (en) * 2017-11-27 2020-11-25 Huawei Technologies Co., Ltd. METHOD FOR COLLABORATION OF MULTIPLE TERMINAL DEVICES, TERMINAL DEVICE AND SYSTEM FOR COOPERATION OF MULTIPLE TERMINAL DEVICES

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207766A (zh) * 2012-01-14 2013-07-17 复旦大学 面向复杂投影表面的集群式多媒体播放与控制系统
CN103049348B (zh) * 2012-12-21 2016-03-16 四川川大智胜软件股份有限公司 多服务器化环境下数据容错存储的方法
US9529583B2 (en) * 2013-01-15 2016-12-27 Intel Corporation Single microcontroller based management of multiple compute nodes
CN103645678B (zh) * 2013-03-13 2016-08-10 沈阳峰点科技有限公司 一种实时响应网络控制系统
CN104122939A (zh) * 2013-04-23 2014-10-29 英业达科技有限公司 伺服器系统
CN104142957A (zh) * 2013-05-10 2014-11-12 上海联影医疗科技有限公司 一种面向区域医疗的数据共享的方法及其系统
CN103368771A (zh) * 2013-06-24 2013-10-23 华为技术有限公司 一种多节点服务器系统的故障现场信息的收集方法及装置
WO2015089714A1 (zh) * 2013-12-16 2015-06-25 华为技术有限公司 一种资源分配的方法以及终端设备
WO2015089710A1 (zh) * 2013-12-16 2015-06-25 华为技术有限公司 一种序列号排序的方法以及终端设备
CN104794037A (zh) * 2014-01-22 2015-07-22 昆达电脑科技(昆山)有限公司 多节点系统管理方法
CN103955441B (zh) * 2014-04-02 2017-04-12 华为技术有限公司 一种设备管理系统、方法及一种io扩展接口
BR112016030547B1 (pt) 2014-11-06 2022-11-16 Huawei Cloud Computing Technologies Co., Ltd Sistema e método de replicação e de armazenamento distribuído
CN104391779A (zh) * 2014-11-26 2015-03-04 浪潮电子信息产业股份有限公司 一种资产运维中自动识别设备物理位置的系统
CN104506362A (zh) * 2014-12-29 2015-04-08 浪潮电子信息产业股份有限公司 一种cc-numa多节点服务器上系统状态切换和监控的方法
CN106331047A (zh) * 2015-06-30 2017-01-11 中兴通讯股份有限公司 一种集群设备性能同步统计方法及系统
CN106603258A (zh) * 2015-10-16 2017-04-26 北京国双科技有限公司 数据发送的方法及装置
CN106452836B (zh) * 2016-08-31 2019-12-13 北京小米移动软件有限公司 主节点设置方法及装置
CN108243214B (zh) * 2016-12-26 2021-06-29 中国电信股份有限公司 牧群监控方法、装置和系统
CN107070688B (zh) * 2016-12-26 2020-06-16 瑞斯康达科技发展股份有限公司 一种配置节点的方法及节点
CN107121945A (zh) * 2017-04-19 2017-09-01 成都铅笔科技有限公司 一种网络节点设备控制系统及方法
CN107370817A (zh) * 2017-07-30 2017-11-21 安徽云帮邦网络技术有限公司 一种智能电表云数据存储系统
CN107302465B (zh) * 2017-08-18 2021-06-29 郑州云海信息技术有限公司 一种PCIe Switch服务器整机管理方法
CN109428756A (zh) * 2017-08-31 2019-03-05 捷讯科技股份有限公司 无线区网的代理管理方法
CN107579860A (zh) * 2017-09-29 2018-01-12 新华三技术有限公司 节点选举方法及装置
CN109684279B (zh) * 2017-10-18 2020-12-08 中移(苏州)软件技术有限公司 一种数据处理方法及系统
CN108173735B (zh) * 2018-01-17 2020-08-25 苏州浪潮智能科技有限公司 一种GPU Box服务器级联通信方法、装置及系统
CN110417927B (zh) * 2018-04-28 2021-06-18 比亚迪股份有限公司 列车车厢网络通信地址的分配方法及系统
CN109213701A (zh) * 2018-08-28 2019-01-15 郑州云海信息技术有限公司 共享io板的外设的控制方法、系统、设备及存储介质
CN109471646A (zh) * 2018-11-01 2019-03-15 郑州云海信息技术有限公司 一种服务器的bmc版本的升级方法、装置及存储介质
CN109548056B (zh) * 2018-11-30 2021-07-23 中国人民解放军陆军工程大学 一种基于ros主从节点管理器的通信方法和系统
CN110737566B (zh) * 2019-09-17 2022-12-30 平安科技(深圳)有限公司 主机性能监控方法及装置、电子设备及存储介质
CN110706426A (zh) * 2019-10-09 2020-01-17 翼石电子股份有限公司 一种管理usb税控盘的方法及系统
CN111464662B (zh) * 2020-06-18 2021-03-05 北京国科天迅科技有限公司 一种多节点主从式网络系统
CN112238790A (zh) * 2020-09-16 2021-01-19 中船动力研究院有限公司 一种船用蓄电池单元的控制方法及混合电力推进系统
CN112187542A (zh) * 2020-09-28 2021-01-05 深圳市玄羽科技有限公司 数据通信的集群方法及系统
CN112601216B (zh) * 2020-12-10 2022-06-21 苏州浪潮智能科技有限公司 一种基于Zigbee的可信平台告警方法与系统
CN112462955A (zh) * 2021-01-25 2021-03-09 北京小鸟科技股份有限公司 分布式kvm坐席的多输出节点控制方法、系统、设备
CN113162797B (zh) * 2021-03-03 2023-03-21 山东英信计算机技术有限公司 一种分布式集群的主节点故障的切换方法、系统及介质
CN114124650A (zh) * 2021-12-08 2022-03-01 中国电子科技集团公司第三十四研究所 一种sptn网络控制器主从部署方法
CN114844591A (zh) * 2022-05-12 2022-08-02 北京领为军融科技有限公司 一种用于空战飞行模拟器的多节点同步方法
CN115529261A (zh) * 2022-08-31 2022-12-27 苏州浪潮智能科技有限公司 一种多bmc的通信方法、装置、设备和存储介质
CN116126649A (zh) * 2023-04-19 2023-05-16 苏州浪潮智能科技有限公司 分节点管控方法、检测方法、装置、服务器、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094228A (zh) * 2007-07-27 2007-12-26 哈尔滨工业大学 Arp工作过程展现系统
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN102187640A (zh) * 2011-04-13 2011-09-14 华为技术有限公司 多业务节点管理系统、装置及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147858A1 (en) * 2006-12-13 2008-06-19 Ramkrishna Prakash Distributed Out-of-Band (OOB) OS-Independent Platform Management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094228A (zh) * 2007-07-27 2007-12-26 哈尔滨工业大学 Arp工作过程展现系统
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN102187640A (zh) * 2011-04-13 2011-09-14 华为技术有限公司 多业务节点管理系统、装置及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3697026A4 (en) * 2017-11-27 2020-11-25 Huawei Technologies Co., Ltd. METHOD FOR COLLABORATION OF MULTIPLE TERMINAL DEVICES, TERMINAL DEVICE AND SYSTEM FOR COOPERATION OF MULTIPLE TERMINAL DEVICES

Also Published As

Publication number Publication date
CN102571452A (zh) 2012-07-11

Similar Documents

Publication Publication Date Title
CN102571452B (zh) 多节点管理的方法和系统
CN106331098B (zh) 一种服务器集群系统
CN102035862B (zh) Svc集群中配置节点的故障移交方法和系统
US9189349B2 (en) Distributed blade server system, management server and switching method
CN104104543B (zh) 一种基于snmp和ipmi协议的服务器管理系统及方法
US7562247B2 (en) Providing independent clock failover for scalable blade servers
CN101902361B (zh) 容灾业务系统及容灾方法
CN104221004A (zh) 对互连失效在群集范围内的一致性检测
CN101212345A (zh) 一种刀片服务器管理系统
CN107666493B (zh) 一种数据库配置方法及其设备
CN103117874A (zh) 一种刀片服务器管理网络快速配置方法
CN102354261A (zh) 机房服务器电源开关远程控制系统
CN102843259A (zh) 集群内中间件自管理热备方法及系统
CN109194514A (zh) 一种双机监测方法、装置、服务器及存储介质
CN105739656A (zh) 具有自动重置功能的机柜及其自动重置方法
US10554497B2 (en) Method for the exchange of data between nodes of a server cluster, and server cluster implementing said method
CN102455951A (zh) 一种虚拟机容错方法和系统
CN102904754A (zh) 服务器管理方法和系统
CN109600260A (zh) 分布式存储系统高可用组件配置方法、系统及装置
CN102035682A (zh) 一种刀片服务器的远程控制方法
CN113626183A (zh) 一种基于超融合基础架构的集群构建方法和装置
CN100550771C (zh) 实现远程加载单板固件的方法和系统
CN102291303B (zh) 一种单板及其确定主备状态的方法
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
JP6395858B2 (ja) ネットワークデバイス発見方法、ネットワークデバイス、およびネットワークデバイス発見システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211222

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: Super fusion Digital Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.