CN116594844A - 管理系统、整机柜服务器、管理方法、设备以及存储介质 - Google Patents
管理系统、整机柜服务器、管理方法、设备以及存储介质 Download PDFInfo
- Publication number
- CN116594844A CN116594844A CN202310623841.7A CN202310623841A CN116594844A CN 116594844 A CN116594844 A CN 116594844A CN 202310623841 A CN202310623841 A CN 202310623841A CN 116594844 A CN116594844 A CN 116594844A
- Authority
- CN
- China
- Prior art keywords
- management
- management controller
- cabinet
- rack
- baseboard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 479
- 238000000034 method Methods 0.000 claims description 23
- 230000004308 accommodation Effects 0.000 claims description 16
- 238000012544 monitoring process Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 239000000758 substrate Substances 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 4
- 238000001816 cooling Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000017525 heat dissipation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000033748 Device issues Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/28—Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Power Sources (AREA)
Abstract
本发明公开了一种管理系统、整机柜服务器、管理方法、设备以及存储介质,其中,管理系统设置于服务器节点;系统包括第一电路板和第二电路板,第一电路板包括基板管理控制器以及与基板管理控制器连接的管理端口,基板管理控制器用于对服务器节点进行管理,并通过管理端口输出或接收对服务器节点进行管理的节点管理数据;第二电路板包括与基板管理控制器连接的机架管理控制器,机架管理控制器用于对服务器节点所在的机柜进行管理,并通过基板管理控制器和管理端口输出或接收对机柜进行管理的机柜管理数据。可以减少交换机的端口消耗。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种管理系统、整机柜服务器、管理方法、设备以及存储介质。
背景技术
整机柜服务器,是指将传统的机架、机器分离的架构融合为一个独立的产品,以一个整机柜为最小颗粒进行交付的服务器。在整机柜服务器中,电源、散热、交换等非计算机体系模块被整合安装在机柜内,机柜的剩余空间用于高度部署服务器节点。RMC(RackManagement Controller,机架管理控制器)对整机柜服务器中的服务器节点、电源、风扇等模块进行集中监控和管理。比如,RMC可以侦测服务器节点的温度、功耗、ID配置、工作状态等,并控制服务器节点的开关机。又比如,RMC可以侦测电源节点的输入输出功耗、电压/电流值、工作状态、故障状态,并控制电源节点的开关。又比如,RMC可以侦测风扇节点的转速、功耗、工作状态、故障状态,并调控风扇转速。
在一些技术中,RMC会通过网络转换芯片接出一个管理接口。该管理接口需要连接到管理交换机。由于每个整机柜服务器通常分别具有一个RMC,这就会大量占用管理交换机的端口。比如,假设有10个整机柜服务器,就需要占用管理交换机的10个端口。
发明内容
有鉴于此,本发明实施方法提供了一种管理系统、整机柜服务器、管理方法、电子设备以及计算机可读存储介质,可以减少交换机的端口开销。
本发明一方面提供了一种管理系统,所述管理系统设置于服务器节点;所述系统包括:
第一电路板,包括基板管理控制器以及与所述基板管理控制器连接的管理端口,所述基板管理控制器用于对所述服务器节点进行管理,并通过所述管理端口输出或接收对所述服务器节点进行管理的节点管理数据;
第二电路板,包括与所述基板管理控制器连接的机架管理控制器,所述机架管理控制器用于对所述服务器节点所在的机柜进行管理,并通过所述基板管理控制器和所述管理端口输出或接收对所述机柜进行管理的机柜管理数据。
在一些实施例中,所述机柜内设置有机柜使能设备,所述机柜管理数据包括所述机柜使能设备的运行数据和针对所述机柜使能设备的控制指令;所述机架管理控制器具体用于监控所述机柜使能设备的运行数据,并通过所述基板管理控制器和所述管理端口输出相应的监控结果;和/或
通过所述基板管理控制器和所述管理端口接收针对所述机柜使能设备的控制指令,以对所述机柜使能设备进行控制。
在一些实施例中,所述机柜使能设备包括与所述机架管理控制器连接的供电装置,所述供电装置包括多个供电电源,所述机架管理控制器具体用于监控所述供电装置的功耗,并通过所述基板管理控制器和所述管理端口输出相应的监控结果;和/或
通过所述基板管理控制器和所述管理端口接收针对所述供电装置的控制指令,以对供电装置的供电量进行控制。
在一些实施例中,所述基板管理控制器与所述机架管理控制器之间包括数据传输通道和管理通道,其中,所述数据传输通道用于传输所述机柜管理数据,所述管理通道用于所述基板管理控制器对所述机架管理控制器进行管理。
在一些实施例中,所述管理通道包括第一管理通道和第二管理通道;所述基板管理控制器用于:
通过所述第一管理通道接收所述机架管理控制器发送的运行状态信号,并在预设时长内未接收到所述运行状态信号的情况下,通过所述第二管理通道对所述机架管理控制器执行重启操作,其中,所述运行状态信号用于表征所述机架管理控制器处于正常运行状态。
在一些实施例中,在所述预设时长内未接收到所述运行状态信号的情况下,所述基板管理控制器还用于通过所述管理端口输出表征所述机架管理控制器异常的消息。
本发明另一方面还提供了一种整机柜服务器,所述整机柜服务器包括:
机柜,所述机柜多个容纳空间;
多个服务器节点,每个所述服务器节点位于其中一个容纳空间,并且,在所述多个服务器节点中,至少一个服务器节点包括如上所述的管理系统。
在一些实施例中,在包括所述管理系统的服务器节点中,所述第二电路板可拆卸的设置于该服务器节点。
在一些实施例中,在所述多个容纳空间中,其中一个所述容纳空间为供电容纳空间,所述供电容纳空间用于容纳所述机柜的供电装置,并且,包括所述管理系统的服务器节点位于与所述供电容纳空间相邻的容纳空间内。
本发明另一方面还提供了一种管理方法,应用于服务器节点,所述服务器节点包括基板管理控制器、与所述基板管理控制器连接的管理端口以及机架管理控制器;所述方法包括:
基于所述基板管理控制器对所述服务器节点进行管理,并通过所述管理端口输出或接收对所述服务器节点进行管理的节点管理数据;
基于所述机架管理控制器对所述服务器节点所在的机柜进行管理,并通过所述基板管理控制器和所述管理端口输出或接收对所述机柜进行管理的机柜管理数据。
在一些实施例中,所述基板管理控制器与所述机架管理控制器之间包括管理通道;所述方法还包括:
由所述基板管理控制器通过所述管理通道对所述机架管理控制器进行管理。
在一些实施例中,所述管理通道包括第一管理通道和第二管理通道;
所述由所述基板管理控制器通过所述管理通道对所述机架管理控制器进行管理,包括:
由所述基板管理控制器通过所述第一管理通道接收所述机架管理控制器发送的运行状态信号,并且,在预设时长内未接收到所述运行状态信号的情况下,由所述基板管理控制器通过所述第二管理通道对所述机架管理控制器执行重启操作。
本发明另一方面还提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现如上所述的方法。
本发明另一方面还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现如上所述的方法。
在本申请一些实施例的技术方案中,在服务器节点内设置第一电路板和第二电路板,第一电路板中的基板管理控制器与第二电路板中的机架管理控制器连接,基板管理控制器和机架管理控制器可以共用管理端口,即基板管理控制器通过管理端口输出或接收对服务器节点进行管理的节点管理数据,机架管理控制器通过基板管理控制器以及控制端口输出或接收对机柜进行管理的机柜管理数据。机架管理控制器可以无需引出控制端口,在管理交换机侧,也无需分配针对机架管理控制器的端口,减少了管理交换机的端口消耗。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了一些技术中的整机柜服务器的管理示意图;
图2示出了本申请的一个实施例提供的管理系统的模块框图;
图3示出了本申请的一个实施例提供的整机柜服务器的示意图;
图4示出了本申请的一个实施例提供的管理方法的流程示意图;
图5示出了本申请的一个实施例提供的电子设备的示意图。
具体实施方式
为使本发明实施方法的目的、技术方案和优点更加清楚,下面将结合本发明实施方法中的附图,对本发明实施方法中的技术方案进行清楚、完整地描述,显然,所描述的实施方法是本发明一部分实施方法,而不是全部的实施方法。基于本发明中的实施方法,本领域服务器管理人员在没有作出创造性劳动前提下所获得的所有其他实施方法,都属于本发明保护的范围。
相比于传统服务器,整机柜服务器具有成本低廉、功能集约和高度模块化等特点。比如,传统服务器是采用单机配置独立风扇进行散热,每台服务器节点需要6个系统风扇来保障散热。以一个机柜中放置48个服务器节点为例,一个机柜中的48个服务器节点所需要的风扇数量为288个。但在整机柜服务器中,可以将每个服务器节点的散热风扇整合为一个风扇墙,布局在整个机柜的后部,这样,48个服务器节点仅需18个风扇,极大降低了散热系统的功耗。又比如,传统服务器是采用单机配置独立电源进行供电,考虑到供电冗余,每个服务器节点需要配置双电源模块进行支撑。同样以一个机柜中放置48个服务器节点为例,一个机柜中的48个服务器节点就需要96个电源模块。但在整机柜服务器中,对各个服务器节点进行集中的统一供电,仅需8个电源模块便可满足48个服务器节点的供电需求,极大的降低了电源模块成本。
请参阅图1,为一些技术中的整机柜服务器11的管理示意图。整机柜服务器11包括机柜114,在机柜114中可以放置用于供电的电源装置112、机架管理控制器113以及服务器节点111。机架管理控制器113和每个服务器节点111中的基板管理控制器均需要引出一个管理端口。管理端口通过网线与管理交换机12连接,可以实现用户对服务器节点111和机柜114的管理。
具体的,管理交换机12可以与显示设备连接。显示设备可以展示服务器节点111的节点管理界面。每个服务器节点111的基板管理控制器可以通过对应的管理端口、管理交换机12上报节点管理数据给显示设备,以在节点管理界面中向用户展示节点管理数据。节点管理数据可以是基板管理控制器对服务器节点111进行监控管理得到的数据,比如服务器节点111中的芯片温度。同时,用户可以通过节点管理界面下发针对服务器节点111的节点控制指令。显示设备通过管理交换机12、管理端口将节点控制指令发送给服务器节点111中的基板管理控制器,以便于基板管理控制器基于节点控制指令,对所在的服务器节点111进行控制。比如,用户可以通过节点管理界面下发下电指令给基板管理控制器,由基板管理控制器对所在的服务器节点111执行下电操作。
类似的,显示设备还可以展示机柜114的机柜管理界面。机架管理控制器113可以通过对应的管理端口、管理交换机12上报机柜管理数据给显示设备,以在机柜管理界面中向用户展示机柜管理数据。机柜管理数据可以是机架管理控制器113对机柜114中的服务器节点111、电源装置112、风扇等模块进行集中监控和管理后得到的数据,比如电源装置112的功耗、风扇的转速等。同时,用户可以通过机柜管理界面下发针对机柜114的机柜控制指令。显示设备通过管理交换机12、管理端口将机柜控制指令发送给机架管理控制器113,以便于机架管理控制器113基于机柜控制指令,对所在的机柜114进行管理。比如,用户可以通过机柜管理界面下发功率调整指令给机架管理控制器113,由机架管理控制器113对电源装置112的功耗进行控制和调整。
在图1所示的管理示意图中,每个服务器节点111和机架管理控制器113均需要引出一个管理端口,以连接管理交换机12。每个机架管理控制器113需要单独占用管理交换机12的一个端口,增加了管理交换机12的端口开销,可能会提高管理成本。比如,在存在多个整机柜服务器11的情况下,由于每个整机柜服务器11包括一个机架管理控制器113,每个机架管理控制器113需要占用管理交换机12的一个端口,单就机架管理控制器113而言,可能就需要单独配置一个或多个管理交换机12。与此同时,还需为各个服务器节点111另外配置一个或多个管理交换机12。显然,所使用的管理交换机12的数量较多,管理成本较高。另外,在每个机柜114中,还需要为机架管理控制器113单独设置容纳空间,造成了机柜114的空间消耗。
鉴于此,本申请提供一种的管理系统,可以在整机柜服务器的管理中,减少管理交换机的端口消耗,降低管理成本。同时,还可以减少机柜的空间消耗。请参阅图2,为本申请的一个实施例提供的管理系统200的模块框图。管理系统200设置于服务器节点25。
图2中,管理系统200包括第一电路板21和第二电路板22。第一电路板21包括基板管理控制器211以及与基板管理控制器211连接的管理端口212,基板管理控制器211用于对服务器节点25进行管理,并通过管理端口212输出或接收对服务器节点25进行管理的节点管理数据。其中,节点管理数据以及基板管理控制器211对服务器节点25进行管理的过程,与图1中的相关描述类似,此处不赘述。第一电路板21又可称为主板、主机板等。
第二电路板22包括与基板管理控制器211连接的机架管理控制器221,机架管理控制器221用于对服务器节点25所在的机柜20进行管理,并通过基板管理控制器211和管理端口212输出或接收对机柜20进行管理的机柜管理数据。其中,机柜管理数据与图1中的相关描述类似,此处不赘述。
在图2所示实施例中,机架管理控制器221与基板管理控制器211可以共用控制端口。在机架管理控制器221需要通过管理交换机23进行数据上报时,可以首先将待上报的数据发送至基板管理控制器211,由基板管理控制器211将机架管理控制器221待上报的数据通过管理端口212发送至管理交换机23。在用户通过机柜管理界面下发针对机柜20的机柜控制指令时,显示设备可以通过管理端口212,将将机柜控制指令发送至基板管理控制器211,再由基板管理控制器211将机柜控制指令发送至机架管理控制器221。如此,机架管理控制器221可以无需引出控制端口,在管理交换机23侧,也无需分配针对机架管理控制器221的端口,减少了管理交换机23的端口消耗。
综上所述,在本申请一些实施例的技术方案中,在服务器节点25内设置第一电路板21和第二电路板22,第一电路板21中的基板管理控制器211与第二电路板22中的机架管理控制器221连接,基板管理控制器211和机架管理控制器221可以共用管理端口211,即基板管理控制器211通过管理端口211输出或接收对服务器节点25进行管理的节点管理数据,机架管理控制器221通过基板管理控制器211以及控制端口212输出或接收对机柜20进行管理的机柜管理数据。机架管理控制器221可以无需引出控制端口,在管理交换机23侧,也无需分配针对机架管理控制器221的端口,减少了管理交换机23的端口消耗,降低了管理成本。
另外,管理系统200设置于服务器节点25,即机架管理控制器221设置于服务器节点25内,因此,在机柜20内也可以无需为机架管理控制器221单独设置容纳空间,减少了机柜20的空间消耗。
以下结合具体的管理过程,对管理系统200作进一步的详细说明。
在一些实施例中,机柜20内设置有机柜使能设备24,机柜管理数据包括机柜使能设备24的运行数据和针对机柜使能设备24的控制指令;机架管理控制器221具体用于监控机柜使能设备24的运行数据,并通过基板管理控制器211和管理端口212输出相应的监控结果;以及通过基板管理控制器211和管理端口212接收针对机柜使能设备24的控制指令,以对机柜使能设备24进行控制。其中,机柜使能设备24指用于使服务器节点25正常工作的辅助设备。图2中,机柜使能设备24示例性的包括与机架管理控制器221连接的供电装置241和风扇242。以下以供电装置241和风扇242为例,来说明机架管理控制器221对机柜使能设备24的管理过程。
在一些实施例中,对于供电装置241来说,机架管理控制器221可以监控供电装置241的功耗,并通过基板管理控制器211和管理端口212输出相应的监控结果;以及通过基板管理控制器211和管理端口212接收针对供电装置241的控制指令,以对供电装置241的供电量进行控制。其中,供电装置241的功耗即机柜20内的设备耗电量。比如,运行中的服务器节点25较多时,设备耗电量会增加,供电装置241的功耗增大;运行中的服务器节点25减少时,设备耗电量会降低,供电装置241的功耗减小。机架管理控制器221在监控到供电装置241的功耗增大时,可以控制供电装置241提高供电量,以为机柜20内的设备提供足够的供电;在监控到供电装置241的功耗减小时,可以控制供电装置241减少供电量,以避免电能资源浪费。
具体的,供电装置241可以包括多个供电电源2411。供电电源2411用于给机柜20内的其它设备(比如服务器节点25、风扇242)供电。机架管理控制器221可以单独控制各个供电电源2411是否对外提供供电。在监控到机柜20内的设备耗电量减少时,机架管理控制器221可以在当前对外供电的供电电源2411中,控制部分供电电源2411停止对外供电,以减少供电量,避免电能资源浪费;在监控到机柜20内的设备耗电量增加时,机架管理控制器221可以控制当前未对外供电的供电电源2411开始对外供电,以提高供电量,保证机柜20内的设备正常工作。
当然,在机架管理控制器221将供电装置241的功耗通过基板管理控制器211和管理端口212进行上报后,若用户认为有必要对供电装置241的供电量进行调整,也可以通过机柜管理界面下发供电量调整指令。显示设备将供电量调整指令通过管理端口212和基板管理控制器211下发给机架管理控制器221后,机架管理控制器221可以基于供电量调整指令,对供电装置241的供电量进行调整。在一些实施例中,供电量调整指令可以包括用户选择的待启动供电或停止供电的目标供电电源2411。机架管理控制器221基于供电量调整指令,控制目标供电电源2411启动供电或停止供电。在另一些实施例中,供电量调整指令可以包括用户设置的供电装置241需对外提供的目标供电量。机架管理控制器221基于供电量调整指令,确定需启动供电或停止供电的供电电源2411,并对相应的供电电源2411进行控制,以使供电装置241输出目标供电量。
在一些实施例中,对于风扇242来说,机架管理控制器221可以监控机柜20内的设备温度,并基于设备温度,控制风扇242是否启动工作,以及风扇242工作时的转速。比如,机架管理控制器221可以监控服务器节点200内的芯片温度,在芯片温度超过温度阈值时,控制风扇242启动工作。风扇242的转速大小可以与芯片温度的高低成正比。
当然,机架管理控制器221也可以将监控到的设备温度通过基板管理控制器211和管理端口212上报给显示设备,由显示设备通过机柜管理界面向用户展示设备温度。用户基于展示的设备温度,可以通过机柜管理界面下发风扇控制指令,以对风扇242是否启动工作和风扇242工作时的转速进行控制。
具体的,请参阅图2,第二电路板22可以包括连接器222。机架管理控制器221通过CAN_BUS总线、RS485总线、I2C总线和GPIO总线连接。连接器222通过线缆与风扇242、供电装置241连接。
在一些实施例中,机架管理控制器221通过CAN_BUS总线和GPIO总线可以监控供电装置241的功耗、各个供电电源2411是否在位(即供电电源2411是否对外供电),以及控制供电装置241的供电量。
在一些实施例中,机架管理控制器221通过I2C总线和GPIO总线控制风扇242的转速并读取相关的senor信息。
在一些实施例中,机架管理控制器221通过RS485总线和GPIO总线获取机柜20内的服务器节点25的信息,比如机柜20内设置的服务器节点25的总数量、运行中的服务器节点25的数量等。在这些实施例中,连接器222还可以连接UV设备。UV设备用于对机柜20内的服务器节点25进行管理。机架管理控制器221从UV设备中获取服务器节点25的相关信息。
进一步的,考虑到基板管理控制器211需要同时用于接收节点管理数据、机柜管理数据,且节点管理数据是基板管理控制器211对服务器节点25进行管理的数据,机柜管理数据是机架管理控制器221对机柜20进行管理的数据。因此,在基板管理控制器211中,有必要对这两种数据进行区分,以便于机架管理控制器221确定是否将接收到的数据发送给机架管理控制器221。具体的,在基板管理控制器211通过管理端口212接收到的数据可以包括数据标识。在数据标识表征节点管理数据的情况下,基板管理控制器211基于接收到的数据,对服务器节点25进行管理;在数据标识表征机柜管理数据的情况下,基板管理控制器211将接收到的数据发送给机架管理控制器221,由机架管理控制221基于接收到的数据,对机柜20进行管理。
除以上描述的方案外,在一些实施例中,基板管理控制器211与机架管理控制器221之间包括数据传输通道和管理通道,其中,数据传输通道用于传输机柜管理数据,管理通道用于基板管理控制器211对机架管理控制器221进行管理。具体的,数据传输通道可以包括I3C/I2C总线。管理通道包括第一管理通道和第二管理通道,基板管理控制器211通过第一管理通道接收机架管理控制器221发送的运行状态信号,并在预设时长内未接收到运行状态信号的情况下,通过第二管理通道对机架管理控制器221执行重启操作,其中,运行状态信号用于表征机架管理控制器221处于正常运行状态。运行状态信号可以是Watchdog信号。在机架管理控制器221处于正常运行状态时,可以定时给基板管理控制器211发送Watchdog信号,以表示其处于正常运行状态。若基板管理控制器211在预设时长内未接收到Watchdog信号,可以表示机架管理控制器221运行异常,基板管理控制器211可以对机架管理控制器221执行重启操作,以保证机架管理控制器221可以正常工作。如此,管理系统200的可靠性更高。
进一步的,在预设时长内未接收到运行状态信号的情况下,基板管理控制器211还可以通过管理端口212输出表征机架管理控制器221异常的消息,以在机柜管理界面对用户进行提示,方便用户及时处理。
综上所述,本申请的管理系统200中,基板管理控制器211和机架管理控制器221连接且共用管理端口212。一方面,减少了管理交换机23的端口消耗;另一方面,基板管理控制器211对机架管理控制器221进行异常监控管理,提高了管理系统200的可靠性。
请参阅图3,为本申请的一个实施例提供的整机柜服务器31的示意图。结合参阅图2和图3。整机柜服务器31包括机柜313和多个服务器节点311。机柜313包括多个容纳空间310,每个服务器节点311位于其中一个容纳空间310,并且,在多个服务器节点311中,至少一个服务器节点311包括图2中的管理系统200。包括管理系统200的服务器节点311用于同时相应的服务器节点311和服务器节点311所在的机柜313。
在一些实施例中,在多个容纳空间310中,其中一个容纳空间310为供电容纳空间,供电容纳空间用于容纳机柜313的供电装置312,并且,包括管理系统200的服务器节点311位于与供电容纳空间相邻的容纳空间内。如此,便于机架管理控制器221与供电装置312通过缆线连接,简化整机柜服务器31的布线。
在一些实施例中,在包括管理系统200的服务器节点311中,第二电路板22可拆卸的设置于该服务器节点311。如此,可动态调整管理系统200所在的服务器节点311。在机柜313中调整服务器节点311的放置顺序时,若第二电路板22所在的服务器节点311被调整至距离供电装置312较远的位置,那么可以将第二电路板22从相应的服务器节点311中取出,并将第二电路板22放置到距离供电装置312较近的服务器节点311中,以简化整机柜服务器31的布线。
请参阅图4,为本申请的一个实施例提供的管理方法的流程示意图。管理方法可应用于图2中的服务器节点。服务器节点包括基板管理控制器、与基板管理控制器连接的管理端口以及机架管理控制器。图4中,管理方法包括如下步骤:
步骤S41,基于基板管理控制器对服务器节点进行管理,并通过管理端口输出或接收对服务器节点进行管理的节点管理数据;
步骤S42,基于机架管理控制器对服务器节点所在的机柜进行管理,并通过基板管理控制器和管理端口输出或接收对机柜进行管理的机柜管理数据。
在一些实施例中,基板管理控制器与机架管理控制器之间包括管理通道;方法还包括:
由基板管理控制器通过管理通道对机架管理控制器进行管理。
在一些实施例中,管理通道包括第一管理通道和第二管理通道;
由基板管理控制器通过管理通道对机架管理控制器进行管理,包括:
由基板管理控制器通过第一管理通道接收机架管理控制器发送的运行状态信号,并且,在预设时长内未接收到运行状态信号的情况下,由基板管理控制器通过第二管理通道对机架管理控制器执行重启操作。
在本申请一些实施例的技术方案中,在服务器节点内设置基板管理控制器和机架管理控制器,基板管理控制器和机架管理控制器连接,基板管理控制器和机架管理控制器连接,基板管理控制器和机架管理控制器可以共用管理端口,即基板管理控制器通过管理端口输出或接收对服务器节点进行管理的节点管理数据,机架管理控制器通过基板管理控制器以及控制端口输出或接收对机柜进行管理的机柜管理数据。机架管理控制器可以无需引出控制端口,在管理交换机侧,也无需分配针对机架管理控制器的端口,减少了管理交换机的端口消耗。
请参阅图5,为本申请的一个实施例提供的电子设备的示意图。电子设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的管理方法。
其中,处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施方式中的方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施方式中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请一个实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现上述的管理方法。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现上述的管理方法。
虽然结合附图描述了本发明的实施方法,但是本领域服务器管理人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (14)
1.一种管理系统,其特征在于,所述管理系统设置于服务器节点;所述系统包括:
第一电路板,包括基板管理控制器以及与所述基板管理控制器连接的管理端口,所述基板管理控制器用于对所述服务器节点进行管理,并通过所述管理端口输出或接收对所述服务器节点进行管理的节点管理数据;
第二电路板,包括与所述基板管理控制器连接的机架管理控制器,所述机架管理控制器用于对所述服务器节点所在的机柜进行管理,并通过所述基板管理控制器和所述管理端口输出或接收对所述机柜进行管理的机柜管理数据。
2.如权利要求1所述的系统,其特征在于,所述机柜内设置有机柜使能设备,所述机柜管理数据包括所述机柜使能设备的运行数据和针对所述机柜使能设备的控制指令;所述机架管理控制器具体用于监控所述机柜使能设备的运行数据,并通过所述基板管理控制器和所述管理端口输出相应的监控结果;和/或
通过所述基板管理控制器和所述管理端口接收针对所述机柜使能设备的控制指令,以对所述机柜使能设备进行控制。
3.如权利要求2所述的系统,其特征在于,所述机柜使能设备包括与所述机架管理控制器连接的供电装置,所述供电装置包括多个供电电源,所述机架管理控制器具体用于监控所述供电装置的功耗,并通过所述基板管理控制器和所述管理端口输出相应的监控结果;和/或
通过所述基板管理控制器和所述管理端口接收针对所述供电装置的控制指令,以对供电装置的供电量进行控制。
4.如权利要求1所述的系统,其特征在于,所述基板管理控制器与所述机架管理控制器之间包括数据传输通道和管理通道,其中,所述数据传输通道用于传输所述机柜管理数据,所述管理通道用于所述基板管理控制器对所述机架管理控制器进行管理。
5.如权利要求4所述的系统,其特征在于,所述管理通道包括第一管理通道和第二管理通道;所述基板管理控制器用于:
通过所述第一管理通道接收所述机架管理控制器发送的运行状态信号,并在预设时长内未接收到所述运行状态信号的情况下,通过所述第二管理通道对所述机架管理控制器执行重启操作,其中,所述运行状态信号用于表征所述机架管理控制器处于正常运行状态。
6.如权利要求5所述的系统,其特征在于,在所述预设时长内未接收到所述运行状态信号的情况下,所述基板管理控制器还用于通过所述管理端口输出表征所述机架管理控制器异常的消息。
7.一种整机柜服务器,其特征在于,所述整机柜服务器包括:
机柜,所述机柜多个容纳空间;
多个服务器节点,每个所述服务器节点位于其中一个容纳空间,并且,在所述多个服务器节点中,至少一个服务器节点包括如权利要求1至6任一所述的管理系统。
8.如权利要求7所述的整机柜服务器,其特征在于,在包括所述管理系统的服务器节点中,所述第二电路板可拆卸的设置于该服务器节点。
9.如权利要求8所述的整机柜服务器,其特征在于,在所述多个容纳空间中,其中一个所述容纳空间为供电容纳空间,所述供电容纳空间用于容纳所述机柜的供电装置,并且,包括所述管理系统的服务器节点位于与所述供电容纳空间相邻的容纳空间内。
10.一种管理方法,其特征在于,应用于服务器节点,所述服务器节点包括基板管理控制器、与所述基板管理控制器连接的管理端口以及机架管理控制器;所述方法包括:
基于所述基板管理控制器对所述服务器节点进行管理,并通过所述管理端口输出或接收对所述服务器节点进行管理的节点管理数据;
基于所述机架管理控制器对所述服务器节点所在的机柜进行管理,并通过所述基板管理控制器和所述管理端口输出或接收对所述机柜进行管理的机柜管理数据。
11.如权利要求10所述的方法,其特征在于,所述基板管理控制器与所述机架管理控制器之间包括管理通道;所述方法还包括:
由所述基板管理控制器通过所述管理通道对所述机架管理控制器进行管理。
12.如权利要求11所述的方法,其特征在于,所述管理通道包括第一管理通道和第二管理通道;
所述由所述基板管理控制器通过所述管理通道对所述机架管理控制器进行管理,包括:
由所述基板管理控制器通过所述第一管理通道接收所述机架管理控制器发送的运行状态信号,并且,在预设时长内未接收到所述运行状态信号的情况下,由所述基板管理控制器通过所述第二管理通道对所述机架管理控制器执行重启操作。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现如权利要求10至12中任一所述的方法。
14.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求10至12中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310623841.7A CN116594844A (zh) | 2023-05-30 | 2023-05-30 | 管理系统、整机柜服务器、管理方法、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310623841.7A CN116594844A (zh) | 2023-05-30 | 2023-05-30 | 管理系统、整机柜服务器、管理方法、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116594844A true CN116594844A (zh) | 2023-08-15 |
Family
ID=87595428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310623841.7A Pending CN116594844A (zh) | 2023-05-30 | 2023-05-30 | 管理系统、整机柜服务器、管理方法、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116594844A (zh) |
-
2023
- 2023-05-30 CN CN202310623841.7A patent/CN116594844A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8656003B2 (en) | Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed | |
CN102510344B (zh) | 机柜服务器系统 | |
US9582010B2 (en) | System and method of rack management | |
CN110392001B (zh) | 机架级网络交换机 | |
US10275004B2 (en) | Data center management | |
US9619422B2 (en) | Server system and method for transferring at least one chassis-specific configuration value | |
US20150116913A1 (en) | System for sharing power of rack mount server and operating method thereof | |
US9037878B2 (en) | Server rack system | |
TW201719405A (zh) | 機櫃的監控系統 | |
US11733762B2 (en) | Method to allow for higher usable power capacity in a redundant power configuration | |
US20130159039A1 (en) | Data center infrastructure management system for maintenance | |
US20110145620A1 (en) | Method of using power supply to perform far-end monitoring of electronic system | |
JP2008083841A (ja) | ブレードサーバ、ブレード装置、及びブレードサーバの電力管理方法 | |
US9535479B2 (en) | Method of performing power management in rack-mount system | |
CN106940676B (zh) | 机柜的监控系统 | |
CN111324503B (zh) | 机框管理装置、方法和计算机可读存储介质 | |
CN107533348B (zh) | 热管理高性能计算系统的方法和装置及计算机可读介质 | |
US9606560B2 (en) | Computer system, arrangement for remote maintenance and remote maintenance method | |
TW201729097A (zh) | 機櫃裝置 | |
CN113629853A (zh) | 一种服务器电源互联冗余供电系统及方法 | |
CN103605413A (zh) | 机架式服务器系统的机柜、机架式服务器系统及其管理方法 | |
JP2016167213A (ja) | ブレード装置およびブレード装置管理方法 | |
CN116594844A (zh) | 管理系统、整机柜服务器、管理方法、设备以及存储介质 | |
CN108150442B (zh) | 机柜风扇控制方法及模块 | |
TW201344403A (zh) | 電源管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |