CN104102291A - 刀片服务器、刀片服务器的监控管理方法和系统 - Google Patents

刀片服务器、刀片服务器的监控管理方法和系统 Download PDF

Info

Publication number
CN104102291A
CN104102291A CN201410351345.1A CN201410351345A CN104102291A CN 104102291 A CN104102291 A CN 104102291A CN 201410351345 A CN201410351345 A CN 201410351345A CN 104102291 A CN104102291 A CN 104102291A
Authority
CN
China
Prior art keywords
blade
calculating
status information
managing
address information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410351345.1A
Other languages
English (en)
Inventor
徐进
叶丰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201410351345.1A priority Critical patent/CN104102291A/zh
Publication of CN104102291A publication Critical patent/CN104102291A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种刀片服务器、刀片服务器监控管理方法和系统,其中方法包括管理刀片获取计算刀片的状态信息和地址信息;管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;如果判断出有计算刀片异常,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。本发明通过刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程监控和管理,因此操作简单便利。

Description

刀片服务器、刀片服务器的监控管理方法和系统
技术领域
本发明涉及服务器监控技术领域,尤其涉及一种刀片服务器、刀片服务器的监控管理方法和系统。
背景技术
刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块刀片实际上就是一块系统主板,类似于一个个独立的服务器。每一块刀片运行自己的系统,可以服务于指定的不同用户群,相互之间没有关联,也可以集合成一个服务器集群,为相同的用户群服务。刀片服务器具有高计算密度、优化部署、方便管理、资源共享及高性价比等明显优势,因此得到越来越广泛的应用,而提高对刀片服务器的监控管理,成为业界努力的一个方向。
对于刀片服务器的监控管理跟机架式服务器监控管理的不同点主要体现在:对于机架式服务器,需要对处理器、内存、硬盘、外设、风扇、电源,甚至于还有网卡进行监控管理;而对于刀片服务器,每一块刀片集中有处理器、内存等部件,因此对刀片服务器而言是对每一块刀片进行监控管理。
刀片服务器包括多种刀片,根据功能区分,刀片服务器可以包括计算刀片和管理刀片,计算刀片负责数据计算,管理刀片负责对所有计算刀片进行管理。目前,对刀片服务器系统的监控管理是通过管理刀片与终端有线连接,需要操作人员进行有线的近距离操作,操作复杂且不便。
发明内容
为了解决上述技术问题,本发明提供了一种刀片服务器、刀片服务器的监控管理方法和系统,能够实现对刀片服务器的无线监控和管理,操作简单便利。
为了达到本发明目的,本发明提供了一种刀片服务器监控管理方法,包括:管理刀片获取计算刀片的状态信息和地址信息;管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;如果判断出有计算刀片异常,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
该方法还包括:计算刀片的计算BMC收集所述计算刀片的状态信息和地址信息,将计算刀片的状态信息和地址信息发送给管理刀片的管理BMC;管理刀片获取计算刀片的状态信息和地址信息,包括:管理刀片的管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息。
管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备,包括:管理刀片的管理BMC通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
该方法还包括:监控管理设备预先设置状态信息的阈值;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常,包括:如果计算刀片的状态信息在状态信息的阈值内,则监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则监控管理设备判断对应的计算刀片异常。
一种刀片服务器,其特征在于,包括:计算刀片和管理刀片,其中,计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;管理刀片,获取各计算刀片的状态信息和地址信息,并将各计算刀片的状态信息和地址信息发送给监控管理设备,以使监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
计算刀片包括计算基板控制器BMC,计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
管理刀片包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块;管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
一种刀片服务器监控管理系统,包括刀片服务器和监控管理设备,刀片服务器,包括计算刀片和管理刀片,计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;管理刀片,获取各计算刀片的状态信息和地址信息,并将各计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
计算刀片包括计算基板控制器BMC,所述计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
管理刀片包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块;管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
监控管理设备还用于预先设置状态信息的阈值;如果计算刀片的状态信息在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片异常。
与现有技术相比,本发明包括:管理刀片获取计算刀片的状态信息和地址信息;管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;如果判断出有计算刀片异常,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。本发明通过刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程监控和管理。
进一步地,在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
附图说明
图1是本发明刀片服务器监控管理系统的架构示意图。
图2是本发明刀片服务器监控管理方法的流程示意图。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。
图1是本发明刀片服务器监控管理系统的架构示意图,如图1所示,刀片服务器包括计算刀片和管理刀片,其中,计算刀片包括计算基板控制器(BMC,Baseboard Management Controller),管理刀片包括管理BMC和路由模块,路由模块包括网络路由子模块及无线接入点子模块。网络路由子模块连接管理刀片及各计算刀片之间的网络,实现刀片服务器内部互连,无线接入点子模块通过无线网络连接外部监控管理设备,从而实现监控管理设备对刀片服务器的无线监控管理。
图2是本发明刀片服务器监控管理方法的流程示意图,如图2并结合图1所示,具体包括:
步骤21,管理刀片获取计算刀片的状态信息和地址信息。
在本步骤之前,计算刀片的计算BMC收集该计算刀片的状态信息和地址信息,将计算刀片的状态信息和地址信息发送给管理刀片的管理BMC,其中状态信息可以包括电流电压、温度、风扇转速等状态参数。
在本步骤中,管理刀片的管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,如此可以通过地址信息查找到相应的计算刀片和该计算刀片的状态信息。
步骤22,管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备。
在本步骤中,管理刀片的管理BMC通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
步骤23,监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常,如果是,返回步骤21,如果否,进行步骤24。
在本步骤之前,监控管理设备预先设置状态信息的阈值。
在本步骤中,如果计算刀片的状态信息在状态信息的阈值内,则监控管理设备判断出对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则监控管理设备判断出对应的计算刀片异常。
步骤24,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
在本步骤中,对处于异常状态的计算刀片进行管理,具体可以例如通过远程调节调整电流电压、温度和/或风扇转速等方式来对处于异常状态的计算刀片进行管理。
本发明通过在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
继续参考图1,该刀片服务器包括计算刀片和管理刀片,其中,
计算刀片,包括计算BMC,该计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片;
管理刀片,包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块,该管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备,以使监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
本发明通过在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
继续参考图1,该刀片服务器监控管理系统包括刀片服务器和监控管理设备,其中,
刀片服务器,包括计算刀片和管理刀片,该计算刀片包括计算BMC,该计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片;管理刀片包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块,该管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备;
监控管理设备,用于根据来自刀片服务器的计算刀片的状态信息,判断对应的计算刀片是否正常;根据计算刀片的地址信息,对处于异常状态的计算刀片进行管理。
本发明通过在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
应当理解,虽然本说明书根据实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用于限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (11)

1.一种刀片服务器监控管理方法,其特征在于,包括:
管理刀片获取计算刀片的状态信息和地址信息;
所述管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;
所述监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;
如果判断出有计算刀片异常,所述监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
2.根据权利要求1所述的刀片服务器监控管理方法,其特征在于,该方法还包括:计算刀片的计算BMC收集所述计算刀片的状态信息和地址信息,将所述计算刀片的状态信息和地址信息发送给管理刀片的管理BMC;
所述管理刀片获取计算刀片的状态信息和地址信息,包括:
所述管理刀片的管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息。
3.根据权利要求1所述的刀片服务器监控管理方法,其特征在于,所述管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备,包括:
所述管理刀片的管理BMC通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
4.根据权利要求1所述的刀片服务器监控管理方法,其特征在于,该方法还包括:所述监控管理设备预先设置状态信息的阈值;
所述监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常,包括:
如果计算刀片的状态信息在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片异常。
5.一种刀片服务器,其特征在于,包括计算刀片和管理刀片,其中,
所述计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;
所述管理刀片,获取各计算刀片的状态信息和地址信息,并将所述各计算刀片的状态信息和地址信息发送给监控管理设备,以使监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
6.根据权利要求5所述的刀片服务器,其特征在于,所述计算刀片包括计算基板控制器BMC;
所述计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
7.根据权利要求5所述的刀片服务器,其特征在于,所述管理刀片包括管理BMC和路由模块,其中所述路由模块包括网络路由子模块及无线接入点子模块;
所述管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
8.一种刀片服务器监控管理系统,其特征在于,包括刀片服务器和监控管理设备,
所述刀片服务器,包括计算刀片和管理刀片,所述计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;所述管理刀片,获取各计算刀片的状态信息和地址信息,并将所述各计算刀片的状态信息和地址信息发送给监控管理设备;
所述监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
9.根据权利要求8所述的刀片服务器监控管理系统,其特征在于,所述计算刀片包括计算基板控制器BMC,所述计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
10.根据权利要求8所述的刀片服务器监控管理系统,其特征在于,所述管理刀片包括管理BMC和路由模块,其中所述路由模块包括网络路由子模块及无线接入点子模块;
所述管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
11.根据权利要求8所述的刀片服务器监控管理系统,其特征在于,所述监控管理设备还用于预先设置状态信息的阈值;
如果计算刀片的状态信息在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片异常。
CN201410351345.1A 2014-07-22 2014-07-22 刀片服务器、刀片服务器的监控管理方法和系统 Pending CN104102291A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410351345.1A CN104102291A (zh) 2014-07-22 2014-07-22 刀片服务器、刀片服务器的监控管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410351345.1A CN104102291A (zh) 2014-07-22 2014-07-22 刀片服务器、刀片服务器的监控管理方法和系统

Publications (1)

Publication Number Publication Date
CN104102291A true CN104102291A (zh) 2014-10-15

Family

ID=51670506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410351345.1A Pending CN104102291A (zh) 2014-07-22 2014-07-22 刀片服务器、刀片服务器的监控管理方法和系统

Country Status (1)

Country Link
CN (1) CN104102291A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450472A (zh) * 2015-12-03 2016-03-30 广州云新信息技术有限公司 一种自动获取服务器物理部件状态的方法及装置
CN106598788A (zh) * 2015-10-20 2017-04-26 鸿富锦精密电子(天津)有限公司 服务器管理装置
CN106897245A (zh) * 2017-02-22 2017-06-27 郑州云海信息技术有限公司 一种机柜式计算器
CN110413484A (zh) * 2019-08-02 2019-11-05 西安微电子技术研究所 一种支持异构平台的集群监控方法
CN111988810A (zh) * 2020-08-13 2020-11-24 苏州浪潮智能科技有限公司 一种基于MIWI的无线服务器监管方法及mesh组网装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101277214A (zh) * 2007-03-28 2008-10-01 联想(北京)有限公司 一种管理刀片式服务器的方法及系统
CN102073344A (zh) * 2010-12-10 2011-05-25 曙光信息产业(北京)有限公司 具有无线模块的刀片服务器管理模块以及刀片服务器系统
CN102510344A (zh) * 2011-11-23 2012-06-20 华为技术有限公司 机柜服务器系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101277214A (zh) * 2007-03-28 2008-10-01 联想(北京)有限公司 一种管理刀片式服务器的方法及系统
CN102073344A (zh) * 2010-12-10 2011-05-25 曙光信息产业(北京)有限公司 具有无线模块的刀片服务器管理模块以及刀片服务器系统
CN102510344A (zh) * 2011-11-23 2012-06-20 华为技术有限公司 机柜服务器系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598788A (zh) * 2015-10-20 2017-04-26 鸿富锦精密电子(天津)有限公司 服务器管理装置
CN106598788B (zh) * 2015-10-20 2020-08-28 鸿富锦精密电子(天津)有限公司 服务器管理装置
CN105450472A (zh) * 2015-12-03 2016-03-30 广州云新信息技术有限公司 一种自动获取服务器物理部件状态的方法及装置
CN106897245A (zh) * 2017-02-22 2017-06-27 郑州云海信息技术有限公司 一种机柜式计算器
CN110413484A (zh) * 2019-08-02 2019-11-05 西安微电子技术研究所 一种支持异构平台的集群监控方法
CN110413484B (zh) * 2019-08-02 2023-01-31 西安微电子技术研究所 一种支持异构平台的集群监控方法
CN111988810A (zh) * 2020-08-13 2020-11-24 苏州浪潮智能科技有限公司 一种基于MIWI的无线服务器监管方法及mesh组网装置
CN111988810B (zh) * 2020-08-13 2022-12-09 苏州浪潮智能科技有限公司 一种基于MIWI的无线服务器监管方法及mesh组网装置

Similar Documents

Publication Publication Date Title
CN102571441B (zh) 整机柜智能管理方法、系统及装置
US6785827B2 (en) System for determining servers power supply requirement by sampling power usage values thereof at a rate based upon the criticality of its availability
AU2018313839B2 (en) Rack level power control
EP2625614B1 (en) System and method for monitoring and managing data center resources in real time incorporating manageability subsystem
US7921315B2 (en) Managing power consumption in a data center based on monitoring circuit breakers
US10061371B2 (en) System and method for monitoring and managing data center resources in real time incorporating manageability subsystem
CN104102291A (zh) 刀片服务器、刀片服务器的监控管理方法和系统
US10200203B2 (en) Controllers with integrated power over ethernet network switches
US10324430B2 (en) Infrastructure control fabric system and method
CN102722461B (zh) 存储管理系统的数据通信系统及通信方法
JP2016507838A (ja) 電子制御システム及び設備制御システムの統合制御
CN104238691B (zh) 服务器系统及其散热方法
CN103135732B (zh) 服务器机柜系统
US9363627B1 (en) Rack server system
US20130138997A1 (en) Rack system
WO2016151779A1 (ja) 情報処理装置及び管理装置
US8880642B2 (en) Server rack system
CN104503405B (zh) 基于scada系统的监控方法、装置和系统
US20130029578A1 (en) Managing system for dissipating heat from server group
US10599204B1 (en) Performance efficiency monitoring system
US9344327B2 (en) Wireless-based network management
US20150188747A1 (en) Cloud-based data center infrastructure management system and method
CN103049050B (zh) 一种刀片服务器的扩容配置方法及管理系统
CN206260192U (zh) 机房机柜的制冷容量评估系统
CN205453732U (zh) 云端监控的警示设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20141015

RJ01 Rejection of invention patent application after publication