CN104102291A - 刀片服务器、刀片服务器的监控管理方法和系统 - Google Patents
刀片服务器、刀片服务器的监控管理方法和系统 Download PDFInfo
- Publication number
- CN104102291A CN104102291A CN201410351345.1A CN201410351345A CN104102291A CN 104102291 A CN104102291 A CN 104102291A CN 201410351345 A CN201410351345 A CN 201410351345A CN 104102291 A CN104102291 A CN 104102291A
- Authority
- CN
- China
- Prior art keywords
- blade
- calculating
- status information
- managing
- address information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Computer And Data Communications (AREA)
Abstract
本发明提供了一种刀片服务器、刀片服务器监控管理方法和系统,其中方法包括管理刀片获取计算刀片的状态信息和地址信息;管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;如果判断出有计算刀片异常,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。本发明通过刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程监控和管理,因此操作简单便利。
Description
技术领域
本发明涉及服务器监控技术领域,尤其涉及一种刀片服务器、刀片服务器的监控管理方法和系统。
背景技术
刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块刀片实际上就是一块系统主板,类似于一个个独立的服务器。每一块刀片运行自己的系统,可以服务于指定的不同用户群,相互之间没有关联,也可以集合成一个服务器集群,为相同的用户群服务。刀片服务器具有高计算密度、优化部署、方便管理、资源共享及高性价比等明显优势,因此得到越来越广泛的应用,而提高对刀片服务器的监控管理,成为业界努力的一个方向。
对于刀片服务器的监控管理跟机架式服务器监控管理的不同点主要体现在:对于机架式服务器,需要对处理器、内存、硬盘、外设、风扇、电源,甚至于还有网卡进行监控管理;而对于刀片服务器,每一块刀片集中有处理器、内存等部件,因此对刀片服务器而言是对每一块刀片进行监控管理。
刀片服务器包括多种刀片,根据功能区分,刀片服务器可以包括计算刀片和管理刀片,计算刀片负责数据计算,管理刀片负责对所有计算刀片进行管理。目前,对刀片服务器系统的监控管理是通过管理刀片与终端有线连接,需要操作人员进行有线的近距离操作,操作复杂且不便。
发明内容
为了解决上述技术问题,本发明提供了一种刀片服务器、刀片服务器的监控管理方法和系统,能够实现对刀片服务器的无线监控和管理,操作简单便利。
为了达到本发明目的,本发明提供了一种刀片服务器监控管理方法,包括:管理刀片获取计算刀片的状态信息和地址信息;管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;如果判断出有计算刀片异常,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
该方法还包括:计算刀片的计算BMC收集所述计算刀片的状态信息和地址信息,将计算刀片的状态信息和地址信息发送给管理刀片的管理BMC;管理刀片获取计算刀片的状态信息和地址信息,包括:管理刀片的管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息。
管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备,包括:管理刀片的管理BMC通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
该方法还包括:监控管理设备预先设置状态信息的阈值;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常,包括:如果计算刀片的状态信息在状态信息的阈值内,则监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则监控管理设备判断对应的计算刀片异常。
一种刀片服务器,其特征在于,包括:计算刀片和管理刀片,其中,计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;管理刀片,获取各计算刀片的状态信息和地址信息,并将各计算刀片的状态信息和地址信息发送给监控管理设备,以使监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
计算刀片包括计算基板控制器BMC,计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
管理刀片包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块;管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
一种刀片服务器监控管理系统,包括刀片服务器和监控管理设备,刀片服务器,包括计算刀片和管理刀片,计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;管理刀片,获取各计算刀片的状态信息和地址信息,并将各计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
计算刀片包括计算基板控制器BMC,所述计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
管理刀片包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块;管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
监控管理设备还用于预先设置状态信息的阈值;如果计算刀片的状态信息在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片异常。
与现有技术相比,本发明包括:管理刀片获取计算刀片的状态信息和地址信息;管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;如果判断出有计算刀片异常,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。本发明通过刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程监控和管理。
进一步地,在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
附图说明
图1是本发明刀片服务器监控管理系统的架构示意图。
图2是本发明刀片服务器监控管理方法的流程示意图。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。
图1是本发明刀片服务器监控管理系统的架构示意图,如图1所示,刀片服务器包括计算刀片和管理刀片,其中,计算刀片包括计算基板控制器(BMC,Baseboard Management Controller),管理刀片包括管理BMC和路由模块,路由模块包括网络路由子模块及无线接入点子模块。网络路由子模块连接管理刀片及各计算刀片之间的网络,实现刀片服务器内部互连,无线接入点子模块通过无线网络连接外部监控管理设备,从而实现监控管理设备对刀片服务器的无线监控管理。
图2是本发明刀片服务器监控管理方法的流程示意图,如图2并结合图1所示,具体包括:
步骤21,管理刀片获取计算刀片的状态信息和地址信息。
在本步骤之前,计算刀片的计算BMC收集该计算刀片的状态信息和地址信息,将计算刀片的状态信息和地址信息发送给管理刀片的管理BMC,其中状态信息可以包括电流电压、温度、风扇转速等状态参数。
在本步骤中,管理刀片的管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,如此可以通过地址信息查找到相应的计算刀片和该计算刀片的状态信息。
步骤22,管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备。
在本步骤中,管理刀片的管理BMC通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
步骤23,监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常,如果是,返回步骤21,如果否,进行步骤24。
在本步骤之前,监控管理设备预先设置状态信息的阈值。
在本步骤中,如果计算刀片的状态信息在状态信息的阈值内,则监控管理设备判断出对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则监控管理设备判断出对应的计算刀片异常。
步骤24,监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对处于异常状态的计算刀片进行管理。
在本步骤中,对处于异常状态的计算刀片进行管理,具体可以例如通过远程调节调整电流电压、温度和/或风扇转速等方式来对处于异常状态的计算刀片进行管理。
本发明通过在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
继续参考图1,该刀片服务器包括计算刀片和管理刀片,其中,
计算刀片,包括计算BMC,该计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片;
管理刀片,包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块,该管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备,以使监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
本发明通过在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
继续参考图1,该刀片服务器监控管理系统包括刀片服务器和监控管理设备,其中,
刀片服务器,包括计算刀片和管理刀片,该计算刀片包括计算BMC,该计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片;管理刀片包括管理BMC和路由模块,其中路由模块包括网络路由子模块及无线接入点子模块,该管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备;
监控管理设备,用于根据来自刀片服务器的计算刀片的状态信息,判断对应的计算刀片是否正常;根据计算刀片的地址信息,对处于异常状态的计算刀片进行管理。
本发明通过在刀片服务器中增加路由模块,一方面通过网络路由子模块实现刀片服务器中计算刀片和管理刀片的网络连接,另一方面通过无线接入点子模块实现刀片服务器和外部监控管理设备的网络连接,实现对刀片服务器的远程无线监控和管理,因此操作简单便利。
应当理解,虽然本说明书根据实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用于限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (11)
1.一种刀片服务器监控管理方法,其特征在于,包括:
管理刀片获取计算刀片的状态信息和地址信息;
所述管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备;
所述监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常;
如果判断出有计算刀片异常,所述监控管理设备根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
2.根据权利要求1所述的刀片服务器监控管理方法,其特征在于,该方法还包括:计算刀片的计算BMC收集所述计算刀片的状态信息和地址信息,将所述计算刀片的状态信息和地址信息发送给管理刀片的管理BMC;
所述管理刀片获取计算刀片的状态信息和地址信息,包括:
所述管理刀片的管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息。
3.根据权利要求1所述的刀片服务器监控管理方法,其特征在于,所述管理刀片将获得的计算刀片的状态信息和地址信息发送给监控管理设备,包括:
所述管理刀片的管理BMC通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
4.根据权利要求1所述的刀片服务器监控管理方法,其特征在于,该方法还包括:所述监控管理设备预先设置状态信息的阈值;
所述监控管理设备根据计算刀片的状态信息,判断对应的计算刀片是否正常,包括:
如果计算刀片的状态信息在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片异常。
5.一种刀片服务器,其特征在于,包括计算刀片和管理刀片,其中,
所述计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;
所述管理刀片,获取各计算刀片的状态信息和地址信息,并将所述各计算刀片的状态信息和地址信息发送给监控管理设备,以使监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
6.根据权利要求5所述的刀片服务器,其特征在于,所述计算刀片包括计算基板控制器BMC;
所述计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
7.根据权利要求5所述的刀片服务器,其特征在于,所述管理刀片包括管理BMC和路由模块,其中所述路由模块包括网络路由子模块及无线接入点子模块;
所述管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
8.一种刀片服务器监控管理系统,其特征在于,包括刀片服务器和监控管理设备,
所述刀片服务器,包括计算刀片和管理刀片,所述计算刀片,用于收集计算刀片的状态信息和地址信息并发送给管理刀片;所述管理刀片,获取各计算刀片的状态信息和地址信息,并将所述各计算刀片的状态信息和地址信息发送给监控管理设备;
所述监控管理设备根据计算刀片的状态信息判断对应的计算刀片是否正常,如果判断出有计算刀片异常,根据计算刀片的地址信息查找到处于异常状态的计算刀片,并对所述处于异常状态的计算刀片进行管理。
9.根据权利要求8所述的刀片服务器监控管理系统,其特征在于,所述计算刀片包括计算基板控制器BMC,所述计算BMC收集计算刀片的状态信息和地址信息并发送给管理刀片。
10.根据权利要求8所述的刀片服务器监控管理系统,其特征在于,所述管理刀片包括管理BMC和路由模块,其中所述路由模块包括网络路由子模块及无线接入点子模块;
所述管理BMC通过网络路由子模块获取各计算BMC发送的计算刀片的状态信息和地址信息,通过无线接入点子模块将获得的计算刀片的状态信息和地址发送给监控管理设备。
11.根据权利要求8所述的刀片服务器监控管理系统,其特征在于,所述监控管理设备还用于预先设置状态信息的阈值;
如果计算刀片的状态信息在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片正常;如果计算刀片的状态信息不在状态信息的阈值内,则所述监控管理设备判断对应的计算刀片异常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410351345.1A CN104102291A (zh) | 2014-07-22 | 2014-07-22 | 刀片服务器、刀片服务器的监控管理方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410351345.1A CN104102291A (zh) | 2014-07-22 | 2014-07-22 | 刀片服务器、刀片服务器的监控管理方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104102291A true CN104102291A (zh) | 2014-10-15 |
Family
ID=51670506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410351345.1A Pending CN104102291A (zh) | 2014-07-22 | 2014-07-22 | 刀片服务器、刀片服务器的监控管理方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104102291A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105450472A (zh) * | 2015-12-03 | 2016-03-30 | 广州云新信息技术有限公司 | 一种自动获取服务器物理部件状态的方法及装置 |
CN106598788A (zh) * | 2015-10-20 | 2017-04-26 | 鸿富锦精密电子(天津)有限公司 | 服务器管理装置 |
CN106897245A (zh) * | 2017-02-22 | 2017-06-27 | 郑州云海信息技术有限公司 | 一种机柜式计算器 |
CN110413484A (zh) * | 2019-08-02 | 2019-11-05 | 西安微电子技术研究所 | 一种支持异构平台的集群监控方法 |
CN111988810A (zh) * | 2020-08-13 | 2020-11-24 | 苏州浪潮智能科技有限公司 | 一种基于MIWI的无线服务器监管方法及mesh组网装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101277214A (zh) * | 2007-03-28 | 2008-10-01 | 联想(北京)有限公司 | 一种管理刀片式服务器的方法及系统 |
CN102073344A (zh) * | 2010-12-10 | 2011-05-25 | 曙光信息产业(北京)有限公司 | 具有无线模块的刀片服务器管理模块以及刀片服务器系统 |
CN102510344A (zh) * | 2011-11-23 | 2012-06-20 | 华为技术有限公司 | 机柜服务器系统 |
-
2014
- 2014-07-22 CN CN201410351345.1A patent/CN104102291A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101277214A (zh) * | 2007-03-28 | 2008-10-01 | 联想(北京)有限公司 | 一种管理刀片式服务器的方法及系统 |
CN102073344A (zh) * | 2010-12-10 | 2011-05-25 | 曙光信息产业(北京)有限公司 | 具有无线模块的刀片服务器管理模块以及刀片服务器系统 |
CN102510344A (zh) * | 2011-11-23 | 2012-06-20 | 华为技术有限公司 | 机柜服务器系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106598788A (zh) * | 2015-10-20 | 2017-04-26 | 鸿富锦精密电子(天津)有限公司 | 服务器管理装置 |
CN106598788B (zh) * | 2015-10-20 | 2020-08-28 | 鸿富锦精密电子(天津)有限公司 | 服务器管理装置 |
CN105450472A (zh) * | 2015-12-03 | 2016-03-30 | 广州云新信息技术有限公司 | 一种自动获取服务器物理部件状态的方法及装置 |
CN106897245A (zh) * | 2017-02-22 | 2017-06-27 | 郑州云海信息技术有限公司 | 一种机柜式计算器 |
CN110413484A (zh) * | 2019-08-02 | 2019-11-05 | 西安微电子技术研究所 | 一种支持异构平台的集群监控方法 |
CN110413484B (zh) * | 2019-08-02 | 2023-01-31 | 西安微电子技术研究所 | 一种支持异构平台的集群监控方法 |
CN111988810A (zh) * | 2020-08-13 | 2020-11-24 | 苏州浪潮智能科技有限公司 | 一种基于MIWI的无线服务器监管方法及mesh组网装置 |
CN111988810B (zh) * | 2020-08-13 | 2022-12-09 | 苏州浪潮智能科技有限公司 | 一种基于MIWI的无线服务器监管方法及mesh组网装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102571441B (zh) | 整机柜智能管理方法、系统及装置 | |
US6785827B2 (en) | System for determining servers power supply requirement by sampling power usage values thereof at a rate based upon the criticality of its availability | |
AU2018313839B2 (en) | Rack level power control | |
EP2625614B1 (en) | System and method for monitoring and managing data center resources in real time incorporating manageability subsystem | |
US7921315B2 (en) | Managing power consumption in a data center based on monitoring circuit breakers | |
US10061371B2 (en) | System and method for monitoring and managing data center resources in real time incorporating manageability subsystem | |
CN104102291A (zh) | 刀片服务器、刀片服务器的监控管理方法和系统 | |
US10200203B2 (en) | Controllers with integrated power over ethernet network switches | |
US10324430B2 (en) | Infrastructure control fabric system and method | |
CN102722461B (zh) | 存储管理系统的数据通信系统及通信方法 | |
JP2016507838A (ja) | 電子制御システム及び設備制御システムの統合制御 | |
CN104238691B (zh) | 服务器系统及其散热方法 | |
CN103135732B (zh) | 服务器机柜系统 | |
US9363627B1 (en) | Rack server system | |
US20130138997A1 (en) | Rack system | |
WO2016151779A1 (ja) | 情報処理装置及び管理装置 | |
US8880642B2 (en) | Server rack system | |
CN104503405B (zh) | 基于scada系统的监控方法、装置和系统 | |
US20130029578A1 (en) | Managing system for dissipating heat from server group | |
US10599204B1 (en) | Performance efficiency monitoring system | |
US9344327B2 (en) | Wireless-based network management | |
US20150188747A1 (en) | Cloud-based data center infrastructure management system and method | |
CN103049050B (zh) | 一种刀片服务器的扩容配置方法及管理系统 | |
CN206260192U (zh) | 机房机柜的制冷容量评估系统 | |
CN205453732U (zh) | 云端监控的警示设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20141015 |
|
RJ01 | Rejection of invention patent application after publication |