CN102571441A - 整机柜智能管理方法、系统及装置 - Google Patents

整机柜智能管理方法、系统及装置 Download PDF

Info

Publication number
CN102571441A
CN102571441A CN201210016653XA CN201210016653A CN102571441A CN 102571441 A CN102571441 A CN 102571441A CN 201210016653X A CN201210016653X A CN 201210016653XA CN 201210016653 A CN201210016653 A CN 201210016653A CN 102571441 A CN102571441 A CN 102571441A
Authority
CN
China
Prior art keywords
rack
server
machine cabinet
management devices
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210016653XA
Other languages
English (en)
Other versions
CN102571441B (zh
Inventor
陈国峰
张家军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210016653.XA priority Critical patent/CN102571441B/zh
Publication of CN102571441A publication Critical patent/CN102571441A/zh
Application granted granted Critical
Publication of CN102571441B publication Critical patent/CN102571441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种整机柜智能管理方法,包括如下步骤:机柜管理装置向多个服务器和背板发送数据上传指令;多个服务器根据数据上传指令向机柜管理装置上传服务器序列号SN,以及背板根据数据上传指令向机柜管理装置上传每台服务器对应的机柜的ID号;机柜管理装置根据服务器序列号SN、每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表;机柜管理装置实时监测多个服务器的状态,并在状态变化时更新资产信息表,并上报更新内容。本发明还公开了一种整机柜智能管理系统以及机柜管理装置。本发明可以实现对整机柜的智能管理,具有较高的正确率。

Description

整机柜智能管理方法、系统及装置
技术领域
本发明涉及服务器技术领域,特别涉及一种整机柜智能管理方法、整机柜智能管理系统及机柜管理装置。
背景技术
整机柜中安插有多个服务器、风扇、电源等机器,为了实现对机器的统筹管理,需要实时掌握各台机器的位置信息和配置信息。特别是在机器发生故障时,需要于故障信息需要查询人工录入SN(Serial Number,序列号)和位置在后台数据库中的匹配关系,从而实现设备定位。
传统的方式是通过人工核对机器的位置和机器对应的机柜的SN等配置信息。但是,人工核对容易出错并且效率较低。并且,机器故障信息的获取方式是非智能化,需要通过多重查询才能实现对故障设备位置的定位,从而导致故障定位效率低,后台不能及时对故障进行排除,影响机器的使用。
发明内容
本发明的目的旨在至少解决上述技术缺陷之一。
为此,本发明的第一个目的在于提供一种整机柜智能管理方法,该方法可以实现对整机柜的智能管理,具有较高的正确率。本发明的第二个目的在于提供一种整机柜智能管理系统。本发明的第三个目的在于提供一种机柜管理装置。
为实现上述目的,本发明的第一个目的在于提供一种整机柜智能管理方法,包括如下步骤:机柜管理装置向多个服务器和背板发送数据上传指令;所述多个服务器根据所述数据上传指令向所述机柜管理装置上传服务器序列号SN,以及所述背板根据所述数据上传指令向所述机柜管理装置上传每台服务器对应的机柜的ID号;所述机柜管理装置根据所述服务器序列号SN、所述每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表;以及所述机柜管理装置实时监测所述多个服务器的状态,并在状态变化时更新所述资产信息表,并上报更新内容。
根据本发明实施例的整机柜智能管理方法,通过整机柜的位置信息、服务器的序列号和服务器在机柜上的ID号作为服务器在整机柜上的标示,从而实现对整机柜的智能管理,提高了管理效率和正确率。
本发明第二方面的实施例提供了一种整机柜智能管理系统,包括:机柜管理装置,用于向多个服务器和背板发送数据上传指令以获取所述多个服务器的服务器序列号SN以及每台服务器对应的机柜的ID号,并生成资产信息表,以及实时监测所述多个服务器的状态,并在状态变化时更新所述资产信息表;后台管理装置,用于接收所述机柜管理装置发送的所述资产信息表的更新内容,以及根据所述资产信息表的更新内容对所述服务器进行管理。
根据本发明实施例的整机柜智能管理系统,通过整机柜的位置信息、服务器的序列号和服务器在机柜上的ID号作为服务器在整机柜上的标示,从而实现对整机柜的智能管理,提高了管理效率和正确率。
本发明第三方面的实施例提供了一种机柜管理装置,包括:发送模块,用于向多个服务器和背板发送数据上传指令;接收模块,用于接收所述多个服务器发送的服务器序列号SN,以及所述背板发送的每台服务器对应的机柜的ID号;表生成模块,用于根据所述服务器序列号SN、所述每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表;监测模块,用于实时监测所述多个服务器的状态;以及更新模块,用于在所述多个服务器的状态变化时更新所述资产信息表,并上报更新内容。
根据本发明实施例的机柜管理装置,通过整机柜的位置信息、服务器的序列号和服务器在机柜上的ID号作为服务器在整机柜上的标示,从而实现对整机柜的智能管理,提高了管理效率和正确率。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的整机柜智能管理方法的流程框图;
图2为根据本发明实施例的整机柜智能管理系统的结构框图;
图3为根据本发明实施例的整机柜的主视图;
图4为根据本发明实施例的整机柜的后视图;
图5为根据本发明一个实施例的整机柜智能管理系统的示意图;
图6为根据本发明另一个实施例的整机柜智能管理系统的示意图;以及
图7为根据本发明实施例的机柜管理装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
参照下面的描述和附图,将清楚本发明的实施例的这些和其他方面。在这些描述和附图中,具体公开了本发明的实施例中的一些特定实施方式,来表示实施本发明的实施例的原理的一些方式,但是应当理解,本发明的实施例的范围不受此限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
下面参考图1描述根据本发明实施例的整机柜智能管理方法。整机柜内设置有服务器、风扇和电源等设备。
如图1所示,本发明实施例的整机柜智能管理方法,包括如下步骤:
步骤S101:机柜管理装置向多个服务器和背板发送数据上传指令。
机柜管理装置为一个独立的硬件模块,可以对整机柜中的服务器、风扇和电源等设备的状态进行管理,以及将设备的状态上报给后台管理装置。其中,机柜管理装置通过IPMB(Intelligent Platform Management Bus,智能型平台管理总线)总线以及以太网与多个服务器和背板进行通信。
机柜管理装置可以通过IPMB总线以及以太网(Ethernet)向多个服务器和背板发送数据上传指令以获得多个服务器和背板的状态信息。
在本发明的一个实施例中,机柜管理装置可以采用嵌入式Linux操作系统。
步骤S102:多个服务器根据数据上传指令向机柜管理装置上传服务器SN(Serial Number,序列号),背板根据数据上传指令向机柜管理装置上传每台服务器对应的机柜的ID号。
多个服务器在接收到来自机柜管理装置的数据上传指令后,将对应于每个服务器的服务器序列号SN发送到机柜管理装置。具体地,服务器的BMC(Baseboard Management Controller,基板管理控制器)中存储有服务器的SN。其中,服务器的SN是在配置服务器时预先写入到服务器的BMC中的。服务器通过IPMI(Intelligent Platform Management Interface,智能型平台管理接口)协议可以将SN发送给机柜管理装置。
背板在接收到来自机柜管理装置的数据上传指令会,将服务器在机柜中的位置及机柜的ID号发送给机柜管理装置。具体地,由于背板在机柜中的位置是相对固定的,可以预先将机柜的位置信息写入到背板的EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)中。当服务器插入到机柜的对应位置时,可以读取到背板的EEPROM中存储的对应的位置信息,从而可以获得服务器在机柜中的位置,即安插该服务器的机柜的ID号。背板可以通过IPMB总线和以太网总线将服务器对应的机柜的ID号发送给机柜管理装置。
在本发明的实施例中,机柜管理装置除了获得服务器的相关位置信息外,还可以对风扇和电源进行定位。
在整机柜中,风扇(Fan)与FCB(Fan Control Board,风扇控制板)相连,风扇控制板通过I2C(Inter-Integrated Circuit,内部集成电路总线)总线与机柜管理装置进行通信。机柜管理装置可以通过I2C总线获取各个风扇对应机柜的ID号。并且,机柜管理装置还可以通过I2C总线获取风扇的故障信息等相关信息。
PSU(power supply unit,电源)与电源背板通过PM总线(PowerManagement Bus,工业电源管理总线)相连,电源背板通过PM总线进一步与机柜管理装置进行通信。机柜管理装置可以通过PM总线获取电源对应的机柜的ID号。
步骤S103:机柜管理装置根据服务器序列号SN、每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表。
机柜管理装置接收来自多个服务器的服务器序列号SN和来自背板的每台服务器对应的机柜的ID号。
在本发明的一个实施例中,机柜管理装置中存储有整机柜的位置信息(location)。其中,整机柜的位置信息包括:整机柜所在机房的位置信息、机房房间号、机柜的行号和机柜的列号等。例如:locaiton=BJ01+Room01+0101。其中,BJ01表示整机柜位于北京,Room01表示机房房间号,0101表示整机柜位于第一行第一列。
在本发明的一个实施例中,整机柜的位置信息(location)为将机柜部署到机房后,由管理员手动输入到机柜管理装置中。
机柜管理装置根据上述服务器序列号SN、每台服务器对应的机柜的ID号和预存的机柜的位置信息可以生成资产信息表。通过SN+ID+location生成的资产信息表可以实现对服务器的定位以及对服务器的相关信息的管理。
在本发明的一个实施例中,资产信息表中还可以存储有风扇和电源的相关的信息。具体地,机柜管理装置通过I2C总线和PM总线分别获得风扇对应的机柜的ID号以及电源对应的机柜的ID号。上述风扇对应的机柜的ID号以及电源对应的机柜的ID号均可以存储在资产信息表中。
表1示出了资产信息表。从表1中可以看出,整机柜中设置有n个服务器,分别为节点1、节点2.......、节点n,其中节点1对应的机柜的ID号为1,节点2对应的机柜的ID号为2,节点n对应的机柜的ID号为n。并且,资产信息表中还存储有每个服务器对应的配置信息(资产信息),例如:中央处理器CPU、内存(memory)和硬盘(disk)的配置信息。
表1中还记录有风扇和电源的位置信息和配置信息等。具体地,整机柜中设置有n个风扇(Fan),分别为Fan1、Fan2.......、Fan n,其中Fan1对应的机柜的ID号为1,Fan 2对应的机柜的ID号为3,Fan n对应的机柜的ID号为n。
整机柜中还设置有n个电源(PSU),分别为PSU1、PSU2.......、PSUn,其中,PSU1对应的机柜的ID号为1,PSU2对应的机柜的ID号为3,PSU对应的机柜ID号为n。并且,资产信息表中还存储有每个电源对应的配置信息(资产信息),例如:电源的尺寸(size)。
表1
步骤S104:机柜管理装置实时监测多个服务器的状态,并在状态变化时更新资产信息表,并上报更新内容。
机柜管理装置可以实时监测多个服务器的状态,例如服务器的工作状态和配置状态。
当服务器的状态发生变化时,例如:服务器开/关机、重启、插入、拔出、设备变更或配置变更等状态变化时,机柜管理装置可以及时监控到上述信息,并实时更新资产信息表中的相关内容,同时将上述内容上报给后台管理装置。换言之,当机柜管理装置监测到服务器发生异常时,可以将异常信息上报给后台管理装置。
在本发明的一个实施例中,机柜管理装置以SNMP-TRAP(SimpleNetwork Management Protocol-TRAP,简单网络管理协议-陷阱)信息或者系统记录SYSLOG信息或者电子邮件向后台管理装置上报异常信息。
在本发明的又一个实施例中,机柜管理装置还可以对风扇和电源的状态进行实时监测。
具体地,当风扇或电源的状态发生变化时,例如:开关机、重启、插入、拔出、设备变更或配置变更等操作时,机柜管理装置可以及时监控到上述状态变化,并实时更新资产信息表中的相关内容,同时将上述内容上报给后台管理装置。换言之,当机柜管理装置监测到电源或风扇发生异常时,可以将上述异常信息上报给后台管理装置。
后台管理装置在接收到上述异常信息后,通知管理员进行相应的异常处理。在本发明的一个实施例中,后台管理装置可以通过电子邮件(email)、短消息或者其他自动办公平台通知管理员对异常进行处理。
在本发明的一个实施例中,后台管理装置可以通过SYSLOG信息中的机柜的ID号和整机柜的位置信息(location)定位设备,例如:服务器、风扇或电源。
上述提供的整机柜智能管理方法采用的是后台被动方式,即由机柜管理装置主动监测各个设备的状态,在设备的状态发生变化时将状态变化信息主动发送给后台管理装置,后台管理装置被动接收上述信息。
在本发明的一个实施例中,本发明实施例提供的整机柜智能管理方法还可以采用后台主动方式,即由后台管理装置主动向机柜管理装置发送信息获取请求,机柜管理装置在接收到上述信息获取请求后向后台管理装置发送对应的设备信息。
具体地,当后台管理装置需要获取服务器、风扇或电源的信息时,通过以太网总线向机柜管理装置发送信息获取请求。机柜管理装置在接收到上述信息获取请求后,将监测到服务器、风扇或电源的信息以SNMP-TRAP信息或者SYSLOG信息或者电子邮件发送给后台管理装置。
在本发明的一个实施例中,后台管理装置通过以太网总线(Ethernet)与机柜管理装置进行通信。后台管理装置可以通过IPMI协议查询机柜管理装置中存储的资产信息表,从而自动获得服务器、风扇和电源的位置信息和资产信息。
根据本发明实施例的整机柜智能管理方法,通过整机柜的位置信息、服务器的序列号和服务器在机柜上的ID号作为服务器在整机柜上的标示,从而实现对整机柜的智能管理,远程自动定位机器,并且能够自动发现及核对服务器等设备的资产变更信息,并能够主动将错误和故障信息实时上报至后台管理装置以通知后台人员进行处理,进而提高了管理效率和正确率。
下面参考图2和图3描述根据本发明实施例整机柜智能管理系统200。
如图2所示,本发明的实施例提供的整机柜智能管理系统,包括机柜管理装置210和后台管理装置220。其中,机柜管理装置210用于向多个服务器和背板发送数据上传指令以获取多个服务器的服务器序列号SN以及每台服务器对应的机柜的ID号,并生成资产信息表,以及实时监测多个服务器的状态,并在状态变化时更新资产信息表。后台管理装置220用于接收机柜管理装置210发送的资产信息表的更新内容,以及根据资产信息表的更新内容对服务器进行管理。
图3和图4分别示出了整机柜的主视图和后视图。从图3中可以看出,整机柜中放置有多个服务器、机柜管理装置和交换机。其中,整机柜中可以放置多台交换机,例如图3所示的交换机A和交换机B。从图4中可以看出,整机柜中还放置有风扇墙、电源和PDU(Power Distribution Unit,电源分配单元),其中,风扇墙中设置有多个风扇。电源分配单元可以为多个,例如图4所示的A路PDU和B路PDU。
机柜管理装置210可以对服务器、风扇和电源等设备的状态进行管理,以及将设备的状态上报给后台管理装置220。如图5所示,机柜管理装置210可以通过IPMB总线以及以太网与多个服务器230和背板240进行通信。
具体地,机柜管理装置210可以通过IPMB总线以及以太网向多个服务器230和背板240发送数据上传指令以获得多个服务器230和背板240的状态信息。其中,机柜管理装置210可以一个独立的硬件模块。
在本发明一个实施例中,机柜管理装置210通过以太网总线与交换机290进行通信,交换机290通过以太网总线和后台管理装置220进行通信。背板240进一步通过IPMB总线与各个服务器的BMC和交换机290进行通信。
在本发明的一个实施例中,机柜管理装置210可以采用嵌入式Linux操作系统。
多个服务器230接收来自机柜管理装置210的数据上传指令后,将对应于每个服务器230的服务器序列号SN发送到机柜管理装置210。其中,在每个服务器230的BMC中存储有服务器的SN。其中,每个服务器230的SN是在配置服务器230时预先写入到服务器230的BMC中的。服务器230通过IPMI协议可以将SN发送给机柜管理装置210。
背板240在接收到机柜管理装置210的数据上传指令,将服务器230在机柜中的位置及机柜的ID号发送给机柜管理装置210。在背板240中设置有电可擦可编程只读存储器EEPROM。由于背板240在机柜中的位置是相对固定的,可以预先将机柜的位置信息写入到背板240的EEPROM,当服务器230插入到机柜的对应位置时,可以读取到背板240的EEPROM中存储的对应的位置信息,从而可以获得服务器230在机柜中的位置,即安插该服务器的机柜的ID号。
如图5所示,在本发明的一个实施例中,背板240可以通过IPMB总线和以太网总线与机柜管理装置210进行通信。具体地,背板240可以通过IPMB总线和以太网总线将服务器230对应的机柜的ID号发送给机柜管理装置210。
在本发明的实施例中,机柜管理装置210还可以实现对风扇250和电源260的定位。
如图5所示,整机柜中放置有风扇250、与风扇250相连的风扇控制板260、电源270和与电源270相连的电源背板280。其中,风扇控制板260通过I2C总线与机柜管理装置210进行通信,电源背板280通过PM总线与电源270相连,并且电源背板280通过PM总线进一步与机柜管理装置210进行通信。
具体地,机柜管理装置210可以通过I2C总线获取各个风扇250对应机柜的ID号以及风扇250的故障信息等相关信息。并且,机柜管理装置210还可以通过PM总线获取电源270对应的机柜的ID号。
在本发明的一个实施例中,机柜管理装置210存储有整机柜的位置信息(location)。其中,整机柜的位置信息包括:整机柜所在机房的位置信息、机房房间号、机柜的行号和机柜的列号等。其中,整机柜的位置信息(location)为将机柜部署到机房后,由管理员手动输入到机柜管理装置210中。
机柜管理装置210根据来自多个服务器230的服务器序列号SN、来自背板240的每台服务器230对应的机柜的ID号和整机柜的位置信息生成资产信息表。通过上述SN+ID+location生成的资产信息表可以实现对服务器230的定位以及对服务器230的相关信息的管理。
在本发明的一个实施例中,资产信息表中还可以存储有风扇250和电源270的相关信息。具体地,机柜管理装置210可以通过I2C总线和PM总线分别获得风扇250对应的机柜的ID号以及电源270对应的机柜的ID号。其中,风扇250对应的机柜的ID号以及电源270对应的机柜的ID号均可以存储在资产信息表中。
在本发明的又一个实施例中,资产信息表还可以存储有服务器230、风扇250和电源270对应的配置信息(资产信息)。其中,服务器230的配置信息包括:CPU、内存(memory)和硬盘(disk)的配置信息。电源270的配置信息包括:电源的尺寸(size)。
机柜管理装置210还用于实时监测多个服务器230的状态,例如服务器的工作状态和配置状态。
当服务器230的状态发生变化时,例如:服务器开/关机、重启、插入、拔出、设备变更或配置变更等状态变化时,机柜管理装置210可以及时监控到上述信息,并实时更新资产信息表中的相关内容,同时将上述内容上报给后台管理装置220。换言之,当机柜管理装置210监测到服务器230发生异常时,可以将异常信息上报给后台管理装置220。
在本发明的一个实施例中,机关管理装置210通过以太网总线与后台管理装置220进行通信。其中,机柜管理装置210以SNMP-TRAP信息或者SYSLOG信息或者电子邮件向后台管理装置220上报异常信息。
在本发明的又一个实施例中,机柜管理装置210还可以对风扇250和电源270的状态进行实时监测。
具体地,当风扇250或电源270的状态发生变化时,例如:开关机、重启、插入、拔出、设备变更或配置变更等操作时,机柜管理装置210可以及时监控到上述状态变化,并实时更新资产信息表中的相关内容,同时将上述内容上报给后台管理装置220。换言之,当机柜管理装置210监测到电源270或风扇250发生异常时,可以将上述异常信息上报给后台管理装置220。
后台管理装置220在接收到上述异常信息后,通知管理员进行相应的异常处理。在本发明的一个实施例中,后台管理装置220可以通过电子邮件(email)、短消息或者其他自动办公平台通知管理员对异常进行处理。
在本发明的一个实施例中,后台管理装置220可以通过SYSLOG信息中的机柜的ID号和整机柜的位置信息(location)定位设备,例如:服务器230、风扇250或电源270。
在本发明的一个实施例中,当后台管理装置220需要获取服务器230、风扇250或电源270的信息时,后台管理装置220还用于主动向机柜管理装置210发送信息获取请求。机柜管理装置210还用于接收来自后台管理装置220的信息获取请求,并根据该信息获取请求将监测到服务器230、风扇250或电源270的信息以SNMP-TRAP信息或者SYSLOG信息或者电子邮件发送给后台管理装置220。
在本发明的一个实施例中,后台管理装置220可以通过IPMI协议查询机柜管理装置210中存储的资产信息表,从而自动获得服务器230、风扇250和电源270的位置信息和资产信息。
在本发明的一个实施例中,如图6所示,本发明实施例整机柜智能管理系统200还包括中转控制装置300,该中转控制装置300可以分别与背板240、风扇控制板和机柜管理装置210进行通信。具体地,服务器节点包括服务器节点1、服务器节点2......服务器节点n,风扇控制板包括风扇控制板1......风扇控制板n,其中,每个风扇控制板可控制n个风扇。其中,n个风扇分别为风扇1、......风扇n。具体地,n个服务器节点通过IPMB总线与背板240进行通信,背板240进一步通过IPMB总线与中转控制装置300进行通信,并且,n个风扇控制板通过I2C总线与中转控制装置300进行通信。
在本发明的一个实施例中,中转控制装置300可以为多个。中转控制装置300通过TCP/IP协议与机柜管理装置210进行通信。
机柜管理装置300通过TCP/IP协议与交换机290进行通信,交换机进一步通过TCP/IP协议与后台管理装置220进行通信。机柜管理装置210通过PM总线与电源背板280进行通信。电源背板280与n个电源相连,其中,n个电源分别为电源1、......电源n。
在本发明的一个实施例中,后台管理装置220通过机柜管理装置210可以获取电源的相关信息、整机柜的电流、电压和功耗监控等信息,以及服务器序列号SN。并且,后台管理装置220可以获取服务器节点的功耗以及整机柜中的硬件状态等信息。
根据本发明实施例的整机柜智能管理系统,通过整机柜的位置信息、服务器的序列号和服务器在机柜上的ID号作为服务器在整机柜上的标示,从而实现对整机柜的智能管理,远程自动定位机器,并且能够自动发现及核对服务器等设备的资产变更信息,并能够主动将错误和故障信息实时上报至后台管理装置以通知后台人员进行处理,进而提高了管理效率和正确率。
下面参考图7描述根据本发明实施例的机柜管理装置。
如图7所示,本发明实施例的机柜管理装置包括发送模块211、接收模块212、表生成模块213、监测模块214和更新模块215。其中,发送模块211用于向多个服务器和背板发送数据上传指令,接收模块212用于接收多个服务器发送的服务器序列号SN以及背板发送的每台服务器对应的机柜的ID号,表生成模块213用于根据服务器序列号SN、每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表,监测模块214用于实时监测多个服务器的状态,更新模块215用于在多个服务器的状态变化时更新资产信息表并上报更新内容。
在本发明的一个实施例中,机柜管理装置210可以采用嵌入式Linux操作系统。
发送模块211可以通过IPMB总线以及以太网向多个服务器和背板发送数据上传指令以获得多个服务器和背板的状态信息。多个服务器接收来自发送模块211的数据上传指令后,将对应于每个服务器的服务器序列号SN发送到接收模块212。
在本发明的一个实施例中,服务器通过IPMI协议将SN发送给接收模块212。
背板在接收到发送模块211的数据上传指令,将服务器在机柜中的位置及机柜的ID号发送给接收模块212。在背板中设置有电可擦可编程只读存储器EEPROM。由于背板在机柜中的位置是相对固定的,可以预先将机柜的位置信息写入到背板的EEPROM,当服务器插入到机柜的对应位置时,可以读取到背板的EEPROM中存储的对应的位置信息,从而可以获得服务器在机柜中的位置,即安插该服务器的机柜的ID号。
在本发明的一个实施例中,背板可以通过IPMB总线和以太网总线与机柜管理装置进行通信。具体地,背板可以通过IPMB总线和以太网总线将服务器对应的机柜的ID号发送给接收模块212。
接收模块212将多个服务器的服务器序列号SN、每台服务器对应的机柜的ID号发送给表生成模块213。表生成模块213根据服务器序列号SN、每台服务器对应的机柜的ID号和整机柜的位置信息生成资产信息表。通过上述SN+ID+location生成的资产信息表可以实现对服务器的定位以及对服务器的相关信息的管理。
在本发明的一个实施例中,整机柜的位置信息预存在表生成模块213中。其中,整机柜的位置信息包括:整机柜所在机房的位置信息、机房房间号、机柜的行号和机柜的列号等。其中,整机柜的位置信息(location)为将机柜部署到机房后,由管理员手动输入到机柜管理装置中。
在本发明的一个实施例中,接收模块212还可以通过I2C总线获取各个风扇对应机柜的ID号以及风扇的故障信息等相关信息,以及通过PM总线获取电源对应的机柜的ID号。
在本发明的一个实施例中,资产信息表中还可以存储有风扇和电源的相关信息。具体地,接收模块211可以通过I2C总线和PM总线分别获得风扇对应的机柜的ID号以及电源对应的机柜的ID号。其中,风扇对应的机柜的ID号以及电源对应的机柜的ID号均可以存储在资产信息表中。
在本发明的又一个实施例中,资产信息表还可以存储有服务器、风扇和电源对应的配置信息(资产信息)。其中,服务器的配置信息包括:CPU、内存(memory)和硬盘(disk)的配置信息。电源的配置信息包括:电源的尺寸(size)。
监测模块214用于实时监测多个服务器的状态,例如服务器的工作状态和配置状态。
当服务器器的状态发生变化时,例如:服务器开/关机、重启、插入、拔出、设备变更或配置变更等状态变化时,监测模块214可以及时监控到上述信息,并由更新模块215实时更新资产信息表中的相关内容,并将上述内容上报给后台管理装置。
在本发明的一个实施例中,机关管理装置通过以太网总线与后台管理装置进行通信。其中,更新模块215以SNMP-TRAP信息或者SYSLOG信息或者电子邮件向后台管理装置上报异常信息。
在本发明的又一个实施例中,监测模块214还可以对风扇和电源的状态进行实时监测。
具体地,当风扇或电源的状态发生变化时,例如:开关机、重启、插入、拔出、设备变更或配置变更等操作时,监测模块214可以及时监控到上述状态变化,并由更新模块215实时更新资产信息表中的相关内容,同时将上述内容上报给后台管理装置。
后台管理装置在接收到上述异常信息后,通知管理员进行相应的异常处理。在本发明的一个实施例中,后台管理装置可以通过电子邮件(email)、短消息或者其他自动办公平台通知管理员对异常进行处理。
在本发明的一个实施例中,后台管理装置可以通过SYSLOG信息中的机柜的ID号和整机柜的位置信息(location)定位设备,例如:服务器、风扇或电源。
在本发明的一个实施例中,当后台管理装置需要获取服务器、风扇或电源的信息时,后台管理装置还用于主动向发送模块211发送信息获取请求。接收模块212还用于接收来自后台管理装置的信息获取请求,并根据该信息获取请求将监测到服务器、风扇或电源的信息以SNMP-TRAP信息或者SYSLOG信息或者电子邮件发送给后台管理装置。
在本发明的一个实施例中,后台管理装置可以通过IPMI协议查询机柜管理装置中存储的资产信息表,从而自动获得服务器、风扇和电源的位置信息和资产信息。
根据本发明实施例的机柜管理装置,通过整机柜的位置信息、服务器的序列号和服务器在机柜上的ID号作为服务器在整机柜上的标示,从而实现对整机柜的智能管理,远程自动定位机器,并且能够自动发现及核对服务器等设备的资产变更信息,并能够主动将错误和故障信息实时上报至后台管理装置以通知后台人员进行处理,进而提高了管理效率和正确率。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,″计算机可读介质″可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。

Claims (15)

1.一种整机柜智能管理方法,其特征在于,包括如下步骤:
机柜管理装置向多个服务器和背板发送数据上传指令;
所述多个服务器根据所述数据上传指令向所述机柜管理装置上传服务器序列号SN,以及所述背板根据所述数据上传指令向所述机柜管理装置上传每台服务器对应的机柜的ID号;
所述机柜管理装置根据所述服务器序列号SN、所述每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表;以及
所述机柜管理装置实时监测所述多个服务器的状态,并在状态变化时更新所述资产信息表,并上报更新内容。
2.如权利要求1所述的整机柜智能管理方法,其特征在于,还包括如下步骤:
所述机柜管理装置通过所述电源背板获取电源对应的机柜的ID号以及通过与风扇控制板相连的内部集成电路I2C总线获取风扇对应的机柜的ID号。
3.如权利要求2所述的整机柜智能管理方法,其特征在于,所述资产信息表包括所述服务器序列号SN、服务器对应所述机柜的ID号、电源对应的机柜的ID号、风扇对应的机柜的ID号以及服务器、电源和风扇的配置信息。
4.如权利要求3所述的整机柜智能管理方法,其特征在于,所述机柜管理装置以简单网络管理协议-陷阱SNMP-TRAP信息或者系统记录SYSLOG信息或者电子邮件向所述后台管理装置上报所述更新内容。
5.如权利要求1所述的整机柜智能管理方法,其特征在于,还包括如下步骤:
所述机柜管理装置接收来自后台管理装置的信息获取请求,并根据所述信息获取请求向所述后台管理装置发送设备信息。
6.一种整机柜智能管理系统,其特征在于,包括:
机柜管理装置,用于向多个服务器和背板发送数据上传指令以获取所述多个服务器的服务器序列号SN以及每台服务器对应的机柜的ID号,并生成资产信息表,以及实时监测所述多个服务器的状态,并在状态变化时更新所述资产信息表;以及
后台管理装置,用于接收所述机柜管理装置发送的所述资产信息表的更新内容,以及根据所述资产信息表的更新内容对所述服务器进行管理。
7.如权利要求6所述的整机柜智能管理系统,其特征在于,所述机柜管理装置通过智能平台管理IPMB总线和以太网总线与所述多个服务器进行通信。
8.如权利要求6所述的整机柜智能管理系统,其特征在于,所述机柜管理装置通过以太网总线与所述后台管理装置进行通信。
9.如权利要求6所述的整机柜智能管理系统,其特征在于,所述机柜管理装置还用于通过电源背板获取电源对应的机柜的ID号以及通过与风扇控制板相连的I2C总线获取风扇对应的机柜的ID号。
10.如权利要求9所述的整机柜智能管理系统,其特征在于,所述资产信息表包括所述服务器序列号SN、服务器对应所述机柜的ID号、电源对应的机柜的ID号、风扇对应的机柜的ID号以及服务器、电源和风扇的配置信息。
11.如权利要求6所述的整机柜智能管理系统,其特征在于,
所述后台管理装置还用于向所述机柜管理装置发送信息获取请求,
所述机柜管理装置还用于根据所述信息获取请求向所述后台管理装置发送设备信息。
12.一种机柜管理装置,其特征在于,包括:
发送模块,用于向多个服务器和背板发送数据上传指令;
接收模块,用于接收所述多个服务器发送的服务器序列号SN,以及所述背板发送的每台服务器对应的机柜的ID号;
表生成模块,用于根据所述服务器序列号SN、所述每台服务器对应的机柜的ID号和预存的机柜的位置信息生成资产信息表;
监测模块,用于实时监测所述多个服务器的状态;以及
更新模块,用于在所述多个服务器的状态变化时更新所述资产信息表,并上报更新内容。
13.如权利要求12所述的机柜管理装置,其特征在于,所述接收模块还用于通过所述电源背板获取电源对应的机柜的ID号以及通过与风扇控制板相连的I2C总线获取风扇对应的机柜的ID号。
14.如权利要求13所述的整机柜智能管理系统,其特征在于,所述资产信息表包括所述服务器序列号SN、服务器对应所述机柜的ID号、电源对应的机柜的ID号、风扇对应的机柜的ID号以及服务器、电源和风扇的配置信息。
15.如权利要求12所述的机柜管理装置,其特征在于,所述发送模块以简单网络管理协议-陷阱SNMP-TRAP信息或者系统记录SYSLOG信息或者电子邮件向后台管理装置上报异常信息。
CN201210016653.XA 2012-01-18 2012-01-18 整机柜智能管理方法、系统及装置 Active CN102571441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210016653.XA CN102571441B (zh) 2012-01-18 2012-01-18 整机柜智能管理方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210016653.XA CN102571441B (zh) 2012-01-18 2012-01-18 整机柜智能管理方法、系统及装置

Publications (2)

Publication Number Publication Date
CN102571441A true CN102571441A (zh) 2012-07-11
CN102571441B CN102571441B (zh) 2017-03-15

Family

ID=46415967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210016653.XA Active CN102571441B (zh) 2012-01-18 2012-01-18 整机柜智能管理方法、系统及装置

Country Status (1)

Country Link
CN (1) CN102571441B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103200050A (zh) * 2013-04-12 2013-07-10 北京百度网讯科技有限公司 服务器的硬件状态监控方法和系统
CN103532762A (zh) * 2013-10-22 2014-01-22 浪潮电子信息产业股份有限公司 基于i2c链路交换的服务器资产信息管理设计方法
CN103685386A (zh) * 2012-09-12 2014-03-26 北京百度网讯科技有限公司 用于确定计算设备在整机柜中的位置信息的方法和设备
CN103677179A (zh) * 2012-09-21 2014-03-26 英业达科技有限公司 服务器
CN103905238A (zh) * 2012-12-28 2014-07-02 鸿富锦精密工业(深圳)有限公司 数据中心异常信息收集系统及方法
CN104009863A (zh) * 2013-02-27 2014-08-27 联想(北京)有限公司 一种服务器系统、及自动获取服务器编号的方法
CN104486432A (zh) * 2014-12-19 2015-04-01 北京百度网讯科技有限公司 一种服务器资产信息自动录入方法及装置
CN104484753A (zh) * 2014-12-16 2015-04-01 浪潮电子信息产业股份有限公司 一种服务器资产信息追溯方法
CN104965573A (zh) * 2015-04-29 2015-10-07 深圳市共济科技有限公司 一种数据中心的批量部署方法及装置
CN105490859A (zh) * 2015-12-18 2016-04-13 山东海量信息技术研究院 一种高端容错服务器的节点定位方法
CN105488608A (zh) * 2015-11-18 2016-04-13 深圳云联讯数据科技有限公司 免配置机架服务器信息采集方法及系统
CN106209453A (zh) * 2016-07-11 2016-12-07 珠海格力电器股份有限公司 一种设备工程信息的更新装置、方法及服务器
CN106714501A (zh) * 2017-02-28 2017-05-24 郑州云海信息技术有限公司 一种节点服务器的识别方法、装置及机柜
CN107273203A (zh) * 2016-04-06 2017-10-20 中兴通讯股份有限公司 一种数据中心业务设备的资产能源分配方法及装置
CN107347086A (zh) * 2016-05-06 2017-11-14 广州御银自动柜员机科技有限公司 一种基于备件身份标识的自检系统
CN109240891A (zh) * 2018-09-26 2019-01-18 郑州云海信息技术有限公司 一种sr整机柜服务器的监控方法及装置
CN109309633A (zh) * 2018-09-21 2019-02-05 郑州云海信息技术有限公司 一种基于管理交换机的整机柜服务器节点管理方法及装置
CN110322023A (zh) * 2019-05-21 2019-10-11 深圳市艾捷莫科技有限公司 一种服务器管理方法及系统
CN113805950A (zh) * 2021-08-30 2021-12-17 超越科技股份有限公司 一种集群管理系统管理服务器的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202649A (zh) * 2006-12-14 2008-06-18 英业达股份有限公司 计算机设备信息的收集和管理方法
CN101656115A (zh) * 2009-08-25 2010-02-24 北京广利核系统工程有限公司 一种安全级机柜监视装置的机柜监视系统
CN201757871U (zh) * 2010-07-26 2011-03-09 深圳市腾讯计算机系统有限公司 一种服务器机柜
CN201837876U (zh) * 2010-06-11 2011-05-18 鲍东 物联网管理系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202649A (zh) * 2006-12-14 2008-06-18 英业达股份有限公司 计算机设备信息的收集和管理方法
CN101656115A (zh) * 2009-08-25 2010-02-24 北京广利核系统工程有限公司 一种安全级机柜监视装置的机柜监视系统
CN201837876U (zh) * 2010-06-11 2011-05-18 鲍东 物联网管理系统
CN201757871U (zh) * 2010-07-26 2011-03-09 深圳市腾讯计算机系统有限公司 一种服务器机柜

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685386A (zh) * 2012-09-12 2014-03-26 北京百度网讯科技有限公司 用于确定计算设备在整机柜中的位置信息的方法和设备
CN103685386B (zh) * 2012-09-12 2019-04-12 北京百度网讯科技有限公司 用于确定计算设备在整机柜中的位置信息的方法和设备
CN103677179A (zh) * 2012-09-21 2014-03-26 英业达科技有限公司 服务器
CN103905238A (zh) * 2012-12-28 2014-07-02 鸿富锦精密工业(深圳)有限公司 数据中心异常信息收集系统及方法
CN104009863A (zh) * 2013-02-27 2014-08-27 联想(北京)有限公司 一种服务器系统、及自动获取服务器编号的方法
CN103200050A (zh) * 2013-04-12 2013-07-10 北京百度网讯科技有限公司 服务器的硬件状态监控方法和系统
CN103532762A (zh) * 2013-10-22 2014-01-22 浪潮电子信息产业股份有限公司 基于i2c链路交换的服务器资产信息管理设计方法
CN104484753A (zh) * 2014-12-16 2015-04-01 浪潮电子信息产业股份有限公司 一种服务器资产信息追溯方法
CN104486432A (zh) * 2014-12-19 2015-04-01 北京百度网讯科技有限公司 一种服务器资产信息自动录入方法及装置
CN104965573B (zh) * 2015-04-29 2018-08-03 深圳市共济科技股份有限公司 一种数据中心的批量部署方法及装置
CN104965573A (zh) * 2015-04-29 2015-10-07 深圳市共济科技有限公司 一种数据中心的批量部署方法及装置
CN105488608A (zh) * 2015-11-18 2016-04-13 深圳云联讯数据科技有限公司 免配置机架服务器信息采集方法及系统
CN105490859A (zh) * 2015-12-18 2016-04-13 山东海量信息技术研究院 一种高端容错服务器的节点定位方法
CN105490859B (zh) * 2015-12-18 2019-01-22 山东海量信息技术研究院 一种高端容错服务器的节点定位方法
CN107273203A (zh) * 2016-04-06 2017-10-20 中兴通讯股份有限公司 一种数据中心业务设备的资产能源分配方法及装置
CN107273203B (zh) * 2016-04-06 2021-02-23 中兴通讯股份有限公司 一种数据中心业务设备的资产能源分配方法及装置
CN107347086A (zh) * 2016-05-06 2017-11-14 广州御银自动柜员机科技有限公司 一种基于备件身份标识的自检系统
CN107347086B (zh) * 2016-05-06 2019-12-13 广州御银自动柜员机科技有限公司 一种基于备件身份标识的自检系统
CN106209453A (zh) * 2016-07-11 2016-12-07 珠海格力电器股份有限公司 一种设备工程信息的更新装置、方法及服务器
CN106209453B (zh) * 2016-07-11 2019-04-09 珠海格力电器股份有限公司 一种设备工程信息的更新装置、方法及服务器
CN106714501A (zh) * 2017-02-28 2017-05-24 郑州云海信息技术有限公司 一种节点服务器的识别方法、装置及机柜
CN109309633A (zh) * 2018-09-21 2019-02-05 郑州云海信息技术有限公司 一种基于管理交换机的整机柜服务器节点管理方法及装置
CN109240891A (zh) * 2018-09-26 2019-01-18 郑州云海信息技术有限公司 一种sr整机柜服务器的监控方法及装置
CN110322023A (zh) * 2019-05-21 2019-10-11 深圳市艾捷莫科技有限公司 一种服务器管理方法及系统
CN113805950A (zh) * 2021-08-30 2021-12-17 超越科技股份有限公司 一种集群管理系统管理服务器的方法

Also Published As

Publication number Publication date
CN102571441B (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
CN102571441A (zh) 整机柜智能管理方法、系统及装置
US11336522B2 (en) Information handling system physical component inventory to aid operational management through near field communication device interaction
US10868581B2 (en) Data center management using device identification over power-line
US9124655B2 (en) Information handling system operational management through near field communication device interaction
US9019114B1 (en) Device management module, remote management module and device management system employing same
US20140297855A1 (en) Determining Rack Position of Device
US8782462B2 (en) Rack system
US10797959B2 (en) LLDP based rack management controller
WO2012047757A1 (en) System and method for monitoring and managing data center resources in real time incorporating manageability subsystem
US9588542B2 (en) Rack server system and method for automatically managing rack configuration information
CN107729038A (zh) 固件更新方法及可更新固件的基板管理控制器
US8880642B2 (en) Server rack system
CN103135732A (zh) 服务器机柜系统
CN105516386A (zh) 一种服务器管理系统mac地址冲突检测和处理方法及系统
CN103138969B (zh) 服务器机架系统
CN104102291A (zh) 刀片服务器、刀片服务器的监控管理方法和系统
WO2010020137A1 (zh) 上电保护方法、模块及系统
JP5673711B2 (ja) サーバ
US20180206008A1 (en) Connection management method, controller, and server cabinet
US20130138803A1 (en) Method for monitoring a plurality of rack systems
CN113805950A (zh) 一种集群管理系统管理服务器的方法
CN103376872A (zh) 电源管理方法
CN205453732U (zh) 云端监控的警示设备
CN109039770A (zh) 一种服务器cmc的刷新方法、装置及相关设备
CN113778667B (zh) 服务器节点信息管理系统和方法、可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant