CN100454267C - 超级服务器的监控管理系统 - Google Patents

超级服务器的监控管理系统 Download PDF

Info

Publication number
CN100454267C
CN100454267C CNB021256276A CN02125627A CN100454267C CN 100454267 C CN100454267 C CN 100454267C CN B021256276 A CNB021256276 A CN B021256276A CN 02125627 A CN02125627 A CN 02125627A CN 100454267 C CN100454267 C CN 100454267C
Authority
CN
China
Prior art keywords
monitoring
node machine
information
management system
host computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB021256276A
Other languages
English (en)
Other versions
CN1470990A (zh
Inventor
吴雪丽
杜晓黎
顾光导
王涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CNB021256276A priority Critical patent/CN100454267C/zh
Publication of CN1470990A publication Critical patent/CN1470990A/zh
Application granted granted Critical
Publication of CN100454267C publication Critical patent/CN100454267C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Abstract

一种超级服务器的监控管理系统,至少包括节点机信息采集装置、节点机监控信息汇集装置和监控主机;该节点机信息采集装置采集单节点机的监控信息,并与节点机监控信息汇集装置通信,执行监控节点机传递的监控指令;该节点机监控信息汇集装置汇集各节点机监控信息,并与监控主机连接通信,接收并传递监控主机的信息,执行监控主机对节点机控制信息的控制指令;监控主机根据接收的信息及用户的设定监控机群系统。本发明采用包括节点机信息采集装置、节点机监控信息汇集装置和监控主机在内的多层监控结构,可以方便地扩充被监控节点,并且通过合理的监控任务分配,降低监控主机的无谓负荷,提高了监控系统的整体性能。

Description

超级服务器的监控管理系统
技术领域:
本发明涉及一种超级服务器的监控管理系统,特别是指一种可以方便地扩充被监控节点,并且通过合理的监控任务分配,降低监控主机的无谓负荷,提高监控整体性能的系统。
背景技术:
超级服务器已经成为继理论科学、实验科学之后,人类认识自然的第三大科学方法。从经济发展角度看,超级服务器正在形成全球年产值上千亿美元的产业;从社会发展角度看,超级服务器已经广泛应用于政府部门、金融、国防、教育、医疗卫生等各行各业。保证超级服务器的稳定、可靠运转是迫在眉睫的问题。
现有技术中,通常采用前端信息采集,后端集中处理的方法进行。这种方法对于节点数较少的系统而言是适用的;而对于具有上百甚至上千个节点的超级服务器系统而言则不能够实现人们所期望的监控管理目标。
具体而言,现有技术中主要存在的问题在于:采集端与处理端的连接数量有限,如果在现有的系统结构中大量增加新的节点,则会导致处理端的负荷过重,严重时反而不能实现监控管理的目的。另外,现有的监控系统并不是从机群的整体性能角度出发来监视系统,用户关心的的机群整体特性指标不能得到及时的反映,用户不能直观地观测到机群系统的整体运行状态。
发明内容:
本发明的主要目的在于提供一种超级服务器的监控管理系统,它采用多层监控结构,可以方便地扩充被监控节点,并且通过合理的监控任务分配,降低监控主机的无谓负荷,提高监控系统的整体性能。
本发明的目的是这样实现的:
一种超级服务器的监控系统,至少包括节点机信息采集装置、节点机监控信息汇集装置和监控主机;其中:
该节点机信息采集装置用于采集与之相应的单节点机的监控信息,并与节点机监控信息汇集装置通信,接收并执行监控节点机传递的监控指令;
该节点机监控信息汇集装置用于汇集各节点机监控信息,并与监控主机连接通信,同时接收并传递监控主机的信息,执行监控主机用于对节点机进行控制的控制信息的控制指令;
监控主机接收从节点机监控信息汇集装置传递过来的各节点机信息、由所述节点机监控信息汇集装置采集的机柜信息,从机群管理系统(CLUSTERMANAGER SYSTEM;简称CMS)主控机读取系统的基本配置信息,根据接收的信息及用户的设定监控机群系统。
所述的节点机信息采集装置装设在节点机内,至少设有中央处理器、与该中央处理器连接并且用于和监控节点机传递信息的通信接口;该中央处理器通过其I2C总线接口与节点机主板连接。
所述的通信接口为RS-485串行接口。
节点机信息采集装置还设有用于显示监控状态的指示灯,该指示灯连接到中央处理器的输出端口。
节点机信息采集装置的中央处理器的地址线上还设有用于设定本装置ID地址的开关。
该节点机信息采集装置直接与所在节点机的5VSB电源连接。
该节点机信息采集装置采集的节点机的监控信息至少包括:该节点机的风扇转速、电压值及温度信息。
该节点机信息采集装置为一个以上。
所述的节点机监控信息汇集装置装设在监控节点机内,至少包括中央处理器、一个以上用于与节点机监控采集装置和监控主机进行的通信接口和存储单元;该通信接口与中央处理器连接,该中央处理器与该存储单元连接。
该节点机监控信息汇集装置还设有用于连接检测机柜供电电源的传感器的连接接口,该连接接口连接到中央处理器的模数转换输入端。
该节点机监控信息汇集装置还设有用于设定ID地址的装置,该装置与中央处理器的数据总线连接。
所述的通信接口为RS-485串行接口。
该节点机监控信息汇集装置还设有用于显示其工作状态以及显示报警信息的指示灯,该指示灯与中央处理器连接。
该监控节点机接受监控主机发出的命令,远程上电/关闭或重启节点机;并根据监控主机的指令控制节点机的电源和机柜电源的开关;出现严重故障时对单机柜实施断电保护。
该节点机监控信息汇集装置为一个以上。
该监控主机与监控节点机以及监控节点机与各单节点机之间通过串口的通信为:采用主从轮询的方式,通过命令包处理队列与相应的通讯对象器的发送/接收命令包进行交互;具体的步骤为:
步骤1:从命令包处理队列尾部加入新的串口命令包;
步骤2:串口处理线程每次从命令包处理队列的队首读入一个命令包,通过串口通讯接口将其发送;
步骤3:在收到相应的回答后,再将该包从队列的队首删除;
步骤4:读入下一个命令包,重复步骤1。
该监控主机与节点机还通过以太网连接和通信,监控主机与各节点机采用主从方式进行通讯,监控主机分析处理汇总后的信息。
在节点机上设有代理模块,在监控主机上设有监控系统模块,代理模块和监控系统模块通过以太网通信。
本发明采用包括节点机信息采集装置、节点机监控信息汇集装置和监控主机在内的多层监控结构,可以方便地扩充被监控节点,并且通过合理的监控任务分配,降低监控主机的无谓负荷,提高了监控系统的整体性能。
附图说明:
图1为本发明的三层结构示意图;
图2为本发明一实施例的总体框图;
图3为本发明一实施例的节点机信息采集装置的原理结构图;
图4为本发明一实施例的节点机监控信息汇集装置的原理结构图;
图5为本发明一实施例的监控节点机的结构示意图;
图6为本发明一实施例的监控主机与节点机通过以太网连接和通信示意图;
图7为本发明一实施例的串口命令包的传输过程示意图;
图8为本发明一实篱例的以太网命令包的转输过程示意图。
具体实施方式:
参见图1、图2、图3,本发明的超级服务器的监控管理系统为一种具有3层结构的系统,具体由采集卡111(节点机信息采集装置)、汇集卡121(节点机监控信息汇集装置)和监控主机2组成;其中:
该采集卡111采集与之相应的单节点机11的监控信息,并与汇集卡121通信,接收并执行监控节点机12传递的监控指令;
该汇集卡121用于汇集各采集卡111采集的节点机11信息,并与监控主机2连接通信,同时接收并传递监控主机2的信息,执行监控主机2对节点机11控制信息的控制指令;
监控主机2接收从汇集卡121传递过来的各节点机11信息、机柜1信息,从机群管理系统主控机3读取系统的基本配置信息,根据接收的信息及用户的设定监控机群系统。
参见图1、图2、图3,本发明的一个具体的实施例如下:
汇集卡121与一个以上的采集卡111连接,监控主机2与一个以上的汇集卡121连接,这些连接均通过RS-485串行接口实现。
采集卡111采集节点机11的信息,并通过RS-485串行接口与汇集卡121通信,接收并执行监控节点机12传递的监控指令;汇集卡121汇集采集卡111采集的信息,同时采集其所在机柜1的硬件信息,通过RS-485串行接口与监控主机2连接通信,同时接收并传递监控主机2的信息,执行监控主机2对节点机11控制信息的控制指令;
监控主机2接收从汇集卡121传递过来的各节点机11信息、机柜1信息,从机群管理系统主控机3读取系统的基本配置信息,根据接收的信息及用户的设定监控机群系统。
另外,监控主机2与节点机11还通过以太网连接和通信,监控主机2与各节点机11采用主从方式进行通讯,监控主机2分析处理汇总后的信息。
参见图2、图3,本实施例中的采集卡111采集单节点内的监控管理信息,并向监控节点机12传递,同时接收并执行监控节点机12传递过来的监控指令;其具体设有:单片机1111、与该单片机1111连接并且用于和监控节点机12传递信息的通信接口;该单片机1111通过其I2C总线接口与节点机主板112连接。该通信接口为RS-485串行接口。另外,采集卡111还设有用于显示监控状态的指示灯,节点机11信息采集装置的单片机1111的地址线上还可以设置用于设定本装置ID地址的开关(图中未示),并可以直接与所在节点机11的5VSB电源连接以保证即使在节点机11关闭的时候也能工作。该采集卡111采集的节点机11的监控信息至少包括:该节点机11的风扇转速、电压值及温度信息。
参见图2、图4、图5,本实施例中的汇集卡121汇总单节点的监控信息,并向监控主机2传递,同时接收并传递监控主机2控制节点机11的信息,执行监控主机2对节点机11控制信息的控制指令;该汇集卡121装设在监控节点机12内,至少包括单片机1211、一个以上用于与节点机11监控采集装置和监控主机2进行通信的通信接口和存储单元;该汇集卡121还设有用于连接检测机柜1供电电源UPS电源17的传感器的连接接口,该连接接口连接到中央处理器1211的模数转换输入端。该汇集卡121还设有用于设定ID地址的装置(图中未示),该装置与中央处理器的数据总线连接。汇集卡121的通信接口为RS-485串行接口。另外,该汇集卡121上还设有用于显示其工作状态以及显示报警信息的指示灯,该指示灯与中央处理器连接;该汇集卡121所对应的监控节点机12接受监控主机2发出的命令,远程上电/关闭或重启节点机11;并根据监控主机2的指令控制节点机11的电源和机柜1电源的开关;出现严重故障时对单机柜1实施断电保护。
该监控主机2与监控节点机12以及监控节点机12与各单节点机11之间通过串口的通信为:采用主从轮询的方式,通过命令包处理队列与相应的通讯对象器的发送/接收命令包进行交互;具体的步骤为:
步骤1:从命令包处理队列尾部加入新的串口命令包;
步骤2:串口处理线程每次从命令包处理队列的队首读入一个命令包,通过串口通讯接口将其发送;
步骤3:在收到相应的回答后,再将该包从队列的队首删除;
步骤4:读入下一个命令包,重复步骤1。
参见图2,本发明的监控主机2与节点机11还通过以太网连接和通信,监控主机2与各节点机11,采用主从方式进行通讯,监控主机2分析处理汇总后的信息。由于以太网通讯机制上应用协议的特性(异步方式),为了高效利用网络带宽,可构造两个命令包队列,待发队列和待收队列。发送处理线程负责将待发队列中的命令包发送出去并调用命令包的回调,发送后的命令包加入待收队列中。接收处理线程监听端口接收来自节点的命令包回应,并调用命令的回调。
参见图2、图3,监控主机2与监控节点机11以及监控节点机12与各单节点机11之间通过串口通信;该通信采用主从轮询的方式,通过命令包处理队列与相应的通讯对象器的发送/接收命令包进行交互;具体的步骤为:
步骤1:从命令包处理队列尾部加入新的串口命令包;
步骤2:串口处理线程每次从命令包处理队列的队首读入一个命令包,通过串口通讯接口将其发送;
步骤3:在收到相应的回答后,再将该包从队列的队首删除;
步骤4:读入下一个命令包,重复步骤1。
再参见图2、图3,采集卡111设置于节点机11内,采集节点机11的风扇、电压、温度等信息,并可根据需要增加风扇和温度传感器,风扇转速可调。对采集到的信息进行监控,通过蜂鸣器113和LED灯报警。通过RS-485高速串行总线与监控节点机12通信,将节点机11运行状态和运行参数送往监控管理设备22。接受监控节点机12发出的命令,远程上电/关闭或重启节点机11。并可控制节点机11的电源和重启按钮有效或失效。出现严重故障时对节点机实施断电保护。
具体通过I2C总线,并遵循INTEL推行的一种数据规范-IPMI(智能平台管理接口,Intelligent Platform Management Interface)规范读取主板监控管理控制器(Baseboard Management Controller,简称BMC)信息,(包括风扇、电压、温度、电源、内存等)。通过中央处理器1111控制在节点机11上增加的风扇,并可读取和控制风扇转速;通过中央处理器1111控制温度传感器114,测量机箱、电源等处的温度。通过LED灯和蜂鸣器113对电压、风扇、温度等出现不正常情况进行报警。不正常情况包括:电压超出阈值、风扇故障、温度超出报警值。另外还通过模拟开关实现控制节点机11的远程上电/断电和重启,并控制节点机11的电源和重启按钮有效或失效。在出现严重故障(比如硬盘过热,电压波动过于强烈)自动断电保护。
再参见图2、图4、图5,监控节点机12主要功能及实施方案如下:汇集卡121设置于单机柜1内,采集机柜1内的风扇、温度等信息,并可根据需要增放风扇和温度传感器,风扇转速可调;并对采集到的信息进行监控,通过蜂鸣器或LED灯报警。通过RS-485高速串行总线与节点机11采集卡111通信,将机柜1内各节点机11运行状态和运行参数送往监控管理设备22。接受监控管理设备22发出的命令,远程上电/关闭或重启节点机11。并根据监控管理设备22的指令控制节点机11的电源和机柜1电源的开关。出现严重故障时对单机柜1实施断电保护。
具体的功能及实施方案:
1、测试单机柜1内各节点机11的监控管理系统是否处于正常工作状态通过RS-485总线与机柜1内各节点机11上的采集卡111的火线(FIRMWARE)通讯,查询各节点机11的监控管理系统是否处于正常的工作状态。
2、测试220v交流电的供电状况
通过电压传感器15测量机柜1的供电源的电压值,并通过电流传感器14测量机柜的供电源的电流值。
3、测量机柜的温度、风扇信息
通过散置在机柜1的各热敏点处的机柜温度传感器16,侦察机柜1内各点的温度值,如果机柜1的风扇上提供控制端,可以通过控制端监控机柜1内风扇的运行状况,保证机柜1内运行的节点机11处在正常的工作环境内。同时通过监测到的温度信息,在极特殊的情况下,自动切断机柜1或节点机11的供电电源。
该汇集卡121通过中央处理器1211读取和控制风扇转速,读取机柜1内热敏点温度。
4、通过RS-485总线与单节点机11、监控主机2通信。
因为RS-485总线能够轻松支持32个节点机进行快速正确的通讯,所以选用RS-485总线支持监控节点机12与单节点机11、监控管理设备22进行通讯。
5、控制执行机柜及各节点机进行开关电操作
汇集卡121接收监控管理设备22的命令,对机柜1及个节点机11进行开关电操作。在遭遇极特殊情况的条件下独立对机柜1及各节点机11进行开关电操作。其中,对机柜的切电操作通过固态继电器实现,对节点机的切电操作是通过给采集卡121发切电指令实现。
再参见图6,机群的硬件信息采集通过串口通讯模块244与各机柜控制器13通讯,机群各节点的系统信息则由节点上的节点代理117模块负责采集,通过以太网通讯模块1172向监控系统24发送。所有通讯必须由监控系统24主动发起,监控系统24与各节点代理117,以及监控系统24与各机柜控制器13之间的通讯均为主从模式。汇总后的软硬件信息在监控系统24中经数据处理模块242分析处理后,将数据在用户界面中表现出来。
由于以太网通讯机制上应用协议的特性(异步方式),为了高效利用网络带宽,因此构造两个命令包队列,待发队列和待收队列。发送处理线程负责将待发队列中的命令包发送出去并调用命令包的回调,发送后的命令包加入待收队列中。接收处理线程监听端口接收来自节点的命令包回应,并调用命令的回调。
节点代理117模块负责将机群节点机上操作系统可获得的信息按要求发送到监控系统24,根据以太网通讯模块243收到的监控系统24请求,分辨请求类型并触发相应的功能,产生随机数模拟真实数据,将数据按一定格式要求打包后返回给以太网通讯模块1172。
本发明中的数据以包的形式在网路上传送,该包按功能分为命令包和数据包,具有固定的相同的包长(7个字节);但是其内容含义各有差异。
命令包独立发送和接收,而数据包则和其包内字段指定长度的数据块一同发送和接收。因此该通讯协议可以传送任意长度的数据。
每个包首先应具有目标地址信息以确保目标机柜能够收到。
其次,包具有校验字节以保证数据的正确性,该校验字节在命令包中位于命令包的尾部,在数据包中位于数据包跟随的数据块的尾部,其值是包内所有其它字节的和(忽略溢出部分)。
同时,包还具有序列号,以保证由于重发导致机柜控制器收到两次同样的包而产生重复动作。
参见图7,串口命令包队列5是一个FIFO(先入先出)队列,队列成员封装了命令包/数据包,加入一些配置信息,同时定义了与之相对应的回调处理(发送前,发送成功,发送失败三种情况)。程序中的其它模块将封装好的队列成员加入队列中等待发送。串口命令包处理线程51打开串口,进行初始化工作,然后进入处理循环,从串口命令包队列5的队首读入一个队列成员(读入操作并未将其从队列中删除),解读该队列成员的信息,提取命令包/数据包,向串口发送。然后等待目标机柜控制器的回应直至超时。超时将导致重发命令包/数据包。当从串口收到回应,确认该回应的正确性后,或者当超时三次后,从串口命令包队列5中删除队首成员。处理下一个队首成员。
串口命令包处理线程51在发送命令包之前,成功收到回应之后,或者超时放弃发送之后都将调用相应的回调处理。
参见图8,类似于串口命令包队列5,以太网命令包队列成员封装了UDP(用户数据包协议,USER DATAGRAM PROTOCOL)包,加入了一些配置信息,同时定义了与之相对应得回调处理(发送前,发送成功,发送失败三种情况)。封装好的队列成员加入以太网命令包待发队列6中,而以太网命令包待收队列7中的成员是待发队列中已经被处理的成员(UDP包已经被发送)。
以太网命令包发送处理线程61负责从待发队列(FIFO)中读取队首成员(读取操作同时将该成员从队首删除),将该成员所包含的UDP包发送至其配置信息指定的目标节点,调用相应的回调处理,然后将该成员添加入待收队列中。以太网命令包接收处理线程71监听本地端口,将接收到的UDP包与待收队列成员中的UDP包进行比较,找到对应的则将该队列成员从队列中删除,发现队列中有成员已经超时未收到回应,则将它取出加入到待发队列中准备重新发送。对于重发超过一定次数的则认为该成员发送失败,调用相应的回调处理,并将其从待收队列中删除。
以上实施例仅用以说明而非限制本发明所涉及的技术方案,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,本发明的技术方案可以进行修改、变形或者等同替换;而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围之中。

Claims (17)

1、一种超级服务器的监控管理系统,其特征在于:至少包括节点机信息采集装置、节点机监控信息汇集装置和监控主机;其中:
该节点机信息采集装置用于采集与之相应的单节点机的监控信息,并与节点机监控信息汇集装置通信,接收并执行监控节点机传递的监控指令;
该节点机监控信息汇集装置用于汇集各节点机监控信息,并与监控主机连接通信,同时接收并传递监控主机的信息,执行监控主机用于对节点机进行控制的控制信息的控制指令;
监控主机接收从节点机监控信息汇集装置传递过来的各节点机信息、由所述节点机监控信息汇集装置采集的机柜信息,从机群管理系统主控机读取系统的基本配置信息,根据接收的信息及用户的设定监控机群系统。
2、根据权利要求1所述的超级服务器的监控管理系统,其特征在于:所述的节点机信息采集装置装设在节点机内,至少设有中央处理器、与该中央处理器连接,并且用于和监控节点机传递信息的通信接口;该中央处理器通过其I2C总线接口与节点机主板连接。
3、根据权利要求2所述的超级服务器的监控管理系统,其特征在于:所述的通信接口为RS-485串行接口。
4、根据权利要求1或2所述的超级服务器的监控管理系统,其特征在于:节点机信息采集装置还设有用于显示监控状态的指示灯,该指示灯连接到中央处理器的输出端口。
5、根据权利要求1或2所述的超级服务器的监控管理系统,其特征在于:在中央处理器的地址线上还设有用于设定所述节点机信息采集装置ID地址的开关。
6、根据权利要求1或2所述的超级服务器的监控管理系统,其特征在于:所述节点机信息采集装置直接与所在节点机的5VSB电源连接。
7、根据权利要求1或2所述的超级服务器的监控管理系统,其特征在于:该节点机信息采集装置采集的节点机的监控信息至少包括:该节点机的风扇转速、电压值及温度信息。
8、根据权利要求1或2所述的超级服务器的监控管理系统,其特征在于:该节点机信息采集装置为一个以上。
9、根据权利要求1所述的超级服务器的监控管理系统,其特征在于:所述的节点机监控信息汇集装置装设在监控节点机内,至少包括中央处理器、一个以上用于与节点机监控采集装置和监控主机进行通信的通信接口和存储单元;该通信接口与中央处理器连接,该中央处理器与该存储单元连接。
10、根据权利要求9所述的超级服务器的监控管理系统,其特征在于:该节点机监控信息汇集装置还设有用于连接检测机柜供电电源的传感器的连接接口,该连接接口连接到中央处理器的模数转换输入端。
11、根据权利要求1或9所述的超级服务器的监控管理系统,其特征在于:设置在所述监控节点机中的节点机监控信息汇集装置还设有用于设定ID地址的装置,所述用于设定ID地址的装置与中央处理器的数据总线连接。
12、根据权利要求9所述的超级服务器的监控管理系统,其特征在于:所述的通信接口为RS-485串行接口。
13、根据权利要求1或9所述的超级服务器的监控管理系统,其特征在于:设置在所述监控节点机中的节点机监控信息汇集装置还设有用于显示其工作状态以及显示报警信息的指示灯,该指示灯与中央处理器连接。
14、根据权利要求9所述的超级服务器的监控管理系统,其特征在于:该监控节点机接受监控主机发出的命令,远程上电/关闭或重启节点机;并根据监控主机的指令控制节点机的电源和机柜电源的开关;出现严重故障时对单机柜实施断电保护。
15、根据权利要求1或9所述的超级服务器的监控管理系统,其特征在于:该节点机监控信息汇集装置为一个以上。
16、根据权利要求1所述的超级服务器的监控管理系统,其特征在于:该监控主机与节点机还通过以太网连接和通信,监控主机与各节点机,采用主从方式进行通讯,监控主机分析处理汇总后的信息。
17、根据权利要求1所述的超级服务器的监控管理系统,其特征在于:在节点机上设有代理模块,在监控主机上设有监控系统模块,代理模块和监控系统模块通过以太网通信。
CNB021256276A 2002-07-25 2002-07-25 超级服务器的监控管理系统 Expired - Fee Related CN100454267C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB021256276A CN100454267C (zh) 2002-07-25 2002-07-25 超级服务器的监控管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021256276A CN100454267C (zh) 2002-07-25 2002-07-25 超级服务器的监控管理系统

Publications (2)

Publication Number Publication Date
CN1470990A CN1470990A (zh) 2004-01-28
CN100454267C true CN100454267C (zh) 2009-01-21

Family

ID=34142974

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021256276A Expired - Fee Related CN100454267C (zh) 2002-07-25 2002-07-25 超级服务器的监控管理系统

Country Status (1)

Country Link
CN (1) CN100454267C (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100430917C (zh) * 2005-04-22 2008-11-05 天津曙光计算机产业有限公司 一种自主构造机群操作系统内核的方法及智能构造器
CN101389104B (zh) * 2007-09-11 2011-09-21 京信通信系统(中国)有限公司 射频拉远系统中远端数据的实时采集方法
CN101567130B (zh) * 2008-04-23 2010-12-22 中国科学院自动化研究所 一种交通信号控制器的远程故障检测方法及系统
CN101621424B (zh) * 2009-05-07 2011-08-17 曙光信息产业(北京)有限公司 一种Infiniband交换机智能监控方法
CN101931551B (zh) * 2009-06-19 2013-01-09 鸿富锦精密工业(深圳)有限公司 服务器管理系统及方法
CN102313506B (zh) * 2010-07-09 2013-12-25 联想(北京)有限公司 一种检测设备物理位置的方法、机柜以及设备
CN102333021A (zh) * 2010-07-12 2012-01-25 上海君悦网络科技有限公司 一种电信机房的服务器资产自动清查信息处理方法及装置
CN102088366B (zh) * 2010-11-30 2015-06-03 中兴通讯股份有限公司 一种单板信息监控装置及分布式单板信息监控系统
CN102567182A (zh) * 2010-12-27 2012-07-11 无锡华润上华科技有限公司 远程主机的监控方法
CN102122262A (zh) * 2011-01-24 2011-07-13 武汉固捷联讯科技有限公司 一种用于固态存储设备的监控系统及方法
CN102434479A (zh) * 2011-11-15 2012-05-02 浪潮电子信息产业股份有限公司 一种机架式服务器机箱内恒温节能控制方法
CN103188106A (zh) * 2011-12-29 2013-07-03 英业达股份有限公司 远端监控节点服务器的方法
CN104076808B (zh) * 2013-03-28 2019-04-12 研祥智能科技股份有限公司 工控设备的故障诊断系统和方法
CN104483913A (zh) * 2014-10-31 2015-04-01 山东超越数控电子有限公司 一种应用i2c总线实现龙芯刀片服务器电源状态监控的方法
CN106033380A (zh) * 2015-03-11 2016-10-19 昆达电脑科技(昆山)有限公司 机架式服务器系统
CN106021073A (zh) * 2016-05-05 2016-10-12 中国人民财产保险股份有限公司 一种高端存储机状态的获取方法及装置
CN106407059A (zh) * 2016-09-28 2017-02-15 郑州云海信息技术有限公司 一种服务器节点测试系统及方法
CN106844092B (zh) * 2016-12-09 2020-02-11 武汉烽火信息集成技术有限公司 一种自动恢复掉电的MariaDB Galera Cluster的方法
CN109522183B (zh) * 2018-10-23 2022-04-12 东软集团股份有限公司 工作状态监控方法及系统,采集器,服务器及存储介质
CN111176956A (zh) * 2018-11-09 2020-05-19 广州贵冠科技有限公司 监控装置
CN110691128A (zh) * 2019-09-25 2020-01-14 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于ipmi系统健康管理中间件的通信方法、系统、介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05316116A (ja) * 1992-05-14 1993-11-26 Matsushita Electric Ind Co Ltd サーバの予備系の一元管理装置
JPH10247911A (ja) * 1997-03-05 1998-09-14 Mitsubishi Electric Corp マルチサーバ構成におけるシステム監視情報管理装置及びマルチサーバ構成におけるシステム監視情報管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05316116A (ja) * 1992-05-14 1993-11-26 Matsushita Electric Ind Co Ltd サーバの予備系の一元管理装置
JPH10247911A (ja) * 1997-03-05 1998-09-14 Mitsubishi Electric Corp マルチサーバ構成におけるシステム監視情報管理装置及びマルチサーバ構成におけるシステム監視情報管理方法

Also Published As

Publication number Publication date
CN1470990A (zh) 2004-01-28

Similar Documents

Publication Publication Date Title
CN100454267C (zh) 超级服务器的监控管理系统
CN101369927B (zh) 通用远程自动数据采集系统
CN112035319B (zh) 一种针对多路径状态的监控告警系统
CN104104434A (zh) 一种快速插入告警帧的掉电告警实现方法
CN103152210A (zh) 修复生成树协议转发状态异常的方法及堆叠设备
CN101378333A (zh) 实现连续性检查消息报文收发的系统、装置及方法
CN113645048B (zh) 网卡切换方法、装置以及现场可编程逻辑门阵列fpga
CN109100116B (zh) 一种光模块故障诊断系统及方法
CN108599978B (zh) 一种云监控方法和装置
Nicholas et al. A power LAN for telecommunication power supply equipment
WO2024082471A1 (zh) 节点间链路状态监测方法和装置
CN110620693A (zh) 一种基于物联网的铁路沿线车站路由远程重启控制系统及方法
EP4072106A1 (en) Dynamic environment monitoring
CN106411616B (zh) 一种通过1553b总线管理以太网终端的装置及方法
CN115276235A (zh) 一种变电站安全监测智能管理系统及方法
CN115484208A (zh) 一种基于云安全资源池的分布式引流系统和方法
CN111683142B (zh) 计量装置、计量方法和计算机可读存储介质
CN210867734U (zh) 一种多接口转发器网络接口控制电路
CN116319398A (zh) 一种网络巡检方法、网络设备及网络管理设备
CN114172933A (zh) 一种dcs与外挂智能控制器的通讯系统
CN205679989U (zh) 一种基于can总线的消防设备控制系统
CN111786899A (zh) 一种物联网通信方法及相关设备
CN101483527B (zh) 一种双引擎交换机设备及其引擎切换方法
CN112671549A (zh) 一种数据处理方法、设备及系统
CN214407595U (zh) 基于窄带物联网的温湿度光照传感器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090121

Termination date: 20200725