CN102929760A - 一种远程监控系统上电过程宕机的方法 - Google Patents

一种远程监控系统上电过程宕机的方法 Download PDF

Info

Publication number
CN102929760A
CN102929760A CN2012103990080A CN201210399008A CN102929760A CN 102929760 A CN102929760 A CN 102929760A CN 2012103990080 A CN2012103990080 A CN 2012103990080A CN 201210399008 A CN201210399008 A CN 201210399008A CN 102929760 A CN102929760 A CN 102929760A
Authority
CN
China
Prior art keywords
bmc
module
node
monitoring
display control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103990080A
Other languages
English (en)
Inventor
颜伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2012103990080A priority Critical patent/CN102929760A/zh
Publication of CN102929760A publication Critical patent/CN102929760A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种远程监控系统上电过程宕机的方法,该方法是以大规模服务器节点为基础的数据中心,通过本体系结构的灵活监控管理,为机房管理人员带来前所未有的灵活性,大大降低了维护调试人员的工作量,提高了生产工作效率。远程监控系统上电过程宕机的方法,对数据机房调试过程中出现的异常宕机状况,可以实现有效定位节点位置和控制修复动作,弥补了传统的以上层监控为核心的监控管理体系结构,使其适应了当今社会发展的需求,因而具有广阔的发展前景。

Description

一种远程监控系统上电过程宕机的方法
技术领域
本发明涉及计算机通信管理领域, 具体地说是一种远程监控系统上电过程宕机的方法。
背景技术
从上个世纪90年代以来,随着科学技术的迅速发展,人们的生产行为,生产方式都发生了重大的变化,作为生产中非常重要的一项技术即监控技术的重要性正在逐渐被人们认识和重视。而计算机监控系统是以监控控制计算机为主体,加上检测装置、执行机构和被监控控制对象共同构成的整体。
随着生产力的进步,各自独立的监测系统已不能满足工业化的需求,于是出现了分布式系统。这种系统以计算机网络为基础,使系统资源分配趋于合理。另一方面数据大规模爆发式增长,数据中心的应用越来越多,然而,当今的数据中心管理大多是针对上层应用的管理控制,数据采集分析之类,对于机房管理人员来说,大规模节点的可调试性,易维护性显得尤为重要。在数据中心的建立及调试过程中,很容易出现个别节点异常状况,在现有的监控管理系统基础上,提出一种适用于机房建设管理人员的监控管理体系结构就显得很必要了。 
发明内容
本发明的目的是提供一种远程监控系统上电过程宕机的方法。。
本发明的目的是按以下方式实现的,系统通过BIOS计时开关模块、BMC监控计时模块、管理中心显示控制模块相互紧密配合,形成一个分布式集成监控系统,当某个节点系统发生故障时,显示模块能有效的定位节点,并远程重启相应节点,从而提高数据中心的调试效率,系统包括:系统上电BIOS计时开关模块(1),BMC监控计时模块(2),管理中心显示控制模块(3),其中:
BMC监控计时模块(2)是系统的核心,负责协调各资源间的通信以及系统状态的转化;
系统上电BIOS计时开关模块(1)负责控制BMC中计时器的打开和关闭,采用专用的IPMI协议来实现;
管理中心显示控制模块(3)在数据中心进行开机调试时,负责系统起动状态的显示,把系统状态以LED灯的形式展现在控制台上,并能发出重启某节点的命令,监控步骤如下:
BMC监控计时模块(2)为此体系结构的核心,起到协调各资源间的通信及协议转化等作用,数据中心进行调试时,各节点BMC监控计时模块收到BIOS打开计时器指令后,立即进行计时动作,BIOS会在节点在上电完成时,发送关闭计时器指令;如果节点机器发生宕机,BMC无法收到关闭计时器指令,从而造成计时器超出规定的限值,进而BMC监控计时模块会发指令更新管理中心显示控制模块(3)的状态,管理人员及时获取,并经过管理中心显示控制模块向BMC发出重启故障节点的指令,来修复故障节点机器。
本发明的有益效果是:在以大规模服务器节点为基础的数据中心,通过本体系结构的灵活监控管理,为机房管理人员带来前所未有的灵活性,大大降低了维护调试人员的工作量,提高了生产工作效率。远程监控系统上电过程宕机的方法,对数据机房调试过程中出现的异常宕机状况,可以实现有效定位节点位置和控制修复动作,弥补了传统的以上层监控为核心的监控管理体系结构,使其适应了当今社会发展的需求,因而具有广阔的发展前景。
附图说明
图1是本体系结构说明图。
具体实施方式
 参照说明书附图对本发明的方法作以下详细地说明。
正如发明内容中所描述的,本发明体系结构主要包括:系统上电BIOS计时开关模块(1),BMC监控计时模块(2)、管理中心显示控制模块(3);
BMC监控计时模块(2)为此体系结构的核心,起到协调各资源间的通信及协议转化等作用,数据中心进行调试时,各节点BMC监控计时模块收到BIOS打开计时器指令后,立即进行计时动作,BIOS会在节点在上电完成时,发送关闭计时器指令;如果节点机器发生宕机,BMC无法收到关闭计时器指令,从而造成计时器超出规定的限值,进而BMC监控计时模块会发指令更新管理中心显示控制模块(3)的状态,管理人员可以及时获取,并经过管理中心显示控制模块向BMC发出重启故障节点的指令,来修复故障节点机器。
与传统的以上层应用为核心的监控管理服务器体系结构相比,这种新型的体系结构具有高可用性、高灵活性,以及基于模块化部件灵活配置等特性。
其中,高可用性的实现方式描述如下:特征在于在体系结构中,BIOS计时开关模块、BMC监控计时模块、管理中心显示控制模块相互紧密配合,形成一个分布式集成监控系统,当某个节点系统发生故障时,显示模块能有效的定位节点,并远程重启相应节点,从而提高数据中心的调试效率。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种远程监控系统上电过程宕机的方法,其特征在于系统通过BIOS计时开关模块、BMC监控计时模块、管理中心显示控制模块相互紧密配合,形成一个分布式集成监控系统,当某个节点系统发生故障时,显示模块能有效的定位节点,并远程重启相应节点,从而提高数据中心的调试效率,系统包括:系统上电BIOS计时开关模块(1),BMC监控计时模块(2),管理中心显示控制模块(3),其中:
BMC监控计时模块(2)是系统的核心,负责协调各资源间的通信以及系统状态的转化;
系统上电BIOS计时开关模块(1)负责控制BMC中计时器的打开和关闭,采用专用的IPMI协议来实现;
管理中心显示控制模块(3)在数据中心进行开机调试时,负责系统起动状态的显示,把系统状态以LED灯的形式展现在控制台上,并能发出重启某节点的命令,监控步骤如下:
BMC监控计时模块(2)为此体系结构的核心,起到协调各资源间的通信及协议转化等作用,数据中心进行调试时,各节点BMC监控计时模块收到BIOS打开计时器指令后,立即进行计时动作,BIOS会在节点在上电完成时,发送关闭计时器指令;如果节点机器发生宕机,BMC无法收到关闭计时器指令,从而造成计时器超出规定的限值,进而BMC监控计时模块会发指令更新管理中心显示控制模块(3)的状态,管理人员及时获取,并经过管理中心显示控制模块向BMC发出重启故障节点的指令,来修复故障节点机器。
CN2012103990080A 2012-10-19 2012-10-19 一种远程监控系统上电过程宕机的方法 Pending CN102929760A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103990080A CN102929760A (zh) 2012-10-19 2012-10-19 一种远程监控系统上电过程宕机的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103990080A CN102929760A (zh) 2012-10-19 2012-10-19 一种远程监控系统上电过程宕机的方法

Publications (1)

Publication Number Publication Date
CN102929760A true CN102929760A (zh) 2013-02-13

Family

ID=47644564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103990080A Pending CN102929760A (zh) 2012-10-19 2012-10-19 一种远程监控系统上电过程宕机的方法

Country Status (1)

Country Link
CN (1) CN102929760A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346252A (zh) * 2013-08-09 2015-02-11 英业达科技有限公司 监控芯片对于异常的感测数据的过滤方法
CN107203456A (zh) * 2016-03-17 2017-09-26 昆达电脑科技(昆山)有限公司 服务器故障的远程报警系统及方法
CN108173959A (zh) * 2018-01-09 2018-06-15 郑州云海信息技术有限公司 一种集群存储系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1655695A2 (en) * 2004-11-05 2006-05-10 Hitachi, Ltd. Remote maintenance system, monitoring center computer used for the same, monitoring system and method of communication for maintenance
CN101271412A (zh) * 2007-03-21 2008-09-24 英业达股份有限公司 多处理器及多存储器系统的开机切换装置及方法
CN101626390A (zh) * 2008-07-11 2010-01-13 上海智动传媒投资有限公司 广告宣传用主机的远程控制系统及其控制方法
CN102387048A (zh) * 2011-10-25 2012-03-21 中兴通讯股份有限公司 一种用于分布式文件系统的监控方法及分布式文件系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1655695A2 (en) * 2004-11-05 2006-05-10 Hitachi, Ltd. Remote maintenance system, monitoring center computer used for the same, monitoring system and method of communication for maintenance
EP1655695A3 (en) * 2004-11-05 2010-12-22 Hitachi, Ltd. Remote maintenance system, monitoring center computer used for the same, monitoring system and method of communication for maintenance
CN101271412A (zh) * 2007-03-21 2008-09-24 英业达股份有限公司 多处理器及多存储器系统的开机切换装置及方法
CN101626390A (zh) * 2008-07-11 2010-01-13 上海智动传媒投资有限公司 广告宣传用主机的远程控制系统及其控制方法
CN102387048A (zh) * 2011-10-25 2012-03-21 中兴通讯股份有限公司 一种用于分布式文件系统的监控方法及分布式文件系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346252A (zh) * 2013-08-09 2015-02-11 英业达科技有限公司 监控芯片对于异常的感测数据的过滤方法
CN107203456A (zh) * 2016-03-17 2017-09-26 昆达电脑科技(昆山)有限公司 服务器故障的远程报警系统及方法
CN108173959A (zh) * 2018-01-09 2018-06-15 郑州云海信息技术有限公司 一种集群存储系统
CN108173959B (zh) * 2018-01-09 2020-09-04 郑州云海信息技术有限公司 一种集群存储系统

Similar Documents

Publication Publication Date Title
CN102710023B (zh) 适用于不同类型的风光储微网系统的监控系统
CN103178544B (zh) 并联型多单元光伏并网逆变器系统的启停控制方法
CN102164184A (zh) 云计算网络中计算机实体的接入和管理方法及云计算网络
CN105577430A (zh) 一种高端容错服务器的节点管理方法
CN102929760A (zh) 一种远程监控系统上电过程宕机的方法
WO2013000412A1 (zh) 一种实现多机监控的直流电源系统及方法
CN105138437A (zh) 一种基于疲劳测试机和4U治具的SmartRack多节点并行reboot测试的方法
CN105978724A (zh) 一种基于ipmi的服务器管理系统
CN109101400A (zh) 一种云计算数据中心整机柜服务器的监控系统
WO2017000387A1 (zh) 数据中心智能电力监控系统和监控方法
CN204287946U (zh) 一种直线式拉丝机物联网化连接结构
CN110703679A (zh) 一种风力发电机组工业控制器
CN103457926A (zh) 一种cms前置机与服务器的通讯方法
CN202353312U (zh) 远程电能质量监测系统
CN104767283A (zh) 一种小型能源发电微网监控方法及装置
Krishnan Smart Home Energy Management-the Future of Energy Conservation: A Review
CN104065738A (zh) 一种智能化自动控制的业务系统负载均衡方法
CN114002952A (zh) 一种集群集中式散热调控系统及方法
CN206712848U (zh) 网络设备远程诊断系统
CN111200919A (zh) 冷源ba控制系统和数据中心
CN204886409U (zh) 可远程维护的变电站在线监测系统
CN204347564U (zh) 一种基于现场总线的智能建筑楼宇控制系统
CN203010841U (zh) 集中管理和控制的新风节能系统
Liu et al. Discussion on the elastic optical network technology of the centralized control architecture of the power data communication network
Zhou et al. Study on Key Technologies of Power Dispatching Control System under the Background of Cloud Computing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130213