CN1286013C - 远程判断系统状态的方法 - Google Patents

远程判断系统状态的方法 Download PDF

Info

Publication number
CN1286013C
CN1286013C CN 03149794 CN03149794A CN1286013C CN 1286013 C CN1286013 C CN 1286013C CN 03149794 CN03149794 CN 03149794 CN 03149794 A CN03149794 A CN 03149794A CN 1286013 C CN1286013 C CN 1286013C
Authority
CN
China
Prior art keywords
monitored end
network interface
interface card
control chip
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 03149794
Other languages
English (en)
Other versions
CN1581094A (zh
Inventor
周谧
周建
刘涛
王晟
席振新
张宗宏
王晚丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN 03149794 priority Critical patent/CN1286013C/zh
Publication of CN1581094A publication Critical patent/CN1581094A/zh
Application granted granted Critical
Publication of CN1286013C publication Critical patent/CN1286013C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种远程判断系统状态的方法,包括由监控端和被监控端构成的监控系统,两者之间通过以太网相连,其中,在被监控端的操作系统之上运行监控代理程序;监控代理程序响应监控端的监控命令,定时向被监控端上的网卡上的控制芯片发送心跳信息;将监控端的IP地址写入网卡上的EEPROM里;监控端定时Ping运行在被监控端操作系统上的监控代理程序,并且随时接收被监控端发来各种命令响应信息和告警信息;监控端不能Ping通运行在被监控端操作系统上的监控代理时,发送ASF的获取系统状态命令到被监控端,通过判断被监控端的网卡上的控制芯片返回的各种状态信息,分别得出系统当前的状态。采用本发明能实现操作系统上层具体状态的判断,如操作系统是部分服务挂起还是操作系统全部挂起,同时还能区分计算机断电还是网络未通。

Description

远程判断系统状态的方法
技术领域
本发明涉及计算机网络系统管理技术,尤其是涉及控制端通过远程对网络的被监控端的状态进行监视判断的方法。
背景技术
随着计算机工业的不断发展,计算机在企业内的应用逐渐普及,这时计算机的集中式网络管理就变得尤为重要。特别是对一些企事业单位,出于对员工的计算机的监控和管理,他们会提出这样一个具体的监控需求,即实时监控网络内所有计算机的状态和当前正在运行的计算机程序。所以在大部分的集中式的网络管理软件中,实时监控所有计算机的状态是一项必备的功能,但是由于它们大都是基于软件的解决方案,所以只能监控到有限的几种计算机状态,如:操作系统运行正常、死机和关机等。目前还没有一家厂商的软件可以实现完全的计算机状态管理。
基于标准的ASF(Alert Standard Format报警标准格式)规范是DMTF在2001年提出的,它适用于针对操作系统在线和操作系统不在线情况下的计算机远程诊断,它适用于笔记本式电脑、台式机、工作站或服务器。ASF技术的‘发送’(报警)和‘接收’(远程控制)功能都是基于硬件的,依靠网络的系统解决方案,这使它真正具有CPU和操作系统的独立性,提供到控制台的更稳定连接。
虽然,ASF的出现增加了对计算机状态的判断,但它不能实现操作系统上层具体状态的判断,如操作系统是部分服务挂起还是操作系统全部挂起(俗称:“当机”、“死机”),同时也不能区分计算机断电还是网络未通。
发明内容
本发明基于ASF的具体实现技术,结合上层软件的配合,提出一种远程判断系统状态的方法,它可以实现的状态判断有:远程计算机正常运行,远程计算机部分服务不能正常运行、远程计算机操作系统挂起、远程计算机操作系统未在线、远程计算机休眠、远程计算机关机但上电、远程计算机断电、远程计算机网络未通等,同时在远程计算机正常运行的情况下,还可以返回当前计算机正常运行的进程。这里的计算机包括:PC机、服务器和笔记本式电脑。
本发明所述远程判断系统状态的方法,包括由监控端和被监控端构成的监控系统,两者之间通过以太网相连,所述方法是这样实现的:
步骤一:在被监控端的操作系统之上运行监控代理程序;该监控代理程序用于响应监控端的监控命令,定时向被监控端上的网卡上的控制芯片发送心跳信息;将监控端的IP地址写入被监控端网卡上的EEPROM里;
步骤二:被监控端网卡上的控制芯片负责接收监控代理发来的心跳信息,当在一段时间内收不到心跳信息,则认为操作系统的服务挂起,就向监控端上报发送操作系统挂起告警信息,否则判断操作系统运行正常;步骤三:监控端定时Ping运行在被监控端操作系统上的监控代理程序,并且随时接收被监控端发来各种命令响应信息和告警信息;
步骤四:监控端不能Ping通运行在被监控端操作系统上的监控代理时,发送ASF的获取系统状态命令到被监控端,通过判断被监控端的网卡上的控制芯片返回的各种状态信息,分别得出系统当前的状态。
如上所述的远程判断系统状态的方法,当发送ASF的获取系统状态命令到被监控端不成功,则认为网络连接中断。
如上所述的远程判断系统状态的方法,当发送ASF的获取系统状态命令到被监控端成功时,如果被监控端的网卡上的控制芯片返回的是工作(S5/G0-Working)状态,则对被监控端进行TCP/IP的Ping;
如果能够收到回应信息,则接着判断是否能收到由被监控端网卡上的控制芯片发来的操作系统挂起信息,如果收到挂起信息,则认为监控代理不能正常运行;如果收不到挂起信息,则认为操作系统层上的服务部分挂起;
如果不能够收到回应信息,则判断认为操作系统全部挂起。
如上所述的远程判断系统状态的方法,当发送ASF的获取系统状态命令到被监控端成功时,如果被监控端的网卡上的控制芯片返回的不是S5/GO-Working状态,则继续判断是否为软关机(S5/G2-soft off)状态,如果是,则认为操作系统已经关闭,如果不是则分别针对返回状态进行判断。
如上所述的远程判断系统状态的方法,当发送ASF的获取系统状态命令到被监控端成功时,如果被监控端的网卡上的控制芯片返回的是S1、S2和S3状态,则表示休眠状态。
如上所述的远程判断系统状态的方法,当发送ASF的获取系统状态命令到被监控端成功时,判断网卡控制芯片是否可从ACPI表中读取信息,如果不能从ACPI表中读取信息,则判断系统状态为断电状态。
如上所述的远程判断系统状态的方法,当发送ASF的获取系统状态命令到被监控端成功时,如果被监控端的网卡上的控制芯片返回的是S5/G2-soft off状态,则表示操作系统关闭,但系统还处于上电的状态。
如上所述的远程判断系统状态的方法,还包括:监控端将得到的被监控端的系统状态在界面显示给用户。
采用本发明能实现操作系统上层具体状态的判断,如操作系统是部分服务挂起还是操作系统全部挂起,同时还能区分计算机断电还是网络未通。这方便了网络管理员对网络系统的管理,如当某被监控端不能联网时,网络管理员可以通过观察全网内其他被监控端的状态,如果都是网络不通状态,那么就可以判断出时交换机或路由器出现故障的可能性较大,如果只是某个被监控端出现网络不通的状态,那么很可能是其自身的原因。此外,管理员在机房里可以很方便的察看各被管理机器的状态,如对于学生机房,在上课时,老师可以通过察看当前被监控端正在运行的进程,得知学生正在做什么,在下课时可以察看哪些机器没有关,或者没有断电。
附图说明
图1是运行本发明所述方法的监控系统的结构示意图;
图2是本发明所述方法的基本流程图。
具体实施方式
图1给出了运行本发明所述方法的监控系统的结构示意图。从图1可以看出,整个监控系统包括监控端和被监控端,两者之间通过以太网相连。
被监控端运行在被监控的计算机上,收集计算机上的信息,响应监控端的命令,并将收集到的信息传到监控端;当被监控端出现告警时或者断电时,将告警信息发送到监控端。它的实现又分四大部分,分别是:
1)运行在被监控计算机操作系统之上的监控代理,它的主要功能是:
响应监控端的监控命令,如获取运行在操作系统上的软件信息,并将这些信息根据监控端的要求返回,根据监控端的命令监控各I/O端口的输入,同时以Pong命令响应监控端发来的Ping命令;
向监控端发送监控端定义的告警信息,如被监控计算机添加一块硬盘,就需要告警;
定时向被监控计算机上的网卡上的控制芯片发送心跳信息;
将监控端的IP地址写入网卡上的EEPROM里。
2)网卡驱动程序;
3)具有ASF功能的网卡,以及位于网卡上的控制芯片,网卡上还包括存储器EEPROM,它的主要功能是存储上层监控代理对网卡的配置,如:监控端的IP地址、心跳发送的时间间隔等。同时它还具备基本的网卡EEPROM所应该完成的功能。网卡芯片的功能是:判断操作系统状态,在监控端向它发送状态判断命令时,将状态判断结果返回。它的主要判断方法是从ACPI表中读取系统的状态,ACPI表中状态的值是由BIOS判断并写入ACPI表中的。ACPI表中的状态有S0/G0,S1,S2,S3,S5/G2等,S0/G0表示操作系统正在运行。通过ACPI表中的状态不能判断操作系统是否是挂起状态,这时仍为S0/G0状态,所以要进一步判断操作系统是否挂起。
监控端通过向被监控端发送命令,获取被监控计算机上的信息同时接收被监控端发来的告警信息和心跳信息,分析处理后向用户输出和显示。
下面以图2为例,结合图1具体说明本发明所述方法的工作过程。
首先,在被监控端的操作系统之上运行监控代理程序AGENT SW;
监控代理程序响应监控端的监控命令,定时向被监控端上的网卡上的控制芯片发送心跳信息;将监控端的IP地址写入网卡上的EEPROM里;网卡上的控制芯片负责接收监控代理发来的心跳信息,当在一段时间内收不到心跳信息,则认为操作系统的服务挂起,它根据存储在网卡EEPROM里的IP地址进行告警包的构建,并向网上发出,以此实现向监控端发送操作系统挂起告警信息;当在一段时间内能够收到心跳信息,则判断操作系统运行正常;
监控端定时Ping运行在被监控端操作系统上的监控代理程序,并且随时接收被监控端发来各种命令响应信息和告警信息;如果能够Ping通,则表示操作系统运行正常,这时,可以从被监控端的监控代理获取当前操作系统正在运行的进程名称并显示。
如果监控端不能Ping通运行在被监控端操作系统上的监控代理时,发送ASF的获取系统状态命令到被监控端,通过判断被监控端的网卡上的控制芯片返回的各种状态信息,分别得出系统当前的状态。下面是几种判断的方式:
当不能成功地发送ASF的获取系统状态命令到被监控端时,则认为网络连接中断。
当发送ASF的获取系统状态命令到被监控端成功时,如果被监控端的网卡上的控制芯片返回的是S5/G0-Working状态,则对被监控端进行TCP/IP的Ping;如果能够收到回应信息,则接着判断是否能收到由被监控端网卡上的控制芯片发来的操作系统挂起信息,如果收到挂起信息,则认为监控代理不能正常运行;如果收不到挂起信息,则认为操作系统层上的服务处于部分挂起的状态;
如果不能够收到回应信息,则判断认为操作系统全部挂起。
如果被监控端的网卡上的控制芯片返回的不是S5/G0-Working状态,则继续判断是否为S5/G2-soft off状态,如果是,则认为操作系统已经关闭;如果不是,则分别针对各种返回的状态进行判断。
如果被监控端的网卡上的控制芯片返回的是S1、S2和S3状态,则表示休眠状态。
如果被监控端的网卡上的控制芯片不能从ACPI表中读取信息时,则表示系统处于断电状态。本发明进行被监控端断电的具体做法是:另外添加一个辅助电源与网卡上的控制芯片相连,当整机断电时,使得只有网卡上的控制芯片还能依靠辅助电源继续工作,这样网卡还能执行ASF通信功能,而其他的网络通信功能则不能执行了,当网卡上的控制芯片不能从ACPI表中读取信息时,则表示系统状态为断电状态。
如果被监控端的网卡上的控制芯片返回的是S5/G2-soft off状态,则表示操作系统关闭,但系统还处于上电的状态。
总之,监控端将得到的被监控端的系统状态在界面显示给用户。
另外,对于网卡上的控制芯片获取系统状态,可以有被动判断和主动判断两种方式:
被动判断的方式是:当监控端向被监控端发出获取状态命令时,被监控端的网卡上的控制芯片进行一次状态判断,并将结果返回。
主动判断的方式是,被监控端的网卡上的控制芯片定时进行状态判断,当监控端向被监控端发出获取状态命令时,被监控端的网卡上的控制芯片将最近一次判断结果返回。
最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1、一种远程判断系统状态的方法,包括由监控端和被监控端构成的监控系统,两者之间通过以太网相连,其特征在于:
步骤一:在被监控端的操作系统之上运行监控代理程序;该监控代理程序用于响应监控端的监控命令,定时向被监控端上的网卡上的控制芯片发送心跳信息;将监控端的IP地址写入被监控端网卡上的EEPROM里;
步骤二:被监控端网卡上的控制芯片负责接收监控代理发来的心跳信息,当在一段时间内收不到心跳信息,则认为操作系统的服务挂起,就向监控端上报发送操作系统挂起告警信息,否则判断操作系统运行正常;
步骤三:监控端定时Ping运行在被监控端操作系统上的监控代理程序,并且随时接收被监控端发来各种命令响应信息和告警信息;
步骤四:当监控端不能Ping通运行在被监控端操作系统上的监控代理时,发送ASF的获取系统状态命令到被监控端,通过判断被监控端网卡的控制芯片返回的各种状态信息,分别得出系统当前的状态。
2、根据权利要求1所述的远程判断系统状态的方法,其特征在于,当向被监控端发送ASF的获取系统状态命令如果不成功,则认为网络连接中断。
3、根据权利要求1所述的远程判断系统状态的方法,其特征在于,当成功发送ASF的获取系统状态命令到被监控端时,如果被监控端的网卡上的控制芯片返回的是工作状态,则对被监控端进行TCP/IP的Ping;
如果能够收到回应信息,则接着判断是否能收到由被监控端网卡上的控制芯片发来的操作系统挂起信息,如果收到挂起信息,则认为监控代理不能正常运行;如果收不到挂起信息,则认为操作系统层上的服务部分挂起;
如果不能够收到回应信息,则判断认为操作系统全部挂起。
4、根据权利要求3所述的远程判断系统状态的方法,其特征在于,如果被监控端的网卡上的控制芯片返回的不是工作状态,则继续判断是否为软关机状态,如果是,则认为操作系统已经关闭,如果不是则分别针对返回状态进行判断。
5、根据权利要求4所述的远程判断系统状态的方法,其特征在于,如果被监控端的网卡上的控制芯片返回的是S1、S2和S3状态,则表示休眠状态。
6、根据权利要求4所述的远程判断系统状态的方法,其特征在于,当发送ASF的获取系统状态命令到被监控端成功时,判断网卡控制芯片是否可从ACPI表中读取信息,如果不能从ACPI表中读取信息,则表示系统状态为断电状态。
7、根据权利要求4所述的远程判断系统状态的方法,其特征在于,如果被监控端的网卡上的控制芯片返回的是软关机状态,则表示操作系统关闭,但系统还处于上电的状态。
8、根据权利要求1所述的远程判断系统状态的方法,其特征在于,还包括:监控端将得到的被监控端的系统状态在界面显示给用户。
9、根据权利要求1所述的远程判断系统状态的方法,其特征在于,所述判断被监控端网卡的控制芯片返回的各种状态信息,包括被动判断和主动判断两种方式。
10、根据权利要求9所述的远程判断系统状态的方法,其特征在于,所述被动判断的方式是:每当监控端向被监控端发出获取状态命令时,被监控端的网卡控制芯片进行一次状态判断,并将结果返回;所述主动判断的方式是,被监控端的网卡控制芯片定时进行状态判断,当监控端向被监控端发出获取状态命令时,被监控端的网卡上的控制芯片将最近一次判断结果返回。
CN 03149794 2003-08-05 2003-08-05 远程判断系统状态的方法 Expired - Fee Related CN1286013C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03149794 CN1286013C (zh) 2003-08-05 2003-08-05 远程判断系统状态的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03149794 CN1286013C (zh) 2003-08-05 2003-08-05 远程判断系统状态的方法

Publications (2)

Publication Number Publication Date
CN1581094A CN1581094A (zh) 2005-02-16
CN1286013C true CN1286013C (zh) 2006-11-22

Family

ID=34579675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03149794 Expired - Fee Related CN1286013C (zh) 2003-08-05 2003-08-05 远程判断系统状态的方法

Country Status (1)

Country Link
CN (1) CN1286013C (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0622551D0 (en) * 2006-11-11 2006-12-20 Ibm A method, apparatus and computer program for a first device to determine the status of a second device
CN101227347B (zh) * 2008-01-07 2010-08-25 上海颐东网络信息有限公司 远程监控主机网络状态的方法和装置
CN101854270A (zh) * 2010-04-23 2010-10-06 山东中创软件工程股份有限公司 多系统运行状态监控方法及系统
CN101982949B (zh) * 2010-11-04 2012-08-22 杭州东信北邮信息技术有限公司 一种智能网设备的检测系统和方法
CN102111310B (zh) * 2010-12-31 2013-11-27 网宿科技股份有限公司 Cdn设备状态监控方法
CN102566558B (zh) * 2012-02-21 2013-04-10 南京农业大学 基于Android平台的智能温室管理系统及其方法
CN102736970A (zh) * 2012-06-29 2012-10-17 浪潮电子信息产业股份有限公司 一种操作系统活动状态的监控方法
CN103150240B (zh) * 2013-03-19 2015-04-08 天脉聚源(北京)传媒科技有限公司 一种应用进程的监控方法和系统
CN104361517B (zh) * 2014-10-29 2020-05-19 中国建设银行股份有限公司 一种金融系统监控方法、装置及相关系统
CN104394033B (zh) * 2014-11-26 2018-02-09 北京奇艺世纪科技有限公司 跨数据中心的监控系统、方法及装置
CN104536927B (zh) * 2014-12-24 2017-07-21 杰瑞石油天然气工程有限公司 一种基于主从问答式加气机通信方法及系统
CN105897464B (zh) * 2016-03-30 2019-08-23 国网福建省电力有限公司 基于mac地址控制的电力内网远程应用程序监测方法
CN106126395B (zh) * 2016-06-15 2018-11-23 广州杰赛科技股份有限公司 一种云平台监控方法及系统
CN108647129A (zh) * 2018-05-22 2018-10-12 山东中创软件商用中间件股份有限公司 一种服务器的监控方法、装置、设备及介质
CN113377600B (zh) * 2020-03-10 2023-06-30 顺丰科技有限公司 一种主机监控方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN1581094A (zh) 2005-02-16

Similar Documents

Publication Publication Date Title
CN1286013C (zh) 远程判断系统状态的方法
US10756990B1 (en) Monitoring and performance improvement of enterprise applications using correlated data associated with a plurality of service layers
CN1308834C (zh) 多途径获取和输出服务器监控信息的方法
US5991806A (en) Dynamic system control via messaging in a network management system
CN102789305B (zh) 推迟挂起
DE60315236T2 (de) Vorrichtung und Verfahren zur Erhaltung des Datenzustands eines Personal Computers im Standby-Modus im Fall einer Unterbrechung der Wechselstromversorgung
CN101876938B (zh) 一种基于消息队列的应用软件响应时间测量方法及系统
US20100043004A1 (en) Method and system for computer system diagnostic scheduling using service level objectives
CN103117879A (zh) 一种计算机硬件运行参数网络监测系统
CN1742249A (zh) 电源管理系统
CN107545067B (zh) 日志信息上报方法、装置及存储介质、adsp和终端
JP2005312011A (ja) ステートマシンの改善されたパワーマネジメントを提供するシステムおよび方法
CN101286854A (zh) 以太网供电方法和系统
WO2023222109A1 (zh) 网络唤醒的管理方法、装置、电子设备及存储介质
CN1991683A (zh) 一种笔记本电脑
CN1508689A (zh) 一种远程获取被监控计算机信息的系统和方法
CN1308833C (zh) 被动式远程判断系统状态的方法
CN109828826B (zh) 一种任务进度的轮询方法、装置及系统
CN107562602B (zh) 日志信息上报方法、装置及存储介质、adsp和终端
CN113176982A (zh) 一种基于vpx架构机箱管理系统的实现装置及方法
CN113535344A (zh) 网络数据处理方法和装置、服务器及存储介质
CN113535519B (zh) 一种监控告警方法
CN1752941A (zh) 一种内存监控的装置及方法
WO2023279829A1 (zh) 消息延迟检测方法、装置、电子设备及存储介质
TWI698741B (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20061122

Termination date: 20200805

CF01 Termination of patent right due to non-payment of annual fee