CN101741654B - 操作系统的监控装置与方法 - Google Patents

操作系统的监控装置与方法 Download PDF

Info

Publication number
CN101741654B
CN101741654B CN2008101783785A CN200810178378A CN101741654B CN 101741654 B CN101741654 B CN 101741654B CN 2008101783785 A CN2008101783785 A CN 2008101783785A CN 200810178378 A CN200810178378 A CN 200810178378A CN 101741654 B CN101741654 B CN 101741654B
Authority
CN
China
Prior art keywords
operating system
controller
baseboard management
management controller
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101783785A
Other languages
English (en)
Other versions
CN101741654A (zh
Inventor
林炫百
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fucheng International Machinery Co.,Ltd.
Jiangxi union Speed Technology Co.,Ltd.
Zhang Kaijun
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN2008101783785A priority Critical patent/CN101741654B/zh
Publication of CN101741654A publication Critical patent/CN101741654A/zh
Application granted granted Critical
Publication of CN101741654B publication Critical patent/CN101741654B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种操作系统的监控装置与方法。在本发明中,基板管理控制器会依照一时间间隔,定时经由一控制器的驱动程序发出一询问信号至操作系统以确定操作系统是否处于正常运作的状态下。当操作系统异常时,基板管理控制器可以主动记录其事件与发生时间,让管理人员可以透过基板管理控制器对操作系统的运作状态进行监控,并增进服务器系统的有效管理。

Description

操作系统的监控装置与方法
技术领域
本发明是有关操作系统的监控装置与方法,特别是一种关于利用基板管理控制器(Baseboard Management Controller,简称BMC)来监控操作系统的装置与方法。
背景技术
随着科技日新月异、自动化生产技术蓬勃发展,产业界对服务器系统的作业效率等各方面要求更臻严谨,智能化平台管理接口(Intelligent PlatformManagement Interface,IPMI)即是因应业界需求所产生的一套智能化硬件管理的通用接口标准,使得管理者得以透过网络或序列的传输形式,监控服务器系统各种固件、硬件组件的工作情况,例如微处理器、系统温度、风扇转速、电压与电源供应…等等。并具远程管理、系统状态检测与记录、资料追踪与系统回复等功能,达到业者有效管理与降低总持有成本(Total Cost of Ownership,TCO)的期望。
而基板管理控制器即是智能化平台管理接口(IPMI)整体架构中的核心处理控制器,经由各别的界面来实现服务器系统的管理。基板管理控制器并包含系统事件日志(System Event Log,SEL)的功能,当检测到服务器不正常状况时,会将运作状态及事件以日志形式记录,通报相关管理人员。故基板管理控制器中的系统事件日志(SEL)扮演着重要的系统的检测除错记录与警报功能。
然而,目前的基板管理控制器虽可监控服务器系统各种固件、硬件组件的运作情形,却无法监控如RHEL、SLES、WIN2K3、WIN2K8...等等的操作系统状态,而无法得知各种操作系统的错误事件(Event),故无法事先预警操作系统的不寻常。
发明内容
本发明提供一种操作系统的监控装置与方法,用以解决目前服务器监控系统如智能化平台管理接口(IPMI)无法主动监控操作系统的问题。
本发明所提出的一种操作系统的监控装置,包括一基板管理控制器以及一控制器。控制器耦接于基板管理控制器,且控制器具有一驱动程序以连结至操作系统。其中,基板管理控制器依照一时间间隔,定时经由控制器的驱动程序发出一询问信号至操作系统并要求操作系统产生相对应的一回复信号至驱动程序。若操作系统停止产生相对应的回复信号,该控制器输出一事件信号至该基板管理控制器,基板管理控制器根据该事件信号对应记录一事件信息与一事件发生时间。
在本发明的一实施例中,当操作系统当机时,基板管理控制器重置具有操作系统的一服务器或透过网络输出一警示信息。
从另一个观点来说,本发明另提出一种操作系统的监控方法,此操作系统的监控方法包括下列步骤。首先,依照一时间间隔,定时经由一控制器中的一驱动程序发出一询问信号至操作系统并要求操作系统产生相对应的一回复信号。然后,若操作系统停止产生相对应的回复信号,控制器输出一事件信号至一基板管理控制器。之后,根据事件信号对应记录一事件信息与一事件发生时间于基板管理控制器中。
在本发明的一实施例中,操作系统的监控方法还包括当操作系统当机时,基板管理控制器重置具有操作系统的一服务器或透过网络输出一当机信息。
基于上述,本发明系令基板管理控制器经由一设计的控制器,定时检测操作系统是否正常运作,遇有操作系统异常情况时能在错误事件发生前,于基板管理控制器中记录并实时警报相关负责人员。故此操作系统的监视装置与方法,能补足目前系统事件日志(SEL)针对操作系统发生事件(Event)后才给予通报之不足,可防范与操作系统当机等相关错误于未然,更利于服务器系统之有效管理。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1是为本发明装置的示意图。
图2是依照本发明的装置实施例的一种监控操作系统的方法的流程图。
图3为根据本发明另一实施例的操作系统的监控方法流程。
具体实施方式
图1为根据本发明的操作系统的监控装置架构图。监控装置包括基板管理控制器101与控制器102,控制器102耦接于基板管理控制器101。控制器102中具有一驱动程序,可连结至操作系统103,并与操作系统103进行沟通。基板管理控制器101会经由此控制器102中的驱动程序,定时发出询问信号给操作系统103,并要求操作系统103产生相对应的回复信号,以确认操作系统103是否在正常运作状况中。当操作系统103没有正常响应时,控制器102随即输出一事件(Event)信号通知基板管理控制器101,基板管理控制器101根据此一事件信号记录一事件信息与一事件发生时间。
由于基板管理控制器101在系统当机时,仍可正常运作,因此管理人员可经由基板管理控制器101的事件记录文件(Event log)中查知操作系统103发生异常的时间与状态,提早确定服务器的问题并减少维修时间。此外,基板管理控制器101在操作系统发生当机时,可自行重置服务器或透过网络输出一警示信息以告知管理者服务器已经当机。至于基板管理控制器101的处置方式可依照使用者需求而定,本实施例并不受限。控制器102则例如为一嵌入式控制器(embedded controller),设计人员可经由其固件设计,让控制器102具有定时询问操作系统的功能。
接下来,配合流程图进一步说明本实施例的操作方法,请同时参照图1与图2,图2为根据本发明的操作系统的监控方法流程图。首先,基板管理控制器101会依照一时间间隔,定时询问控制器102(步骤S201),然后控制器102便会透过驱动程序询问操作系统,即发出一询问信号至操作系统并要求操作系统产生相对应的一回复信号(步骤S202)。接着,判断操作系统是否正确产生回复信号给控制器102的驱动程序(步骤S203)。
在步骤S203中,若操作系统有正确产生回复信号给控制器,则表示操作系统正常运作中,此时控制器102会传送一正常反应信号(例如句柄“01”)给基板管理控制器101以响应操作系统正常(步骤S204)。为节省基板管理控制器101的系统事件日志(SEL)空间,基板管理控制器101可不响应亦不记录此一正常回报信号(步骤S205),并回到步骤S201中继续此监控流程。值得注意的是,控制器102可通过单一接脚上的电位变化(逻辑高电位或逻辑低电位)来通知基板管理控制器101操作系统是否正常运作的信息,也可以利用数字数据传输的方式或多位的组合变化来传达操作系统是否正常运作的信息或者更详细的信息给基板管理控制器101。
在本实施例中,以二位的句柄为例,当句柄“01”时,表示操作系统正常,当句柄“00”时,表示操作系统异常。然而,上述句柄应用仅为本发明的一实施方式,本发明并不受限于此,本技术领域具有通常知识者在经由本发明的揭露后,应可轻易推知其余可行的实施方式,在此不不再赘述。
在步骤S203中,若操作系统未正确产生回复信号给控制器,则表示操作系统运作异常,例如当机。此时控制器于将会发出一事件信息(例如句柄“00”)通知基板管理控制器101,表示操作系统异常(步骤S206)。基板管理控制器101会主动记录此事件信息与事件发生时间(步骤S207)。接下来,基板管理控制器101可依照使用者设定,透过网络发出一个警示讯息给相关处理人员或是下指令使操作系统重新开机(步骤S208)。
综合上述图1与图2的说明,本发明可归纳出一种操作系统的监控方法流程,适用所有具有基板控制器的服务器,其步骤如图3所示,图3为根据本发明另一实施例的操作系统的监控方法流程。首先,依照一时间间隔,定时经由控制器中的驱动程序发出询问信号至操作系统并要求操作系统产生相对应的回复信号(步骤S301)。若操作系统停止产生相对应的回复信号时,控制器会输出一事件信号至基板管理控制器(步骤S302)。基板管理控制器便会根据此事件信号对应记录一事件信息与一事件发生时间(步骤S303)。关于图3的其余实施细节,本技术领域具有通常知识者应可经由上述图1与图2的说明轻易推知,在此不再赘述。
综上所述,本发明通过基板管理控制器与操作系统之间所设置的控制器,让基板管理控制器可与操作系统进行沟通。基板管理控制器透过控制器定时发送信号给操作系统,以主动检测操作系统的运作是否正常。使用者可直接经由基板管理控制器中的记录文件中直接确知操作系统是否异常与其异常发生的时间,进而实时处理相关问题,让服务器的维修与管理更具效益与方便性。
虽然本发明已以实施例揭露如上,然其并非用以限定本发明,任何所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当以权利要求所界定的为准。

Claims (5)

1.一种操作系统的监控装置,包括:
一基板管理控制器;以及
一控制器,耦接于该基板管理控制器,该控制器具有一驱动程序以连结至该操作系统;
其中,该基板管理控制器依照一时间间隔,定时经由该控制器的该驱动程序发出一询问信号至该操作系统并要求该操作系统产生相对应的一回复信号至该驱动程序,若该操作系统停止产生相对应的该回复信号,该控制器输出一事件信号至该基板管理控制器,该基板管理控制器根据该事件信号对应记录一事件信息与一事件发生时间。
2.如权利要求1所述的监控装置,其特征在于,当该操作系统当机时,该基板管理控制器重置具有该操作系统的一服务器或透过网络输出一警示信息。
3.如权利要求1所述的监控装置,其特征在于,该控制器为一嵌入式控制器。
4.一种操作系统的监控方法,包括:
依照一时间间隔,定时经由一控制器中的一驱动程序发出一询问信号至该操作系统并要求该操作系统产生相对应的一回复信号;
若该操作系统停止产生相对应的该回复信号,该控制器输出一事件信号至一基板管理控制器;以及
根据该事件信号对应记录一事件信息与一事件发生时间于该基板管理控制器中。
5.如权利要求4所述的监控方法,其特征在于,还包括:
当该操作系统当机时,该基板管理控制器重置具有该操作系统的一服务器或透过网络输出一当机信息。
CN2008101783785A 2008-11-27 2008-11-27 操作系统的监控装置与方法 Expired - Fee Related CN101741654B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101783785A CN101741654B (zh) 2008-11-27 2008-11-27 操作系统的监控装置与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101783785A CN101741654B (zh) 2008-11-27 2008-11-27 操作系统的监控装置与方法

Publications (2)

Publication Number Publication Date
CN101741654A CN101741654A (zh) 2010-06-16
CN101741654B true CN101741654B (zh) 2012-01-18

Family

ID=42464586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101783785A Expired - Fee Related CN101741654B (zh) 2008-11-27 2008-11-27 操作系统的监控装置与方法

Country Status (1)

Country Link
CN (1) CN101741654B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631685A (zh) * 2012-08-29 2014-03-12 鸿富锦精密工业(深圳)有限公司 故障自检系统及方法
CN104122939A (zh) * 2013-04-23 2014-10-29 英业达科技有限公司 伺服器系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1746859A (zh) * 2004-09-09 2006-03-15 英业达股份有限公司 一种智能平台事件报警系统及其方法
CN1917446A (zh) * 2006-09-04 2007-02-21 华为技术有限公司 服务器的故障恢复方法及系统
US7188275B2 (en) * 2004-01-16 2007-03-06 Hewlett-Packard Development Company, L.P. Method of verifying a monitoring and responsive infrastructure of a system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7188275B2 (en) * 2004-01-16 2007-03-06 Hewlett-Packard Development Company, L.P. Method of verifying a monitoring and responsive infrastructure of a system
CN1746859A (zh) * 2004-09-09 2006-03-15 英业达股份有限公司 一种智能平台事件报警系统及其方法
CN1917446A (zh) * 2006-09-04 2007-02-21 华为技术有限公司 服务器的故障恢复方法及系统

Also Published As

Publication number Publication date
CN101741654A (zh) 2010-06-16

Similar Documents

Publication Publication Date Title
CN107995049B (zh) 电力安全区跨区同步故障监测方法、装置和系统
TWI229796B (en) Method and system to implement a system event log for system manageability
US20140082142A1 (en) System and method for accessing operating system and hypervisors via a service processor of a server
CN104639380A (zh) 服务器监控方法
CN108199922B (zh) 一种用于网络设备及服务器故障诊断和修复的系统和方法
CN110175451A (zh) 一种基于电力云的安全监控方法和系统
CN103443727A (zh) 异常检测系统、异常检测方法以及用于异常检测的程序
CN103577298A (zh) 基板管理控制器监控系统及方法
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN103490919A (zh) 故障管理系统和故障管理方法
TW201119173A (en) Method of using power supply to execute remote monitoring of an electronic system
CN103135732A (zh) 服务器机柜系统
CN109062753A (zh) 一种硬盘监控系统以及监控方法
CN112380089A (zh) 一种数据中心监控预警方法及系统
CN102055615A (zh) 服务器监控方法
CN100498733C (zh) 一种实现计算机故障报警控制的方法
CN116126772A (zh) 一种应用于arm服务器的uart串口管理系统及方法
CN101741654B (zh) 操作系统的监控装置与方法
CN103178977A (zh) 计算机系统及计算机系统的开机管理方法
CN103176516B (zh) 机柜系统及机柜系统的监控方法
KR100943213B1 (ko) 홈네트워크에서의 오류 모델과 규칙 기반의 오류 관리 장치및 그 방법
CN116225812B (zh) 基板管理控制器系统运行方法、装置、设备及存储介质
WO2023125702A1 (zh) 换电站的云管理方法、系统、服务器及存储介质
CN103995759A (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN104571098B (zh) 基于Atom平台的远程自诊断方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170818

Address after: Room 8, building 805, sunshine times, Fenghuang Road, Fenghuang County, Shangrao, Jiangxi, Shangrao

Co-patentee after: Zhang Kaijun

Patentee after: Jiangxi union Speed Technology Co.,Ltd.

Address before: Qingnian Road Taiwan Wanhua District of Taipei city China No. 184 3 2 floor

Patentee before: Fucheng International Machinery Co.,Ltd.

Effective date of registration: 20170818

Address after: Qingnian Road Taiwan Wanhua District of Taipei city China No. 184 3 2 floor

Patentee after: Fucheng International Machinery Co.,Ltd.

Address before: Taipei City, Taiwan Chinese Shilin District Hougang Street No. 66

Patentee before: Yingda Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120118

Termination date: 20171127