CN103294585B - 服务器监控系统 - Google Patents

服务器监控系统 Download PDF

Info

Publication number
CN103294585B
CN103294585B CN201210052216.3A CN201210052216A CN103294585B CN 103294585 B CN103294585 B CN 103294585B CN 201210052216 A CN201210052216 A CN 201210052216A CN 103294585 B CN103294585 B CN 103294585B
Authority
CN
China
Prior art keywords
server
management controller
machine
baseboard management
address decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210052216.3A
Other languages
English (en)
Other versions
CN103294585A (zh
Inventor
高政欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongshan Yunchuang Intellectual Property Service Co ltd
Scienbizip Consulting Shenzhen Co Ltd
Original Assignee
Yun Chuan Intellectual Property Services Co Ltd Of Zhongshan City
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yun Chuan Intellectual Property Services Co Ltd Of Zhongshan City filed Critical Yun Chuan Intellectual Property Services Co Ltd Of Zhongshan City
Priority to CN201210052216.3A priority Critical patent/CN103294585B/zh
Priority to TW101108076A priority patent/TW201337547A/zh
Publication of CN103294585A publication Critical patent/CN103294585A/zh
Application granted granted Critical
Publication of CN103294585B publication Critical patent/CN103294585B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种服务器监控系统,包括多个看门狗定时器、多个地址译码器、存储单元及显示单元,当一个或多个服务器发生当机时,与发生当机的服务器对应的看门狗定时器输出一溢出信号至对应的地址译码器,所述地址译码器将所述溢出信号转换为与发生当机的服务器对应的地址,并改变发生当机的服务器的基板管理控制器状态,该等未发生当机的服务器的基板管理控制器再周期性地读取该存储单元内存储的所有数据,以确定每一服务器的基板管理控制器状态,进而将正常工作的服务器及发生当机的服务器进行区分,并传送至显示单元进行显示,进而方便用户及时对出现当机的服务器进行维修,并防止数据丢失。

Description

服务器监控系统
技术领域
本发明涉及服务器系统,尤其涉及一种服务器监控系统。
背景技术
服务器内一般设置有基板管理控制器(baseboardmanagementcontroller,BMC),用于监控整个服务器系统的硬件健康状况。然而,在BMC发生当机(crash)时,若服务器内的其他硬件同时也发生故障,则BMC无法及时记录并反馈该服务器内各硬件的运作状况。如此,将会导致大量数据丢失,并对服务器系统的维护造成很大不便。
发明内容
有鉴于此,有必要提供一种可有效防止数据丢失且方便用户维护的服务器监控系统。
一种服务器监控系统,用以监控多个含有基板管理控制器的服务器是否发生当机;该服务器监控系统包括与所述多个服务器一一对应的多个看门狗定时器、与所述多个服务器一一对应的地址译码器、存储单元及显示单元,每一基板管理控制器分别连接至相应的地址译码器,所述地址译码器均连接至存储单元,所述每一看门狗定时器的输出端分别连接至相应的地址译码器,当所述多个服务器正常工作时,所述基板管理控制器分别发送一写本服务器信号至对应的地址译码器,所述地址译码器接收该写本服务器信号,并将所述写本服务器信号转换为该存储单元内相应的地址,使得所述多个服务器分别通过相应的地址译码器将所述服务器的编号及相应的基板管理控制器状态写入至对应的地址;当一个或多个服务器发生当机时,与发生当机的服务器对应的看门狗定时器输出一溢出信号至对应的地址译码器,所述地址译码器将所述溢出信号转换为与发生当机的服务器对应的地址,并改变发生当机的服务器的基板管理控制器状态,该等未发生当机的服务器的基板管理控制器再周期性地读取该存储单元内存储的所有数据,以确定每一服务器的基板管理控制器状态,进而将正常工作的服务器及发生当机的服务器进行区分,并传送至显示单元进行显示。
上述服务器监控系统通过将该等服务器的基板管理控制器状态及时输出至显示单元以供用户参考,进而供用户监控该等服务器是否发生当机,以便于用户及时对出现当机的服务器进行维修,并防止数据丢失。
附图说明
图1为本发明较佳实施方式的服务器监控系统的电路图。
主要元件符号说明
服务器监控系统 100
服务器 S1-Sn
基板管理控制器 BMC
电源供应单元 PSU
看门狗定时器 W1-Wn
与门 A1-An
地址译码器 Y1-Yn
存储单元 10
显示单元 30
启动控制端 Ctrl
复位端 Reset
输出端 Output
固件 FW
传感器数据记录 SDR
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
请参阅图1,本发明较佳实施方式提供一种服务器监控系统100,用以监控多个服务器S1-Sn是否发生当机(crash)。每一服务器S1-Sn内分别设置有相应的基板管理控制器(baseboardmanagementcontroller,BMC)及电源供应单元(powersupplyunit,PSU)。该服务器监控系统100包括多个与门A1-An、多个看门狗定时器(Watchdogtimer)W1-Wn、多个地址译码器Y1-Yn、存储单元10及显示单元30。
每一服务器S1-Sn的BMC均通过I2C总线连接至对应的地址译码器Y1-Yn。该地址译码器Y1-Yn均连接至该存储单元10。例如,服务器S1的BMC通过I2C总线连接至对应的地址译码器Y1,并通过该地址译码器Y1连接至该存储器10。每一服务器S1-Sn的BMC还连接至相应的与门A1-An的第一输入端。该与门A1-An的第二输入端连接至对应的PSU。该与门A1-An的输出端分别连接至相应的看门狗定时器W1-Wn的复位端Reset。该看门狗定时器W1-Wn的启动控制端Ctrl连接至对应的PSU。该看门狗定时器W1-Wn的输出端Output连接至对应的地址译码器Y1-Yn。例如,该服务器S1的BMC连接至与门A1的第一输入端。该与门A1的第二输入端连接至该服务器S1的PSU。该与门A1的输出端连接至看门狗定时器W1的复位端Reset。该看门狗定时器W1的启动控制端Ctrl连接至服务器S1的PSU。该看门狗定时器W1的输出端Output连接至对应的地址译码器Y1。
该看门狗定时器W1-Wn的工作原理均相同,因此,在本实施例中,以该看门狗定时器W1的工作原理为例加以说明。具体地,当服务器S1正常上电时,所述服务器S1的PSU输出一高电平。此时,该看门狗定时器W1的启动控制端Ctrl因连接至该服务器S1的PSU而获得一高电平,该看门狗定时器W1开始计时,同时该服务器S1的BMC开始初始化。当所述服务器S1的BMC初始化完成后,该服务器S1的BMC将输出一复位信号至相应的与门A1的第一输入端,而所述与门A1的第二输入端接收来自服务器S1的PSU的高电平信号。因此,该与门A1的输出端输出所述复位信号至该看门狗定时器W1的复位端Reset,以刷新该看门狗定时器W1。
而当所述服务器S1发生当机时,所述服务器S1的BMC将无法输出相应的复位信号至该与门A1的第一输入端。该服务器S1的PSU保持输出一高电平至该与门A1的第二输入端。因此,所述与门A1的输出端输出一低电平信号至该看门狗定时器W1的复位端Reset。由于该服务器S1的BMC未在该看门狗定时器W1的计时周期内发出复位信号至该看门狗定时器W1的复位端Reset,即未于计时周期内刷新该看门狗定时器W1,进而导致该看门狗定时器W1溢出,并通过该看门狗定时器W1的输出端Output输出相应的溢出信号至该地址译码器Y1。在本实施例中,该看门狗定时器W1-Wn的计时周期为该服务器S1-Sn的BMC的初始化时间的2倍。该看门狗定时器W1-Wn的计时周期为服务器S1-Sn的BMC发出复位信号的时间周期的4倍。
该地址译码器Y1-Yn用以当所述服务器S1-Sn的BMC初始化完成后,接收来自相应的BMC发出的一写本服务器信号,并将所述写本服务器信号转换为该存储单元10内相应的地址。如此,该服务器S1-Sn的BMC可通过相应的地址译码器Y1-Yn将所述服务器S1-Sn的编号,相应的服务器S1-Sn的BMC状态(例如0代表服务器的BMC工作正常,1代表服务器的BMC发生当机)等服务器信息写入至该存储单元10内相应的地址译码器Y1-Yn转换后的地址。例如,当所述服务器S1、S2的BMC分别发出一写本服务器信号时,所述地址译码器Y1、Y2分别将上述写本服务器信号转换为该存储单元11内的相应的地址1、地址2。如此,该服务器S1、S2的BMC可分别通过地址译码器Y1、Y2将所述服务器S1、S2的编号,服务器S1、S2的BMC状态等服务器信息分别写入至存储单元11内的地址1、地址2。在本实施例中,每一地址译码器Y1-Yn转换出来的存储单元10的地址互不重复且与该服务器S1-Sn一一对应。
该地址译码器Y1-Yn还用以当其中一个或多个服务器S1-Sn发生当机,以使得相应的看门狗定时器W1-Wn产生溢出信号时,接收相应的溢出信号,并将相应的溢出信号转换为与存放该服务器S1-Sn信息相同的地址,并更改出现当机的服务器对应的BMC状态,例如将出现当机的服务器对应的BMC状态设置为1,以表明该服务器所对应的BMC发生当机。
该存储单元10为一非易失性随机访问存储器(non-volatilerandomaccessmemory,NVRAM),其内存储有各服务器S1-Sn的编号、服务器S1-Sn对应的BMC状态等信息。例如,所述存储单元10内的地址1用以存储服务器S1的编号、服务器S1的BMC状态等信息。所述存储单元11内的地址n用以存储服务器Sn的编号、服务器Sn的BMC状态等信息。
每一服务器的BMC内均设置有固件(firmware,FW)。该FW用以定义该服务器S1-Sn的BMC对该BMC状态的采样时间。因此,未发生当机的服务器的BMC便可根据该采样时间周期性地向相应的地址译码器Y1-Yn发出读取该存储单元10内存储的数据的请求。该地址译码器Y1-Yn接收到该请求后,将对该请求进行转换,使得该等未发生当机的服务器的BMC通过对应的地址译码器获取存储单元10内存储的所有数据,并利用该FW内的传感器数据记录(sensordatarecord,SDR)将所读取的数据定义为threshold型的虚拟传感器的读数。接着,该FW再对该虚拟传感器的读数进行解码,以确定每一服务器S1-Sn的BMC状态,进而将正常工作的服务器与发生当机的服务器进行区分,并通过智能型平台管理接口工具(intelligentplatformmanagementinterfacetool,IPMITool)传送至显示单元30进行显示,以提示用户。例如,当该虚拟传感器的读数对应该服务器S1、S2、S3的BMC状态为0,剩下的服务器S4-Sn的BMC状态为1时,则用户可通过显示单元30确定该等服务器S1-Sn中仅服务器S1、S2、S3正常工作,其他服务器均发生当机。
显然,上述服务器监控系统100可将该等服务器S1-Sn的BMC状态及时输出至显示单元30以供用户参考,进而供用户监控该等服务器S1-Sn是否发生当机,以便于用户及时对出现当机的服务器进行维修,并防止数据丢失。
另外,本领域技术人员还可在本发明权利要求公开的范围和精神内做其他形式和细节上的各种修改、添加和替换。当然,这些依据本发明精神所做的各种修改、添加和替换等变化,都应包含在本发明所要求保护的范围之内。

Claims (3)

1.一种服务器监控系统,用以监控多个含有基板管理控制器的服务器是否发生当机;其特征在于:该服务器监控系统包括与所述多个含有基板管理控制器的服务器一一对应的多个看门狗定时器、与所述多个含有基板管理控制器的服务器一一对应的地址译码器、存储单元及显示单元,每一基板管理控制器分别连接至相应的地址译码器,所述地址译码器均连接至存储单元,每一看门狗定时器的输出端分别连接至相应的地址译码器,当所述多个含有基板管理控制器的服务器正常工作时,所述基板管理控制器分别发送一写本服务器信号至对应的地址译码器,所述地址译码器接收该写本服务器信号,并将所述写本服务器信号转换为该存储单元内相应的地址,使得所述多个含有基板管理控制器的服务器分别通过相应的地址译码器将所述服务器的编号及相应的基板管理控制器状态写入至对应的地址;当一个或多个服务器发生当机时,与发生当机的服务器对应的看门狗定时器输出一溢出信号至对应的地址译码器,所述地址译码器将所述溢出信号转换为与发生当机的服务器对应的地址,并改变发生当机的服务器的基板管理控制器状态,这些未发生当机的服务器的基板管理控制器再周期性地读取该存储单元内存储的所有数据,以确定每一服务器的基板管理控制器状态,进而将正常工作的服务器及发生当机的服务器进行区分,并传送至显示单元进行显示。
2.如权利要求1所述的服务器监控系统,其特征在于:所述多个含有基板管理控制器的服务器均包括电源供电单元,每一看门狗定时器的启动控制端分别连接至对应的电源供应单元,当所述服务器正常上电时,所述服务器的电源供应单元输出一高电平,该看门狗定时器的启动控制端获得所述高电平并开始计时。
3.如权利要求2所述的服务器监控系统,其特征在于:所述多个含有基板管理控制器的服务器的基板管理控制器分别连接至对应的看门狗定时器的复位端,用以当所述多个含有基板管理控制器的服务器未发生当机且初始化完成后,输出一复位信号至相应的看门狗定时器,以刷新该看门狗定时器。
CN201210052216.3A 2012-03-02 2012-03-02 服务器监控系统 Expired - Fee Related CN103294585B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210052216.3A CN103294585B (zh) 2012-03-02 2012-03-02 服务器监控系统
TW101108076A TW201337547A (zh) 2012-03-02 2012-03-09 伺服器監控系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210052216.3A CN103294585B (zh) 2012-03-02 2012-03-02 服务器监控系统

Publications (2)

Publication Number Publication Date
CN103294585A CN103294585A (zh) 2013-09-11
CN103294585B true CN103294585B (zh) 2016-05-04

Family

ID=49095505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210052216.3A Expired - Fee Related CN103294585B (zh) 2012-03-02 2012-03-02 服务器监控系统

Country Status (2)

Country Link
CN (1) CN103294585B (zh)
TW (1) TW201337547A (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354103A (zh) * 2014-12-19 2016-02-24 汉柏科技有限公司 一种用户态下管理watchdog的方法
TWI739794B (zh) * 2017-01-23 2021-09-21 香港商阿里巴巴集團服務有限公司 資料的監控方法及裝置
CN108376107A (zh) * 2018-03-01 2018-08-07 郑州云海信息技术有限公司 一种服务器故障检测的方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5638510A (en) * 1992-11-11 1997-06-10 Nissan Motor Co., Ltd. Multiplexed system with watch dog timers
CN101686154A (zh) * 2008-09-22 2010-03-31 联想(北京)有限公司 服务器以及处理服务器信息的方法
CN101902355A (zh) * 2009-05-27 2010-12-01 宏正自动科技股份有限公司 服务器、计算机系统及计算机系统的监控方法
CN102053902A (zh) * 2009-11-10 2011-05-11 英业达股份有限公司 操作系统的监控方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5638510A (en) * 1992-11-11 1997-06-10 Nissan Motor Co., Ltd. Multiplexed system with watch dog timers
CN101686154A (zh) * 2008-09-22 2010-03-31 联想(北京)有限公司 服务器以及处理服务器信息的方法
CN101902355A (zh) * 2009-05-27 2010-12-01 宏正自动科技股份有限公司 服务器、计算机系统及计算机系统的监控方法
CN102053902A (zh) * 2009-11-10 2011-05-11 英业达股份有限公司 操作系统的监控方法

Also Published As

Publication number Publication date
CN103294585A (zh) 2013-09-11
TW201337547A (zh) 2013-09-16

Similar Documents

Publication Publication Date Title
JP4307461B2 (ja) 消費電力監視が内蔵されているメモリモジュール
US7962792B2 (en) Interface for enabling a host computer to retrieve device monitor data from a solid state storage subsystem
JP5063240B2 (ja) パフォーマンス・モニタリングを提供するメモリ・システム・方法
CN107193713B (zh) 一种实现主板管理控制的fpga及方法
CN106201332A (zh) 驱动器阵列策略控制
CN101794256A (zh) 非易失性存储器子系统及其存储器控制器
CN107463459A (zh) 系统异常内存数据的保存方法、装置、系统及终端设备
CN101751348A (zh) 存储器控制器和操作电可变非易失性存储装置的方法
CN103294585B (zh) 服务器监控系统
CN103378986A (zh) 系统事件日志记录系统及方法
US9626241B2 (en) Watchdogable register-based I/O
CN103116551A (zh) 应用于CLB总线的NorFLASH存储接口模块
US20100125726A1 (en) Thin client host wakeup method and thin client host
US20230275809A1 (en) Unobservable node identification
CN115359821A (zh) 用于存储器芯片行锤威胁背压信号和主机侧响应的方法和装置
CN102750109A (zh) 资料同步系统及方法
CN102983989A (zh) 一种服务器虚拟地址的迁移方法、装置和设备
CN1848089A (zh) 届时控制提供副基础输入/输出系统码的方法及相关装置
US20210141433A1 (en) Managing ephemeral storage on a computing node
CN105975382B (zh) 一种硬件配置变动的报警方法
CN109117299A (zh) 服务器的侦错装置及其侦错方法
US10452574B2 (en) Read performance on a SATA storage device behind a host bus adapter
US8873327B2 (en) Semiconductor device and operating method thereof
CN108985402A (zh) 一种raid卡信息获取方法及相关装置
CN116662042A (zh) 内存装置及其工作方法、计算机可读存储介质及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20151221

Address after: 528437 Guangdong province Zhongshan Torch Development Zone, Cheung Hing Road 6 No. 222 north wing trade building room

Applicant after: Zhongshan yunchuang Intellectual Property Service Co.,Ltd.

Address before: 518109 Guangdong province Shenzhen city Longhua District Dragon Road No. 83 wing group building 11 floor

Applicant before: SCIENBIZIP CONSULTING (SHEN ZHEN) Co.,Ltd.

Effective date of registration: 20151221

Address after: 518109 Guangdong province Shenzhen city Longhua District Dragon Road No. 83 wing group building 11 floor

Applicant after: SCIENBIZIP CONSULTING (SHEN ZHEN) Co.,Ltd.

Address before: 518109 Guangdong city of Shenzhen province Baoan District Longhua Town Industrial Zone tabulaeformis tenth East Ring Road No. 2 two

Applicant before: HONG FU JIN PRECISION INDUSTRY (SHENZHEN) Co.,Ltd.

Applicant before: HON HAI PRECISION INDUSTRY Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160504

Termination date: 20170302

CF01 Termination of patent right due to non-payment of annual fee