CN107203456A - 服务器故障的远程报警系统及方法 - Google Patents

服务器故障的远程报警系统及方法 Download PDF

Info

Publication number
CN107203456A
CN107203456A CN201610152220.5A CN201610152220A CN107203456A CN 107203456 A CN107203456 A CN 107203456A CN 201610152220 A CN201610152220 A CN 201610152220A CN 107203456 A CN107203456 A CN 107203456A
Authority
CN
China
Prior art keywords
server
failure
far
failure code
management controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610152220.5A
Other languages
English (en)
Inventor
管纪豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shencloud Technology Co Ltd
Kunda Computer Technology Kunshan Co Ltd
Original Assignee
Shencloud Technology Co Ltd
Kunda Computer Technology Kunshan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shencloud Technology Co Ltd, Kunda Computer Technology Kunshan Co Ltd filed Critical Shencloud Technology Co Ltd
Priority to CN201610152220.5A priority Critical patent/CN107203456A/zh
Publication of CN107203456A publication Critical patent/CN107203456A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Selective Calling Equipment (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种服务器故障的远程报警方法,由一监控服务器通过基板管理控制器及其监控软件控制一远端服务器开机,该远程报警方法包含以下步骤:该监控服务器预存有一故障对照表及多个声音档,该故障对照表中记录多个不同故障代码以及每一故障代码所对应的一种声音档;该远端服务器开机异常时,该基本输入输出系统输出一故障代码;该基板管理控制器接收该故障代码后,该监控服务器根据该故障代码比对出所对应的声音档;该监控服务器播放该声音档。本发明的远程报警方法令管理人员在远端控制服务器时,可以快速地了解目前服务器的状况,在服务器故障后,在第一时间收到该故障硬件的信息,并及时将其检修。

Description

服务器故障的远程报警系统及方法
技术领域
本发明涉及一种电子信息处理系统及方法,特别涉及一种服务器故障的远程报警系统及方法。
背景技术
目前的服务器主机往往都装配有蜂鸣器,开机过程中,通常能在硬件出现故障时发出声音,提醒使用者板子上的硬件出了问题。比如说在进行上电自检(Power-On-Self-Test,POST)过程中,板子上有存储器坏掉了,基本输入输出系统(Basic Input Output System,BIOS)会发出故障信息并使蜂鸣器发出三声短音,来警告使用者,存储器出问题了,而这种利用声音来提醒使用者的方式,又有着长短、次数的排列组合,每一种排列组合,依据不同BIOS厂商的设定,也各有不同。另一方面,目前管理远端服务器的方式,包括通过基板管理控制器(baseboard management controller,BMC)的网络控制台(Web console)或远端服务器主机画面的监控(console redirection)来远端控制系统,其用意在于管理人员可以不用进入机房就可做到远端控制、存取资料,进而达成要完成的目的或工作。其中,基板管理控制器的网络控制台是利用JAVA技术所制作出的网页,其用途可以让机房管理人员未进机房,就能知服务器的状况;通常我们可以从这个网页得知目前机器上重要部件的实时信息,例如温度、风扇转速、电压、系统事件日志(system event log)等等,甚至可以透过KVM(Keyboard Video Mouse)达成远端进入基本输入输出系统对系统设定值进行修改、存取。
然而,在这种技术背景下,由于远端管理人员通常不会处于服务器边,在服务器硬件发生故障后,管理人员很难察觉,甚至管理人员即使位于服务器边,却很可能因为机房内的种种噪音,比如说风扇的声音,导致管理人员根本无法或着很难听到、辨别眼前的服务器是否发出声音,使蜂鸣器的效果大打折扣。另一方面,对远端管理人员来说,虽然可以透过网络控制台检视系统事件日志中的资料来得知远端服务器中的硬件是否维持正常运作,然而,远端管理人员并不会一直盯着系统事件日志,因此也无法实时发现远端服务器的硬件是否有故障情形。
发明内容
本发明的目的在于针对现有技术中的不足,提供一种服务器故障发生后能够远程报警的方法,管理人员即使不在故障服务器旁也能实时接收到报警信息。
为了达到上述目的,本发明提供一种服务器故障的远程报警方法,由一监控服务器通过基板管理控制器及其监控软件控制一远端服务器开机,该远端服务器具有一基本输入输出系统,该基板管理控制器安装在该远端服务器主机板上,其特征在于:该远程报警方法包含:
(A)该监控服务器预先储存有多个不同声音档及一故障对照表,该故障对照表中记录多个不同故障代码以及每一故障代码所对应的一种该声音档;
(B)该远端服务器开机异常时,该基本输入输出系统输出一故障代码到该基板管理控制器;
(C)该基板管理控制器接收该故障代码后,该监控服务器根据该故障对照表比对出该故障代码所对应的该声音档;
(D)该监控服务器播放该故障代码所对应的该声音档。
特别地,该故障代码为一符合智慧平台管理界面(Intelligent Platform Management Interface,IPMI)工业标准的OEM(Original Equipment Manufacturer)指令。
特别地,该远端服务器开机异常是指,该远端服务器的该基本输入输出系统在进行POST过程中所发生的异常。
及一种服务器故障的远程报警系统,该系统包括:
一远端服务器,包含一主机板,其上安装有一基板管理控制器,该主机板上还包含:
一基本输入输出系统,用于在该远端服务器开机异常时,输出一故障代码;
一监控服务器,包括一音频设备,该监控服务器中预存有多个不同声音档及一故障对照表,该故障对照表记录多个不同故障代码以及每一故障代码所对应的一种该声音档,该监控服务器通过该基板管理控制器监控该远端服务器;
当该基板管理控制器接收来自该基本输入输出系统的故障代码时,该监控服务器根据该故障对照表比对出所对应的声音档,并控制音频设备发出该声音档。
特别地,该故障代码为一符合IPMI工业标准的OEM指令。
本发明的功效在于,管理人员在远端控制服务器时,可以快速地了解目前服务器的状况,在服务器故障后,在第一时间收到该故障硬件的信息,并及时将其检修。
【附图说明】
图1为本发明的远程报警方法的一实施例的系统图;
图2为对应图1的实施例的流程图。
【具体实施方式】
请参阅图1所示,本发明远程报警方法的一实施例,包含监控服务器2及远端服务器1。
该监控服务器2包括音频设备21及基板管理控制器112,且预存有一故障对照表22及多个不同声音档23,该基板管理控制器112安装于该远端服务器1上,该故障对照表22中记录多个不同故障代码以及每一故障代码所对应的一种该声音档23。
该远端服务器1包含主机板11,该主机板11具有基本输入输出系统111。
该基本输入输出系统111在该远端服务器1开机检测过程中发生开机异常时,输出一故障代码至该基板管理控制器112,在本实施例中,该故障代码为一符合IPMI工业标准的OEM指令。该基板管理控制器112接收到该故障代码后,该监控服务器根据该故障对照表22找出该故障代码所对应的声音档23,并控制该音频设备21发出该声音。
请参阅图2所示,该远程报警方法步骤如下:
步骤A:该监控服务器2上预先存有一故障对照表22及多个不同声音档23,该故障对照表22中记录多个不同故障代码以及每一故障代码所对应的一种声音档23。
步骤B:该远端服务器1接收到开机命令后开机,其基本输入输出系统111进行其POST,在检测出某一硬件如一双列直插内存条(DIMM)出现故障后,向基板管理控制器112发出一故障代码;在本实施例中,该故障代码对应到该主机板11上的特定CPU底下的特定通道的特定插槽,因此,该故障代码可对应到该主机板11上特定位置上的双列直插内存条。
步骤C:该基板管理控制器112接收到来自该基本输入输出系统111发出的该故障代码后,该监控服务器2根据该故障对照表22比对后找出该故障代码所对应的该双列直插内存条故障的声音档23,例如为三声短音警报。
步骤D:该监控服务器2播放该双列直插内存条故障对应的三声短音警报。
于是,管理人员即可通过监控服务器2接收到该三声短音警报后,并根据预先定义好的报警声与硬件的对应关系,查询并了解到该三声短音代表该内存条发生故障,而对其进行检修。
综上所述,在远端服务器1故障后,通过电路传输信号并最终在监控服务器2上实现报警,使管理人员能更及时地在不进机房的情况下发现故障硬件,因此确实能达成本发明的目的。
上面结合附图对本发明的具体实施方式和实施例做了详细说明,但不能以之限定本发明的范围,在本发明的申请专利范围内所作的均等修饰和变化,皆应该属于本发明专利范围内。

Claims (5)

1.一种服务器故障的远程报警方法,由一监控服务器通过基板管理控制器及其监控软件控制一远端服务器开机,该远端服务器具有一基本输入输出系统,该基板管理控制器安装在该远端服务器主机板上,其特征在于:该远程报警方法包含:
(A)该监控服务器预先储存有多个不同声音档及一故障对照表,该故障对照表中记录多个不同故障代码以及每一故障代码所对应的一种该声音档;
(B)该远端服务器开机异常时,该基本输入输出系统输出一故障代码到该基板管理控制器;
(C)该基板管理控制器接收该故障代码后,该监控服务器根据该故障对照表比对出该故障代码所对应的该声音档;
(D)该监控服务器播放该故障代码所对应的该声音档。
2.按照权利要求1所述的远程报警方法,其特征在于:该故障代码为一符合IPMI工业标准的OEM指令。
3.按照权利要求1所述的远程报警方法,其特征在于:该远端服务器开机异常是指,该远端服务器的该基本输入输出系统在进行POST过程中所发生的异常。
4.一种服务器故障的远程报警系统,其特征在于:该系统包括:
一远端服务器,包含一主机板,其上安装有一基板管理控制器,该主机板上还包含一基本输入输出系统,用于在该远端服务器开机异常时,输出一故障代码;
一监控服务器,包括一音频设备,该监控服务器中预存有多个不同声音档及一故障对照表,该故障对照表记录多个不同故障代码以及每一故障代码所对应的一种该声音档,该监控服务器通过该基板管理控制器监控该远端服务器;
当该基板管理控制器接收来自该基本输入输出系统的故障代码时,该监控服务器根据该故障对照表比对出所对应的声音档,并控制音频设备发出该声音档。
5.按照权利要求4所述的远程报警系统,其特征在于:该故障代码为一符合IPMI工业标准的OEM指令。
CN201610152220.5A 2016-03-17 2016-03-17 服务器故障的远程报警系统及方法 Pending CN107203456A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610152220.5A CN107203456A (zh) 2016-03-17 2016-03-17 服务器故障的远程报警系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610152220.5A CN107203456A (zh) 2016-03-17 2016-03-17 服务器故障的远程报警系统及方法

Publications (1)

Publication Number Publication Date
CN107203456A true CN107203456A (zh) 2017-09-26

Family

ID=59903912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610152220.5A Pending CN107203456A (zh) 2016-03-17 2016-03-17 服务器故障的远程报警系统及方法

Country Status (1)

Country Link
CN (1) CN107203456A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045375A (zh) * 2019-12-31 2020-04-21 北京北信源软件股份有限公司 一种机房安全运维监测系统和方法
CN111241098A (zh) * 2020-01-09 2020-06-05 佛山科学技术学院 一种工业故障数据响应方法及装置
CN111651321A (zh) * 2020-05-26 2020-09-11 深圳市同泰怡信息技术有限公司 系统事件记录解析的方法、装置、存储介质和计算机设备
CN113465270A (zh) * 2021-06-30 2021-10-01 重庆海尔制冷电器有限公司 冰箱的故障提示方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192187A (zh) * 2006-11-30 2008-06-04 中国长城计算机深圳股份有限公司 计算机故障报警系统及方法
CN102340517A (zh) * 2010-07-15 2012-02-01 英业达股份有限公司 一种具有多主机板的服务器系统
CN102467425A (zh) * 2010-11-05 2012-05-23 英业达股份有限公司 利用基板管理控制器取得储存装置故障信号的方法
CN102929760A (zh) * 2012-10-19 2013-02-13 浪潮电子信息产业股份有限公司 一种远程监控系统上电过程宕机的方法
CN203038055U (zh) * 2012-12-31 2013-07-03 湖北新冶钢有限公司 设备故障报警装置
CN203193658U (zh) * 2013-05-02 2013-09-11 山东电力集团公司枣庄供电公司 一种具备远程警示功能的服务器管理监控系统
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
CN105183600A (zh) * 2015-09-09 2015-12-23 浪潮电子信息产业股份有限公司 一种远程定位硬盘故障的装置和方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192187A (zh) * 2006-11-30 2008-06-04 中国长城计算机深圳股份有限公司 计算机故障报警系统及方法
CN102340517A (zh) * 2010-07-15 2012-02-01 英业达股份有限公司 一种具有多主机板的服务器系统
CN102467425A (zh) * 2010-11-05 2012-05-23 英业达股份有限公司 利用基板管理控制器取得储存装置故障信号的方法
CN102929760A (zh) * 2012-10-19 2013-02-13 浪潮电子信息产业股份有限公司 一种远程监控系统上电过程宕机的方法
CN203038055U (zh) * 2012-12-31 2013-07-03 湖北新冶钢有限公司 设备故障报警装置
CN203193658U (zh) * 2013-05-02 2013-09-11 山东电力集团公司枣庄供电公司 一种具备远程警示功能的服务器管理监控系统
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
CN105183600A (zh) * 2015-09-09 2015-12-23 浪潮电子信息产业股份有限公司 一种远程定位硬盘故障的装置和方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045375A (zh) * 2019-12-31 2020-04-21 北京北信源软件股份有限公司 一种机房安全运维监测系统和方法
CN111045375B (zh) * 2019-12-31 2023-03-10 北京北信源软件股份有限公司 一种机房安全运维监测系统和方法
CN111241098A (zh) * 2020-01-09 2020-06-05 佛山科学技术学院 一种工业故障数据响应方法及装置
CN111651321A (zh) * 2020-05-26 2020-09-11 深圳市同泰怡信息技术有限公司 系统事件记录解析的方法、装置、存储介质和计算机设备
CN113465270A (zh) * 2021-06-30 2021-10-01 重庆海尔制冷电器有限公司 冰箱的故障提示方法

Similar Documents

Publication Publication Date Title
CN104639380B (zh) 服务器监控方法
EP2472402B1 (en) Remote management systems and methods for mapping operating system and management controller located in a server
CN107203456A (zh) 服务器故障的远程报警系统及方法
CN111314115A (zh) 一种基于idl日志的告警方法、装置、设备及可读介质
US20140189103A1 (en) System for monitoring servers and method thereof
CN102055615A (zh) 服务器监控方法
US7694179B2 (en) Suspected place identifying apparatus and processing method
US8839040B2 (en) Computer system and detecting-alarming method thereof
US20120163212A1 (en) Apparatus and method for detecting abnormal traffic
US7286051B2 (en) Providing audio indications remotely
CN115190046B (zh) 一种服务器集群的检测方法、检测装置及计算设备
CN115080362A (zh) 一种pcie设备降速上报方法、系统、设备以及存储介质
US11595241B2 (en) Systems and methods for managing a security system
CN205121541U (zh) 可远程报警和备份的嵌入式系统加密备份还原装置
JP2000040040A (ja) データ通信装置及びプログラムを記憶した記憶媒体
JP2003345681A (ja) ネットワーク監視方法及びその実施システム並びにその処理プログラム
JP2011039676A (ja) 監視装置及び警報通知方法
JP2006201890A (ja) プログラム異常対策装置
JP3223872B2 (ja) サーバ群表示監視装置
US11010317B2 (en) Method for remotely triggered reset of a baseboard management controller of a computer system
JPH1040097A (ja) ウイルスチェック機能付計算機
TWI711285B (zh) 網路故障偵測方法以及網路故障偵測裝置
JP2002278798A (ja) 障害監視装置及びその方法並びに記憶媒体
US20080123537A1 (en) Method and Apparatus for Facilitating the Detection of Loop-Back Conditions in Computer Networks
CN106599046A (zh) 分布式文件系统的写入方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170926

WD01 Invention patent application deemed withdrawn after publication