CN109981366A - 一种服务器sensor读值异常容错的报警方法 - Google Patents

一种服务器sensor读值异常容错的报警方法 Download PDF

Info

Publication number
CN109981366A
CN109981366A CN201910240552.2A CN201910240552A CN109981366A CN 109981366 A CN109981366 A CN 109981366A CN 201910240552 A CN201910240552 A CN 201910240552A CN 109981366 A CN109981366 A CN 109981366A
Authority
CN
China
Prior art keywords
readings
tolerant
sensor
fault
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910240552.2A
Other languages
English (en)
Inventor
靳先奇
乔英良
颜伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910240552.2A priority Critical patent/CN109981366A/zh
Publication of CN109981366A publication Critical patent/CN109981366A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种服务器sensor读值异常容错的报警方法,包括以下步骤:服务器BMC实时读取主板上各sensor的读值;将任一sensor读取的N次读值进行处理得到该sensor的有效值;记录上述有效值,且对有效值进行容错处理后进行报警。本发明公开的服务器sensor读值异常容错的报警方法,通过BMC读取sensor值,并用简单安全有效的异常容错机制,将各种异常原因导致的读值干扰过滤,选取有效读值,从而大大提高了故障告警机制的安全性和稳定性。

Description

一种服务器sensor读值异常容错的报警方法
技术领域
本发明涉及服务器技术领域,尤其涉及一种服务器sensor读值异常容错的报警方法。
背景技术
近几年大数据、云服务的持续火热,各大运营商以及众多互联网企业对服务器的需求连年增长,因此各大服务器供应商都加大对服务器的开发投入,来迎合市场更多、更广的需求。随着厂商定制化的深入,服务器基板管理控制器(BMC)的管理功能向更细致更全面的方向发展。
通常BMC管理监控服务器上各sensor的故障告警:服务器BMC实时读取主板上各sensor的读值,外界环境异常或者硬件特性的改变都会影响sensor读值的精确度,同时芯片本身也会有概率性的出现读值异常等现象。目前的方案都没有对读值异常的有效过滤,最终导致sensor误报警的出现。
基于上述背景,对于本领域技术人员而言,如何更好的实现将各种异常原因导致的读值干扰过滤,提高故障告警机制的安全性和稳定性,是亟需解决的技术问题。
发明内容
基于背景技术存在的技术问题,本发明提出了一种服务器sensor读值异常容错的报警方法,通过BMC读取sensor值,并用简单安全有效的异常容错机制,将各种异常原因导致的读值干扰过滤,选取有效读值,从而大大提高了故障告警机制的安全性和稳定性。
为了便于理解,对本文中名词说明如下:
BMC(Baseboard Management Controller,基板管理控制器)是服务器特有的管理控制器。
本发明提出的一种服务器sensor读值异常容错的报警方法,包括以下步骤:
服务器BMC实时读取主板上各sensor的读值;
将任一sensor读取的N次读值进行处理得到该sensor的有效值;
记录上述有效值,且对有效值进行容错处理后进行报警。
优选地,对N次读值进行处理,具体包括以下步骤:去掉最高读值和去掉最低读值,并将剩余读值取平均值。
优选地,去掉的最高读值数量与去掉的最低读值数量相等。
优选地,N的值为10,且去掉的最高读值数量和去掉的最低读值数量均为2。
优选地,对有效值进行容错处理后进行报警,具体方式为:连续M次有效值出现异常时,触发该sensor的报警机制。
优选地,M的值为3。
优选地,若出现有效值正常,则清空异常信息。
优选地,还包括以下步骤:将告警信息上传远程控制中心。
本发明中提供的一种服务器sensor读值异常容错的报警方法,服务器BMC实时读取主板各sensor值,将最近读取的10次值保留,去掉最高的2次读值以及最低的2次读值,将剩余的6次读值取平均值,然后将此平均值作为服务器sensor的读取有效值。同时BMC检测到连续3次读值异常时,才触发告警机制。此异常容错方案可简单有效的保证故障告警机制的安全性和稳定性。
附图说明
图1为本发明提出的一种服务器sensor读值异常容错的报警方法的流程图。
具体实施方式
如图1所示,图1为本发明提出的一种服务器sensor读值异常容错的报警方法的流程图。
下面结合附图和实施例对本发明进行详细的描述。
一种服务器sensor读值异常容错的报警方法,包括以下步骤:
S1:服务器BMC实时读取主板上各sensor的读值;
S2:将任一sensor读取的10次读值,去掉最高2次读值和去掉最低2次读值,并将剩余6次读值取平均值,得到该sensor的有效值;
S3:若连续3次有效值出现异常时,触发该sensor的报警机制,若出现有效值正常,则清空异常信息;
S4:将告警信息上传远程控制中心。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种服务器sensor读值异常容错的报警方法,其特征在于,包括以下步骤:
服务器BMC实时读取主板上各sensor的读值;
将任一sensor读取的N次读值进行处理得到该sensor的有效值;
记录上述有效值,且对有效值进行容错处理后进行报警。
2.根据权利要求1所述的服务器sensor读值异常容错的报警方法,其特征在于,对N次读值进行处理,具体包括以下步骤:去掉最高读值和去掉最低读值,并将剩余读值取平均值。
3.根据权利要求2所述的服务器sensor读值异常容错的报警方法,其特征在于,去掉的最高读值数量与去掉的最低读值数量相等。
4.根据权利要求3所述的服务器sensor读值异常容错的报警方法,其特征在于,N的值为10,且去掉的最高读值数量和去掉的最低读值数量均为2。
5.根据权利要求1所述的服务器sensor读值异常容错的报警方法,其特征在于,对有效值进行容错处理后进行报警,具体方式为:连续M次有效值出现异常时,触发该sensor的报警机制。
6.根据权利要求5所述的服务器sensor读值异常容错的报警方法,其特征在于,M的值为3。
7.根据权利要求5所述的服务器sensor读值异常容错的报警方法,其特征在于,若出现有效值正常,则清空异常信息。
8.根据权利要求1所述的服务器sensor读值异常容错的报警方法,其特征在于,还包括以下步骤:将告警信息上传远程控制中心。
CN201910240552.2A 2019-03-28 2019-03-28 一种服务器sensor读值异常容错的报警方法 Pending CN109981366A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910240552.2A CN109981366A (zh) 2019-03-28 2019-03-28 一种服务器sensor读值异常容错的报警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910240552.2A CN109981366A (zh) 2019-03-28 2019-03-28 一种服务器sensor读值异常容错的报警方法

Publications (1)

Publication Number Publication Date
CN109981366A true CN109981366A (zh) 2019-07-05

Family

ID=67081010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910240552.2A Pending CN109981366A (zh) 2019-03-28 2019-03-28 一种服务器sensor读值异常容错的报警方法

Country Status (1)

Country Link
CN (1) CN109981366A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104502759A (zh) * 2014-12-19 2015-04-08 国家电网公司 配网开关柜智能监测系统
CN105138103A (zh) * 2015-07-27 2015-12-09 浪潮(北京)电子信息产业有限公司 一种电源板和服务器电路板系统
CN105278579A (zh) * 2015-11-23 2016-01-27 浪潮电子信息产业股份有限公司 一种基于节点功耗的Rack机柜入风温度修正方法
CN106598807A (zh) * 2016-12-14 2017-04-26 郑州云海信息技术有限公司 一种板卡、一种主板和一种温度监控系统及方法
CN107943654A (zh) * 2017-11-24 2018-04-20 郑州云海信息技术有限公司 一种快速判定服务器环境温度监控异常原因的方法
CN207424858U (zh) * 2017-05-24 2018-05-29 联想(北京)有限公司 基板管理控制器及服务器
CN108571460A (zh) * 2017-08-30 2018-09-25 紫光华山信息技术有限公司 风扇转速控制方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104502759A (zh) * 2014-12-19 2015-04-08 国家电网公司 配网开关柜智能监测系统
CN105138103A (zh) * 2015-07-27 2015-12-09 浪潮(北京)电子信息产业有限公司 一种电源板和服务器电路板系统
CN105278579A (zh) * 2015-11-23 2016-01-27 浪潮电子信息产业股份有限公司 一种基于节点功耗的Rack机柜入风温度修正方法
CN106598807A (zh) * 2016-12-14 2017-04-26 郑州云海信息技术有限公司 一种板卡、一种主板和一种温度监控系统及方法
CN207424858U (zh) * 2017-05-24 2018-05-29 联想(北京)有限公司 基板管理控制器及服务器
CN108571460A (zh) * 2017-08-30 2018-09-25 紫光华山信息技术有限公司 风扇转速控制方法和装置
CN107943654A (zh) * 2017-11-24 2018-04-20 郑州云海信息技术有限公司 一种快速判定服务器环境温度监控异常原因的方法

Similar Documents

Publication Publication Date Title
CN102682565B (zh) 适于开放空间的消防和安防一体化智能视频监测系统
US10137397B2 (en) Filter systems
CN104685531B (zh) 具有篡改尝试报告的现场设备
CN102591591A (zh) 磁盘检测系统、磁盘检测方法以及网络存储系统
WO2011026174A1 (en) Video camera system
CN102279775A (zh) 一种Linux系统下的硬盘故障处理方法
CN114363044A (zh) 一种分层告警方法、系统、存储介质和终端
JP2015028700A (ja) 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体
CN105740110A (zh) 一种linux系统下硬盘smart信息的检测方法
CN109639501B (zh) 一种异常记录信息存储方法及装置
CN104660552A (zh) 一种wlan网络入侵检测系统
CN103810823A (zh) 报警处理方法和装置
JP2010033517A (ja) 警報器
US20170146196A1 (en) Natural gas leakage detection device
CN108899059B (zh) 一种固态硬盘的检测方法和设备
CN109981366A (zh) 一种服务器sensor读值异常容错的报警方法
CN106899977B (zh) 异常流量检验方法和装置
CN106533812B (zh) 一种应用服务器
CA2848554C (en) System and method for storing and monitoring events at security devices
CN102419887A (zh) 多元综合推断的电气火灾监控系统
JP2015075808A (ja) ネットワークフィルタリング装置及びネットワークフィルタリング方法
TWI494754B (zh) 伺服器監控裝置和其操作方法
KR20140120200A (ko) 데이터베이스 장애 조기 경보 시스템 및 방법
WO2018102977A1 (zh) 一种物联网设备的预警方法及系统
JP2007133650A (ja) ネットワークセキュリティシステム及び通信切断方法並びにプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705

RJ01 Rejection of invention patent application after publication