CN109981366A - 一种服务器sensor读值异常容错的报警方法 - Google Patents
一种服务器sensor读值异常容错的报警方法 Download PDFInfo
- Publication number
- CN109981366A CN109981366A CN201910240552.2A CN201910240552A CN109981366A CN 109981366 A CN109981366 A CN 109981366A CN 201910240552 A CN201910240552 A CN 201910240552A CN 109981366 A CN109981366 A CN 109981366A
- Authority
- CN
- China
- Prior art keywords
- readings
- tolerant
- fault
- sensor
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 22
- 230000001960 triggered effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了一种服务器sensor读值异常容错的报警方法,包括以下步骤:服务器BMC实时读取主板上各sensor的读值;将任一sensor读取的N次读值进行处理得到该sensor的有效值;记录上述有效值,且对有效值进行容错处理后进行报警。本发明公开的服务器sensor读值异常容错的报警方法,通过BMC读取sensor值,并用简单安全有效的异常容错机制,将各种异常原因导致的读值干扰过滤,选取有效读值,从而大大提高了故障告警机制的安全性和稳定性。
Description
技术领域
本发明涉及服务器技术领域,尤其涉及一种服务器sensor读值异常容错的报警方法。
背景技术
近几年大数据、云服务的持续火热,各大运营商以及众多互联网企业对服务器的需求连年增长,因此各大服务器供应商都加大对服务器的开发投入,来迎合市场更多、更广的需求。随着厂商定制化的深入,服务器基板管理控制器(BMC)的管理功能向更细致更全面的方向发展。
通常BMC管理监控服务器上各sensor的故障告警:服务器BMC实时读取主板上各sensor的读值,外界环境异常或者硬件特性的改变都会影响sensor读值的精确度,同时芯片本身也会有概率性的出现读值异常等现象。目前的方案都没有对读值异常的有效过滤,最终导致sensor误报警的出现。
基于上述背景,对于本领域技术人员而言,如何更好的实现将各种异常原因导致的读值干扰过滤,提高故障告警机制的安全性和稳定性,是亟需解决的技术问题。
发明内容
基于背景技术存在的技术问题,本发明提出了一种服务器sensor读值异常容错的报警方法,通过BMC读取sensor值,并用简单安全有效的异常容错机制,将各种异常原因导致的读值干扰过滤,选取有效读值,从而大大提高了故障告警机制的安全性和稳定性。
为了便于理解,对本文中名词说明如下:
BMC(Baseboard Management Controller,基板管理控制器)是服务器特有的管理控制器。
本发明提出的一种服务器sensor读值异常容错的报警方法,包括以下步骤:
服务器BMC实时读取主板上各sensor的读值;
将任一sensor读取的N次读值进行处理得到该sensor的有效值;
记录上述有效值,且对有效值进行容错处理后进行报警。
优选地,对N次读值进行处理,具体包括以下步骤:去掉最高读值和去掉最低读值,并将剩余读值取平均值。
优选地,去掉的最高读值数量与去掉的最低读值数量相等。
优选地,N的值为10,且去掉的最高读值数量和去掉的最低读值数量均为2。
优选地,对有效值进行容错处理后进行报警,具体方式为:连续M次有效值出现异常时,触发该sensor的报警机制。
优选地,M的值为3。
优选地,若出现有效值正常,则清空异常信息。
优选地,还包括以下步骤:将告警信息上传远程控制中心。
本发明中提供的一种服务器sensor读值异常容错的报警方法,服务器BMC实时读取主板各sensor值,将最近读取的10次值保留,去掉最高的2次读值以及最低的2次读值,将剩余的6次读值取平均值,然后将此平均值作为服务器sensor的读取有效值。同时BMC检测到连续3次读值异常时,才触发告警机制。此异常容错方案可简单有效的保证故障告警机制的安全性和稳定性。
附图说明
图1为本发明提出的一种服务器sensor读值异常容错的报警方法的流程图。
具体实施方式
如图1所示,图1为本发明提出的一种服务器sensor读值异常容错的报警方法的流程图。
下面结合附图和实施例对本发明进行详细的描述。
一种服务器sensor读值异常容错的报警方法,包括以下步骤:
S1:服务器BMC实时读取主板上各sensor的读值;
S2:将任一sensor读取的10次读值,去掉最高2次读值和去掉最低2次读值,并将剩余6次读值取平均值,得到该sensor的有效值;
S3:若连续3次有效值出现异常时,触发该sensor的报警机制,若出现有效值正常,则清空异常信息;
S4:将告警信息上传远程控制中心。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种服务器sensor读值异常容错的报警方法,其特征在于,包括以下步骤:
服务器BMC实时读取主板上各sensor的读值;
将任一sensor读取的N次读值进行处理得到该sensor的有效值;
记录上述有效值,且对有效值进行容错处理后进行报警。
2.根据权利要求1所述的服务器sensor读值异常容错的报警方法,其特征在于,对N次读值进行处理,具体包括以下步骤:去掉最高读值和去掉最低读值,并将剩余读值取平均值。
3.根据权利要求2所述的服务器sensor读值异常容错的报警方法,其特征在于,去掉的最高读值数量与去掉的最低读值数量相等。
4.根据权利要求3所述的服务器sensor读值异常容错的报警方法,其特征在于,N的值为10,且去掉的最高读值数量和去掉的最低读值数量均为2。
5.根据权利要求1所述的服务器sensor读值异常容错的报警方法,其特征在于,对有效值进行容错处理后进行报警,具体方式为:连续M次有效值出现异常时,触发该sensor的报警机制。
6.根据权利要求5所述的服务器sensor读值异常容错的报警方法,其特征在于,M的值为3。
7.根据权利要求5所述的服务器sensor读值异常容错的报警方法,其特征在于,若出现有效值正常,则清空异常信息。
8.根据权利要求1所述的服务器sensor读值异常容错的报警方法,其特征在于,还包括以下步骤:将告警信息上传远程控制中心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910240552.2A CN109981366A (zh) | 2019-03-28 | 2019-03-28 | 一种服务器sensor读值异常容错的报警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910240552.2A CN109981366A (zh) | 2019-03-28 | 2019-03-28 | 一种服务器sensor读值异常容错的报警方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109981366A true CN109981366A (zh) | 2019-07-05 |
Family
ID=67081010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910240552.2A Pending CN109981366A (zh) | 2019-03-28 | 2019-03-28 | 一种服务器sensor读值异常容错的报警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109981366A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104502759A (zh) * | 2014-12-19 | 2015-04-08 | 国家电网公司 | 配网开关柜智能监测系统 |
CN105138103A (zh) * | 2015-07-27 | 2015-12-09 | 浪潮(北京)电子信息产业有限公司 | 一种电源板和服务器电路板系统 |
CN105278579A (zh) * | 2015-11-23 | 2016-01-27 | 浪潮电子信息产业股份有限公司 | 一种基于节点功耗的Rack机柜入风温度修正方法 |
CN106598807A (zh) * | 2016-12-14 | 2017-04-26 | 郑州云海信息技术有限公司 | 一种板卡、一种主板和一种温度监控系统及方法 |
CN107943654A (zh) * | 2017-11-24 | 2018-04-20 | 郑州云海信息技术有限公司 | 一种快速判定服务器环境温度监控异常原因的方法 |
CN207424858U (zh) * | 2017-05-24 | 2018-05-29 | 联想(北京)有限公司 | 基板管理控制器及服务器 |
CN108571460A (zh) * | 2017-08-30 | 2018-09-25 | 紫光华山信息技术有限公司 | 风扇转速控制方法和装置 |
-
2019
- 2019-03-28 CN CN201910240552.2A patent/CN109981366A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104502759A (zh) * | 2014-12-19 | 2015-04-08 | 国家电网公司 | 配网开关柜智能监测系统 |
CN105138103A (zh) * | 2015-07-27 | 2015-12-09 | 浪潮(北京)电子信息产业有限公司 | 一种电源板和服务器电路板系统 |
CN105278579A (zh) * | 2015-11-23 | 2016-01-27 | 浪潮电子信息产业股份有限公司 | 一种基于节点功耗的Rack机柜入风温度修正方法 |
CN106598807A (zh) * | 2016-12-14 | 2017-04-26 | 郑州云海信息技术有限公司 | 一种板卡、一种主板和一种温度监控系统及方法 |
CN207424858U (zh) * | 2017-05-24 | 2018-05-29 | 联想(北京)有限公司 | 基板管理控制器及服务器 |
CN108571460A (zh) * | 2017-08-30 | 2018-09-25 | 紫光华山信息技术有限公司 | 风扇转速控制方法和装置 |
CN107943654A (zh) * | 2017-11-24 | 2018-04-20 | 郑州云海信息技术有限公司 | 一种快速判定服务器环境温度监控异常原因的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108897665B (zh) | 日志管理方法、装置、计算机设备及存储介质 | |
JP4573179B2 (ja) | 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム | |
CN109815697B (zh) | 误报行为处理方法及装置 | |
CN113485872B (zh) | 故障处理方法、装置及分布式存储系统 | |
CN107193680A (zh) | 一种心跳检测方法、设备及系统 | |
CN109639501B (zh) | 一种异常记录信息存储方法及装置 | |
CN113934720A (zh) | 一种数据清洗方法、设备及计算机存储介质 | |
CN111752811A (zh) | 异常告警信息处理方法、电子设备及存储介质 | |
CN110888763A (zh) | 磁盘故障诊断方法、装置、终端设备及计算机存储介质 | |
CN111639053A (zh) | 授权文件到期告警提示方法、装置及计算机设备 | |
CN114338372A (zh) | 网络信息安全监控方法及系统 | |
CN114138615A (zh) | 一种业务告警处理方法、装置、设备及存储介质 | |
CN109992448A (zh) | 文件变化增量备份方法、装置、设备及介质 | |
CN106911519A (zh) | 一种数据采集监控方法及装置 | |
CN112839112A (zh) | 一种分层数据存储系统及方法、备份管理服务器 | |
JP6216621B2 (ja) | プラント監視制御システム | |
CN109981366A (zh) | 一种服务器sensor读值异常容错的报警方法 | |
CN108899059A (zh) | 一种固态硬盘的检测方法和设备 | |
CN110333968B (zh) | 应用于数据库的数据管理方法、装置及计算机设备 | |
CN111090491B (zh) | 虚拟机任务状态的恢复方法、装置及电子设备 | |
CN117785613A (zh) | 内存监控方法、装置、设备、计算机存储介质及车辆 | |
CN117271222A (zh) | 一种面向大数据的云容灾备份方法及系统 | |
CN111586129A (zh) | 针对数据同步的报警方法、装置、电子设备及存储介质 | |
US7664797B1 (en) | Method and apparatus for using statistical process control within a storage management system | |
CN110955587A (zh) | 一种待更换设备确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190705 |