CN111338908A - 一种基于bmc自动调整部件监控周期的方法 - Google Patents

一种基于bmc自动调整部件监控周期的方法 Download PDF

Info

Publication number
CN111338908A
CN111338908A CN202010160166.5A CN202010160166A CN111338908A CN 111338908 A CN111338908 A CN 111338908A CN 202010160166 A CN202010160166 A CN 202010160166A CN 111338908 A CN111338908 A CN 111338908A
Authority
CN
China
Prior art keywords
bmc
component
monitoring
period
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010160166.5A
Other languages
English (en)
Inventor
王忠林
吴之光
沈忱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Chaoyue CNC Electronics Co Ltd
Original Assignee
Shandong Chaoyue CNC Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Chaoyue CNC Electronics Co Ltd filed Critical Shandong Chaoyue CNC Electronics Co Ltd
Priority to CN202010160166.5A priority Critical patent/CN111338908A/zh
Publication of CN111338908A publication Critical patent/CN111338908A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种基于BMC自动调整部件监控周期的方法,涉及数据监控技术领域;将不同服务器的BMC日志按照服务器类别进行分别存储,需要进行部件监控的服务器进行BMC部署,获取同类别服务器的BMC日志,根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整;通过自动调整的方式,极大降低了故障时间,且具有灵活性及针对性,容易察觉可能存在故障的部件及时间点;并且灵活调整监控周期对可能出现的不同的故障现象进行有效分析,也提高了BMC监控效率,进一步提高了工作效率。

Description

一种基于BMC自动调整部件监控周期的方法
技术领域
本发明公开一种调整部件监控周期的方法,涉及数据监控技术领域,具体地说是一种基于BMC自动调整部件监控周期的方法。
背景技术
数据载体承担了更多的数据传输交换、存储等方面的业务需求,通常以大规模、多数量的服务器等数据处理机器为主。大量的数据处理要求服务器有着更高的可靠性及精准性,并且实时对服务器的软硬件以及固件等部件进行监控,对可能发生的故障进行预防,减少故障发生的概率,并且在故障发生后可以迅速排查解决故障。
目前采用的BMC对机器进行监控。通常来说,BMC对机器的监控通常以固定的周期获取相关部件的信息,容易导致一些潜在问题,比如监控周期固定,没有灵活性及针对性,极易无法察觉或漏掉可能存在故障的部件及时间点;其次,固定的监控周期导致无法对可能出现的不同的故障现象进行有效分析调整,导致BMC监控效率无法提高等问题。
发明内容
本发明针对现有技术的问题,提供一种基于BMC自动调整部件监控周期的方法,进行有效灵活的监控,能够察觉可能存在故障的部件及时间点信息,有效进行分析调整,提高BMC监控效率。
本发明提出的具体方案是:
一种基于BMC自动调整部件监控周期的方法:将不同服务器的BMC日志按照服务器类别进行分别存储,
需要进行部件监控的服务器进行BMC部署,获取同类别服务器的BMC日志,根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整。
所述的方法中对需要进行部件监控的服务器定时进行历史BMC日志的检查,分析历史BMC日志各个部件发生故障的概率,对部件的监控周期进行持续修正调整。
所述的方法中原周期内BMC日志中部件发生故障的概率降低,对部件的监控周期进行增长,原周期内BMC日志中部件发生故障的概率升高,对部件的监控周期进行减短。
所述的方法中原周期内BMC日志中部件发生故障的概率不变,部件的监控周期进行不变。
所述的方法中监控周期进行相应的调整的具体步骤为:
进行部件监控的服务器读取原周期内BMC日志,
按照一定顺序查看每个部件的故障概率,根据每个部件的故障概率,对每个部件进行监控周期的调整。
所述的方法中对于首次进行部件监控的服务器,还包括进行BMC部署,获取同类别服务器的BMC日志的步骤。
一种基于BMC自动调整部件监控周期的系统,包括存储模块和调整模块,存储模块将不同服务器的BMC日志按照服务器类别进行分别存储,
调整模块将需要进行部件监控的服务器进行BMC部署,使需要进行部件监控的服务器获取同类别服务器的BMC日志,并根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整。
所述的系统中调整模块对需要进行部件监控的服务器定时进行历史BMC日志的检查,分析历史BMC日志各个部件发生故障的概率,对部件的监控周期进行持续修正调整。
本发明的有益之处是:
本发明提供一种基于BMC自动调整部件监控周期的方法,在BMC上实现自动学习,根据同类产品的BMC日志以及自身运行过程中部件故障现象出现的概率大小,随时自动调整对不同部件的监控周期,从而实现BMC监控资源的高效利用,能够对故障进行快速解决;
同时本发明方法通过自动调整的方式,极大降低了故障时间,且具有灵活性及针对性,容易察觉可能存在故障的部件及时间点;并且灵活调整监控周期对可能出现的不同的故障现象进行有效分析,也提高了BMC监控效率,进一步提高了工作效率。
附图说明
图1是本发明方法中监控周期调整流程示意图;
图2是本发明方法初始化调整流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
本发明提供一种基于BMC自动调整部件监控周期的方法:将不同服务器的BMC日志按照服务器类别进行分别存储,
需要进行部件监控的服务器进行BMC部署,获取同类别服务器的BMC日志,根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整。
利用本发明方法进行部件监控周期调整时,具体过程为:
将不同服务器的BMC日志按照服务器类别进行分别存储,
不同产品服务器安装部署BMC时,可自动下载同类的产品日志,通过分析相关部件的故障发生率,对不同部件的监控周期做出相应调整:原周期内BMC日志中部件发生故障的概率降低,对部件的监控周期进行增长,原周期内BMC日志中部件发生故障的概率升高,对部件的监控周期进行减短,原周期内BMC日志中部件发生故障的概率不变,部件的监控周期也可不变。
在上述过程中,若需要进行部件监控的服务器是首次进行部件监控周期调整,则需要进行初始化,进行BMC部署,获取同类别服务器的BMC日志,
按照一定顺序查看每个部件的故障概率,根据每个部件的故障概率,对每个部件进行监控周期的调整。查看顺序可以是部件编号顺序,也可以根据实际需求,或部件的重要性进行。可参考图2。
在上述过程中,利用本发明方法还可对需要进行部件监控的服务器定时进行历史BMC日志的检查,分析历史BMC日志各个部件发生故障的概率,从而对部件的监控周期进行持续修正调整。
同时,本发明还提供一种基于BMC自动调整部件监控周期的系统,包括存储模块和调整模块,
存储模块将不同服务器的BMC日志按照服务器类别进行分别存储,
调整模块将需要进行部件监控的服务器进行BMC部署,使需要进行部件监控的服务器获取同类别服务器的BMC日志,并根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整。本发明系统可以通过python语言实现相关功能。
利用本发明系统进行部件监控周期调整时,具体过程为:
存储模块将不同服务器的BMC日志按照服务器类别进行分别存储,
不同产品服务器安装部署BMC时,通过调整模块可自动下载同类的产品日志,通过分析相关部件的故障发生率,对不同部件的监控周期做出相应调整:原周期内BMC日志中部件发生故障的概率降低,对部件的监控周期进行增长,原周期内BMC日志中部件发生故障的概率升高,对部件的监控周期进行减短,原周期内BMC日志中部件发生故障的概率不变,部件的监控周期也可不变。
在上述过程中,若需要进行部件监控的服务器是首次进行部件监控周期调整,则需要进行初始化,进行BMC部署,通过调整模块获取同类别服务器的BMC日志,
按照一定顺序查看每个部件的故障概率,根据每个部件的故障概率,对每个部件进行监控周期的调整。查看顺序可以是部件编号顺序,也可以根据实际需求,或部件的重要性进行。可参考图2。
在上述过程中,利用本发明系统的调整模块还可对需要进行部件监控的服务器定时进行历史BMC日志的检查,分析历史BMC日志各个部件发生故障的概率,从而对部件的监控周期进行持续修正调整。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (8)

1.一种基于BMC自动调整部件监控周期的方法,其特征是将不同服务器的BMC日志按照服务器类别进行分别存储,
需要进行部件监控的服务器进行BMC部署,获取同类别服务器的BMC日志,根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整。
2.根据权利要求1所述的方法,其特征是对需要进行部件监控的服务器定时进行历史BMC日志的检查,分析历史BMC日志各个部件发生故障的概率,对部件的监控周期进行持续修正调整。
3.根据权利要求1或2所述的方法,其特征是原周期内BMC日志中部件发生故障的概率降低,对部件的监控周期进行增长,原周期内BMC日志中部件发生故障的概率升高,对部件的监控周期进行减短。
4.根据权利要求3所述的方法,其特征是原周期内BMC日志中部件发生故障的概率不变,部件的监控周期进行不变。
5.根据权利要求1或4所述的方法,其特征是监控周期进行相应的调整的具体步骤为:
进行部件监控的服务器读取原周期内BMC日志,
按照一定顺序查看每个部件的故障概率,根据每个部件的故障概率,对每个部件进行监控周期的调整。
6.根据权利要求5所述的方法,其特征是对于首次进行部件监控的服务器,还包括进行BMC部署,获取同类别服务器的BMC日志的步骤。
7.一种基于BMC自动调整部件监控周期的系统,其特征是包括存储模块和调整模块,
存储模块将不同服务器的BMC日志按照服务器类别进行分别存储,
调整模块将需要进行部件监控的服务器进行BMC部署,使需要进行部件监控的服务器获取同类别服务器的BMC日志,并根据原周期内BMC日志中各个部件发生故障的概率,对部件的监控周期进行相应的调整。
8.根据权利要求7所述的系统,其特征是调整模块对需要进行部件监控的服务器定时进行历史BMC日志的检查,分析历史BMC日志各个部件发生故障的概率,对部件的监控周期进行持续修正调整。
CN202010160166.5A 2020-03-10 2020-03-10 一种基于bmc自动调整部件监控周期的方法 Pending CN111338908A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010160166.5A CN111338908A (zh) 2020-03-10 2020-03-10 一种基于bmc自动调整部件监控周期的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010160166.5A CN111338908A (zh) 2020-03-10 2020-03-10 一种基于bmc自动调整部件监控周期的方法

Publications (1)

Publication Number Publication Date
CN111338908A true CN111338908A (zh) 2020-06-26

Family

ID=71182224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010160166.5A Pending CN111338908A (zh) 2020-03-10 2020-03-10 一种基于bmc自动调整部件监控周期的方法

Country Status (1)

Country Link
CN (1) CN111338908A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114900671A (zh) * 2022-07-12 2022-08-12 深圳市盈润科技有限公司 一种基于农业物联网的综合管理服务系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130246001A1 (en) * 2010-10-29 2013-09-19 Fujitsu Limited Device monitoring system and method
CN105677538A (zh) * 2016-01-11 2016-06-15 中国科学院软件研究所 一种基于故障预测的云计算系统自适应监测方法
CN106502868A (zh) * 2016-11-18 2017-03-15 国云科技股份有限公司 一种适用于云计算的动态调整监测频率方法
CN109101400A (zh) * 2018-08-16 2018-12-28 郑州云海信息技术有限公司 一种云计算数据中心整机柜服务器的监控系统
CN109981328A (zh) * 2017-12-28 2019-07-05 中国移动通信集团陕西有限公司 一种故障预警方法及装置
CN110489260A (zh) * 2019-07-31 2019-11-22 新华三技术有限公司成都分公司 故障识别方法、装置及bmc

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130246001A1 (en) * 2010-10-29 2013-09-19 Fujitsu Limited Device monitoring system and method
CN105677538A (zh) * 2016-01-11 2016-06-15 中国科学院软件研究所 一种基于故障预测的云计算系统自适应监测方法
CN106502868A (zh) * 2016-11-18 2017-03-15 国云科技股份有限公司 一种适用于云计算的动态调整监测频率方法
CN109981328A (zh) * 2017-12-28 2019-07-05 中国移动通信集团陕西有限公司 一种故障预警方法及装置
CN109101400A (zh) * 2018-08-16 2018-12-28 郑州云海信息技术有限公司 一种云计算数据中心整机柜服务器的监控系统
CN110489260A (zh) * 2019-07-31 2019-11-22 新华三技术有限公司成都分公司 故障识别方法、装置及bmc

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114900671A (zh) * 2022-07-12 2022-08-12 深圳市盈润科技有限公司 一种基于农业物联网的综合管理服务系统及方法

Similar Documents

Publication Publication Date Title
US20210064500A1 (en) System and Method for Detecting Anomalies by Discovering Sequences in Log Entries
CN105808394B (zh) 一种服务器自愈的方法和装置
EP2645257A2 (en) System and method for visualisation of behaviour within computer infrastructure
CN103605722A (zh) 数据库监控方法及装置、设备
CN104022904A (zh) 分布式机房it设备统一管理平台
CN105653322B (zh) 运维服务器和服务器事件的处理方法
CN108521339A (zh) 一种基于集群日志的反馈式节点故障处理方法及系统
CN102479113A (zh) 异常自适应处理方法及系统
CN109240891A (zh) 一种sr整机柜服务器的监控方法及装置
CN104065526A (zh) 一种服务器故障报警的方法和装置
CN112529223A (zh) 一种设备故障报修方法、装置、服务器及储存介质
CN111338908A (zh) 一种基于bmc自动调整部件监控周期的方法
CN107729213B (zh) 一种后台任务监控方法及装置
CN110109434B (zh) 控制器、协同服务器、设备的协同运行系统及方法
CN112446051B (zh) 一种基于区块链技术的异常追踪方法及其系统
CN102136922B (zh) 相关性分析的方法、设备及系统
WO2024008130A1 (zh) 故障硬件处理方法、装置和系统
CN109728957B (zh) 一种交互式运维的方法及装置
CN109284204B (zh) 一种基于虚拟化计算的大数据平台运维方法以及系统
CN108021463B (zh) 一种基于有限状态机的gpu故障管理方法
CN113242147B (zh) 多云环境的自动化运维部署方法、装置、设备和存储介质
CN114661507A (zh) 基于时间关联数据的数据处理方法、装置和电子设备
CN102436397B (zh) 一种基于windows服务控制器的系统自动运行方法
US11457374B2 (en) Hub device with diagnostic function and diagnostic method using the same
CN112115032B (zh) 一种日志生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination