CN112132195B - 一种利用马尔科夫模型分析与预测机房故障的方法 - Google Patents
一种利用马尔科夫模型分析与预测机房故障的方法 Download PDFInfo
- Publication number
- CN112132195B CN112132195B CN202010961323.2A CN202010961323A CN112132195B CN 112132195 B CN112132195 B CN 112132195B CN 202010961323 A CN202010961323 A CN 202010961323A CN 112132195 B CN112132195 B CN 112132195B
- Authority
- CN
- China
- Prior art keywords
- fault
- state
- data
- markov model
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 230000007704 transition Effects 0.000 claims abstract description 22
- 238000012423 maintenance Methods 0.000 abstract description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000007654 immersion Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 239000000779 smoke Substances 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Alarm Systems (AREA)
Abstract
一种利用马尔科夫模型分析与预测机房故障的方法,该方法根据历史告警故障数据构建马尔科夫模型矩阵,并根据当前的新告警故障数据按照马尔科夫模型矩阵推断是否发生故障状态转移,再将新告警故障数据和预测故障状态转移以网络消息的形式发生至运维人员,最后将新告警故障数据加入历史告警故障数据中进行数据更新,以方便提高下一次推断故障状态转移的准确性,该方法根据历史告警故障数据构建马尔科夫模型矩阵,判断出告警故障数据的不同状态之间的内在联系,而且利用马尔科夫模型分析新产生的新告警故障数据,判断出对无人机房将来会发生的问题并且对相关运维人员进行预警,而不是被动式等待问题出现并且解决,因此提高了运维人员的工作效率。
Description
技术领域
本发明涉及一种利用马尔科夫模型分析与预测机房故障的方法,属于机房检测技术领域。
背景技术
目前各大运营商在机房管理上都采用无人值守智慧化管理方式,运维人员通过远程监控手段来降低运维成本,即利用摄像机对监视对象中设备及其运行情况的监视,但是人工监控要求工作人员一直在屏幕前,不但工作量大,而且难免会有疏漏。而且故障发生后,由运维人员及时处理,完全取决于运维人员的工作经验以及工作效率,只能被动式等待问题出现并且解决。
而且机房故障状态会发生转移,比如水浸设备故障发生后,有一定概率发生电压过高,或者过低相关故障,烟感设备故障发生后,也有一定概率发生红外设备等关联设备故障,但目前只能通过运维人员的长期工作获取的经验来预防这些问题的发生。
发明内容
为解决上述现有技术中存在的技术问题,本发明提供了一种利用马尔科夫模型分析与预测机房故障的方法,该方法利用马尔科夫模型分析新产生的新告警故障数据,预判出对无人机房将来会发生的问题并且进行预警,从而对机房运维人员起到提前预判问题的发生,同时提高了运维人员的工作效率。
实现本发明目的的技术方案为,一种利用马尔科夫模型分析与预测机房故障的方法,至少包括以下步骤:
(1)根据历史告警故障数据计算出初始经验值,再根据初始经验值构建马尔科夫模型矩阵,且初始经验值存储到经验库中,其中马尔科夫模型矩阵的计算公式为:
pij=p(Ej/Ei) 式1
式1中,Ei为故障第i种状态概率,Ej为故障第j种状态概率,pij为从状态i到状态j的条件概率即故障第i种状态转为故障第j种状态的状态转移概率;式2中,P为状态转移概率矩阵,pij为从状态i到状态j的条件概率;式3中,pij为从状态i到状态j 的条件概率;
(2)根据马尔科夫模型矩阵设定不同阈值,再将采集得到的新告警故障数据值与阈值A进行比对,若数据值小于相应阈值A,则作为普通故障或者事件进行丢弃;若数据值大于相应阈值A,则认定为故障状态转移,且将新告警故障数据值根据马尔科夫模型数据并行计算出其他条件概率,再将条件概率值与相应的阈值B进行比对,若条件概率值小于相应阈值B,则作为极低故障状态转移事件丢弃;若条件概率值大于相应阈值 B,则将新告警故障数据和预测故障状态转移以网络消息的形式输出;
(3)将新告警故障数据加入历史告警故障数据中进行数据更新,即故障状态产生次数加历史状态次数形成总历史状态次数,且更新后的历史告警故障数据更新马尔科夫模型矩阵,再将更新后的历史告警故障数据进行存储。
对上述技术方案的进一步改进为:步骤(1)所述历史告警故障数据以周或月或年为时间范围内的告警故障数据结合而成。
且步骤(3)所述更新后的历史告警故障数据以故障名称、故障状态、马尔科夫模型矩阵、故障更新日期、相应阈值的数据结构进行存储。
由上述技术方案可知:本发明提供的一种利用马尔科夫模型分析与预测机房故障的方法,该方法根据历史告警故障数据构建马尔科夫模型矩阵,并根据当前的新告警故障数据按照马尔科夫模型矩阵推断是否发生故障状态转移,再将新告警故障数据和预测故障状态转移以网络消息的形式发生至运维人员,最后将新告警故障数据加入历史告警故障数据中进行数据更新,以方便提高下一次推断故障状态转移的准确性,该方法根据历史告警故障数据构建马尔科夫模型矩阵,判断出告警故障数据的不同状态之间的内在联系,而且利用马尔科夫模型分析新产生的新告警故障数据,判断出对无人机房将来会发生的问题并且对相关运维人员进行预警,从而对机房运维人员起到提前预判问题的发生,而不是被动式等待问题出现并且解决,因此提高了运维人员的工作效率。
附图说明
图1为本发明提供的利用马尔科夫模型分析与预测机房故障的方法框架示意图。
具体实施方式
下面结合附图和实施例对本发明进行详细具体说明,本发明的内容不局限于以下实施例。
参照图1,本发明提供的一种利用马尔科夫模型分析与预测机房故障的方法,包括以下步骤:
(1)根据历史告警故障数据计算出初始经验值,再根据初始经验值构建马尔科夫模型矩阵,且初始经验值存储到经验库中,其中马尔科夫模型矩阵的计算公式为:
pij=p(Ej/Ei) 式1
式1中,Ei为故障第i种状态概率,Ej为故障第j种状态概率,pij为从状态i到状态j的条件概率即故障第i种状态转为故障第j种状态的状态转移概率;式2中,P为状态转移概率矩阵,pij为从状态i到状态j的条件概率;式3中,pij为从状态i到状态j 的条件概率;
本实施例中,故障由相应的传感器监测获得,传感器监测出异常会发生告警信息,,目前无人机房相关故障告警信息至少包括:水浸告警、烟感告警、输入断电告警、零序电流过大告警、防雷器故障告警、风扇故障告警、电压畸变过大告警、电流畸变过大告警、控制器温度过高告警、欠压告警、熔丝告警、过压告警、低油温告警、低油压告警、进排风风门告警、启动电池电压低告警、充电器故障告警、高油温告警、室内氢气浓度告警、电池组温度过高告警、压缩机高压告警、压缩机低压告警、压缩机高温告警、开门次数状态等。
由于机房故障状态会发生转移,比如水浸设备故障发生后,有一定概率发生电压过高,或者过低相关故障,烟感设备故障发生后,也有一定概率发生红外设备等关联设备故障,根据历史告警故障数据分析发现各个故障之间的规律,例如,式1中,Ei为故障第i种状态概率即水浸设备故障,Ej为故障第j种状态概率即电压过高,pij为从水浸设备故障到电压过高的条件概率即水浸设备故障后发生电压过高的几率。
根据构建马尔科夫模型矩阵,可以知道所有故障状态到其他故障状态的条件概率即某种故障状态发生后发生其他故障状态的几率。
(2)根据马尔科夫模型矩阵设定不同阈值,再将采集得到的新告警故障数据值与阈值A进行比对,若数据值小于相应阈值A,则作为普通故障或者事件进行丢弃;若数据值大于相应阈值A,则认定为故障状态转移,且将新告警故障数据值根据马尔科夫模型数据并行计算出其他条件概率,再将条件概率值与相应的阈值B进行比对,若条件概率值小于相应阈值B,则作为极低故障状态转移事件丢弃;若条件概率值大于相应阈值 B,则将新告警故障数据和预测故障状态转移以网络消息的形式输出,本实施中网络消息通知方式为UDP、TCP等协议。;
根据统计学分析统计历史告警故障数据,得到故障状态还与次数有关,达到一定次数的某类告警发生后,预示着相关的告警发生几率会大大提高,将该值设为阈值,
当某告警或者事件发生达到预设的次数后,我们就认定这时刻达到我们马尔科夫模型中预定的某种状态并产生转移。判断出对无人机房将来会发生的问题并且对相关运维人员进行预警,从而对机房运维人员起到提前预判问题的发生,而不是被动式等待问题出现并且解决,因此提高了运维人员的工作效率,大大提高了预测准确性,对机房运维人员的要求进一步降低,并且有效的防止事故的发生。
(3)将新告警故障数据加入历史告警故障数据中进行数据更新,即故障状态产生次数加历史状态次数形成总历史状态次数,且更新后的历史告警故障数据更新马尔科夫模型矩阵,再将更新后的历史告警故障数据进行存储。
及时的更新马尔科夫模型矩阵,使下一次推断故障状态转移更为准确。
本实施例中,步骤(1)所述历史告警故障数据以周或月或年为时间范围内的告警故障数据结合而成。
本实施例中,步骤(3)所述更新后的历史告警故障数据以故障名称、故障状态、马尔科夫模型矩阵、故障更新日期、相应阈值的数据结构进行存储。
Claims (3)
1.一种利用马尔科夫模型分析与预测机房故障的方法,其特征在于,至少包括以下步骤:
(1)根据历史告警故障数据计算出初始经验值,再根据初始经验值构建马尔科夫模型矩阵,且初始经验值存储到经验库中,其中马尔科夫模型矩阵的计算公式为:
pij=p(Ej/Ei) 式1
式1中,Ei为故障第i种状态概率,Ej为故障第j种状态概率,pij为从状态i到状态j的条件概率即故障第i种状态转为故障第j种状态的状态转移概率;式2中,P为状态转移概率矩阵,pij为从状态i到状态j的条件概率;式3中,pij为从状态i到状态j的条件概率;
(2)根据马尔科夫模型矩阵设定不同阈值,再将采集得到的新告警故障数据值与阈值A进行比对,若数据值小于相应阈值A,则作为普通故障或者事件进行丢弃;若数据值大于相应阈值A,则认定为故障状态转移,且将新告警故障数据值根据马尔科夫模型数据并行计算出其他条件概率,再将条件概率值与相应的阈值B进行比对,若条件概率值小于相应阈值B,则作为极低故障状态转移事件丢弃;若条件概率值大于相应阈值B,则将新告警故障数据和预测故障状态转移以网络消息的形式输出;
(3)将新告警故障数据加入历史告警故障数据中进行数据更新,即故障状态产生次数加历史状态次数形成总历史状态次数,且更新后的历史告警故障数据更新马尔科夫模型矩阵,再将更新后的历史告警故障数据进行存储。
2.根据权利要求1所述的利用马尔科夫模型分析与预测机房故障的方法,其特征在于,步骤(1)所述历史告警故障数据以周或月或年为时间范围内的告警故障数据结合而成。
3.根据权利要求1所述的利用马尔科夫模型分析与预测机房故障的方法,其特征在于,步骤(3)所述更新后的历史告警故障数据以故障名称、故障状态、马尔科夫模型矩阵、故障更新日期、相应阈值的数据结构进行存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010961323.2A CN112132195B (zh) | 2020-09-14 | 2020-09-14 | 一种利用马尔科夫模型分析与预测机房故障的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010961323.2A CN112132195B (zh) | 2020-09-14 | 2020-09-14 | 一种利用马尔科夫模型分析与预测机房故障的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112132195A CN112132195A (zh) | 2020-12-25 |
CN112132195B true CN112132195B (zh) | 2024-03-29 |
Family
ID=73845665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010961323.2A Active CN112132195B (zh) | 2020-09-14 | 2020-09-14 | 一种利用马尔科夫模型分析与预测机房故障的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132195B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115037634B (zh) * | 2022-05-30 | 2024-04-16 | 中电信数智科技有限公司 | 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 |
CN116016298B (zh) * | 2023-01-04 | 2024-04-09 | 重庆邮电大学 | 一种基于隐半马尔可夫模型的5g通信协议异常检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103235933A (zh) * | 2013-04-15 | 2013-08-07 | 东南大学 | 一种基于隐马尔科夫模型的车辆异常行为检测方法 |
CN103323707A (zh) * | 2013-06-05 | 2013-09-25 | 清华大学 | 基于半马尔科夫过程的变压器故障率预测方法 |
CN109635854A (zh) * | 2018-11-26 | 2019-04-16 | 国网冀北电力有限公司 | 基于马尔科夫链的充电桩故障预测方法及装置 |
CN110224850A (zh) * | 2019-04-19 | 2019-09-10 | 北京亿阳信通科技有限公司 | 电信网络故障预警方法、装置及终端设备 |
CN111124840A (zh) * | 2019-12-02 | 2020-05-08 | 北京天元创新科技有限公司 | 业务运维中告警的预测方法、装置与电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190266682A1 (en) * | 2018-02-27 | 2019-08-29 | United States Of America As Represented By The Secretary Of The Army | Calculating value of inspection information |
-
2020
- 2020-09-14 CN CN202010961323.2A patent/CN112132195B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103235933A (zh) * | 2013-04-15 | 2013-08-07 | 东南大学 | 一种基于隐马尔科夫模型的车辆异常行为检测方法 |
CN103323707A (zh) * | 2013-06-05 | 2013-09-25 | 清华大学 | 基于半马尔科夫过程的变压器故障率预测方法 |
CN109635854A (zh) * | 2018-11-26 | 2019-04-16 | 国网冀北电力有限公司 | 基于马尔科夫链的充电桩故障预测方法及装置 |
CN110224850A (zh) * | 2019-04-19 | 2019-09-10 | 北京亿阳信通科技有限公司 | 电信网络故障预警方法、装置及终端设备 |
CN111124840A (zh) * | 2019-12-02 | 2020-05-08 | 北京天元创新科技有限公司 | 业务运维中告警的预测方法、装置与电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112132195A (zh) | 2020-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10013866B2 (en) | Production equipment monitoring method and system | |
CN112132195B (zh) | 一种利用马尔科夫模型分析与预测机房故障的方法 | |
CN111007433A (zh) | 基于物联网的智慧用电安全监管系统 | |
CN114137916B (zh) | 基于数据分析的电路板生产用监督管控系统 | |
CN117176560B (zh) | 一种基于物联网的监测设备监管系统及其方法 | |
CN110349048B (zh) | 变电站多维数据运行交互控制平台及故障处置方法 | |
CN117354171B (zh) | 基于物联网平台的平台健康状况预警方法及系统 | |
CN109214529A (zh) | 一种机电系统预防性维护方法及系统、设备、存储介质 | |
CN118152784B (zh) | 模块化变电站设备数据特征提取方法 | |
CN115208059A (zh) | 一种变电站动力与环境监控告警处理系统及方法 | |
CN116755964A (zh) | 一种加固服务器的故障预测与健康管理系统 | |
CN118203260A (zh) | 一种基于智能分析的吸尘器状态评估方法及系统 | |
CN115656812A (zh) | 一种电机实时状态多维度监测方法及系统 | |
CN117094852B (zh) | 一种工商业储能的能源监控系统及方法 | |
CN116863664A (zh) | 燃气设备的实时监测方法以及燃气设备监测系统 | |
CN117269821A (zh) | 一种变电站蓄电池远程控制核容系统 | |
CN116736134A (zh) | 一种实时性储能电池数据监测方法及装置 | |
CN113691529B (zh) | 一种基于电力行业网络安全的工业控制系统及方法 | |
CN105809257A (zh) | 一种基于电力通信网络的触发式状态检修方法 | |
CN111931798A (zh) | 进行冷头状态分类检测和寿命预测的方法 | |
CN118523505B (zh) | 基于人工智能的配电箱远程管理方法及系统 | |
CN118501596B (zh) | 一种基于数据分析的智能用电监测系统 | |
CN118552179A (zh) | 基于物联网的设备功耗运行管理系统 | |
CN117942517A (zh) | 一种充电桩的智能消防监控系统 | |
CN118657506A (zh) | 一种基于人工智能的光网通信设备运维管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |