CN115037634B - 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 - Google Patents
一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 Download PDFInfo
- Publication number
- CN115037634B CN115037634B CN202210596149.5A CN202210596149A CN115037634B CN 115037634 B CN115037634 B CN 115037634B CN 202210596149 A CN202210596149 A CN 202210596149A CN 115037634 B CN115037634 B CN 115037634B
- Authority
- CN
- China
- Prior art keywords
- threshold
- network
- fault
- model
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 241000283073 Equus caballus Species 0.000 claims abstract description 6
- 230000006855 networking Effects 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims abstract description 5
- 238000004458 analytical method Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 238000012423 maintenance Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,包括:在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相关节点、数据库和模型;构建使用固定流量阈值的基于马尔可夫链的网络预警模型,获得模型训练参数数据;构建基于贝叶斯的阈值预测模型,获得预测模型参数,阈值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用中的固定流量阈值,实现连续时间的k8s网络故障预测。本发明采用贝叶斯阈值预测模型调整监控阈值来解决马尔科夫链的网络预警模型稳态分布的方法不能实现对连续时间马尔科夫链的计算从而造成对网络预警模型预测失真的问题。
Description
技术领域
本发明属于网络故障预警技术领域,具体涉及一种基于马氏链和贝叶斯网络的k8s网络 故障预测方法。
背景技术
随着数字化发展的逐渐深入,各单位的在运设备也在逐渐增加。相较于十年前,设备增 长了10~100倍,即便运维已经在从手工运维向工具运维和平台运维发展,但仍然无法满足当前集群对运维管理要求及集群之间数据互通的高效处理。
机房运维场景下存在集群业务规模大,应用关系复杂,依赖层次多,排查问题困难的问 题,现有技术很难预测未来时间段内各集群网络流量趋势、运维压力的情况,无法实现多集 群中网络预警及分析。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于马氏链和贝叶斯 网络的k8s网络故障预测方法,引入基于马尔科夫链的网络预警模型,通过该模型可更加智 能的预测集群未来时间段内的网络运行情况;并通过贝叶斯概率预测动态管理网络流量阈值,来调整马尔科夫链的网络预警模型状态变化最终趋于平稳分布后对网络预警模型预测失真的 问题。
为实现上述技术目的,本发明采取的技术方案为:
一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,包括:
步骤一、在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相 关节点、数据库和模型;
步骤二、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,基于步骤一部署内 容获得模型训练参数数据;
步骤三、构建基于贝叶斯的阈值预测模型,基于步骤一部署内容获得预测模型参数,阈 值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用 中的固定流量阈值,实现连续时间的k8s网络故障预测。
为优化上述技术方案,采取的具体措施还包括:
上述的步骤一在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群;
在中央集群管理服务器上部署主节点Master和历史故障数据库及阈值管理数据库;
在主节点Master通过k8s的API server在中央集群管理服务器上创建一个模型Node节点 和一个采集所有Pod网络流量数据的采集Node节点;
在采集Node节点部署采集数据库;
在模型节点上部署网络预警模型和阈值预测模型。
上述的步骤二包括:
S1、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,其对应的马尔可夫转移 概率矩阵模型公式为:
X(k+1)=X(k)×P
式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵, X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量;
S2、通过访问采集数据库和历史故障数据库获得参数生成矩形集合,所述参数包括固定 流量阈值下历史网络故障初始概率、本时段固定阈值下网络故障转移到非故障概率、本时段 固定阈值下非网络故障转移到故障概率;
S3、网络预警模型基于S2获取的固定流量阈值下历史网络故障初始概率、本时段固定阈 值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率,得出下一 个时段阈值不变网络故障占采集数据占比、下一个时段阈值不变非网络故障占采集数据占比 和下一时段阈值不变情况下故障与非故障比例。
上述的S2中,具体参数获取方式为:
1)、固定流量阈值下历史网络故障初始概率=(N)/(N+C);
N=从历史故障数据库获取符合指定阈值条件的网络故障数据总条数;
C=从采集数据库获取符合指定阈值条件的网络采集数据总条数;
2)、本时段固定流量阈值下网络故障转移到非故障概率=|(S%-H%)|x本时间段内采 集总条数/S;
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时 间段内采集总条数;
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数 据总条数/本时间段内采集总条数;
S=本时间段内故障未恢复数据总条数;
3)、本时段固定流量阈值下非网络故障转移到故障概率=(|(S%-H%)|x本时间段内 采集总条数)/(本时间段内采集总条数-本时间段内故障未恢复数据总条数)。
上述的步骤三构建基于贝叶斯的阈值预测模型,访问部署在中央集群管理服务器上的阈 值管理数据库和历史告警数据库结合分析,获得模型参数,具体的:
所述阈值预测模型为:
P(A|B)=(P(B|A)*P(A))/P(B|A)P(A)+P(B|A')P(A')
其中,模型各参数为:
P(B|A)为网络预警模型连续学习过程中曾经使用过几次当前阈值/阈值数据库总条数结果 的概率;
P(A)是忽略其它因素,使用当前阈值的故障总条数/历史故障总条数;
P(B|A')为阈值数据库阈值在历史故障数据库出现过的概率;
P(A')=1-P(A)。
上述的步骤三将历史阈值中除当前使用之外的每个阈值逐一输入阈值预测模型,获得阈 值使用概率,采用使用概率最大的阈值代替马网络预警模型使用中的固定流量阈值,实现连 续时间的k8s网络故障预测。
本发明具有以下有益效果:
本发明突出了人工智能在集群中网络预警及阈值智能管控的地位,创造性地采用贝叶斯 阈值预测模型调整监控阈值来解决马尔科夫链的网络预警模型稳态分布的方法不能实现对连 续时间马尔科夫链的计算从而造成对网络预警模型预测失真的问题;同时,运用马尔科夫链和贝叶斯网络从纵横两个方面对网络故障做了比较全面的分析和预测,创新性的处理了马尔 科夫链在处理上层指标缺失这个方面的不足;其中,马尔科夫链是探索由样本所决定的在未 来时间里变量的概率分布,是一种纵向预测的方法,贝叶斯网络监测阈值则展示出故障与阈 值指标之间的相互影响关系,是一种横向预测方法;本发明结合这两种方法有一个优势在于可以解决多层指标体系的非底层指标数据缺乏的问题,以实现宏观意义上的故障预测。贝叶 斯贝叶斯网络监测阈值的反推功能也为网络故障风险控制提供了基础;
本发明突出了人工智能在k8s集群之间Pod业务数据对网络及网络设备负载及压力的概 率预测的优势,解决了现有IT业务系统的多集群数据共同参与运算且集群之间数据可灵活控 制与调度参与分析及运算的技术问题;
本发明采用人工智能通过主机管理k8s集群的方式满足跨k8s集群管理需求的技术问题, 通过日志分析判定集群间关联关系并生成关联标识放入配置文件。提高了Pod调度的灵活性, 为Pod节点在跨集群拓扑数据互通、集群之间业务数据交互、及集群资源消耗概率预测、灵 活配置及调度提供了一种可行性方法。
附图说明
图1是本发明的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法的流程图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细描述。
参见图1,本发明一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,包括:
步骤一、在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相 关节点、数据库和模型。
集群管理服务器所在网络节点简称,集群中央管理节点。中央调度集群主要包括三个对 象Master(主节点)、Node(节点)、Pod。
首先,在中央集群管理服务器上部署Master(主节点)和历史故障数据库及阈值管理数 据库。
其次,在Master(主节点)通过k8s的API server在中央集群管理服务器上创建一个模 型Node节点和一个采集所有Pod网络流量数据的采集Node节点。在采集Node节点部署采 集数据库。
最后,在模型节点上部署【网络预警模型】和【阈值预测模型】。
步骤二、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,基于步骤一部署内 容获得模型训练参数数据;
可访问部署在中央集群管理服务器上的历史故障数据库,获得模型训练初始概率和移动 概率数据。
具体描述:
S1、马尔可夫转移概率矩阵模型公式
X(k+1)=X(k)×P
公式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵, X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量。
S2、通过访问采集数据库和历史故障数据库获得参数生成矩形集合
历史网络故障初始概率【0.3、0.7】
下一时间段网络故障转移到非故障概率【0.6、0.4】
下一时间段网络非故障转移到故障概率【0.3、0.7】
矩形集合形如:
具体参数获取描述
1、固定流量阈值下历史网络故障初始概率
N=从历史故障数据库获取符合指定阈值条件的网络故障数据总条数。
C=从采集数据库获取符合指定阈值条件的网络采集数据总条数。
例如:N=30条符合指定阈值条件的网络故障数据
C=70条符合指定阈值条件的网络采集数据
网络故障初始概率=(N)/(N+C)=30%
网络故障初始概率【0.3 0.7】
2、本时段固定流量阈值下网络故障转移到非故障概率
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时 间段内采集总条数(历史网络故障数据)
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数 据总条数/本时间段内采集总条数(实时未恢复网络故障数据)
H=本时间段内历史网络故障数据总条数
S=本时间段内故障未恢复数据总条数
1、如果(S%-H%)<0表示实时未恢复网络故障有部分转移到非故障。(S%-H%)由于 实时未恢复网络故障转移到非故障概率只关注实时未恢复网络故障转移概率。因此只获取 (S%-H%)小于0部分参与计算。
本时段固定阈值下网络故障转移到非故障概率:
公式:|(S%-H%)|x本时间段内采集总条数/S
注:(/=除号、|=取绝对值)
非故障转移到未恢复故障概率=【0.4 0.6】
3、本时段固定流量阈值下非网络故障转移到故障概率
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时 间段内采集总条数(历史网络故障数据)
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数 据总条数/本时间段内采集总条数(实时未恢复网络故障数据)
H=本时间段内历史网络故障数据总条数
S=本时间段内故障未恢复数据总条数
1、如果(S%-H%)>0表示实时未恢复网络故障有数量增加,部分来自采集监测数据转 移。(S%-H%)由于非故障概率转移到实时未恢复网络故障只关注非故障转移概率。因此只获取(S%-H%)大于0部分参与计算。
本时段固定阈值下非故障转移到未恢复故障概率:
公式:(|(S%-H%)|x本时间段内采集总条数)/(本时间段内采集总条数-本时间段 内故障未恢复数据总条数)
注:(/=除号、||)=取绝对值)
非故障转移到未恢复故障概率=【0.3 0.7】
S3、网络预警模型基于S2获取的固定流量阈值下历史网络故障初始概率、本时段固定阈 值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率,得出下一 个时段阈值不变网络故障占采集数据占比、下一个时段阈值不变非网络故障占采集数据占比 和下一时段阈值不变情况下故障与非故障比例。
固定流量阈值下历史网络故障初始概率【0.3、0.7】
本时段固定阈值下网络故障转移到非故障概率【0.6、0.4】
本时段固定阈值下非网络故障转移到故障概率【0.3、0.7】
通过模型计算得出:X(k+1)=X(k)×P
下一个时段固定阈值下网络故障占采集数据占比0.3x0.6+0.3x0.7=0.39
下一个时段固定阈值下非网络故障占采集数据占比0.3x0.4+7x0.7=0.61
下一时段固定阈值下故障与非故障比例【0.39 0.61】
步骤三、构建基于贝叶斯的阈值预测模型,基于步骤一部署内容获得预测模型参数,阈值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用 中的固定流量阈值,实现连续时间的k8s网络故障预测。
可访问部署在中央集群管理服务器上的阈值管理数据库和历史告警数据库,获得模型参 数【先验概率】【条件概率】【调整因子】。
将【先验概率】【条件概率】【调整因子】放入模型运算。运算结果做为下一时段马尔可夫链【网络预警模型】平稳状态分布后,由于故障与非故障比例持续为类似【0.5 0.5】数值且持续相同。从而不能实现对连续时间马尔科夫链的计算。因此需要通过调整对采集的网 络数据进行阈值变动从而生成新的故障数据,而故障阈值的调整则通过结合贝叶斯【阈值预 测模型】分析历史故障数据得出更符合当前业务特征的故障阈值。
模型公式及举例:
P(A|B)=(P(B|A)*P(A))/P(B|A)P(A)+P(B|A')P(A')
【先验概率】=P(A)【条件概率】=P(B)【调整因子】=P(B|A)x P(A)
P(A)是忽略其它因素,使用当前阈值的故障总条数/历史故障总条数例如:40%;
P(A')1-P(A),在这里是60%;
P(B|A)【网络预警模型】连续学习过程中曾经使用过几次当前阈值/阈值数据库总条数结 果的概率,在这里是50%;
P(B|A')阈值数据库阈值在历史故障数据库出现过的概率,如果历史阈值都在历史故障数 据库有应用在这里是100%;
P(B)是忽略其它因素,直接考虑阈值使用概率公式
P(B)=P(B|A)P(A)+P(B|A')P(A'),在这里是0.5*0.4+1*0.6=0.8;
那么根据贝叶斯公式,可以计算得到,也就是
P(A|B)=(0.5*0.4)/(0.8)=0.25
将历史阈值中除当前使用之外的每个阈值逐一放入贝叶斯【阈值预测模型】获得阈值使 用概率,数值最大的阈值做为马尔可夫链【网络预警模型】平稳状态分布后,不能实现对连 续时间马尔科夫链的计算。从而代替使用中的固定流量阈值。从而完成整个【网络预警模型】的持续运算。
本发明所用到的缩略语和关键术语定义如下:
Kubernetes Kubernetes,简称k8s或者“kube”,是一个开源的Linux容器自动化运维 平台,它消除了容器化应用程序在部署、伸缩时涉及到的许多手动操作。换句话说,可以将 多台主机组合成集群来运行Linux容器,而k8s可以帮助你简单高效地管理那些集群。构成这些集群的主机还可以跨越公有云、私有云以及混合云。
·Master(主节点):控制k8s节点的机器,也是创建作业任务的地方。
·Node(节点):这些机器在k8s主节点的控制下执行被分配的任务。
·Pod:由一个或多个容器构成的集合,作为一个整体被部署到一个单一节点。同一个 pod中的容器共享IP地址、进程间通讯(IPC)、主机名以及其它资源。Pod将底层容器的网络和存储抽象出来,使得集群内的容器迁移更为便捷。
马尔可夫链法(Markov chain method)亦称马尔可夫预测分析.把经济事态的演变设想为有 限马尔可夫链的预测方法.所谓有限马尔可夫链是指只取有限种状态的无后效性的随机过程. 例如,某种股票的隔日价格变化可以有涨和跌两种状态.如果认为它是按马尔可夫链的规律来 变化的,那么其变化规律就由一个2X2的状态转移矩阵来决定.这个矩阵的四个元素是继续上涨的概率、涨转跌的概率、跌转涨的概率、继续下跌的概率.根据统计资料,可以对这四种概 率有一个估计.由此就可根据以往的股市,来预测明天以至若干天后的该股票价格的涨跌的概 率.马尔可夫链法常用于各种市场预测。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于 本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术 人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (4)
1.一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,包括:
步骤一、在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相关节点、数据库和模型;
步骤二、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,基于步骤一部署内容获得模型训练参数数据;所述步骤二包括:
S1、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,其对应的马尔可夫转移概率矩阵模型公式为:
X(k+1)=X(k)×P
式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵,X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量;
S2、通过访问采集数据库和历史故障数据库获得参数生成矩形集合,所述参数包括固定流量阈值下历史网络故障初始概率、本时段固定阈值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率;
具体参数获取方式为:
1)、固定流量阈值下历史网络故障初始概率=(N)/(N+C);
N=从历史故障数据库获取符合指定阈值条件的网络故障数据总条数;
C=从采集数据库获取符合指定阈值条件的网络采集数据总条数;
2)、本时段固定流量阈值下网络故障转移到非故障概率=|(S%-H%)|x本时间段内采集总条数/S;
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时间段内采集总条数;
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数据总条数/本时间段内采集总条数;
S=本时间段内故障未恢复数据总条数;
3)、本时段固定流量阈值下非网络故障转移到故障概率=(|(S%-H%)|x本时间段内采集总条数)/(本时间段内采集总条数-本时间段内故障未恢复数据总条数);
S3、网络预警模型基于S2获取的固定流量阈值下历史网络故障初始概率、本时段固定阈值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率,得出下一个时段阈值不变网络故障占采集数据占比、下一个时段阈值不变非网络故障占采集数据占比和下一时段阈值不变情况下故障与非故障比例;
步骤三、构建基于贝叶斯的阈值预测模型,基于步骤一部署内容获得预测模型参数,阈值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用中的固定流量阈值,实现连续时间的k8s网络故障预测。
2.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤一在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群;
在中央集群管理服务器上部署主节点Master和历史故障数据库及阈值管理数据库;
在主节点Master通过k8s的API server在中央集群管理服务器上创建一个模型Node节点和一个采集所有Pod网络流量数据的采集Node节点;
在采集Node节点部署采集数据库;
在模型节点上部署网络预警模型和阈值预测模型。
3.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤三构建基于贝叶斯的阈值预测模型,访问部署在中央集群管理服务器上的阈值管理数据库和历史告警数据库结合分析,获得模型参数,具体的:
所述阈值预测模型为:
P(A|B)=(P(B|A)*P(A))/P(B|A)P(A)+P(B|A')P(A')
其中,模型各参数为:
P(B|A)为网络预警模型连续学习过程中曾经使用过几次当前阈值/阈值数据库总条数结果的概率;
P(A)是忽略其它因素,使用当前阈值的故障总条数/历史故障总条数;
P(B|A')为阈值数据库阈值在历史故障数据库出现过的概率;
P(A')=1-P(A)。
4.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤三将历史阈值中除当前使用之外的每个阈值逐一输入阈值预测模型,获得阈值使用概率,采用使用概率最大的阈值代替马网络预警模型使用中的固定流量阈值,实现连续时间的k8s网络故障预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210596149.5A CN115037634B (zh) | 2022-05-30 | 2022-05-30 | 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210596149.5A CN115037634B (zh) | 2022-05-30 | 2022-05-30 | 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115037634A CN115037634A (zh) | 2022-09-09 |
CN115037634B true CN115037634B (zh) | 2024-04-16 |
Family
ID=83120764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210596149.5A Active CN115037634B (zh) | 2022-05-30 | 2022-05-30 | 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115037634B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101651568A (zh) * | 2009-07-01 | 2010-02-17 | 青岛农业大学 | 一种网络流量预测和异常检测方法 |
CN108320040A (zh) * | 2017-01-17 | 2018-07-24 | 国网重庆市电力公司 | 基于贝叶斯网络优化算法的采集终端故障预测方法及系统 |
CN109635854A (zh) * | 2018-11-26 | 2019-04-16 | 国网冀北电力有限公司 | 基于马尔科夫链的充电桩故障预测方法及装置 |
CN109951327A (zh) * | 2019-03-05 | 2019-06-28 | 南京信息职业技术学院 | 一种基于贝叶斯混合模型的网络故障数据合成方法 |
CN109981358A (zh) * | 2019-03-13 | 2019-07-05 | 南京理工大学 | 一种基于组合模型的自适应网络性能预警方法 |
CN110224850A (zh) * | 2019-04-19 | 2019-09-10 | 北京亿阳信通科技有限公司 | 电信网络故障预警方法、装置及终端设备 |
CN110460458A (zh) * | 2019-04-15 | 2019-11-15 | 清华大学深圳研究生院 | 基于多阶马尔科夫链的流量异常检测方法 |
CN110730099A (zh) * | 2019-10-21 | 2020-01-24 | 电子科技大学 | 基于历史流量数据时间序列的流量预测方法 |
CN112132195A (zh) * | 2020-09-14 | 2020-12-25 | 江西山水光电科技股份有限公司 | 一种利用马尔科夫模型分析与预测机房故障的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7593906B2 (en) * | 2006-07-31 | 2009-09-22 | Microsoft Corporation | Bayesian probability accuracy improvements for web traffic predictions |
-
2022
- 2022-05-30 CN CN202210596149.5A patent/CN115037634B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101651568A (zh) * | 2009-07-01 | 2010-02-17 | 青岛农业大学 | 一种网络流量预测和异常检测方法 |
CN108320040A (zh) * | 2017-01-17 | 2018-07-24 | 国网重庆市电力公司 | 基于贝叶斯网络优化算法的采集终端故障预测方法及系统 |
CN109635854A (zh) * | 2018-11-26 | 2019-04-16 | 国网冀北电力有限公司 | 基于马尔科夫链的充电桩故障预测方法及装置 |
CN109951327A (zh) * | 2019-03-05 | 2019-06-28 | 南京信息职业技术学院 | 一种基于贝叶斯混合模型的网络故障数据合成方法 |
CN109981358A (zh) * | 2019-03-13 | 2019-07-05 | 南京理工大学 | 一种基于组合模型的自适应网络性能预警方法 |
CN110460458A (zh) * | 2019-04-15 | 2019-11-15 | 清华大学深圳研究生院 | 基于多阶马尔科夫链的流量异常检测方法 |
CN110224850A (zh) * | 2019-04-19 | 2019-09-10 | 北京亿阳信通科技有限公司 | 电信网络故障预警方法、装置及终端设备 |
CN110730099A (zh) * | 2019-10-21 | 2020-01-24 | 电子科技大学 | 基于历史流量数据时间序列的流量预测方法 |
CN112132195A (zh) * | 2020-09-14 | 2020-12-25 | 江西山水光电科技股份有限公司 | 一种利用马尔科夫模型分析与预测机房故障的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115037634A (zh) | 2022-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110389838B (zh) | 一种适用于虚拟资源的实时调度和在线迁移管控方法 | |
CN112104751B (zh) | 调控云数据处理方法、装置及系统 | |
CN108549977B (zh) | 基于多Agent的面向订单的柔性生产动态调度系统 | |
CN105205231B (zh) | 一种基于dcom的配电网数字仿真系统 | |
CN110794800B (zh) | 一种智慧工厂信息管理的监控系统 | |
CN112600891A (zh) | 一种基于信息物理融合的边云协同系统及工作方法 | |
CN106919153A (zh) | 星载电子设备综合化系统管控架构 | |
CN112214280A (zh) | 一种电力系统仿真的云化方法及系统 | |
JP2689836B2 (ja) | 監視制御方法及び監視制御システム | |
CN118092404B (zh) | 一种基于人工智能的plc控制器网络预防性维护方法及系统 | |
CN113516244B (zh) | 一种智能运维方法、装置、电子设备及存储介质 | |
Sanislav et al. | Multi-agent architecture for reliable Cyber-Physical Systems (CPS) | |
Moghaddam et al. | Ias: an iot architectural self-adaptation framework | |
CN111767145A (zh) | 容器调度系统、方法、装置和设备 | |
CN115037634B (zh) | 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 | |
Pinzón et al. | Real-time health condition monitoring of SCADA infrastructure of power transmission systems control centers | |
CN115037769B (zh) | 一种基于soa的空中交通管制自动化系统及其实现方法 | |
CN107528709A (zh) | 一种配置状态回退方法和装置 | |
Lv et al. | Edge asset management based on administration shell in industrial cyber-physical systems | |
CN112348209B (zh) | 列车组运维系统及方法、电子设备及可读存储介质 | |
CN114118548A (zh) | 一种隧道掘进机维修资源协同调度方法及系统 | |
CN114792045A (zh) | 一种边缘计算的数字孪生方法和系统 | |
CN118869512A (zh) | 一种边缘计算场景下变电设备预测性维护系统及方法 | |
WO2024179066A1 (zh) | 用于轨道交通系统的工业互联网平台、方法及存储介质 | |
McCalley et al. | Integrated decision algorithms for auto-steered electric transmission system asset management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |