CN115037634A - 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 - Google Patents

一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 Download PDF

Info

Publication number
CN115037634A
CN115037634A CN202210596149.5A CN202210596149A CN115037634A CN 115037634 A CN115037634 A CN 115037634A CN 202210596149 A CN202210596149 A CN 202210596149A CN 115037634 A CN115037634 A CN 115037634A
Authority
CN
China
Prior art keywords
network
fault
threshold
model
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210596149.5A
Other languages
English (en)
Other versions
CN115037634B (zh
Inventor
朱文进
王玉梁
房杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Digital Intelligence Technology Co Ltd
Original Assignee
China Telecom Digital Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Digital Intelligence Technology Co Ltd filed Critical China Telecom Digital Intelligence Technology Co Ltd
Priority to CN202210596149.5A priority Critical patent/CN115037634B/zh
Publication of CN115037634A publication Critical patent/CN115037634A/zh
Application granted granted Critical
Publication of CN115037634B publication Critical patent/CN115037634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,包括:在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相关节点、数据库和模型;构建使用固定流量阈值的基于马尔可夫链的网络预警模型,获得模型训练参数数据;构建基于贝叶斯的阈值预测模型,获得预测模型参数,阈值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用中的固定流量阈值,实现连续时间的k8s网络故障预测。本发明采用贝叶斯阈值预测模型调整监控阈值来解决马尔科夫链的网络预警模型稳态分布的方法不能实现对连续时间马尔科夫链的计算从而造成对网络预警模型预测失真的问题。

Description

一种基于马氏链和贝叶斯网络的k8s网络故障预测方法
技术领域
本发明属于网络故障预警技术领域,具体涉及一种基于马氏链和贝叶斯网络的k8s网络 故障预测方法。
背景技术
随着数字化发展的逐渐深入,各单位的在运设备也在逐渐增加。相较于十年前,设备增 长了10~100倍,即便运维已经在从手工运维向工具运维和平台运维发展,但仍然无法满足当 前集群对运维管理要求及集群之间数据互通的高效处理。
机房运维场景下存在集群业务规模大,应用关系复杂,依赖层次多,排查问题困难的问 题,现有技术很难预测未来时间段内各集群网络流量趋势、运维压力的情况,无法实现多集 群中网络预警及分析。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于马氏链和贝叶斯 网络的k8s网络故障预测方法,引入基于马尔科夫链的网络预警模型,通过该模型可更加智 能的预测集群未来时间段内的网络运行情况;并通过贝叶斯概率预测动态管理网络流量阈值, 来调整马尔科夫链的网络预警模型状态变化最终趋于平稳分布后对网络预警模型预测失真的 问题。
为实现上述技术目的,本发明采取的技术方案为:
一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,包括:
步骤一、在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相 关节点、数据库和模型;
步骤二、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,基于步骤一部署内 容获得模型训练参数数据;
步骤三、构建基于贝叶斯的阈值预测模型,基于步骤一部署内容获得预测模型参数,阈 值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用 中的固定流量阈值,实现连续时间的k8s网络故障预测。
为优化上述技术方案,采取的具体措施还包括:
上述的步骤一在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群;
在中央集群管理服务器上部署主节点Master和历史故障数据库及阈值管理数据库;
在主节点Master通过k8s的API server在中央集群管理服务器上创建一个模型Node节点 和一个采集所有Pod网络流量数据的采集Node节点;
在采集Node节点部署采集数据库;
在模型节点上部署网络预警模型和阈值预测模型。
上述的步骤二包括:
S1、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,其对应的马尔可夫转移 概率矩阵模型公式为:
X(k+1)=X(k)×P
式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵, X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量;
S2、通过访问采集数据库和历史故障数据库获得参数生成矩形集合,所述参数包括固定 流量阈值下历史网络故障初始概率、本时段固定阈值下网络故障转移到非故障概率、本时段 固定阈值下非网络故障转移到故障概率;
S3、网络预警模型基于S2获取的固定流量阈值下历史网络故障初始概率、本时段固定阈 值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率,得出下一 个时段阈值不变网络故障占采集数据占比、下一个时段阈值不变非网络故障占采集数据占比 和下一时段阈值不变情况下故障与非故障比例。
上述的S2中,具体参数获取方式为:
1)、固定流量阈值下历史网络故障初始概率=(N)/(N+C);
N=从历史故障数据库获取符合指定阈值条件的网络故障数据总条数;
C=从采集数据库获取符合指定阈值条件的网络采集数据总条数;
2)、本时段固定流量阈值下网络故障转移到非故障概率=|(S%-H%)|x本时间段内采 集总条数/S;
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时 间段内采集总条数;
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数 据总条数/本时间段内采集总条数;
S=本时间段内故障未恢复数据总条数;
3)、本时段固定流量阈值下非网络故障转移到故障概率=(|(S%-H%)|x本时间段内 采集总条数)/(本时间段内采集总条数-本时间段内故障未恢复数据总条数)。
上述的步骤三构建基于贝叶斯的阈值预测模型,访问部署在中央集群管理服务器上的阈 值管理数据库和历史告警数据库结合分析,获得模型参数,具体的:
所述阈值预测模型为:
P(A|B)=(P(B|A)*P(A))/P(B|A)P(A)+P(B|A')P(A')
其中,模型各参数为:
P(B|A)为网络预警模型连续学习过程中曾经使用过几次当前阈值/阈值数据库总条数结果 的概率;
P(A)是忽略其它因素,使用当前阈值的故障总条数/历史故障总条数;
P(B|A')为阈值数据库阈值在历史故障数据库出现过的概率;
P(A')=1-P(A)。
上述的步骤三将历史阈值中除当前使用之外的每个阈值逐一输入阈值预测模型,获得阈 值使用概率,采用使用概率最大的阈值代替马网络预警模型使用中的固定流量阈值,实现连 续时间的k8s网络故障预测。
本发明具有以下有益效果:
本发明突出了人工智能在集群中网络预警及阈值智能管控的地位,创造性地采用贝叶斯 阈值预测模型调整监控阈值来解决马尔科夫链的网络预警模型稳态分布的方法不能实现对连 续时间马尔科夫链的计算从而造成对网络预警模型预测失真的问题;同时,运用马尔科夫链 和贝叶斯网络从纵横两个方面对网络故障做了比较全面的分析和预测,创新性的处理了马尔 科夫链在处理上层指标缺失这个方面的不足;其中,马尔科夫链是探索由样本所决定的在未 来时间里变量的概率分布,是一种纵向预测的方法,贝叶斯网络监测阈值则展示出故障与阈 值指标之间的相互影响关系,是一种横向预测方法;本发明结合这两种方法有一个优势在于 可以解决多层指标体系的非底层指标数据缺乏的问题,以实现宏观意义上的故障预测。贝叶 斯贝叶斯网络监测阈值的反推功能也为网络故障风险控制提供了基础;
本发明突出了人工智能在k8s集群之间Pod业务数据对网络及网络设备负载及压力的概 率预测的优势,解决了现有IT业务系统的多集群数据共同参与运算且集群之间数据可灵活控 制与调度参与分析及运算的技术问题;
本发明采用人工智能通过主机管理k8s集群的方式满足跨k8s集群管理需求的技术问题, 通过日志分析判定集群间关联关系并生成关联标识放入配置文件。提高了Pod调度的灵活性, 为Pod节点在跨集群拓扑数据互通、集群之间业务数据交互、及集群资源消耗概率预测、灵 活配置及调度提供了一种可行性方法。
附图说明
图1是本发明的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法的流程图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细描述。
参见图1,本发明一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,包括:
步骤一、在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相 关节点、数据库和模型。
集群管理服务器所在网络节点简称,集群中央管理节点。中央调度集群主要包括三个对 象Master(主节点)、Node(节点)、Pod。
首先,在中央集群管理服务器上部署Master(主节点)和历史故障数据库及阈值管理数 据库。
其次,在Master(主节点)通过k8s的API server在中央集群管理服务器上创建一个模 型Node节点和一个采集所有Pod网络流量数据的采集Node节点。在采集Node节点部署采 集数据库。
最后,在模型节点上部署【网络预警模型】和【阈值预测模型】。
步骤二、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,基于步骤一部署内 容获得模型训练参数数据;
可访问部署在中央集群管理服务器上的历史故障数据库,获得模型训练初始概率和移动 概率数据。
具体描述:
S1、马尔可夫转移概率矩阵模型公式
X(k+1)=X(k)×P
公式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵, X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量。
S2、通过访问采集数据库和历史故障数据库获得参数生成矩形集合
历史网络故障初始概率【0.3、0.7】
下一时间段网络故障转移到非故障概率【0.6、0.4】
下一时间段网络非故障转移到故障概率【0.3、0.7】
矩形集合形如:
Figure BDA0003668122350000051
具体参数获取描述
1、固定流量阈值下历史网络故障初始概率
N=从历史故障数据库获取符合指定阈值条件的网络故障数据总条数。
C=从采集数据库获取符合指定阈值条件的网络采集数据总条数。
例如:N=30条符合指定阈值条件的网络故障数据
C=70条符合指定阈值条件的网络采集数据
网络故障初始概率=(N)/(N+C)=30%
网络故障初始概率【0.3 0.7】
2、本时段固定流量阈值下网络故障转移到非故障概率
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时 间段内采集总条数(历史网络故障数据)
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数 据总条数/本时间段内采集总条数(实时未恢复网络故障数据)
H=本时间段内历史网络故障数据总条数
S=本时间段内故障未恢复数据总条数
1、如果(S%-H%)<0表示实时未恢复网络故障有部分转移到非故障。(S%-H%)由于 实时未恢复网络故障转移到非故障概率只关注实时未恢复网络故障转移概率。因此只获取 (S%-H%)小于0部分参与计算。
本时段固定阈值下网络故障转移到非故障概率:
公式:|(S%-H%)|x本时间段内采集总条数/S
注:(/=除号、|=取绝对值)
非故障转移到未恢复故障概率=【0.4 0.6】
3、本时段固定流量阈值下非网络故障转移到故障概率
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时 间段内采集总条数(历史网络故障数据)
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数 据总条数/本时间段内采集总条数(实时未恢复网络故障数据)
H=本时间段内历史网络故障数据总条数
S=本时间段内故障未恢复数据总条数
1、如果(S%-H%)>0表示实时未恢复网络故障有数量增加,部分来自采集监测数据转 移。(S%-H%)由于非故障概率转移到实时未恢复网络故障只关注非故障转移概率。因此只 获取(S%-H%)大于0部分参与计算。
本时段固定阈值下非故障转移到未恢复故障概率:
公式:(|(S%-H%)|x本时间段内采集总条数)/(本时间段内采集总条数-本时间段 内故障未恢复数据总条数)
注:(/=除号、||)=取绝对值)
非故障转移到未恢复故障概率=【0.3 0.7】
S3、网络预警模型基于S2获取的固定流量阈值下历史网络故障初始概率、本时段固定阈 值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率,得出下一 个时段阈值不变网络故障占采集数据占比、下一个时段阈值不变非网络故障占采集数据占比 和下一时段阈值不变情况下故障与非故障比例。
固定流量阈值下历史网络故障初始概率【0.3、0.7】
本时段固定阈值下网络故障转移到非故障概率【0.6、0.4】
本时段固定阈值下非网络故障转移到故障概率【0.3、0.7】
通过模型计算得出:X(k+1)=X(k)×P
下一个时段固定阈值下网络故障占采集数据占比0.3x0.6+0.3x0.7=0.39
下一个时段固定阈值下非网络故障占采集数据占比0.3x0.4+7x0.7=0.61
下一时段固定阈值下故障与非故障比例【0.39 0.61】
步骤三、构建基于贝叶斯的阈值预测模型,基于步骤一部署内容获得预测模型参数,阈 值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用 中的固定流量阈值,实现连续时间的k8s网络故障预测。
可访问部署在中央集群管理服务器上的阈值管理数据库和历史告警数据库,获得模型参 数【先验概率】【条件概率】【调整因子】。
将【先验概率】【条件概率】【调整因子】放入模型运算。运算结果做为下一时段马尔可夫链【网络预警模型】平稳状态分布后,由于故障与非故障比例持续为类似【0.5 0.5】数值且持续相同。从而不能实现对连续时间马尔科夫链的计算。因此需要通过调整对采集的网 络数据进行阈值变动从而生成新的故障数据,而故障阈值的调整则通过结合贝叶斯【阈值预 测模型】分析历史故障数据得出更符合当前业务特征的故障阈值。
模型公式及举例:
P(A|B)=(P(B|A)*P(A))/P(B|A)P(A)+P(B|A')P(A')
【先验概率】=P(A)【条件概率】=P(B)【调整因子】=P(B|A)x P(A)
P(A)是忽略其它因素,使用当前阈值的故障总条数/历史故障总条数例如:40%;
P(A')1-P(A),在这里是60%;
P(B|A)【网络预警模型】连续学习过程中曾经使用过几次当前阈值/阈值数据库总条数结 果的概率,在这里是50%;
P(B|A')阈值数据库阈值在历史故障数据库出现过的概率,如果历史阈值都在历史故障数 据库有应用在这里是100%;
P(B)是忽略其它因素,直接考虑阈值使用概率公式
P(B)=P(B|A)P(A)+P(B|A')P(A'),在这里是0.5*0.4+1*0.6=0.8;
那么根据贝叶斯公式,可以计算得到,也就是
P(A|B)=(0.5*0.4)/(0.8)=0.25
将历史阈值中除当前使用之外的每个阈值逐一放入贝叶斯【阈值预测模型】获得阈值使 用概率,数值最大的阈值做为马尔可夫链【网络预警模型】平稳状态分布后,不能实现对连 续时间马尔科夫链的计算。从而代替使用中的固定流量阈值。从而完成整个【网络预警模型】 的持续运算。
本发明所用到的缩略语和关键术语定义如下:
Kubernetes Kubernetes,简称k8s或者“kube”,是一个开源的Linux容器自动化运维 平台,它消除了容器化应用程序在部署、伸缩时涉及到的许多手动操作。换句话说,可以将 多台主机组合成集群来运行Linux容器,而k8s可以帮助你简单高效地管理那些集群。构成这些集群的主机还可以跨越公有云、私有云以及混合云。
·Master(主节点):控制k8s节点的机器,也是创建作业任务的地方。
·Node(节点):这些机器在k8s主节点的控制下执行被分配的任务。
·Pod:由一个或多个容器构成的集合,作为一个整体被部署到一个单一节点。同一个 pod中的容器共享IP地址、进程间通讯(IPC)、主机名以及其它资源。Pod将底层容器的网络和存储抽象出来,使得集群内的容器迁移更为便捷。
马尔可夫链法(Markov chain method)亦称马尔可夫预测分析.把经济事态的演变设想为有 限马尔可夫链的预测方法.所谓有限马尔可夫链是指只取有限种状态的无后效性的随机过程. 例如,某种股票的隔日价格变化可以有涨和跌两种状态.如果认为它是按马尔可夫链的规律来 变化的,那么其变化规律就由一个2X2的状态转移矩阵来决定.这个矩阵的四个元素是继续上 涨的概率、涨转跌的概率、跌转涨的概率、继续下跌的概率.根据统计资料,可以对这四种概 率有一个估计.由此就可根据以往的股市,来预测明天以至若干天后的该股票价格的涨跌的概 率.马尔可夫链法常用于各种市场预测。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于 本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术 人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (6)

1.一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,包括:
步骤一、在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群,部署相关节点、数据库和模型;
步骤二、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,基于步骤一部署内容获得模型训练参数数据;
步骤三、构建基于贝叶斯的阈值预测模型,基于步骤一部署内容获得预测模型参数,阈值预测模型分析历史故障数据得出更符合当前业务特征的故障阈值代替马网络预警模型使用中的固定流量阈值,实现连续时间的k8s网络故障预测。
2.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤一在组网内的中央集群管理服务器上创建一个基于k8s的中央调度集群;
在中央集群管理服务器上部署主节点Master和历史故障数据库及阈值管理数据库;
在主节点Master通过k8s的API server在中央集群管理服务器上创建一个模型Node节点和一个采集所有Pod网络流量数据的采集Node节点;
在采集Node节点部署采集数据库;
在模型节点上部署网络预警模型和阈值预测模型。
3.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤二包括:
S1、构建使用固定流量阈值的基于马尔可夫链的网络预警模型,其对应的马尔可夫转移概率矩阵模型公式为:
X(k+1)=X(k)×P
式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵,X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量;
S2、通过访问采集数据库和历史故障数据库获得参数生成矩形集合,所述参数包括固定流量阈值下历史网络故障初始概率、本时段固定阈值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率;
S3、网络预警模型基于S2获取的固定流量阈值下历史网络故障初始概率、本时段固定阈值下网络故障转移到非故障概率、本时段固定阈值下非网络故障转移到故障概率,得出下一个时段阈值不变网络故障占采集数据占比、下一个时段阈值不变非网络故障占采集数据占比和下一时段阈值不变情况下故障与非故障比例。
4.根据权利要求3所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述S2中,具体参数获取方式为:
1)、固定流量阈值下历史网络故障初始概率=(N)/(N+C);
N=从历史故障数据库获取符合指定阈值条件的网络故障数据总条数;
C=从采集数据库获取符合指定阈值条件的网络采集数据总条数;
2)、本时段固定流量阈值下网络故障转移到非故障概率=|(S%-H%)|x本时间段内采集总条数/S;
H%=从历史故障数据库获取本时间段内符合指定阈值条件的网络故障数据总条数/本时间段内采集总条数;
S%=从采集数据库获取本时间段内符合指定阈值条件的发生且故障未恢复的网络采集数据总条数/本时间段内采集总条数;
S=本时间段内故障未恢复数据总条数;
3)、本时段固定流量阈值下非网络故障转移到故障概率=(|(S%-H%)|x本时间段内采集总条数)/(本时间段内采集总条数-本时间段内故障未恢复数据总条数)。
5.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤三构建基于贝叶斯的阈值预测模型,访问部署在中央集群管理服务器上的阈值管理数据库和历史告警数据库结合分析,获得模型参数,具体的:
所述阈值预测模型为:
P(A|B)=(P(B|A)*P(A))/P(B|A)P(A)+P(B|A')P(A')
其中,模型各参数为:
P(B|A)为网络预警模型连续学习过程中曾经使用过几次当前阈值/阈值数据库总条数结果的概率;
P(A)是忽略其它因素,使用当前阈值的故障总条数/历史故障总条数;
P(B|A')为阈值数据库阈值在历史故障数据库出现过的概率;
P(A')=1-P(A)。
6.根据权利要求1所述的一种基于马氏链和贝叶斯网络的k8s网络故障预测方法,其特征在于,所述步骤三将历史阈值中除当前使用之外的每个阈值逐一输入阈值预测模型,获得阈值使用概率,采用使用概率最大的阈值代替马网络预警模型使用中的固定流量阈值,实现连续时间的k8s网络故障预测。
CN202210596149.5A 2022-05-30 2022-05-30 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法 Active CN115037634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210596149.5A CN115037634B (zh) 2022-05-30 2022-05-30 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210596149.5A CN115037634B (zh) 2022-05-30 2022-05-30 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法

Publications (2)

Publication Number Publication Date
CN115037634A true CN115037634A (zh) 2022-09-09
CN115037634B CN115037634B (zh) 2024-04-16

Family

ID=83120764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210596149.5A Active CN115037634B (zh) 2022-05-30 2022-05-30 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法

Country Status (1)

Country Link
CN (1) CN115037634B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080027890A1 (en) * 2006-07-31 2008-01-31 Microsoft Corporation Bayesian probability accuracy improvements for web traffic predictions
CN101651568A (zh) * 2009-07-01 2010-02-17 青岛农业大学 一种网络流量预测和异常检测方法
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及系统
CN109635854A (zh) * 2018-11-26 2019-04-16 国网冀北电力有限公司 基于马尔科夫链的充电桩故障预测方法及装置
CN109951327A (zh) * 2019-03-05 2019-06-28 南京信息职业技术学院 一种基于贝叶斯混合模型的网络故障数据合成方法
CN109981358A (zh) * 2019-03-13 2019-07-05 南京理工大学 一种基于组合模型的自适应网络性能预警方法
CN110224850A (zh) * 2019-04-19 2019-09-10 北京亿阳信通科技有限公司 电信网络故障预警方法、装置及终端设备
CN110460458A (zh) * 2019-04-15 2019-11-15 清华大学深圳研究生院 基于多阶马尔科夫链的流量异常检测方法
CN110730099A (zh) * 2019-10-21 2020-01-24 电子科技大学 基于历史流量数据时间序列的流量预测方法
CN112132195A (zh) * 2020-09-14 2020-12-25 江西山水光电科技股份有限公司 一种利用马尔科夫模型分析与预测机房故障的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080027890A1 (en) * 2006-07-31 2008-01-31 Microsoft Corporation Bayesian probability accuracy improvements for web traffic predictions
CN101651568A (zh) * 2009-07-01 2010-02-17 青岛农业大学 一种网络流量预测和异常检测方法
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及系统
CN109635854A (zh) * 2018-11-26 2019-04-16 国网冀北电力有限公司 基于马尔科夫链的充电桩故障预测方法及装置
CN109951327A (zh) * 2019-03-05 2019-06-28 南京信息职业技术学院 一种基于贝叶斯混合模型的网络故障数据合成方法
CN109981358A (zh) * 2019-03-13 2019-07-05 南京理工大学 一种基于组合模型的自适应网络性能预警方法
CN110460458A (zh) * 2019-04-15 2019-11-15 清华大学深圳研究生院 基于多阶马尔科夫链的流量异常检测方法
CN110224850A (zh) * 2019-04-19 2019-09-10 北京亿阳信通科技有限公司 电信网络故障预警方法、装置及终端设备
CN110730099A (zh) * 2019-10-21 2020-01-24 电子科技大学 基于历史流量数据时间序列的流量预测方法
CN112132195A (zh) * 2020-09-14 2020-12-25 江西山水光电科技股份有限公司 一种利用马尔科夫模型分析与预测机房故障的方法

Also Published As

Publication number Publication date
CN115037634B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN111368888B (zh) 基于深度动态贝叶斯网络的服务功能链故障诊断方法
Ghobaei-Arani et al. A cost-efficient IoT service placement approach using whale optimization algorithm in fog computing environment
CN108900358B (zh) 基于深度信念网络资源需求预测的虚拟网络功能动态迁移方法
CN112104751B (zh) 调控云数据处理方法、装置及系统
TWI725744B (zh) 透過多層次相關性建立系統資源預測及資源管理模型的方法
CN113259355B (zh) 一种基于sdn的工业互联网标识切片管理系统
CN113341712B (zh) 无人机自主控制系统智能分层递阶控制选择方法
JP7401677B2 (ja) モデル更新システム、モデル更新方法及び関連装置
CN114675956B (zh) 一种基于Kubernetes集群之间Pod配置及调度的方法
Yaghoobirafi et al. An autonomic mechanism based on ant colony pattern for detecting the source of incidents in complex enterprise systems
Pinzón et al. Real-time health condition monitoring of SCADA infrastructure of power transmission systems control centers
CN115037634A (zh) 一种基于马氏链和贝叶斯网络的k8s网络故障预测方法
Rahman et al. Auto-scaling network resources using machine learning to improve qos and reduce cost
CN115037769B (zh) 一种基于soa的空中交通管制自动化系统及其实现方法
Chen et al. Research on network management technology of power line carrier communication in low-voltage distribution network based on digital twin
CN116089079A (zh) 一种基于大数据的计算机资源分配管理系统及方法
CN116109058A (zh) 一种基于深度强化学习的变电站巡视管理方法和装置
CN115562841A (zh) 一种云视频服务自适应资源调度系统和方法
CN114757448A (zh) 一种基于数据空间模型的制造环节间最优价值链构建方法
CN113327033A (zh) 配电网故障诊断方法及系统
Sengupta et al. Collaborative learning-based schema for predicting resource usage and performance in F2C paradigm
Addis et al. Function placement and acceleration for in-network federated learning services
CN115396495B (zh) 一种sdn-fog环境下工厂微服务体系的故障应对方法
Balouek-Thomert et al. Evaluating policy-driven adaptation on the edge-to-cloud continuum
Atwal et al. DeepSDN: connecting the dots towards self-driving networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant