WO2023231192A1

WO2023231192A1 - 一种基于SRv6的智能网络及设备故障预测方法及系统

Info

Publication number: WO2023231192A1
Application number: PCT/CN2022/114154
Authority: WO
Inventors: 朱文进; 杜忠田; 王宏昊; 王玉梁; 刘少卿; 房杰
Original assignee: 中电信数智科技有限公司
Priority date: 2022-05-31
Filing date: 2022-08-23
Publication date: 2023-12-07
Also published as: CN114978930A

Abstract

本发明公开了一种基于SRv6的智能网络及设备故障预测方法及系统，方法为：数据采集模块采集基于SRv6的网络数据和网络设备基础监控项，并将采集数据存入采集数据库；贝叶斯状态转移概率模型对采集数据库和历史告警数据库数据进行分析计算，得出本次和下次网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率；基于马尔可夫链转移概率矩阵模型，根据步骤二得到的概率构建马尔可夫链网络转移概率矩阵和马尔可夫链设备转移概率矩阵，对智能网络及设备故障进行预测。本发明通过多模型融合，以及多数据源的融合，提高了缺陷监测指标预测精度。

Description

一种基于SRv6的智能网络及设备故障预测方法及系统

技术领域

本发明属于网络故障预测技术领域，具体涉及一种基于SRv6的智能网络及设备故障预测方法及系统。

背景技术

随着数字化发展的逐渐深入，全球SRv6网的在运设备逐渐增加，相较于十年前，设备增长了10～100倍。即便运维已经在从手工运维向工具运维和平台运维发展，但仍然无法满足当前超大型组网、服务器、应用对运维监测要求。机房运维场景下网络业务规模大，应用关系复杂，依赖层次多，排查问题困难。如此大的规模下，靠人工经验、自动化运维去监测网络设备就成为了制约运维工作的技术瓶颈。

现有技术很难达到在SRv6组网监测过程中，网络设备、服务器、应用结合的问题，从而造成无法快速了解SRv6网络节点之间、网络节点与服务器之间、服务器与应用之间的综合情况。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足，提供一种基于SRv6的智能网络及设备故障预测方法及系统。

为实现上述技术目的，本发明采取的技术方案为：

一种基于SRv6的智能网络及设备故障预测方法，包括：

步骤一、数据采集模块采集基于SRv6的网络数据和网络设备基础监控项，并将采集数据存入采集数据库；

步骤二：贝叶斯状态转移概率模型对采集数据库和历史告警数据库数据进行分析计算，得出本次和下次网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率；

步骤三、基于马尔可夫链转移概率矩阵模型，根据步骤二得到的概率构建马尔可夫链网络转移概率矩阵和马尔可夫链设备转移概率矩阵，对智能网络及设备故障进行预测。

为优化上述技术方案，采取的具体措施还包括：

上述的步骤一包括：

1)数据采集模块采集网络数据：

通过采集程序执行rping命令获得网络设备到网络出口设备通过的每段SRv6节点相邻的网络丢包数、延迟毫秒数；

并通过snmp命令采集每段SRv6节点之间的网络流量；

2)数据采集模块采集网络设备基础监控项：

通过采集程序执行snmp命令采集网络设备各板卡上的CPU使用率、内存占用率、硬盘使用率；

3)将采集到的网络数据和网络设备基础监控项存入采集数据库。

上述的步骤二包括：

S1、构建用于计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的贝叶斯状态转移概率模型：

模型公式为：QZ(D|+)＝QZ(+|D)QZ(D)/(QZ(+|D)QZ(D)+QZ(+|N)QZ(N))；

S2、基于采集数据库和历史告警数据库数据计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的先验概率；

S3、基于采集数据库和历史告警数据库数据计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的条件概率；

S4、基于采集数据库和历史告警数据库数据计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的调整因子

S5、将网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的先验概率、条件概率、调整因子分别放入S1构建的模型公式中，得到本次和下次网络及设备的状态转移初始概率和转移概率，即本次和下次网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率。

上述的S2中，网络状态转移初始概率先验概率包括：

1)采集数据库的SRv6节点之间网络流量非故障总数；

2)采集数据库的SRv6节点之间网络延迟毫秒非故障总数；

3)采集数据库的SRv6节点之间网络丢包非故障数总数；

网络状态转移概率先验概率包括：

1)历史告警数据库2个SRv6节点之间网络流量故障总数；

2)延迟毫秒故障总数；

3)丢包故障数总数；

设备状态转移初始概率先验概率包括：

1)采集数据库设备CPU使用率非故障总数；

2)采集数据库内存占用率非故障总数；

3)采集数据库硬盘使用率非故障总数；

设备状态转移概率先验概率包括：

1)历史告警数据库设备CPU使用率故障总数；

2)内存占用率故障总数；

3)硬盘使用率故障总数。

上述的S3中，网络状态转移初始概率条件概率包括：

1)采集数据库的SRv6节点之间网络流量非故障总数；

2)采集数据库的SRv6节点间网络延迟毫秒非故障总数；

3)采集数据库的SRv6节点之间网络丢包非故障数总数；

网络状态转移概率条件概率包括：

1)历史告警数据库SRv6节点之间网络流量故障按IN和OUT方向统计流量占比；

2)历史告警数据库SRv6节点之间网络流量延迟故障按100毫秒以下和100毫秒以上统计故障占比；

3)历史告警数据库SRv6节点之间网络流量丢包故障按丢包比例60％以下和60％以上统计故障占比；

设备状态转移初始概率条件概率包括：

1)采集数据库设备按所在板卡划分CPU使用率占比；

2)采集数据库设备按所在板卡划分内存占用率占比；

3)采集数据库设备按所在板卡划分硬盘使用率占比；

设备状态转移概率条件概率包括：

1)历史告警数据库设备按所在板卡划分CPU使用率占比；

2)历史告警数据库设备按所在板卡划分内存占用率占比；

3)历史告警数据库设备按所在板卡划分硬盘使用率占比。

上述的S4中，网络状态转移初始概率调整因子包括：

1)采集数据库网络流量误报次数/先验概率；

2)采集数据库网络流量延迟误报次数/先验概率；

3)采集数据库网络流量丢包误报次数/先验概率；

网络状态转移概率调整因子包括：

1、历史告警数据库网络流量故障误报次数/先验概率；

2、历史告警数据库网络流量延迟误报次数/先验概率；

3、历史告警数据库网络流量丢包误报次数/先验概率；

设备状态转移初始概率条件概率包括：

1)采集数据库按板卡划分CPU使用率误报次数/先验概率；

2)采集数据库按板卡划分内存占用率误报次数/先验概率；

3)采集数据库按板卡划分硬盘使用率误报次数/先验概率；

设备状态转移概率条件概率包括：

1)历史告警数据库按板卡划分CPU使用率误报次数/先验概率；

2)历史告警数据库按板卡划分内存占用率误报次数/先验概率；

3)历史告警数据库按板卡划分硬盘使用率误报次数/先验概率。

上述的步骤三基于马尔可夫链转移概率矩阵模型，采用网络状态转移初始概率、网络状态转移概率构建马尔可夫链网络转移概率矩阵；

采用设备状态转移初始概率、设备状态转移概率构建马尔可夫链设备转移概率矩阵。

基于SRv6的智能网络及设备故障预测系统，包括数据采集模块、采集数据库、历史告警数据库、贝叶斯状态转移概率模型、马尔可夫链转移概率矩阵模型和及其训练模块，用于实现所述的基于SRv6的智能网络及设备故障预测方法。

本发明具有以下有益效果：

采用rping结合snmp命令进行网络及设备采集，并采用贝叶斯和马尔可夫链算法构建马尔可夫链设备转移概率矩阵对物理设备的多块板卡中的CPU、内存、IO等监测指标根据历史告警数据进行概率预测。同时对网络流量通过构建马尔可夫链网络转移概率矩阵根据历史告警数据进行概率预测，实现物理设备概率预测和网络流量概率预测。

本发明突出了人工智能在故障概率预测领域的地位，采用贝叶斯结合马尔科夫链算法模型相结合，结合采集的多源数据进行监测指标的故障概率预测，使运算模型更加精确，并能够满足大型和超大型SRv6组网内海量IPv6巡检、安全漏扫等场景下可实现性。同时通过对下一时段故障概率预测，更加前瞻性了解组网内各节点与相邻网络丢包和延迟情况，相关服务器及应用未来运行健康趋势情况及可能发生的故障隐匿点，通过多模型融合，以及多数据源的融合，提高了缺陷监测指标预测精度。

附图说明

图1为本发明方法流程图。

具体实施方式

以下结合附图对本发明的实施例作进一步详细描述。

参见图1，本发明一种基于SRv6的智能网络及设备故障预测方法，包括：

数据采集模块包括：rping和snmp监控及采集、数据采集服务器、网络拓扑数据库。

网络数据采集：

首先，通过采集程序执行rping命令获得网络设备到网络出口设备通过的每段SRv6节点相邻的网络丢包数、延迟毫秒数。

并通过snmp命令采集每段SRv6节点之间的网络流量。

重复执行rping和snmp命令得出全部SRv6网络节点及相邻节点之间的网络品质信息(延迟、丢包数等)。

从而得到SRv6组网内源设备到出口网络设备的所经过节点的全路径网络品质数据。

最后将(网络流量、延迟、丢包数)三个监测指标采集到的数据进行分析，分析结果做为马尔科夫链转移概率矩阵模型的训练数据。

网络设备基础监控项采集：

首先，通过采集程序执行snmp命令采集网络设备各板卡上的(CPU使用率、内存占用率、硬盘使用率)。

重复执行snmp命令得出网络设备全部板卡监测数据。

最后将(CPU使用率、内存占用率、硬盘使用率)三个监测指标采集到的数据进行分析，分析结果作为马尔科夫链转移概率矩阵模型的训练数据。

通过贝叶斯公式对采集数据库和历史告警数据库数据分析计算，得出获取网络状态转移概率(网络流量、延迟、丢包数)和设备状态转移概率(CPU使用率、内存占用率、硬盘使用率)下一次监测状态转移概率。

S1、构建【网络状态转移初始概率】、【网络状态转移概率】和【设备状态转移初始概率】、【设备状态转移概率】用的模型公式。

具体描述：得到训练模型的【先验概率】、【条件概率】、【调整因子】参数放入模型进行训练。得到平衡各种指标后的【网络状态转移概率】和【设备状态转移概率】。

公式：QZ(D|+)＝QZ(+|D)QZ(D)/(QZ(+|D)QZ(D)+QZ(+|N)QZ(N))

S2、网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的【先验概率】

一、网络状态转移初始概率先验概率

1、采集数据库的SRv6节点之间网络流量非故障总数

2、采集数据库的SRv6节点之间网络延迟毫秒非故障总数

3、采集数据库的SRv6节点之间网络丢包非故障数总数

二、网络状态转移概率先验概率

1、历史告警数据库2个SRv6节点之间网络流量故障总数

2、延迟毫秒故障总数

3、丢包故障数总数

三、设备状态转移初始概率先验概率

1、采集数据库该设备CPU使用率非故障总数

2、采集数据库内存占用率非故障总数

3、采集数据库硬盘使用率非故障总数。

四、设备状态转移概率先验概率

历史告警数据库该设备CPU使用率故障总数

内存占用率故障总数

硬盘使用率故障总数。

S3、网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的【条件概率】

一、网络状态转移初始概率条件概率

1、采集数据库的SRv6节点之间网络流量非故障总数

2、采集数据库的SRv6节点间网络延迟毫秒非故障总数

3、采集数据库的SRv6节点之间网络丢包非故障数总数

二、网络状态转移概率条件概率

1、历史告警数据库SRv6节点之间网络流量故障按IN和OUT方向统计(流量占比)

2、历史告警数据库SRv6节点之间网络流量延迟故障按100毫秒以下和100毫秒以上统计(故障占比)

3、历史告警数据库SRv6节点之间网络流量丢包故障按丢包比例60％以下和60％以上统计(故障占比)。

三、设备状态转移初始概率条件概率

1、采集数据库该设备按所在板卡划分CPU使用率(占比)。

2、采集数据库该设备按所在板卡划分内存占用率(占比)。

3、采集数据库该设备按所在板卡划分硬盘使用率(占比)。

板卡划分CPU使用率(占比)＝假设，该设备有四块板块。本次采集的CPU使用率占全部该设备采集的CPU使用率总数的(占比)。

注：设备可能有多块板卡且板卡上有cpu、内存及硬盘。

四、设备状态转移概率条件概率

1、历史告警数据库设备按所在板卡划分CPU使用率(占比)。

2、历史告警数据库设备按所在板卡划分内存占用率(占比)。

3、历史告警数据库设备按所在板卡划分硬盘使用率(占比)。

S4、网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的【调整因子】

一、网络状态转移初始概率调整因子

1、采集数据库网络流量误报次数/【先验概率】

2、采集数据库网络流量延迟误报次数/【先验概率】

3、采集数据库网络流量丢包误报次数/【先验概率】

二、网络状态转移概率调整因子

1、历史告警数据库网络流量故障误报次数/【先验概率】

2、历史告警数据库网络流量延迟误报次数/【先验概率】

3、历史告警数据库网络流量丢包误报次数/【先验概率】

三、设备状态转移初始概率条件概率

1、采集数据库按板卡划分CPU使用率误报次数/【先验概率】

2、采集数据库按板卡划分内存占用率误报次数/【先验概率】

3、采集数据库按板卡划分硬盘使用率误报次数/【先验概率】

四、设备状态转移概率条件概率

1、历史告警数据库按板卡划分CPU使用率误报次数/【先验概率】

2、历史告警数据库按板卡划分内存占用率误报次数/【先验概率】

3、历史告警数据库按板卡划分硬盘使用率误报次数/【先验概率】

S5、网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的【先验概率】、【条件概率】、【调整因子】放入模型公式

QZ(D|+)＝QZ(+|D)QZ(D)/(QZ(+|D)QZ(D)+QZ(+|N)QZ(N))

例如：先验概率＝QZ(D|+)＝采集数据库的SRv6节点之间网络流量故障概率

条件概率＝QZ(+|D)＝历史告警数据库SRv6节点之间网络流量故障按IN和OUT方向统计故障总数/采集总数比例(故障+非故障)

调整因子＝QZ(+|N)＝网络流量误报次数/先验概率(误报率)

通过贝叶斯概率预测得到本次和下次网络及设备的状态转移初始概率和转移概率。

马尔可夫链设备转移概率矩阵，用于物理设备概率预测模型；马尔可夫链网络转移概率矩阵，用于网络流量概率预测。

构建马尔可夫链转移概率矩阵模型及训练模块

模型公式：

P(X ⁽ⁿ⁺¹⁾＝i|X ⁽ⁿ⁾＝j，X ^(n-1)＝i _(n-1)，…，X ⁽⁰⁾＝i ₍₀₎)＝P _ij，n≥0

1、马尔可夫链网络转移概率矩阵由网络状态转移初始概率、网络状态转移概率二部分组成

2、马尔可夫链设备转移概率矩阵由设备状态转移初始概率、设备状态转移概率二部分组成

1和2通过步骤三贝叶斯模型得到网络及设备的状态初始转移概率和转移概率。

最终第二次网络及设备巡检各监测指标可能发生故障的概率。

例如：

一、网络状态转移初始概率【x1＝0.6、x2＝0.2、x3＝0.2】

x1＝本次采集网络流量发生故障概率

x2＝本次采集网络延迟发生故障概率

x3＝本次采集网络丢包发生故障概率

二、网络状态转移非初始概率

即：

第一次流量故障x1＝0.6的情况下第二次流量故障概率

【x1＝0.2、x2＝0.3、x3＝0.5】

第一次延迟故障x2＝0.2的情况下第二次延迟故障概率【x1＝0.1、x2＝0.6、x3＝0.3】

第一次丢包故障x3＝0.2的情况下第二次丢包故障概率

【x1＝0.4、x2＝0.5、x3＝0.1】

最后，将初始概率和非初始概率生成矩形数据集合放入【马尔可夫链模型】进行训练。具体步骤描述如下：

矩形集合为：

第一次的转移矩阵【X1＝0.6、X2＝0.2、X3＝0.2】

X1＝0.6的转移矩阵【X1＝0.2、X2＝0.3、X3＝0.5】

X2＝0.2的转移矩阵【X1＝0.1、X2＝0.6、X3＝0.3】

X3＝0.6的转移矩阵【X1＝0.4、X2＝0.5、X3＝0.1】

依据模型公式进行训练：

计算步骤1：

第一次的转移矩阵X1＝0.6乘X1＝0.2+

第一次的转移矩阵X2＝0.2乘X1＝0.1+

第一次的转移矩阵X3＝0.2乘X1＝0.4

第二次网络流量发生故障概率X1＝0.22

计算步骤2：

第一次的转移矩阵X1＝0.6乘X2＝0.3+

第一次的转移矩阵X2＝0.2乘X2＝0.6+

第一次的转移矩阵X3＝0.2乘X2＝0.5

第二次网络延迟发生故障概率X2＝0.4

计算步骤3：

第一次的转移矩阵X1＝0.6乘X3＝0.5+

第一次的转移矩阵X2＝0.2乘X3＝0.3+

第一次的转移矩阵X3＝0.2乘X3＝0.1

第二次网络丢包发生故障概率X3＝0.38

第一次初始概率【0.6、0.2、0.2】

第二次马尔可夫链转移概率矩阵模型训练结果【0.22、0.4、0.38】即，最终第二次网络及设备巡检各监测指标可能发生故障的概率。

本发明所用到的缩略语和关键术语定义如下：

rping：remote ping，在企业局域网络内，负责：“测算几台路由器之间时延和丢包率”。登录到路由器，在路由器而非管理终端(此即remote)上面执行ping(或扩展ping)命令测量到其它router或指定地址的时延和丢包并将结果记录，进行后期的各种分析比较工作。

【rping程序】：采用执行rping命令，测试相邻的两个节点之间平均延迟，完成整条线路的测试，然后对每个相邻节点的平均延迟求和，求出整条线路的延迟。

【网络拓扑数据库】存储所有SRv6网络节点及与之相邻的网络节点之间交互关系。与其相关的还有，【服务拓扑数据库】存储所有服务器、数据库、中间件之间交互关系及服务器CPU、内存、磁盘、进程监测指标。【溯源数据库】存储溯源拓扑即：SRv6组网内相邻网络设备之间、网络设备与服务器、服务器与数据库、服务器与中间件、网络设备与服务器自身的CPU、内存、磁盘、进程等监测信息的交互及关联关系。溯源拓扑数据：对应监测数据信息。

SRv6：SRv6是一种网络转发技术，SR指Segment Routing技术，v6指原生IPv6，SRv6就是IPv6+Segment Routing。

SR-MPLS使用4字节标签标识路径信息，MPLS标签仅能标识标签值、TTL、标签栈底三个信息，无扩展信息能力。与SR MPLS的Segment不同，SRv6的Segment有128bits，而且分成了三部分：

SRv6 SID

Locator(位置标识)：网络中分配给一个网络节点的标识，可以用于路由和转发数据包。Locator有两个重要的属性，可路由和聚合。在SRv6 SID中Locator是一个可变长的部分，用于适配不同规模的网络。

Function(功能)：设备分配给本地转发指令的一个ID值，该值可用于表达需要设备执行的转发动作，相当于计算机指令的操作码。在SRv6网络编程中，不同的转发行为由不同的功能ID来表达。一定程度上功能ID和MPLS标签类似，用于标识VPN转发实例等。

Args(变量)：转发指令在执行的时候所需要的参数，这些参数可能包含流，服务或任何其他相关的可变信息。

总之，SRv6同时具有路由和MPLS两种转发属性，具备TE流量工程能力、扩展性能力、兼容IPv6，也便于未来固移融合，实现IP转发技术统一。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

一种基于SRv6的智能网络及设备故障预测方法，其特征在于，包括：

步骤一、数据采集模块采集基于SRv6的网络数据和网络设备基础监控项，并将采集数据存入采集数据库；

步骤二：贝叶斯状态转移概率模型对采集数据库和历史告警数据库数据进行分析计算，得出本次和下次网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率；

步骤三、基于马尔可夫链转移概率矩阵模型，根据步骤二得到的概率构建马尔可夫链网络转移概率矩阵和马尔可夫链设备转移概率矩阵，对智能网络及设备故障进行预测。
根据权利要求1所述的一种基于SRv6的智能网络及设备故障预测方法，其特征在于，所述步骤一包括：

1)数据采集模块采集网络数据：

通过采集程序执行rping命令获得网络设备到网络出口设备通过的每段SRv6节点相邻的网络丢包数、延迟毫秒数；

并通过snmp命令采集每段SRv6节点之间的网络流量；

2)数据采集模块采集网络设备基础监控项：

通过采集程序执行snmp命令采集网络设备各板卡上的CPU使用率、内存占用率、硬盘使用率；

3)将采集到的网络数据和网络设备基础监控项存入采集数据库。
根据权利要求2所述的一种基于SRv6的智能网络及设备故障预测方法，其特征在于，所述步骤二包括：

S1、构建用于计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的贝叶斯状态转移概率模型：

模型公式为：QZ(D|+)＝QZ(+|D)QZ(D)/(QZ(+|D)QZ(D)+QZ(+|N)QZ(N))；

QZ(D|+)为先验概率，QZ(+|D为条件概率，QZ(+|N)为调整因子；

S2、基于采集数据库和历史告警数据库数据计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的先验概率；

S3、基于采集数据库和历史告警数据库数据计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的条件概率；

S4、基于采集数据库和历史告警数据库数据计算网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的调整因子；

S5、将网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率的先验概率、条件概率、调整因子分别放入S1构建的模型公式中，得到本次和下次网络及设备的状态转移初始概率和转移概率，即本次和下次网络状态转移初始概率、网络状态转移概率和设备状态转移初始概率、设备状态转移概率。
根据权利要求3所述的一种基于SRv6的智能网络及设备故障预测方法，其特征在于，所述S2中，网络状态转移初始概率先验概率包括：

1)采集数据库的SRv6节点之间网络流量非故障总数；

2)采集数据库的SRv6节点之间网络延迟毫秒非故障总数；

3)采集数据库的SRv6节点之间网络丢包非故障数总数；

网络状态转移概率先验概率包括：

1)历史告警数据库2个SRv6节点之间网络流量故障总数；

2)延迟毫秒故障总数；

3)丢包故障数总数；

设备状态转移初始概率先验概率包括：

1)采集数据库设备CPU使用率非故障总数；

2)采集数据库内存占用率非故障总数；

3)采集数据库硬盘使用率非故障总数；

设备状态转移概率先验概率包括：

1)历史告警数据库设备CPU使用率故障总数；

2)内存占用率故障总数；

3)硬盘使用率故障总数。
根据权利要求3所述的一种基于SRv6的智能网络及设备故障预测方法，其特征在于，所述S3中，网络状态转移初始概率条件概率包括：

1)采集数据库的SRv6节点之间网络流量非故障总数；

2)采集数据库的SRv6节点间网络延迟毫秒非故障总数；

3)采集数据库的SRv6节点之间网络丢包非故障数总数；

网络状态转移概率条件概率包括：

1)历史告警数据库SRv6节点之间网络流量故障按IN和OUT方向统计流量占比；

2)历史告警数据库SRv6节点之间网络流量延迟故障按100毫秒以下和100毫秒以上统计故障占比；

3)历史告警数据库SRv6节点之间网络流量丢包故障按丢包比例60％以下和60％以上统计故障占比；

设备状态转移初始概率条件概率包括：

1)采集数据库设备按所在板卡划分CPU使用率占比；

2)采集数据库设备按所在板卡划分内存占用率占比；

3)采集数据库设备按所在板卡划分硬盘使用率占比；

设备状态转移概率条件概率包括：

1)历史告警数据库设备按所在板卡划分CPU使用率占比；

2)历史告警数据库设备按所在板卡划分内存占用率占比；

3)历史告警数据库设备按所在板卡划分硬盘使用率占比。
根据权利要求3所述的一种基于SRv6的智能网络及设备故障预测方法，其特征在于，所述S4中，网络状态转移初始概率调整因子包括：

1)采集数据库网络流量误报次数/先验概率；

2)采集数据库网络流量延迟误报次数/先验概率；

3)采集数据库网络流量丢包误报次数/先验概率；

网络状态转移概率调整因子包括：

1)历史告警数据库网络流量故障误报次数/先验概率；

2)历史告警数据库网络流量延迟误报次数/先验概率；

3)历史告警数据库网络流量丢包误报次数/先验概率；

设备状态转移初始概率条件概率包括：

1)采集数据库按板卡划分CPU使用率误报次数/先验概率；

2)采集数据库按板卡划分内存占用率误报次数/先验概率；

3)采集数据库按板卡划分硬盘使用率误报次数/先验概率；

设备状态转移概率条件概率包括：

1)历史告警数据库按板卡划分CPU使用率误报次数/先验概率；

2)历史告警数据库按板卡划分内存占用率误报次数/先验概率；

3)历史告警数据库按板卡划分硬盘使用率误报次数/先验概率。
根据权利要求1所述的一种基于SRv6的智能网络及设备故障预测方法，其特征在于，所述步骤三基于马尔可夫链转移概率矩阵模型，采用网络状态转移初始概率、网络状态转移概率构建马尔可夫链网络转移概率矩阵；

采用设备状态转移初始概率、设备状态转移概率构建马尔可夫链设备转移概率矩阵。
基于SRv6的智能网络及设备故障预测系统，其特征在于，包括数据采集模块、采集数据库、历史告警数据库、贝叶斯状态转移概率模型、马尔可夫链转移概率矩阵模型和及其训练模块，用于实现权利要求1-7任一所述的基于SRv6的智能网络及设备故障预测方法。