WO2021073343A1

WO2021073343A1 - 通信系统的故障根因分析方法、装置、系统和计算机存储介质

Info

Publication number: WO2021073343A1
Application number: PCT/CN2020/115602
Authority: WO
Inventors: 韩静; 张百胜; 陈力; 刘建伟; 董辛酉; 杨帆; 曹亮; 郁枫; 李维杨; 王德政
Original assignee: 中兴通讯股份有限公司; 清华大学
Priority date: 2019-10-14
Filing date: 2020-09-16
Publication date: 2021-04-22
Also published as: CN110635952A; EP4033700A4; EP4033700A1; CN110635952B

Abstract

一种通信系统的故障根因分析方法、装置、系统和计算机可读存储介质，方法包括：获取所述通信系统的目标KPI变量的实时值以及所述通信系统的多个观测变量的实时值；将所述多个观测变量的实时值输入预测模型中，以获得目标KPI变量的预测值，其中，所述预测模型由预定算法对所述通信系统的历史数据进行训练所获得；将获得的所述目标KPI变量的预测值与所述目标KPI变量的实时值进行对比；当所述通信系统的性能变差时，计算各个观测变量对所述系统性能变差这一现象的贡献度；将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量，其中，K为正整数。

Description

通信系统的故障根因分析方法、装置、系统和计算机存储介质

相关申请的交叉引用

本申请基于申请号为201910975121.0、申请日为2019年10月14日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及通信领域，具体地，涉及一种通信系统的故障根因分析方法、一种通信系统的故障根因分析装置、一种执行该故障根因分析方法的系统、一种计算机可读存储介质。

背景技术

在通信网络的运行维护过程中，不可避免地会出现通信系统的变更。通信系统变更后可能会出现关键性能指标(KPI，Key Performance Indicator)恶化的问题，技术人员需要在大量观测变量中寻找导致通信系统性能下降的原因，效率较低。

因此，如何高效率地寻找通信系统性能下降的原因成为本领域亟待解决的技术问题。

发明内容

本公开的目的在于提供一种通信系统的故障根因分析方法、一种通信系统的故障根因分析装置、一种执行该故障根因分析方法的系统、一种计算机可读存储介质。利用所述故障根因分析方法可高效率地找到通信系统性能下降的原因。

作为本公开的第一个方面，提供一种通信系统的故障根因分析方法，包括：获取所述通信系统的目标KPI变量的实时值以及所述通信系统的多个观测变量的实时值；将所述多个观测变量的实时值输入预测模型中，以获得目标KPI变量的预测值，其中，所述预测模型由预定算法对所述通信系统的历史数据进行训练所获得；将获得的所述目标KPI变量的预测值与所述目标KPI变量的实时值进行对比；当所述通信系统的性能变差时，计算各个观测变量对所述系统性能变差这一现象的贡献度，其中，所述通信系统的性能变差至少满足以下预定条件：所述目标KPI变量的预测值与所述目标KPI变量的实时值相差超过预定值；将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量，其中，K为正整数。

作为本公开的第二个方面，提供一种用于对通信系统进行故障根因分析的系统，包括：离线装置，所述离线装置中存储有利用预定算法对通信系统的历史数据进行训练获得的用于预测KPI变量的预测模型；在线装置，所述在线装置用于：实时监控通信系统的KPI变量，以获得实时KPI变量；将所述预测模型输出的预测KPI变量与所述实时KPI变量进行对比；当所述通信系统的性能变差时，计算各个观测变量对所述实时KPI变量变差这一现象的贡献度，其中，所述通信系统的性能变差至少满足以下预定条件：所述预测KPI变量与所述实时KPI变量相差超过预定值；将贡献度按照大小排在前K位的观测变量作为所述实时KPI变量变差的备选根因变量，其中，K为正整数。

作为本公开的第三个方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有可执行程序，所述可执行程序用于在被处理器执行时实现上述故障根因分析方法。

作为本公开的第四个方面，提供一种通信系统的故障根因分析装置，包括处理器和存储器，所述存储器存储有可执行程序，所述可执行程序用于在被处理器执行时实现上述故障根因分析方法。

附图说明

附图是用来提供对本发明的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明，但并不构成对本发明的限制。在附图中：

图1是本公开所提供的通信系统的故障根因分析方法的流程图；

图2是步骤S130的一种实施方式的示意图；

图3是构建预测模型的流程图；

图4是本公开所提供的对通信系统进行故障根音分析的系统的模块图；

图5是通信系统更新前和通信系统更新后，目标KPI的预测值以及实时值的对比图；

图6是T ²统计量实时监控示意图；

图7是各观测变量的累积贡献度示意图；

图8是各观测变量贡献度告警序列；

图9是本公开所提供的通信系统的故障根因分析装置的示意性结构图。

附图标记说明

110：离线装置 120：在线装置

901：处理器 902：存储器

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

作为本发明的第一个方面，提供一种通信系统的故障根因分析方法，如图1所示，该故障根因分析方法包括：

在步骤S110中，获取所述通信系统的目标KPI变量的实时值和所述通信系统的多个观测变量的实时值；

在步骤S120中，将所述多个观测变量的实时值输入预测模型中，以获得所述目标KPI变量的预测值，其中，所述预测模型由预定算法对所述通信系统的历史数据进行训练所获得；

在步骤S130中，将获得的所述目标KPI变量的预测值与所述目标KPI变量的实时值进行对比；

在步骤S140中，当所述通信系统的性能变差时，计算各个观测变量对所述系统性能变差这一现象的贡献度，其中，所述通信系统的性能变差至少满足以下预定条件：所述目标KPI变量的预测值与所述目标KPI变量的实时值相差超过预定值；

在步骤S150中，将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量，其中，K为正整数。

在本公开中，对如何获取通信系统的目标KPI变量的实时值和所述通信系统的多个观测变量的实时值不做特殊的限定。例如，可以通过对通信系统进行实时监控的方式获得所述目标KPI变量的实时值和所述多个观测变量的实时值。再例如，可以利用监控装置对所述通信系统进行实时监控，然后通过监控装置与执行所述故障根因分析方法的装置之间进行通信获得所述目标KPI变量的实时值和所述多个观测变量的实时值。在一些实施例中，通过构造霍特林统计量，在线监测所述通信系统运行的状态，以获得所述目标KPI变量的实时值和多个观测变量的实时值。

在本公开中，对采集目标KPI变量的实时值和采集各个观测变量的实时值的周期也不做特殊限定。例如，每隔时间T采集一次目标KPI变量和观测变量。时间间隔T越小、则故障根因分析方法的分析结果越准确。为了在运算量和精确度之间获得平衡，在一些实施例中，所述时间T可以为15min。

此处，所述通信系统的历史数据，是指通信系统更新前获得的数据，包括通信系统更新前的目标KPI变量的历史值、以及通信系统更新前的观测变量的历史值等。并且，需要确定通信系统在更新前是正常运行的。

通过对比目标KPI变量的预测值和目标KPI变量的实时值，可以快速地判断通信系统是否发生故障。然后，通过计算各个观测变量对目标KPI变量变差的贡献度可以快速地确定使得通信系统性能变差的故障根因，无需人工排查，提高了故障根因分析的效率。

需要指出的是，通常可以认为贡献度最大的观测变量为故障根因变量，但是通过本公开所提供的故障根因分析方法所获得的备选根因变量也仅供技术人员进行分析。技术人员可以根据各个观测变量的贡献度，确定真正的故障根因变量。

在本公开中，对所述预定算法的具体类型不做特殊的限定，在一些实施例中，所述预定算法包括偏最小二乘(PLS，Partial least squares regression)算法。对于通信系统而言，相关的观测变量较多，因此通信系统中涉及的数据量也非常庞大，并且，大采样时间的通信系统满足PLS算法的静态特性，在本申请中，使用PLS算法对通信系统的历史数据进行训练获得的模型可以更加精确地预测目标KPI变量。

为了更加精确地确定故障根因，在一些实施例中，所述故障根因分析方法还可包括在步骤S150之后进行的：

在步骤S160中，监控各个观测变量的实时值是否超过预定的控制限；

在步骤S170中，当K个备选根因变量的实时值超出相应的控制限的频率大于预定频率和/或K个备选根因变量的实时值超出相应的控制限的时机早于其他观测变量时，将K个备选根因变量确定为最终根因变量。

在本公开中，对各个观测变量的控制限不做特殊的限定，技术人员可以根据经验来设定所述控制限。当然，所述的最终根因变量，也是供技术人员进行参考的。

在本公开中，对K的具体数值不做特殊的限定，技术人员可以根据自己的需求来确定K的数值。

为了使得预测根因分析结果更加准确，在一些实施例中，所述故障根因分析方法还包括：

构造统计量，在线监测所述通信系统运行的状态，其中，所述通信系统的性能变差还包括所述通信系统的统计量(记作T ²)偏离所述通信系统的统计量阈值(记作T ² _limit)。

为了让维护人员快速、直观地获得目标KPI变量的预测值和目标KPI变量的实时值之间的对比结果，在一些实施例中，如图2所示，步骤S130可以包括：

在步骤S131中，生成所述目标KPI的预测值随观测时间变化的第一曲线，以及生成所述目标KPI变量的实时值随观测时间变化的第二曲线；

在步骤S132中，利用所述第一曲线和所述第二曲线进行对比，以判断所述目标KPI变量的预测值与所述目标KPI变量的实时值在各个时间点的关系。

在本公开中，对如何按照贡献度对各观测变量进行排序不做特殊的规定，可以按照以下方法按照贡献度对各观测变量进行排序：

计算预定时间段内各观测变量在各个观测时刻的瞬时贡献度；

计算各个观测变量在预定时间段内的累积贡献度；

统计各个观测变量在所述预定时间段内的瞬时贡献度超过第一预定贡献度的次数；

确定所述预定时间段内的累积贡献度超过第二预定贡献度的观测变量；

将瞬时贡献度超过第一预定贡献度的次数大于预定次数、且累计贡献度超过所述第二预定贡献度的观测变量进行排序。

在本公开实施例所提供的具体步骤中，既考虑到了观测变量的瞬时贡献度，又考虑到了观测变量的总贡献度，从而可以更加客观公正地对各观测变量的贡献度进行排序。

换言之，在本公开所提供的故障根因分析方法中，一旦发现目标KPI变差(即，通信系统发生异常)，即分析在此之前一段时间内的观测变量对KPI变差的贡献度，筛选出贡献度较大的一部分变量，并将其视为造成故障的根因，以供技术人员分析。

如上文中所述，通过PLS算法构建所述预测模型。为了节约计算量，首先要对历史数据进行预处理，将与所述目标KIP变量相关性较小的观测变量排除。具体地，如图3所示，构建所述预测模型的步骤包括：

在步骤S210中，对所述通信系统的历史数据中，所述通信系统的目标KPI变量的历史值与多个观测变量的历史值进行互相关分析，以获得与目标KPI变量的历史值的相关度超过第一预定百分比(记作E％)的观测变量的历史值作为输入变量；

在步骤S230中，将所述输入变量作为输入数据，将所述目标KPI变量的历史值作为预测数据，利用所述预定算法进行模型训练，以获得所述预测模型。

通过步骤S210，可以在大量观测变量中，自动选出与目标KPI变量最相关的测变量，作为PLS算法的输入数据，从而降低了构建预测模型时的运算量。

经本申请的发明人研究发现，所述通信系统的有效观测变量(即，与目标KPI变量最相关的观测变量)中，大部分观测变量存在明显的线性相关特性，也就是说，所述通信系统为超过第二预定百分比(记作D％)的有效变量存在线性相关特性的线性系统。

在一些实施例中，所述第一预定百分比不超过所述第二预定百分比(即，E≤D)。在一些实施例中，第一预定百分比E％选取50％至70％，而第二预定百分比D％则选取70％至90％。

PLS算法尤其适用于对线性系统进行预测。因此，作为提升预测结果的准确性，在一些实施例中，在构建预测模型时，可以首先对通信系统是否为线性系统进行分析。只有确认了通信系统为线性系统，方执行步骤S230。具体地，构建预测模型的步骤还包括在步骤S230之前进行的如下步骤：

在步骤S221中，根据所述目标KPI变量的历史值与多个观测变量的历史值之间的互相关分析，确定各个观测变量与所述目标KPI变量之间的相关系数；

在步骤S222中，通过显著性检验计算得到相关系数阈值；

在步骤S223中，判断与所述目标KPI变量的相关系数超过所述相关系数阈值的观测变量在所有观测变量中的比例是否超过所述第二预定百分比；

当判断结果为是时，表明通信系统为线性系统，则执行步骤S230。

当步骤S223中的判断结果为否时，表明通信系统为非线性系统，此时可以考虑利用其它算法构建预测模型。

在本公开中，对如何执行步骤S221没有特殊的限定。

在本发明中，对如何计算各个观测变量与所述目标KPI变量之间的相关系数不做特殊的限定。具体地，计算各个观测变量与所述目标KPI变量之间的相关系数的步骤包括：

通过互相关分析方法计算KPI变量与其他观测变量的相关系数矩阵P和延时矩阵L。即对两个统计序列x _i和x _j，引入时延l(l∈Z)，且|l|≤l _max，利用公式(3)计算一系列相关系数ρ _xixj(l)：

其中，k为两个统计序列的长度；

S _xi为x _i的标准差；

S _xj为x _j的标准差；

m为样本序号。

对于公式(1)获得的一系列相关系数ρ _xixj(l)取最大值，记做ρ _ij，对应的时延为l _ij。

通过显著性检验计算相关系数的阈值，检验的方式是通过构造一个T统计量，以得到相关系数的阈值ρ ₀；

如果超过D％的有效变量存在明显线性相关特性，则认为所述通信系统的线性特性明显，满足PLS模型的线性特性。一般情况下，D可以取70％-90％。

从大量观测变量在那个选择相关系数前E％的变量作为PLS模型的输入，其中，E≤D。记正常运行的观测变量个数为M，观测变量的样本个数为N，并对数据进行标准化，得到输入矩阵X＝[x ₁,x ₂,…，x _M]∈R ^N×M，输出向量为Y＝[y ₁,y ₂,…,y _N] ^T∈R ^1×N。一般情况下，E取50％至70％。

使用PLS算法建立输出变量为目标KPI变量、输入变量为所述观测变量的模型，具体地：

PLS算法将数据矩阵[X,Y]投影到较少潜变量[t ₁,t ₂,…，t _A]所张成的低维空间中：

式中，T＝[t ₁,t ₂,…，x _A]∈R ^N×A为得分矩阵；

P＝[p ₁,p ₂,…,p _A]∈R ^M×A为X的载荷矩阵；

Q＝[q ₁,q ₂,…,q _A]∈R ^M×A为Y的载荷矩阵；

E为X的残差矩阵；

F为Y的残差矩阵。

引入权重矩阵R＝[r ₁,r ₂,…,r _A]∈R ^M×A，使得T＝XR，进一步可以得到P ^TR＝R ^TP，则对Y的预测模型可以写成

下面介绍如何利用所述预测模型来进行故障根因分析：

如上文中所述，构造T ²统计量在线监测通信系统的运行状态；

将观测变量的实时值输入上述预测模型中，获得目标KPI的预测变量；

如果目标KPI的实时值显著偏离目标KPI的预测变量，且T ²统计量显著偏离T ² _limit阈值，则认为通信系统的性能下降。其中，利用公式(2)计算T2统计量，利用公式(3)计算T ²统计量阈值。

T ²＝x ^TRΔ ^-1R ^Tx (2)

其中，

T为建模得分的样本协方差；

α为置信水平；

N为利用PLS算法训练预测模型时用到的样本个数；

n为利用PLS算法训练预测模型时用到的样本个数样本个数；

A为PLS算法选取的成分个数；

R为权重矩阵。

一旦监测到通信系统的性能下降，则计算一定时间内各个观测变量对目标KPI变量变差的贡献度。采用重构贡献图方法(RBC)，观测变量x _i对T ²监测指标的贡献程度。具体地，可以通过公式(4)确定贡献度RBC：

其中，

为故障向量。

作为本公开的第二个方面，提供一种用于对通信系统进行故障根因分析的系统，如图4所示，该系统包括离线装置110和在线装置120。

其中，离线装置110中存储有利用预定算法对通信系统的历史数据进行训练获得的用于预测KPI变量的预测模型。

在线装置120用于执行以下步骤：

实时监控通信系统的KPI变量，以获得实时KPI变量；

将所述预测模型输出的预测KPI变量与所述实时KPI变量进行对比；

当所述通信系统的性能变差时，计算各个观测变量对所述实时KPI变量变差这一现象的贡献度，其中，所述通信系统的性能变差至少满足以下预定条件：所述预测KPI变量与所述实时KPI变量相差超过预定值；

将贡献度按照大小排在前K位的观测变量作为所述实时KPI变量变差的备选根因变量，其中，K为正整数。

在一些实施例中，离线装置110能够按照以下步骤构建所述预测模型：

对所述通信系统的历史数据中，所述通信系统的目标KPI变量的历史值与多个观测变量的历史值进行互相关分析，以获得与目标KPI变量的历史值的相关度超过第一预定百分比的观测变量的历史值作为输入变量；

将所述输入变量作为输入数据，将所述目标KPI变量的历史值作为预测数据，利用偏最小二乘算法进行模型训练，以获得所述预测模型。

在一些实施例中，所述预定算法为PLS算法。

作为本公开的第三个方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有可执行程序，所述可执行程序用于在被处理器执行时实现本公开所提供的上述故障根因分析方法。

作为本公开的第四个方面，提供一种通信系统的故障根因分析装置，如图9所示，包括处理器901和存储器902，所述存储器902存储有可执行程序，所述可执行程序用于在被处理器901执行时实现本公开所提供的上述故障根因分析方法。

其中，计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机可读存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储介质、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。

下面以某小区的基站数据作为分析案例，详细描述本公开所提供的故障根因分析方法的工作原理。以下说明仅为示例性解释本公开所提供的故障根因分析方法是如何工作的，并非真实案例。

某小区共201个待观测变量，评价系统性能的有1个目标KPI变量，观测数据采样间隔为15min，正常运行状态下共采样10天数据。去除空白数据序列以及常值数据序列，共得到92个观测变量序列和1个KPI变量序列；

利用互相关分析法进行分析，T统计量得到的相关性阈值为0.24，其中，89/92的变量超过了相关性阈值，可以认为系统满足线性特性要求；

选取相关系数前65％的变量作为PLS算法的输入，得到60个输入变量；

使用PLS算法为目标KPI建立预测模型；

构造T ²监测指标对系统进行实时监控；

升级前10天正常10天正常数据和升级后7天待分析数据的实时监控结果图5所示，其中，图5的横坐标表示的是时间信息，其中，500表示按照时间顺序采集到的第500个数据点，1000表示按照时间顺序采集到的第1000个数据点，1500则表示按照时间顺序采集到的第1500个数据点，纵坐标为目标KPI的值，其中，指示线1为预测线，指示线2为实际线：注意到升级后(960个采样点)系统性能发生了下降，体现在预测性能下降，如图6所示，T ²监测指标(即，T ²统计量)超过控制限(在图6中，横坐标表示样本序列，500表示按照时间顺序采集到的第500个数据点，1000表示按照时间顺序采集到的第1000个数据点，1500则表示按照时间顺序采集到的第1500个数据点，纵坐标表示的是T ²统计值，图表区域内的水平横线为T ²统计量的控制限，曲线为T ²监测指标的值)，因而需要分析各变量对统计指标的贡献程度。

取分析长度为1天，即96个采样点。如图7所示，所述故障根因分析系统给出的累计贡献率最高的前五个观测变量(即，K为5)分别为：18→27→19→42→79，通过图7可以看出18号变量累计贡献最高，因而认为18号变量是故障根因。另一方面，对每个变量单独进行贡献度分析，超过控制限的发出报警，如图8所示，18号变量同样可以看出其报警次数最多，且最先发出告警，因而可以认为18号变量引起了故障的传播。

在本公开所提供的故障根因分析方法的若干实施例中，通过构建预测模型，可以得到目标KPI的预测值。通过对比目标KPI变量的预测值和目标KPI变量的实时值，可以快速地判断通信系统是否发生故障。然后，通过计算各个观测变量对目标KPI变量变差的贡献度可以快速地确定使得通信系统性能变差的故障根因，无需人工排查，提高了故障根因分析的效率。

可以理解的是，以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式，然而本发明并不局限于此。对于本领域内的普通技术人员而言，在不脱离本发明的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本发明的保护范围。

Claims

一种通信系统的故障根因分析方法，包括：

获取所述通信系统的目标KPI变量的实时值以及所述通信系统的多个观测变量的实时值；

将所述多个观测变量的实时值输入预测模型中，以获得目标KPI变量的预测值，其中，所述预测模型由预定算法对所述通信系统的历史数据进行训练所获得；

将获得的所述目标KPI变量的预测值与所述目标KPI变量的实时值进行对比；

当所述通信系统的性能变差时，计算各个观测变量对所述系统性能变差这一现象的贡献度，其中，所述通信系统的性能变差至少满足以下预定条件：所述目标KPI变量的预测值与所述目标KPI变量的实时值相差超过预定值；

将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量，其中，K为正整数。
根据权利要求1所述的故障根因分析方法，其中，获取所述通信系统的目标KPI变量的实时值以及所述通信系统的多个观测变量的实时值具体包括：

构造统计量，在线监测所述通信系统运行的状态，以获得所述通信系统的目标KPI变量的实时值以及所述通信系统的多个观测变量，其中，所述通信系统的性能变差还包括所述通信系统的统计量偏离所述通信系统的统计量阈值。
根据权利要求1所述的故障根因分析方法，其中，将获得的所述目标KPI变量的预测值与所述目标KPI变量的实时值进行对比，包括：

生成所述目标KPI变量的预测值随观测时间变化的第一曲线，以及生成所述目标KPI变量的实时值随观测时间变化的第二曲线；

利用所述第一曲线和所述第二曲线进行对比，以判断所述目标KPI变量的预测值与所述目标KPI变量的实时值在各个时间点的关系。
根据权利要求1至3中任意一项所述的故障根因分析方法，其中，所述故障根因分析方法还包括将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量的步骤之前进行的：

计算预定时间段内各观测变量在各个观测时刻的瞬时贡献度；

计算各个观测变量在预定时间段内的累积贡献度；

统计各个观测变量在所述预定时间段内的瞬时贡献度超过第一预定贡献度的次数；

确定所述预定时间段内的累积贡献度超过第二预定贡献度的观测变量；

将瞬时贡献度超过第一预定贡献度的次数大于预定次数、且累计贡献度超过所述第二预定贡献度的观测变量进行排序。
根据权利要求1至4中任意一项所述的故障根因分析方法，其中，所述预定算法为偏最小二乘算法。
根据权利要求5所述的故障根因分析方法，其中，所述预测模型通过以下步骤构建：

对所述通信系统的历史数据中，所述通信系统的目标KPI变量的历史值与多个观测变量的历史值进行互相关分析，以获得与目标KPI变量的历史值的相关度超过第一预定百分比的观测变量的历史值作为输入变量；

将所述输入变量作为输入数据，将所述目标KPI变量的历史值作为预测数据，利用所述预定算法进行模型训练，以获得所述预测模型。
根据权利要求6所述的故障根因分析方法，其中，所述通信系统为超过第二预定百分比的观测变量存在线性相关特性的线性系统，所述第一预定百分比不超过所述第二预定百分比。
根据权利要求7所述的故障根因分析方法，其中，构建所述预测模型还包括在将所述输入变量作为输入数据，将所述目标KPI变量作为预测数据，利用预定算法进行模型训练，以获得所述预测模型的步骤之前进行的以下步骤：

根据所述目标KPI变量的历史值与多个观测变量的历史值之间的互相关分析，确定各个观测变量与所述目标KPI变量之间的相关系数；

通过显著性检验计算得到相关系数阈值；

判断与所述目标KPI变量的相关系数超过所述相关系数阈值的观测变量在所有观测变量中的比例是否超过所述第二预定百分比；

当判断结果为是时，则执行所述将所述输入变量作为输入数据，将所述目标KPI变量作为预测数据，利用偏最小二乘算法进行模型训练，以获得预测模型的步骤。
根据权利要求1至3中任意一项所述的故障根因分析方法，其中，所述故障根因分析方法还包括在将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量的步骤之后进行的：

监控各个观测变量的实时值是否超过预定的控制限；

当K个备选根因变量的实时值超出相应的控制限的频率大于预定频率，以及K个备选根因变量的实时值超出相应的控制限的时机早于其他观测变量时，将K个备选根因变量确定为最终根因变量。
根据权利要求1至3中任意一项所述的故障根因分析方法，其中，所述故障根因分析方法还包括在将贡献度按照大小排在前K位的观测变量作为所述通信系统的性能变差的备选根因变量的步骤之后进行的：

监控各个观测变量的实时值是否超过预定的控制限；

当K个备选根因变量的实时值超出相应的控制限的频率大于预定频率，或者K个备选根因变量的实时值超出相应的控制限的时机早于其他观测变量时，将K个备选根因变量确定为最终根因变量。
一种用于对通信系统进行故障根因分析的系统，包括：

离线装置，所述离线装置中存储有利用预定算法对通信系统的历史数据进行训练获得的用于预测KPI变量的预测模型；

在线装置，所述在线装置用于：

实时监控通信系统的KPI变量，以获得实时KPI变量；

将所述预测模型输出的预测KPI变量与所述实时KPI变量进行对比；

当所述通信系统的性能变差时，计算各个观测变量对所述实时KPI变量变差这一现象的贡献度，其中，所述通信系统的性能变差至少满足以下预定条件：所述预测KPI变量与所述实时KPI变量相差超过预定值；

将贡献度按照大小排在前K位的观测变量作为所述实时KPI变量变差的备选根因变量，其中，K为正整数。
根据权利要求11所述的系统，其中，所述预定算法为偏最小二乘算法。
一种计算机可读存储介质，所述计算机可读存储介质存储有可执行程序，所述可执行程序用于在被处理器执行时实现权利要求1至10中任意一项所述的故障根因分析方法。
一种通信系统的故障根因分析装置，包括处理器和存储器，所述存储器存储有可执行程序，所述可执行程序用于在被所述处理器执行时实现权利要求1至10中任意一项所述的故障根因分析方法。