CN116388865B

CN116388865B - 一种基于pon光模块光功率异常的自动筛选方法

Info

Publication number: CN116388865B
Application number: CN202310651716.7A
Authority: CN
Inventors: 杨德瑞; 鲁光辉; 鲁伟帆
Original assignee: Shenzhen Fibertop Technology Co ltd
Current assignee: Shenzhen Fibertop Technology Co ltd
Priority date: 2023-06-05
Filing date: 2023-06-05
Publication date: 2023-09-15
Anticipated expiration: 2043-06-05
Also published as: CN116388865A

Abstract

本发明公开了一种基于PON光模块光功率异常的自动筛选方法，该方法包括：获取PON光模块光功率的时间序列数据并进行预处理；基于预处理后的时间序列数据进行归一化处理，利用滑动窗口获取生成模型的输入值；构建BiGRU‑Attention网络模型，并进行优化，得到光功率异常检测模型；将生成模型的输入值输入至所述光功率异常检测模型并得到预测值；基于得到的预测值与实际数据进行计算，并判断是否为异常数据。本发明能够将异常值自动筛选处理，从而及时发现和排除故障模块，提高整个网络的稳定性，可以大幅度减少运维人员的工作量，提高PON光模块光功率的运维效率，减少运营成本，提高用户的使用体验。

Description

一种基于PON光模块光功率异常的自动筛选方法

技术领域

本发明涉及通信设备参数测试技术领域，具体来说，涉及一种基于PON光模块光功率异常的自动筛选方法。

背景技术

PON光模块（Passive Optical Network Module）是一种用于被动光网络的光通信设备，主要用于传输语音、数据和视频等信息。它可以将光纤网络连接到用户家中的电缆电视机顶盒、电话和电脑等终端设备上，实现高速宽带接入和多媒体业务传输。PON光模块采用分光器技术，将一个光信号分为多个信号，实现了多用户共享一条光纤的传输方式，提高了光纤网络的利用率和经济性。同时，PON光模块还具有低成本、低功耗、易于维护等优点，因此在现代光通信市场上得到了广泛应用。

目前，一级OTN传输设备，大量采用光模块进行业务通信，随着骨干通信网承载业务重要性日益增强，光模块作为通信传输设备的重要组成部分，其性能好坏关系到业务能否正常运行，一旦发生光模块异常后将严重影响业务的正常运行，由于光纤、连接器、跳线等因素的影响，光功率在传输过程中会发生变化，这会导致系统对光功率的异常情况产生误判，从而会影响对PON光模块光功率的异常值筛选。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明提出一种基于PON光模块光功率异常的自动筛选方法，以克服现有相关技术所存在的上述技术问题。

为此，本发明采用的具体技术方案如下：

一种基于PON光模块光功率异常的自动筛选方法，该方法包括以下步骤：

S1、获取PON光模块光功率的时间序列数据并进行预处理；

S2、基于预处理后的时间序列数据进行归一化处理，并利用滑动窗口获取生成模型的输入值；

S3、构建BiGRU-Attention网络模型，并对所述BiGRU-Attention网络模型的网络参数进行优化，得到光功率异常检测模型；

S4、将生成模型的输入值输入至所述光功率异常检测模型并得到预测值；

S5、基于得到的预测值与实际数据进行计算，并判断是否为异常数据。

进一步的，所述获取PON光模块光功率的时间序列数据并进行预处理包括以下步骤：

S11、通过光功率计设备采集PON光模块光功率的时间序列数据；

S12、对采集的PON光模块光功率的时间序列数据进行数据清洗，将PON光模块光功率的时间序列数据中的缺失值及重复值进行剔除，将PON光模块光功率的时间序列数据中的异常值至替换为合理值；

S13、利用中位数滤波法消除PON光模块光功率的时间序列数据中的噪声。

进一步的，所述基于预处理后的时间序列数据进行归一化处理，并利用滑动窗口获取生成模型的输入值包括以下步骤：

S21、采用最大最小值对预处理后的时间序列数据进行归一化处理，得到标准化时间序列数据；

S22、根据得到的标准化数据确定所述滑动窗口的大小以及步长；

S23、基于标准化时间序列数据的起始位置开始，并以所述滑动窗口的步长为间隔，将所述滑动窗口沿着时间轴的方向进行移动，直至所述滑动窗口到达标准化时间序列数据的末尾，并得到大小固定的窗口；

S24、基于得到的窗口提取进行特征提取，并将提取的特征拼接起来，作为模型的输入。

进一步的，所述构建BiGRU-Attention网络模型，并对所述BiGRU-Attention网络模型的网络参数进行优化，得到光功率异常检测模型包括以下步骤：

S31、收集PON光模块光功率的历史数据，并将其作为训练样本数据；

S32、构建BiGRU-Attention网络模型；

S33、采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，并得到光功率异常检测模型。

进一步的，所述构建BiGRU-Attention网络模型包括以下步骤：

S321、基于Keras中的Bidirectional层构建双向GRU层，并确定GRU层的隐藏节点数和激活函数；

S322、基于构建的双向GRU层并利用注意力机制构建注意力层；

S323、采用均方误差损失函数作为激活函数构建输出层；

S324、将构建的所述双向GRU层、所述注意力层及所述输出层组合，并得到BiGRU-Attention网络模型。

进一步的，所述采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，并得到光功率异常检测模型包括以下步骤：

S331、将BiGRU-Attention网络模型中的第一层BiGRU的神经元数量、第二层BiGRU的神经元数量、学习率以及批处理大小作为寻优的参数，并确定每个参数寻优的大小范围；

S332、随机生成g1，g2，a及b的四维种群粒子，g1代表的是第一层BiGRU的神经元数量，g2代表的是第二层BiGRU的神经元数量，a代表的是学习率，b代表的是批处理大小，并完成粒子位置和速度的初始化；

S333、确定粒子的种群规模、加速度因子、惯性权值的初始值和最终值、粒子种群的最大迭代次数以及粒子的最大速度；

S334、以训练样本数据的均方误差作为粒子群算法的适应度函数，并计算粒子的适应度值；

S335、比较粒子的适应度值，并通过速度更新公式及位置更新公式更新粒子的个体最优位置和全局最优位置；

S336、当满足最大迭代次数时，则输出全局的最优值；若不满足最大迭代次数时，则返回执行步骤S334。

进一步的，所述以训练样本数据的均方误差作为粒子群算法的适应度函数，并计算粒子的适应度值的计算公式为：

；

其中，fit_i表示第i个粒子的适应度值；

N表示训练样本数据的总数；

K表示输出节点的个数；

P_jk表示第j个样本的第k个输出节点的实际输出值；

表示第j个样本的第k个输出节点的期望值。

进一步的，所述速度更新公式为：

；

其中，V_i（m+1）表示第i个粒子在第m+1次迭代中的粒子速度；

V_i（m）表示第i个粒子在第m次迭代中的粒子速度；

P_i（m）表示第i个粒子在第m次迭代的个体最优解；

P_l（m）表示粒子种群中所有粒子在第m次迭代中的最优位置；

P_g（m）表示粒子群在第m次迭代后的全局最优解；

c₁和c₂均表示粒子的加速学习因子，c₁是用于让粒子意识到局部最优解，c₂是用于让粒子意识到全局最优解；

r₁和r₂均表示在区间[0，1]内均匀分布的随机数；

α表示在区间[0，1]内的常数；

w表示惯性权值，是用于平衡粒子的全局搜索能力和局部搜索能力；

m表示迭代次数；

所述位置更新公式为：

；

其中，X_i（m+1）表示i个粒子在第m+1次迭代中的位置；

V_i（m+1）表示第i个粒子在第m+1次迭代中的粒子速度；

X_i（m）表示i个粒子在第m次迭代中的位置。

进一步的，所述基于得到的预测值与实际数据进行计算，并判断是否为异常数据包括以下步骤：

S51、计算得到的PON光模块光功率预测值与PON光模块光功率实际值进行均方误差计算，得到的结果作为异常分数；

S53、将所述异常分数分别输入到预设的LOF模型和POT模型中，并利用LOF模型的局部离群因子值和POT模型生成的动态阈值考量PON光模块光功率是否异常。

进一步的，所述将所述异常分数分别输入到预设的LOF模型和POT模型中，并利用LOF模型的局部离群因子值和POT模型生成的动态阈值考量PON光模块光功率是否异常包括以下步骤：

S531、将得到的异常分数按照时间顺序生成异常分数序列；

S532、将异常分数序列的顺序索引index作为另一维度的信息，形成二维数据；

S533、将二维数据输入到LOF模型中，输出每个数据的局部离群因子值，并通过局部离群因子值判断公式判断异常分数是否异常；

S534、对于生成的异常分数序列，选取前H个数据作为初始数据输入至POT模型中，得到POT模型的初始化阈值，并通过POT模型判断公式判断异常分数是否异常；

S535、将LOF模型和POT模型判断的结果进行加权求和，得到异常分数的最终得分，并通过异常判断公式判断PON光模块光功率是否异常。

本发明的有益效果为：

1、本发明通过获取PON光模块光功率的时间序列数据并进行预处理以及归一化处理，然后通过光功率异常检测模型计算PON光模块光功率的预测值并与实际数据进行异常判断，从而能够将PON光模块光功率的异常值自动筛选处理，从而及时发现和排除故障模块，提高整个网络的稳定性，同时，采用自动化的筛选方法，可以大幅度减少运维人员的工作量，提高PON光模块光功率的运维效率，减少运营成本，提高用户的使用体验。

2、本发明通过对采集的PON光模块光功率的时间序列数据进行数据清洗以及噪声消除，从而可以去除原始光功率数据可能存在各种噪声和异常值，提高数据的准确性和可信度，保证数据的质量，使得数据更加规范化和标准化，更容易理解和分析，有助于发现数据中隐藏的信息和趋势，为后续的决策提供依据；能够将数据量降低到最低限度，进而减少计算成本和存储成本。

3、本发明通过采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，从而能够优化网络参数，可以使模型更加准确地拟合数据，提高模型的预测性能；尤其是在处理复杂的非线性问题时，采用改进的粒子群算法可以有效地提高模型的性能；采用改进的粒子群算法，可以自动地搜索最优参数，减少了人工干预的需求，提高了效率。

4、本发明利用LOF模型的局部离群因子值和POT模型生成的动态阈值考量PON光模块光功率是否异常，能够避免根据固定阈值判断异常可能会出现异常误判和异常漏判的现象，提高对异常数据筛选的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种基于PON光模块光功率异常的自动筛选方法的流程图。

具体实施方式

为进一步说明各实施例，本发明提供有附图，这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理，配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点，图中的组件并未按比例绘制，而类似的组件符号通常用来表示类似的组件。

根据本发明的实施例，提供了一种基于PON光模块光功率异常的自动筛选方法。

现结合附图和具体实施方式对本发明进一步说明，如图1所示，根据本发明实施例的基于PON光模块光功率异常的自动筛选方法，该方法包括以下步骤：

S1、获取PON光模块光功率的时间序列数据并进行预处理；

其中，所述获取PON光模块光功率的时间序列数据并进行预处理包括以下步骤：

具体的，采集光模块光功率可以使用光功率计进行测量；光功率计是一种专门用于测量光源输出功率的设备，通常由探头和读数仪器组成。探头负责接收光源发出的光信号，并将其转换为电信号。

具体的，数据清洗是指检查数据是否存在缺失值、异常值、重复值等问题，并进行相应的处理。例如，可以删除缺失值、将异常值替换为合理值、删除重复值等。

具体的，去噪是指消除数据中的噪声，使得数据更加平滑。例如，在时间序列数据中，可以使用移动平均、中位数滤波等方法进行去噪。

具体的，归一化是指将数据转换为特定的范围或分布，以便于比较和分析。例如，可以使用最小最大归一化将数据缩放到0-1之间，或者使用Z-score标准化将数据转换为服从标准正态分布的形式。

其中，所述基于预处理后的时间序列数据进行归一化处理，并利用滑动窗口获取生成模型的输入值包括以下步骤：

具体的，滑动窗口是一种常见的时间序列数据预处理方法，可以将时间序列数据分解为固定大小的窗口，并利用这些窗口生成模型的输入值。

其中，所述构建BiGRU-Attention网络模型，并对所述BiGRU-Attention网络模型的网络参数进行优化，得到光功率异常检测模型包括以下步骤：

S32、构建BiGRU-Attention网络模型；

具体的，GRU网络是按照时间顺序正向的方式提取信息特征。当发生异常状态后，数据会出现一种恢复趋势的现象，如果反向利用这种趋势将会更加敏感的捕捉异常状态。采用双向GRU模型（BiGRU）对时间序列正向和反向的特征信息进行同时提取；BiGRU具有两个独立的隐藏层，这两个隐藏层的内部结构是相同的，方向却是相反的，依靠两个方向同时为网络提供数据信息。第一层的GRU按照时间顺序计算数据的正向传播信息，而第二层的GRU反向读取时间序列，按照时间逆序计算数据的反向传播信息；这两层GRU在计算自己的隐藏状态时互不干扰，最终的BiGRU网络输出信息是由两者联合确定。

注意力机制（AttentionMechanism）的主要思想如同大脑对视觉效果的处理方式，外在事物类比模型的输入数据，通过人眼将数据传递给大脑，如果不经过大脑处理，投影呈现的将是各种冗余数据揉合在一起的图像，实际上并不是所有数据都需要被关注，因此通过大脑给重要的信息分配更多注意力，忽视那些无关紧要的数据信息。

其中，所述构建BiGRU-Attention网络模型包括以下步骤：

S322、基于构建的双向GRU层并利用注意力机制构建注意力层；

S323、采用均方误差损失函数作为激活函数构建输出层；

S33、采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，并得到光功率异常检测模型；

具体的，粒子群算法是一种优化算法，源于对鸟群觅食行为的研究。其基本思想是通过模拟鸟群在搜索过程中的协同行为来进行优化。粒子群算法将待优化的问题看作一个多维空间中的搜索问题，每个解向量都可以视作空间中的一个粒子。算法通过不断更新每个粒子的速度和位置来在空间中搜索全局最优解。粒子群算法有着较好的全局寻优能力，尤其适用于连续型非线性优化问题。同时，其简单易懂，易于实现，并且容易与其他算法结合使用。

其中，所述采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，并得到光功率异常检测模型包括以下步骤：

其中，所述以训练样本数据的均方误差作为粒子群算法的适应度函数，并计算粒子的适应度值的计算公式为：

；

其中，fit_i表示第i个粒子的适应度值；

N表示训练样本数据的总数；

K表示输出节点的个数；

P_jk表示第j个样本的第k个输出节点的实际输出值；

表示第j个样本的第k个输出节点的期望值。

其中，所述速度更新公式为：

；

其中，V_i（m+1）表示第i个粒子在第m+1次迭代中的粒子速度；

V_i（m）表示第i个粒子在第m次迭代中的粒子速度；

P_i（m）表示第i个粒子在第m次迭代的个体最优解；

P_g（m）表示粒子群在第m次迭代后的全局最优解；

r₁和r₂均表示在区间[0，1]内均匀分布的随机数；

α表示在区间[0，1]内的常数；

m表示迭代次数；

所述位置更新公式为：

；

其中，X_i（m+1）表示i个粒子在第m+1次迭代中的位置；

V_i（m+1）表示第i个粒子在第m+1次迭代中的粒子速度；

X_i（m）表示i个粒子在第m次迭代中的位置。

其中，所述基于得到的预测值与实际数据进行计算，并判断是否为异常数据包括以下步骤：

具体的，上述均方误差的计算公式为：

其中，D（t）表示PON光模块光功率预测值与PON光模块光功率实际值的均方误差值；

表示t时刻第i个变量的预测值；

表示t时刻第i个变量的实际值；

n表示数据的维度；

具体的，局部离群因子（Local Outlier Factor，LOF）算法是通过分析数据分布的密度情况，探测数据集中存在的非集群点和噪声。LOF算法利用局部离群因子值来判断数据是否为异常值，正常数据点都集中分布在一起，意味着这些数据的局部离群因子值较小，而局部离群因子值越大的数据点，代表离群集越远，是异常点的可能性也就越大。LOF算法的具体过程是通过计算k-邻近距离、k-距离邻域、可达距离、局部可达密度和局部离群因子实现的。

极值理论（Extreme Value Theory，EVT）是统计学中处理概率问题的一种思想，研究数据集中存在的极端数据分布情况，通常极端值往往分布在概率模型的尾部。在异常检测问题中，目标任务是要寻找数据集里的异常值，而这些异常值也就是极值理论中所要挖掘的极值。极值理论中的超阈值模型（Peaks Over Threshold，POT）通过广义帕累托分布（Generalized Pareto Distribution，GPD）拟合超过阈值数据点的概率分布情况，可以利用POT模型学习异常分数阈值，将超过该阈值的数据判定为异常数据。

其中，所述将所述异常分数分别输入到预设的LOF模型和POT模型中，并利用LOF模型的局部离群因子值和POT模型生成的动态阈值考量PON光模块光功率是否异常包括以下步骤：

S531、将得到的异常分数按照时间顺序生成异常分数序列；

具体的，局部离群因子值判断公式为：

；

其中，label_i表示第i个数据点的判断结果，lof_i表示是第i个数据点的局部离群因子值，threshold_lof表示的是LOF模型的阈值，并且值大于1。如果某个点的局部离群因子值超过这个阈值，就会被判定为异常值。

具体的，POT模型判断公式为：

；

其中，label_i表示第i个数据点的判断结果，threshold_lof表示POT模型的初始化阈值；d_i表示异常分数的峰值点。

具体的，异常判断公式为：

；

其中，score_i表示第i个异常分数的最终得分，label_i表示第i个数据点的最终判断结果。

综上所述，借助于本发明的上述技术方案，本发明通过获取PON光模块光功率的时间序列数据并进行预处理以及归一化处理，然后通过光功率异常检测模型计算PON光模块光功率的预测值并与实际数据进行异常判断，从而能够将PON光模块光功率的异常值自动筛选处理，从而及时发现和排除故障模块，提高整个网络的稳定性，同时，采用自动化的筛选方法，可以大幅度减少运维人员的工作量，提高PON光模块光功率的运维效率，减少运营成本，提高用户的使用体验；本发明通过对采集的PON光模块光功率的时间序列数据进行数据清洗以及噪声消除，从而可以去除原始光功率数据可能存在各种噪声和异常值，提高数据的准确性和可信度，保证数据的质量，使得数据更加规范化和标准化，更容易理解和分析，有助于发现数据中隐藏的信息和趋势，为后续的决策提供依据；能够将数据量降低到最低限度，进而减少计算成本和存储成本；本发明通过采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，从而能够优化网络参数，可以使模型更加准确地拟合数据，提高模型的预测性能；尤其是在处理复杂的非线性问题时，采用改进的粒子群算法可以有效地提高模型的性能；采用改进的粒子群算法，可以自动地搜索最优参数，减少了人工干预的需求，提高了效率；本发明利用LOF模型的局部离群因子值和POT模型生成的动态阈值考量PON光模块光功率是否异常，能够避免根据固定阈值判断异常可能会出现异常误判和异常漏判的现象，提高对异常数据筛选的准确性。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于PON光模块光功率异常的自动筛选方法，其特征在于，该方法包括以下步骤：

S1、获取PON光模块光功率的时间序列数据并进行预处理；

S3、构建BiGRU-Attention网络模型，并对所述BiGRU-Attention网络模型的网络参数进行优化，得到光功率异常检测模型；包括以下步骤：

S32、构建BiGRU-Attention网络模型；

S33、采用改进的粒子群算法优化BiGRU-Attention网络模型的网络参数，并得到光功率异常检测模型；包括以下步骤：

S334、以训练样本数据的均方误差作为粒子群算法的适应度函数，并计算粒子的适应度值；计算公式为：

其中，fit_i表示第i个粒子的适应度值；

N表示训练样本数据的总数；

K表示输出节点的个数；

P_jk表示第j个样本的第k个输出节点的实际输出值；

表示第j个样本的第k个输出节点的期望值；

所述速度更新公式为：

V_i(m+1)＝w(m)V_i(m)+c₁(m)r₁[(1-α^m)(P_i(m)-X_i(m))+α^m(P_l(m)-X_i(m))]+c₂(m)r₂(P_g(m)-X_i(m))；

其中，V_i(m+1)表示第i个粒子在第m+1次迭代中的粒子速度；

V_i(m)表示第i个粒子在第m次迭代中的粒子速度；

P_i(m)表示第i个粒子在第m次迭代的个体最优解；

P_l(m)表示粒子种群中所有粒子在第m次迭代中的最优位置；

P_g(m)表示粒子群在第m次迭代后的全局最优解；

r₁和r₂均表示在区间[0，1]内均匀分布的随机数；

α表示在区间[0，1]内的常数；

m表示迭代次数；

所述位置更新公式为：

X_i(m+1)＝X_i(m)+V_i(m+1)；

其中，X_i(m+1)表示i个粒子在第m+1次迭代中的位置；

V_i(m+1)表示第i个粒子在第m+1次迭代中的粒子速度；

X_i(m)表示i个粒子在第m次迭代中的位置；

S336、当满足最大迭代次数时，则输出全局的最优值；若不满足最大迭代次数时，则返回执行步骤S334；

2.根据权利要求1所述的一种基于PON光模块光功率异常的自动筛选方法，其特征在于，所述获取PON光模块光功率的时间序列数据并进行预处理包括以下步骤：

S12、对采集的PON光模块光功率的时间序列数据进行数据清洗，将PON光模块光功率的时间序列数据中的缺失值及重复值进行剔除，将PON光模块光功率的时间序列数据中的异常值替换为合理值；

3.根据权利要求1所述的一种基于PON光模块光功率异常的自动筛选方法，其特征在于，所述基于预处理后的时间序列数据进行归一化处理，并利用滑动窗口获取生成模型的输入值包括以下步骤：

S22、根据得到的标准化时间序列数据确定所述滑动窗口的大小以及步长；

S24、基于得到的窗口进行特征提取，并将提取的特征拼接起来，作为生成模型的输入值。

4.根据权利要求1所述的一种基于PON光模块光功率异常的自动筛选方法，其特征在于，所述构建BiGRU-Attention网络模型包括以下步骤：

S322、基于构建的双向GRU层并利用注意力机制构建注意力层；

S323、采用均方误差损失函数作为激活函数构建输出层；

5.根据权利要求1所述的一种基于PON光模块光功率异常的自动筛选方法，其特征在于，所述基于得到的预测值与实际数据进行计算，并判断是否为异常数据包括以下步骤：

6.根据权利要求5所述的一种基于PON光模块光功率异常的自动筛选方法，其特征在于，所述将所述异常分数分别输入到预设的LOF模型和POT模型中，并利用LOF模型的局部离群因子值和POT模型生成的动态阈值考量PON光模块光功率是否异常包括以下步骤：

S531、将得到的异常分数按照时间顺序生成异常分数序列；