CN115758187A

CN115758187A - 一种基于k-cnn--n-gru的煤矿机械电机状态预测方法

Info

Publication number: CN115758187A
Application number: CN202211449604.5A
Authority: CN
Inventors: 杨晓东; 肖鹿; 赵明辉; 陈国磊; 袁庆瑶; 倪珉
Original assignee: Xinjiang Tianchi Energy Sources Co ltd
Current assignee: Xinjiang Tianchi Energy Sources Co ltd
Priority date: 2022-11-18
Filing date: 2022-11-18
Publication date: 2023-03-07

Abstract

一种基于K‑CNN‑‑N‑GRU的煤矿机械电机状态预测方法，采集煤矿机械电机数据数据，对样本处理数据集进行预处理，将处理后的数据进行加权融合，得到一维融合参数D，构建K‑CNN模型，将模型特征提取结果划分为测试集和训练集，训练GRU模型，构建N‑GRU模型，将构建K‑CNN模型与N‑GRU模型结合得到K‑CNN‑N‑GRU模型输出结果，计算K‑CNN‑‑N‑GRU模型的预测残差，对预测残差进行平滑处理，针对平滑处理后的残差数据，使用网格搜索GridSearchCV寻找似然估计最大化时的带宽，通过核密度估计KDE得到概率密度函数，并用辛普森Simpson对概率密度函数求积分到0.95，从而得到告警阈值；本发明具有提高电机可靠性、降低维护成本的特点。

Description

一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法

技术领域

本发明涉及电机状态预测技术领域，具体涉及一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法。

背景技术

露天煤矿机械设备具有典型的低速重载、运行环境恶劣且多变等特点，带式输送机作为煤矿串联式生产线中运输煤炭的关键设备，其安全高效运行直接影响煤矿企业的生产效益。其中异步电机作为带式输送机的主要动力来源，其运行可靠性直接影响整个系统的稳定运转，一旦发生故障停机，将威胁到整个生产系统的安全，造成极大的经济损失。

露天煤矿电机长期暴露在复杂恶劣环境中，电机的状态变量受环境因素和负载变化扰动较大，频繁出现单一状态变量瞬时超限的误报警。常用的基于深度学习的特征提取方法为端到端式，即在开始时输入参数，在最后一层输出特征结果，提取的特征往往不够显著。

名称为“一种基于混合神经网络的风力发电机故障识别方法”，专利号为[CN202110488921.7]的专利，提供了一种基于混合神经网络的风力发电机故障识别方法,具体包括采集齿轮箱时域波形数据,建立原始样本数据，并为数据打标签；提取波形数据中振幅的最小值、振动速度和峭度指标作为特征；将提取的故障和正常特征值输入到混合网络1D-CNN-Bi-GRU中，混合网络串联了1D-CNN和Bi-GRU，首先利用1D-CNN作为初级网络提取序列局部特征，然后将1D-CNN的输出作为Bi-GRU的输入，利用Bi-GRU的特性，同时获得正向来自过去和反向的来自未来的累积依赖信息，进一步提取序列的长期依赖特征来进行故障诊断；保存模型，将待分析的数据输入到模型中，输出故障分类结果。

由于现有故障识别方法采用先提取电机状态的浅层特征或深层特征，后采用时间序列模型预测深层特征的变化趋势，以预测残差值来表征电机的状态，未能综合提取电机状态的不同维度特征，因此存在电机状态特征提取不全面，状态预测的精度较低等缺点。

发明内容

为了克服上述现有技术的缺点，本发明的目的在于提供一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，通过分析异步电机大量历史数据，对未来某一时间段异步电机运行状态进行预测，并对预测后的状态进行评估，可检测异步电机潜在的异常状态，并在故障进一步恶化之前合理安排维护措施，具有提高电机可靠性、降低维护成本的特点。

为实现上述目的，本发明采取的技术方案是：

一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，包括以下步骤：

步骤一：采集煤矿机械电机数据，所述的煤矿机械电机数据包括电流、前轴温度、后轴温度、绕组温度、环境温度、皮带秤瞬时量6个状态参数；并将这6个状态参数作为样本数据集；

步骤二：将步骤一的样本数据集进行预处理，剔除非正常项后进行最小最大值归一化处理；

步骤三：将步骤二预处理后的数据进行皮尔逊相关系数Pearson分析，得到相关性系数，以相关性系数作为各参数的加权系数，通过加权系数实现数据融合，得到一维融合参数D；

步骤四：对经典卷积神经网络CNN架构进行三组特征提取，利用核主成分分析KPCA将三组特征提取的结果降为一维，得到K-CNN模型；

步骤五：将步骤三得到的一维融合参数D输入到步骤四得到的K-CNN模型，得到特征提取结果，将得到的特征提取结果划分训练集和测试集；

步骤六：将训练集输入到门控循环单元GRU模型中，GRU模型输出预测值，将输出的预测值，使用均方误差函数作为损失函数来计算实际值与预测值之间的误差，并使用优化器优化目标函数，调整模型参数使得目标函数达到最小值，此时训练所得模型的性能最佳，模型训练好后，将测试集输入到门控循环单元GRU模型中，模型输出预测后的值及均方根误差RMSE；

步骤七：利用神经网络架构搜索NAS，改进并优化门控循环单元GRU算法，得到N-GRU模型；

步骤八：将步骤五得到的K-CNN模型提取后的特征结果输入到步骤七得到的N-GRU模型做预测，得到未来一周的数据，即K-CNN--N-GRU模型输出结果；

步骤九：计算步骤八得到的K-CNN--N-GRU模型输出结果与真实值之差即预测残差；

步骤十：采用滑动平均滤波法对步骤九得到的进行平滑处理，并保证模型的输出和输入长度相等；

步骤十一：针对步骤十平滑处理后的预测残差数据，使用网格搜索GridSearchCV寻找似然估计最大化时的带宽即最优带宽，通过核密度估计KDE得到概率密度函数，并用辛普森Simpson对概率密度函数求积分到0.95即95％的置信区间，从而得到告警阈值。

所述步骤二中的数据预处理包括：(1)剔除单一状态参数超过告警阈值的数据；(2)参考电机的故障日志，剔除人工停机和故障停机时的数据；(3)通过最小最大值归一化来消除量纲，以线性的方式把数据转换到[0，1]之间，变量α的第i个数据归一化后的值αi*：

式中，αi为变量α的第i个数据归一化前的值，α_max、α_min分别为变量α中的最大值和最小值。

所述步骤三中的一维融合参数D，具体过程包括：

皮尔逊相关系数r_XY计算：

式中，X、Y为两组变量；X_i、X_j分别为变量X的第i、j个数值；Y_i、Y_j分别为变量Y的第i、j个数值；n为变量X或Y的长度；

权重系数U_B*计算：

式中，U_B、U_C为相关性系数，其中B＝1，2，......，m，m为状态参数个数；

通过权重系数加权得到一维融合参数D，从而实现数据融合，加权后的一维融合参数D计算：

式中，A_B为A第B个状态参数对应的全部数据。

所述步骤四利用核主成分分析KPCA将三组特征提取的结果降为一维过程为：核主成分分析KPCA对原始数据空间R即对CNN架构进行三组特征提取后输出的数据，进行非线性映射Φ：R→F；具体如下：

(1)原始数据xk(k＝1，2，.........，N)在特征空间F的映射为Φ(x_k)(k＝1，2，.........，N)，设Φ(x_k)已去均值，即

则Φ(x_k)的协方差为：

式中x_k为原始数据，Φ(x_k)为原始数据在特征空间F上的映射，Φ^T(x_k)为Φ(x_k)的转置，其中k＝1，2，.........，N，N为原始数据的个数；

(2)矩阵ST对应的特征方程为：

λV＝S_TV；

式中，λ为特征值，V为特征向量；

将Φ(x_k)与矩阵S_T对应的特征方程作内积得：

λ[Φ(x_k)V]＝Φ(x_k)S_TV (k＝1,2,…,N)；

(3)特征向量V可由Φ(x_l)线性表示：

式中，a_l为相关系数，l＝1，2......，N；

进一步得：

(4)定义矩阵K∈R^N×N，令K_kl＝Φ(x_k)Φ(x_l)，上述方程式可以表示为NλKa＝KKa，即Nλa＝Ka；

由特征向量a求出S_T的特征向量V，得到映射空间F的主元方向；对K进行对角化，λ₁≥λ₂≥......≥λ_p≥......≥λ_N表示K的特征值，a₁，a₂，......，a_p，......，a_N为对应的特征向量；设λ_p为大于零的最小特征值，对特征向量进行归一化，令：

式中，V_β是指S_T的第β个特征向量，V_β ^T是V_β的转置；

(5)计算M个测试样本在特征空间中前p个轴的投影为：

[Φ(y₁),Φ(y_z),…,Φ(y_M)]^T[V₁,V₂,…,V_p]＝K_test[a₁,a₂,…,a_p]＝Λ∈R^M×p

式中，y_R为测试数据，Φ(y_R)为测试数据在特征空间F上的映射，R＝1,2,......,M，M指测试数据的个数；a_β为K对应的特征向量，β＝1，2，......，p，p指投影轴的个数；其中：

对映射数据K进行中心化，进而得到：

式中，Q_N为系数为1/N的N×N阶单位矩阵；

高斯核函数

其中参数σ²为自变量，表示核的宽度，由核函数参数优化方法获得。

所述步骤五得到特征提取结果的过程为：按照故障日志和预测时长来划分练集和测试集，并通过比较时间窗口依次为5、10、15、20时的均方根误差RMSE值，选择均方根误差RMSE值最小时对应的时间窗口。

所述步骤六的调整模型参数使得目标函数达到最小值，此时训练所得模型的性能最佳，过程为：通过比较Epoch依次为4、8、12、16、20时的均方根误差RMSE值，并选择均方根误差RMSE值最小时对应的Epoch，在每次训练迭代时计算损失函数的梯度，进而更新GRU模型的权重和偏置。

所述步骤六所述GRU模型的初始设置为：第一层GRU的优化器为adam，激活函数为tanh函数，用于循环时间步的激活函数为sigmoid函数，神经元个数为5，第二层全连接层Dense的神经元个数为1。

所述步骤七得到N-GRU模型具体如下：

使用四层神经网络来进行时序预测，第一、二层为门控循环单元GRU，第三、四层为全连接层Dense，网络架构为：输入→门控循环单元GRU→门控循环单元GRU→全连接层Dense→全连接层Dense→输出；

搜索空间设置包括：第一层GRU中激活函数为sigmoid函数或tanh函数，神经元个数为4或5或6，用于循环时间步的激活函数为sigmoid函数或tanh函数；第二层GRU中神经元个数为0或4或8或16；第三层Dense中神经元个数为0或4或8或16，第四层神经元个数为1；共包括192个组合；搜索策略为：针对目标函数

其中，L表示数据的样本个数，Fu表示实际数据，Fu′表示预测数据，调用函数对上述192种组合进行多目标搜索，得到所有组合的均方根误差RMSE，通过比较找到RMSE最小的组合，按照该组合进行参数设置，即得N-GRU模型。

所述步骤七构建N-GRU模型时，搜索策略共包含三种，具体为：

(1)强化学习搜索策略

调用policy_gradient函数对上述192种组合进行多目标搜索，得到所有组合的均方根误差RMSE，通过比较找到RMSE最小的组合。强化学习算法中的梯度计算公式为：

式中，π_θ(c_t|s_t)表示用参数θ进行函数拟合而获得的策略函数，进而可以获得在状态s下执行动作c的概率；

为梯度，G_t为未来累积奖励，

为π_θ的期望值，T(θ)为目标函数；

优化目标函数T(θ)时采用随机梯度上升方法，获得最大的未来累积奖励，计算公式为：

式中，θ为网络参数，κ为学习率；

(2)遗传算法搜索策略

基于进化算法的方法，采用遗传算法，选择算子的公式为：

式中，f_o为第o个个体的适应度，

为第o个体被选择的概率，O为群体大小；

交叉算子是遗传算法中产生新个体的主要方法，因具有全局搜索能力被作为主要算子；而变异算子只是产生新个体的辅助方法，只有局部搜索能力，这里采用单点交叉算子和基本位变异算子；

遗传算法中需要选择确定的运行参数主要有群体大小O、终止代数T、交叉概率P_c和变异概率P_m；P_c和P_m能够随着适应度自动改变，P_c和P_m按以下公式计算：

式中，f_max为群体中最大的适应度，f_avg为每代群体的平均适应度，f′为交叉的两个个体中较大的适应度，f为变异个体的适应度，P_c1＝0.8，P_c2＝0.5，P_m1＝0.1，P_m2＝0.001；

(3)可微分网络架构搜索DARTS

采用可微分网络架构搜索DARTS，DARTS定义的cell共包含7个结点，其中前两个结点为输入结点，分别代表最近临的前两个cell的输出，中间的4个结点，每个都通过有向边与其所有前序结点相连，公式如下：

式中，g^(J)为cell的中间结点，g^(H)为输入结点或中间结点，I^(H,J)为连接g^(H)和g^(J)的混合操作，H和J均为结点序号；

可微分网络架构搜索DARTS在cell中引入了架构参数δ，将离散问题转化为连续参数的优化问题，以架构参数作为权重，构建了加权的混合操作；该算法还使用softmax函数对架构参数进行松弛化操作，把架构参数的值归一化到(0,1)之间；松弛化操作后，上述公式中的混合操作I(H,J)变形为：

式中，

为松弛化后的混合操作，δ_I ^(H,J)和δ_I′ ^(H,J)均为连接g^(H)和g^(J)的某个候选操作I对应的架构参数；

所述步骤十中采用滑动平均滤波法对预测残差进行平滑处理，公式为：

式中，e为原始时间序列，

为平滑处理后的时间序列，τ为滑动窗口大小，w＝τ+1，τ+2，......，ε+1，其中ε为原始时间序列的长度，滑动窗口为50，mode选择“same”模式以保证输出和输入长度相等。

相对于现有技术，本发明的有益效果为：

1、传统的电机状态预测方法无法体现不同监测参数对状态预测的重要性，本发明采用皮尔逊相关系数Pearson计算电机各监测参数的相关性，并通过相关性系数得到权重系数，加权求和得到一维融合参数，从而实现数据融合，为电机的状态预测提供一维观测指标，加权后的一维融合参数变化趋势较单一状态变量更加稳定，体现出不同监测参数对状态预测的重要性。

2、本发明克服了传统卷积神经网络只提取最深层特征而无法实现特征选择的缺点，采用卷积神经网络的各卷积层提取多维度不同层次的状态特征，然后使用核主成分分析法对多维状态特征进行选择与融合，能够准确表征电动机状态变化的一维特征，更加准确地提取电机状态特征。

3、本发明构建了N-GRU模型，采用神经网络架构搜索(NAS)优化GRU的结构参数，搭建的NAS搜索架构包括三种参数寻优方法，分别为基于强化学习的参数优化，基于进化算法的参数优化以及基于梯度下降的参数优化，该搜索架构根据模型输入数据的特点，自适应选择不同参数寻优方法，提高了网络参数优化的效率和网络模型的预测精度，与传统的基于遗传算法或粒子群算法相比，更具有普适性，提高了GRU网络参数的优化效率，解决了传统GRU算法参数欠优化问题。

附图说明

图1是本发明的流程图。

图2本发明K-CNN模型的结构流程图。

图3是本发明K-CNN模型与CNN模型特征提取结果对比图。

图4是本发明N-GRU模型的结构流程图。

图5是本发明多算法预测结果对比图。

图6是本发明多算法预测残差对比图。

图7是本发明核密度估计KDE求得的概率密度函数图。

图8是本发明绕组温度超过告警阈值的趋势图。

图9是本发明预测残差经平滑处理后与阈值的对比图。

具体实施方式

下面结合附图对本发明的工作原理作详细叙述。

如图1所示，一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，包括以下步骤：

步骤一：采集煤矿机械电机数据，并将其作为样本数据集，样本数据集包括电流、前轴温度、后轴温度、绕组温度、环境温度、皮带秤瞬时量，6个状态参数，这6个状态参数均由安装在电机上的传感器获取；

步骤二：将步骤一的样本数据集进行预处理，包括：(1)剔除前轴温度大于90℃的数据，剔除后轴温度大于90℃的数据，剔除绕组温度大于120℃的数据；(2)参考电机的故障日志，剔除人工停机和故障停机时的数据；(3)通过最小最大值归一化来消除量纲，以线性的方式把数据转换到[0,1]之间，公式为：

式中，α_i、α_i ^*分别为变量α的第i个数据归一化前后的值，α_max、α_min分别为变量α中的最大值和最小值；

步骤三：经步骤二预处理后样本数据集分别和后轴温度、前轴温度、电流通过皮尔逊相关系数Pearson，得到相关性系数，通过权重分配得到权重系数，如表1、表2、表3所示，具体过程包括：

皮尔逊相关系数r_XY计算：

式中，X、Y为两组变量；X_i、X_j分别为变量X的第i、j个数值；Y_i、Y_j分别为变量Y的第i、j个数值，n为变量X或Y的长度；

权重系数U_B ^*计算：

式中，U_B、U_C为相关性系数，其中B＝1，2，......，m，m为状态参数个数；表1后轴温度相关性分析

表2前轴温度相关性分析

表3电流相关性分析

根据表1、表2、表3中的权重系数分别加权得到一维融合参数D₁、D₂、D₃，从而实现数据融合，一维融合参数D计算公式为：

式中，A_B为A第B个状态参数对应的全部数据；

将得到的一维融合参数D₁、D₂、D₃两两之间通过皮尔逊相关系数Pearson，公式同上，得到相关性系数，如表4所示：

表4相关性分析

由表4可知，一维融合参数D₁、D₂、D₃两两之间相关性极高，说明选择其中任何一个都能体现一维融合参数的整体走向和变化趋势，此处选择一维融合参数D₁作为后续模型输入；

如图2所示，步骤四：构建K-CNN模型

对经典卷积神经网络CNN架构进行三组特征提取；核主成分分析KPCA对原始数据空间R即对CNN架构进行三组特征提取后输出的数据进行非线性映射Φ：R→F；

(1)原始数据x_k(k＝1，2，......，N)在特征空间F的映射为Φ(x_k)(k＝1,2,......,N)，设Φ(x_k)已去均值，即

则Φ(x_k)的协方差为

式中，x_k为原始数据，Φ(x_k)为原始数据在特征空间F上的映射，Φ^T(x_k)为Φ(x_k)的转置，其中k＝1，2，......，N，N为原始数据的个数

(2)矩阵S_T对应的特征方程为

λV＝S_TV (6)

式中，λ为特征值，V为特征向量

将Φ(x_k)与式(6)作内积得

λ[Φ(x_k)V]＝Φ(x_k)S_TV (k＝1,2,…,N) (7)

(3)特征向量V可由Φ(x_l)线性表示

式中，a_l为相关系数，其中l＝1，2，......，N。

将式(8)代入式(7)得

(4)定义矩阵K∈R^N×N，令K_kl＝Φ(x_k)Φ(x_l)，式(9)可以表示为NλKa＝KKa，即Nλa＝Ka；

由特征向量a求出S_T的特征向量V，得到映射空间F的主元方向；对K进行对角化，λ₁≥λ₂≥......≥λ_p≥......≥λ_N表示K的特征值，a₁，a₂，......，a_p，......，a_N为对应的特征向量，设λ_p为大于零的最小特征值，对特征向量进行归一化，令

式中，V_β是指S_T的第β个特征向量，V_β ^T是V_β的转置。

(5)计算M个测试样本在特征空间中前p个轴的投影为

[Φ(y₁),Φ(y_z),…,Φ(y_M)]^T[V₁,V₂,…,V_p]＝K_test[a₁,a₂,…,a_p]＝Λ∈R^M×p (11)

式中，y_R为测试数据，Φ(y_R)为测试数据在特征空间F上的映射，R＝1，2，......，M，M指测试数据的个数；a_β为K对应的特征向量，β＝1，2，......，p，p指投影轴的个数，其中

对映射数据进行中心化，相应K变为

式中，Q_N为系数为1/N的N×N阶单位矩阵，用K代替式中的K即可中心化

高斯核函数

其中，参数σ²为自变量，表示核的宽度，由核函数参数优化方法获得；利用核主成分分析KPCA将三组特征提取的结果降为一维，便于后期进行状态预测，上面所述即为K-CNN模型构建过程；

一维融合参数D₁共有29460个数据，将其划分为60个样本，每个样本里有491个数据，因此K-CNN模型的输入维度为[60,491,1]，特征提取最终的输出维度均为[60，1，491]；

将特征提取结果合并为一个整体，总输入维度为[60，491，3]，经核主成分分析KPCA降维后输出维度为[60，491，1]，此为K-CNN模型的输出结果；

如图3所示，将K-CNN模型和卷积神经网络CNN模型特征提取的结果进行对比，可见K-CNN模型提取后的特征比卷积神经网络CNN更明显，峰值部分更突出，更能表征出数据的变化趋势；

步骤五：数据集划分：故障日志表明电机在2021年12月14日4:23出现电机绕组超温异常，将步骤四K-CNN模型得到的结果前27443个数据作为训练集，后672个数据作为测试集，如表5，以10个步长作为一个时间窗，前9个数据作为模型输入，来预测第10个数据值：

表5不同时间窗口下RMSE值

步骤六：将训练集输入到门控循环单元GRU模型中，输出预测后的值，使用均方误差(RMSE)函数作为损失函数来计算实际值与预测值之间的误差，并使用adam优化器优化目标函数，如表6，取Epoch＝12，在每次训练迭代时计算损失函数的梯度，进而更新门控循环单元GRU模型的权重和偏置；

表6不同Epoch下RMSE值

传统门控循环单元GRU模型一般有两层神经网络：第一层为门控循环单元GRU，第二层为全连接层，GRU单元结构可描述为：

z_t＝ω(W_xzd_t+W_hzh_t-1+b_z) (13)

r_t＝ω(W_xrd_t+W_hrh_t-1+b_r) (14)

式中，dt为当前层第t个时间步的输入向量，h_t-1为第t-1个时间步保存的输出向量，z_t为第t个时间步的更新门，r_t为第t个时间步的重置门，激活函数ω为Sigmoid函数，

为第t个时间步的候补隐藏状态，h_t为当前状况下的输出向量，Tanh函数为双曲正切函数，W_xz、W_xr、W_xh、W_hz、W_hr、W_hh都是权重参数，b_z、b_r、b_h则是偏置向量；

GRU模型初始设置：第一层门控循环单元GRU的优化器(optimizer)为adam，激活函数(activation)为tanh函数，用于循环时间步的激活函数(recurrent_activation)为sigmoid函数，神经元个数(neurons1)为5，第二层全连接层Dense的神经元个数为1；

在模型训练好后，将测试集输入到门控循环单元GRU模型中，输出预测后的值及均方根误差RMSE；

如图4所示，步骤七：构建N-GRU模型

利用神经网络架构搜索(NAS)，改进并优化传统的门控循环单元GRU算法，得到N-GRU模型，N-GRU模型主要考虑使用最多四层神经网络来进行时序预测，第一、二层为门控循环单元GRU，第三、四层为全连接层Dense，网络架构为：输入→门控循环单元GRU→门控循环单元GRU→全连接层Dense→全连接层Dense→输出；

搜索空间：第一层门控循环单元GRU中的激活函数为tanh函数或sigmoid函数，2种选择，神经元个数为4或5或6，3种选择，用于循环时间步的激活函数有tanh函数或sigmoid函数，2种选择；第二层门控循环单元GRU的神经元个数为0或4或8或16，4种选择；第三层全连接层Dense中神经元个数为0或4或8或16，4种选择；第四层全连接层Dense中神经元个数为1，1种选择，总共有2×3×2×4×4×1＝192个组合；

搜索策略：针对目标函数

其中，L表示数据的样本个数，F_u表示实际数据，F_u′表示预测数据；

通过基于进化算法的方法，采用遗传算法，选择算子的公式为：

式中，f_o为第o个个体的适应度，

为第o个个体被选择的概率，O为群体大小，交叉算子是遗传算法中产生新个体的主要方法，因具有全局搜索能力被作为主要算子；而变异算子只是产生新个体的辅助方法，因只有局部搜索能力被作为辅助算子，这里采用单点交叉算子和基本位变异算子；

遗传算法中需要选择确定的运行参数主要有群体大小O、终止代数T、交叉概率P_c和变异概率P_m等，P_c和P_m能够随着适应度自动改变，P_c和P_m按以下公式计算：

采用上述遗传算法调用maximize函数对上述192种组合进行多目标搜索，得到所有组合的均方根误差RMSE，通过比较找到均方根误差RMSE最小的组合，按照该组合进行参数设置，即得N-GRU模型；

搜索结果：第一层门控循环单元GRU的神经元个数为4，激活函数为sigmoid函数，用于循环时间步的激活函数为relu函数；第二层门控循环单元GRU的神经元个数为0，第三层全连接层Dense的神经元数量为16，其余参数默认为门控循环单元GRU模型初始设置，最终选择的网络架构去掉第二层门控循环单元GRU，即输入→门控循环单元GRU→全连接层→全连接层→输出，此网络架构即为N-GRU。

如图5所示，步骤八：根据以上步骤分别运用门控循环单元GRU模型和N-GRU模型来预测未来一周的数据，K-CNN--N-GRU模型即先通过K-CNN模型特征提取后采用N-GRU模型做预测，K-CNN--GRU模型即先通过K-CNN模型特征提取，后采用门控循环单元GRU做预测，CNN--GRU模型即先通过卷积神经网络CNN特征提取，后采用门控循环单元GRU做预测，将K-CNN--N-GRU模型与K-CNN--GRU、CNN--GRU的预测结果作对比，选取均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE作为误差评价指标，通过这三个指标对各预测模型性能进行比较，如表7

表7误差评价指标

Models	RMSE	MAPE(％)	MAE
				CNN--GRU	0.0439	6.2704	0.0351
K-CNN--GRU	0.0405	5.5411	0.0326
				K-CNN--N-GRU	0.0363	4.8291	0.0283

如图6所示，步骤九：得到上述K-CNN--N-GRU与K-CNN--GRU、CNN--GRU模型的预测残差对比图，预测残差即预测值与真实值之差；

步骤十：采用滑动平均滤波法对预测残差进行平滑处理，公式为：

式中，e为原始时间序列，ē为平滑处理后的时间序列，τ为滑动窗口大小，w＝τ+1,τ+2,......,ε+1，其中ε为原始时间序列的长度；

滑动窗口为50，mode中有‘full’，‘valid’，‘same’三种模式可选，此处选择‘same’模式，可以保证输出和输入长度相等；

如图7所示，步骤十一：针对训练集的残差数据，使用网格搜索GridSearchCV寻找似然估计最大化时的带宽，即最优带宽，经计算为0.011，通过核密度估计KDE得到概率密度函数，并用辛普森Simpson对概率密度函数求积分到0.95，即95％的置信区间，得到阈值为0.0192。

如图8所示，故障日志表明电机在2021年12月14日4:23分出现电机绕组超温异常，绕组温度在第147.6849h超过告警阈值100，此阈值为企业设定的告警阈值。

如图9所示，可以看出经平滑处理后，总的上升趋势更加明显，线条更加光滑，更能直观地反映未来的变化趋势，因此有必要对预测残差进行平滑处理；K-CNN--N-GRU模型对应的预测残差在第75h后，总的趋势是一直在上升，且在第126.6042h超过告警阈值0.0192，即电机进入异常告警状态，相比实际出现绕组超温异常而言，提前约21h发现异常，便于及时安排维护策略，K-CNN--GRU比实际出现绕组超温异常而言提前约12.7h发现异常，CNN--GRU比实际出现绕组超温异常而言滞后约1h发现异常K-CNN--GRU、CNN--GRU以及实际出现绕组超温异常均比K-CNN--N-GRU模型发现异常时间晚。

Claims

1.一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，包括以下步骤：

步骤三：将步骤二预处理后的样本数据集进行皮尔逊相关系数Pearson分析，得到相关性系数，以相关性系数作为各参数的加权系数，通过加权系数实现数据融合，得到一维融合参数D；

步骤十：采用滑动平均滤波法对步骤九得到的预测残差数据进行平滑处理，并保证模型的输出和输入长度相等；

2.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，所述步骤二中的样本数据集预处理包括：(1)剔除单一状态参数超过告警阈值的数据；(2)参考电机的故障日志，剔除人工停机和故障停机时的数据；(3)通过最小最大值归一化来消除量纲，以线性的方式把数据转换到[0，1]之间，变量α的第i个数据归一化后的值αi*：

3.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，所述步骤三中的一维融合参数D，具体过程包括：

皮尔逊相关系数r_XY计算：

权重系数U_B*计算：

式中，A_B为A第B个状态参数对应的全部数据。

4.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，所述步骤四利用核主成分分析KPCA将三组特征提取的结果降为一维过程为：核主成分分析KPCA对原始数据空间R即对CNN架构进行三组特征提取后输出的数据，进行非线性映射Φ：R→F，具体如下：

(1)原始数据xk(k＝1，2，.........，N)在特征空间F的映射为Φ(x_k)(k＝1，2，........，N)，设Φ(x_k)已去均值，即

则Φ(x_k)的协方差为：

(2)矩阵ST对应的特征方程为：

λV＝S_TV；

式中，λ为特征值，V为特征向量；

将Φ(x_k)与矩阵S_T对应的特征方程作内积得：

λ[Φ(x_k)V]＝Φ(x_k)S_TV (k＝1，2，…，N)；

(3)特征向量V可由Φ(x_l)线性表示：

式中，a_l为相关系数，l＝1，2......，N；

进一步得：

式中，V_β是指S_T的第β个特征向量，V_β ^T是V_β的转置；

(5)计算M个测试样本在特征空间中前p个轴的投影为：

[Φ(y₁)，Φ(y_z)，…，Φ(y_M)]^T[V₁，V₂，…，V_p]＝K_test[a₁，a₂，…，a_p]＝Λ∈R^M×p

式中，y_R为测试数据，Φ(y_R)为测试数据在特征空间F上的映射，R＝1，2，......，M，M指测试数据的个数；a_β为K对应的特征向量，β＝1，2，......，p，p指投影轴的个数；其中：

对映射数据K进行中心化，进而得到：

式中，Q_N为系数为1/N的N×N阶单位矩阵；

高斯核函数

5.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，所述步骤五得到特征提取结果的过程为：按照故障日志和预测时长来划分练集和测试集，并通过比较时间窗口依次为5、10、15、20时的均方根误差RMSE值，选择均方根误差RMSE值最小时对应的时间窗口。

6.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，所述步骤六的调整模型参数使得目标函数达到最小值，此时训练所得模型的性能最佳，过程为：通过比较Epoch依次为4、8、12、16、20时的均方根误差RMSE值，并选择均方根误差RMSE值最小时对应的Epoch，在每次训练迭代时计算损失函数的梯度，进而更新GRU模型的权重和偏置。

7.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，步骤六所述GRU模型的初始设置为：第一层GRU的优化器为adam，激活函数为tanh函数，用于循环时间步的激活函数为sigmoid函数，神经元个数为5，第二层全连接层Dense的神经元个数为1。

8.根据权利要求1所述的一种基于K-CNN--N-GRU的煤矿机械电机状态预测方法，其特征在于，所述步骤七具体如下：