CN117009841A

CN117009841A - 一种模型训练方法、电机故障诊断方法和微控制器

Info

Publication number: CN117009841A
Application number: CN202310853844.XA
Authority: CN
Inventors: 柳雅倩; 王建国; 蔡浩原; 申亚琪
Original assignee: Suzhou Geniitek Sensor Co ltd
Current assignee: Suzhou Geniitek Sensor Co ltd
Priority date: 2023-07-12
Filing date: 2023-07-12
Publication date: 2023-11-07

Abstract

本发明公开了一种模型训练方法、电机故障诊断方法和微控制器，其中一种模型训练方法，包括获取电机的历史振动信号及其所对应的故障类型标签，生成样本数据集；历史振动信号为时域连续的三维振动信号；以至少部分样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型；一维卷积神经网络各层按顺序依次为输入层、一维卷积层、一维最大池化层、随机失活层、展平层、第一全连接层、第二全连接层；其中，采用随机失活层用于剔除一维卷积神经网络模型中的部分神经元。本发明提供的模型能处理大规模的复杂数据并有效地预测，降低了计算资源占用，将第一随机失活层设在一维最大池化层和展平层之间，降低了模型的过拟合风险。

Description

一种模型训练方法、电机故障诊断方法和微控制器

技术领域

本发明涉及振动信号处理领域，特别涉及一种模型训练方法、电机故障诊断方法和微控制器。

背景技术

在工业场景中，对设备进行预测性诊断和维护能够预防硬件故障，减少停机时间和维修成本，同时能够加强工作场所安全，降低人员伤害风险。传统的故障诊断大多采用基于统计分析的方法或者是基于信号处理的方法，上述技术的核心是对历史过程数据进行统计分析，计算出每个样本相应的统计量以估计当前样本的运行状态，以及对提取的信号做检测和处理，诊断的过程要求操作者掌握大量的数据处理方法，十分依赖于经验，难以满足当下工业发展中的需求，因此故障诊断方法应由传统向智能化、高效化的方向改变。

近年来，基于人工智能的故障诊断模型方兴未艾，这些以大数据为中心的模型和方法，训练和分析过程需要极高的算力，特别是在深度学习领域，由于电机复杂多变的工作状况产生了海量数据，计算资源的过度占用和功耗增加问题也随之而来，这些问题会影响诊断效率，难以实现设备端数据的实时分析和监测。工业的预测性维护需要在物联网的设备端布置大量传感器来收集设备运转产生的数据，监测设备的运行状况，如何在资源受限的设备端微控制器上实现实时高效的故障诊断是相关研究的重点和难点。

发明内容

本发明提供了一种模型训练方法、电机故障诊断方法和微控制器，降低了一维卷积神经网络模型的深度和复杂度，减轻了计算资源的过度占用，提高了故障诊断效率。

本发明第一方面公开了一种模型训练方法，包括：

获取电机的历史振动信号及其所对应的故障类型标签，生成样本数据集；历史振动信号为时域连续的三维振动信号；

以至少部分样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型；一维卷积神经网络各层按顺序依次为输入层、一维卷积层、一维最大池化层、随机失活层、展平层、第一全连接层、第二全连接层；

其中，采用输入层用于接收历史振动信号，采用一维卷积层用于从历史振动信号数据中提取特征并输出特征图，采用一维最大池化层用于对特征图进行采样，采用随机失活层用于剔除一维卷积神经网络模型中的部分神经元，采用展平层用于将特征图降为一维，采用第一全连接层用于对降为一维的特征图进行线性变换，采用第二全连接层用于对经线性变换的特征图进行分类并输出故障类型标签。

优选地，获取电机的历史振动信号及其所对应的故障类型标签之后，包括如下预处理：

采用滑动窗口法对时域连续的历史振动信号进行切分生成样本数据集；

切分的滑动窗口长度为a，滑动步长为b，历史振动信号数据的总采样点数为M，则最后得到的样本数据集中的总样本数量N₁的计算公式(1)为：

优选地，滑动窗口长度a等于样本长度，样本长度为2ⁿ个采样点；

或，

样本长度为2n个采样点；

其中，n为正整数。

优选地，获取电机的历史振动信号及其所对应的故障类型标签之后，还包括如下预处理：

对时域连续的三维振动信号按照公式(2)进行归一化处理；

其中，D_raw为三维振动信号，D′为经归一化后的三维振动信号，max D_raw表示三维振动信号的最大值，min D_raw表示三维振动信号的最小值；

对归一化后的三维振动信号数据按照公式(3)进行傅里叶变换，变换为三维频域信号；

其中，D′(t)表示三维振动信号在时间轴上的变化，表示对在时间轴上的变化的三维振动信号进行傅里叶变换，D(ω)表示三维频域信号，ω表示三维频域信号的频率；

对三维频域信号数据取半并对其在竖直方向做拼接得到融合振动信号作为样本数据集。

进一步地，以至少部分样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型，包括：

利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值并基于损失值对一维卷积神经网络模型的参数进行优化；

在判断达到模型训练收敛条件时停止训练，得到目标一维卷积神经网络模型；

交叉熵损失函数定义公式(4)为：

其中，N₂为参与模型训练例子的数量，每个例子有C个可能的故障类型；y_i＝[y_i1,y_i2,…,y_iC]表示第i个例子在每个故障类型的真实概率分布；当第j类是第i个例子的真实故障类型时，y_ij＝1，当第j类不是第i个例子的真实故障类型时，y_ij＝0；p_i＝[p_i1,p_i2,…,P_iC]表示第i个例子在每个故障类型的预测概率分布，其中p_ij是第i个例子的第j类的故障类型预测概率。

优选地，利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值并基于损失值对一维卷积神经网络模型的参数进行优化包括：

利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值；

利用Adam函数确定损失值对应的梯度值，并基于梯度值更新一维卷积神经网络模型的参数；

迭代上述过程直至交叉熵损失函数的损失值最小化。

优选地，一种模型训练方法，还包括：对目标一维卷积神经网络的参数进行压缩；

和/或，

将目标一维卷积神经网络的一维卷积层和一维最大池化层合并为一层一维汇合层；

其中，对目标一维卷积神经网络的参数进行压缩包括：

对目标一维卷积神经网络模型的参数进行提取并展平，获得一维参数向量；

利用K-means聚类算法将所有一维参数向量聚类为K个簇并确定每个簇的质心；

将每个一维参数向量中的参数替换为对应簇的质心。

本发明第二方面公开了一种电机故障诊断方法，应用于第一方面的目标一维卷积神经网络模型中，包括：

采集电机的实时振动信号，输入至目标一维卷积神经网络模型，输出预测的故障类型标签；

目标一维卷积神经网络各层按顺序依次为输入层、一维汇合层、随机失活层、展平层、第一全连接层、第二全连接层；

其中，采用输入层用于接收实时振动信号，采用一维汇合层用于减少特征图的空间尺寸，并保留主要的特征信息，采用随机失活层用于剔除目标一维卷积神经网络模型中的部分神经元，采用展平层用于将特征图降为一维，采用第一全连接层用于对降为一维的特征图进行线性变换，采用第二全连接层用于对经线性变换的特征图进行分类并输出预测的故障类型标签。

优选地，电机故障诊断方法应用在设备端微控制器，目标一维卷积神经网络模型部署在设备端微控制器。

进一步地，电机故障诊断方法应用在设备端微控制器，目标一维卷积神经网络模型部署在设备端微控制器，包括：

调用初始化函数，初始化目标一维卷积神经网络模型和通信接口；

利用通信接口采集实时振动信号数据；

对实时振动信号进行预处理；预处理包括：切分实时振动信号，并做归一化，对归一化后的数据进行傅里叶变换得到频域数据；

采用目标一维卷积神经网络模型对频域数据进行预测，得到预测的故障类型标签。

优选地，利用通信接口采集实时振动信号数据，包括：

通信接口从外部传感器采集实时振动信号；实时振动信号为传感器采集并按照公式(6)解析处理后得到；实时振动信号为三轴振动加速度信号；三轴振动加速度信号数据共有16位，每个轴的加速度数据分别存放在两个寄存器中；

其中，为三轴振动加速度信号在X轴的高位数据，/>为三轴振动加速度信号在X轴的低位数据，acc_x为三轴振动加速度信号在X轴的数据，Sensitivity为公式(6)的权重，g为地球加速度。

本发明第三方面公开了一种微控制器，布置在设备端，微控制器上布置有第一方面的目标一维卷积神经网络模型，且用于执行第二方面的电机故障诊断方法。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本申请提供了一种模型训练方法、电机故障诊断方法和微控制器，其中模型训练的方法包括获取电机的历史振动信号及其所对应的故障类型标签，生成样本数据集；以至少部分样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型；一维卷积神经网络各层按顺序依次为输入层、一维卷积层、一维最大池化层、随机失活层、展平层、第一全连接层、第二全连接层；其中，采用输入层用于接收历史振动信号，采用一维卷积层用于从历史振动信号数据中提取特征并输出特征图，采用一维最大池化层用于对特征图进行采样，采用随机失活层用于剔除一维卷积神经网络模型中的部分神经元，采用展平层用于将特征图降为一维，采用第一全连接层用于对降为一维的特征图进行线性变换，采用第二全连接层用于对经线性变换的特征图进行分类并输出故障类型标签。本发明提供的一维卷积神经网络的设计是相对节约资源的，一维卷积层减少了可训练参数的总体数量，一维最大池化层有助于降低特征图的维度，降低了全连接层的计算成本，且一维最大池化层输出的尺寸比一维卷积层小，从而产生更少的参数和计算负担。同时，将随机失活层放在一维最大池化层之后，可以将随机失活层应用于第一全连接层和第二全连接层中，保留了池化层输出的相对位置信息，在第一全连接层和第二全连接层中减少了一些过拟合，使训练数据得到更有效的利用，减少了计算量，提高了计算速度，能处理大规模的复杂数据并有效地预测。对采用的一维卷积神经网络模型的结构进行优化，降低了模型的深度与复杂度，降低了资源占用，提高了模型的鲁棒性，使得模型后续可以被布置在设备端，提高了模型诊断的效率。

进一步地，采集电机的三维振动信号并融合相比只采集电机其中的一个振动信号幅值较大的数据进行分析，具有更准确、更详细、更可靠的特点，有利于更精确地分析电机的振动信号的特征。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的模型训练方法的一维卷积神经网络模型结构图；

图2是本发明实施例提供的模型训练方法的数据切分示意图；

图3是本发明实施例提供的模型训练方法的频域转换示意图；

图4是本发明实施例提供的电机故障诊断方法的原理图；

图5是本发明实施例提供的电机故障诊断方法的实际使用流程图；

图6是本发明实施例提供的电机故障诊断方法的预测处理流程图；

图7是本发明实施例提供的电机故障诊断方法的识别结果的混淆矩阵；

图8是本发明实施例提供的电机故障诊断方法的实时诊断用时分布图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

下面结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图的方向或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，属于“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，属于“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

基于人工智能的故障诊断模型的训练和分析过程需要极高的算力，尤其在深度学习领域，由于电机复杂多变的工作状况产生了海量数据，随着诊断模型的深度和复杂度不断增加，计算资源的过度占用和功耗增加的问题随之到来，这些问题影响诊断效率，难以实现设备端数据的实时分析和监测。本发明提供的一种模型训练方法、电机故障诊断方法和微控制器，在模型训练中减轻了计算资源的过度占用，降低了功耗，采用一维卷积神经网络模型降低了模型的深度与复杂度，提高了诊断效率。

实施例1

本发明的实施例1提供了一种模型训练方法，利用电机的历史数据对神经网络模型进行训练以获取训练完成后的目标神经网络模型。

在对神经网络模型进行训练之前，获取电机的历史振动信号及其对应的故障类型标签，生成样本数据集；其中，历史振动信号为时域连续的三维振动信号，用X表示电机在水平方向上的振动信号，Y表示电机在轴向上的振动信号，Z表示电机在竖直方向上的振动信号。即本申请中所述的三维振动信号均是时域连续的。

神经网络模型采用一维卷积神经网络模型，该模型优势在于训练速度快且深度与复杂度低，能减轻计算资源的过度占用。如图1所示，一维卷积神经网络模型各层按顺序依次为输入层、一维卷积层、一维最大池化层、随机失活层、展平层、第一全连接层和第二全连接层。

从识别精度的角度来看，一维卷积层和一维最大池化层有助于从输入信号中提取特征。卷积层对输入实时振动信号应用一组滤波器，使其能学习信号中的不同特征和模式。一维最大池化层对一维卷积层的输出进行采样，减少特征图的维度，同时保留最重要的特征。随机失活层通过在训练过程中随剔除一部分神经元来帮助防止过拟合，迫使一维卷积神经网络学习更强健的特征。第一全连接层和第二全连接层负责将提取的特征分类为不同的故障类别。第一个全连接层作为一个瓶颈层，在将特征图传递给第二个全连接层进行最终分类之前，降低了特征图的维度。

从资源占用的角度来看，上述各层的网络设计是相对节约资源的。一维卷积层只需要一个输入通道，并使用少量的过滤器，减少了可训练参数的总体数量。一维最大池化层有助于降低特征图的维度，这又降低了全连接层的计算成本。随机失活层也降低了过拟合的风险，使训练数据得到更有效的利用。

对于电机故障诊断任务来说，含有一个输入层、一个一维卷积层、一个一维最大池化层、一个随机失活层、一个展平层和两个全连接层的一维卷积神经网络模型是一个有效的、节省资源的架构。一维卷积层和一维最大池化层有助于从输入信号中提取稳健的特征，而两个全连接层提供准确的分类。随机失活层可以防止过度拟合，从而更有效地利用实时振动信号数据。本实施例1的一维卷积神经网络模型在识别精度和资源占用间取得了良好的平衡。

同时，在神经网络模型训练中，更多的训练样本往往意味着更优的训练结果，如果模型的参数过多，训练样本过少就会出现过拟合的现象，将随机失活层放在一维最大池化层之后，可以将随机失活层应用于第一全连接层和第二全连接层中，保留了池化层输出的相对位置信息，在第一全连接层和第二全连接层中减少了一些过拟合。另，一维最大池化层输出的尺寸比一维卷积层小，从而产生更少的参数和计算负担，因此，在第一全连接层之前使用随机失活层，可以减少计算量，提高计算速度，并保持高性能，提高了训练模型的鲁棒性。

以至少部分样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型。训练结束后生成的目标一维卷积神经网络模型具有更高的诊断效率，能对输入的振动信号进行精准的故障诊断，输出的预测故障类型准确率高，提高工业生产的安全性。

本发明的实施例1提供了一种模型训练方法，通过获取电机的历史振动信号及其所对应的故障类型标签，生成样本数据集；将至少部分样本数据集输入至一维卷积神经网络模型进行训练，以获取目标一维卷积神经网络模型，该模型的深度与复杂度低，诊断效率高，具有较强的分析能力，且该模型在一维最大池化层和展平层之间加入了随机失活层，降低了模型的过拟合，提升了训练模型的鲁棒性。

实施例2

本发明的实施例2提供了一种模型训练方法，在实施例1的基础上，获取电机的历史振动信号及其所对应的故障类型标签之后，对历史振动数据进行预处理操作，使其变换成符合一维卷积神经网络模型输入的形式。

历史振动信号数据预处理分为数据切分和频域转换两部分，其中频域转换包含了数据的归一化过程。

在神经网络训练中，更多的训练样本往往意味着更优的训练结果，样本量不足则容易产生过拟合现象，且对于历史振动信号这一类的时序信号，电机在不同的工作状态下，其振动信号的特征可能会有较大的差异，因此需要对历史振动信号数据进行切分重构，可以更方便地对不同工作状态下的振动信号进行分析和比较。进一步地，通过对历史振动信号数据进行切分，可以将长时间的信号切分成若干个短时间的片段，从而降低每个片段的计算量，以提高计算效率。采用滑动窗口法对时域连续的历史振动信号进行切分生成样本数据集。切分的滑动窗口长度为a，滑动步长为b，历史振动信号数据的总采样点数为M，则最后得到的样本数据集中的总样本数量N₁的计算公式(1)为：

当滑动步长b等于滑动窗口长度a，即滑动窗口不重叠，此时a＝b，公式(1)变为公式(1.1)：

滑动窗口长度a等于样本长度，样本长度为2ⁿ个采样点，或样本长度为2n个采样点；其中，n为正整数。

在对电机的实时振动数据进行采集过程中，设定电机转速RS＝1485r/min＝24.75r/s，采集实时振动数据的传感器的采样频率Fs＝3300Hz，则电机每一转传感器的采样点N_per的计算公式(1.2)为：

由此，电机每一转传感器的采样点为133点，优选地，在本实施例2中，采取电机每四转的传感器采样点数作为样本长度，即n取9，样本长度为512个采样点。如图2所示，sample为样本，x、y和z分别代表电机在水平向、轴向和竖直向的振动信号。当滑动窗口不重叠时，a＝b＝512，同时采样点为512方便后续的频域转换过程，每一条样本包含电机连续转动过程中约每四转的包含三个振动方向的数据。

在电机故障诊断中，每个训练样本使用的振动信号采样点的数量取决于几个因素，包括信号的性质和任务的具体要求。一般来说，采样点的数量应该足够大，以捕获足够的三维振动信号信息，同时也要足够小，以保持资源消耗和响应时间在可管理的水平。以下三个方面为将每一条样本的采样点数设置为512点的设置依据：

一，快速傅里叶变换(FFT)是一种用于三维振动信号频率分析的常用技术，在对三维振动信号进行傅里叶变换方面，通常在采样点数为2ⁿ时效率最高；当采样点较多的信号(如采样点为1024点)时，相较于512个采样点，需要更多的计算资源来进行傅里叶变换分析，而采样点较少的信号(如采样点为256点)时，相较于512个采样点，频率分辨率降低，可能无法捕获足够的频率信息导致计算效率降低，因此具有512个采样点的信号可以很容易地使用傅里叶变换进行分析，以节省计算资源，提高傅里叶变换的速度。

二，在资源消耗方面，采样点的数量直接影响到处理信号所需的计算资源。一个有512个采样点的信号比一个有更多采样点的信号(如1024个采样点的信号)所需的数据存储空间和计算资源要少，节省了计算资源，降低了功耗。

三，在响应时间方面，对于实时应用中，一个有512个采样点的信号可以比一个有更多采样点的信号(如1024个采样点的信号)处理得更快，从而可以更快地对电机故障诊断做出反应。

进一步地，对在时域连续的三维振动信号按照公式(2)进行归一化处理，以消除三维振动信号中部分奇异数据对后续处理的不良影响，保障预测故障类型标签的精度和结果的稳定性；

其中，D_raw为三维振动信号，D′为经归一化后的三维振动信号，max D_raw表示三维振动信号的最大值，min D_raw表示三维振动信号的最小值。经归一化后的三维振动信号数据分布在区间[0,1]之间。

进一步地，对归一化后的三维振动信号数据按照公式(3)进行傅里叶变换，变换为三维频域信号；

其中，D′(t)表示三维振动信号在时间轴上的变化，表示对在时间轴上的变化的三维振动信号进行傅里叶变换，D(ω)表示三维频域信号，ω表示三维频域信号的频率。

如图3所示的电机在正常和不同故障类型下的三维频域信号图。其中，纵轴Amplitude表示三维振动信号的振幅，NOR表示正常电机、RIB表示转子不平衡故障、LB表示电机底座松动故障、RMA表示转子不对中故障、BRB表示转子断条故障、AGE0表示气隙偏心0°故障、AGE23表示气隙偏心23°故障、BFIR表示轴承内圈故障、BFOR表示轴承外圈故障、BFR表示轴承滚子故障、BFM表示轴承混合故障。每种故障类型下对应有各自的电机三位频谱。

由于傅里叶变换具有对称性，对三维频域信号的数据取半并对其在竖直方向做拼接得到融合振动信号作为样本数据集。

融合振动信号D的表达式见公式(3.1)；

其中，D_x、D_y和D_z为三维频域信号,融合振动信号数据的尺寸为(3,256)。

将三维频域信号的数据取半并对其在竖直方向做拼接可以得到更精确、分辨率更高的融合振动数据，便于更准确地提取振动信号的特征，从而可以更精准地定位故障的位置。另外融合振动数据相较于三维频域信号拥有更强的噪声抗干扰性，提高了数据的质量和可靠性。

本发明的实施例2提供了一种模型训练方法，在获取电机的历史振动信号及其所对应的故障类型标签之后，对历史振动信号进行预处理操作，预处理包括数据切分和频域转换，频域转换包含了归一化过程。使用滑动窗口法将历史振动信号切分成段，从而降低每个片段的计算量，减小了计算资源的占用，以提高计算效率，便于后续频域转换操作；使用归一化将三维振动信号数据分布于区间[0,1]之间，消除奇异样本数据对后续傅里叶变换的不良影响；使用傅里叶变换将时域信号转换为频域信号，并对频域信号取半在竖直方向做拼接得到融合振动信号，便于更准确地提取振动信号的特征，统一了信号的形式，提高了数据输入一维卷积神经网络模型的精确性。

实施例3

本发明的实施例3提出了一种模型训练方法，在实施例2的基础上，使用交叉熵损失函数和能够改进自适应学习率的Adam函数参与模型训练的参数更新，以对一维卷积神经网络模型进行优化，提高模型的准确率和诊断效率。

以至少部分样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型包括：

利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值并给予损失值对一维卷积神经网络模型的参数进行优化；

在判断达到模型训练收敛条件时停止训练，得到目标一维卷积神经网络模型。

具体地，模型训练收敛的条件有交叉熵损失函数收敛、参数稳定和验证集准确率稳定；其中，交叉熵损失函数收敛的解释为当损失函数达到一个接近最小值的稳定值并保持不变时，可认为模型已收敛；参数稳定的解释为模型的参数变化非常小或达到一个接近稳定的状态时，可认为模型已收敛；验证集准确率稳定的解释为模型在验证集上的准确率在一段时间内保持稳定，可认为模型已收敛。

交叉熵损失函数常用于机器学习中的分类任务，特别是当模型的输出是多个类别的概率分布时。交叉熵损失函数的优化逻辑包括最小化预测的概率分布和真实概率分布之间的差异。

交叉熵损失函数L定义公式(4)为：

优化过程包括寻找使交叉熵损失函数最小的模型参数值，可以通过梯度下降法或Adam、RMSprop优化算法来实现，以此更快地收敛和优化模型。交叉熵损失函数相对于预测概率分布的梯度可以用公式(4.1)推导出：

交叉熵损失函数相对于一维卷积神经网络模型的参数的梯度可以用微积分的连锁规则得到。模型第k层的单个参数w_kl1的更新规则可由公式(4.2)表示为：

其中，w_kl2为更新后的参数，lr是一个超参数，用于控制每次迭代的更新大小。

具体的，可利用Adam函数最小化损失函数，利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值并基于损失值对一维卷积神经网络模型的参数进行优化包括：

迭代上述过程直至交叉熵损失函数的损失值最小化。

具体地，Adam是一种优化算法，广泛用于深度学习中，利用Adam函数结合交叉熵损失函数不断更新一维卷积神经网络的参数。它结合了随机梯度下降(SGD)和均方根传播(RMSprop)优化方法的优点，并被设计成计算上高效和对噪声梯度具有鲁棒性。

Adam算法通过存储过去梯度和平方梯度的指数衰减平均值来计算每个参数的自适应学习率，然后通过梯度的一阶和二阶矩估计来归一化学习率。然后使用动量项将这些归一化梯度与上一步的更新相结合，从而计算参数的更新量。

Adam算法的步骤可以总结如下：

S1：将网络的参数θ_t，包括权重和偏置，初始化为随机值；

S2：将一阶矩变量m_t和二阶矩变量v_t初始化为与参数相同维度的零向量；

S3：将时间步长t初始化为0；

S4：对于每个训练示例的小批量，利用公式(5)计算损失函数对参数的梯度，利用公式(5.1)更新一阶矩变量m_t和二阶矩变量v_t；

其中，m_t+1是更新后的一阶矩，v_t+1是更新后的二阶矩，β₁是一阶矩估计的衰减率，β₂是二阶矩估计的衰减率；β₁通常设为0.9，β₂通常设为0.999。

利用公式(5.2)和公式(5.3)计算偏差矫正的一阶矩估计和二阶矩估计/>

利用公式(5.4)更新参数；

其中，θ_t+1为更新后的参数，α是学习率，通常设为小值，如0.001，ε是添加到分母中以保持数值稳定性的小常数，通常设为10^-8。

S5：增加时间步长t。

Adam算法结合了SGD和RMSprop优化方法的优点，可以有效地更新一维卷积神经网络的参数，从而实现更好的训练效果。

进一步地，将训练数据划分为训练集、测试集和验证集，划分比例为6:2:2。使用具有0.001学习率的Adam损失优化器对一维卷积神经网络模型进行优化，使用交叉熵损失函数计算一维卷积神经网络模型的损失值，以在训练过程中不断优化模型的参数，提高模型的准确率和鲁棒性。参数验证与网络训练同时进行，每次从训练集中随机抽取32组数据组成一批数据输入网络，有效地减少了计算资源的占用，降低了计算的复杂度；每训练一轮后根据模型在验证集的表现进行参数的优化调整，共训练20轮，训练过程中记录每轮训练后模型的损失值和准确率并保存训练后的模型，避免了过拟合现象的发生，提高了模型的泛化能力。

优选地，模型训练方法包括对目标一维卷积神经网络的参数进行压缩，和/或，将目标一维卷积神经网络的一维卷积层和一维最大池化层合并成一维汇合层。其中，对目标一维卷积神经网络的参数进行压缩包括：对目标一维卷积神经网络模型的参数进行提取并展平，获得一维参数向量；利用K-means聚类算法将所有一维参数向量聚类为K个簇并确定每个簇的质心；将每个一维参数向量中的参数替换为对应簇的质心。

具体地，通过超参数搜索来选择聚类的数量K，并将一维参数向量替换为K个簇的质心。超参数搜索是一种通过尝试不同的超参数组合来优化模型的过程，超参数有学习率、正则化系数等；质心为每个簇的中心点，该点是该簇中所有观测值的平均值，将一维参数向量替换为K个簇的质心意味着将原始数据压缩到K个点上，这有助于减少模型中的冗余信息并提高计算效率。将一维卷积层和一维最大池化层合并成一维汇合层有效地减少了目标一维卷积神经网络模型的规模，提高了预测速度。

本发明的实施例3提供了一种模型训练的方法，利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失，从而更好地衡量真实概率分布与预测概率分布间的差异，使用Adam函数优化损失，提高了模型训练的效果和准确性。在一维卷积神经网络模型训练结束后，使用K-means聚类算法将权重替换为K个簇的质心，将高维数据空间降低到低维数据空间并去除干扰信息，合并一维卷积层和一维最大池化层，提高了一维卷积神经网络模型的性能。

实施例4

本发明的实施例4提供了一种电机故障诊断方法，应用上述实施例1-3中的目标一维卷积神经网络模型进行故障预测，提高了模型的诊断效率。

一种电机故障诊断方法，如图4所示，包括：

S11:采集电机的实时振动信号；

S12:输入至目标一维卷积神经网络模型，输出预测的故障类型标签；

其中，S12:输入至目标一维卷积神经网络模型，包括：S121:采用输入层用于接收实时振动信号，S122:采用一维汇合层用于减少特征图的空间尺寸，并保留主要的特征信息，S123:采用随机失活层用于降低一维卷积神经网络模型的过拟合，S124:采用展平层用于将特征图降为一维，S125采用第一全连接层用于对降为一维的特征图进行线性变换，S126:采用第二全连接层用于对经线性变换的特征图进行分类并输出预测的故障类型标签。

优选地，一种电机故障诊断方法应用于设备端微控制器，目标一维卷积神经网络模型部署在设备端微控制器，实现了设备对故障的实时分析和监测，提高了系统的鲁棒性和可靠性。

本发明的实施例4提供了一种电机故障诊断方法，采集电机的实时振动信号，输入至目标一维卷积神经网络模型，输出预测的故障类型标签；目标一维卷积神经网络各层按顺序依次为输入层、一维汇合层、随机失活层、展平层、第一全连接层、第二全连接层；其中，采用输入层用于接收实时振动信号，采用一维汇合层用于减少特征图的空间尺寸，并保留主要的特征信息，采用随机失活层用于降低一维卷积神经网络模型的过拟合，采用展平层用于将特征图降为一维，采用第一全连接层用于对降为一维的特征图进行线性变换，采用第二全连接层用于对经线性变换的特征图进行分类并输出预测的故障类型标签。该目标一维卷积神经网络模型功耗低，不过多占用计算资源，且对采用的目标一维卷积神经网络模型的结构进行优化，降低了模型的深度与复杂度，提高了模型诊断的效率，将第一随机失活层设在一维最大池化层和展平层之间，提高了模型性能，降低了模型的过拟合风险。

同时，上述的目标一维卷积神经网络模型具有简单的结构、适应性强，能够实时地处理振动信号，大大降低了模型预测的计算量，使得该模型可以被布置在设备端控制器上使用，有效地预防了电机故障，减少设备停机时间，而且采集的电机数据都存储在本地设备上，无需将数据上传至云平台，降低了数据储存成本，减少了网络流量的使用，降低了隐私泄露的风险，提升了系统的鲁棒性和可靠性。

实施例5

本发明的实施例5提供了一种电机故障诊断方法，在实施例4的基础上，将该电机故障诊断方法应用在微控制器并使用，实现了对故障诊断数据的实时分析和监测。

一种电机故障诊断方法，如图5所示，包括：

S21:调用初始化函数，初始化目标一维卷积神经网络模型和通信接口；

S22:利用通信接口采集实时振动信号数据；

S23:对实时振动信号进行预处理；预处理包括：切分实时振动信号，并做归一化，对归一化后的数据进行傅里叶变换得到频域数据；

S24:采用目标一维卷积神经网络模型对频域数据进行预测，得到预测的故障类型标签。

具体地，S24为调用目标一维卷积神经网络模型的C模型对频域数据进行预测，得到预测的故障类型标签；C模型为将目标一维卷积神经网络模型转换成C语言代码的模型。

输入目标一维卷积神经网络模型的三位振动信号的相关设置在结构体T_LSM6DSL_TYPE的定义的对象tlsm6dsl中被设置，包含了接收的信号以及接收函数、接收标志等。

通信接口从外部传感器采集实时振动信号；实时振动信号为传感器通过SPI通信协议采集并解析处理后得到；SPI通信为串行外围设备接口；传感器具体可以为LSM6DSL智能传感器，实时振动信号为三轴振动加速度信号；三轴振动加速度信号数据共有16位，每个轴的加速度数据分别存放在两个寄存器中，由此tlsm6dsl.reg_buf作为一个512×6的向量，其中从0～5分别储存了X轴低位、X轴高位、Y轴低位、Y轴高位、Z轴低位和Z轴高位数据，要将其转化为地球加速度则需要合并高位和低位的数据，传感器按照公式(6)对三轴振动加速度信号进行解析处理；

其中，为X轴高位数据，/>为X轴低位数据，Sensitivity为公式(6)的权重，g为地球加速度，Sensitivity＝4.88×10^-4，g＝9.8m/s²。

该过程将每个轴的低位和高位数据按照一定的规则进行合并，以X轴数据为例，将高位数据按位左移8个位置，并与低位数据/>相加，并与公式(6)的权重Sensitivity和地球加速度g相乘，可以将三轴的加速度值组合成一个三维向量，表示电机在X、Y、Z轴上的加速度，便于一维卷积神经网络模型能更好地分析传感器采集的三位振动信号，从而更好地应用于各种振动监测和故障诊断控制系统中。

对实时振动信号进行预处理；预处理包括：切分实时振动信号，并做归一化，对归一化后的数据进行傅里叶变换得到频域数据。在切分阶段，可以将实时振动信号按照时序进行切分，便于针对不同时间段内的三位振动信号数据进行分析；在归一化阶段，可以将经切分的三维振动信号数据进行标准化，使数据分布在区间[0,1]之间，使得不同时间段内的数据可以进行比较和分析；在傅里叶变换阶段，可以将归一化的三位振动信号数据从时域转换到频域上，便于分析其频谱特性，进而输入至目标一维卷积神经网络模型中。

调用目标一维卷积神经网络模型的C模型对频域数据进行预测时，可通过一组定义明确的ai_mvsa_network_XXX()函数生成的模型来实现。该ai_mvsa_network_XXX()函数包含初始化、获取权重参数、激活参数、输入输出等多种功能，常用功能如表(1)所示。

函数	功能	预测过程
			ai_mvsa_network_create_and_init()	模型创建和初始化
ai_mvsa_network_inputs_get()	模型输入指针定义	初始化
			ai_mvsa_network_outputs_get()	模型输出指针定义
AI_HANDLE_PTR()	更新I/O处理程序
			ai_mvsa_network_run()	模型预测	预测
ai_mvsa_network_get_error()	返回模型运行error

表(1)

目标一维卷积神经网络模型预测过程主要包含两个部分：初始化过程和预测过程。

具体地，如图6所示，在初始化过程首先利用create_and_init()函数对C模型进行创建并初始化，同时利用inputs/outputs_get()定义输入输出指针，用于存储输入输出数据；随后在预测过程使用AI_HANDLE_PTR()更新I/O处理程序，执行预测函数ai_mvsa_network_run()，得到输出数据，运行过程的错误从get_error()函数中得到。该实现方式将目标一维卷积神经网络模型转换成C语言代码的模型，方便嵌入至其他系统中，减少了编写代码的工作量。

将得到的频域数据展平为长度为768的一维数据，并将其赋值至目标一维卷积神经网络模型的输入指针，可以有效地将频域数据转换为目标一维卷积神经网络模型所需的输入格式，执行初始化和预测操作，最终得到输出指针，由于目标一维卷积神经网络模型的第二全连接层使用softmax(随机失活)函数激活，所以输出指针指向一个长度为11的一维向量，包含对11种故障类型的综合分析结果，其中最大值所在位置即为模型预测得到的故障标签，该方式有效地利用目标一维卷积神经网络模型对频域数据进行分析，提高了目标一维卷积神经网络模型的效率和准确性。

优选地，一种电机故障诊断方法，还包括将编码后的故障类型标签转换为字符串类型的故障类型标签并输出至蓝牙。输出指针指向的向量中最大值所在位置对应的故障类型标签，将编码后的标签转换为字符串类型，便于通过USART串口通信发送发送至低功耗蓝牙模块SKB501。调用HAL库的传输函数HAL_UART_Transmit()，以阻塞方式将预测的故障类型发送至蓝牙。

手机端使用nRF Connect APP实现蓝牙配对和数据接收，当MCU和手机配对成功后，即可通过BLE连接进行数据收发，最终将智能传感器安装在电机上，即可在手机端获得电机振动实时分析结果，实现了实时的故障诊断和监测。

本发明的实施例5提供了一种电机故障诊断方法，主要流程为调用初始化函数，初始化目标一维卷积神经网络模型和通信接口；利用通信接口采集实时振动信号数据；对实时振动信号进行预处理；预处理包括：切分实时振动信号，并做归一化，对归一化后的数据进行傅里叶变换得到频域数据；调用目标一维卷积神经网络模型的C模型对频域数据进行预测，得到预测的故障类型标签，以实现精准的故障诊断和预测，提高了目标一维卷积神经网络模型的准确率和实时性。

基于上述电机故障诊断方法，本发明还公开了一种微控制器，布置在设备端。一种微控制器，包括上述的电机故障诊断方法，实现了设备端实时的分析和监测电机的状况，降低了故障对设备的影响，提高了设备的运行效率和稳定性。

为验证模型的性能，以下将布置有上述目标一维卷积神经网络模型的微控制器(可选STM32)布置在设备端的智能传感器(可选LSM6DSL)中，利用智能传感器对电机进行实时监测，获得监测结果。从电机故障类型识别准确性和智能传感器的执行时间两个方面对监测结果进行分析。

第一，对电机故障类型识别准确性进行验证。如图7所示的识别结果的混淆矩阵，混淆矩阵是评判模型结果的一种指标，属于模型评估的一部分，用于评判模型的优劣。其中，横坐标Predicted label为故障类型预测标签，纵坐标True label为故障类型真实标签，NOR表示正常电机、RIB表示转子不平衡故障、LB表示电机底座松动故障、RMA表示转子不对中故障、BRB表示转子断条故障、AGE0表示气隙偏心0°故障、AGE23表示气隙偏心23°故障、BFIR表示轴承内圈故障、BFOR表示轴承外圈故障、BFR表示轴承滚子故障、BFM表示轴承混合故障。由图中1200组数据可得，仅有故障类型真实标签为RMA的94组数据中，出现了1组预测错误，其余93组都预测正确，由此可得微控制器对电机状态的识别准确率为1199/1200≈99.92％。

如表(2)所示，其给出了在微控制器STM32上部署的C模型(STM32 C-model)与上位机中的原始模型(Original model)的表现对比，以及二者输出的交叉验证(X-cross)；其中,ACC为准确率，RMSE为均方根误差，MAE为平均绝对误差,L2R为学习排序指标。交叉验证以原始模型的识别结果为参考，是评价原始模型和C模型之间差异性的一个指标，此处交叉验证为100％由此可以认为，在微控制器中一维卷积神经网络的识别结果与上位机验证结果完全相同。

	ACC	RMSE	MAE	L2R
					STM32 C-model	99.92％	1.141×10^-2	1.923×10^-4	3.784×10^-2
Original model	99.92％	1.141×10^-2	1.923×10^-4	3.784×10^-2
					X-cross	100％	1.7×10^-8	2×10^-9	5.6×10^-8

表(2)

第二，对智能传感器的实时性进行分析。在本发明的一个实施例的一次实时诊断中，如图8所示，将传感器的实时监测过程分为数据接收与预处理(acquire_and_preprocess_data)、模型预测(aiRun)及数据后处理(post_process)三个模块，经试验，传感器每执行一次实时诊断平均用时219.84ms，数据接收与预处理模块用时最长，平均用时为163.39ms，其次是数据后处理模块，平均用时为39.30ms，最后是模型预测模块，平均用时17.15ms。

由此可得，智能传感器在电机故障监测方面具有很高的实时性，通过即时检测和诊断电机的运行状态，可以有效地预防电机故障，减少设备的停机时间，提高生产效率。

本发明能实时、快速地处理和分析数据；具有较低的功耗和成本；安全性强，无需将所有数据上传至云平台，减少隐私泄露和网络流量；并且故障诊断模型可以根据电机故障诊断的技术特点和工业实际需求做出针对性调整，方便更新迭代。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种模型训练方法，其特征在于，包括：

获取电机的历史振动信号及其所对应的故障类型标签，生成样本数据集；所述历史振动信号为时域连续的三维振动信号；

以至少部分所述样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型；所述一维卷积神经网络各层按顺序依次为输入层、一维卷积层、一维最大池化层、随机失活层、展平层、第一全连接层、第二全连接层；

其中，采用所述输入层用于接收所述历史振动信号，采用所述一维卷积层用于从所述历史振动信号数据中提取特征并输出特征图，采用所述一维最大池化层用于对所述特征图进行采样，采用所述随机失活层用于剔除所述一维卷积神经网络模型中的部分神经元，采用所述展平层用于将所述特征图降为一维，采用所述第一全连接层用于对降为一维的所述特征图进行线性变换，采用所述第二全连接层用于对经所述线性变换的所述特征图进行分类并输出所述故障类型标签。

2.根据权利要求1所述的模型训练方法，其特征在于，所述获取电机的历史振动信号及其所对应的故障类型标签之后，包括如下预处理：

采用滑动窗口法对所述时域连续的历史振动信号进行切分生成所述样本数据集；

所述切分的滑动窗口长度为a，滑动步长为b，所述历史振动信号数据的总采样点数为M，则最后得到的所述样本数据集中的总样本数量N₁的计算公式(1)为：

3.根据权利要求2所述的模型训练方法，其特征在于，所述滑动窗口长度a等于样本长度，所述样本长度为2ⁿ个采样点；

或，

所述样本长度为2n个采样点；

其中，n为正整数。

4.根据权利要求1所述的模型训练方法，其特征在于，所述获取电机的历史振动信号及其所对应的故障类型标签之后，还包括如下预处理：

对所述时域连续的三维振动信号按照公式(2)进行归一化处理；

其中，D_raw为所述三维振动信号，D′为经所述归一化后的所述三维振动信号，maxD_raw表示所述三维振动信号的最大值，minD_raw表示所述三维振动信号的最小值；

对所述归一化后的所述三维振动信号数据按照公式(3)进行傅里叶变换，变换为三维频域信号；

其中，D^′(t)表示所述三维振动信号在时间轴上的变化，表示对在时间轴上的变化的所述三维振动信号进行所述傅里叶变换，D(ω)表示所述三维频域信号，ω表示三维频域信号的频率；

对所述三维频域信号数据取半并对其在竖直方向做拼接得到融合振动信号作为所述样本数据集。

5.根据权利要求1所述的模型训练方法，其特征在于，所述以至少部分所述样本数据集对搭建的一维卷积神经网络模型进行训练，获取目标一维卷积神经网络模型，包括：

利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值并基于所述损失值对所述一维卷积神经网络模型的参数进行优化；

在判断达到模型训练收敛条件时停止训练，得到所述目标一维卷积神经网络模型；

所述交叉熵损失函数定义公式(4)为：

其中，N₂为参与模型训练例子的数量，每个所述例子有C个可能的故障类型；y_i＝[y_i1,y_i2,…,y_iC]表示第i个例子在每个故障类型的真实概率分布；当第j类是第i个例子的真实故障类型时，y_ij＝1，当第j类不是第i个例子的真实故障类型时，y_ij＝0；p_i＝[p_i1,p_i2,…,P_iC]表示第i个例子在每个故障类型的预测概率分布，其中p_ij是第i个例子的第j类的故障类型预测概率。

6.根据权利要求5所述的模型训练方法，其特征在于，所述利用交叉熵损失函数计算实际输出的故障类型标签概率与预测的故障类型标签概率的损失值并基于所述损失值对所述一维卷积神经网络模型的参数进行优化包括：

利用Adam函数确定所述损失值对应的梯度值，并基于所述梯度值更新所述一维卷积神经网络模型的参数；

迭代上述过程直至所述交叉熵损失函数的所述损失值最小化。

7.根据权利要求6所述的模型训练方法，其特征在于，还包括：对所述目标一维卷积神经网络的所述参数进行压缩；

和/或，

将所述目标一维卷积神经网络的所述一维卷积层和所述一维最大池化层合并为一层一维汇合层；

其中，对所述目标一维卷积神经网络的所述参数进行压缩包括：

对所述目标一维卷积神经网络模型的所述参数进行提取并展平，获得一维参数向量；

利用K-means聚类算法将所有所述一维参数向量聚类为K个簇并确定每个簇的质心；

将每个所述一维参数向量中的所述参数替换为对应簇的所述质心。

8.一种电机故障诊断方法，应用于如权利要求1-7所述的目标一维卷积神经网络模型中，其特征在于，包括：

采集电机的实时振动信号，输入至所述目标一维卷积神经网络模型，输出预测的故障类型标签；

所述目标一维卷积神经网络各层按顺序依次为输入层、一维汇合层、随机失活层、展平层、第一全连接层、第二全连接层；

其中，采用所述输入层用于接收所述实时振动信号，采用所述一维汇合层用于减少特征图的空间尺寸，并保留主要的特征信息，采用所述随机失活层用于剔除所述目标一维卷积神经网络模型中的部分神经元，采用所述展平层用于将所述特征图降为一维，采用所述第一全连接层用于对降为一维的所述特征图进行线性变换，采用所述第二全连接层用于对经所述线性变换的所述特征图进行分类并输出所述预测的故障类型标签。

9.根据权利要求8所述的电机故障诊断方法，其特征在于，所述电机故障诊断方法应用在设备端微控制器，所述目标一维卷积神经网络模型部署在所述设备端微控制器。

10.根据权利要求9所述的电机故障诊断方法，其特征在于，所述电机故障诊断方法应用在设备端微控制器，所述目标一维卷积神经网络模型部署在所述设备端微控制器，包括：

调用初始化函数，初始化所述目标一维卷积神经网络模型和通信接口；

利用所述通信接口采集所述实时振动信号数据；

对所述实时振动信号进行预处理；所述预处理包括：切分所述实时振动信号，并做归一化，对归一化后的数据进行傅里叶变换得到频域数据；

采用所述目标一维卷积神经网络模型对所述频域数据进行预测，得到预测的所述故障类型标签。

11.根据权利要求10所述的电机故障诊断方法，其特征在于，利用所述通信接口采集所述实时振动信号数据，包括：

所述通信接口从外部传感器采集所述实时振动信号；所述实时振动信号为所述传感器采集并按照公式(6)解析处理后得到；所述实时振动信号为三轴振动加速度信号；所述三轴振动加速度信号数据共有16位，每个轴的加速度数据分别存放在两个寄存器中；

其中，为所述三轴振动加速度信号在X轴的高位数据，/>为所述三轴振动加速度信号在X轴的低位数据，acc_x为所述三轴振动加速度信号在X轴的数据，Sensitivity为所述公式(6)的权重，g为地球加速度。

12.一种微控制器，布置在设备端，其特征在于，微控制器上布置有权利要求1-7任一项所述的目标一维卷积神经网络模型，且用于执行权利要求8-11任一项所述的电机故障诊断方法。