CN116091897A

CN116091897A - 一种基于轻量化的分布式光纤传感事件识别方法及系统

Info

Publication number: CN116091897A
Application number: CN202310238330.3A
Authority: CN
Inventors: 杨振国; 董火民; 张发祥; 张鸿宇; 姜劭栋; 王金伟; 王昌; 王春晓
Original assignee: Shandong Computer Science Center National Super Computing Center in Jinan
Current assignee: Shandong Computer Science Center National Super Computing Center in Jinan
Priority date: 2023-03-14
Filing date: 2023-03-14
Publication date: 2023-05-09

Abstract

本发明属于光纤传感事件图像识别相关技术领域，本发明提出了一种基于轻量化的分布式光纤传感事件识别方法及系统，基于马尔可夫变迁场将分布式传感器事件时序信号数据转换成马尔可夫变迁场二维图像；利用得到的图像对建立的教师网络模型进行预训练；利用预训练好的教师网络模型对所建立的学生网络模型进行中间特征层的一阶知识蒸馏训练；利用预训练好的教师网络模型和经过一阶知识蒸馏的学生网络模型对所述学生网络模型的输出特征层进行二阶知识蒸馏训练，得到训练好的学生网络模型；通过训练好的学生网络模型进行识别，提升了小模型的识别精度，缩短了识别时间，提升了推理速度。

Description

一种基于轻量化的分布式光纤传感事件识别方法及系统

技术领域

本发明属于光纤传感事件图像识别相关技术领域，尤其涉及一种基于轻量化的分布式光纤传感事件识别方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

分布式光纤传感技术是随着光纤和光纤通信技术的深入研究而兴起的一种新型传感技术。与传统的电声传感器相比，分布式光纤传感器具有抗电磁干扰能力强、稳定性好、耐腐蚀性强、灵敏度高、远距离传输损耗低、无需通电、成本低等一系列的优点。相敏光时域反射技术（Φ-OTDR）作为分布式光纤传感技术的典型代表，其可以利用光纤感测沿线环境中振动、声波等物理量的时间变化以及空间分布信息情况。因其具有独特的优异性，现被广泛用于建筑结构健康检测、周界安防、管道监控等多种应用领域。

在分布式光纤传感事件识别初期，一些研究者通过机器学习的方法进行分布式光纤事件识别。利用机器学习进行事件识别主要分成两个关键步骤，特征提取和事件分类算法设计。很多研究者通过采用时域信号幅值过零率、频谱分布、小波包能量分解、傅里叶变换、短时傅里叶变换等方法进行特征的转换或特征提取，并结合支持向量机、相关向量机、高斯混合模型、人工神经网络等机器学习算法进行事件分类。通过机器学习算法进行光纤传感识别分类时，存在流程复杂、连续性差、需要人工手动提取、时间消耗成本高、无法处理大批量数据、不易现场部署等问题。

随着深度学习的发展，研究者通过将深度学习算法引入到分布式光纤传感事件识别领域。引入深度学习后，其能够改善传统机器学习算法的人工手动提取特征缺点。越来越多的研究者借鉴深度学习在图像的应用，将分布式光纤传感采集到的事件数据转化为灰度图像或RGB图像进行事件的分类。然而，事件数据转换成图像后，识别事件算法往往都是繁重、复杂的，而且需要建立在资源消耗、高时间成本的基础上。此外，如何将繁重复杂的网络模型性能压缩到轻量化的小模型中，让小模型既有识别事件的高效性同时仍保持着轻量化、识别事件快速化、容易在资源有限的设备终端部署，是光纤传感数据转换成图像进行事件识别的主要瓶颈之一。

发明内容

为克服上述现有技术的不足，本发明提供了一种基于轻量化的分布式光纤传感事件识别方法及系统，通过采用马尔可夫变迁场即MTF的方法将采集到的事件数据转换成图像，能够呈现更深层的特征并保持事件信号的时域相关性，并且MTF算法对光路中电源波动不敏感，有效提高了系统的鲁棒性和实用性。针对识别算法存在的问题，通过二阶段知识蒸馏的方法，有效地将大规模模型压缩为具有最佳学习能力的轻量化模型，保证了压缩模型的高效性。

为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：一种基于轻量化的分布式光纤传感事件识别方法，包括：

获取分布式传感器事件时序信号数据并将所述分布式传感器事件时序信号数据基于马尔可夫变迁场转换成马尔可夫变迁场二维图像；

利用马尔可夫变迁场二维图像对所建立的教师网络模型进行预训练；

利用预训练好的教师网络模型对所建立的学生网络模型进行中间特征层的一阶知识蒸馏训练；

利用预训练好的教师网络模型和经过一阶知识蒸馏的学生网络模型对所述学生网络模型的输出特征层进行二阶知识蒸馏训练，得到训练好的学生网络模型；

将待识别的分布式传感器的马尔可夫变迁场二维图像输入至训练好的学生网络模型中，得到识别结果。

本发明的第二个方面提供一种基于轻量化的分布式光纤传感事件识别系统，包括：

获取模块：获取分布式传感器事件时序信号数据并将所述分布式传感器事件时序信号数据基于马尔可夫变迁场转换成马尔可夫变迁场二维图像；

预训练模块：利用马尔可夫变迁场二维图像对所建立的教师网络模型进行预训练；

一阶知识蒸馏模块：利用预训练好的教师网络模型对所建立的学生网络模型进行中间特征层的一阶知识蒸馏训练；

二阶知识蒸馏模块：利用预训练好的教师网络模型和经过一阶知识蒸馏的学生网络模型对所述学生网络模型的输出特征层进行二阶知识蒸馏训练，得到训练好的学生网络模型；

输出识别模块：将待识别的分布式传感器的马尔可夫变迁场二维图像输入至训练好的学生网络模型中，得到识别结果。

以上一个或多个技术方案存在以下有益效果：

本发明通过采用马尔可夫变迁场的方法将采集到的事件数据转换成图像，能够呈现更深层的特征并保持事件信号的时域相关性，并且马尔可夫变迁场算法对光路中电源波动不敏感，有效提高了系统的鲁棒性和实用性。

在本发明中，通过二阶段的知识蒸馏的方法，能够将大模型教师网络模型的知识汲取到小模型学生网络模型中，提升了小模型的识别精度同时使用小模型在分布式光纤传感事件识别中缩短识别时间、提升了推理速度，也更容易在小型终端设备上部署。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例一中分布式光纤传感事件识别方法的流程图；

图2为本发明实施例一中分布式光纤传感系统结构及工作原理图；

图3（a）为本发明实施例一中当人推着小车在光纤传感附近时对应的时域波形数据；

图3（b）为本发明实施例一中当人行走在光纤传感附近时对应的时域波形数据；

图3（c）为本发明实施例一中当一个人在光纤传感附近连续跺脚时对应的时域波形数据；

图3（d）为本发明实施例一中当一个人用小锤在光纤传感附近敲击时对应的时域波形数据；

图3（e）为本发明实施例一中当一个人光纤传感附近进行铁锹挖掘时对应的时域波形数据；

图3（f）为本发明实施例一中当喷壶模拟下雨时对应的时域波形数据；

图4（a）为本发明实施例一中学生网络模型中Stblock模块示意图；

图4（b）为本发明实施例一中学生网络模型中通道注意力模块示意图；

图4（c）为本发明实施例一中学生网络模型中空间注意力模块示意图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

实施例一

如图1-图2所示，本实施例公开了一种基于轻量化的分布式光纤传感事件识别方法，包括：

步骤1：获取分布式传感器事件时序信号数据并基于马尔可夫变迁场将所述分布式传感器事件时序信号数据转换成马尔可夫变迁场二维图像；

步骤2：利用马尔可夫变迁场二维图像对所建立的教师网络模型进行预训练；

步骤3：利用预训练好的教师网络模型对所建立的学生网络模型进行中间特征层的一阶知识蒸馏训练；

步骤4：利用预训练好的教师网络模型和经过一阶知识蒸馏的学生网络模型对所述学生网络模型的输出特征层进行二阶知识蒸馏训练，得到训练好的学生网络模型；

步骤5：将待识别的分布式传感器的马尔可夫变迁场二维图像输入至训练好的学生网络模型中，得到识别结果。

本实例以长距离管道安全监测应用为例进行说明。

如图2所示，本实施例所采用的是基于相敏光时域反射技术的分布式光纤声波/振动传感系统。用于采集信号的系统硬件包括：光信号解调设备、信号处理主机以及探测光缆。

光信号解调设备是分布式光纤传感系统的核心设备，在图2中可以看出，采用窄线激光器即NLL作为激光的光源，通过窄线激光器发出的连续波即CW首先经过声光调制器即AOM调制成对应的光脉冲信号，光脉冲信号经过第一个掺饵放大器即EDFA1进行放大，通过光纤布拉格光栅滤波器即Filter进行滤波，接着通过环形器将放大的脉冲发射到单模光纤中，瑞利后向散射经过第二个掺饵放大器即EDFA2以及光纤布拉格光栅滤波器获得更好的信噪比的改善，然后注入3*3耦合器即Coupler中，耦合器的另外一侧的两个端口连接两个法拉第旋转镜即FRM，入射光分成两束，由法拉第旋转镜进行反射，并在耦合器中进行干涉，干涉后的信号由三个平衡光电探测器即BPD接受，最后由数据采集卡将事件数据进行收集。

信号处理主机为普通的电脑主机即PC，用于将分布式光纤传感探测信号进行分析、处理得到对应事件的位置信息和对数据进行保存等。

探测光缆采用普通的单模通信光纤，一般可以在城市地下管道，边境安防栅栏等多种场景进行铺设，也可以直接采用沿管道或道路铺设的通信光纤的空余纤芯。

通过分布式光纤传感系统采集到的事件时空信号矩阵对应为：

（1）

其中，XX为采集到的整体分布式光纤传感时空矩阵数据，t为采集信号的时间维度，s为采集到信号的空间维度，为在t时刻对应的s空间维度的时频域数据。

因为分布式光纤传感依据激光器输出的脉冲光与探测器接收到的后向瑞利散射光之间的时光差能够准确地判断出光纤路径中发生事件的位置，根据事件定位信息根据时空响应信号矩阵得到每个空间点的一维时间序列，对应的一维时间序列为：

（2）

式中，(z=1,2,…,n)表示为事件信号每个时刻对应的幅值。

沿着时间轴将事件信号进行分割，分割时依据信号的采样频率进行分割，将分割好的事件信号数据集进行保存。

在本实例中的信号数据集对应于图3（a）-图3（f）中的时间序列数据，在时间序列数据中事件为：图3（a）为人推着小车在光纤传感附近、图3（b）为人行走在光纤传感附近、图3（c）为一个人在光纤传感附近连续跺脚、图3（d）为一个人用小锤在光纤传感附近敲击、图3（e）为一个人光纤传感附近进行铁锹挖掘、图3（f）为用喷壶模拟下雨。

基于上述得到的六种事件序列数据集，且均为分割成1S内的时间序列数据。将采集到的事件时间序列数据通过马尔可夫变迁场转换成图像，这样不仅能够呈现更深层的事件特征并保持信号的时域相关性，并且马尔可夫变迁场方法对光路中的电源波不敏感，能够更好地和深度学习网络结合，有效提高了系统的鲁棒性和实用性。

在本实施例步骤1中，信号样本，其中(z=1,2,…,n)表示为振动信号每个时刻对应的幅值，依据信号幅值大小将样本信号序列划分为Q个子集，每个任意的对应一个唯一的，也就是说事件样本信号X依据幅值映射到一个对应的子集，每个子集中包括有振动信号中的幅值相同的数值或幅值相同区间的数值。

根据上一步划分出来的Q个子集，计算出从任意一个子集出发，经过任意一次转移，出现在另外Q-1个区间幅值的概率，通过计算可以得到一个尺寸为[]的马尔可夫转移矩阵，对应的马尔可夫转移矩阵A为：

A==

（3）

式中，表示为从状态转移到状态的转移概率，即区域中的一个采样信号跟后面一个区域采样信号的概率，表示为，在公式中，表示信号样本 i时刻的信号幅值，表示信号样本i-1时刻的信号幅值，表示i时刻的信号幅值转化到i-1时刻的信号幅值的概率，、表示对应的换分到Q的子集。具体的概率计算公式如下所示：

（4）

在式中，表示在从状态转移到状态的数量之和，表示为样本信号的长度即总数。

通过将计算的马尔可夫转移矩阵A与样本信号按照时间序列排序构建尺寸大小为的事件信号马尔可夫变迁场矩阵B:

=（5）

其中，式中表示一维时间信号序列映射到马尔可夫转移矩阵及一维时间信号序列映射到马尔可夫转移矩阵的转移概率，表示为。

马尔可夫变迁场表示时序数据中的任意两个时间点的数据之间的关系。马尔可夫变迁场矩阵B中元素的取值范围为，通过将矩阵B中的每个元素的值缩放到0～255，从而得到事件马尔可夫变迁场二维图像。

为了更好地对马尔可夫变迁场进行更进一步的说明，通过下面的例子进行原理说明，设原始光纤传感样本序列X={1,1,1,2,2,2,3,3,3,3,4}其中信号序列X中的数值表示这振动信号的幅值强度，可以将信号中的样本划分成，可以将序列X分成四个子集，即={1}，={2}，={3}，={4}，接下来计算信号序列X中的每个元素的一次性转移概率：

；；

；；；；；；

；。

通过计算转移后的概率，得到的马尔可夫转移A矩阵为：

通过将计算得到的马尔可夫转移矩阵，依据公式（5）来计算马尔可夫变迁场矩阵B，其中

；

；；

；

；；

。

根据上述的计算情况可以推理出，为此可以得到一个11*11的马尔可夫转移矩阵，再根据将矩阵中的数值缩放在的区间中，进一步转换成相应的图像。

在本实施例步骤3和步骤4中，选择MobliNetV3-large作为教师网络模型，并将教师网络模型在马尔可夫变迁场二维图像数据集上进行训练并将最佳的训练网络权重进行保存。依据MobliNetV3-large网络进行了适当的调整，将MobliNetV3-large网络结构依据特征图尺寸划分成5个模块和全连接层。其中教师网络模型的输入特征图的默认尺寸为224×224×3，教师网络模型的划分是按照上一步的特征图的高和宽尺寸减半来进行的，如Block1输出的特征图尺寸为112×112×16，Block2输出的特征图尺寸为56×56×24，Block3输出的特征图尺寸为28×28×80，Block4输出的特征图尺寸为14×14×112，Block5输出的特征图尺寸为7×7×960。

本实施例所设计的学生网络模型由依次顺序连接的5个自定义Stblock模块、平均池化和全连接层组合，学生网络模型结构如表1所示。在表1中，Stblock后面会跟4或8，4或8是倍率因子即e，即Stblock中的第一个1×1卷积层会将输入特征矩阵的通道扩充e倍，其中k5×5表示Stblock中深度卷积所采用的卷积核大小。

表1 本实施例中学生网络模型的详细参数

如图4（a）所示，在Stblock模块中，首先依次经过卷积核大小为1*1、步距为1的卷积层、归一化层和Relu6激活函数进行特征维度的扩充，然后依次经过卷积核大小为5*5、步距为2的深度可分离卷积层、归一化层和Relu6激活函数进行特征提取，再经过通道注意力模块和空间注意力模块进行深层特征提取，最后依次通过卷积核大小为1*1、步距为1卷积层、归一化层进行特征维度降维。

由通道注意力机制和空间注意力机制组成注意力机制模块即CBAM，注意力机制可以看作是对图像输入重要信息的动态选择过程，这个过程是由对特征自适应权重实现的。

具体的，如图4（b）所示，对于通道注意力机制：首先将输入的特征图经过两个并行的MaxPool即最大池化层和AvgPool即平均池化层，得到两个不同的空间语义描述算子：和，将两者分别作为共享的包含一个隐藏层的多层感知机MLP的输入以生成通道注意力特征向量。此时隐藏层神经元的个数为C，为了减少参数量，设置r为通道缩减率，将隐藏层神经元的个数降低为C/r，将得到的两个通道注意力特征向量对应的元素相加，再使用激活函数，获得最终的通道注意力图。具体的通道注意力过程可以用以下公式：

（6）

式中，为Sigmoid激活函数，, 为共享的多层感知机的权重。，为通道注意力机制中并行的平均池化层和最大池化层的结果，通道注意力图中每个权重表示对应通道的特征图中对于关键信息的重要性和关联程度。

在空间注意力中执行过程如图4（c）所示，其利用被重构之后的特征图的空间关系生成空间注意力图。通道注意力模块的输出沿着通道方向同时进行平均池化和最大池化来聚合输入特征图的通道信息，分别得到两个二维的通道特征描述算子和，将二者特征融合进行维度拼接以生成有效的空间矩阵特征，然后通过7×7卷积获得空间注意力矩阵，再通过sigmoid激活函数得到一个二维的空间注意力图，它包含了要关注或抑制信息的空间位置，具体的空间注意力计算公式为：

（7）

式中，为Sigmoid激活函数，表示为7×7的卷积运算。表示为通道注意力模块的输出，，分别表示空间注意力机制中的平均池化和最大池化。空间注意力机制与通道注意力机制相辅相成，可以有效突出含有关键信息的区域特征。

在步骤2和步骤3中，在马尔可夫变迁场时间数据集上训练好的教师网络模型的权重进行加载并将学生网络模型与教师网络模型进行中间特征层的一阶知识蒸馏。将相同特征维度的教师网络模型的输出张量与学生网络模型的输出张量通过均方误差损失函数进行维度计算以及反馈训练，确保教师与学生之间的中间特征层映射距离最小化，计算公式为：

（8）

式中，为教师网络模型特征层的输出张量，为学生网络模型特征层的输出张量，分别为相同特征维度的教师网络模型与学生网络模型输出张量的宽度、高度、通道数。

选择的MobliNetV3-large教师网络模型与学生网络模型进行中间特征层知识蒸馏，将教师网络模型与学生网络模型分别进行5次中间特征层知识蒸馏，其中，中间特征层知识蒸馏的特征Block1、Block2、Block3、Block4、Block5的输出分别为112×112×16，56×56×24，28×28×40，14×14×112，7×7×960，这正好将教师网络模型输出特征层及表1中学生网络模型的输出特征层特征向量相对应，并将中间特征层知识蒸馏训练的权重进行保存。

在本实施例步骤4中，在将教师网络模型与学生网络模型进行完中间特征层的知识蒸馏后再进行输出层的二阶知识蒸馏。在二阶知识蒸馏过程中，最小化学生网络模型和教师网络模型之前的软标签分布差异，由于软标签利用了样本之前的相似性关系，有利于增强学生网络模型的泛化能力。教师网络模型的最后全连接层通过除以温度T进行平滑操作，并经过第一Softmax函数得到教师网络模型的软标签。学生网络模型的最后全连接层通过除以温度T进行平滑操作，并经过第二Softmax函数得到学生网络模型的软标签。对应的计算公式为：

（9）

（10）

其中，为教师网络模型的软标签，为学生网络模型的软标签，n为类别数量，,分别为教师网络模型最后全连接层输出的特征图、学生网络模型最后全连接层输出的特征图，为温度系数。

学生网络模型的最后全连接层通过除以温度T，此时T为1进行平滑操作，并经过第三Softmax函数得到学生网络模型的硬标签。对应的计算公式为：

（11）

其中，为学生网络模型的硬标签，为学生网络模型最后全连接层输出的特征图。

马尔可夫变迁场二维图像的真实标签与学生网络模型预测的硬标签之间通过交叉熵损失函数进行计算二者的相似性，对应的计算公式为：

（12）

式中，表示为公式（10）中的学生网络模型的硬标签，表示为第i个样本的真实标签，n为类别数量，为交叉熵损失函数。

教师网络模型预测的软标签与学生网络模型预测的软标签，通过相对熵损失函数(.)，评价两者预测的差异与相似性，对应的计算公式为：

（13）

式中，为教师网络模型预测的软标签，为学生网络模型预测的软标签，n为类别数量，(.)为相对熵损失函数，为教师网络模型的软标签。

将得到的交叉熵损失函数与得到的相对熵损失函数，以自定义的比例系数进行运算得到混合总损失函数，的反向传播是教师网络模型将暗知识授予学生网络模型，并提升学生网络模型性能的关键。对应的计算公式为：

（14）

其中，为自定义的比例系数，为马尔可夫变迁场二维图像的真实标签与学生网络模型预测的硬标签之间通过交叉熵损失函数所计算的二者的相似性，为教师网络模型预测的软标签与学生网络模型预测的软标签通过相对熵损失函数(.)所计算得到的两者预测的差异与相似性，T为温度。

将上述完成的一阶的中间特征层的训练的权重与马尔可夫变迁场的马尔可夫变迁场二维图像数据集在教师网络模型上的训练权重进行加载，进行输出特征层的知识蒸馏后，并依据训练的结果将最终的二阶知识蒸馏训练后的学生网络模型训练权重进行保存。

将采集到的未知类别事件信号，通过马尔可夫变迁场转换成马尔可夫变迁场二维图像，将马尔可夫变迁场二维图像输入到二阶知识蒸馏训练好的学生网络模型中，得到未知事件的识别结果。

实施例二

本实施例提供一种基于轻量化的分布式光纤传感事件识别系统，包括：

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，包括：

获取分布式传感器事件时序信号数据并基于马尔可夫变迁场将所述分布式传感器事件时序信号数据转换成马尔可夫变迁场二维图像；

2.如权利要求1所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，所述分布式传感器事件时序信号数据为振动信号每个时刻对应的幅值数据。

3.如权利要求2所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，基于马尔可夫变迁场将所述分布式传感器时序信号数据转换成马尔可夫变迁场二维图像，具体为：

依据幅值数据按照大小将分布式传感器时序信号数据划分为Q个子集；

利用一阶马尔可夫链计算任意一个子集内幅值数据经过一次转移后，出现在另外（Q-1）个子集的概率，构建马尔可夫转移矩阵；

基于分布式传感器时序信号数据映射到马尔可夫转移矩阵的转移概率，得到马尔可夫变迁场矩阵；

将马尔可夫变迁场矩阵中每个元素进行缩放，得到马尔可夫变迁场二维图像。

4.如权利要求1所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，所述学生网络模型由依次顺序连接的5个Stblock模块、平均池化和全连接层组成；

在所述Stblock模块中，首先依次经过卷积层、归一化层和Relu激活函数进行升维操作；然后依次经过深度可分离卷积层、归一化层和Relu激活函数进行特征提取操作；再经过通道注意力模块和空间注意力模块进行深层特征提取；最后依次经过卷积层、归一化层进行降维操作。

5.如权利要求4所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，在所述通道注意力模块中，首先对输入特征经过并行的最大池化层、平均池化层进行池化操作；然后将经过最大池化层、平均池化层的输出分别作为共享的包含一个隐藏层的多层感知机的输入以生成通道注意力特征向量；将得到的两个通道注意力向量对应元素进行相加；最后经过激活函数输出通道注意力特征图。

6.如权利要求5所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，在所述空间注意力模块中，将所述通道注意力特征图分别经过最大池化层、平均池化层，将经过最大池化层和平均池化层的输出进行特征维度拼接生成空间矩阵特征；将所述空间矩阵特征通过卷积层获得空间注意力矩阵，将所述空间注意力矩阵通过sigmoid激活函数得到空间注意力特征图。

7.如权利要求1所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，所述教师网络模型采用MobliNetV3网络，将MobliNetV3网络按照学生网络模型中的5个Stblock模块所输出的特征图的尺寸大小，划分为5个Block模块。

8.如权利要求6所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，在一阶知识蒸馏中，将相同特征维度的教师网络模型的输出张量与学生网络模型的输出张量通过均方差损失函数进行维度计算，使教师网络模型与学生网络模型的中间特征层映射距离最小化。

9.如权利要求1所述的一种基于轻量化的分布式光纤传感事件识别方法，其特征在于，在二阶知识蒸馏中，具体为：

基于教师网络模型的最后全连接层的输出除以温度系数并经过第一激活函数，将所述第一激活函数的结果作为教师网络模型的教师软标签；

基于学生网络模型的最后全连接层的输出除以温度系数并经过第二激活函数，将所述第二激活函数的结果作为学生软标签；

基于学生网络模型的最后全连接层的输出经过第三激活函数，将所述第二激活函数的结果作为学生硬标签；

通过交叉熵损失函数计算马尔可夫变迁场二维图像的真实标签与学生硬标签之前的相似性；

通过相对熵损失函数计算教师软标签与学生软标签之间的相似性；

将所得到的交叉熵损失函数和相对熵损失函数的结果按比例相加后得到混合总损失函数；

利用混合总损失函数对学生网络模型进行二阶知识蒸馏训练。

10.一种基于轻量化的分布式光纤传感事件识别系统，其特征在于，包括：