CN115273154B

CN115273154B - 基于边缘重构的热红外行人检测方法、系统及存储介质

Info

Publication number: CN115273154B
Application number: CN202211171768.6A
Authority: CN
Inventors: 何震宇; 李佳琪; 田超; 杨超
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2022-09-26
Filing date: 2022-09-26
Publication date: 2023-01-17
Anticipated expiration: 2042-09-26
Also published as: CN115273154A

Abstract

本发明提供了一种基于边缘重构的热红外行人检测方法、系统及存储介质，热红外行人检测方法包括数据预处理步骤、主干网络预训练步骤、模型训练步骤和预测步骤。本发明的有益效果是：通过引入边缘信息，引导模型深入挖掘热红外图像中的边缘特征；通过引入主干网络预训练方法，提升主干网络的特征提取和学习能力；通过设计全新的算法架构，提升热红外行人检测性能；通过引入针对性训练流程，避免使用额外任务和额外数据，提升模型有效信息量，不影响实际运行速度。

Description

基于边缘重构的热红外行人检测方法、系统及存储介质

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种基于边缘重构的热红外行人检测方法、系统及存储介质。

背景技术

热红外行人检测是计算机视觉的重要领域之一，被广泛地应用于视频监控、自动驾驶等领域。热红外图像成像不受光照条件影响，在恶劣天气条件下能正常工作，具有良好的稳定性。但热红外行人检测算法存在可用信息不足、白天性能下降等问题。为了解决上述问题，很多工作使用在可见光域训练的行人检测器，在热红外行人数据集上进行微调，实现域自适应。

在数据使用方面，依据使用的数据种类不同，分为两种范式：

1、仅使用热红外图像进行训练和测试（实际应用）。这类算法使用在可见光域预训练完毕的主干权重，使用热红外数据进行微调训练（finetune），训练完成后在热红外数据上测试（实际应用）。这种方法的实现成本较小，但需要精心设计模型架构，深入挖掘热红外图像中的信息，以提升热红外行人检测器的性能。

2、使用“热红外-可见光”图像对实现双光（RGB-T）检测。这类算法在训练和测试时，都需要使用精准对齐的双光数据。模型的架构也需要面向双模态数据重新设计，一般采用双流或者多流网络，同时对多个输入图像进行特征提取，再进行特征处理。这种方法性能较好，但是对数据和设备要求较高，很难落实到实际应用中。

在模型架构方面，依据热红外数据和可见光数据的结合使用方式，又分为两种范式：

1、单一输入的检测网络。这种模型仅使用热红外数据作为输入，包括提取图像特征的主干网络、处理特征的颈部网络和产生检测结果的检测头，不同的模型还可能包括特征融合、特征对齐等辅助模块。不同的模型中，每个模块的具体实现方式也不完全相同。

2、双输入（甚至更多）的检测网络，同时读入视角配对的“可见光+热红外”数据，分别在两个分支的主干网络进行特征提取，再融合特征进行后续检测步骤，训练完成后，测试（实际应用）时，仍需使用配对的“可见光+热红外”数据，即RGB-T方法。

在一些通用目标检测方法中，出现了一些使用边缘检测来提升检测效果的方法。例如，基于边缘信息引导的可见光显著目标检测模型，其重点在于利用边缘先验知识来细化显著检测结果的边缘轮廓，并不能提升热红外行人检测的性能；还有一些工作使用边缘检测来提升可见光图像分割模型的性能，其目的在于提升模型对于图像中不同区域的敏感度，提升其语义分割能力，但由于目的不同，其方法并不能提升热红外行人检测器的性能。

在数据预处理方面，有一些方法使用特征分析、去噪、增强等突出热红外行人图像有效细节信息并弱化无效信息的方式，以提升行人检测的精准度。这与本发明提出的数据预处理方法完全不同，也不适用于本发明。

在特征融合方面，有大量方法针对RGB-T设计了特征融合方法，用于解决跨模特信息交互问题，但是这些方法面向可见光和热红外特征设计，并不能直接用于热红外和边缘信息交互，从而提升热红外行人检测器的精准度。还有方法针对行人检测的结果进行融合，分别对置信度和位置信息的检测结果进行融合，以提升行人检测性能，但该方法是针对模型预测结果设计融合方案，并不适用于对热红外特征图和边缘特征图进行融合，即与本发明提出的方法无关。

综上，背景技术的缺陷如下：

对于使用单一热红外数据的行人检测模型，它们大多是直接基于可见光检测器，简单在可见光数据上预训练，并利用热红外数据进行微调训练得到。无论是两阶段热红外检测器还是单阶段热红外检测器，它们在温差较小（如白天）的热红外检测性能都比较差，容易导致漏检、错检等问题。

对于使用双光数据的RGB-T行人检测模型，无论是训练，还是在测试（实际应用）中，都需使用视角对齐的“可见光+热红外”双模态数据，总体计算复杂度高，训练数据难以获取，落地困难。

在数据预训练方面，当前主流方法为特征分析、去噪、增强等突出细节信息的方法，但这些方法也不能完全消除背景等干扰信息的影响，其提升热红外行人检测器性能的能力有限。

在使用边缘检测方面，现有方法仅用于可见光图像，方向为显著检测和分割检测，并不能直接应用于热红外行人检测。

在特征融合方面，当前特征融合主要面向可见光和热红外特征的融合，不能直接应用在边缘特征和热红外特征上。

发明内容

为了解决现有技术中的问题，本发明提供了一种基于边缘重构的热红外行人检测方法、系统及存储介质, 提升有效信息量，提高了热红外行人检测器的性能。

本发明提供了一种基于边缘重构的热红外行人检测方法，包括如下步骤：

数据预处理步骤：获取热红外图像对应的边缘图像，抑制其背景表达，获取行人边缘掩模图像，平滑行人边缘，获得更完整和更精准的行人边缘轮廓；

主干网络预训练步骤：使用行人标签对主干网络进行对比学习预训练，使得主干网络能够学习到行人的标签和图像之间存在的关系，提升主干网络对行人特征的学习和分类能力；

模型训练步骤：同时输入热红外行人图像和行人边缘掩模图像，分别提取两种图像的特征信息，在特征融合模块进行信息交互，经过特征处理模块进一步处理后，送入分类、定位和重构头中进行行人检测和边缘重构；

预测步骤：仅使用热红外行人图像，不使用行人边缘掩模图像，关闭辅助网络通道，实现完全位于热红外域的行人检测。

作为本发明的进一步改进，在数据预处理步骤中，获取行人边缘掩模图像的技术方案是：使用边缘提取算法生成热红外图像对应的边缘图像，将其与热红外图像同时输入模型；利用热红外行人数据集的标注框确定行人区域，抑制所有非行人区域的表达，得到仅包含行人边缘的掩模图像；将行人边缘掩模图像与热红外图像同时输入到行人检测器中。

作为本发明的进一步改进，在所述数据预处理步骤中，使用膨胀和腐蚀操作平滑行人边缘掩模图像。

作为本发明的进一步改进，所述模型训练步骤包括冻结主干网络的训练步骤，在冻结主干网络的训练步骤中，冻结预训练的主干网络，为主干网络的每层注入一组可学习的附加参数，在训练过程中仅更新附加参数和除了主干网络以外的其他模块。

作为本发明的进一步改进，所述主干网络预训练步骤包括：

步骤1：读取一个包含N个标签-图像对的训练块，将N个标签和N个图像特征两两组合，组成

个标签-图像对，其中含有 N 正样本对，

个负样本对；

步骤2：使用CLIP模型预测出

个可能的文本-图像对的余弦相似度；

步骤3：最大化N个正样本的相似度，同时最小化

个负样本的相似度，从而建立热红外行人图像和标签之间的联系。

作为本发明的进一步改进，在所述模型训练步骤中，行人边缘特征提取模块包含五个阶段，每个阶段的输出特征图分别为E1、E2、E3、E4和E5，通道数分别为64、128、256、512和1024，尺寸分别为原始输入图像的1/2、1/4、1/8、1/16和 1/32；行人边缘特征提取模块的每个阶段都包含两个深度可分离卷积层，每个深度可分离卷积层包括一个输入通道与输出通道数相同的3*3卷积，一个输入通道与输出通道数不同的1*1卷积，两个卷积后面都有批量归一化操作，第一个卷积后还有ReLU激活操作；在每个阶段的第二个深度可分离卷积层使用残差连接；如公式1所示，输入特征图Ei经过上述顺序的操作后，得到输出特征图Ej，

Ej = ReLU(BN(Conv(Ei)))+ ReLU(BN(Conv(ReLU(BN(Conv(Ei)))))) 公式1；

其中的Conv表示卷积层，BN表示归一化，ReLU为激活函数。

作为本发明的进一步改进，在所述模型训练步骤中，所述特征融合模块执行如下步骤：

第一步：将主干网络最后一个阶段输出的热红外特征图 T5 和行人边缘特征提取网络最后一个阶段输出的边缘特征图 E5 进行逐元素相乘，得到一个尺寸不变的特征图；

第二步：对第一步中得到的尺寸不变的特征图引入全局平均池化操作，得到第一结果；

第三步：将第二步中的第一结果与热红外特征图 T5 相乘，得到第二结果；

第四步：使用残差连接的方式将第三步中的第二结果与原始热红外特征图 T5 相加，得到第三结果；

第五步：将第三结果再经过一个不改变尺寸和通道数的1*1 卷积层、归一化和激活函数进行融合，最终得到特征融合模块的输出特征图。

作为本发明的进一步改进，所述模型训练步骤包括有监督的边缘重构任务，所述边缘重构任务包括如下步骤：

步骤a：首先将热红外图像送入主干网络进行特征提取，其输出热红外特征图为T5；

步骤b：将行人边缘掩模图像送入行人边缘特征提取模块进行特征提取，得到输出边缘特征图E5；

步骤c：将步骤a的输出热红外特征图T5和步骤b的输出边缘特征图E5送入特征融合模块进行特征融合，将融合完毕后的特征图送入重构模块进行边缘重构，得到边缘重构图像E_pred；

步骤d：将步骤c得到的边缘重构图像E_pred与行人边缘掩模图像E₀做对比损失，得到损失值；

步骤e：根据步骤d得到的损失值更新辅助网络各模块的权重，各模块包括行人边缘特征提取模块、特征融合模块和重构模块。

作为本发明的进一步改进，所述冻结主干网络的训练步骤包括：

步骤A：

表示第i层的输出特征图，y表示模型的输出结果：

公式4

公式5

步骤B：对主干网络的每一层都插入一个 d 维的向量

作为附加参数，构成集合P：

公式6

步骤C：训练时，冻结主干网络的权重，仅更新附加参数集合 P：

公式7

公式8

在公式4中，

的含义是：Layer代表主干网络的某一层，用下标i区分，i的取值范围为1~5；x表示特征图，第i个layer的输入是第i-1个layer的输出特征图x，下标为 i-1；

在公式5中，

的含义是：检测头，能够输出最终结果；

在公式6中，

的含义是：P是一个向量，在主干网络的每一层中插入一个p，用i做下标区分不同的层；

的含义是：R表示实数，上标d表示维度是d维，即p是一个实数域中的 d维向量；

表示自然数；N表示主干网络最大级数；

在公式7中，

的含义是：将

和

同时输入第i个layer中，得到输出特征图x。

本发明还提供了一种基于边缘重构的热红外行人检测系统，包括：存储器、处理器以及存储在所述存储器上的计算机程序，所述计算机程序配置为由所述处理器调用时实现热红外行人检测方法的步骤。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现热红外行人检测方法的步骤。

本发明的有益效果是：通过引入边缘信息，引导模型深入挖掘热红外图像中的边缘特征；通过引入主干网络预训练方法，提升主干网络的特征提取和学习能力；通过设计全新的算法架构，提升热红外行人检测性能；通过引入针对性训练流程，避免使用额外任务和额外数据，提升模型有效信息量，不影响实际运行速度。

附图说明

图1是模型训练步骤网络架构示意图；

图2是预测阶段网络架构示意图；

图3是行人边缘特征提取模块的单个阶段结构示意图；

图4是特征融合模块的原理示意图。

具体实施方式

本发明公开了一种基于边缘重构的热红外行人检测方法，包括如下步骤：

数据预处理步骤：获取热红外图像对应的边缘图像，抑制其背景表达，获取行人边缘掩模图像，使用膨胀和腐蚀操作平滑行人边缘，获得更完整和更精准的行人边缘轮廓；在数据预处理步骤，使用膨胀腐蚀操作平滑行人边缘轮廓，获得精准的行人边缘掩模图像，提升模型对行人轮廓的敏感度和学习能力。

主干网络预训练步骤：使用行人标签对主干网络进行对比学习预训练，使得主干网络能够学习到行人的标签和图像之间存在的关系，提升主干网络对行人特征的学习和分类能力；在主干网络的预训练步骤，使用文本标签和对应图像进行对比学习，提升主干网络对热红外行人的特征学习能力。

如图1所示，模型训练步骤：

同时输入热红外行人图像和行人边缘掩模图像，分别提取两种图像的特征信息，在特征融合模块进行信息交互，经过特征处理模块进一步处理后，送入分类、定位和重构头中进行行人检测和边缘重构；在整个训练过程中，冻结预训练的主干网络，为主干网络的每层注入一组可学习的附加参数，在训练过程中仅更新附加参数和除了主干网络以外的其他模块；在模型训练步骤，设计了特征融合模块，利用行人的边缘信息引导模型更加关注行人轮廓；在模型训练步骤，添加有监督的边缘重构任务促进模型更加关注并深入学习行人边缘区域信息；在模型训练方法上，冻结预训练好的主干网络，引入少量可以特定热红外行人检测任务训练的参数，加速模型训练速度。

如图1所示，预测步骤：仅使用热红外行人图像，不使用行人边缘掩模图像，关闭辅助网络通道，实现完全位于热红外域的行人检测。

本发明进行展开说明：

1.在在数据预处理步骤中，获取行人边缘掩模图像的技术方案如下：热红外图像包含信息较少，是影响热红外行人检测器性能提升的关键问题之一。为了解决这一问题，我们使用边缘提取算法生成热红外图像对应的边缘图像，将其与热红外图像同时输入模型。然而边缘图像中不仅仅包含行人的轮廓，还有背景和其他干扰物的轮廓信息，这需要一定的去除干扰信息的处理。为了解决这个问题，我们利用热红外行人数据集的标注框确定行人区域，抑制所有非行人区域的表达，得到仅包含行人边缘的掩模图像。为了使得行人的边缘线条更加流畅，我们使用膨胀和腐蚀操作对其进行平滑连接，最终得到了完整的行人边缘掩模图像，将其与热红外图像同时输入到行人检测器中，提升了输入的有效信息量，也提升了模型对于热红外图像中行人特征的学习能力。

2.基于标签与图像对比学习的预训练机制

模型的主干网络对于学习和提取图像中的有效信息至关重要，为了提升其对于行人特征的学习能力，可以在可见光域对主干网络进行分类任务的训练，使其先学习到一定的图像特征，然而这不仅需要大量的可见光图像，同时也会使主干网络学习到不必要的冗余信息。

为了解决这一问题，我们使用热红外行人图像和对应的行人标签对主干网络进行对比学习预训练，帮助主干网络学习到行人的像素特征和标签之间的联系，提升主干网络对行人特征的敏感度。该方法的具体流程如下：

（1）读取一个包含N个标签-图像对的训练块，将N个标签和N个图像特征两两组合，组成

个标签-图像对，其中含有 N 正样本对，

个负样本对；

（2）使用CLIP模型预测出

个可能的文本-图像对的余弦相似度；

（3）最大化N个正样本的相似度，同时最小化

3. 模型架构

（1）行人边缘特征提取模块

为了能够更好地提取行人边缘掩模图像中的有效信息，本发明设计了行人边缘特征提取模块。由于边缘图像仅包含热红外图像中梯度变化剧烈的边缘信息，信息量比较少，同时考虑到模型训练速度，本发明设计了如图3所示的行人边缘特征提取模块。

该模块包含五个阶段，每个阶段的输出特征图分别为E1、E2、E3、E4和E5，通道数分别为64、128、256、512和1024，尺寸分别为原始输入图像的1/2、1/4、1/8、1/16和 1/32。如附图3示，该模块的每个阶段都包含两个深度可分离卷积层，每个深度可分离卷积层包括一个输入通道与输出通道数相同的3*3卷积，一个输入通道与输出通道数不同的1*1卷积，两个卷积后面都有批量归一化(BN)操作，第一个卷积后还有ReLU激活操作。此外，为了防止特征消失，在每个阶段的第二个深度可分离卷积层使用残差连接。如公式1所示，输入特征图Ei经过上述顺序的操作后，得到输出特征图Ej。

Ej = ReLU(BN(Conv(Ei)))+ ReLU(BN(Conv(ReLU(BN(Conv(Ei)))))) 公式1；

其中的Conv表示卷积层，BN表示归一化，ReLU为激活函数。

（2）特征融合模块

为了能够更好地利用边缘特征和热红外特征的优势进行互补，本发明设计了如图4所示的特征融合模块。该模块基于残差注意力机制，能够有效利用边缘特征引导热红外特征选择并突出有效边缘信息。

该模块包含一系列操作，第一步，将主干网络最后一个阶段输出的热红外特征图T5 和行人边缘特征提取网络最后一个阶段输出的边缘特征图 E5 进行逐元素相乘，得到一个尺寸不变的特征图；第二步，对将第一步中得到的尺寸不变的特征图引入全局平均池化操作，得到第一结果；第三步，将第二步中的第一结果与热红外特征图 T5 相乘，得到第二结果；第四步，使用残差连接的方式将第三步中的第二结果与原始热红外特征图 T5 相加，得到第三结果；最后，将第三结果再经过一个不改变尺寸和通道数的1*1 卷积层、归一化和激活函数进行融合，最终得到特征融合模块的输出特征图。如公式2所示，输入特征图E5和T5经过上述操作后，得到输出特征图T5E，T5E的通道数为1024，尺寸为原始输入图像的1/32。

T5E = ReLU(BN(Conv(T5+T5*GAP(T5*E5)))) 公式2

（3）有监督的边缘重构任务

为了充分利用行人边缘掩模图像中的边缘信息，我们设计添加了有监督边缘重构任务，为模型增加了一个重构输出分支，与原有的分类和定位分支并行。重构分支接收特征处理模块的输出作为输入特征图，输出预测的行人边缘重构图像。我们使用生成的行人边缘掩模图像E₀作为约束，对边缘重构图像的重构效果进行评价，根据评价的结果更新辅助网络的权重，以此推动模型深入学习行人边缘信息。

该任务流程如下：

1）；首先将热红外图像送入主干网络进行特征提取，其输出热红外特征图为T5

2）将行人边缘掩模图像送入行人边缘特征提取模块进行特征提取，得到输出边缘特征图E5；

3）将步骤a的输出热红外特征图T5和步骤b的输出边缘特征图E5送入特征融合模块进行特征融合，将融合完毕后的特征图送入重构模块进行边缘重构，得到边缘重构图像E_pred；

4）将步骤c得到的边缘重构图像E_pred与行人边缘掩模图像E₀做对比损失，得到损失值；

5）根据损失值更新辅助网络各模块的权重，包括行人边缘特征提取模块、特征融合模块和重构模块。

（4）损失函数

在训练过程中，模型同时完成两个有监督训练任务，因此存在两个损失函数分别对应热红外行人检测任务和边缘重构任务。

第一个损失函数即主检测网络自身的检测损失，使用L_thermal表示，其具体实现形式由具体的主检测网络模型决定。

第二个损失函数即重构损失函数。为了更好地促进模型学习边缘图像的特征，本发明引入了结构相似性(SSIM)和均方误差(MSE)的加权和作为损失函数。结构相似性是一个衡量重构图像和原图像的相似性的指标，它从三个角度对两个图像进行比较：亮度，对比度和结构。同时添加了均方误差来补充结构相似性，使得损失函数能够更加适合边缘重构任务。如公式3所示，设置结构相似性和均方误差的权重分别为

和

。

公式3

4. 基于冻结主干的训练机制和关闭辅助通道的测试机制：

为了更好更快地推进双任务模型的收敛，我们设计冻结已经预训练完毕的主干网络，只在输入空间中引入少量辅助训练的参数，训练时仅更新其它模块的权重，以此实现快速高效地训练，该训练方式如下所示：

（1）

表示第i层的输出特征图，y表示模型的输出结果：

公式4

公式5

（2）对主干网络的每一层都插入一个 d 维的向量

作为附加参数，构成集合P：

公式6

（3）训练时，冻结主干网络的权重，仅更新附加参数集合 P：

公式7

公式8

在公式4中，

在公式5中，

的含义是：检测头，能够输出最终结果；

在公式6中，

表示自然数；N表示主干网络最大级数，例如为5；

在公式7中，

的含义是：将

和

同时输入第i个layer中，得到输出特征图x。

为了更好地面向应用场景和市场需求，降低落地任务对于移动设备的存储容量和计算能力的需求，本方法在测试（实际应用）中，关闭辅助网络通道，仅使用热红外图像完成行人检测任务。

本发明在利用热红外数据进行训练时，不需要使用配对的“可见光+热红外”数据，仅使用热红外数据。在测试（实际应用）中，模型为单一分支架构，仅使用热红外图像即可完成热红外检测任务。

本发明的潜在应用场景包括自动驾驶、智能安防、军事等领域。应用方式为将算法及模型部署到计算设备并对输入的热红外图像中的指定目标进行检测。

本发明的有益效果如下：

1. 通过引入边缘信息，引导模型深入挖掘热红外图像中的边缘特征。

2. 通过引入主干网络预训练方法，提升主干网络的特征提取和学习能力。

3. 通过设计全新的算法架构，提升热红外行人检测性能。

4. 通过引入针对性训练流程，避免使用额外任务和额外数据，提升模型有效信息量，不影响实际运行速度。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于边缘重构的热红外行人检测方法，其特征在于，包括如下步骤：

模型训练步骤：

同时输入热红外行人图像和行人边缘掩模图像，分别提取两种图像的特征信息，在特征融合模块进行信息交互，经过特征处理模块进一步处理后，送入分类、定位和重构头中进行行人检测和边缘重构；

预测步骤：仅使用热红外行人图像，不使用行人边缘掩模图像，关闭辅助网络通道，实现完全位于热红外域的行人检测；

在所述模型训练步骤中，所述特征融合模块执行如下步骤：

2.根据权利要求1所述的热红外行人检测方法，其特征在于，在数据预处理步骤中，获取行人边缘掩模图像的技术方案是：使用边缘提取算法生成热红外图像对应的边缘图像，将其与热红外图像同时输入模型；利用热红外行人数据集的标注框确定行人区域，抑制所有非行人区域的表达，得到仅包含行人边缘的掩模图像；将行人边缘掩模图像与热红外图像同时输入到行人检测器中。

3.根据权利要求2所述的热红外行人检测方法，其特征在于，在所述数据预处理步骤中，使用膨胀和腐蚀操作平滑行人边缘掩模图像。

4.根据权利要求1所述的热红外行人检测方法，其特征在于，所述模型训练步骤包括冻结主干网络的训练步骤，在冻结主干网络的训练步骤中，冻结预训练的主干网络，为主干网络的每层注入一组可学习的附加参数，在训练过程中仅更新附加参数和除了主干网络以外的其他模块。

5.根据权利要求1所述的热红外行人检测方法，其特征在于，所述主干网络预训练步骤包括：

个标签-图像对，其中含有 N 正样本对，

个负样本对；

步骤2：使用CLIP模型预测出

个可能的标签-图像对的余弦相似度；

步骤3：最大化N个正样本的相似度，同时最小化

6.根据权利要求1所述的热红外行人检测方法，其特征在于，在所述模型训练步骤中，行人边缘特征提取模块包含五个阶段，每个阶段的输出特征图分别为E1、E2、E3、E4和E5，通道数分别为64、128、256、512和1024，尺寸分别为原始输入图像的1/2、1/4、1/8、1/16和 1/32；行人边缘特征提取模块的每个阶段都包含两个深度可分离卷积层，每个深度可分离卷积层包括一个输入通道与输出通道数相同的3*3卷积，一个输入通道与输出通道数不同的1*1卷积，两个卷积后面都有批量归一化操作，第一个卷积后还有ReLU激活操作；在每个阶段的第二个深度可分离卷积层使用残差连接；如公式1所示，输入特征图Ei经过上述顺序的操作后，得到输出特征图Ej，

Ej = ReLU(BN(Conv(Ei)))+ ReLU(BN(Conv(ReLU(BN(Conv(Ei)))))) 公式1；

其中的Conv表示卷积层，BN表示归一化，ReLU为激活函数。

7.根据权利要求1所述的热红外行人检测方法，其特征在于，所述模型训练步骤包括有监督的边缘重构任务，所述边缘重构任务包括如下步骤：

8.根据权利要求4所述的热红外行人检测方法，其特征在于，所述冻结主干网络的训练步骤包括：

步骤A：

表示第i层的输出特征图，y表示模型的输出结果：