CN116597427B

CN116597427B - 一种基于深度学习的舰船驾驶台身份识别方法

Info

Publication number: CN116597427B
Application number: CN202310876338.2A
Authority: CN
Inventors: 商堰婷
Original assignee: Shandong University of Science and Technology
Current assignee: Shandong University of Science and Technology
Priority date: 2023-07-18
Filing date: 2023-07-18
Publication date: 2023-10-20
Anticipated expiration: 2043-07-18
Also published as: CN116597427A

Abstract

本发明公开一种基于深度学习的舰船驾驶台身份识别方法，属于计算机视觉和航运安全技术领域，该方法为：采集舰船驾驶台中船员的人脸图像，使用船员身份信息标记人脸信息，得到船员人脸识别数据集；构建船员人脸检测模型CenterNet和船员人脸特征提取模型IResNet‑50；通过监控相机实时采集驾驶台内的监控视频，当检测到船员到岗或每隔20分钟，采用船员人脸检测模型和船员人脸特征提取模型自动检测人脸位置、采集其人脸信息，并进行人脸识别。该方法具有识别准确率高、鲁棒性强、兼容性好等优点，可以有效识别船员的身份，防止非法人员进入驾驶台，保障船员和船舶的安全。

Description

一种基于深度学习的舰船驾驶台身份识别方法

技术领域

本发明属于计算机视觉和航运安全技术领域，具体涉及一种基于深度学习的舰船驾驶台身份识别方法。

背景技术

船舶驾驶台是船舶航行的核心设备，利用视频监控技术对船员驾驶台进行实时监控是保障航运安全的重要手段。据相关报告分析，人为疏忽导致的航行事故约占总数的79%，由于安全责任意识缺乏，船员值班时离守等原因造成事故发生。在海上航行时，船舶的船员驾驶台作为船舶重点区域，需在船员进入驾驶台前进行身份识别，并且每隔一段时间对船员进行身份识别，保证授权人员在船舶航行时正常值班，确保船舶安全航行，避免事故发生。在进行船员驾驶台身份识别时，快速定位船员面部，准确提取船员人脸特征是实现高质量船员驾驶台身份识别的关键技术。

随人工智能和视频监控技术在船舶领域的应用，船员驾驶台身份识别由人工监控方式转变为智能视频监控方式。人工监控方式灵活性较高，监控性能较高，但存在疲劳、误判、成本高等缺点；智能视频监控方式可以通过驾驶台监控视频自动进行船员身份识别，成本较低、可全天候运行，具有良好的精度。

目前，现有的智能视频监控系统，主要采用基于深度学习的人脸识别技术完成，由人脸检测及人脸识别两部分组成，但在船员驾驶台环境中，存在多种影响监控图像质量的干扰因素：一是光线条件不佳，船员驾驶台通常位于船舶内部，光线条件较差，难以进行准确的人脸定位。二是不同船员人脸特征相似性高，船员驾驶台通常是一个固定的小范围，船员之间的面部特征比较相似，导致识别精度下降；三是船员面部姿态多变，难以获取高质量正脸图像。

因此利用深度学习技术的性能优势，解决上述技术问题，构建实时性的船员驾驶台身份识别方法，对保护船员人身安全，保障船舶航运安全具有重要意义。

发明内容

针对现有技术中存在的上述技术问题，本发明提供一种基于深度学习的舰船驾驶台身份识别方法，设计合理，解决了现有技术的不足，具有良好的效果。

本发明采用如下技术方案：

一种基于深度学习的舰船驾驶台身份识别方法，包括以下步骤：

S1、采集舰船驾驶台中船员的人脸图像，使用船员身份信息标记人脸信息，得到船员人脸识别数据集；

S2、构建改进后的CenterNet船员人脸检测模型；

S3、构建改进后的IResNet-50船员人脸特征提取模型；

S4、通过监控相机实时采集驾驶台内的监控视频，当检测到船员到岗或每隔20分钟，采用船员人脸检测模型和船员人脸特征提取模型自动检测人脸位置、采集其人脸信息，并进行人脸识别。

进一步地，其特征在于，所述S1包括以下子步骤：

S1.1、在舰船驾驶台上安装两台摄像头，用于采集船员的人脸图像，摄像头安装在能够准确捕捉船员面部信息的位置，包括驾驶台前方或侧方；同时，为了保护船员的隐私，系统只采集船员面部信息，不采集其他身体信息；

S1.2、将采集的视频利用视频帧转换软件生成单帧图像序列；

S1.3、使用人工截图工具截取数据集中出现的船员正脸图像，制作船员人脸识别数据集，每位船员对应1张正脸图像。

进一步地，在所述S2中，改进后的CenterNet船员人脸检测模型包括改进后的特征提取网络ResNet-50、上采样网络DeConv和改进后的预测网络Heads，特征提取网络ResNet-50包括四个ResBlock模块ResBlock_1~ResBlock_4和一个TransfomerBlock模块，其中TransfomerBlock模块由三个1×1的卷积模块、一个位置编码模块和一个多头注意力模块组成；ResBlock_1由一个ConvBNR和三个ConvBlock组成，ResBlock_2由四个ConvBlock组成，ResBlock_3由六个ConvBlock组成，ResBlock_4由六个ConvBlock组成；其中ConvBNR由一个7×7的卷积模块、一个批标准化模块、一个ReLu模块和一个3×3的最大池化模块组成，ConvBlock由一个1×1的卷积模块、一个3×3的卷积模块和一个1×1的卷积模块组成；上采样网络DeConv由三个DeConvBlock组成，每个DeConvBlock由一个3×3的卷积模块和一个4×4的反卷积模块组成；预测网络Heads包括中心点预测网络HeatMap Head、边界偏置预测网络Offerset Head和尺寸预测网络Size Head；中心点预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块与一个CBAM模块组成，边界偏置预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块与一个CBAM模块组成，尺寸预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块组成。

进一步地，在所述S3中，改进后的IResNet-50船员人脸特征提取模型包括一个3×3的CBR模块、四个ResGroup模块ResGroup_1~ResGroup_4、一个SimAM模块、一个全局平均池化模块和全连接模块；

CBR由一个卷积模块、一个批标准化模块、一个ReLu模块组成；ResGroup_1、ResGroup_4由1个Start_IResBlock、1个IResBlock与一个End_ IResBlock组成，ResGroup_2由1个Start_IResBlock、2个IResBlock与1个End_IResBlock组成，ResGroup_3由1个Start_IResBlock、4个IResBlock与1个End_IResBlock组成；

Start_IResBlock由一个1×1的CBR模块、一个3×3的CBR模块、一个1×1卷积模块和一个批归一化模块组成；IResBlock由一个1×1的BRC模块、一个3×3的BRC模块组成，BRC为将CBR的卷积模块放置在末尾所形成；End_IResBlock由1×1的BRC模块、一个3×3的BRC模块、一个批归一化模块、一个ReLu模块组成。

进一步地，对IResNet-50进行训练，首先采集舰船驾驶台中船员的人脸图像，使用船员身份信息标记人脸信息，得到船员人脸识别数据集，将数据集输入到IResNet-50中进行训练，设置迭代次数为20，学习率为1.25e^-4，批训练大小为128，训练动量设置为0.9，权重衰减率为0.0005，根据训练中损失函数的变化趋势适当设置不同的学习率和批训练大小，使损失函数最小化，直至达到指定的迭代次数时结束训练，得到最终的船员人脸特征提取模型。

进一步地，所述船员人脸特征提取模型的损伤函数为：

；

其中，表示样本数量，表示缩放因子，表示边界参数，表示第个样本的特征向量与第个类别中心点的角度余弦值，表示第个样本的特征向量与第个类别中心点的角度余弦值。通过缩放因子和边界参数来控制类别之间的间隔。

进一步地，通过船员人脸特征提取模型进行特征提取的过程具体为：每帧图像通过自适应缩放方式设置尺寸为112×112×3，图像首先依次通过CBR模块、ResGroup_1、ResGroup_2和ResGroup_3后输出特征图Ⅰ，将特征图Ⅰ输入SimAM模块，得到512个不同模式的14×14尺寸的注意力热图，将特征图Ⅰ和注意力热图通过Concat操作进行堆叠，随后输入到ResGroup_4模块，得到7×7×1024尺寸的全局特征图II；将II依次输入到全局平均池化模块和全连接模块进行人脸特征提取，得到输出长度为1×1×512的人脸特征向量。

进一步地，所述S4包括以下子步骤：

S4.1、将驾驶台内视频实时传输到CenterNet模型中，得到驾驶台内的船员人脸检测框D(F1，F2)和人脸关键点K(E1,E2,N1,M1,M2)，并将该船员人脸图像从原图分割生成图像I1。其中E1、E2分别为图像中船员左右眼中心位置，N1为船员鼻尖位置，M1、M2分别为船员左右嘴角位置，F1和F2分别为船员人脸左上角、右下角位置；

S4.2、设计基于几何关系的人脸姿态估计算法，根据人脸关键点坐标筛选船员高质量人脸图像，基于人脸关键点坐标，采用仿射变化算法，对同一个船员的多张人脸图像进行对齐，减少由于光照、角度、表情引起的人脸图像差异；

S4.3、将对齐后的人脸图像输入到IResNet-50模型中，输出人脸特征向量；

S4.4、计算人脸特征向量与人脸数据库中各船员人脸特征的相似度，得到相似矩阵R，其中相似度阈值设置为0.6，若相似度超过0.6，则人脸识别成功，船员能够启动或继续使用驾驶台设备，若相似度没有超过0.6，则人脸识别失败，则驾驶台报警，同时记录下船员人脸图像I1和当前时间T，并录入数据库中。

进一步地，在S4.2中，人脸姿态估计算法根据人脸关键点坐标计算船员人脸的偏航角度Yaw与俯仰角度Pitch，其计算公式为：

；

其中，、、分别代表船员面部关键点中的左眼中心点、右眼中心点和鼻尖中心点，、分别代表船员人脸检测框D的左上角点和右下角点，、分别代表图像中某点的轴坐标、轴坐标，代表两点之间直线距离的函数；

通过Yaw与Pitch值筛选人脸图像，过滤掉阈值外的人脸图像，其中，Yaw与Pitch阈值设置如下：

。

与现有技术相比，本发明提供的一种基于深度学习的舰船驾驶台身份识别方法具有以下有益效果：本发明提供了一种基于深度学习的船员驾驶台身份识别方法，改进人脸特征提取网络IResNet-50，利用空间-通道注意力可以更准确、快速提取出各种光照、尺度的船员人脸特征，提升船员驾驶台身份识别精度；设计了基于几何关系的船员头部姿态估计算法，可有效获取船员正脸图像，提升船员驾驶台身份识别精度，适用于船员驾驶台环境；该方法具有识别准确率高、鲁棒性强、兼容性好等优点，可以有效识别船员的身份，防止非法人员进入驾驶台，保障船员和船舶的安全。

附图说明

图1为本发明中改进后的IResNet-50模型结构示意图。

图2为本发明中采用不同模型的船员人脸识别精度对比图。

具体实施方式

下面结合具体实施例对本发明的具体实施方式做进一步说明：

一种基于深度学习的舰船驾驶台身份识别方法，其特征在于，包括以下步骤：

S1包括以下子步骤：

S1.2、将采集的视频利用视频帧转换软件生成单帧图像序列；

S2、构建改进后的CenterNet船员人脸检测模型；

CenterNet包括改进后的特征提取网络ResNet-50、上采样网络DeConv和改进后的预测网络Heads，特征提取网络ResNet-50包括四个ResBlock模块ResBlock_1~ResBlock_4和一个TransfomerBlock模块，其中TransfomerBlock模块由三个1×1的卷积模块、一个位置编码模块和一个多头注意力模块组成；ResBlock_1由一个ConvBNR和三个ConvBlock组成，ResBlock_2由四个ConvBlock组成，ResBlock_3由六个ConvBlock组成，ResBlock_4由六个ConvBlock组成；其中ConvBNR由一个7×7的卷积模块、一个批标准化模块、一个ReLu模块和一个3×3的最大池化模块组成，ConvBlock由一个1×1的卷积模块、一个3×3的卷积模块和一个1×1的卷积模块组成；上采样网络DeConv由三个DeConvBlock组成，每个DeConvBlock由一个3×3的卷积模块和一个4×4的反卷积模块组成；预测网络Heads包括中心点预测网络HeatMap Head、边界偏置预测网络Offerset Head和尺寸预测网络SizeHead；中心点预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块与一个CBAM模块组成，边界偏置预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块与一个CBAM模块组成，尺寸预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块组成。

S3、构建改进后的IResNet-50船员人脸特征提取模型；

IResNet-50包括一个3×3的CBR模块、四个ResGroup模块ResGroup_1~ResGroup_4、一个SimAM模块、一个全局平均池化模块Global Avgpool和全连接模块Full Connect；

采用同类型的模型如ResNet-50、ResNet-100、IResNet-100与原I ResNet-50作为对比模型，ResNet为残差网络，IResNet为现有技术中对ResNet改进的残差网络，50和100为网络的层数，选择Rank-1识别精度、推理耗时作为评价指标，从而得到对比结果如表1，其中Rank-1至Rank-5的CMC精度如图2所示；

表1 人脸识别方法精度对比实验；

；

改进后的IResNet-50模型具有较好的准确率与较快的计算速度，将提取到的特征进行归一化处理，并进行降维，得到人脸检测框D(F1，F2)和人脸关键点K(E1,E2,N1,M1,M2)；

对IResNet-50进行训练，首先采集舰船驾驶台中船员的人脸图像，在舰船驾驶台上安装两台摄像头，用于采集船员的人脸图像，摄像头安装在可准确捕捉船员面部信息的位置，包括驾驶台前方或侧方，同时为了保护船员隐私，系统只采集船员面部信息，不采集其他身体信息；将采集的视频利用视频帧转换软件生成单帧图像序列，使用人工截图工具截取船员正脸图像制作船员人脸识别数据集，每位船员对应1张正脸图像，数据集内容示例如表2所示：

表2 数据集内容示例；

；

将数据集输入到IResNet-50中进行训练，设置迭代次数为20，学习率为1.25e^-4，批训练大小为128，训练动量设置为0.9，权重衰减率为0.0005，根据训练中损失函数的变化趋势适当设置不同的学习率和批训练大小，使损失函数最小化，直至达到指定的迭代次数时结束训练，得到最终的船员人脸特征提取模型。

船员人脸特征提取模型的损伤函数为：

；

通过船员人脸特征提取模型进行特征提取的过程具体为：如图1所示，每帧图像通过自适应缩放方式设置尺寸为112×112×3，首先通过CBR模块输出的特征尺寸为112×112×64，然后通过ResGroup_1模块输出的特征尺寸为56×56×128，通过ResGroup_2模块输出的特征尺寸为28×28×256，通过ResGroup_3模块输出特征图Ⅰ，其尺寸为28×28×256；将特征图Ⅰ输入SimAM模块，得到14×14×512尺寸的注意力热图，将特征图Ⅰ和注意力热图通过Concat操作进行堆叠，随后输入到ResGroup_4模块，得到7×7×1024尺寸的全局特征图II；将II先输入到全局平均池化模块中，输出1×1×1024的特征图，然后输入到全连接模块进行人脸特征提取，得到输出长度为1×1×512的人脸特征向量，用于和数据库中已有人脸特征向量进行对比。

S4、通过监控相机实时采集驾驶台内的监控视频，当检测到船员到岗或每隔20分钟，采用船员人脸检测模型和船员人脸特征提取模型自动检测人脸位置、采集其人脸信息，并进行人脸识别；

S4包括以下子步骤：

S4.2、设计基于几何关系的人脸姿态估计算法，根据人脸关键点坐标筛选船员高质量人脸图像，基于人脸关键点坐标，采用仿射变换算法，对同一个船员的多张人脸图像进行对齐，以减少由于光照、角度、表情等因素引起的人脸图像差异；

人脸姿态估计算法根据人脸关键点坐标计算船员人脸的偏航角度Yaw与俯仰角度Pitch，其计算公式为：

；

S4.4、计算人脸特征向量与人脸数据库中各船员人脸特征的相似度，得到相似矩阵R，其中相似度阈值设置为0.6，若相似度超过0.6，则人脸识别成功，船员能够启动或继续使用驾驶台设备，若相似度没有超过0.6，则人脸识别失败，则驾驶台报警，同时记录下船员人脸图像I1和当前时间T，并录入数据库中以供后续分析。

当然，上述说明并非是对本发明的限制，本发明也并不仅限于上述举例，本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换，也应属于本发明的保护范围。

Claims

1.一种基于深度学习的舰船驾驶台身份识别方法，其特征在于，包括以下步骤：

S2、构建改进后的CenterNet船员人脸检测模型；

S3、构建改进后的IResNet-50船员人脸特征提取模型；

改进后的IResNet-50船员人脸特征提取模型包括一个3×3的CBR模块、四个ResGroup模块ResGroup_1～ResGroup_4、一个SimAM模块、一个全局平均池化模块和全连接模块；

CBR由一个卷积模块、一个批标准化模块、一个ReLu模块组成；ResGroup_1、ResGroup_4由1个Start_IResBlock、1个IResBlock与一个End_IResBlock组成，ResGroup_2由1个Start_IResBlock、2个IResBlock与1个End_IResBlock组成，ResGroup_3由1个Start_IResBlock、4个IResBlock与1个End_IResBlock组成；

Start_IResBlock由一个1×1的CBR模块、一个3×3的CBR模块、一个1×1卷积模块和一个批归一化模块组成；IResBlock由一个1×1的BRC模块、一个3×3的BRC模块组成，BRC为将CBR的卷积模块放置在末尾所形成；End_IResBlock由1×1的BRC模块、一个3×3的BRC模块、一个批归一化模块、一个ReLu模块组成；

对IResNet-50进行训练，首先采集舰船驾驶台中船员的人脸图像，使用船员身份信息标记人脸信息，得到船员人脸识别数据集，将数据集输入到IResNet-50中进行训练，设置迭代次数为20，学习率为1.25e^-4，批训练大小为128，训练动量设置为0.9，权重衰减率为0.0005，根据训练中损失函数的变化趋势适当设置不同的学习率和批训练大小，使损失函数最小化，直至达到指定的迭代次数时结束训练，得到最终的船员人脸特征提取模型；

船员人脸特征提取模型的损伤函数为：

其中，N表示样本数量，s表示缩放因子，m表示边界参数，表示第i个样本的特征向量与第y_i个类别中心点的角度余弦值，θ_j表示第i个样本的特征向量与第j个类别中心点的角度余弦值，通过缩放因子s和边界参数m来控制类别之间的间隔；

通过船员人脸特征提取模型进行特征提取的过程具体为：每帧图像通过自适应缩放方式设置尺寸为112×112×3，图像首先依次通过CBR模块、ResGroup_1、ResGroup_2和ResGroup_3后输出特征图Ⅰ，将特征图Ⅰ输入SimAM模块，得到512个不同模式的14×14尺寸的注意力热图，将特征图Ⅰ和注意力热图通过Concat操作进行堆叠，随后输入到ResGroup_4模块，得到7×7×1024尺寸的全局特征图II；将II依次输入到全局平均池化模块和全连接模块进行人脸特征提取，得到输出长度为1×1×512的人脸特征向量；

S4、通过监控相机实时采集驾驶台内的监控视频，当检测到船员到岗或每隔20分钟，采用船员人脸检测模型和船员人脸特征提取模型自动检测人脸位置、采集其人脸信息，并进行人脸识别；S4包括以下子步骤：

S4.1、将驾驶台内视频实时传输到CenterNet模型中，得到驾驶台内的船员人脸检测框D(F1，F2)和人脸关键点K(E1,E2,N1,M1,M2)，并将该船员人脸图像从原图分割生成图像I1；其中E1、E2分别为图像中船员左右眼中心位置，N1为船员鼻尖位置，M1、M2分别为船员左右嘴角位置，F1和F2分别为船员人脸左上角、右下角位置；

S4.2、设计基于几何关系的人脸姿态估计算法，根据人脸关键点坐标筛选船员高质量人脸图像，基于人脸关键点坐标，采用仿射变换算法，对同一个船员的多张人脸图像进行对齐，减少由于光照、角度、表情引起的人脸图像差异；

S4.4、计算人脸特征向量与人脸数据库中各船员人脸特征的相似度，得到相似矩阵R，其中相似度阈值设置为0.6，若相似度超过0.6，则人脸识别成功，船员能够启动或继续使用驾驶台设备，若相似度没有超过0.6，则人脸识别失败，则驾驶台报警，同时记录下船员人脸图像I1和当前时间T，并录入数据库中；

在S4.2中，人脸姿态估计算法根据人脸关键点坐标K(E₁,E₂,N₁,M₁,M₂)计算船员人脸的偏航角度Yaw与俯仰角度Pitch，其计算公式为：

其中，E₁、E₂、N₁分别代表船员面部关键点中的左眼中心点、右眼中心点和鼻尖中心点，F₁、F₂分别代表船员人脸检测框D的左上角点和右下角点，x、y分别代表图像中某点的x轴坐标、y轴坐标，len代表两点之间直线距离的函数；

2.根据权利要求1所述的一种基于深度学习的舰船驾驶台身份识别方法，其特征在于，所述S1包括以下子步骤：

S1.2、将采集的视频利用视频帧转换软件生成单帧图像序列；

3.根据权利要求1所述的一种基于深度学习的舰船驾驶台身份识别方法，其特征在于，在所述S2中，改进后的CenterNet船员人脸检测模型包括改进后的特征提取网络ResNet-50、上采样网络DeConv和改进后的预测网络Heads，特征提取网络ResNet-50包括四个ResBlock模块ResBlock_1～ResBlock_4和一个TransfomerBlock模块，其中TransfomerBlock模块由三个1×1的卷积模块、一个位置编码模块和一个多头注意力模块组成；ResBlock_1由一个ConvBNR和三个ConvBlock组成，ResBlock_2由四个ConvBlock组成，ResBlock_3由六个ConvBlock组成，ResBlock_4由六个ConvBlock组成；其中ConvBNR由一个7×7的卷积模块、一个批标准化模块、一个ReLu模块和一个3×3的最大池化模块组成，ConvBlock由一个1×1的卷积模块、一个3×3的卷积模块和一个1×1的卷积模块组成；上采样网络DeConv由三个DeConvBlock组成，每个DeConvBlock由一个3×3的卷积模块和一个4×4的反卷积模块组成；预测网络Heads包括中心点预测网络HeatMap Head、边界偏置预测网络Offerset Head和尺寸预测网络Size Head；中心点预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块与一个CBAM模块组成，边界偏置预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块与一个CBAM模块组成，尺寸预测网络由一个3×3×256的卷积模块、一个1×1×256的卷积模块组成。