CN110991366A

CN110991366A - 一种基于三维残差网络的航运监控事件识别方法及系统

Info

Publication number: CN110991366A
Application number: CN201911250944.3A
Authority: CN
Inventors: 张鸿; 容杰雄
Original assignee: Wuhan University of Science and Engineering WUSE
Current assignee: Wuhan University of Science and Engineering WUSE; Wuhan University of Science and Technology WHUST
Priority date: 2019-12-09
Filing date: 2019-12-09
Publication date: 2020-04-10

Abstract

本发明涉及一种基于三维残差网络的航运监控事件识别方法及系统。所述识别方法包括：获取船舶每天的航行视频；将所述航行视频转换为等间隔连续的图像数据；将所述图像数据划分为训练集以及测试集；采用四层残差块结构建立三维残差网络模型；根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型；根据所述三维残差网络模型识别航运监控中的事件。采用本发明所提供的识别方法能够大大加快神经网络的训练速度，降低计算资源的消耗。

Description

一种基于三维残差网络的航运监控事件识别方法及系统

技术领域

本发明涉及航运监控事件识别领域，特别是涉及一种基于三维残差网络的航运监控事件识别方法及系统。

背景技术

航运视频监控用于监视船舶的状态，它不仅可以判断船舶是处于正常行驶状态还是停泊状态，而且还可以提供船舶异常状态的预警，例如停泊过程中的装卸状态，船舶行驶过程中的雨布吹飞和未盖雨布状态的预警。随着人工智能的快速发展，人们尝试将人工智能技术应用于航运视频监控，以实现智能监控运输。通过深度学习的方法，可以在大量的训练数据集上训练一个好的网络，以实现对船舶状态的识别，这不仅降低了人工成本，而且使异常状态的预警更加及时。

现有的航运监控事件识别方法通常基于三维卷积神经网络模型进行识别，而三维卷积神经网络模型较大，识别一次花费的时间较长，这是因为三维卷积神经网络是普通网络，没有专门处理模型的参数，因此需要消耗更多的计算资源，平均处理时间更长。

发明内容

本发明的目的是提供一种基于三维残差网络的航运监控事件识别方法及系统，以解决现有的航运监控事件识别方法计算资源消耗量大，且计算时间长的问题。

为实现上述目的，本发明提供了如下方案：

一种基于三维残差网络的航运监控事件识别方法，包括：

获取船舶每天的航行视频；

将所述航行视频转换为等间隔连续的图像数据；

将所述图像数据划分为训练集以及测试集；

采用四层残差块结构建立三维残差网络模型；

根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型；

根据所述三维残差网络模型识别航运监控中的事件。

可选的，所述将所述图像数据划分为训练集以及测试集，具体包括：

对所述图像数据进行分类，确定分类后的图像数据；

按照9:1的比例，将所述分类后的图像数据划分为训练集以及测试集。

可选的，所述采用四层残差块结构建立三维残差网络模型，具体包括：

利用公式y＝F(x,{W_i})+W_sx建立三维残差网络模型；其中，y为所述三维残差网络模型中残差块的输出量；x为所述残差块的输入量；F(x,{W_i})为残差；W_i为第i个权重函数；W_s为线性变换函数。

可选的，所述根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型，具体包括：

利用参数正则化方法Dropout技术，根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型。

可选的，所述根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型之后，还包括：

利用均值减法确定每个所述图像数据之间的差异特征。

一种基于三维残差网络的航运监控事件识别系统，包括：

航行视频获取模块，用于获取船舶每天的航行视频；

图像数据转换模块，用于将所述航行视频转换为等间隔连续的图像数据；

划分模块，用于将所述图像数据划分为训练集以及测试集；

三维残差网络模型建立模块，用于采用四层残差块结构建立三维残差网络模型；

训练模块，用于根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型；

识别模块，用于根据所述三维残差网络模型识别航运监控中的事件。

可选的，所述划分模块具体包括：

分类单元，用于对所述图像数据进行分类，确定分类后的图像数据；

划分单元，用于按照9:1的比例，将所述分类后的图像数据划分为训练集以及测试集。

可选的，所述三维残差网络模型建立模块具体包括：

三维残差网络模型建立单元，用于利用公式y＝F(x,{W_i})+W_sx建立三维残差网络模型；其中，y为所述三维残差网络模型中残差块的输出量；x为所述残差块的输入量；F(x,{W_i})为残差；W_i为第i个权重函数；W_s为线性变换函数。

可选的，所述训练模块具体包括：

训练单元，用于利用参数正则化方法Dropout技术，根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型。

可选的，所述四层残差块中的第二层残差块以及第三层残差块为3*3*3的卷积层；所述第二层残差块的输出通道数以及所述第三层残差块的输出通道数均为第一层残差块的输出通道数的一半。

根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明提供了一种基于三维残差网络的航运监控事件识别方法及系统，利用三维残差网络模型识别航运监控中的事件，三维残差网络模型中使用了多个残差块，并且残差块使得输入通过跨层数据线路的传播速度更快，大大加快了神经网络的训练速度，降低了计算资源的消耗。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明所提供的基于三维残差网络的航运监控事件识别方法流程图；

图2为本发明所提供的基于上述识别方法的整体框架图；

图3为本发明所提供的基于三维残差网络的航运监控事件识别系统结构图；

图4为本发明所提供的四层残差块的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的是提供一种基于三维残差网络的航运监控事件识别方法及系统，以大大加快神经网络的训练速度，降低计算资源的消耗。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明所提供的基于三维残差网络的航运监控事件识别方法流程图，如图1所示，一种基于三维残差网络的航运监控事件识别方法，包括：

步骤101：获取船舶每天的航行视频。

步骤102：将所述航行视频转换为等间隔连续的图像数据。

位于船舶上的摄像头记录了船舶每天的运动视频，将视频转换成等间隔连续的图像数据，然后对图像数据按照实际类别进行分类。

步骤103：将所述图像数据划分为训练集以及测试集。

将每个类别下的图像数据进行随机地打乱，避免人为因素的干扰，同时，将打乱后的图像数据按照9比1的比例分成训练集和测试集。

逐一读取训练集中的图像数据，将训练集的图像保存为二进制文件。

步骤104：采用四层残差块结构建立三维残差网络模型。

搭建三维残差网络具体包括如下步骤：

1)采用四层残差块结构：三维残差网络由许多残差块组成，残差块是在原始网络中增加了一个直连通道，使得输入可以通过跨层的数据线路更快地向前传播，极大的加快了神经网络的训练；

该三维残差网络采用了四层残差块结构，输入x通过四层残差块后，获得了残差F(x,{W_i})，对应的公式如下：

F(x,{W_i})＝W₄σ(W₃σ(W₂σ(W₁x))) (1)

其中，x是残差块的输入；W₁是第一个权重函数；σ是线性整流函数；W₂是第一个权重函数；W₃是第三个权重函数；W₄是第四个权重函数；W_i是第i个权重函数；F(x,{W_i})是残差。

线性整流函数可以克服梯度消失的问题，加快训练的速度，对应的公式如下：

σ(x)＝max(0,x) (2)

其中，x是残差块的输入；max是最大值；σ是线性整流函数；然后通过一个直连通道与输入的x直接相加，得到最终的输出y，对应的公式如下：

y＝F(x,{W_i})+x (3)

其中，x是残差块的输入；W_i是第i个权重函数；F(x,{W_i})是残差；y是残差块的输出。

当需要对输入和输出维数进行变化时(如改变通道数目)，可以在直连通道对x做一个线性变换W_s，对应的公式如下：

y＝F(x,{W_i})+W_sx (4)

其中，x是残差块的输入；W_s是线性变换函数；W_i是第i个权重函数；F(x,{W_i})是残差；y是残差块的输出。

2)采用Dropout技术

该三维残差网络也采用了Dropout技术，它允许神经元的激活值在向前传播时以一定的概率停止工作，这使得模型更加通用，因为它不过度依赖某些局部特征；

r是依伯努利概率分布(0-1分布)随机产生的向量，向量元素取值为0或1，取1的概率为p，取0的概率为1-p，对应的公式如下：

其中，p是向量元素取值为1的概率；Bernoulli是伯努利概率分布函数；r是随机向量。

r向量与神经元对应元素相乘，r中元素为1的被保留，为0的则被置为0，对应的公式如下：

其中，y^(l)是变换前，第l层的输出；r是随机向量；

是变换后，第l层的输出。

只有被保留的神经元对应的参数得到了训练，参数获得了更新(强迫神经元和其他随机挑选出来的神经元共同工作，减弱了神经元节点间的联合适应性)，对应的公式如下：

其中，

是第l+1层的偏置；

是变换后，第l层的输出；

是第l+1层的权重函数；

是第l+1层的输出。

对

加上一个激活函数，获得最终的输出，对应的公式如下：

其中，

是变换前，第l+1层的输出；f是激活函数；

是变换后，第l+1层的输出。

3)采用均值减法操作

该三维残差网络还使用到了均值减法，目的是找出每个图像的差异性，对应的公式如下：

y＝x-mean (9)

其中，mean是训练集中图像数据的平均值；x是输入的图像数据；y是输出的图像数据。

步骤105：根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型。

图2为本发明所提供的基于上述识别方法的整体框架图，如图2所示，使用了66层的三维残差网络来提取图像的特征，对应的算法如下：

其中，Conv1表示第一个卷积神经网络，Conv2_x表示第二个卷积神经网络模块，残差块中的Conv2a表示位于第二个卷积神经网络模块中的第一个卷积神经网络子模块，Conv3_x表示第三个卷积神经网络模块，残差块中的Conv3a表示位于第三个卷积神经网络模块中的第一个卷积神经网络子模块，残差块中的Conv3b表示位于第三个卷积神经网络模块中的第二个卷积神经网络子模块，Conv4_x表示第四个卷积神经网络模块，残差块中的Conv4a表示位于第四个卷积神经网络模块中的第一个卷积神经网络子模块，残差块中的Conv4b表示位于第四个卷积神经网络模块中的第二个卷积神经网络子模块，Conv5_x表示第五个卷积神经网络模块，残差块中的Conv5a表示位于第五个卷积神经网络模块中的第一个卷积神经网络子模块，残差块中的Conv5b表示位于第五个卷积神经网络模块中的第二个卷积神经网络子模块，Flatten层表示扁平层，可以将高维的输入转换至一维输出，Dropout层表示丢失层，可以防止模型出现过拟合的现象，Softmax层表示软最大化层，可以将三维残差网络的输出映射为一个概率分布。

输入：航运事件数据集中连续的六帧RGB剪辑图像，批次数量batch_size＝6，训练轮次N_epoch＝10，训练集数量N_train，测试集数量N_test，训练集迭代次数I_train，测试集迭代次数I_test

训练过程：

1)在训练集上循环，迭代次数1,2,……I_train；随机选择六组输入图像构建批次数据；对批次数据执行均值相减的操作(式(9))；输入到三维残差网络中，训练模型(式(1-8))；结束循环。

2)在测试集上循环，迭代次数1,2,……I_test；随机选择六组输入图像构建批次数据；对批次数据执行均值相减的操作(式(9))；输入三维残差网络中，提取图像特征(式(1-4))；如果这一轮次的准确率大于初始准确率，更新初始准确率；保存当前轮次的训练模型；结束循环。

3)重复1)和2)，直到达到了指定的训练轮次N_epoch。

步骤106：根据所述三维残差网络模型识别航运监控中的事件。

利用训练完成的三维残差网络模型进行航运事件的实时识别，对应的算法如下：

1)从视频中截取等间隔连续的六帧RGB剪辑图像。

2)使用训练完成的三维残差网络模型提取图像特征。

3)模型中的softmax层会返回每个类别的概率值，选择最大概率的类别作为最终的识别结果。

图3为本发明所提供的基于三维残差网络的航运监控事件识别系统结构图，如图3所示，一种基于三维残差网络的航运监控事件识别系统，包括：

航行视频获取模块301，用于获取船舶每天的航行视频。

图像数据转换模块302，用于将所述航行视频转换为等间隔连续的图像数据。

划分模块303，用于将所述图像数据划分为训练集以及测试集。

所述划分模块303具体包括：分类单元，用于对所述图像数据进行分类，确定分类后的图像数据；划分单元，用于按照9:1的比例，将所述分类后的图像数据划分为训练集以及测试集。

三维残差网络模型建立模块304，用于采用四层残差块结构建立三维残差网络模型。

所述三维残差网络模型建立模块304具体包括：三维残差网络模型建立单元，用于利用公式y＝F(x,{W_i})+W_sx建立三维残差网络模型；其中，y为所述三维残差网络模型中残差块的输出量；x为所述残差块的输入量；F(x,{W_i})为残差；W_i为第i个权重函数；W_s为线性变换函数。

训练模块305，用于根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型。

所述训练模块305具体包括：训练单元，用于利用参数正则化方法Dropout技术，根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型。

识别模块306，用于根据所述三维残差网络模型识别航运监控中的事件。

图4为本发明所提供的四层残差块的结构图，如图4所示，所述四层残差块中的第二层残差块以及第三层残差块为3*3*3的卷积层；所述第二层残差块的输出通道数以及所述第三层残差块的输出通道数为第一层残差块的输出通道数的一半。

依次训练了每种方法的模型，然后在同一测试集上验证它们各自的性能。所选择的基准比较方法是三维卷积神经网络，18层，34层和50层三维残差网络。下表显示了航运事件数据集上不同方法的性能。

表1

表1为本发明所提供的不同方法在航运事件数据集上表现的对比表，根据表1中的结果，可以清楚地看到三维卷积神经网络具有最大的模型大小，并且识别一次花费的时间最长。这是因为三维卷积神经网络是普通网络，它没有专门处理参数的数量。由于三维卷积神经网络本身具有大量参数，因此需要消耗更多的计算资源，因此平均处理时间更长。但是，三维残差网络使用了多个残差块，并且残差块使得输入通过跨层数据线路的传播速度更快，并大大加快了神经网络的训练速度。因此，三维残差网络在准确性，模型大小或平均处理时间方面优于三维卷积神经网络。随着三维残差网络深度的增加(从18层增加到34层)，模型大小和平均处理时间相应增加，这是正常现象。当网络深度增加到50时，模型大小和平均处理时间会减少，这是因为50层的三维残差网络采用了三层残差块，可以更有效地减少参数数量。而本发明方法采用了四层残差块，不仅减少了参数数量，而且提高了特征提取能力。

本发明所提供的四层残差块的中间两层使用两个3×3×3卷积层，其目的是增强特征提取的能力；同时，为了减少参数的数量，将两个卷积层的输出通道数设置为第一个的卷积层输出通道数的一半。

本发明还使用了Dropout技术，有效地避免了模型出现过拟合的现象。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于三维残差网络的航运监控事件识别方法，其特征在于，包括：

获取船舶每天的航行视频；

将所述航行视频转换为等间隔连续的图像数据；

将所述图像数据划分为训练集以及测试集；

采用四层残差块结构建立三维残差网络模型；

根据所述三维残差网络模型识别航运监控中的事件。

2.根据权利要求1所述的基于三维残差网络的航运监控事件识别方法，其特征在于，所述将所述图像数据划分为训练集以及测试集，具体包括：

对所述图像数据进行分类，确定分类后的图像数据；

3.根据权利要求1所述的基于三维残差网络的航运监控事件识别方法，其特征在于，所述采用四层残差块结构建立三维残差网络模型，具体包括：

4.根据权利要求1所述的基于三维残差网络的航运监控事件识别方法，其特征在于，所述根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型，具体包括：

5.根据权利要求1所述的基于三维残差网络的航运监控事件识别方法，其特征在于，所述根据所述训练集训练所述三维残差网络模型，确定训练后的三维残差网络模型之后，还包括：

利用均值减法确定每个所述图像数据之间的差异特征。

6.一种基于三维残差网络的航运监控事件识别系统，其特征在于，包括：

航行视频获取模块，用于获取船舶每天的航行视频；

划分模块，用于将所述图像数据划分为训练集以及测试集；

7.根据权利要求6所述的基于三维残差网络的航运监控事件识别系统，其特征在于，所述划分模块具体包括：

8.根据权利要求6所述的基于三维残差网络的航运监控事件识别系统，其特征在于，所述三维残差网络模型建立模块具体包括：

9.根据权利要求6所述的基于三维残差网络的航运监控事件识别系统，其特征在于，所述训练模块具体包括：

10.根据权利要求6所述的基于三维残差网络的航运监控事件识别系统，其特征在于，所述四层残差块中的第二层残差块以及第三层残差块为3*3*3的卷积层；所述第二层残差块的输出通道数以及所述第三层残差块的输出通道数均为第一层残差块的输出通道数的一半。