CN116071566A

CN116071566A - 基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法

Info

Publication number: CN116071566A
Application number: CN202310286670.3A
Authority: CN
Inventors: 荆晓远; 刘飞; 王广宁; 韩光信; 朱冠华; 陈俊均; 姚永芳
Original assignee: Maoming Huajian Experimental Technology Co ltd; Guangdong University of Petrochemical Technology
Current assignee: Maoming Huajian Experimental Technology Co ltd; Guangdong University of Petrochemical Technology
Priority date: 2023-03-23
Filing date: 2023-03-23
Publication date: 2023-05-05

Abstract

本发明公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，涉及钢桶运输轨迹领域，旨在解决现有技术中人工成本高、图像去噪不佳的问题，采用的技术方案是，通过摄像头获取钢桶运输轨迹视频；将获取的视频利用网格流运动网络模型进行去噪处理；将获得的去噪后的视频输入到已经训练完成的多尺度目标检测网络中，得到钢桶运输轨迹是否正常的判断；通过采集不同背景下钢桶图像，对其进行运输轨迹检测，根据检测结果来监测钢桶运输情况。相比采用人工的方式节省了大量的人力、物力和财力。基于网格流运动网络可以有效地对视频噪声进行去除，而训练完成的多尺度目标检测网络可以提高钢桶运输轨迹的检测效率。

Description

基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法

技术领域

本发明涉及钢桶运输轨迹领域，具体为一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法。

背景技术

钢桶因其体积、质量较大，使用人工搬运的成本很高而效率不高，因此，工厂大量的钢桶一般采用自动化设备进行运输。而在工厂在大量运输钢桶的过程中会因为运输带的一些缺陷或者因为钢桶本身由于磕碰产生一些形变导致运输不稳定甚至导致钢桶脱离运输带。

传统的钢桶运输一般为人工对其进行监视和判断，虽然使用人力对其检测的精确度较高，但需要人工有一定的经验、经过一定的培训。其次，人工长时间保持较强的专注度比较困难。相对于使用人工对钢桶运输进行监视，使用一些基础的图像处理方法对钢桶运输轨迹进行检测，可以降低人工成本，但是基础的图像处理方法对视频中的一些光照、阴影等噪声的去除效果不佳。

中国专利CN202111391364.3公开了一种使用卷积神经网络和双向匹配算法的视频多目标跟踪方法，采用的技术方案是，在无锚框目标检测方法的卷积神经网络的基础上，增加了针对目标的双向运动预测分支，并基于双向运动信息设计了对应的多目标跟踪匹配算法，从而通过多帧视频信息的输入，完成对目标的双向跟踪匹配，并通过搁浅区的设计缓解因目标短时遮挡导致的跟踪间断。

中国专利CN202210296395.9公开了一种基于多尺度信息融合的海面小目标检测方法、电子设备及计算机可读介质，采用的技术方案是，构建海面小目标仿真数据集；构建深度学习网络模型；利用小目标仿真数据集对构建的深度学习模型进行训练；在训练过程中，通过transformer模块解码和检测出海面小目标的位置和类别信息；利用训练好的模型进行其他场景下的海面小目标检测。

两现有专利分别是基于无锚框的卷积神经网络和应用transformer模块进行解码预测边界框，其包含信息少，精度差。

因此，本发明提出一种网格流运动网络来对视频去除噪声，使用多尺度目标检测网络来对钢桶运输轨迹进行检测。

发明内容

鉴于现有技术中所存在的人工成本高、基础图像处理对噪声去除效果差的问题，本发明公开了基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，通过网格流运动网络来对视频去除噪声，使用多尺度目标检测网络来对钢桶运输轨迹进行检测。

为实现上述目的，本发明先公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，采用的技术方案是，包括以下步骤：

步骤1，通过摄像头获取钢桶运输轨迹视频；

步骤2，将所述步骤1中获取的视频利用网格流运动网络模型进行去噪处理；

步骤3，将所述步骤2中获得的去噪后的视频输入到已经训练完成的多尺度目标检测网络中，得到钢桶运输轨迹是否正常的判断，使用训练完成的多尺度目标检测网络能够进一步提高准确性。

作为本发明的一种优选技术方案，所述步骤2中，利用离散的Laplacian算子和Laplacian矩阵将所述步骤1中获取的视频进行去噪处理。

作为本发明的一种优选技术方案，所述步骤3中，多尺度目标检测网络的训练包括以下步骤：

步骤a，构建训练数据集，所述训练数据集包括在不同背景下钢桶图像，将所述钢桶图像在不同的背景中标注出来；

步骤b，将所述钢桶图像输入到待训练的多尺度目标检测网络中，得到生成多尺度的锚框，并为锚框预测类别和偏移量；

步骤c，基于所述预测类别和偏移量及标注值，计算联合损失函数；

若所述多尺度目标检测网络的联合损失函数收敛，则以最新的多尺度目标检测网络作为训练完成的多尺度目标检测网络。

作为本发明的一种优选技术方案，所述步骤c中，计算联合损失函数包括：

将所述锚框类别的损失使用交叉熵损失函数来计算，所述交叉熵损失函数公式为：

其中，N代表样本总数，代表真实值，代表预测值；

将所述锚框偏移量的损失使用平滑范数损失函数来计算，所述平滑范数损失函数公式为：

其中超参数用来控制平滑区域。

作为本发明的一种优选技术方案，所述步骤3中，将摄像头所获取的视频输入到已经训练完成的多尺度网络中，得到钢桶运输轨迹是否正常判断的步骤包括：

步骤i，将所述去噪处理之后的视频输入到所述多尺度目标检测训练模型中；

步骤ii，在所述多尺度目标检测训练模型的前向传播过程中生成多尺度锚框，得到预测边界框并预测其类别和偏移量；

步骤iii，将所述生成的锚框根据标签信息标记类别和偏移量，根据所述类别和偏移量的预测和标注值计算出距离，得到钢桶运输轨迹是否正常判断。

作为本发明的一种优选技术方案，所述步骤iii中，计算距离的公式为：

其中，代表预测的锚框中左边框的横坐标值，代表设置的左边界线的横坐标值，代表预测的锚框中右边框的横坐标值，代表设置的右边界线的横坐标值，、分别为代表左右边界线与预测锚框的距离。

作为本发明的一种优选技术方案，所述多尺度目标检测网络包括基本网络块和高宽减半网络块组成，其中，所述基本网络块包括串联的多个高宽减半网络块；

所述高宽减半网络块采用多个卷积层和最大汇聚层将特征图将输入的特征图的高和宽减少一半，扩大每个单元在其输出特征图中的感受野。

本发明还公开基于上述检测方法的一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测装置，采用的技术方案是，包括以下模块：

处理模块，用于将摄像头获取的视频利用网格流运动网络进行去噪处理，将所述去噪处理后的视频输入到训练完成的多尺度目标检测网络中，得到对钢桶运输轨迹检测是否正常的判断；

训练模块，用于构建训练数据集，所述训练数据集包括在不同背景下钢桶图像，将所述钢桶图像在不同的背景中标注出来；所述钢桶图像输入到待训练的多尺度目标检测网络中，得到生成多尺度的锚框，并为锚框预测类别和偏移量；

计算模块，用于计算锚框类别的损失使用交叉熵损失函数、锚框偏移量的损失使用平滑范数损失函数、平滑范数损失函数。

为实现上述目的，本发明还公开了一种可读存储介质，采用的技术方案是，存储介质上存储有基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序，所述基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序被处理器执行时实现基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法。

为实现上述目的，本发明还公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测设备，采用的技术方案是，包括处理器、摄像头、用户接口、网络接口、通信模块、存储器，其中，所述处理器和所述摄像头、所述用户接口、所述网络接口、所述通信模块、所述存储器相连；所述存储器内存储有可在所述处理器上运行的钢桶运输轨迹检测程序，所述钢桶运输轨迹检测程序被所述处理器执行时实现钢桶运输轨迹检测方法。

本发明的有益效果：本发明通过采集不同背景下钢桶图像，对其进行运输轨迹检测，根据检测结果来监测钢桶运输情况。相比采用人工的方式节省了大量的人力、物力和财力。基于网格流运动网络可以有效地对视频噪声进行去除，而训练完成的多尺度目标检测网络可以提高钢桶运输轨迹的检测效率。

进一步的，本发明通过使用多尺度特征图来生成锚框并预测其类别和偏移量，不同尺度的特征包含丰富的语义信息，精度高。

进一步的，本发明通过使用网格流运动网络模型进行视频去噪，不需要层次结构和逐层优化，效率更高，更方便。

进一步的，本发明使用两侧直线距离绝对值数值判断钢桶运输轨迹的偏移量，计算更为简便、省时。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1为本发明钢桶运输轨迹的检测方法流程图；

图2为本发明多尺度目标检测网络训练流程图；

图3为本发明钢桶运输轨迹的检测设备结构示意图。

图中：1001、处理器；1002、摄像头；1003、用户接口；1004、网络接口；1005、通信模块；1006、存储器。

具体实施方式

实施例1

如图1、图2所示，本实施例先公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，采用的技术方案是，包括以下步骤：

步骤1，使用摄像头采集钢桶运输视频；

步骤2，将步骤1采集的视频输入网格流运动网络使用离散的Laplacian算子和Laplacian矩阵进行去噪处理；

其中离散Laplacian公式为：

其中，f(x,y)代表视频帧图像(x,y)位置的像素值；

步骤3，使用不同背景下的钢桶图像构建训练数据集；

步骤4，将训练集中钢桶图像在不同的背景中标注出来；

步骤5，将钢桶图像输入到待训练的多尺度目标检测网络中，得到生成多尺度的锚框，并为锚框预测类别和偏移量；

步骤6，基于所述预测类别和偏移量及标注值，计算联合损失函数，联合损失函数由交叉熵损失函数和平滑范数损失函数相加构成；

交叉熵损失函数公式为：

其中，N代表样本总数，代表真实值，代表预测值；

平滑范数损失函数公式为：

其中超参数用来控制平滑区域；

步骤7，若所述多尺度目标检测网络的联合损失函数收敛，则以最新的多尺度目标检测网络作为训练完成的多尺度目标检测网络；

步骤8，将步骤2中获得的去噪后的视频输入到步骤7获得的训练完成的多尺度目标检测网络中；多尺度目标检测网络包括基本网络特征块和高宽减半网络特征块；

步骤9，去噪后的视频输入到训练完成的多尺度目标检测网络中后，构建类别预测层和边界框预测层，类别预测层由填充为1、卷积核大小为3×3的卷积层组成，边界预测层由填充为1、卷积核大小为3×3的卷积层组成；

步骤10，构建多个高宽减半特征块扩大每个单元在其输出特征图的感受野，其中每个高宽减半特征块由2个填充为1、卷积核大小为3×3的卷积层，在每一个卷积层之后进行归一化处理，在所述归一化处理之后使用ReLu激活函数，最后使用卷积核大小为2×2的最大池化层；

步骤11，构建基本网络块对所述经网格流运动网络去除噪声后的视频帧进行特征提取，所述基本网络块由4个高宽减半特征块串联组成；

步骤12，构建交叉熵损失函数以及平滑范数损失函数，将所述类别预测层所预测的锚框类别的损失使用交叉熵损失函数来计算；并将所述锚框偏移量的损失使用平滑范数损失函数来计算，通过超参数控制平滑区域；

步骤13，通过计算锚框和预设边界线的距离，判断钢桶运输轨迹是否正常。

本实施例还提供了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测设备，如图3所示，其包括处理器1001（例如中央处理器 Central Processing Unit，CPU）、摄像头1002、用户接口1003、网络接口1004、通信模块1005、存储器1006；其中，摄像头1002用于获取钢桶运输视频；用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard）；网络接口1004可选的可以包括标准的有线接口、无线接口（如无线保真WIreless FIdelity，WI FI接口）；通信总线1005用于实现这些组件之间的连接通信；存储器1006可以是高速随机存取存储器（random access memory，RAM），也可以是稳定的存储器（non volatile memory），例如磁盘存储器，存储器1006可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解，图3中示出的硬件结构并不构成对本发明的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。继续参照图3，图3中作为一种计算机存储介质的存储器1006中可以包括操作系统、网络通信模块、用户接口模块以及钢桶运输轨迹检测程序。其中，处理器1001可以调用存储器1006中存储的钢桶运输轨迹检测程序，并执行本发明实施例提供的钢桶运输轨迹检测方法。

本实施例还公开基于上述检测方法的一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测装置，采用的技术方案是，包括以下模块：

本实施例还公开了一种可读存储介质，采用的技术方案是，存储介质上存储有基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序，基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序被处理器执行时实现基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法。

上述虽然对本发明的具体实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化，而不具备创造性劳动的修改或变形仍在本发明的保护范围以内。

Claims

1.基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于，包括以下步骤：

步骤1，获取钢桶运输轨迹视频；

步骤3，将所述步骤2中获得的去噪后的视频输入到已经训练完成的多尺度目标检测网络中，得到钢桶运输轨迹是否正常的判断；

所述步骤3中，多尺度目标检测网络的训练包括以下步骤：

2.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于：所述步骤2中，利用离散的Laplacian算子和Laplacian矩阵将所述步骤1中获取的视频进行去噪处理。

3.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于：所述步骤c中，计算联合损失函数包括：

其中，N代表样本总数，代表真实值，代表预测值；

其中超参数用来控制平滑区域。

4.根据权利要求1或3所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于：所述步骤3中，将摄像头所获取的视频输入到已经训练完成的多尺度网络中，得到钢桶运输轨迹是否正常判断的步骤包括：

5.根据权利要求4所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于：所述步骤iii中，计算距离的公式为：

6.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于：所述多尺度目标检测网络包括基本网络块和高宽减半网络块组成，其中，所述基本网络块包括串联的多个高宽减半网络块；

7.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法，其特征在于，实现步骤1-3的装置包括以下模块：

处理模块，用于将获取的视频利用网格流运动网络进行去噪处理，将所述去噪处理后的视频输入到训练完成的多尺度目标检测网络中，得到对钢桶运输轨迹检测是否正常的判断；

8.一种可读存储介质，其特征在于：被处理器执行时实现如权利要求1-6中任一项所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法的程序存储在所述可读存储介质中。

9.一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测设备，其特征在于：实现步骤1-3的设备包括处理器（1001）、图像获取装置、用户接口（1003）、网络接口（1004）、通信模块（1005）、存储器（1006），其中，所述处理器（1001）和所述图像获取装置、所述用户接口（1003）、所述网络接口（1004）、所述通信模块（1005）、所述存储器（1006）相连；所述存储器（1006）内存储有可在所述处理器（1001）上运行的钢桶运输轨迹检测程序，所述钢桶运输轨迹检测程序被所述处理器（1001）执行时实现如权利要求1-6中任一项所述的钢桶运输轨迹检测方法。