CN116071566A - 基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法 - Google Patents
基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法 Download PDFInfo
- Publication number
- CN116071566A CN116071566A CN202310286670.3A CN202310286670A CN116071566A CN 116071566 A CN116071566 A CN 116071566A CN 202310286670 A CN202310286670 A CN 202310286670A CN 116071566 A CN116071566 A CN 116071566A
- Authority
- CN
- China
- Prior art keywords
- steel drum
- network
- scale target
- denoising
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910000831 Steel Inorganic materials 0.000 title claims abstract description 88
- 239000010959 steel Substances 0.000 title claims abstract description 88
- 238000001514 detection method Methods 0.000 title claims abstract description 78
- 230000006870 function Effects 0.000 claims description 35
- 238000012549 training Methods 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 239000000463 material Substances 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/62—Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,涉及钢桶运输轨迹领域,旨在解决现有技术中人工成本高、图像去噪不佳的问题,采用的技术方案是,通过摄像头获取钢桶运输轨迹视频;将获取的视频利用网格流运动网络模型进行去噪处理;将获得的去噪后的视频输入到已经训练完成的多尺度目标检测网络中,得到钢桶运输轨迹是否正常的判断;通过采集不同背景下钢桶图像,对其进行运输轨迹检测,根据检测结果来监测钢桶运输情况。相比采用人工的方式节省了大量的人力、物力和财力。基于网格流运动网络可以有效地对视频噪声进行去除,而训练完成的多尺度目标检测网络可以提高钢桶运输轨迹的检测效率。
Description
技术领域
本发明涉及钢桶运输轨迹领域,具体为一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法。
背景技术
钢桶因其体积、质量较大,使用人工搬运的成本很高而效率不高,因此,工厂大量的钢桶一般采用自动化设备进行运输。而在工厂在大量运输钢桶的过程中会因为运输带的一些缺陷或者因为钢桶本身由于磕碰产生一些形变导致运输不稳定甚至导致钢桶脱离运输带。
传统的钢桶运输一般为人工对其进行监视和判断,虽然使用人力对其检测的精确度较高,但需要人工有一定的经验、经过一定的培训。其次,人工长时间保持较强的专注度比较困难。相对于使用人工对钢桶运输进行监视,使用一些基础的图像处理方法对钢桶运输轨迹进行检测,可以降低人工成本,但是基础的图像处理方法对视频中的一些光照、阴影等噪声的去除效果不佳。
中国专利CN202111391364.3公开了一种使用卷积神经网络和双向匹配算法的视频多目标跟踪方法,采用的技术方案是,在无锚框目标检测方法的卷积神经网络的基础上,增加了针对目标的双向运动预测分支,并基于双向运动信息设计了对应的多目标跟踪匹配算法,从而通过多帧视频信息的输入,完成对目标的双向跟踪匹配,并通过搁浅区的设计缓解因目标短时遮挡导致的跟踪间断。
中国专利CN202210296395.9公开了一种基于多尺度信息融合的海面小目标检测方法、电子设备及计算机可读介质,采用的技术方案是,构建海面小目标仿真数据集;构建深度学习网络模型;利用小目标仿真数据集对构建的深度学习模型进行训练;在训练过程中,通过transformer模块解码和检测出海面小目标的位置和类别信息;利用训练好的模型进行其他场景下的海面小目标检测。
两现有专利分别是基于无锚框的卷积神经网络和应用transformer模块进行解码预测边界框,其包含信息少,精度差。
因此,本发明提出一种网格流运动网络来对视频去除噪声,使用多尺度目标检测网络来对钢桶运输轨迹进行检测。
发明内容
鉴于现有技术中所存在的人工成本高、基础图像处理对噪声去除效果差的问题,本发明公开了基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,通过网格流运动网络来对视频去除噪声,使用多尺度目标检测网络来对钢桶运输轨迹进行检测。
为实现上述目的,本发明先公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,采用的技术方案是,包括以下步骤:
步骤1,通过摄像头获取钢桶运输轨迹视频;
步骤2,将所述步骤1中获取的视频利用网格流运动网络模型进行去噪处理;
步骤3,将所述步骤2中获得的去噪后的视频输入到已经训练完成的多尺度目标检测网络中,得到钢桶运输轨迹是否正常的判断,使用训练完成的多尺度目标检测网络能够进一步提高准确性。
作为本发明的一种优选技术方案,所述步骤2中,利用离散的Laplacian算子和Laplacian矩阵将所述步骤1中获取的视频进行去噪处理。
作为本发明的一种优选技术方案,所述步骤3中,多尺度目标检测网络的训练包括以下步骤:
步骤a,构建训练数据集,所述训练数据集包括在不同背景下钢桶图像,将所述钢桶图像在不同的背景中标注出来;
步骤b,将所述钢桶图像输入到待训练的多尺度目标检测网络中,得到生成多尺度的锚框,并为锚框预测类别和偏移量;
步骤c,基于所述预测类别和偏移量及标注值,计算联合损失函数;
若所述多尺度目标检测网络的联合损失函数收敛,则以最新的多尺度目标检测网络作为训练完成的多尺度目标检测网络。
作为本发明的一种优选技术方案,所述步骤c中,计算联合损失函数包括:
将所述锚框类别的损失使用交叉熵损失函数来计算,所述交叉熵损失函数公式为:
其中,N代表样本总数,代表真实值,代表预测值;
将所述锚框偏移量的损失使用平滑范数损失函数来计算,所述平滑范数损失函数公式为:
其中超参数用来控制平滑区域。
作为本发明的一种优选技术方案,所述步骤3中,将摄像头所获取的视频输入到已经训练完成的多尺度网络中,得到钢桶运输轨迹是否正常判断的步骤包括:
步骤i,将所述去噪处理之后的视频输入到所述多尺度目标检测训练模型中;
步骤ii,在所述多尺度目标检测训练模型的前向传播过程中生成多尺度锚框,得到预测边界框并预测其类别和偏移量;
步骤iii,将所述生成的锚框根据标签信息标记类别和偏移量,根据所述类别和偏移量的预测和标注值计算出距离,得到钢桶运输轨迹是否正常判断。
作为本发明的一种优选技术方案,所述步骤iii中,计算距离的公式为:
其中,代表预测的锚框中左边框的横坐标值,代表设置的左边界线的横坐标值,代表预测的锚框中右边框的横坐标值,代表设置的右边界线的横坐标值,、分别为代表左右边界线与预测锚框的距离。
作为本发明的一种优选技术方案,所述多尺度目标检测网络包括基本网络块和高宽减半网络块组成,其中,所述基本网络块包括串联的多个高宽减半网络块;
所述高宽减半网络块采用多个卷积层和最大汇聚层将特征图将输入的特征图的高和宽减少一半,扩大每个单元在其输出特征图中的感受野。
本发明还公开基于上述检测方法的一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测装置,采用的技术方案是,包括以下模块:
处理模块,用于将摄像头获取的视频利用网格流运动网络进行去噪处理,将所述去噪处理后的视频输入到训练完成的多尺度目标检测网络中,得到对钢桶运输轨迹检测是否正常的判断;
训练模块,用于构建训练数据集,所述训练数据集包括在不同背景下钢桶图像,将所述钢桶图像在不同的背景中标注出来;所述钢桶图像输入到待训练的多尺度目标检测网络中,得到生成多尺度的锚框,并为锚框预测类别和偏移量;
计算模块,用于计算锚框类别的损失使用交叉熵损失函数、锚框偏移量的损失使用平滑范数损失函数、平滑范数损失函数。
为实现上述目的,本发明还公开了一种可读存储介质,采用的技术方案是,存储介质上存储有基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序,所述基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序被处理器执行时实现基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法。
为实现上述目的,本发明还公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测设备,采用的技术方案是,包括处理器、摄像头、用户接口、网络接口、通信模块、存储器,其中,所述处理器和所述摄像头、所述用户接口、所述网络接口、所述通信模块、所述存储器相连;所述存储器内存储有可在所述处理器上运行的钢桶运输轨迹检测程序,所述钢桶运输轨迹检测程序被所述处理器执行时实现钢桶运输轨迹检测方法。
本发明的有益效果:本发明通过采集不同背景下钢桶图像,对其进行运输轨迹检测,根据检测结果来监测钢桶运输情况。相比采用人工的方式节省了大量的人力、物力和财力。基于网格流运动网络可以有效地对视频噪声进行去除,而训练完成的多尺度目标检测网络可以提高钢桶运输轨迹的检测效率。
进一步的,本发明通过使用多尺度特征图来生成锚框并预测其类别和偏移量,不同尺度的特征包含丰富的语义信息,精度高。
进一步的,本发明通过使用网格流运动网络模型进行视频去噪,不需要层次结构和逐层优化,效率更高,更方便。
进一步的,本发明使用两侧直线距离绝对值数值判断钢桶运输轨迹的偏移量,计算更为简便、省时。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明钢桶运输轨迹的检测方法流程图;
图2为本发明多尺度目标检测网络训练流程图;
图3为本发明钢桶运输轨迹的检测设备结构示意图。
图中:1001、处理器;1002、摄像头;1003、用户接口;1004、网络接口;1005、通信模块;1006、存储器。
具体实施方式
实施例1
如图1、图2所示,本实施例先公开了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,采用的技术方案是,包括以下步骤:
步骤1,使用摄像头采集钢桶运输视频;
步骤2,将步骤1采集的视频输入网格流运动网络使用离散的Laplacian算子和Laplacian矩阵进行去噪处理;
其中离散Laplacian公式为:
其中,f(x,y)代表视频帧图像(x,y)位置的像素值;
步骤3,使用不同背景下的钢桶图像构建训练数据集;
步骤4,将训练集中钢桶图像在不同的背景中标注出来;
步骤5,将钢桶图像输入到待训练的多尺度目标检测网络中,得到生成多尺度的锚框,并为锚框预测类别和偏移量;
步骤6,基于所述预测类别和偏移量及标注值,计算联合损失函数,联合损失函数由交叉熵损失函数和平滑范数损失函数相加构成;
交叉熵损失函数公式为:
其中,N代表样本总数,代表真实值,代表预测值;
平滑范数损失函数公式为:
其中超参数用来控制平滑区域;
步骤7,若所述多尺度目标检测网络的联合损失函数收敛,则以最新的多尺度目标检测网络作为训练完成的多尺度目标检测网络;
步骤8,将步骤2中获得的去噪后的视频输入到步骤7获得的训练完成的多尺度目标检测网络中;多尺度目标检测网络包括基本网络特征块和高宽减半网络特征块;
步骤9,去噪后的视频输入到训练完成的多尺度目标检测网络中后,构建类别预测层和边界框预测层,类别预测层由填充为1、卷积核大小为3×3的卷积层组成,边界预测层由填充为1、卷积核大小为3×3的卷积层组成;
步骤10,构建多个高宽减半特征块扩大每个单元在其输出特征图的感受野,其中每个高宽减半特征块由2个填充为1、卷积核大小为3×3的卷积层,在每一个卷积层之后进行归一化处理,在所述归一化处理之后使用ReLu激活函数,最后使用卷积核大小为2×2的最大池化层;
步骤11,构建基本网络块对所述经网格流运动网络去除噪声后的视频帧进行特征提取,所述基本网络块由4个高宽减半特征块串联组成;
步骤12,构建交叉熵损失函数以及平滑范数损失函数,将所述类别预测层所预测的锚框类别的损失使用交叉熵损失函数来计算;并将所述锚框偏移量的损失使用平滑范数损失函数来计算,通过超参数控制平滑区域;
步骤13,通过计算锚框和预设边界线的距离,判断钢桶运输轨迹是否正常。
本实施例还提供了一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测设备,如图3所示,其包括处理器1001(例如中央处理器 Central Processing Unit,CPU)、摄像头1002、用户接口1003、网络接口1004、通信模块1005、存储器1006;其中,摄像头1002用于获取钢桶运输视频;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless FIdelity,WI FI接口);通信总线1005用于实现这些组件之间的连接通信;存储器1006可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non volatile memory),例如磁盘存储器,存储器1006可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图3中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。继续参照图3,图3中作为一种计算机存储介质的存储器1006中可以包括操作系统、网络通信模块、用户接口模块以及钢桶运输轨迹检测程序。其中,处理器1001可以调用存储器1006中存储的钢桶运输轨迹检测程序,并执行本发明实施例提供的钢桶运输轨迹检测方法。
本实施例还公开基于上述检测方法的一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测装置,采用的技术方案是,包括以下模块:
处理模块,用于将摄像头获取的视频利用网格流运动网络进行去噪处理,将所述去噪处理后的视频输入到训练完成的多尺度目标检测网络中,得到对钢桶运输轨迹检测是否正常的判断;
训练模块,用于构建训练数据集,所述训练数据集包括在不同背景下钢桶图像,将所述钢桶图像在不同的背景中标注出来;所述钢桶图像输入到待训练的多尺度目标检测网络中,得到生成多尺度的锚框,并为锚框预测类别和偏移量;
计算模块,用于计算锚框类别的损失使用交叉熵损失函数、锚框偏移量的损失使用平滑范数损失函数、平滑范数损失函数。
本实施例还公开了一种可读存储介质,采用的技术方案是,存储介质上存储有基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序,基于网格流去噪和多尺度目标网络的钢桶轨迹检测程序被处理器执行时实现基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法。
上述虽然对本发明的具体实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化,而不具备创造性劳动的修改或变形仍在本发明的保护范围以内。
Claims (9)
1.基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于,包括以下步骤:
步骤1,获取钢桶运输轨迹视频;
步骤2,将所述步骤1中获取的视频利用网格流运动网络模型进行去噪处理;
步骤3,将所述步骤2中获得的去噪后的视频输入到已经训练完成的多尺度目标检测网络中,得到钢桶运输轨迹是否正常的判断;
所述步骤3中,多尺度目标检测网络的训练包括以下步骤:
步骤a,构建训练数据集,所述训练数据集包括在不同背景下钢桶图像,将所述钢桶图像在不同的背景中标注出来;
步骤b,将所述钢桶图像输入到待训练的多尺度目标检测网络中,得到生成多尺度的锚框,并为锚框预测类别和偏移量;
步骤c,基于所述预测类别和偏移量及标注值,计算联合损失函数;
若所述多尺度目标检测网络的联合损失函数收敛,则以最新的多尺度目标检测网络作为训练完成的多尺度目标检测网络。
2.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于:所述步骤2中,利用离散的Laplacian算子和Laplacian矩阵将所述步骤1中获取的视频进行去噪处理。
3.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于:所述步骤c中,计算联合损失函数包括:
将所述锚框类别的损失使用交叉熵损失函数来计算,所述交叉熵损失函数公式为:
其中,N代表样本总数,代表真实值,代表预测值;
将所述锚框偏移量的损失使用平滑范数损失函数来计算,所述平滑范数损失函数公式为:
其中超参数用来控制平滑区域。
4.根据权利要求1或3所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于:所述步骤3中,将摄像头所获取的视频输入到已经训练完成的多尺度网络中,得到钢桶运输轨迹是否正常判断的步骤包括:
步骤i,将所述去噪处理之后的视频输入到所述多尺度目标检测训练模型中;
步骤ii,在所述多尺度目标检测训练模型的前向传播过程中生成多尺度锚框,得到预测边界框并预测其类别和偏移量;
步骤iii,将所述生成的锚框根据标签信息标记类别和偏移量,根据所述类别和偏移量的预测和标注值计算出距离,得到钢桶运输轨迹是否正常判断。
5.根据权利要求4所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于:所述步骤iii中,计算距离的公式为:
其中,代表预测的锚框中左边框的横坐标值,代表设置的左边界线的横坐标值,代表预测的锚框中右边框的横坐标值,代表设置的右边界线的横坐标值,、分别为代表左右边界线与预测锚框的距离。
6.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于:所述多尺度目标检测网络包括基本网络块和高宽减半网络块组成,其中,所述基本网络块包括串联的多个高宽减半网络块;
所述高宽减半网络块采用多个卷积层和最大汇聚层将特征图将输入的特征图的高和宽减少一半,扩大每个单元在其输出特征图中的感受野。
7.根据权利要求1所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法,其特征在于,实现步骤1-3的装置包括以下模块:
处理模块,用于将获取的视频利用网格流运动网络进行去噪处理,将所述去噪处理后的视频输入到训练完成的多尺度目标检测网络中,得到对钢桶运输轨迹检测是否正常的判断;
训练模块,用于构建训练数据集,所述训练数据集包括在不同背景下钢桶图像,将所述钢桶图像在不同的背景中标注出来;所述钢桶图像输入到待训练的多尺度目标检测网络中,得到生成多尺度的锚框,并为锚框预测类别和偏移量;
计算模块,用于计算锚框类别的损失使用交叉熵损失函数、锚框偏移量的损失使用平滑范数损失函数、平滑范数损失函数。
8.一种可读存储介质,其特征在于:被处理器执行时实现如权利要求1-6中任一项所述的基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法的程序存储在所述可读存储介质中。
9.一种基于网格流去噪和多尺度目标网络的钢桶轨迹检测设备,其特征在于:实现步骤1-3的设备包括处理器(1001)、图像获取装置、用户接口(1003)、网络接口(1004)、通信模块(1005)、存储器(1006),其中,所述处理器(1001)和所述图像获取装置、所述用户接口(1003)、所述网络接口(1004)、所述通信模块(1005)、所述存储器(1006)相连;所述存储器(1006)内存储有可在所述处理器(1001)上运行的钢桶运输轨迹检测程序,所述钢桶运输轨迹检测程序被所述处理器(1001)执行时实现如权利要求1-6中任一项所述的钢桶运输轨迹检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310286670.3A CN116071566A (zh) | 2023-03-23 | 2023-03-23 | 基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310286670.3A CN116071566A (zh) | 2023-03-23 | 2023-03-23 | 基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116071566A true CN116071566A (zh) | 2023-05-05 |
Family
ID=86173405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310286670.3A Pending CN116071566A (zh) | 2023-03-23 | 2023-03-23 | 基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116071566A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014062415A (ja) * | 2012-09-21 | 2014-04-10 | Mitsubishi Electric Corp | 軌道検出装置及び軌道監視装置 |
CN111027547A (zh) * | 2019-12-06 | 2020-04-17 | 南京大学 | 一种针对二维图像中的多尺度多形态目标的自动检测方法 |
US20220092797A1 (en) * | 2019-07-08 | 2022-03-24 | Zhongyuan University Of Technology | Intelligent Vehicle Trajectory Measurement Method Based on Binocular Stereo Vision System |
CN114820765A (zh) * | 2022-03-09 | 2022-07-29 | 亚信科技(中国)有限公司 | 图像识别方法、装置、电子设备及计算机可读存储介质 |
CN114862913A (zh) * | 2022-05-15 | 2022-08-05 | 哈尔滨工程大学 | 基于人工智能网络的机器视觉目标定位方法 |
CN115222884A (zh) * | 2022-07-15 | 2022-10-21 | 南京智能高端装备产业研究院有限公司 | 一种基于人工智能的空间对象分析及建模优化方法 |
CN115761647A (zh) * | 2022-12-09 | 2023-03-07 | 国家电网有限公司 | 基于计算机视觉的变电站内物体运动轨迹检测方法及系统 |
-
2023
- 2023-03-23 CN CN202310286670.3A patent/CN116071566A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014062415A (ja) * | 2012-09-21 | 2014-04-10 | Mitsubishi Electric Corp | 軌道検出装置及び軌道監視装置 |
US20220092797A1 (en) * | 2019-07-08 | 2022-03-24 | Zhongyuan University Of Technology | Intelligent Vehicle Trajectory Measurement Method Based on Binocular Stereo Vision System |
CN111027547A (zh) * | 2019-12-06 | 2020-04-17 | 南京大学 | 一种针对二维图像中的多尺度多形态目标的自动检测方法 |
CN114820765A (zh) * | 2022-03-09 | 2022-07-29 | 亚信科技(中国)有限公司 | 图像识别方法、装置、电子设备及计算机可读存储介质 |
CN114862913A (zh) * | 2022-05-15 | 2022-08-05 | 哈尔滨工程大学 | 基于人工智能网络的机器视觉目标定位方法 |
CN115222884A (zh) * | 2022-07-15 | 2022-10-21 | 南京智能高端装备产业研究院有限公司 | 一种基于人工智能的空间对象分析及建模优化方法 |
CN115761647A (zh) * | 2022-12-09 | 2023-03-07 | 国家电网有限公司 | 基于计算机视觉的变电站内物体运动轨迹检测方法及系统 |
Non-Patent Citations (1)
Title |
---|
何志伟: "基于网格流运动模型的视频去噪算法", 《中国优秀硕士学位论文全文数据库信息科技辑》, pages 31 - 44 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
CN108564579B (zh) | 一种基于时空相关的混凝土裂缝检测方法及检测装置 | |
CN114549563A (zh) | 一种基于DeepLabV3+的复合绝缘子实时分割方法及系统 | |
CN111161090B (zh) | 圈养栏信息的确定方法、装置及系统、存储介质 | |
CN111062854B (zh) | 检测水印的方法、装置、终端及存储介质 | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
CN114359665B (zh) | 全任务人脸识别模型的训练方法及装置、人脸识别方法 | |
CN110827312A (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN113989716A (zh) | 煤矿井下输送带异物目标检测方法、系统、设备及终端 | |
CN114119480A (zh) | 一种基于深度学习的裂纹缺陷检测系统 | |
CN111597845A (zh) | 一种二维码检测方法、装置、设备及可读存储介质 | |
CN116486296A (zh) | 目标检测方法、装置及计算机可读存储介质 | |
CN111242066A (zh) | 大尺寸图像目标检测方法、装置及计算机可读存储介质 | |
CN116258715B (zh) | 一种粉尘回收方法、装置及电子设备 | |
CN111062924B (zh) | 图像处理方法、装置、终端和存储介质 | |
CN110889858A (zh) | 一种基于点回归的汽车部件分割方法及装置 | |
CN116071566A (zh) | 基于网格流去噪和多尺度目标网络的钢桶轨迹检测方法 | |
CN111582012A (zh) | 一种检测小目标船只方法及装置 | |
CN115311680A (zh) | 人体图像质量检测方法、装置、电子设备及存储介质 | |
CN115330705A (zh) | 一种基于自适应加权模板ncc的蒙皮漆面缺陷检测方法 | |
CN113449559B (zh) | 一种表格识别方法、装置、计算机设备和存储介质 | |
CN110276260B (zh) | 一种基于深度摄像头的商品检测方法 | |
CN113780136A (zh) | 基于时空纹理识别的VOCs气体泄漏检测方法、系统及设备 | |
Tian et al. | Real-time vehicle detection under complex road conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230505 |