CN111950475A - 一种基于yoloV3的calhe直方图增强型目标识别算法 - Google Patents

一种基于yoloV3的calhe直方图增强型目标识别算法 Download PDF

Info

Publication number
CN111950475A
CN111950475A CN202010821792.4A CN202010821792A CN111950475A CN 111950475 A CN111950475 A CN 111950475A CN 202010821792 A CN202010821792 A CN 202010821792A CN 111950475 A CN111950475 A CN 111950475A
Authority
CN
China
Prior art keywords
histogram
image
calhe
yolov3
gray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010821792.4A
Other languages
English (en)
Inventor
蔡向东
屈新辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202010821792.4A priority Critical patent/CN111950475A/zh
Publication of CN111950475A publication Critical patent/CN111950475A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明是一种基于yolov3的calhe直方图增强型目标识别算法,有效解决了现有检测设备不能准确识别的技术问题,包括步骤一,输入一张从某一摄像头采集的包裹图像,通过灰度变换将包裹检测图像变换为灰度图像,然后提取灰度图像的长和宽;步骤二,将上述步骤一种的灰度图像利用傅里叶变换到频率空间;步骤三,通过函数cumsum来计算cdf,并将频率映射到0‑255的无符号整数;步骤四,采用calhe直方图均衡;步骤五,对步骤四中的处理后的直方图图像进行傅里叶反变换,转换到空间域;步骤六,选择多个步骤五得到的图像和同一幅的原始图像进行yolo V3目标识别算法检测,然后进行比较,本发明能够有效减少识别时的运行时间,提高了目标识别的准确率。

Description

一种基于yoloV3的calhe直方图增强型目标识别算法
技术领域
本发明涉及图像识别技术领域,具体是一种基于yoloV3的calhe直方图增强型目标识别算法,能够实现图像去噪、图像增强以及神经网路算法,可应用于目标检测。
背景技术
随着互联网科技的快速发展,人们对网上购物的偏爱越来越热烈。于是激增了一大批的产业链,其中就包括物流系统。传统的物流系统靠人力去分拣包裹费时又费力,于是就出现了自动化分拣包裹的流水线作业。那么包裹的大小以及包裹的重量成为分拣的首要考虑因素。发明一款可以实现根据包裹体积大小去完成自动分拣的设备越来越受到人们的重视,而其最重要的环节就是检测部分的设计。
传统的单目摄像头仅仅只能够检测出包裹的上面的物流信息,把包裹分别送达到各个目的地,但是由于对包裹的大小就没有那么多的考虑,在工人去装载和卸货的时候就显得包裹的位置摆放的杂乱无章,就会出现包裹损坏的现象。
这样不仅对我们消费者是一种危害,对商家和物流同样也是一种危害。其二是物流公司在运输包裹的时候可以根据包裹的体积大小进行合理的规划,提高物流效率,降低物流成本。
比如京东物流在物流配送中除了运用本地仓库直接取货,还有就是运用了包裹体积大小检测设备,通过检测设备的体积大小,可以提高工人在装运过程中的效率,大大简化了装运的复杂性。
市面上已经出现了一部分用于包裹体积检测的设备,常见的有基于激光雷达的包裹体积检测系统。通过激光测距,然后通过仿真生成三维图像,测量出物体的体积。这类产品的安装成本比较高,安装比较复杂,体积比较大。
本发明采用的是基于双目视觉测距原理测量物体的深度信息。成本比较低,安装简单,体积比较小。
另外为了提高测试的识别准确性,采用深度学习的方式去识别包裹。通常情况下,摄像头抓取的照片包含了其他的很多信息,比如旁边的机台,有时工人们误操作放在传送装置上面的垃圾。或者晚上工作的时候,光照不是很充足的时候,采集的照片清晰度不够。另外考虑到人为因素对采集装置的影响,比如在双十一物流量比较大的时候,包裹不是一个一个单独放在流水装置上面,而是被随机扔放到流水装置上面的,这样就会造成对测量包裹的整体轮廓的影响。这些因素都将对包裹的识别有重大的影响,传统的只靠图像处理方面的工作远远不能满足当前的要求,那么就需要提出一种有效的分类识别算法去解决。
如果通过神经网络学习,那么这些问题都将得到明显的解决。但是传统的神经网络学习的算法需要很强的运算能力,在嵌入式设备上面没有办法移植到单独的嵌入式设备上面去进行运算,只能在性能比较高的电脑上面去运行,本发明提出了一种轻量级的神经网络算法,这样就可以在嵌入式设备上面去运行一个神经网络算法的程序,然后就可以对采集到的包裹进行识别。
在此基础上,本发明提供一种基于yoloV3的calhe直方图增强型目标识别算法来解决此问题。
发明内容
为了解决上述的以及其他潜在的技术问题,一种基于yoloV3的calhe直方图增强型目标识别算法,有效解决了现有检测设备成本高、体积大、安装复杂、不能准确识别的技术问题。
一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,包括以下步骤:
步骤一,输入一张从某一摄像头采集的包裹图像,通过灰度变换将包裹检测图像变换为灰度图像,然后提取灰度图像的长和宽;
步骤二,将上述步骤一种的灰度图像利用傅里叶变换到频率空间;
步骤三,通过函数cumsum来计算cdf,并将频率映射到0-255的无符号整数;
步骤四,采用calhe直方图均衡;
步骤五,对步骤四中的处理后的直方图图像进行傅里叶反变换,转换到空间域;
步骤六,选择多个步骤五得到的图像和同一幅的原始图像进行yolo V3目标识别算法检测,然后进行比较。
优选的,所述步骤二中的傅里叶变换算法为:
Figure RE-GDA0002692777740000031
优选的,所述步骤三中的频率取值范围是0.0-1.0。
优选的,所述步骤四中的calhe直方图均衡化算法:
对于统计得到的直方图进行裁剪,使其幅值低于某个上限,裁剪掉的部分不能扔掉,将这部分裁剪值均匀地分布在整个灰度区间上,以保证直方图总面积不变,设裁剪值为CL,求直方图中高于该值的部分和TE,假设将TE均分给所有灰度级,求出这样导致的直方图整体上升的高度L=TE/N,以upper=CL-L为界限对直方图进行如下处理:若幅值高于CL,直接置为CL;若幅值处于Upper 和CL之间,将其填补至CL;若幅值低于Upper,直接填补L个像素点;经过上述操作,用来填补的像素点个数通常会略小于TE,也就是还有一些剩余的像素点没分出去,可以再把这些点均匀地分给那些目前幅值仍然小于CL的灰度值。
优选的,所述步骤五中傅里叶反变换算法:
Figure RE-GDA0002692777740000041
优选的,所述步骤六中的目标识别算法yolo V3目标识别算法为:
首先是模型的搭建;
其次是多尺度检测,通过上采样加张量拼接。
最后将图片切成S*S的网格。
本发明主要是一种在低照度情况下的目标识别时,为提高识别率的算法,其主要原理是将calhe直方图均衡化算法作用在图像预处理阶段,得到分辨率较高的图像,然后通过yoloV3目标识别算法识别,提高识别率和准确度。
本发明能够有效减少识别时的运行时间,进而降低了对系统资源的消耗,同时能够有效突出原始低照度图像中没有的细节,增强了图像的亮度,拉伸了图像的对比度,提高了目标识别的准确率。
附图说明
图1为本发明步骤顺序原理图。
图2为本发明具体实施方式的算法。
图3为本发明算法结果对比。
具体实施方式
首先我们需要的是用神经网络去学习,把包裹进行识别,当包裹能够被机器识别出来以后,那么就可以去对包裹进行测量,主要采用clahe直方图增强预处理来消除自然场景中光照变化对物体识别效果的影响。从而达到识别包裹的目的。利用双目摄像头采集包裹的图像信息,采用opencv,matlab等强大的图形处理工具,借助ARM平台实现了对图像的标定、预处理、轮廓提取、测点匹配、三维坐标的恢复及体积计算等功能。通过单目测距原理和双目测距算法实现包裹长,宽,高的测量。并将测量数据作出可视化转换和数据保存。
一种基于yoloV3的calhe直方图增强型目标识别算法,包括以下步骤:
步骤一,输入一张从某一摄像头采集的包裹图像,通过灰度变换将包裹检测图像变换为灰度图像,然后提取灰度图像的长和宽;
步骤二,将上述步骤一种的灰度图像利用傅里叶变换到频率空间;
步骤三,通过函数cumsum来计算cdf,并将频率映射到0-255的无符号整数;
步骤四,采用calhe直方图均衡;
赋值语句右端,Img(i,j)被用来作为CumuPixel的索引。比如Img(i,j)=120,则从CumuPixel中取出第120个值作为Img(i,j)的新像素值。得到新图像的直方图。
步骤五,对步骤四中的处理后的直方图图像进行傅里叶反变换,转换到空间域;
步骤六,选择多个步骤五得到的图像和同一幅的原始图像进行yolo V3目标识别算法检测,然后进行比较。
最终通过对比发现,经过直方图均衡化得到的图像远比正常的未经处理的图像识别率高,识别速度快。
本发明的技术方案是,首先输入一张从某一摄像头采集的包裹图像,通过灰度变换将包裹检测图像变换成灰度图像,采用clahe直方图增强型处理图像,使得图像由受到光线影响比较严重的原始图像转换成一个平滑且饱和度高的灰度图像,并将处理后的灰度图像作为目标识别的待测图像。clahe直方图增强算法主要对于统计得到的直方图进行裁剪,使其幅值低于某个上限,裁剪掉的部分不能扔掉,将这部分裁剪值均匀地分布在整个灰度区间上,以保证直方图总面积不变,设裁剪值为CL,求直方图中高于该值的部分的和TE,假设将TE均分给所有灰度级,求出这样导致的直方图整体上升的高度L=TE/N,以upper=CL-L为界限对直方图进行如下处理:若幅值高于CL,直接置为CL;若幅值处于 Upper和CL之间,将其填补至CL;若幅值低于Upper,直接填补L个像素点;经过上述操作,用来填补的像素点个数通常会略小于TE,也就是还有一些剩余的像素点没分出去。可以再把这些点均匀地分给那些目前幅值仍然小于CL的灰度值。
进一步地,经过上述步骤处理之后的灰度图像在饱和度方面有很大的提高,并且对受到图像亮度的影响进一步的减弱。
实施例,所述步骤二中的傅里叶变换算法为:
Figure RE-GDA0002692777740000061
输入值为时域的像素值,输出值为频域的复频域值,其取值范围是(0,1)。其作用在于在频域下方便对图像的分析,包括图像的进一步的处理。
实施例,所述步骤三中通过函数cumsum来计算cdf,并将频率(取值范围是0.0-1.0)映射到0-255的无符号整数;
实施例,所述步骤四中的calhe直方图均衡化算法:
对于统计得到的直方图进行裁剪,使其幅值低于某个上限,裁剪掉的部分不能扔掉,将这部分裁剪值均匀地分布在整个灰度区间上,以保证直方图总面积不变,设裁剪值为CL,求直方图中高于该值的部分的和TE,假设将TE均分给所有灰度级,求出这样导致的直方图整体上升的高度L=TE/N,以upper=CL-L 为界限对直方图进行如下处理:若幅值高于CL,直接置为CL;若幅值处于Upper 和CL之间,将其填补至CL;若幅值低于Upper,直接填补L个像素点;经过上述操作,用来填补的像素点个数通常会略小于TE,也就是还有一些剩余的像素点没分出去,可以再把这些点均匀地分给那些目前幅值仍然小于CL的灰度值。
实施例,所述步骤五中逆傅里叶反变换算法:
Figure RE-GDA0002692777740000071
其作用在于将复频域的图片通过傅里叶反变换转换成正常的时域的图像,以便于yoloV3进行目标识别。
实施例,所述步骤六中的目标识别算法yolo V3目标识别算法为:
yolo的英文全拼是you only look once,直译就是只看一次,进一步就是把目标判断和目标识别合二为一,所以在识别性能上有了很大的提升。
首先是模型的搭建,yoloV3又叫darknet-53,这是因为它一共有53层卷积神经网络组成(52层卷积神经网络组成外加一层全连接层),分别是:
1+(1+1*2)+(1+2*2)+(1+2*8)+(1+2*8)+(1+2*4)=52。
其次就是多尺度检测,通过上采样加张量拼接,获取
13*13*255,26*26*255,52*52*255三种不同维度的预测张量。其中13*13表示一幅图片上有13*13个像素点,255=3*(80+4+1),3表示一个预测点有3个预测框,4表示每个预测框中包含的需要训练的坐标信息。1表示置信度,80表示 coco数据集的分类样本数。
之后就是将一幅大小为448X448大小的图片切成S*S的网格,目标中心所在的格子负责该目标的相关检测,每个网格预测B个边框及其置信度,以及C 种类别的概率。
主要训练的待定值包括where和what。where就是位置信息,也就是预测框中的那4个位置值,what就是需要用80个coco数据标注的信息样本库去训练。
对于多尺度检测来说,采用多个尺度进行预测,具体形式是在网络预测的最后某些层进行上采样拼接的操作来达到。
对于分辨率对预测的影响:分辨率信息直接反映的就是构成object的像素的数量。一个待测目标,像素数量越多,它对待测目标的细节表现就越丰富越具体,也就是说分辨率信息越丰富。语义信息在目标检测中指的是让object区分于背景的信息,即语义信息是让你知道这个是待测目标,其余是背景。在不同类别中语义信息并不需要很多细节信息,分辨率信息大,反而会降低语义信息,因此小尺度特征图在提供必要的分辨率信息下语义信息会提供的更好。
yolo3更进一步采用了3个不同尺度的特征图来进行对象检测。能够检测的到更加细粒度的特征。
对于这三种检测的结果并不是同样的东西,这里的粗略理解是不同的尺度检测不同大小的物体。网络的最终输出有3个尺度分别为1/32,1/16,1/8。
在第79层之后经过几个卷积操作得到的是1/32(13*13)的预测结果,下采样倍数高,这里特征图的感受野比较大,因此适合检测图像中尺寸比较大的对象。
然后这个结果通过上采样与第61层的结果进行concat,再经过几个卷积操作得到1/16的预测结果;它具有中等尺度的感受野,适合检测中等尺度的对象。 91层的结果经过上采样之后在于第36层的结果进行concat,经过几个卷积操作之后得到的是1/8的结果,它的感受野最小,适合检测小尺寸的对象。
concat:张量拼接。将darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add 只是直接相加不会导致张量维度的改变。
多尺度融合是yoloV3的精髓算法,其主要在多个维度上面进行目标检测,当识别的物体比较大的时候,采样像素值为13*13。当需要检测的物体较小时,则可以使用采样像素值为26*26,或者更高的52*52的像素值。
anchor box其实就是从训练集的所有ground truth box中统计(使用 k-means)出来的在训练集中最经常出现的几个box形状和尺寸。anchor box其实就是对预测的对象范围进行约束,并加入了尺寸先验经验,从而实现多尺度学习的目的。
bx=σ(tx)+cx
by=σ(ty)+cy
Figure RE-GDA0002692777740000091
Figure RE-GDA0002692777740000092
(1)anchor box的计算:
Bx,By为待求中心坐标,Bw,Bh为预测框的宽和高,Pw,Ph为anchor box 的中心坐标,Tx,Ty是预测的坐标偏移值,Tw,Th是尺度缩放。我们网络实际上的学习目标是Tx,Ty,Tw,Th这4个预测值。
在Yolo检测层中,也就是最后的feture map,维度为(batch_size, num_anchors*bbox_attrs,grid_size,grid_size),对于每张图就是 (num_anchors*bbox_attrs,grid_size,grid_size)对于coco的80类,bbox_attrs就是80+5,5表示网络中学习到的参数tx,ty,tw,th,以及是否有目标的score。也就是对于3层预测层,最深层是255*13*13,255是channel,物理意义表征bbox_attrs*3,3是anchor个数。
(2)loss函数:
yoloV3全部使用了均方和误差作为loss函数.由三部分组成:坐标误差、IOU 误差和分类误差。简单相加时还要考虑每种loss的贡献率,yoloV3给coordErr 设置权重λcoord=5.在计算IOU误差时,包含物体的格子与不包含物体的格子,二者的IOU误差对网络loss的贡献值是不同的。若采用相同的权值,那么不包含物体的格子的confidence值近似为0,变相放大了包含物体的格子的 confidence误差在计算网络参数梯度时的影响。为解决这个问题,yoloV3使用λnoobj=0.5修正iouErr。对于相等的误差值,大物体误差对检测的影响应小于小物体误差对检测的影响。这是因为,相同的位置偏差占大物体的比例远小于同等偏差占小物体的比例。yoloV3将物体大小的信息项(w和h)进行求平方根来改进这个问题,但并不能完全解决这个问题。
每个箱子预测的类边界框可能包含使用multilabel分类。在训练中,我们使用二叉叉损失类预测。使用softmax假设每个盒子都有一个类通常不是这样的。一个multilabel更好的模型数据的方法。
预训练。使用ImageNet 1000类数据训练YOLO网络的前20个卷积层+1个 average池化层+1个全连接层。训练图像分辨率resize到224x224。得到的前 20个卷积层网络参数来初始化YOLO模型前20个卷积层的网络参数,然后用VOC 20类标注数据进行YOLO模型训练。检测通常需要有细密纹理的视觉信息,所以为提高图像精度,在训练检测模型时,将输入图像分辨率从224×224resize 到448x448。训练时B个bbox的ground truth设置成相同的。
本发明主要是一种在低照度情况下的目标识别时,为提高识别率的算法,其主要原理是将calhe直方图均衡化算法作用在图像预处理阶段,得到分辨率较高的图像,然后通过yoloV3目标识别算法识别,提高识别率和准确度。
本发明能够有效减少识别时的运行时间,进而降低了对系统资源的消耗,同时能够有效突出原始低照度图像中没有的细节,增强了图像的亮度,拉伸了图像的对比度,提高了目标识别的准确率。

Claims (6)

1.一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,包括以下步骤:
步骤一,输入一张从某一摄像头采集的包裹图像,通过灰度变换将包裹检测图像变换为灰度图像,然后提取灰度图像的长和宽;
步骤二,将上述步骤一种的灰度图像利用傅里叶变换到频率空间;
步骤三,通过函数cumsum来计算cdf,并将频率映射到0-255的无符号整数;
步骤四,采用calhe直方图均衡;
步骤五,对步骤四中的处理后的直方图图像进行傅里叶反变换,转换到空间域;
步骤六,选择多个步骤五得到的图像和同一幅的原始图像进行yolo V3目标识别算法检测,然后进行比较。
2.根据权利要求1所述的一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,所述步骤二中的傅里叶变换算法为:
Figure RE-FDA0002692777730000011
3.根据权利要求1所述的一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,所述步骤三中的频率取值范围是0.0-1.0。
4.根据权利要求1所述的一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,所述步骤四中的calhe直方图均衡化算法:
对于统计得到的直方图进行裁剪,使其幅值低于某个上限,裁剪掉的部分不能扔掉,将这部分裁剪值均匀地分布在整个灰度区间上,以保证直方图总面积不变,设裁剪值为CL,求直方图中高于该值的部分和TE,假设将TE均分给所有灰度级,求出这样导致的直方图整体上升的高度L=TE/N,以upper=CL-L为界限对直方图进行如下处理:若幅值高于CL,直接置为CL;若幅值处于Upper和CL之间,将其填补至CL;若幅值低于Upper,直接填补L个像素点;经过上述操作,用来填补的像素点个数通常会略小于TE,也就是还有一些剩余的像素点没分出去,可以再把这些点均匀地分给那些目前幅值仍然小于CL的灰度值。
5.根据权利要求1所述的一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,所述步骤五中傅里叶反变换算法:
Figure RE-FDA0002692777730000021
6.根据权利要求1所述的一种基于yoloV3的calhe直方图增强型目标识别算法,其特征在于,所述步骤六中的目标识别算法yolo v3目标识别算法为:
首先是模型的搭建;
其次是多尺度检测,通过上采样加张量拼接。
最后将图片切成S*S的网格。
CN202010821792.4A 2020-08-15 2020-08-15 一种基于yoloV3的calhe直方图增强型目标识别算法 Pending CN111950475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010821792.4A CN111950475A (zh) 2020-08-15 2020-08-15 一种基于yoloV3的calhe直方图增强型目标识别算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010821792.4A CN111950475A (zh) 2020-08-15 2020-08-15 一种基于yoloV3的calhe直方图增强型目标识别算法

Publications (1)

Publication Number Publication Date
CN111950475A true CN111950475A (zh) 2020-11-17

Family

ID=73343514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010821792.4A Pending CN111950475A (zh) 2020-08-15 2020-08-15 一种基于yoloV3的calhe直方图增强型目标识别算法

Country Status (1)

Country Link
CN (1) CN111950475A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949452A (zh) * 2021-02-25 2021-06-11 山西大学 一种基于多任务共享网络的机器人弱光环境抓取检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930517A (zh) * 2012-11-30 2013-02-13 江苏技术师范学院 直方图均衡化图像增强方法
CN107358177A (zh) * 2017-06-27 2017-11-17 维拓智能科技(深圳)有限公司 一种基于图像分析的中远距离行人检测方法及终端设备
CN108960185A (zh) * 2018-07-20 2018-12-07 泰华智慧产业集团股份有限公司 基于YOLOv2的车辆目标检测方法及系统
CN110795991A (zh) * 2019-09-11 2020-02-14 西安科技大学 一种基于多信息融合的矿用机车行人检测方法
WO2020092509A1 (en) * 2018-10-30 2020-05-07 University of North Texas System Reconfigurable fabric inspection system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930517A (zh) * 2012-11-30 2013-02-13 江苏技术师范学院 直方图均衡化图像增强方法
CN107358177A (zh) * 2017-06-27 2017-11-17 维拓智能科技(深圳)有限公司 一种基于图像分析的中远距离行人检测方法及终端设备
CN108960185A (zh) * 2018-07-20 2018-12-07 泰华智慧产业集团股份有限公司 基于YOLOv2的车辆目标检测方法及系统
WO2020092509A1 (en) * 2018-10-30 2020-05-07 University of North Texas System Reconfigurable fabric inspection system
CN110795991A (zh) * 2019-09-11 2020-02-14 西安科技大学 一种基于多信息融合的矿用机车行人检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JING TAO ET AL: "An Object Detection System Based on YOLO in", 《2017 6TH INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND NETWORK TECHNOLOGY (ICCSNT)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949452A (zh) * 2021-02-25 2021-06-11 山西大学 一种基于多任务共享网络的机器人弱光环境抓取检测方法
CN112949452B (zh) * 2021-02-25 2022-05-31 山西大学 一种基于多任务共享网络的机器人弱光环境抓取检测方法

Similar Documents

Publication Publication Date Title
CN109584248B (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
US11429818B2 (en) Method, system and device for multi-label object detection based on an object detection network
CN109784203B (zh) 基于分层传播和激活的弱监督x光图像违禁品检查方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
WO2022033095A1 (zh) 一种文本区域的定位方法及装置
CN112183414A (zh) 一种基于混合空洞卷积的弱监督遥感目标检测方法
CN112967243A (zh) 一种基于yolo的深度学习芯片封装裂纹缺陷检测方法
CN112560675B (zh) Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法
Nordeng et al. DEBC detection with deep learning
CN114841972A (zh) 基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法
CN109325407B (zh) 基于f-ssd网络滤波的光学遥感视频目标检测方法
CN113096085A (zh) 基于两阶段卷积神经网络的集装箱表面损伤检测方法
CN110751195A (zh) 一种基于改进YOLOv3的细粒度图像分类方法
CN116645586A (zh) 一种基于改进YOLOv5的港口集装箱损伤检测方法及系统
Kumar et al. Feature relevance analysis for 3D point cloud classification using deep learning
Mewada et al. Automatic room information retrieval and classification from floor plan using linear regression model
Zuo et al. A remote sensing image semantic segmentation method by combining deformable convolution with conditional random fields
CN116630802A (zh) 一种基于SwinT与尺寸自适应卷积的电力设备锈蚀缺陷图像检测方法
CN115272691A (zh) 一种钢筋绑扎状态检测模型的训练方法、识别方法及设备
CN114358133A (zh) 一种基于语义辅助双目视觉slam检测回环帧的方法
CN112668662B (zh) 基于改进YOLOv3网络的野外山林环境目标检测方法
CN111950475A (zh) 一种基于yoloV3的calhe直方图增强型目标识别算法
CN111368865A (zh) 遥感影像储油罐检测方法、装置、可读存储介质及设备
CN113255555A (zh) 中国交通标志牌识别方法、系统、处理设备及存储介质
Kaur et al. 2-D geometric shape recognition using canny edge detection technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201117

WD01 Invention patent application deemed withdrawn after publication