CN110874556B - 一种基于深度学习的自然场景中车牌检测系统 - Google Patents

一种基于深度学习的自然场景中车牌检测系统 Download PDF

Info

Publication number
CN110874556B
CN110874556B CN201811025112.7A CN201811025112A CN110874556B CN 110874556 B CN110874556 B CN 110874556B CN 201811025112 A CN201811025112 A CN 201811025112A CN 110874556 B CN110874556 B CN 110874556B
Authority
CN
China
Prior art keywords
convolution
license plate
new
layer
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811025112.7A
Other languages
English (en)
Other versions
CN110874556A (zh
Inventor
付腾桂
杨银环
柳庆祥
华建刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Focus Vision Security Technology Co ltd
Original Assignee
Shanghai Focus Vision Security Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Focus Vision Security Technology Co ltd filed Critical Shanghai Focus Vision Security Technology Co ltd
Priority to CN201811025112.7A priority Critical patent/CN110874556B/zh
Publication of CN110874556A publication Critical patent/CN110874556A/zh
Application granted granted Critical
Publication of CN110874556B publication Critical patent/CN110874556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及车牌检测系统。一种基于深度学习的自然场景中车牌检测系统,它包括:输入单元,用于自然场景图像的输入,包括但不限于摄像头采集图像输入、码流解码输入;第一深度网络单元,它用于对车牌的初筛,并包括6个卷积层、1个最大池化层、1个非极大值抑制处理单元;第二深度网络单元,它用于对车牌的再次筛选,包括3个卷积层、3个全连接层、2个最大池化层;和,输出单元,对所有的通过了第一深度网络结构初筛和第二深度网络结构筛选的车牌区域进行对比,如果存在重合且重合区域大于阈值Th_4,那么这些区域合并为一个区域;将经过合并处理后的区域输出,输出的区域即为疑似车牌区域。本发明占用资源少,适合嵌入式设备使用。

Description

一种基于深度学习的自然场景中车牌检测系统
技术领域
本发明涉及车牌检测,尤其涉及一种在自然场景的车牌检测。
背景技术
在自然场景中检测车牌,传统方法是通过颜色、边缘等特征进行过滤,或者是构建HOG、LBP等人工特征进行检测,存在的问题是检测不够准确,误报和漏报率都较高。深度学习兴起后,人们也可以用SSD/YOLO/Faster RCNN等深度学习框架来检测车牌,基于深度学习的车牌检测方法,诸如201610312822.2、201710187201.0、201710187289.6和201710531085.X。
这些方法存在的问题是计算量大,消耗的CPU和DDR的资源都很大,但是对于自然场景的检测设备因成本、按照较早等原因,配置不会太高,资源有限,上述各种方法不利于在资源有限的嵌入式设备上实现应用。
发明内容
本发明旨在于解决现有技术存在的上述问题,提供一种基于深度学习的自然场景中车牌检测方法。本发明占用资源少,适合嵌入式设备使用。
本发明一种基于深度学习的自然场景中车牌检测系统,其特征在于,它包括:
输入单元,用于自然场景图像的输入,包括但不限于摄像头采集图像输入、码流解码输入;
第一深度网络单元,它用于对车牌的初筛,并包括6个卷积层、1个最大池化层、1个非极大值抑制处理单元;
第二深度网络单元,它用于对车牌的再次筛选,包括3个卷积层、3个全连接层、2个最大池化层;和,
输出单元,对所有的通过了第一深度网络结构初筛和第二深度网络结构筛选的车牌区域进行对比,如果存在重合且重合区域大于阈值Th_4,那么这些区域合并为一个区域;将经过合并处理后的区域输出,输出的区域即为疑似车牌区域。
所述的一种基于深度学习的自然场景中车牌检测系统,所述第一深度网络单元的结构包括:
a)第一卷积层的参数为(3,9,3,10),表示对输入单元的RGB图像(h,w,3)以(3,9,3)的卷积核进行卷积,卷积的跨度为1,共10组卷积核,得到(new_h,new_w,10)的输出,其中new_h=h-2,new_w=w-8;
b)第一最大池化层以(2,2)的核对第一卷积层的输出数据(h,w,10)进行池化,池化的跨度为2,得到(new_h,new_w,10)的输出,其中new_h=h/2,new_w=w/2,不能整除时向下取整,例如w=5时,new_w=2;
c)第二卷积层的参数为(3,9,10,16),表示对第一最大池化层的输出数据(h,w,10)以(3,9,10)的卷积核进行卷积,卷积的跨度为1,共16组卷积核,得到(new_h,new_w,16)的输出,其中new_h=h-2,new_w=w-8;
d)第三卷积层的参数为(3,9,16,32),表示对第二卷积层的输出数据(h,w,16)以(3,9,16)的卷积核进行卷积,卷积的跨度为1,共32组卷积核,得到(new_h,new_w,32)的输出,其中new_h=h-2,new_w=w-8;
e)第四卷积层的参数为(1,4,32,2),表示对第三卷积层的输出数据(h,w,32)以(1,4,2)的卷积核进行卷积,卷积的跨度为1,共2组卷积核,得到(new_h,new_w,2)的输出,其中new_h=h,new_w=w-3。第四卷积层的输出分别为判定为车牌的得分和判定为非车牌的得分,如果判定为车牌的得分大于判定为非车牌的得分,那么该区域可能存在车牌;
f)第五卷积层的参数为(1,4,32,4),表示对第三卷积层的输出数据(h,w,32)以(1,4,4)的卷积核进行卷积,卷积的跨度为1,共4组卷积核,得到(new_h,new_w,4)的输出,其中new_h=h,new_w=w-3。第五卷积层的输出是车牌区域相对于当前位置的偏差,分别代表(dx,dy,dw,dh),即中心坐标x、y的偏差和宽高w、h的偏差;
g)非极大值抑制处理单元将第四卷积层的输出数据中判定为车牌的得分大于判定为非车牌的得分,且判定为车牌的得分大于阈值Th_0的区域筛选出来,并根据第五卷积层的输出数据中的(dx,dy,dw,dh),对于车牌区域位置进行校正,最后比较这些区域是否重叠,如果重叠面积大于阈值Th_1,保留其中得分最高的区域;
所述的一种基于深度学习的自然场景中车牌检测系统,训练第一深度网络单元时,图像统一缩放到(12,48,3)的大小,经过卷积层和最大池化层的大小分别为(10,40,10)->(5,20,10)->(3,12,16)->(1,4,32)->(1,1,2)和(1,1,4)根据预设的最大车牌高度和最小车牌高度,对自然场景图像进行缩放,并对缩放后的图像序列都进入第一深度网络单元进行处理,从而得到各个尺度下不同搜索框生成的初筛图像,并将通过初筛的图像统一缩放到(24,96,3)的大小。
所述的一种基于深度学习的自然场景中车牌检测系统,所述第二深度网络单元的结构包括
a)第一卷积层的参数为(3,9,3,28),表示对初筛并统一缩放后的图像(24,96,3)以(3,9,3)的卷积核进行卷积,卷积的跨度为1,共28组卷积核,得到(22,88,28)的输出;
b)第一最大池化层以(3,3)的核对第一卷积层的输出数据(22,88,28)进行池化,池化的跨度为2,得到(11,44,28)的输出;
c)第二卷积层的参数为(3,9,28,48),表示对第一最大池化层的输出数据(11,44,28)以(3,9,28)的卷积核进行卷积,卷积的跨度为1,共48组卷积核,得到(9,36,48)的输出;
d)第二最大池化层以(3,3)的核对第二卷积层的输出数据(9,36,48)进行池化,池化的跨度为2,得到(4,17,48)的输出;
e)第三卷积层的参数为(2,6,48,64),表示对第二最大池化层的输出数据(4,17,48)以(2,6,48)的卷积核进行卷积,卷积的跨度为1,共64组卷积核,得到(3,12,64)的输出;
f)第一全连接层的参数为(2304,128),将第三卷积层的输出展开为维度为2304的一维向量(3*12*64),向量和矩阵乘得到(128)的一维向量;。
g)第二全连接层的参数为(128,2),和第一全连接层的输出向量进行矩阵乘法,得到(2)的一维向量,表示判定为车牌的得分和判定为非车牌的得分,如果判定为车牌的得分大于判定为非车牌的得分,那么该区域可能存在车牌;
h)第二全连接层的参数为(128,4),和第一全连接层的输出向量进行矩阵乘法,得到(4)的一维向量,表示车牌区域相对于当前位置的偏差,分别代表(dx,dy,dw,dh);
将判定为车牌的得分大于阈值Th_3的区域筛选出来,并根据计算得到的位置偏差校正车牌区域。
本发明通过第一个网络对自然场景进行初筛,得到疑似车牌区域,通过第二个网络对疑似车牌区域进行判断类别和位置回归,准确判断车牌和定位其位置信息。通过双网络结合的方式,兼顾了性能和准确率。
附图说明
图1为发明示意图。
具体实施方式
参见图1、本发明一种基于深度学习的车牌检测系统,包含输入单元、第一深度网络单元、第二深度网络单元、输出单元。
所述输入单元主要用于自然场景图像的输入,包括但不限于摄像头采集图像输入、码流解码输入等。
缩水第一深度网络单元包括6个卷积层、1个最大池化层、1个非极大值抑制处理单元,详细结构如下:
a)第一卷积层的参数为(3,9,3,10),表示对输入单元的RGB图像(h,w,3)以(3,9,3)的卷积核进行卷积,卷积的跨度为1,共10组卷积核,得到(new_h,new_w,10)的输出,其中new_h=h-2,new_w=w-8
b)第一最大池化层以(2,2)的核对第一卷积层的输出数据(h,w,10)进行池化,池化的跨度为2,得到(new_h,new_w,10)的输出,其中new_h=h/2,new_w=w/2,不能整除时向下取整,例如w=5时,new_w=2。
c)第二卷积层的参数为(3,9,10,16),表示对第一最大池化层的输出数据(h,w,10)以(3,9,10)的卷积核进行卷积,卷积的跨度为1,共16组卷积核,得到(new_h,new_w,16)的输出,其中new_h=h-2,new_w=w-8。
d)第三卷积层的参数为(3,9,16,32),表示对第二卷积层的输出数据(h,w,16)以(3,9,16)的卷积核进行卷积,卷积的跨度为1,共32组卷积核,得到(new_h,new_w,32)的输出,其中new_h=h-2,new_w=w-8。
e)第四卷积层的参数为(1,4,32,2),表示对第三卷积层的输出数据(h,w,32)以(1,4,2)的卷积核进行卷积,卷积的跨度为1,共2组卷积核,得到(new_h,new_w,2)的输出,其中new_h=h,new_w=w-3。第四卷积层的输出分别为判定为车牌的得分和判定为非车牌的得分,如果判定为车牌的得分大于判定为非车牌的得分,那么该区域可能存在车牌。
f)第五卷积层的参数为(1,4,32,4),表示对第三卷积层的输出数据(h,w,32)以(1,4,4)的卷积核进行卷积,卷积的跨度为1,共4组卷积核,得到(new_h,new_w,4)的输出,其中new_h=h,new_w=w-3。第五卷积层的输出是车牌区域相对于当前位置的偏差,分别代表(dx,dy,dw,dh),即中心坐标x、y的偏差和宽高w、h的偏差。
g)非极大值抑制处理单元将第四卷积层的输出数据中判定为车牌的得分大于判定为非车牌的得分,且判定为车牌的得分大于阈值Th_0的区域筛选出来,并根据第五卷积层的输出数据中的(dx,dy,dw,dh),对于车牌区域位置进行校正,最后比较这些区域是否重叠,如果重叠面积大于阈值Th_1,保留其中得分最高的区域。
举例说明:输入图像为(600,800,3)的大小,经过第一卷积层为(598,792,10),经过第一最大池化层为(299,396,10),经过第二卷积层为(297,388,16),经过第三卷积层为(295,380,32),经过第四卷积层和第五卷积层后分别为(295,377,2),(295,377,4),相当于对800*600的RGB图像进行了295*277个搜索框的初筛。
训练第一深度网络单元时,图像统一缩放到(12,48,3)的大小,经过卷积层和最大池化层的大小分别为(10,40,10)->(5,20,10)->(3,12,16)->(1,4,32)->(1,1,2)和(1,1,4)
根据预设的最大车牌高度和最小车牌高度,对自然场景图像进行缩放,并对缩放后的图像序列都进入第一深度网络单元进行处理,从而得到各个尺度下不同搜索框生成的初筛图像,并将通过初筛的图像统一缩放到(24,96,3)的大小。
所述第二深度网络单元包括3个卷积层、3个全连接层、2个最大池化层,详细结构如下:
a)第一卷积层的参数为(3,9,3,28),表示对初筛并统一缩放后的图像(24,96,3)以(3,9,3)的卷积核进行卷积,卷积的跨度为1,共28组卷积核,得到(22,88,28)的输出。
b)第一最大池化层以(3,3)的核对第一卷积层的输出数据(22,88,28)进行池化,池化的跨度为2,得到(11,44,28)的输出。
c)第二卷积层的参数为(3,9,28,48),表示对第一最大池化层的输出数据(11,44,28)以(3,9,28)的卷积核进行卷积,卷积的跨度为1,共48组卷积核,得到(9,36,48)的输出。
d)第二最大池化层以(3,3)的核对第二卷积层的输出数据(9,36,48)进行池化,池化的跨度为2,得到(4,17,48)的输出。
e)第三卷积层的参数为(2,6,48,64),表示对第二最大池化层的输出数据(4,17,48)以(2,6,48)的卷积核进行卷积,卷积的跨度为1,共64组卷积核,得到(3,12,64)的输出。
f)第一全连接层的参数为(2304,128),将第三卷积层的输出展开为维度为2304的一维向量(3*12*64),向量和矩阵乘得到(128)的一维向量。
g)第二全连接层的参数为(128,2),和第一全连接层的输出向量进行矩阵乘法,得到(2)的一维向量,表示判定为车牌的得分和判定为非车牌的得分,如果判定为车牌的得分大于判定为非车牌的得分,那么该区域可能存在车牌。
h)第二全连接层的参数为(128,4),和第一全连接层的输出向量进行矩阵乘法,得到(4)的一维向量,表示车牌区域相对于当前位置的偏差,分别代表(dx,dy,dw,dh)。
将判定为车牌的得分大于阈值Th_3的区域筛选出来,并根据计算得到的位置偏差校正车牌区域。
所述输出单元:对所有的通过了第一深度网络结构初筛和第二深度网络结构筛选的车牌区域,如果存在重合且重合区域大于阈值Th_4,那么这些区域合并为一个区域。将经过合并处理后的区域输出,输出的区域即为疑似车牌区域。

Claims (2)

1.一种基于深度学习的自然场景中车牌检测系统,其特征在于,它包括:输入单元,用于自然场景图像的输入,包括摄像头采集图像输入、码流解码输入;
第一深度网络单元,它用于对车牌的初筛,并包括6个卷积层、1个最大池化层、1个非极大值抑制处理单元;
第二深度网络单元,它用于对车牌的再次筛选,包括3个卷积层、3个全连接层、2个最大池化层;和,
输出单元,对所有的通过了第一深度网络结构初筛和第二深度网络结构筛选的车牌区域进行对比,如果存在重合且重合区域大于阈值Th_4,那么这些区域合并为一个区域;将经过合并处理后的区域输出,输出的区域即为疑似车牌区域;所述第一深度网络单元的结构包括:
a)第一卷积层的参数为(3,9,3,10),表示对输入单元的RGB图像(h,w,3)以(3,9,3)的卷积核进行卷积,卷积的跨度为1,共10组卷积核,得到(new_h,new_w,10)的输出,其中new_h=h-2,new_w=w-8;
b)第一最大池化层以(2,2)的核对第一卷积层的输出数据(h,w,10)进行池化,池化的跨度为2,得到(new_h,new_w,10)的输出,其中new_h=h/2,new_w=w/2,不能整除时向下取整;
c)第二卷积层的参数为(3,9,10,16),表示对第一最大池化层的输出数据(h,w,10)以(3,9,10)的卷积核进行卷积,卷积的跨度为1,共16组卷积核,得到(new_h,new_w,16)的输出,其中new_h=h-2,new_w=w-8;
d)第三卷积层的参数为(3,9,16,32),表示对第二卷积层的输出数据(h,w,16)以(3,9,16)的卷积核进行卷积,卷积的跨度为1,共32组卷积核,得到(new_h,new_w,32)的输出,其中new_h=h-2,new_w=w-8;
e)第四卷积层的参数为(1,4,32,2),表示对第三卷积层的输出数据(h,w,32)以(1,4,2)的卷积核进行卷积,卷积的跨度为1,共2组卷积核,得到(new_h,new_w,2)的输出,其中new_h=h,new_w=w-3;第四卷积层的输出分别为判定为车牌的得分和判定为非车牌的得分,如果判定为车牌的得分大于判定为非车牌的得分,那么该区域可能存在车牌;
f)第五卷积层的参数为(1,4,32,4),表示对第三卷积层的输出数据(h,w,32)以(1,4,4)的卷积核进行卷积,卷积的跨度为1,共4组卷积核,得到(new_h,new_w,4)的输出,其中new_h=h,new_w=w-3;第五卷积层的输出是车牌区域相对于当前位置的偏差,分别代表(dx,dy,dw,dh),即中心坐标x、y的偏差和宽高w、h的偏差;
g)非极大值抑制处理单元将第四卷积层的输出数据中判定为车牌的得分大于判定为非车牌的得分,且判定为车牌的得分大于阈值Th_0的区域筛选出来,并根据第五卷积层的输出数据中的(dx,dy,dw,dh),对于车牌区域位置进行校正,最后比较这些区域是否重叠,如果重叠面积大于阈值Th_1,保留其中得分最高的区域;
所述第二深度网络单元的结构包括
a)第一卷积层的参数为(3,9,3,28),表示对初筛并统一缩放后的图像(24,96,3)以(3,9,3)的卷积核进行卷积,卷积的跨度为1,共28组卷积核,得到(22,88,28)的输出;
b)第一最大池化层以(3,3)的核对第一卷积层的输出数据(22,88,28)进行池化,池化的跨度为2,得到(11,44,28)的输出;
c)第二卷积层的参数为(3,9,28,48),表示对第一最大池化层的输出数据(11,44,28)以(3,9,28)的卷积核进行卷积,卷积的跨度为1,共48组卷积核,得到(9,36,48)的输出;
d)第二最大池化层以(3,3)的核对第二卷积层的输出数据(9,36,48)进行池化,池化的跨度为2,得到(4,17,48)的输出;
e)第三卷积层的参数为(2,6,48,64),表示对第二最大池化层的输出数据(4,17,48)以(2,6,48)的卷积核进行卷积,卷积的跨度为1,共64组卷积核,得到(3,12,64)的输出;
f)第一全连接层的参数为(2304,128),将第三卷积层的输出展开为维度为2304的一维向量(3*12*64),向量和矩阵乘得到(128)的一维向量;
g)第二全连接层的参数为(128,2),和第一全连接层的输出向量进行矩阵乘法,得到(2)的一维向量,表示判定为车牌的得分和判定为非车牌的得分,如果判定为车牌的得分大于判定为非车牌的得分,那么该区域可能存在车牌;
h)第二全连接层的参数为(128,4),和第一全连接层的输出向量进行矩阵乘法,得到(4)的一维向量,表示车牌区域相对于当前位置的偏差,分别代表(dx,dy,dw,dh);
将判定为车牌的得分大于阈值Th_3的区域筛选出来,并根据计算得到的位置偏差校正车牌区域。
2.根据权要求1所述的一种基于深度学习的自然场景中车牌检测系统,其特征在于,训练第一深度网络单元时,图像统一缩放到(12,48,3)的大小,经过卷积层和最大池化层的大小分别为(10,40,10)->(5,20,10)->(3,12,16)->(1,4,32)->(1,1,2)和(1,1,4)根据预设的最大车牌高度和最小车牌高度,对自然场景图像进行缩放,并对缩放后的图像序列都进入第一深度网络单元进行处理,从而得到各个尺度下不同搜索框生成的初筛图像,并将通过初筛的图像统一缩放到(24,96,3)的大小。
CN201811025112.7A 2018-09-04 2018-09-04 一种基于深度学习的自然场景中车牌检测系统 Active CN110874556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811025112.7A CN110874556B (zh) 2018-09-04 2018-09-04 一种基于深度学习的自然场景中车牌检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811025112.7A CN110874556B (zh) 2018-09-04 2018-09-04 一种基于深度学习的自然场景中车牌检测系统

Publications (2)

Publication Number Publication Date
CN110874556A CN110874556A (zh) 2020-03-10
CN110874556B true CN110874556B (zh) 2024-02-09

Family

ID=69715970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811025112.7A Active CN110874556B (zh) 2018-09-04 2018-09-04 一种基于深度学习的自然场景中车牌检测系统

Country Status (1)

Country Link
CN (1) CN110874556B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341517A (zh) * 2017-07-07 2017-11-10 哈尔滨工业大学 一种基于深度学习层级间特征融合的多尺度小物体检测方法
WO2018120740A1 (zh) * 2016-12-29 2018-07-05 深圳光启合众科技有限公司 图片分类方法和装置、机器人
CN108446696A (zh) * 2018-02-09 2018-08-24 杭州雄迈集成电路技术有限公司 一种基于深度学习的端到端车牌识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018120740A1 (zh) * 2016-12-29 2018-07-05 深圳光启合众科技有限公司 图片分类方法和装置、机器人
CN107341517A (zh) * 2017-07-07 2017-11-10 哈尔滨工业大学 一种基于深度学习层级间特征融合的多尺度小物体检测方法
CN108446696A (zh) * 2018-02-09 2018-08-24 杭州雄迈集成电路技术有限公司 一种基于深度学习的端到端车牌识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李娟 ; 强赞霞 ; 杨关 ; 崔春生 ; .基于区域推荐和深度卷积网络的交通目标检测.数学的实践与认识.2018,(16),全文. *
赵莉 ; 白猛猛 ; 雷松泽 ; 计雪薇 ; .深度学习在车牌定位中的研究.计算机应用研究.2017,(10),全文. *

Also Published As

Publication number Publication date
CN110874556A (zh) 2020-03-10

Similar Documents

Publication Publication Date Title
US11048948B2 (en) System and method for counting objects
CN111507958B (zh) 目标检测方法、检测模型的训练方法及电子设备
US10198689B2 (en) Method for object detection in digital image and video using spiking neural networks
CN109815843B (zh) 图像处理方法及相关产品
US20180114071A1 (en) Method for analysing media content
CN113065558A (zh) 一种结合注意力机制的轻量级小目标检测方法
EP3048579B1 (en) Structure analysis method for recovering missing structures in an image after object removal
JP2018028899A5 (zh)
CN113469074B (zh) 基于孪生注意力融合网络的遥感图像变化检测方法及系统
CN111680690B (zh) 一种文字识别方法及装置
CN109472193A (zh) 人脸检测方法及装置
WO2023082784A1 (zh) 一种基于局部特征注意力的行人重识别方法和装置
CN113658192B (zh) 一种多目标行人的轨迹获取方法、系统、装置及介质
CN107506792B (zh) 一种半监督的显著对象检测方法
CN111353956B (zh) 图像修复方法、装置、计算机设备及存储介质
CN111985374A (zh) 人脸定位方法、装置、电子设备及存储介质
JP2020503886A (ja) 作物画像におけるジャガイモウイルスを検出するための方法、媒体、およびシステム
CN103810707B (zh) 一种基于移动视觉焦点的图像视觉显著性检测方法
CN106650615A (zh) 一种图像处理方法及终端
CN111414807A (zh) 一种基于yolo技术的潮水识别与危机预警方法
CN112215188B (zh) 交警姿态识别方法、装置、设备及存储介质
CN112560619A (zh) 一种基于多聚焦图像融合的多距离鸟类精准识别方法
CN110751195A (zh) 一种基于改进YOLOv3的细粒度图像分类方法
CN109409224A (zh) 一种自然场景火焰检测的方法
CN110874556B (zh) 一种基于深度学习的自然场景中车牌检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant