CN110766002B - 一种基于深度学习的船名字符区域检测方法 - Google Patents

一种基于深度学习的船名字符区域检测方法 Download PDF

Info

Publication number
CN110766002B
CN110766002B CN201910950738.7A CN201910950738A CN110766002B CN 110766002 B CN110766002 B CN 110766002B CN 201910950738 A CN201910950738 A CN 201910950738A CN 110766002 B CN110766002 B CN 110766002B
Authority
CN
China
Prior art keywords
name character
ship name
layer
convolution
subunit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910950738.7A
Other languages
English (en)
Other versions
CN110766002A (zh
Inventor
张三元
吴书楷
祁忠琪
涂凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910950738.7A priority Critical patent/CN110766002B/zh
Publication of CN110766002A publication Critical patent/CN110766002A/zh
Application granted granted Critical
Publication of CN110766002B publication Critical patent/CN110766002B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的船名字符区域检测方法。通过摄像机采集大运河过往货船的高清图片,预处理后对图片中船名字符区域进行标注,构建船名字符区域检测数据集;搭建基于特征融合策略的深度学习检测网络,将数据集送入网络进行训练;利用训练好的检测网络对原图中的目标区域进行计算,根据置信度阈值和非极大值抑制算法对检测结果进行筛选获得最终的检测框,并绘制在图片上。本发明能够快速、准确地对自然场景中的货船船名字符区域进行检测,相比于传统检测方法采用阈值分割、边缘检测等技术,其不容易受光线、雨水等复杂环境的影响,在智能交通领域具有较好的应用前景。

Description

一种基于深度学习的船名字符区域检测方法
技术领域
本发明涉及船名字符区域的检测方法,具体涉及一种基于深度学习的船名字符区域检测方法。
背景技术
水路运输作为一种高效、快捷的运输方式,对经济的发展起到了一定的助推作用。为了方便对运河进行管理,往往需要了解过往船只的身份信息,因此船名的自动识别技术具有重大意义。当前船名识别技术包括船名字符区域的定位和船名识别两个主要步骤,快速、准确地定位出船名字符区域作为第一步至关重要,因为检测质量的高低将影响后续的识别过程。
传统的检测方法选择采用二值化、边缘检测等技术对目标区域进行计算,这种方法很容易受到外界自然环境的影响,检测的准确度偏低,效果不理想。
发明内容
为了解决背景技术中的问题,本发明提出了一种基于深度学习的船名字符区域检测方法。该方法通过深度神经网络对船名字符区域的位置进行计算,实现了高效、准确、快速的定位功能,且鲁棒性和抗干扰能力强,易于移植。
本发明采用技术方案如下:
本发明包括以下步骤:
步骤1)采集经过运河的货船图片作为样本图片,然后对样本图片进行预处理,所有样本图片及其标注信息作为数据集;
步骤2)构建船名字符区域检测网络,使用步骤1)的数据集训练船名字符区域检测网络,得到训练后的船名字符区域检测网络;
步骤3)对待测货船图片进行预处理后输入步骤2)训练后的船名字符区域检测网络,获得包含置信度得分的目标框;
步骤4)根据置信度阈值筛选出高得分的目标框,然后通过非极大值抑制算法剔除位置重合度高的目标框,最终保留的目标框作为最终检测结果。
所述步骤1)和步骤4)中的预处理为将图片缩放至500×500的固定尺寸。
所述步骤1)具体为:对样本图片进行预处理后使用标注软件对船名字符区域的位置进行矩形框框定标注,并赋予船名字符区域标签序号1,赋予船名字符区域以外的背景区域标签序号0;所有样本图片及其标注信息作为数据集,标注信息包括标签序号和矩形框的位置信息,矩形框的位置信息为矩形框左上角的坐标值以及矩形框的宽度值和长度值。
所述步骤2)具体为:
2.1)构建包括输入层、特征提取模块、特征融合模块、预测模块和输出层的船名字符区域检测网络;
特征提取模块包括基础网络模块和三个卷积模块,输入层依次经基础网络模块、第一个卷积模块、第二个卷积模块连接到第三个卷积模块,基础网络模块为去除全连接层后的VGG16网络,每个卷积模块均包括两个依次连接的卷积层;
特征融合模块包括四个依次连接的子单元,每个子单元包括依次连接的一个反卷积层、一个Eltwise层和一个卷积层,卷积层作为每个子单元的输出;第二个子单元、第三个子单元和第四个子单元中反卷积层的输入分别为上一个子单元的输出,第一个子单元中反卷积层的输入为第三个卷积模块中第二个卷积层的输出;基础网络模块中的卷积层和池化层分别输入第四个子单元和第三个子单元中的Eltwise层,第一个卷积模块和第二个卷积模块中的第二个卷积层分别输入第二个子单元和第一个子单元中的Eltwise层;
预测模块包括五个预测单元,每个预测单元的输出均连接至输出层,第二个、第三个、第四个和第五个预测单元的输入分别为第一个、第二个、第三个和第四个子单元中卷积层的输出;
2.2)将步骤1)的数据集送入船名字符区域检测网络,采用随机梯度下降法训练神经网络,直到网络的误差达到最小值;其中,前20K次迭代学习率设置为1×10-4,后10K次迭代学习率衰减为1×10-5
检测网络采用多任务损失函数,损失函数为类别损失和位置损失之和;其中,类别损失采用交叉熵代价函数,位置损失使用smooth L1损失函数。
船名字符区域检测网络中高层次的特征图经过子单元中反卷积层的反卷积操作后与网络中低层次的特征图大小一致,即输入子单元中反卷积层的特征图经反卷积操作后与输入当前子单元Eltwise层的特征图大小一致;
所述子单元的Eltwise层用于将输入的两个特征图中相同位置的像素值相加以实现特征的增强。
特征图经过预测单元生成多个以特征图中每个像素点为中心的默认包围框,所述默认包围框为一系列面积相同纵横比不同的矩形框,矩形框的纵横比分别为1、1/2、1/3、1/5、1/7和1/10;
对于每个矩形框,预测单元采用两个1×5大小卷积核的卷积层分别进行类别得分和位置偏移的计算,所述类别得分为矩形框内船名字符区域的置信度得分,所述位置偏移为船名字符区域位置的计算,计算结果包括矩形框左上角的坐标值以及矩形框的宽度值和长度值。
所述的步骤4)中,每张图片输入船名字符区域检测网络后输出大量重复的矩形框,首先根据预设的置信度阈值选出高得分的矩形框,然后利用非极大值抑制算法剔除冗余的矩形框,保留船名字符区域邻域里置信度得分最高的矩形框,最终保留的矩形框作为最终检测结果。
本发明的有益效果是:
1)本发明的船名字符区域检测功能完全通过神经网络算法实现,相比传统的方法,该方法很好地学习到了字符区域的细节特征,大大提升了检测的精度和稳定性。
2)本发明对于一张500×500分辨率的图片检测时间只需要约210ms,速度快,具有时效性。
3)本发明应用范围较为广泛,迁移后可应用于车牌区域检测等领域,具有较好的应用前景。
4)本发明能够快速、有效地对船名字符区域进行自动检测,且具备一定的检测精度和速度,相比于传统检测方法采用阈值分割、边缘检测等技术,其不容易受光线、雨水等复杂环境的影响,在智能交通领域具有较好的应用前景。
附图说明
图1是本发明的流程图。
图2是本发明的船名字符区域检测网络的结构图。
图3是本发明所要检测的原图,(a)(b)(c)(d)分别为四张不同的样本图片。
图4是本发明的检测结果图,(a)(b)(c)(d)分别为图3四张不同的样本图片对应的检测结果。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
如图1所示,本发明的实施过程如下:
步骤一:通过安装在运河两岸的高清摄像头采集过往货船图片作为样本图片,对样本图片进行预处理,构建船名位置数据集,具体的过程为:
将获取的原图片缩放到500×500的固定尺寸。使用标注软件对船名字符区域进行矩形框框定标注,赋予标签序号1,对于背景区域不需要框定,赋予标签序号0。其中,框定的位置信息为矩形框左上角坐标的x、y值(以图片左上角为原点建立坐标系),以及矩形框的宽度值和长度值。所有图片及即标注信息构成船名字符区域检测数据集,标注信息包括标签序号和矩形框的位置信息。数据集根据4:1的比例划分为训练集和验证集,用于检测网络的训练。
步骤二:搭建如图2所示的船名字符区域检测网络,将步骤一中构建的数据集送入网络进行训练,具体过程为:
2.1)构建深度学习检测网络,该网络主要分为三个模块:特征提取模块、特征融合模块和预测模块。
特征提取模块由基础网络模块和若干卷积模块组成。数据输入特征提取模块后首先会通过基础网络模块进行特征提取,其中基础网络模块是去除了全连接层的VGG16网络。在基础网络模块后添加了三个连续的卷积模块,每个卷积模块中有两个卷积层。第一个卷积模块的第一个卷积层(Conv6_1)包含了256个1×1大小的卷积核,步长为1,填充大小为0,第二个卷积层(Conv6_2)包含了512个3×3大小的卷积核,步长为2,填充大小为1。第二个卷积模块的第一个卷积层(Conv7_1)包含了128个1×1大小的卷积核,步长为1,填充大小为0,第二个卷积层(Conv7_2)使用了256个3×3大小的卷积核,步长为2,填充大小为1。第三个卷积模块的第一个卷积层(Conv8_1)包含了128个1×1大小的卷积核,步长为1,填充大小为0,第二个卷积层(Conv8_2)包含了256个3×3大小的卷积核,步长为2,填充大小为1。以上所有卷积层的结果都会通过ReLU函数激活。
特征融合模块分为四个子单元,每个子单元包括依次连接的一个反卷积层(Deconv)、一个Eltwise层和一个卷积层(Conv_Eltwise),卷积层作为每个子单元的输出;在每个子单元内部依次执行反卷积、对应位置像素值相加和卷积操作。具体流程为首先对Conv8_2进行反卷积,使其与Conv7_2大小一致,然后将Conv8_2与Conv7_2进行对应位置的元素值相加,随后再通过一个使用了256个3×3大小的卷积核,步长为1,填充大小为1,激活函数为ReLU的卷积层(Conv_Eltwise_1)处理。至此,形成了第一个子单元。接下来,再将第一个子单元的卷积层(Conv_Eltwise_1)的结果送入下一个子单元处理,形成第二个子模块。依次类推,可形成四个子单元。将第一个子单元的卷积层(Conv_Eltwise_1)、第二个子单元的卷积层(Conv_Eltwise_2)、第三个子单元的卷积层(Conv_Eltwise_3)、第四个子单元的卷积层(Conv_Eltwise_4)和Conv8_2层的结果送入预测模块进行处理。
预测模块包括五个预测单元,每个预测单元在特征图上以每个像素点为中心生成特定数量的默认包围框,包围框的纵横比分别为1、1/2、1/3、1/5、1/7和1/10。对于每个包围框,预测单元采用两个1×5大小卷积核的卷积层分别进行类别得分和位置偏移的计算。其中,位置偏移有四个值,依次代表包围框左上角坐标点的x、y值(以图片左上角为原点建立坐标系)以及包围框的宽度值和长度值。
检测网络采用多任务损失函数,损失函数为类别损失和位置损失之和。其中,类别损失采用交叉熵代价函数,位置损失使用smooth L1损失函数。
2.2)将步骤1)构建的数据集送入深度学习检测网络,采用随机梯度下降法训练神经网络,直到网络的误差达到最小值。其中,前20K次迭代学习率设置为1×10-4,后10K次迭代学习率衰减为1×10-5
步骤三:首先根据预设的置信度阈值选出高得分的检测框,然后利用非极大值抑制算法对检测结果中位置重合度高的框进行剔除,保留下来的框即为最终的检测结果。最终,将检测结果绘制在原图上。
具体实施例:
本发明采用图3所示的摄像机拍摄到的原始图片,原始图片经过预处理后送入船名字符区域检测网络进行计算,根据预设的阈值和非极大值抑制算法自动对检测结果进行筛选,并将目标框绘制在原图上,最终检测结果如图4所示。如果不存在目标框,则对原图不做任何处理。
本发明可在复杂的自然场景下实现较为精确的船名字符区域检测功能,生成高质量的目标框,有利于后续船名字符识别过程的进行,并且具备一定的时效性,便于工作人员及时了解过往船只的身份信息,具有较大的应用前景。
上述具体实施方式用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (6)

1.一种基于深度学习的船名字符区域检测方法,其特征在于:
包括以下步骤:
1)采集经过运河的货船图片作为样本图片,然后对样本图片进行预处理,所有样本图片及其标注信息作为数据集;
2)构建船名字符区域检测网络,使用步骤1)的数据集训练船名字符区域检测网络,得到训练后的船名字符区域检测网络;
3)对待测货船图片进行预处理后输入步骤2)训练后的船名字符区域检测网络,获得包含置信度得分的目标框;
4)根据置信度阈值筛选出高得分的目标框,然后通过非极大值抑制算法剔除位置重合度高的目标框,最终保留的目标框作为最终检测结果;
所述步骤2)具体为:
2.1)构建包括输入层、特征提取模块、特征融合模块、预测模块和输出层的船名字符区域检测网络;
特征提取模块包括基础网络模块和三个卷积模块,输入层依次经基础网络模块、第一个卷积模块、第二个卷积模块连接到第三个卷积模块,基础网络模块为去除全连接层后的VGG16网络,每个卷积模块均包括两个依次连接的卷积层;
特征融合模块包括四个依次连接的子单元,每个子单元包括依次连接的一个反卷积层、一个Eltwise层和一个卷积层,卷积层作为每个子单元的输出;第二个子单元、第三个子单元和第四个子单元中反卷积层的输入分别为上一个子单元的输出,第一个子单元中反卷积层的输入为第三个卷积模块中第二个卷积层的输出;基础网络模块中的卷积层和池化层分别输入第四个子单元和第三个子单元中的Eltwise层,第一个卷积模块和第二个卷积模块中的第二个卷积层分别输入第二个子单元和第一个子单元中的Eltwise层;
预测模块包括五个预测单元,每个预测单元的输出均连接至输出层,第二个、第三个、第四个和第五个预测单元的输入分别为第一个、第二个、第三个和第四个子单元中卷积层的输出;
2.2)将步骤1)的数据集送入船名字符区域检测网络,采用随机梯度下降法训练神经网络,直到网络的误差达到最小值;其中,前20K次迭代学习率设置为1×10-4,后10K次迭代学习率衰减为1×10-5
2.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:所述步骤1)和步骤4)中的预处理为将图片缩放至500×500的固定尺寸。
3.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:所述步骤1)具体为:对样本图片进行预处理后使用标注软件对船名字符区域的位置进行矩形框框定标注,并赋予船名字符区域标签序号1,赋予船名字符区域以外的背景区域标签序号0;所有样本图片及其标注信息作为数据集,标注信息包括标签序号和矩形框的位置信息,矩形框的位置信息为矩形框左上角的坐标值以及矩形框的宽度值和长度值。
4.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:船名字符区域检测网络中高层次的特征图经过子单元中反卷积层的反卷积操作后与网络中低层次的特征图大小一致;
所述子单元的Eltwise层用于将输入的两个特征图中相同位置的像素值相加。
5.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:特征图经过预测单元生成多个以特征图中每个像素点为中心的默认包围框,所述默认包围框为一系列面积相同纵横比不同的矩形框,矩形框的纵横比分别为1、1/2、1/3、1/5、1/7和1/10;
对于每个矩形框,预测单元采用两个1×5大小卷积核的卷积层分别进行类别得分和位置偏移的计算,所述类别得分为矩形框内船名字符区域的置信度得分,所述位置偏移为船名字符区域位置的计算,计算结果包括矩形框左上角的坐标值以及矩形框的宽度值和长度值。
6.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:所述的步骤4)中,每张图片输入船名字符区域检测网络后输出大量重复的矩形框,首先根据预设的置信度阈值选出高得分的矩形框,然后利用非极大值抑制算法剔除冗余的矩形框,保留船名字符区域邻域里置信度得分最高的矩形框,最终保留的矩形框作为最终检测结果。
CN201910950738.7A 2019-10-08 2019-10-08 一种基于深度学习的船名字符区域检测方法 Expired - Fee Related CN110766002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910950738.7A CN110766002B (zh) 2019-10-08 2019-10-08 一种基于深度学习的船名字符区域检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910950738.7A CN110766002B (zh) 2019-10-08 2019-10-08 一种基于深度学习的船名字符区域检测方法

Publications (2)

Publication Number Publication Date
CN110766002A CN110766002A (zh) 2020-02-07
CN110766002B true CN110766002B (zh) 2022-03-22

Family

ID=69331117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910950738.7A Expired - Fee Related CN110766002B (zh) 2019-10-08 2019-10-08 一种基于深度学习的船名字符区域检测方法

Country Status (1)

Country Link
CN (1) CN110766002B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401139B (zh) * 2020-02-25 2024-03-29 云南昆钢电子信息科技有限公司 基于字符图像智能识别获得矿山井下设备位置的方法
CN111985363B (zh) * 2020-08-06 2022-05-06 武汉理工大学 一种基于深度学习框架的船舶名称识别系统及方法
CN112036396B (zh) * 2020-09-14 2022-09-02 上海高德威智能交通系统有限公司 船名识别方法、装置、电子设备及计算机可读存储介质
CN112651353B (zh) * 2020-12-30 2024-04-16 南京红松信息技术有限公司 一种基于自定义标签的目标口算的定位识别方法
CN113643235B (zh) * 2021-07-07 2023-12-29 青岛高重信息科技有限公司 一种基于深度学习的芯片计数方法
CN113642583B (zh) * 2021-08-13 2022-06-28 北京百度网讯科技有限公司 用于文本检测的深度学习模型训练方法及文本检测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145200A (zh) * 2007-10-26 2008-03-19 浙江工业大学 多视觉传感器信息融合的内河船舶自动识别系统
CN107133616A (zh) * 2017-04-02 2017-09-05 南京汇川图像视觉技术有限公司 一种基于深度学习的无分割字符定位与识别方法
CN107491752A (zh) * 2017-08-14 2017-12-19 中国石油大学(华东) 一种基于深度学习的自然场景中船牌文字识别方法、装置
CN107563372A (zh) * 2017-07-20 2018-01-09 济南中维世纪科技有限公司 一种基于深度学习ssd框架的车牌定位方法
CN107679531A (zh) * 2017-06-23 2018-02-09 平安科技(深圳)有限公司 基于深度学习的车牌识别方法、装置、设备及存储介质
CN108154144A (zh) * 2018-01-12 2018-06-12 江苏省新通智能交通科技发展有限公司 一种基于图像的船名字符定位方法及系统
CN109993163A (zh) * 2019-03-19 2019-07-09 苏州大学 一种基于人工智能的非标铭牌识别系统及其识别方法
CN110210475A (zh) * 2019-05-06 2019-09-06 浙江大学 一种非二值化和边缘检测的车牌字符图像分割方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845530B (zh) * 2016-12-30 2018-09-11 百度在线网络技术(北京)有限公司 字符检测方法和装置
US10579897B2 (en) * 2017-10-02 2020-03-03 Xnor.ai Inc. Image based object detection

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145200A (zh) * 2007-10-26 2008-03-19 浙江工业大学 多视觉传感器信息融合的内河船舶自动识别系统
CN107133616A (zh) * 2017-04-02 2017-09-05 南京汇川图像视觉技术有限公司 一种基于深度学习的无分割字符定位与识别方法
CN107679531A (zh) * 2017-06-23 2018-02-09 平安科技(深圳)有限公司 基于深度学习的车牌识别方法、装置、设备及存储介质
CN107563372A (zh) * 2017-07-20 2018-01-09 济南中维世纪科技有限公司 一种基于深度学习ssd框架的车牌定位方法
CN107491752A (zh) * 2017-08-14 2017-12-19 中国石油大学(华东) 一种基于深度学习的自然场景中船牌文字识别方法、装置
CN108154144A (zh) * 2018-01-12 2018-06-12 江苏省新通智能交通科技发展有限公司 一种基于图像的船名字符定位方法及系统
CN109993163A (zh) * 2019-03-19 2019-07-09 苏州大学 一种基于人工智能的非标铭牌识别系统及其识别方法
CN110210475A (zh) * 2019-05-06 2019-09-06 浙江大学 一种非二值化和边缘检测的车牌字符图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DCNN Based Real-Time Adaptive Ship License Plate Recognition (DRASLPR);Weishan Zhang 等;《IEEE》;20190603;第1829-1834页 *
基于图像分析和深度学习的船名标识字符检测与识别研究;刘宝龙;《中国博士学位论文全文数据库工程科技Ⅱ辑》;20190115;第2018年卷(第12期);第3、5章 *

Also Published As

Publication number Publication date
CN110766002A (zh) 2020-02-07

Similar Documents

Publication Publication Date Title
CN110766002B (zh) 一种基于深度学习的船名字符区域检测方法
CN110084292B (zh) 基于DenseNet和多尺度特征融合的目标检测方法
US11878433B2 (en) Method for detecting grasping position of robot in grasping object
CN108647585B (zh) 一种基于多尺度循环注意力网络的交通标识符检测方法
CN108665496B (zh) 一种基于深度学习的端到端的语义即时定位与建图方法
CN111583097A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN111257341B (zh) 基于多尺度特征与堆叠式全卷积网络的水下建筑物裂缝检测方法
CN110991435A (zh) 一种基于深度学习的快递运单关键信息定位方法和装置
CN112991447A (zh) 一种动态环境下视觉定位与静态地图构建方法及系统
CN106971185B (zh) 一种基于全卷积网络的车牌定位方法及装置
CN112949633B (zh) 一种基于改进YOLOv3的红外目标检测方法
CN113076871A (zh) 一种基于目标遮挡补偿的鱼群自动检测方法
CN112053441B (zh) 一种室内鱼眼图像的全自动布局恢复方法
CN111027538A (zh) 一种基于实例分割模型的集装箱检测方法
CN111553949A (zh) 基于单帧rgb-d图像深度学习对不规则工件的定位抓取方法
CN106845338B (zh) 视频流中行人检测方法与系统
CN114782770A (zh) 一种基于深度学习的车牌检测与车牌识别方法及系统
CN110310305A (zh) 一种基于bssd检测与卡尔曼滤波的目标跟踪方法与装置
CN112802197A (zh) 动态场景下基于全卷积神经网络的视觉slam方法及系统
CN111368637B (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
CN113537085A (zh) 基于两次迁移学习和数据增广的船舶目标检测方法
CN111626241A (zh) 一种人脸检测方法及装置
CN115272691A (zh) 一种钢筋绑扎状态检测模型的训练方法、识别方法及设备
CN109615610B (zh) 一种基于YOLO v2-tiny的医用创可贴瑕疵检测方法
CN113095316B (zh) 基于多级融合和角点偏移的图像旋转目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220322