CN109858327B - 一种基于深度学习的字符分割方法 - Google Patents

一种基于深度学习的字符分割方法 Download PDF

Info

Publication number
CN109858327B
CN109858327B CN201811523482.3A CN201811523482A CN109858327B CN 109858327 B CN109858327 B CN 109858327B CN 201811523482 A CN201811523482 A CN 201811523482A CN 109858327 B CN109858327 B CN 109858327B
Authority
CN
China
Prior art keywords
license plate
character
character position
neural network
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811523482.3A
Other languages
English (en)
Other versions
CN109858327A (zh
Inventor
张卡
刘跃
何佳
尼秀明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Qingxin Internet Information Technology Co ltd
Original Assignee
Anhui Qingxin Internet Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Qingxin Internet Information Technology Co ltd filed Critical Anhui Qingxin Internet Information Technology Co ltd
Priority to CN201811523482.3A priority Critical patent/CN109858327B/zh
Publication of CN109858327A publication Critical patent/CN109858327A/zh
Application granted granted Critical
Publication of CN109858327B publication Critical patent/CN109858327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的字符分割方法,属于图像处理技术领域,包括:基于LeNet‑5深度神经网络模型,构建待训练深度神经网络模型;收集车牌图像作为原始车牌图像,并标注出原始车牌图像的车牌字符位置矩形;在车牌字符位置矩形中随机选择车牌字符分割位置组合,获取至少一种字符位置组合;将原始车牌图像和字符位置组合输入到所述待训练深度神经网络模型中,训练得到字符分割深度神经网络模型;将任一幅待测车牌图像及其对应的部分车牌字符位置矩形输入至所述字符分割深度神经网络模型中,获取待测车牌图像完整的字符位置矩形。本发明对于低质量车牌图像的字符分割结果更加准确。

Description

一种基于深度学习的字符分割方法
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于深度学习的字符分割方法。
背景技术
车牌识别是智能交通的核心技术,包含了三个部分:车牌定位、字符分割、字符识别。其中,字符分割是指在一幅已知车牌准确位置的图像中,精确分割出每个单一字符,是整个技术最重要的一部分,字符分割的好坏直接影响后续的字符识别,进而影响整体的识别性能。
目前,车牌字符分割主要有以下几类方法:
(1)基于垂直投影的方法,该方法通过过去车牌字符的垂直投影曲线,依据曲线的波峰波谷位置,获取每个字符的边缘位置。该类方法的优点在于算法简单、速度快,对于清晰车牌图像的分割较佳。其缺点是对于一些污损、黏连、定位不够精确的低质量车牌的分割效果会明显下降,甚至失效。
(2)基于连通区域分析的方法,该方法首先进行车牌图像二值化,利用单个字符的都是单连通区域的特征分析方法,最终获取字符的位置,该方法的优点是对低图像质量的车牌适用性较好,但是对于缺失、黏连的字符分割却无能为为力。
(3)基于机器学习的方法,该方法通过获取车牌的布局规律特征,借助分类器进行训练学习,最终完成车牌字符的分割。其优点是对于清晰车牌图像,识别效果较佳,对于低质量图像也有一定的抵抗性,其缺点是合适的布局规律特征较难选取,部分变形车牌不满足布局规律,特征计算过程相对复杂。
在实际环境中,由于光线变化、拍摄角度、车牌无损等各种复杂场景的存在,会造成车牌字符的模糊、缺失、黏连等缺陷的出现。而上述车牌字符分割方法多适用清晰的车牌图像,对于具有车牌字符的模糊、缺失、黏连等缺陷的车牌图像,当前的方法很难进行精确的分割,最终造成车牌识别失败。如何对低质量车牌图像进行精确字符分割当前仍是限制车牌准确识别的一大难题。
发明内容
本发明的目的在于提供一种基于深度学习的字符分割方法,以对低质量车牌图像进行精确字符分割。
为实现以上目的,本发明采用一种基于深度学习的字符分割方法,包括:
基于LeNet-5深度神经网络模型,构建用于预测车牌字符位置矩形的深度神经网络模型;
收集车牌图像作为原始车牌图像,并标注出原始车牌图像的车牌字符位置矩形;
需要说明的是,本实施例中采用现有技术中常用的方法如基于haar特征的adaboost方法检测车牌字符位置矩形、基于连通区域分析的方法获取每个字符连通区域的位置矩形、基于深度学的方法(如SSD、faster rcnn)检测车牌字符位置矩形等对原始车牌图像进行处理,标注出原始车牌图像的车牌字符位置矩形,并进行人工审核,对于错误的字符位置矩形进行校正。
在所述车牌字符位置矩形中随机选择车牌字符分割位置组合,获取至少一种字符位置组合;
将原始车牌图像和字符位置组合输入到所述待训练深度神经网络模型中,训练得到字符分割深度神经网络模型;
将任一幅待测车牌图像及其对应的部分车牌字符位置矩形输入至所述字符分割深度神经网络模型中,获取待测车牌图像完整的字符位置矩形。
优选地,在所述标注出原始车牌图像的车牌字符位置矩形之后,还包括:
按照车牌字符的固定排列规则,扩展车牌字符位置矩形标注,以增加标注车牌字符位置矩形的数目。
优选地,在所述车牌字符位置矩形中随机选择车牌字符分割位置组合,获取至少一种字符位置组合,包括:
a、在所述车牌字符位置矩形中,随机选择m个车牌字符分割位置矩形作为一个m字符位置组合,m取值为5、6或7中的至少一个值;
b、计算所有可能的m字符位置组合的数量N;
c、随机打乱所述车牌字符位置矩形;
d、在打乱后的车牌字符位置矩形中选择前m个字符位置矩形作为本次随机选择的一个m字符位置组合;
e、重复执行步骤a~d,直至获取指定数目的m字符位置组合。
优选地,在所述计算所有可能的m字符位置组合的数量N之后,还包括:
判断所述所有可能的m字符位置组合的数量N是否大于设定数目T,T和N均为常数;
若是,则所述所有可能的m字符位置组合的数量为T;
若否,则所述所有可能的m字符位置组合的数量为N。
优选地,所述将原始车牌图像和字符位置组合输入到所述待训练深度神经网络模型中,训练得到字符分割深度神经网络模型,包括:
将所述m字符位置组合转化为与m字符位置组合对应的掩码图像,该掩码图像和所述原始车牌图像尺寸相同;
将掩码图像与所述原始车牌图像进行合并,得到合并后的图像;
将合并后的图像输入到相应的所述待训练深度神经网络模型中,训练得到相应的字符分割深度神经网络模型。
优选地,所述将合并后的图像输入到相应的所述待训练深度神经网络模型中,训练得到相应的字符分割深度神经网络模型,包括:
将利用5字符位置组合转化得到的掩码图像与原始车牌图像合并后的图像,输入到5字符位置组合对应的待训练深度神经网络模型中,训练得到5字符位置组合对应的字符分割深度神经网络模型;
将利用6字符位置组合转化得到的掩码图像与原始车牌图像合并后的图像,输入到6字符位置组合对应的待训练深度神经网络模型中,训练得到6字符位置组合对应的字符分割深度神经网络模型;
将利用7字符位置组合转化得到的掩码图像与原始车牌图像合并后的图像,输入到7字符位置组合对应的待训练深度神经网络模型中,训练得到7字符位置组合对应的字符分割深度神经网络模型。
优选地,所述将任一幅待测车牌图像及其对应的部分车牌字符位置矩形输入至所述字符分割深度神经网络模型中,获取待测车牌图像完整的车牌字符位置矩形,包括:
对于所述任一幅待测车牌图像,标注出待测车牌图像的车牌字符位置矩形;
在所述待测车牌图像的车牌字符位置矩形中随机选择车牌字符分割位置组合,获取待测车牌图像的至少一种字符位置组合;
将所述待测车牌图像和待测车牌图像的字符位置组合输入到所述相应的字符分割深度神经网络模型中,获取待测车牌图像每个字符可能分布位置矩形;
利用随机投票机制,对待测车牌图像每个字符可能分布位置矩形进行投票统计,得到待测车牌图像的字符位置矩形。
优选地,所述利用随机投票机制,对待测车牌图像每个字符可能分布位置矩形进行投票统计,得到待测车牌图像的字符位置矩形,包括:
利用随机投票机制,对所述待测车牌的每个字符位置矩形进行投票统计,确定待测车牌每个字符局部最优分割位置矩形;
将待测车牌所有字符的局部最优分割位置矩形,作为一个7字符位置组合送入所述7字符位置组合对应的字符分割深度神经网络模型中,得到待测车牌字符整体最优分割位置矩形。
优选地,所述利用随机投票机制,对所述待测车牌的每个字符位置矩形进行投票统计,确定待测车牌每个字符局部最优分割位置矩形,包括:
根据所述待测车牌图像每个字符的位置矩形,将可能处于同一位置的字符组成位置矩形集合;
设定该矩形集合中每个字符的投票数均是1,计算该矩形集合中任意两个位置矩形属于同一个位置矩形的概率P;
根据概率P判断该任意两个位置矩形是否属于同一个位置矩形;
若是,则将该任意两个位置矩形进行合并,并将该任意两个位置矩形的投票数之和作为合并后的位置矩形的投票数;
将投票数最多的位置矩形作为当前字符的局部最优分割位置矩形。
与现有技术相比,本发明存在以下技术效果:本发明首先利用现有技术对车牌图像进行处理,获取车牌字符初始分割位置矩形,通过深度学习技术预测车牌字符的各种可能分布位置,再利用随机投票机制获取统计意义上的最佳车牌字符分割位置。不仅能够以较小的运算代价精确分割车牌字符,而且对于污损、粘连、字符确实、定位不精确的低质量车牌图像字符分割位置更加准确,鲁棒性较强。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是字符分割深度神经网络模型训练流程图;
图2是利用字符分割深度神经网络模型进行车牌字符检测的流程示意图;
图3是用于预测车牌字符位置矩形的深度神经网络模型示意图;
图4是原始车牌图像和掩码图像。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图1至3所示,本实施例以常见的单层蓝色车牌为例对本方案进行具体说明,该车牌有7个字符,并且车牌字符之间存在规则的排列顺序。本方案进行车牌字符分割的过程包括模型训练和字符检测:
(1)模型训练,其用于训练深度神经网络模型,使得训练后的模型能够根据输入的部分车牌字符位置矩形预测完整的车牌字符位置矩形,本发明选择的深度神经网络是卷积神经网络,如图1所示,具体的训练步骤如下:
T1、构建待训练深度神经网络模型:基于LeNet-5深度神经网络模型,构建用于预测车牌字符位置矩形的深度神经网络模型。
由于本发明中深度神经网络模型的作用是,根据输入的部分车牌字符位置矩形预测完整的车牌字符位置矩形,该任务属于回归分析范畴,因此,综合考虑车牌字符分割任务的特殊性和深度神经网络模型的计算复杂性,本发明基于LeNet-5深度神经网络模型进行改进,改进后的深度神经网络模型如图3所示。图3中每个模块图形代表卷积神经网络模型中的一个特征层(layers),图形下方的标识含义:第一行(比如Input、Conv_1、MaxPool_1等)表示当前特征层的名称,第二行(比如128×64×4、124×60×32、31×20×32等)表示当前特征层的特征图尺寸,即:特征图高度×特征图宽度×特征图通道数,其中,FC层和Label层的图形下方标识表示单通道n维特征;每个箭头上方的标识表示相应运算的核尺寸,即核宽度×核高度,其中,标识K表示卷积核,P表示最大值池化操作的采样核尺寸。
T2、收集车牌图像:
主要收集各种场景、各种光线、各种角度下的车牌图像,作为原始车牌图像,以用于对步骤T1中构建的待训练深度神经网络模型进行训练。
T3、标注出原始车牌图像的车牌字符位置矩形:
需要说明的是,本实施例中采用现有技术中常用的方法如基于haar特征的adaboost方法检测车牌字符位置矩形、基于连通区域分析的方法获取每个字符连通区域的位置矩形、基于深度学的方法(如SSD、faster rcnn)检测车牌字符位置矩形等对原始车牌图像进行处理,得到车牌字符位置矩形。然后人工进行审核,对于错误的字符位置矩形进行校正,以确保标注的准确性,保证模型训练的准确性。
T4、扩展车牌字符位置矩形标注:
主要方法是按照车牌字符的固定排列规则,分别沿第一个字符位置矩形向左扩展N1个矩形位置,沿最后一个字符位置矩形向右扩展N2个矩形位置,使得最终的标注车牌字符位置矩形数目增加了N1+N2个,N1和N2均为常数。
需要说明的是,以常用的7字符车牌为例,由于在采用现有技术对原始图像进行字符分割时,可能会存在分割的字符位置矩形数目少于7个的情况,所以需要对车牌字符位置矩形进行扩展,使其更好的分割整个车牌位置,以便后续进行模型训练。
T5、选择随机车牌字符分割位置矩形组合:
随机选择5个车牌字符分割位置矩形作为一个5字符位置组合,同理,随机选择6个车牌字符分割位置矩形作为一个6字符位置组合,随机选择7个车牌字符分割位置矩形作为一个7字符位置组合。
T6、对待训练深度神经网络模型进行训练:
对于5字符位置组合、6字符位置组合、7字符位置组合,按照步骤T1中定义的深度神经网络模型结构,分别训练相应的深度神经网络模型,其中,5字符位置组合对应的深度神经网络模型是MODEL-5,6字符位置组合对应的深度神经网络模型是MODEL-6,7字符位置组合对应的深度神经网络模型是MODEL-7。
具体地,待训练深度神经网络模型的输入图像由两部分合并而成,第一部分就是原始车牌图像,第二部分是车牌字符分割位置矩形组合,考虑深度神经网络模型的效率,输入的车牌字符位置矩形组合转化为和原始车牌图像尺寸相同的掩码图像。
其掩码图像生成方法是首先创建一幅和原始车牌图像尺寸相同的所有像素灰度值为0的单通道图像M,然后对于不同的已知车牌字符位置矩形,使用随机选择的不同灰度值在单通道图像M上画出相应的位置矩形。具体如图4所示,图4-(a)表示原始车牌图像,矩形框表示相应的车牌字符位置矩形,图4-(b)和图4-(c)表示5字符位置组合对应的掩码图像,图4-(d)和4-图(e)表示6字符位置组合对应的掩码图像,图4-(f)表示7字符位置组合对应的掩码图像,需要说明的是,图4中显示的各种掩码图像只是随机选择的所有掩码图像中的一部分。
掩码图像和原始图像合并的方法采用图像通道拼接方法,例如原始图像是一幅宽度为W高度为H的3通道图像,掩码图像是一幅宽度为W高度为H的单通道图像,其合并后的图像是一幅宽度为W高度为H的4通道图像。深度神经网络模型的输出是一个56维的向量,表示7个车牌字符位置矩形,每个车牌字符位置矩形由矩形的4个角点表示,每个角点由x坐标、y坐标表示。
(2)字符检测:其用于对于任意一幅车牌图像,根据已获取的部分车牌字符位置矩形,通过深度神经网络模型预测完整的车牌字符位置矩形,如图2所示,具体的检测步骤如下:
S1、获取车牌字符的初始分割位置矩形:
主要方法是采用目前常用的技术方法,如基于haar特征的adaboost方法检测车牌字符位置矩形、基于连通区域分析的方法获取每个字符联通区域的位置矩形、基于深度学习的方法(如SSD,faster rcnn)检测车牌字符位置矩形,由于采用的是常用技术,不再详细叙述。
S2、选择随机车牌字符分割位置组合,主要方法是在步骤S1的基础上,随机选择5个车牌字符分割位置矩形作为一个5字符位置组合,同理,随机选择6个车牌字符分割位置矩形作为一个6字符位置组合,随机选择7个车牌字符分割位置矩形作为一个7字符位置组合。以选择5字符位置组合为例,具体方法如下:
S21、获取5字符位置组合的数目,首先按照公式(1)计算所有可能的5字符位置组合的数目N,如果该数目大于T,那么最后的5字符位置组合的数目就是T,公式(1)如下:
N=n×(n-1)×(n-2)...×(n-m+1),
其中,N表示所有可能的字符位置组合数目,n表示车牌字符的初始分割位置矩形数目,m表示一个字符位置组合里包含的车牌字符位置矩形数目。
需要说明的是,N和T均为常数,T为本领域技术人员经过大量实验得出的一个用于与字符位置组合数目进行比较的数值。
S22、随机打乱车牌字符的初始分割位置矩形;
S23、选择前5个字符位置矩形作为本次随机选择的一个5字符位置组合;
S24、重复步骤S21-S23,直到获取指定数目的5字符位置组合。
需要说明的是,该处所述指定数目为本领域人员经过大量实验得出的能够预测车牌字符完整分割位置矩形的字符位置组合数值的最小值,以便在准确预测车牌字符完整分割位置矩形前提下,提高预测效率。
S3、预测车牌字符完整分割位置矩形:
首先根据步骤S2中获取的每一种字符位置组合,生成和原始车牌图像尺寸相同的掩码图像,然后把原始车牌图像和掩码图像进行合并,最后把合并后的图像送入相应的深度神经网络模型,输出对应的车牌字符完整分割位置矩形,其图像合并方法和步骤T1相同,其中,相应的深度神经网络模型的定义和步骤T6相同。
S4、获取车牌字符局部最优分割位置矩形:
由于步骤S3得到的是待测车牌字符的各种可能的分割位置矩形,需要对这些可能的分割位置矩形进行投票统计,获取每一个车牌字符的局部最优分割位置矩形,具体方法如下:
S41、获取待测车牌每一个字符位置矩形的投票统计,以车牌分割第一个字符位置矩形为例,主要方法是首先获取步骤S3中所有的车牌字符完整分割位置矩形的第一个字符位置矩形,形成第一字符位置矩形集合,该集合里的每一个位置矩形的投票数均是1,然后按照公式(2)、公式(3),计算该集合里任意两个位置矩形属于同一个位置矩形的概率p,如果概率p大于0.7,则说明这两个位置矩形属于同一个位置矩形,按照公式(4),进行位置矩形合并,同时该合并后的位置矩形的投票数等于被合并的两个位置矩形的投票数之和。
其中,公式(2)如下:
Figure BDA0001903781710000101
公式(3)如下:
Figure BDA0001903781710000102
公式(4)如下:
Figure BDA0001903781710000103
其中,p表示任意两个位置矩形属于同一个位置矩形的概率,max{}表示获取两个元素的最大值,min{}表示获取两个元素的最小值,crossrect.x0、crossrect.y0、crossrect.x1、crossrect.y1、crossrect.w、crossrect.h分别表示矩形crossrect的左上角x坐标、左上角y坐标、右下角x坐标、右下角y坐标、矩形宽度、矩形高度,combrect.x0、combrect.y0、combrect.x1、combrect.y1、combrect.w、combrect.h分别表示矩形combrect的左上角x坐标、左上角y坐标、右下角x坐标、右下角y坐标、矩形宽度、矩形高度,t1.x0、t1.y0、t1.x1、t1.y1、t1.w、t1.h分别表示矩形t1的左上角x坐标、左上角y坐标、右下角x坐标、右下角y坐标、矩形宽度、矩形高度,t2.x0、t2.y0、t2.x1、t2.y1、t2.w、t2.h分别表示矩形t2的左上角x坐标、左上角y坐标、右下角x坐标、右下角y坐标、矩形宽度、矩形高度。
S42、选择车牌每一个字符位置的局部最优位置矩形,主要是在步骤S41获取的每一个字符位置矩形的投票统计中,选择最多投票数的位置矩形作为当前字符的局部最优位置矩形。
S5、获取车牌字符整体最优分割位置矩形,主要方法是把步骤S4中获取的所有车牌字符局部最优分割位置矩形,作为一个7字符位置组合送入相应的深度神经网络模型,输出的车牌字符分割位置矩形就是车牌字符整体最优分割位置矩形,这里使用的深度学习网络模型和步骤S3里的7字符位置组合深度学习网络模型相同。
需要说明的是,深度学习技术凭借可以模拟人类大脑神经网络,进行精确的非线性预测,在各个领域都得到了广泛的应用,但是,该技术的缺点在于模型消耗内存和运算量都很大。本实施例考虑到神经网络模型的运行效率,将掩码图像和原始车牌图像合并后作为预先构建的深度神经网络模型的输入,利用深度神经网络模型预测出车牌字符各种可能的分布位置,通过随机投票机制对各种可能的分布位置进行投票,获取统计意义上的最佳车牌字符分割位置,实现了以较小的运算代价精确的分割车牌字符,对污损、粘连、字符确实等低质量车牌图像的字符分割结果也更加准确。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于深度学习的字符分割方法,其特征在于,包括:
基于LeNet-5深度神经网络模型,构建待训练深度神经网络模型;
收集车牌图像作为原始车牌图像,并标注出原始车牌图像的车牌字符位置矩形;
在所述车牌字符位置矩形中随机选择车牌字符分割位置进行组合,获取至少一种字符位置组合;
将原始车牌图像和字符位置组合输入到所述待训练深度神经网络模型中,训练得到字符分割深度神经网络模型;
将任一幅待测车牌图像及其对应的部分车牌字符位置矩形输入至所述字符分割深度神经网络模型中,获取待测车牌图像完整的字符位置矩形;
所述在所述车牌字符位置矩形中随机选择车牌字符分割位置进行组合,获取至少一种字符位置组合,包括:
a、在所述车牌字符位置矩形中,随机选择m个车牌字符分割位置矩形作为一个m字符位置组合,m取值为5、6或7中的至少一个值;
b、计算所有可能的m字符位置组合的数量N;
c、随机打乱所述车牌字符位置矩形;
d、在打乱后的车牌字符位置矩形中选择前m个字符位置矩形作为本次随机选择的一个m字符位置组合;
e、重复执行步骤a~d,直至获取指定数目的m字符位置组合;
在所述计算所有可能的m字符位置组合的数量N之后,还包括:
判断所述所有可能的m字符位置组合的数量N是否大于设定数目T,T和N均为常数;
若是,则所述所有可能的m字符位置组合的数量为T;
若否,则所述所有可能的m字符位置组合的数量为N;
所述将原始车牌图像和字符位置组合输入到所述待训练深度神经网络模型中,训练得到字符分割深度神经网络模型包括:
将所述m字符位置组合转化为与m字符位置组合对应的掩码图像,该掩码图像和所述原始车牌图像尺寸相同;
将掩码图像与所述原始车牌图像进行合并,得到合并后的图像;
将合并后的图像输入到相应的所述待训练深度神经网络模型中,训练得到相应的字符分割深度神经网络模型。
2.如权利要求1所述的基于深度学习的字符分割方法,其特征在于,在所述标注出原始车牌图像的车牌字符位置矩形之后,还包括:
按照车牌字符的固定排列规则,扩展车牌字符位置矩形标注,以增加标注车牌字符位置矩形的数目。
3.如权利要求1所述的基于深度学习的字符分割方法,其特征在于,所述将合并后的图像输入到相应的所述待训练深度神经网络模型中,训练得到相应的字符分割深度神经网络模型,包括:
将利用5字符位置组合转化得到的掩码图像与原始车牌图像合并后的图像,输入到5字符位置组合对应的待训练深度神经网络模型中,训练得到5字符位置组合对应的字符分割深度神经网络模型;
将利用6字符位置组合转化得到的掩码图像与原始车牌图像合并后的图像,输入到6字符位置组合对应的待训练深度神经网络模型中,训练得到6字符位置组合对应的字符分割深度神经网络模型;
将利用7字符位置组合转化得到的掩码图像与原始车牌图像合并后的图像,输入到7字符位置组合对应的待训练深度神经网络模型中,训练得到7字符位置组合对应的字符分割深度神经网络模型。
4.如权利要求3所述的基于深度学习的字符分割方法,其特征在于,所述将任一幅待测车牌图像及其对应的部分车牌字符位置矩形输入至所述字符分割深度神经网络模型中,获取待测车牌图像完整的车牌字符位置矩形,包括:
对于所述任一幅待测车牌图像,标注出待测车牌图像的车牌字符位置矩形;
在所述待测车牌图像的车牌字符位置矩形中随机选择车牌字符分割位置进行组合,获取待测车牌图像的至少一种字符位置组合;
将所述待测车牌图像和待测车牌图像的字符位置组合输入到所述相应的字符分割深度神经网络模型中,获取待测车牌图像每个字符可能分布位置矩形;
利用随机投票机制,对待测车牌图像每个字符可能分布位置矩形进行投票统计,得到待测车牌图像的字符位置矩形。
5.如权利要求4所述的基于深度学习的字符分割方法,其特征在于,所述利用随机投票机制,对待测车牌图像每个字符可能分布位置矩形进行投票统计,得到待测车牌图像的字符位置矩形,包括:
利用随机投票机制,对所述待测车牌的每个字符位置矩形进行投票统计,确定待测车牌每个字符局部最优分割位置矩形;
将待测车牌所有字符的局部最优分割位置矩形,作为一个7字符位置组合送入所述7字符位置组合对应的字符分割深度神经网络模型中,得到待测车牌字符整体最优分割位置矩形。
6.如权利要求5所述的基于深度学习的字符分割方法,其特征在于,所述利用随机投票机制,对所述待测车牌的每个字符位置矩形进行投票统计,确定待测车牌每个字符局部最优分割位置矩形,包括:
根据所述待测车牌图像每个字符的位置矩形,将可能处于同一位置的字符组成位置矩形集合;
设定该矩形集合中每个字符的投票数均是1,计算该矩形集合中任意两个位置矩形属于同一个位置矩形的概率P;
根据概率P判断该任意两个位置矩形是否属于同一个位置矩形;
若是,则将该任意两个位置矩形进行合并,并将该任意两个位置矩形的投票数之和作为合并后的位置矩形的投票数;
将投票数最多的位置矩形作为当前字符的局部最优分割位置矩形。
CN201811523482.3A 2018-12-13 2018-12-13 一种基于深度学习的字符分割方法 Active CN109858327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811523482.3A CN109858327B (zh) 2018-12-13 2018-12-13 一种基于深度学习的字符分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811523482.3A CN109858327B (zh) 2018-12-13 2018-12-13 一种基于深度学习的字符分割方法

Publications (2)

Publication Number Publication Date
CN109858327A CN109858327A (zh) 2019-06-07
CN109858327B true CN109858327B (zh) 2023-06-09

Family

ID=66890996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811523482.3A Active CN109858327B (zh) 2018-12-13 2018-12-13 一种基于深度学习的字符分割方法

Country Status (1)

Country Link
CN (1) CN109858327B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502990B (zh) * 2019-07-17 2022-06-03 上海展湾信息科技有限公司 利用图像处理进行数据采集的方法及系统
CN111179253B (zh) 2019-12-30 2023-11-24 歌尔股份有限公司 一种产品缺陷检测方法、装置与系统
CN113326836B (zh) * 2020-02-28 2024-06-14 深圳市丰驰顺行信息技术有限公司 车牌识别方法、装置、服务器及存储介质
CN111881914B (zh) * 2020-06-23 2024-02-13 安徽清新互联信息科技有限公司 一种基于自学习阈值的车牌字符分割方法及系统
US11915499B1 (en) * 2023-08-30 2024-02-27 Hayden Ai Technologies, Inc. Systems and methods for automated license plate recognition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260735A (zh) * 2015-10-10 2016-01-20 安徽清新互联信息科技有限公司 一种基于典型位置的车牌字符分割方法
WO2018028230A1 (zh) * 2016-08-10 2018-02-15 东方网力科技股份有限公司 一种基于深度学习的车牌字符分割方法、装置及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260735A (zh) * 2015-10-10 2016-01-20 安徽清新互联信息科技有限公司 一种基于典型位置的车牌字符分割方法
WO2018028230A1 (zh) * 2016-08-10 2018-02-15 东方网力科技股份有限公司 一种基于深度学习的车牌字符分割方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于卷积神经网络的车牌识别技术;刘建国等;《物流技术》;20181025(第10期);全文 *
基于深度学习的车牌字符识别的设计与实现;肖秀春等;《电子技术与软件工程》;20180824(第16期);全文 *

Also Published As

Publication number Publication date
CN109858327A (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
CN109858327B (zh) 一种基于深度学习的字符分割方法
CN110287960B (zh) 自然场景图像中曲线文字的检测识别方法
CN106845487B (zh) 一种端到端的车牌识别方法
CN109978893B (zh) 图像语义分割网络的训练方法、装置、设备及存储介质
CN108038474B (zh) 人脸检测方法、卷积神经网络参数的训练方法、装置及介质
CN108009543B (zh) 一种车牌识别方法及装置
CN107563372B (zh) 一种基于深度学习ssd框架的车牌定位方法
CN106960195B (zh) 一种基于深度学习的人群计数方法及装置
CN110738125B (zh) 利用Mask R-CNN选择检测框的方法、装置及存储介质
WO2018108129A1 (zh) 用于识别物体类别的方法及装置、电子设备
CN108256431B (zh) 一种手部位置标识方法及装置
CN110599537A (zh) 基于Mask R-CNN的无人机图像建筑物面积计算方法及系统
CN107423760A (zh) 基于预分割和回归的深度学习目标检测方法
CN107784288B (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN108334881B (zh) 一种基于深度学习的车牌识别方法
CN110569738B (zh) 基于密集连接网络的自然场景文本检测方法、设备和介质
CN109583483A (zh) 一种基于卷积神经网络的目标检测方法和系统
CN112508975A (zh) 一种图像识别方法、装置、设备及存储介质
US20190279368A1 (en) Method and Apparatus for Multi-Model Primitive Fitting based on Deep Geometric Boundary and Instance Aware Segmentation
CN113343985B (zh) 车牌识别方法和装置
CN112232371A (zh) 一种基于YOLOv3与文本识别的美式车牌识别方法
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN112446356B (zh) 基于多重极坐标的自然场景下任意形状文本的检测方法
CN114038004A (zh) 一种证件信息提取方法、装置、设备及存储介质
CN111008576A (zh) 行人检测及其模型训练、更新方法、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant