CN114973225A - 号牌识别方法、装置及设备 - Google Patents

号牌识别方法、装置及设备 Download PDF

Info

Publication number
CN114973225A
CN114973225A CN202210493635.4A CN202210493635A CN114973225A CN 114973225 A CN114973225 A CN 114973225A CN 202210493635 A CN202210493635 A CN 202210493635A CN 114973225 A CN114973225 A CN 114973225A
Authority
CN
China
Prior art keywords
detection area
number plate
preset
evidence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210493635.4A
Other languages
English (en)
Other versions
CN114973225B (zh
Inventor
蔡茂贞
李小青
丁小波
黎蕴玉
彭琨
钟地秀
黄珊珊
赖俊滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Internet Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Internet Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Internet Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202210493635.4A priority Critical patent/CN114973225B/zh
Publication of CN114973225A publication Critical patent/CN114973225A/zh
Application granted granted Critical
Publication of CN114973225B publication Critical patent/CN114973225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种号牌识别方法、装置及设备,并具体公开了:基于预设的检测网络,从待检测图像中确定检测区域、检测区域中含有号牌的证据因子,以及检测区域中含有的号牌在预设方向上的证据因子;检测区域为号牌外接的最小区域;当检测区域中含有号牌的证据因子满足第一预设条件时,将检测区域确定为候选检测区域;当候选检测区域中含有的号牌在预设方向上的证据因子满足第二预设条件时,将预设方向确定为目标方向;根据目标方向对候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对目标检测区域进行号牌识别。

Description

号牌识别方法、装置及设备
技术领域
本发明涉及图像识别技术领域,尤其涉及一种号牌识别方法、装置及设备。
背景技术
目前,对于马拉松赛事举办方而言,如何对赛事期间为运动员们拍摄的照片进行精准分类、推送和管理是一项具有挑战性的赛事服务工作。相比于效率低、耗时长和成本高的传统人工分类方式,基于运动员号牌的智能识别成了实现海量马拉松赛事图片精确分类的重要方法。
然而,在使用传统的图像识别技术对照片中的号牌进行识别时,常常因为号牌变形、号牌方向错乱等原因造成识别效果差,无法快速、准确地进行号牌识别。
发明内容
本发明实施例提供一种号牌识别方法、装置及设备,以解决相关技术中因号牌变形、号牌方向错乱等原因造成的号牌识别效果差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,提供了一种号牌识别方法,所述方法包括:
基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在预设方向上的证据因子;所述检测区域为所述号牌外接的最小区域;
当所述检测区域中含有号牌的证据因子满足第一预设条件时,将所述检测区域确定为候选检测区域;
当所述候选检测区域中含有的号牌在所述预设方向上的证据因子满足第二预设条件时,将所述预设方向确定为目标方向;
根据所述目标方向对所述候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对所述目标检测区域进行号牌识别。
第二方面,提供了一种号牌识别装置,所述装置包括:
第一确定模块,用于基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在预设方向上的证据因子;所述检测区域为所述号牌外接的最小区域;
第二确定模块,用于当所述检测区域中含有号牌的证据因子满足第一预设条件时,将所述检测区域确定为候选检测区域;
第三确定模块,用于当所述候选检测区域中含有的号牌在所述预设方向上的证据因子满足第二预设条件时,将所述预设方向确定为目标方向;
识别模块,用于根据所述目标方向对所述候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对所述目标检测区域进行号牌识别。
第三方面,提供了一种号牌识别设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述第一方面所述的方法的步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法的步骤。
本发明实施例提供的上述至少一个技术方案可以达到如下技术效果:
在本发明实施例中,可以先确定待检测图像中的检测区域,并通过检测区域含有号牌的证据因子来确定包含号牌的检测区域,然后,通过号牌在预设方向上的证据因子来确定号码对应的概率较高的方向,并根据该方向来对待检测区域进行旋转,以尽可能地将图像中的号牌调整至水平方向,从而使得预设的号牌识别模型能在一定程度上输出准确的号牌识别结果。
由上述内容可知,本发明实施例可以先从待检测图像中锁定含有号牌的检测区域,然后,确定检测区域对应的概率较高的方向,并对检测区域进行对应的旋转调整,从而在一定程度上提升号牌识别的准确率,有效解决相关技术中因号牌变形、号牌方向错乱等原因造成的号牌识别效果差的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一个实施例提供的号牌识别方法的流程示意图之一;
图2为本发明一个实施例提供的检测网络的结构示意图;
图3为本发明一个实施例提供的候选检测区域的处理流程示意图;
图4为本发明一个实施例提供的号牌识别方法的流程示意图之二;
图5为本发明一个实施例提供的号牌识别装置500的模块组成示意图;
图6为本发明一个实施例提供的号牌识别设备的硬件结构示意图。
具体实施方式
为使本发明的目的端、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合附图,详细说明本发明各实施例提供的技术方案。
请参见图1,图1为本发明一个实施例提供的号牌识别方法的流程示意图之一,如图1所示,该方法包括以下步骤:
步骤102:基于预设的检测网络,从待检测图像中确定检测区域、检测区域中含有号牌的证据因子,以及检测区域中含有的号牌在预设方向上的证据因子;检测区域为号牌外接的最小区域。
步骤104:当检测区域中含有号牌的证据因子满足第一预设条件时,将检测区域确定为候选检测区域。
步骤106:当候选检测区域中含有的号牌在预设方向上的证据因子满足第二预设条件时,将预设方向确定为目标方向。
步骤108:根据目标方向对候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对目标检测区域进行号牌识别。
在本发明实施例中,可以预设检测网络,并基于预设的检测网络来从待检测网络中确定检测区域、检测区域中含有号牌的证据因子,以及检测区域中含有的号牌在预设方向上的证据因子。
其中,检测区域可以为号牌外接的最小区域。在一个示例中,检测区域可以由号牌外接最小矩形框的坐标、预设的最小矩形框的长度和宽度来确定。
在一个发明实施例中,检测网络的主干网络可以为ResNet50,可以利用特征金字塔进行多尺度特征提取。
检测网络可以包括多个特征提取层,而每个特征提取层可以包括三个特征提取子层,这三个特征提取子层可以分别从输入该检测网络的图像中提取表征检测区域的第一特征、表征检测区域是否含有号牌的第二特征,以及表征检测区域中的号牌字符相对于水平方向的旋转角度的第三特征。
如图2所示,为本发明一个实施例提供的检测网络的结构示意图。由图2可知,检测网络可以包括多个特征提取层,每个特征提取层可以对接三个分支:框分支、号牌类别分支以及方向分支。其中,框分支可以提取号牌外接最小矩形框坐标,以基于最小矩形框坐标以及预设的最小矩形框的长度和宽度来确定号牌外接的最小区域,即检测区域;号牌类别分支可以提取表征检测区域是否含有号牌的特征,以确定检测区域是否含有号牌;而方向分支则可以提取表征号牌文字相对水平方向的旋转角度,如0°、90°、180°和270°的特征,以确定检测区域含有的号牌的字符相对于水平方向的旋转角度。
在本发明实施例中,每个特征提取层可以对应多个锚点,以提取不同尺度的特征。
上述三个特征提取子层在提取了对应的特征后,可以采用不同的损失函数来对提取的特征进行处理。
在一个示例中,提取第一特征的特征提取子层,对应于图2中的框分支,采用的损失函数可以为回归损失函数;而提取第二特征和第三特征的特征提取子层,对应于图2中的类别分支和方向分支,采用的损失函数可以为含有证据因子的分类损失函数。
在本示例中,含有证据因子e的分类损失函数Le(y,e)可以如下所示:
Figure BDA0003632803010000051
其中,提取第二特征和第三特征的特征提取子层为基于证据的k类的分类神经网络层;检测区域x的标签(即是否含有号牌)为y;e=g(f(x))为证据因子;f(x)为检测网络输出的分类证据;g为令证据因子为非负的激活函数(如softplus、ReLU等);
Figure BDA0003632803010000052
为狄利克雷总强度。
结合图2可知,若预设方向为0°、90°、180°和270°,则检测网络的输出层可以有三部分,分别为:1.框预测:输出4通道,分别表示检测框的中心点x坐标,中心点y坐标,检测矩形框长和检测矩形框宽。2.类预测:输出1通道,为检测框中含有号牌的证据因子。3.方向预测:输出4通道,可以分别为检测框4个方向(0°、90°、180°和270°)的证据因子。
在本发明实施例中,在基于预设的检测网络,从待检测图像中确定检测区域、检测区域中含有号牌的证据因子,以及检测区域中含有的号牌在各预设方向上的证据因子之前,还可以先对检测网络进行训练。
在对检测网络进行训练时,可以获取候选训练样本,并根据深度证据学习算法对候选训练样本进行不确定性识别,将不确定性高于预设不确定性阈值(预先设定的阈值)的训练样本确定为负样本,以及将不确定性不高于预设不确定性阈值的训练样本确定为正样本,然后,可以根据正样本和负样本,对检测网络进行训练,得到训练后的检测网络。此时,可以基于训练后的检测网络,从待检测图像中确定检测区域、检测区域中含有号牌的证据因子,以及检测区域中含有的号牌在各预设方向上的证据因子。
在实际应用中,会产生大量的未见过的负样本,为了让检测网络能更好地拒绝未见过的负样本,提升检测精度,本发明实施例采用深度证据学习策略,利用分类不确定性的不确定性估计作为打分函数来区分正负样本,如果对样本识别的不确定性很大,则认为它属于负样本,需要被拒绝,否则被识别为已有定义类别的正样本。深度证据学习使用深度神经网络直接学习狄利克雷后验分布,在K类的分类模型中,通过对证据因子e的预测,既可以得到分类概率,还可以计算分类的不确定性。
在本发明实施例中,对于输入的检测区域x*,分类分支输出证据因子e,输出类别为y*=argmax(ek),分类概率期望为p*=(ek+1)/S,分类的不确定性为u=K/S。如果不确定性很高,图片可以被拒绝分类,作为负样本输出,而如果不确定性很低,则接受y*的分类结果。
在本发明实施例中,在基于预设的检测网络确定待检测图像中的检测区域、检测区域中含有号牌的证据因子,以及检测区域中含有的号牌在预设方向上的证据因子后,可以将含有号牌的证据因子满足第一预设条件的检测区域,确定为候选检测区域。
其中,第一预设条件可以为检测区域中含有号牌的证据因子经深度证据学习算法计算得到的分类概率期望大于第一阈值,且检测区域中含有号牌的证据因子经深度证据学习算法计算得到的不确定性小于第二阈值。
在本发明实施例中,在确定检测区域中含有号牌的证据因子后,可以经过任意非极大值抑制算法,来确定大概率含有号牌的检测区域,得到候选检测区域集。由上述内容可知,候选检测区域集中的每个候选检测区域可以有对应的类别证据因子(即是否有号码)和方向证据因子。
然后,可以根据候选检测区域的类别证据因子e计算可得输出类别为
Figure BDA0003632803010000071
对应的分类概率期望为
Figure BDA0003632803010000072
分类的不确定性为u=K/S。当候选检测区域集1中的候选检测区域1的号牌类别分类概率期望p大于阈值t1且不确定性u小于阈值t2时,则接受号牌类别y的分类结果,将其加入到候选检测区域集2,否则认为该区域为非号牌区域进行剔除,遍历候选检测区域集1后获得候选检测区域集2。经过筛选,候选检测区域集2均为含号牌的候选检测区域,此时,根据候选检测区域集2中的候选检测区域对原图进行裁剪获得号牌区域图集1。
在本发明实施例中,当候选检测区域中含有的号牌在预设方向上的证据因子满足第二预设条件时,可以将该预设方向确定为目标方向。
在本发明实施例中,根据候选检测区域的方向证据因子e计算可得输出类别为
Figure BDA0003632803010000081
对应的分类概率期望为
Figure BDA0003632803010000082
分类的不确定性为u=K/S。对号牌区域图集1进行方向调整的流程则为:遍历号牌区域图集1中的号牌区域图,当其对应的方向分类概率期望p大于阈值t3且不确定性u小于阈值t4时,则认为方向类别y指示的方向为正确,将号牌区域图进行预测方向的旋转后加入号牌区域图集2。当对应的方向分类概率期望p大于阈值t3但不确定性u大于阈值t4时,将号牌区域图和按预测方向旋转后的号牌区域图均加入到号牌区域图集2中,作为后续号牌识别模型的输入,利用重复识别号牌区域图以减少方向预测导致的识别误差。
如图3所示,为本发明一个实施例提供的候选检测区域的处理流程示意图。由图3可知,当检测区域集1中的检测区域中含有号牌的证据因子经深度证据学习算法计算得到的分类概率期望大于第一阈值(t1),且检测区域中含有号牌的证据因子经深度证据学习算法计算得到的不确定性小于第二阈值(t2)时,将检测区域确定为候选检测区域,并组成检测区域集2。然后,根据检测区域集2中的检测区域对待检测图像进行裁剪,生成号牌区域图集1,然后,将号牌区域图集1中的号牌在预设方向上的证据因子经深度证据学习算法计算得到的分类概率期望大于第三阈值,且在预设方向上的证据因子经深度证据学习算法计算得到的不确定性小于第四阈值时,确定目标方向,并按照目标方向进行旋转,得到方向正确的号牌区域图集2。
在本发明实施例中,由于文字的类别、字体、颜色和方向都具有多样性,要训练精度高的文字识别模型需要大量的训练数据和巨大的算力资源,现阶段的多方向文字识别方法基本使用文字方向检测和水平方向文字识别模型相结合的策略。因此,在根据预设的号牌识别模型对所述目标检测区域进行号牌识别之前,还可以基于迁移学习技术,对采集到的训练样本进行预处理;其中,预处理可以至少包括以下之一:平移、剪裁、添加噪声。然后,可以对预处理后的训练样本进行预设角度范围内的方向偏移处理,得到目标训练样本,并根据目标训练样本对预设的号牌识别模型进行训练,得到训练后的号码识别模型。当根据预设的号牌识别模型对目标检测区域进行号牌识别时,可以根据训练后的号码识别模型对目标检测区域进行号牌识别。
由于在生成训练样本时,会生成方向偏移的文字样本,偏移的角度为0度至90度之间,因此,可以增强号码识别模型的鲁棒性,可识别微变形和方向偏移的文字内容。
现有深度学习号牌识别模型主要基于卷积神经网络(RNN),该结构每一步计算都依赖于对前一步的计算和输出结果,造成较高的计算复杂度。为加快推理速度和提高号牌识别准确率,本说明书实施例中的号牌识别模型采用DenseNet为主干网络,利用CTC作为损失函数来实现非定长序列的端到端号牌识别。
在本说明书实施例中,在根据预设的号牌识别模型对所述目标检测区域进行号牌识别时,可以通过预先构建的BK树(Burkhard-Keller树)对目标检测区域进行重复号牌区域过滤,然后对过滤后的目标检测区域进行号牌识别。
号牌识别的结果中会存在个别字符误识别以及错误识别干扰信息的情况,因此该部分引入BK树,根据编辑距离执行拼写检查和近似字符串匹配,提高识别精度。在方向调整时产生的重复号牌区域识别结果也可通过BK树进行过滤。BK树由节点和边组成,其中节点为号牌值,边为连接节点代表的号牌值间的编辑距离。首先对举办方输入的号牌值构建BK树,然后将号牌识别模型识别的号牌值逐个输入BK树,BK树返回的最小容差距离的查询结果,用该结果作为最终识别的号牌值,实现号牌值的自动校正功能。
在本发明实施例中,在实现对号牌的识别后,可以对号码进行聚类,并建立对应的索引,该部分将建立两个索引表,以供后续的应用和管理使用。一是构建【图片-号牌值列表】索引表,建立每张图片和图片中识别的号牌值的联系。二是构建【号牌值-图片名列表】的索引表,将识别出的号牌值作为唯一索引,进行图片聚类,返回含有同一号牌值的图片列表。
请参见图4,为本发明一个实施例提供的号牌识别方法的流程示意图之二,如图4所示,本发明实施例可以包括终端和服务器两部分,在终端上传了图片后,服务器可以在图像自带角度的情况下对图像进行旋转,然后,进行号牌检测、号牌所在的检测区域的确定和方向的调整,然后对调整方向后的号牌进行识别,并构建BK树过滤重复号牌区域,并进行号牌聚类和建立索引,以实现精准分类、查询以及推送等。
在本发明实施例中,可以先确定待检测图像中的检测区域,并通过检测区域含有号牌的证据因子来确定包含号牌的检测区域,然后,通过号牌在预设方向上的证据因子来确定号码对应的概率较高的方向,并根据该方向来对待检测区域进行旋转,以尽可能地将图像中的号牌调整至水平方向,从而使得预设的号牌识别模型能在一定程度上输出准确的号牌识别结果。
由上述内容可知,本发明实施例可以先从待检测图像中锁定含有号牌的检测区域,然后,确定检测区域对应的概率较高的方向,并对检测区域进行对应的旋转调整,从而在一定程度上提升号牌识别的准确率,有效解决相关技术中因号牌变形、号牌方向错乱等原因造成的号牌识别效果差的问题。
对应上述号牌识别方法,本发明实施例还提供了一种号牌识别装置,图5为本发明实施例提供的号牌识别装置500的模块组成示意图,如图5所示,该号牌识别装置500包括:
第一确定模块501,用于基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在预设方向上的证据因子;所述检测区域为所述号牌外接的最小区域;
第二确定模块502,用于当所述检测区域中含有号牌的证据因子满足第一预设条件时,将所述检测区域确定为候选检测区域;
第三确定模块503,用于当所述候选检测区域中含有的号牌在所述预设方向上的证据因子满足第二预设条件时,将所述预设方向确定为目标方向;
识别模块504,用于根据所述目标方向对所述候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对所述目标检测区域进行号牌识别。
可选的,所述检测网络的主干网络为ResNet50;所述检测网络包括多个特征提取层;每个特征提取层包括三个特征提取子层,所述三个特征提取子层分别从输入所述检测网络的图像中提取表征所述检测区域的第一特征、表征所述检测区域是否含有号牌的第二特征,以及表征所述检测区域中的号牌字符相对于水平方向的旋转角度的第三特征;
其中,所述提取第一特征的特征提取子层采用的损失函数为回归损失函数;所述提取第二特征的特征提取子层以及所述提取第三特征的特征提取子层采用的损失函数为含有证据因子的分类损失函数。
可选的,所述装置还包括:
获取模块505,用于在所述基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在各预设方向上的证据因子之前,获取候选训练样本,并根据深度证据学习算法对所述候选训练样本进行不确定性识别,将不确定性高于预设不确定性阈值的训练样本确定为负样本,以及将不确定性不高于预设不确定性阈值的训练样本确定为正样本;
第一训练模块506,用于根据所述正样本和所述负样本,对所述检测网络进行训练,得到训练后的检测网络;
所述识别模块504,用于:
基于所述训练后的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在各预设方向上的证据因子。
可选的,所述方法还包括:
预处理模块507,用于在所述根据预设的号牌识别模型对所述目标检测区域进行号牌识别之前,基于迁移学习技术,对采集到的训练样本进行预处理;其中,所述预处理至少包括以下之一:平移、剪裁、添加噪声;
偏移处理模块508,用于对预处理后的训练样本进行预设角度范围内的方向偏移处理,得到目标训练样本;
第二训练模块509,用于根据所述目标训练样本对所述预设的号牌识别模型进行训练,得到训练后的号码识别模型;
所述识别模块504用于:
根据所述训练后的号码识别模型对所述目标检测区域进行号牌识别。
可选的,所述第一预设条件包括:所述检测区域中含有号牌的证据因子经深度证据学习算法计算得到的分类概率期望大于第一阈值,且所述检测区域中含有号牌的证据因子经深度证据学习算法计算得到的不确定性小于第二阈值。
可选的,所述第二预设条件包括:所述检测区域中含有的号牌在预设方向上的证据因子经深度证据学习算法计算得到的分类概率期望大于第三阈值,且所述检测区域中含有的号牌在预设方向上的证据因子经深度证据学习算法计算得到的不确定性小于第四阈值。
可选的,所述识别模块504用于:
通过预先构建的BK树对所述目标检测区域进行重复号牌区域过滤;
对过滤后的所述目标检测区域进行号牌识别。
在本发明实施例中,可以先确定待检测图像中的检测区域,并通过检测区域含有号牌的证据因子来确定包含号牌的检测区域,然后,通过号牌在预设方向上的证据因子来确定号码对应的概率较高的方向,并根据该方向来对待检测区域进行旋转,以尽可能地将图像中的号牌调整至水平方向,从而使得预设的号牌识别模型能在一定程度上输出准确的号牌识别结果。
由上述内容可知,本发明实施例可以先从待检测图像中锁定含有号牌的检测区域,然后,确定检测区域对应的概率较高的方向,并对检测区域进行对应的旋转调整,从而在一定程度上提升号牌识别的准确率,有效解决相关技术中因号牌变形、号牌方向错乱等原因造成的号牌识别效果差的问题。
对应上述号牌识别方法,本发明实施例还提供了一种号牌识别设备,图6为本发明一个实施例提供的号牌识别设备的硬件结构示意图。
该号牌识别设备可以为上述实施例提供的用于识别号牌的终端设备或服务器等。
号牌识别设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器601和存储器602,存储器602中可以存储有一个或一个以上存储应用程序或数据。其中,存储器602可以是短暂存储或持久存储。存储在存储器602的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对号牌识别设备中的一系列计算机可执行指令。更进一步地,处理器601可以设置为与存储器602通信,在号牌识别设备上执行存储器602中的一系列计算机可执行指令。号牌识别设备还可以包括一个或一个以上电源603,一个或一个以上有线或无线网络接口604,一个或一个以上输入输出接口605,一个或一个以上键盘606。
具体在本实施例中,号牌识别设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对号牌识别设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行上述实施例。
在本发明实施例中,可以先确定待检测图像中的检测区域,并通过检测区域含有号牌的证据因子来确定包含号牌的检测区域,然后,通过号牌在预设方向上的证据因子来确定号码对应的概率较高的方向,并根据该方向来对待检测区域进行旋转,以尽可能地将图像中的号牌调整至水平方向,从而使得预设的号牌识别模型能在一定程度上输出准确的号牌识别结果。
由上述内容可知,本发明实施例可以先从待检测图像中锁定含有号牌的检测区域,然后,确定检测区域对应的概率较高的方向,并对检测区域进行对应的旋转调整,从而在一定程度上提升号牌识别的准确率,有效解决相关技术中因号牌变形、号牌方向错乱等原因造成的号牌识别效果差的问题。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种号牌识别方法,其特征在于,所述方法包括:
基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在预设方向上的证据因子;所述检测区域为所述号牌外接的最小区域;
当所述检测区域中含有号牌的证据因子满足第一预设条件时,将所述检测区域确定为候选检测区域;
当所述候选检测区域中含有的号牌在所述预设方向上的证据因子满足第二预设条件时,将所述预设方向确定为目标方向;
根据所述目标方向对所述候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对所述目标检测区域进行号牌识别。
2.根据权利要求1所述的方法,其特征在于,所述检测网络的主干网络为ResNet50;所述检测网络包括多个特征提取层;每个特征提取层包括三个特征提取子层,所述三个特征提取子层分别从输入所述检测网络的图像中提取表征所述检测区域的第一特征、表征所述检测区域是否含有号牌的第二特征,以及表征所述检测区域中的号牌字符相对于水平方向的旋转角度的第三特征;
其中,所述提取第一特征的特征提取子层采用的损失函数为回归损失函数;所述提取第二特征的特征提取子层以及所述提取第三特征的特征提取子层采用的损失函数为含有证据因子的分类损失函数。
3.根据权利要求2所述的方法,其特征在于,在所述基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在各预设方向上的证据因子之前,所述方法还包括:
获取候选训练样本,并根据深度证据学习算法对所述候选训练样本进行不确定性识别,将不确定性高于预设不确定性阈值的训练样本确定为负样本,以及将不确定性不高于预设不确定性阈值的训练样本确定为正样本;
根据所述正样本和所述负样本,对所述检测网络进行训练,得到训练后的检测网络;
所述基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在各预设方向上的证据因子,包括:
基于所述训练后的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在各预设方向上的证据因子。
4.根据权利要求3所述的方法,其特征在于,在所述根据预设的号牌识别模型对所述目标检测区域进行号牌识别之前,所述方法还包括:
基于迁移学习技术,对采集到的训练样本进行预处理;其中,所述预处理至少包括以下之一:平移、剪裁、添加噪声;
对预处理后的训练样本进行预设角度范围内的方向偏移处理,得到目标训练样本;
根据所述目标训练样本对所述预设的号牌识别模型进行训练,得到训练后的号码识别模型;
所述根据预设的号牌识别模型对所述目标检测区域进行号牌识别,包括:
根据所述训练后的号码识别模型对所述目标检测区域进行号牌识别。
5.根据权利要求1所述的方法,其特征在于,所述第一预设条件包括:所述检测区域中含有号牌的证据因子经深度证据学习算法计算得到的分类概率期望大于第一阈值,且所述检测区域中含有号牌的证据因子经深度证据学习算法计算得到的不确定性小于第二阈值。
6.根据权利要求1所述的方法,其特征在于,所述第二预设条件包括:所述检测区域中含有的号牌在预设方向上的证据因子经深度证据学习算法计算得到的分类概率期望大于第三阈值,且所述检测区域中含有的号牌在预设方向上的证据因子经深度证据学习算法计算得到的不确定性小于第四阈值。
7.根据权利要求1所述的方法,其特征在于,所述根据预设的号牌识别模型对所述目标检测区域进行号牌识别,包括:
通过预先构建的BK树对所述目标检测区域进行重复号牌区域过滤;
对过滤后的所述目标检测区域进行号牌识别。
8.一种号牌识别装置,其特征在于,所述装置包括:
第一确定模块,用于基于预设的检测网络,从待检测图像中确定检测区域、所述检测区域中含有号牌的证据因子,以及所述检测区域中含有的号牌在预设方向上的证据因子;所述检测区域为所述号牌外接的最小区域;
第二确定模块,用于当所述检测区域中含有号牌的证据因子满足第一预设条件时,将所述检测区域确定为候选检测区域;
第三确定模块,用于当所述候选检测区域中含有的号牌在所述预设方向上的证据因子满足第二预设条件时,将所述预设方向确定为目标方向;
识别模块,用于根据所述目标方向对所述候选检测区域进行旋转,得到目标检测区域,并根据预设的号牌识别模型对所述目标检测区域进行号牌识别。
9.一种号牌识别设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
CN202210493635.4A 2022-05-07 2022-05-07 号牌识别方法、装置及设备 Active CN114973225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210493635.4A CN114973225B (zh) 2022-05-07 2022-05-07 号牌识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210493635.4A CN114973225B (zh) 2022-05-07 2022-05-07 号牌识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN114973225A true CN114973225A (zh) 2022-08-30
CN114973225B CN114973225B (zh) 2023-10-27

Family

ID=82981890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210493635.4A Active CN114973225B (zh) 2022-05-07 2022-05-07 号牌识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN114973225B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046886A (zh) * 2019-12-12 2020-04-21 吉林大学 号码牌自动识别方法、装置、设备及计算机可读存储介质
CN111639566A (zh) * 2020-05-19 2020-09-08 浙江大华技术股份有限公司 一种提取表单信息的方法及装置
CN112163577A (zh) * 2020-09-22 2021-01-01 广州博冠信息科技有限公司 游戏画面中的文字识别方法、装置、电子设备和存储介质
US10902291B1 (en) * 2020-08-04 2021-01-26 Superb Ai Co., Ltd. Methods for training auto labeling device and performing auto labeling related to segmentation while performing automatic verification by using uncertainty scores and devices using the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046886A (zh) * 2019-12-12 2020-04-21 吉林大学 号码牌自动识别方法、装置、设备及计算机可读存储介质
CN111639566A (zh) * 2020-05-19 2020-09-08 浙江大华技术股份有限公司 一种提取表单信息的方法及装置
US10902291B1 (en) * 2020-08-04 2021-01-26 Superb Ai Co., Ltd. Methods for training auto labeling device and performing auto labeling related to segmentation while performing automatic verification by using uncertainty scores and devices using the same
CN112163577A (zh) * 2020-09-22 2021-01-01 广州博冠信息科技有限公司 游戏画面中的文字识别方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
K¨URSAT PETEK ET AL.: "Robust Monocular Localization in Sparse HD Maps Leveraging Multi-Task Uncertainty Estimation", ARXIV:2110.10563V1 [CS.RO], pages 1 - 7 *

Also Published As

Publication number Publication date
CN114973225B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN112734775B (zh) 图像标注、图像语义分割、模型训练方法及装置
CN112131978B (zh) 一种视频分类方法、装置、电子设备和存储介质
CN110363049B (zh) 图形元素检测识别和类别确定的方法及装置
CN111476284A (zh) 图像识别模型训练及图像识别方法、装置、电子设备
US8606022B2 (en) Information processing apparatus, method and program
CN102385592B (zh) 图像概念的检测方法和装置
Tamiru et al. Recognition of Amharic sign language with Amharic alphabet signs using ANN and SVM
Obaidullah et al. Script identification from printed Indian document images and performance evaluation using different classifiers
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN111178196B (zh) 一种细胞分类的方法、装置及设备
US20220215679A1 (en) Method of determining a density of cells in a cell image, electronic device, and storage medium
CN113408282B (zh) 主题模型训练和主题预测方法、装置、设备及存储介质
CN113377929B (zh) 专用术语无监督聚类方法、装置和系统
CN112613474B (zh) 一种行人重识别的方法和装置
CN117315090A (zh) 基于跨模态风格学习的图像生成方法及装置
CN111753583A (zh) 一种识别方法及装置
CN114973225B (zh) 号牌识别方法、装置及设备
CN116152933A (zh) 一种异常检测模型的训练方法、装置、设备及存储介质
CN111091198B (zh) 一种数据处理方法及装置
CN114898290A (zh) 一种海上船舶实时检测方法及系统
CN113641766A (zh) 一种关系识别方法、装置、存储介质及电子设备
Calarasanu et al. From text detection to text segmentation: a unified evaluation scheme
Xie Analysis of Commodity image recognition based on deep learning
CN112115952B (zh) 一种基于全卷积神经网络的图像分类方法、设备及介质
CN117173731B (zh) 一种模型训练的方法、图像处理的方法以及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant