CN112257720B - 提升车牌的中文字符自动检测识别率方法、装置及介质 - Google Patents

提升车牌的中文字符自动检测识别率方法、装置及介质 Download PDF

Info

Publication number
CN112257720B
CN112257720B CN202011309271.7A CN202011309271A CN112257720B CN 112257720 B CN112257720 B CN 112257720B CN 202011309271 A CN202011309271 A CN 202011309271A CN 112257720 B CN112257720 B CN 112257720B
Authority
CN
China
Prior art keywords
license plate
characters
character
category information
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011309271.7A
Other languages
English (en)
Other versions
CN112257720A (zh
Inventor
韩建文
刘宇龙
张仲书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Defence Driver Information Technology Co ltd
Original Assignee
Beijing Guardian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guardian Information Technology Co ltd filed Critical Beijing Guardian Information Technology Co ltd
Priority to CN202011309271.7A priority Critical patent/CN112257720B/zh
Publication of CN112257720A publication Critical patent/CN112257720A/zh
Application granted granted Critical
Publication of CN112257720B publication Critical patent/CN112257720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种提升车牌中文字符自动检测识别率的模型训练方法、模型训练装置与车牌识别方法及存储介质,属于自动识别技术领域。该方法主要包括模型训练步骤。该方法可以识别中国车牌的汉字、数字、字母部分,解决了OCR算法只能检测和识别中国车牌的字母和数字不能识别中国车牌中的省份等汉字字符。

Description

提升车牌的中文字符自动检测识别率方法、装置及介质
技术领域
本发明涉及自动识别技术领域,特别是一种提升车牌的中文字符自动检测识别率的模型训练方法、模型训练装置与车牌识别方法及存储介质。
背景技术
Alpr全称Automatic License Plate Recognition,即无场景约束自动车牌识别,它工作的过程是先识别出车,将每个车裁剪成一张图片然后进行车牌检测并进行矫正最终得到几乎正视的车牌,然后对车牌中的字母、数字进行检测和识别,并按照位置信息排列得到车牌字符本身的排序。
识别车牌中的字符的算法在Alpr算法中被命名为OCR算法。Alpr算法针对国外车牌,国外的车牌只有数字和字母,所以OCR算法只能检测和识别中国车牌的字母和数字不能识别中国车牌中的省份等汉字字符。
发明内容
本发明主要是提供一种提升车牌的中文字符自动检测识别率的模型训练方法、模型训练装置与车牌识别方法及存储介质。针对传统车牌识别算法OCR只能识别中国车牌中的数字和字母部分,不能识别车牌中的中国省份等汉字部分,创新了OCR算法训练的具体方式,可以针对中国车牌数据集进行训练,从而得到权重,在推理阶段应用此权重结合OCR算法对中国车牌中的数字和字母、各省份等汉字进行检测和识别。
为了实现上述目的,本发明采用的一个技术方案是:提供一种提升车牌中文字符自动检测识别率的模型训练方法,包括:模型前处理步骤,其包括,根据对实时采集的车牌图片进行标注得到的标注文件与车牌图片,建立车牌字符数据集,根据车牌字符数据集中的标注文件中的中文字符的类别,补充类别信息文件,根据经补充的类别信息文件,改写用于对神经网络进行描述的网络描述文件;模型训练步骤,其包括,将车牌字符数据集中的车牌字符的预训练权重加载在神经网络上,从而对车牌字符数据集进行特征提取,得到相应的车牌字符的特征,由神经网络对相应的车牌字符的每一个字符的特征依次进行学习,从而依次预测相应的车牌字符的每一个字符的位置信息和车牌字符的类别信息,利用类别信息文件依次对经预测的车牌字符的每一个字符的类别信息进行修正,利用经预测的车牌字符的每一个字符的位置信息、经修正的车牌字符的每一个字符的类别信息和标注文件中相应车牌字符的位置信息和类别信息,依次计算神经网络损失度,根据经依次计算的神经网络损失度进行反向传播,依次改写神经网络的当前历史参数,得到车牌字符数据集中的车牌字符的最终训练权重。
本发明采用的另一个技术方案是:提供一种提升车牌的中文字符自动检测识别率的模型训练装置,包括:模型前处理模块,其包括:用于根据对实时采集的车牌图片进行标注得到的标注文件与车牌图片,建立车牌字符数据集,用于根据车牌字符数据集中的中文字符的类别,补充类别信息文件,用于根据经补充的类别信息文件,改写用于对神经网络进行描述的网络描述文件;模型训练模块,其包括,用于将车牌字符数据集中的车牌字符的预训练权重加载在神经网络上,从而对车牌字符数据集进行特征提取,得到相应的车牌字符的特征,用于由神经网络对相应的车牌字符的每一个字符的特征依次进行学习,从而依次预测相应的车牌字符的每一个字符的位置信息和车牌字符的类别信息,用于利用类别信息文件依次对经预测的车牌字符的每一个字符的类别信息进行修正,用于利用经预测的车牌字符的每一个字符的位置信息、经修正的车牌字符的每一个字符的类别信息和标注文件中相应车牌字符的位置信息和类别信息,依次计算神经网络损失度,用于根据经依次计算的神经网络损失度进行反向传播,依次改写神经网络的当前历史参数,得到车牌字符数据集中的车牌字符的最终训练权重。
本发明采用的另一个技术方案是:提供一种车牌识别方法,其利用提升车牌中文字符自动检测识别率的模型训练方法训练得到的模型,进行模型推理,其中,模型推理的过程包括:将车牌字符数据集中的车牌字符的最终训练权重加载在神经网络上,从而对实时采集的车牌图片进行特征提取,得到车牌图片中的字符特征;由神经网络对车牌图片中的字符特征进行学习,从而预测车牌图片中的字符的位置信息和车牌图片中的字符的类别信息;利用类别信息文件对车牌图片中的字符的类别信息进行修正;利用经修正的车牌图片中的字符的类别信息,对车牌图片中的字符进行识别;以及按照经预测的车牌图片中的字符的位置信息,对经识别的车牌图片中的字符进行排列并输出。
本发明采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行方案一中的提升车牌的中文字符自动检测识别率方法。
本发明的技术方案可以达到的有益效果是:本发明设计了一种提升车牌的中文字符自动检测识别率的模型训练方法、模型训练装置与车牌识别方法及存储介质。本发明创新OCR训练方式,使得OCR算法能对中国车牌中字母、数字、中国省份等汉字进行检测和识别,提升了中文字符自动检测的识别率。
附图说明
图1是本发明一种提升车牌的中文字符自动检测识别率方法的一个具体实施方式的示意图;
图2是本发明一种提升车牌的中文字符自动检测识别率方法的一个具体实施例的示意图;
图3是本发明一种提升车牌的中文字符自动检测识别率方法的模型训练阶段的示意图;
图4是本发明一种提升车牌的中文字符自动检测识别率方法的模型推理阶段的示意图;
图5是本发明一种提升车牌的中文字符自动检测识别率装置的一个具体实施方式的示意图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
图1标示出了本发明一种提升车牌的中文字符自动检测识别率方法的一个具体实施方式。
在本发明的一个具体实施方式中,提升车牌的中文字符自动检测识别率方法主要包括模型前处理步骤S101,该步骤包括根据对实时采集的车牌图片进行标注得到的标注文件与车牌图片,建立车牌字符数据集。
在本发明的一个具体实施例中,标注文件的形成过程包括利用车牌识别算法对车牌的图片中的手动标注的数据进行训练,得到车牌识别权重文件;将车牌识别权重文件作为参数代入自动标注模型中,从而对车牌的图片进行再标注,省去了后期人工标注的时间与成本。
在本发明的一个具体实例中,初期用labelImg.exe软件对中国车牌图片中的字母、数字和中国省份汉字进行位置信息和类别信息的标注,形成图片名对应的***.xml文件,然后进行人为的检查标注,最后用车牌识别算法OCR对这样手动标注的数据进行训练形成初期的车牌识别权重文件,用初期的车牌识别权重文件作为参数代入模型自动标注程序中去对中国车牌进行标注形成.xml文件,然后人为进行检测去除不合格的标注。这种模型自动标注只需要前期用人工进行标注,并人工去检测标注是否合格,后期用模型自动标注程序进行标注代替人工标注,这样做的目的省去了后期人工标注的时间与成本。
在本发明的一个具体实例中,利用车牌图片和标注文件建立车牌字符数据集,其中标注文件包含车牌中的所有字符的位置信息和车牌中的所有字符的类别信息。
在本发明的一个具体实例中,图片是带有要识别目标的图片。
优选的,车牌的图片是经过二值化处理的图片,背景单一。
在本发明的一个具体实施方式中,在提升车牌的中文字符自动检测识别率方法中,模型前处理步骤S101还包括根据车牌字符数据集中的标注文件中的中文字符的类别,补充类别信息文件。
在本发明的一个具体实施例中,类别信息文件包含车牌字符数据集中的车牌字符的种类,种类包含车牌字符中的中文字符、字母字符及数字字符,其中,每一个字符代表一个种类,这样便于区分每一个字符。
在本发明的一个具体实例中,类别信息文件具体是用alpr-ocr-net.names记录的。传统车牌算法类别信息中包含数字和字母,其中数字部分0表示0,1表示1,2表示2,3表示3,4表示4,5表示5,6表示6,7表示7,8表示8,9表示9,共10种类别信息。字母部分A表示A,B表示B,C表示C,D表示D,E表示E,F表示F,G表示G,H表示H,J表示J,K表示K,L表示L,M表示M,N表示N,P表示P,Q表示Q,R表示Q,S表示S,T表示T,U表示U,V表示V,W表示W,X表示X,Y表示Y,Z表示Z,共24种类别信息。由于国内和国外的字母和数字方面是一样的,所以不动,但新加入了zh_jing,zh_hu,zh_jin,zh_yu1,zh_ji,zh_sx,zh_meng,zh_liao,zh_jl,zh_hei,zh_su,zh_zhe,zh_wan,zh_min,zh_gan,zh_lu,zh_yu,zh_e,zh_xiang,zh_yue,zh_gui1,zh_qiong,zh_cuan,zh_gui,zh_yun,zh_zang,zh_shan,zh_gan1,zh_qing,zh_ning,zh_xin,zh_shi,zh_ling,zh_gang,zh_ao,zh_jing1,zh_xue这37种类别信息。
在本发明的一个具体实施例中,对类别信息文件的补充包括车牌字符数据集中的车牌字符的类别信息以拼音的形式代表中国各个省份的简称,方便后续类别信息文件修正中文字符的形式。
在本发明的一个具体实例中,这37种类别信息是以拼音的方式表示中国车牌中的汉字,具体如下:zh_jing表示京,zh_hu表示沪,zh_jin表示津,zh_yu1表示渝,zh_ji表示冀,zh_sx表示晋,zh_meng表示蒙,zh_liao表示辽,zh_jl表示吉,zh_hei表示黑,zh_su表示苏,zh_zhe表示浙,zh_wan表示皖,zh_min表示闽,zh_gan表示赣,zh_lu表示鲁,zh_yu表示豫,zh_e表示鄂,zh_xiang表示湘,zh_yue表示粤,zh_gui1表示桂,zh_qiong表示琼,zh_cuan表示川,zh_gui表示贵,zh_yun表示云,zh_zang表示藏,zh_shan表示陕,zh_gan1表示甘,zh_qing表示青,zh_ning表示宁,zh_xin表示新,zh_shi表示使,zh_ling表示领,zh_gang表示港,zh_ao表示澳,zh_jing1表示警,zh_xue表示学。
在本发明的一个具体实施方式中,在提升车牌的中文字符自动检测识别率方法中,模型前处理步骤S101还包括根据经补充的类别信息文件,改写用于对神经网络进行描述的网络描述文件。
在本发明的一个具体实例中,网络描述文件用alpr-ocr-net.cfg记录。因为信息的类别种类和数目的改变,所以在alpr-ocr-net.cfg中修改类别数目和输出通道。
在本发明的一个具体实例中,将车牌识别算法中的batch=1改为batch=64,这样改进的目的是增加图片输入数量,这样可以对多个图片进过网络计算形成的loss进行反向传播时减小训练震荡。
在本发明的一个具体实例中,车牌识别算法中增加anchors数量,由原来的2个anchor机制增加到4个anchors机制,其中,代码中anchors集合框中的4个数由3个逗号隔开。
在本发明的一个具体实例中,车牌识别网络输出tensor是4*(71+5),其中,4代表4个anchors机制,71代表71个类别信息,5是由两个坐标点和一个置信度组成的,其中两个坐标点是4个数值。
在本发明的一个具体实例中,中国车牌图片是经过二值化处理过的图片,所以背景是单一的,即只包含字符目标和单一背景。为了提高OCR神经网络对车符(字符:汉字京、沪等,字母:A,B等,数字:1,2等)的检测概率,增加这部分的权重系数;由于识别的种类多,某些种类的图片比较少,所以适当的增加了预测类别的损失函数的权重。OCR算法的损失函数中的object_scale的值由40增加到55,class_scale的值由1增加到1.5。
图2标示出了本发明一种提升车牌的中文字符自动检测识别率方法的一个具体实施例,在本发明的一个具体实施例中,在模型前处理步骤之前还可以包括图像信息采集步骤S100,该步骤包括图像采集和处理。
在本发明的一个具体实例中,本方案中车牌识别应用于地下停车场中,在地下停车场中一个摄像头要对应1个或者2个或者3个或者3个以上的车辆,面对一个图片中可能出现1个车或者2个车或者3个车或者3个以上车的车牌,选用了Alpr算法(开源算法)。Alpr全称Automatic License Plate Recognition,即自动车牌识别,是一种基于摄像头无场景约束的自动识别车牌的技术。通过摄像头采集图像,将采集的图像在GTX1080tiGPU服务器或者其他型号的服务器上运行Alpr算法进行识别车牌。识别工作无须人工干预,可工作各种环境。使用Alpr算法可对多个车牌进行快速识别。Alpr算法在摄像头采集到的图片中先进行车辆识别,然后将每个车辆裁剪成一张图片,然后对裁剪后的单辆车进行车牌检测并进行矫正最终得到几乎正视的车牌图片。
在本发明的一个具体实施方式中,提升车牌的中文字符自动检测识别率方法主要还包括:模型训练步骤S102。该步骤包括将车牌字符数据集中的车牌字符的预训练权重加载在神经网络上,从而对车牌字符数据集进行特征提取,得到相应的车牌字符的特征,由神经网络对相应的车牌字符的每一个字符的特征依次进行学习,从而依次预测相应的车牌字符的每一个字符的位置信息和车牌字符的类别信息,利用类别信息文件依次对经预测的车牌字符的每一个字符的类别信息进行修正,利用经预测的车牌字符的每一个字符的位置信息、经修正的车牌字符的每一个字符的类别信息和标注文件中相应车牌字符的位置信息和类别信息,依次计算神经网络损失度,根据根据经依次计算的神经网络损失度进行反向传播,依次改写神经网络的参数,得到车牌字符数据集中的车牌字符的最终训练权重。
在本发明的一个具体实施例中,将车牌字符数据集中的车牌字符的预训练权重加载在神经网络上,从而对车牌字符数据集进行特征提取,得到相应的车牌字符的特征的过程包括对车牌字符数据集中的车牌图片与包含车牌字符位置信息和车牌字符类别信息的标注文件进行特征提取,其中标注文件与车牌图片一一对应,使得提取出来的特征更加具体。
在本发明的一个具体实施例中,利用类别信息文件依次对经预测的车牌字符的每一个字符的类别信息进行修正的过程包括类别信息文件将经预测的车牌字符的类别信息修正为与标注文件中相应的车牌字符的类别信息一样的形式,使得识别出的字符更加准确。
在本发明的一个具体实例中,根据根据经依次计算的神经网络损失度进行反向传播,依次改写神经网络的当前历史参数,得到车牌字符数据集中的车牌字符的最终训练权重的过程包括将经依次计算的神经网络损失度进行反向传播到神经网络中,改写神经网络的当前历史参数,使得神经网络的参数收敛于一个近似值。
在本发明的一个具体实施例中,得到车牌字符数据集中的车牌字符的最终训练权重的过程还包括将经改写的网络描述文件、预训练权重以及经补充的类别信息文件的路径和车牌字符数据集的路径作为参数进行训练,创新了训练方式。
在本发明的一个具体实例中,网络描述文件、类别信息文件以及预训练权重三者之间的运作关系是:首先用网络描述文件构建的神经网络中的主干网络加载预训练权重对车牌字符数据集进行特征提取;其次神经网络中的后端网络将主干网络提取好的特征进行再提取并预测目标的位置信息和类别信息;然后类别信息文件将预测出的目标类别信息转化为与标注文件中目标类别信息一样的形式,将预测出的位置信息、类别信息和标注文件中的位置信息、类别信息进行损失度loss计算,将loss值进行反向传播到后端网络,并改写其参数;最后重复上述的训练步骤直至达到训练次数,保存主干网络和后端网络的参数形成最终训练权重文件即***.weights文件。
在本发明的一个具体实例中,后端网络预测出来位置信息和标注文件中目标的位置信息都是数字形式,所以不用对预测出的位置信息做处理,预测出的类别信息和标注文件中目标的类别信息是不一样的,所以需要类别信息文件对预测出的类别信息进行处理。
在本发明的一个具体实例中,网络描述文件是用来构建神经网络的,分成主干网络和后端网络两个部分;类别信息文件记录要识别的目标有哪些类别;预训练权重由一堆带有格式存放的数字组成,目的是为了主干网络固化参数,作用是加速神经网络的收敛。预训练权重只是为了提取车牌特征,并不能检测和识别车牌当中的车牌字符,所以训练的目的为了形成不仅可以提取特征还可以检测和识别车牌字符的权重。
图3标示出了本发明一种提升车牌的中文字符自动检测识别率方法的模型训练阶段。
在本发明的一个具体实例中,传统车牌识别算法没有提供如何进行训练的方式,在此我们创新了自己的训练方式。传统车牌识别算法OCR是基于yolo算法改进,所以我们将darknet53作为预训练权重。训练方式是这样:./darknet detector train cfg/alpr-ocr-net.data cfg/alpr-ocr-net.cfg darknet53.conv.74;其中,车牌图片和标注文件以及类别目标信息是在cfg/alpr-ocr-net.data中体现,cfg/alpr-ocr-net.data中记录了类别目标信息alpr-ocr-net.names和中国车牌数据集的路径;网络描述文件在cfg/alpr-ocr-net.cfg中体现;预训练权重的作用在darknet53.conv.74中体现。
在本发明的一个具体实例中,将yolo算法中的detector.c进行编译,将alpr-ocr-net.cfg,darknet53.conv.74以及alpr-ocr-net.data作为detector.c的参数,然后运行./darknet detector train cfg/alpr-ocr-net.data cfg/alpr-ocr-net.cfgdarknet53.conv.74-gpus 1,开始OCR网络的训练,直到达到指定训练次数,得到最终训练权重,用alpr-ocr-net_final.weights记录。
在本发明的一个具体实例中,最终训练权重alpr-ocr-net_final.weights由一堆带有格式存放的数字组成,是训练阶段的产物,推理阶段需要用到。
在本发明的一个具体实施方式中,提供一种车牌识别方法,其利用提升车牌中文字符自动检测识别率的模型训练方法训练得到的模型,进行模型推理,其中,模型推理的过程包括,将车牌字符数据集中的车牌字符的最终训练权重加载在神经网络上,从而对实时采集的车牌图片进行特征提取,得到车牌图片中的字符特征;由神经网络对车牌图片中的字符特征进行学习,从而预测车牌图片中的字符的位置信息和车牌图片中的字符的类别信息;利用类别信息文件对车牌图片中的字符的类别信息进行修正;利用经修正的车牌图片中的字符的类别信息,对车牌图片中的字符进行识别;以及按照经预测的车牌图片中的字符的位置信息,对经识别的车牌图片中的字符进行排列并输出。
在本发明的一个具体实例中,模型推理的过程还包括将训练完的最终训练权重alpr-ocr-net_final.weights、类别信息文件alpr-ocr-net.names、网络描述文件alpr-ocr-net.cfg、图片路径作为参数送到送到ocr.py,在GTX1080tiGPU服务器或者其他型号的服务器端中运行ocr.py,从而进行中国车牌测试和识别。
图4标示出了本发明一种提升车牌的中文字符自动检测识别率方法的模型推理阶段。
在本发明的一个具体实例中,网络描述文件alpr-ocr-net.cfg、类别信息文件alpr-ocr-net.names以及训练得到的最终训练权重alpr-ocr-net_final.weights三者之间的运作关系是网络描述文件构建的神经网络中的主干网络和后端网络模型加载最终训练权重,主干网络对未知的中国车牌图片进行特征提取,后端网络对主干网络提取好的特征进行特征再提取,并预测车牌中字符的位置信息以及类别信息。类别信息文件的目的就是将预测出的目标类别信息转化为标注文件中目标类别一样的形式,然后按照位置信息对预测出的字符进行排列,最终输出和车牌字符顺序一样的车牌号。
在本发明的一个具体实例中,由于后端网络预测出来位置信息和标注文件中目标的位置信息都是数字形式,所以不用对预测出的位置信息做处理,而预测出的类别信息和标注文件中目标的类别信息是不一样的,所以需要类别信息文件对预测出的类别信息进行处理。
在本发明的一个具体实例中,将最终训练权重alpr-ocr-net_final.weights、类别信息文件alpr-ocr-net.names、网络描述文件alpr-ocr-net.cfg、图片路径作为参数送到ocr.py中对中国车牌进行预测识别。
图5标示出了本发明一种提升车牌的中文字符自动检测识别率装置的一个具体实施方式。
在本发明的一个具体实施方式中,提供一种提升车牌的中文字符自动检测识别率的模型训练装置包括模型前处理模块501,该模块用于根据对实时采集的车牌图片进行标注得到的标注文件与车牌图片,建立车牌字符数据集,用于根据车牌字符数据集中的中文字符的类别,补充类别信息文件,用于根据经补充的类别信息文件,改写用于对神经网络进行描述的网络描述文件。
在本发明的一个具体实例中,中国车牌字符数据集由带有要识别目标字符的图片和标注文件组成的,其中,标注文件在前期用人工进行标注,并人工去检测标注是否合格,后期用模型自动标注程序进行标注代替人工标注,这样省去了后期人工标注的时间与成本。
在本发明的一个具体实例中,类别信息文件新增添了37种类别信息,并以拼音的方式代表了中国37个省份的汉字,类别信息文件中一共有71种类别。
在本发明的一个具体实例中,网络描述文件的改进是根据新增添的字符信息种类和数目来更改的。
在本发明的一个具体实施方式中,提供一种提升车牌的中文字符自动检测识别率的模型训练装置还包括模型训练模块502,该模块用于将车牌字符数据集中的车牌字符的预训练权重加载在神经网络上,从而对车牌字符数据集进行特征提取,得到相应的车牌字符的特征,用于由神经网络对相应的车牌字符的每一个字符的特征依次进行学习,从而依次预测相应的车牌字符的每一个字符的位置信息和车牌字符的类别信息,用于利用类别信息文件依次对经预测的车牌字符的每一个字符的类别信息进行修正,用于利用经预测的车牌字符的每一个字符的位置信息、经修正的车牌字符的每一个字符的类别信息和标注文件中相应车牌字符的位置信息和类别信息,依次计算神经网络损失度,用于根据经依次计算的神经网络损失度进行反向传播,依次改写神经网络的当前历史参数,得到车牌字符数据集中的车牌字符的最终训练权重。
在本发明的一个具体实例中,网络描述文件构建的神经网络中的主干网络加载预训练权重对中国车牌图片字符数据集进行特征提取;其次神经网络中的后端网络将主干网络提取好的特征进行再提取并预测中国车牌图片字符的位置信息和类别信息;然后类别信息文件将预测出的中国车牌图片字符类别信息转化为与标注文件中目标类别信息一样的形式,将预测出的位置信息、类别信息和标注文件中的位置信息、类别信息进行损失度loss计算,将loss值进行反向传播到后端网络,并改写其参数;最后重复上述的训练步骤直至达到训练次数,保存主干网络和后端网络的参数形成不仅可以提取特征还可以检测和识别车牌字符的最终的权重文件即***.weights文件。
在本发明的一个具体实例中,模型训练模块还用于车牌识别算法对预训练权重的改进。
在本发明的一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行任一实施例描述的提升车牌的中文字符自动检测识别率方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上描述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,包括:
模型前处理步骤,其包括,
根据对实时采集的车牌图片进行标注得到的标注文件与所述车牌图片,建立车牌字符数据集,
根据所述车牌字符数据集中的所述标注文件中的中文字符的类别,补充类别信息文件,
根据经补充的类别信息文件,改写用于对神经网络进行描述的网络描述文件;
模型训练步骤,其包括,
将所述车牌字符数据集中的车牌字符的预训练权重加载在所述神经网络上,从而对所述车牌字符数据集进行特征提取,得到相应的车牌字符的特征,
由所述神经网络对相应的所述车牌字符的每一个字符的特征依次进行学习,从而依次预测相应的所述车牌字符的每一个字符的位置信息和所述车牌字符的类别信息,
利用所述类别信息文件依次对经预测的所述车牌字符的每一个字符的类别信息进行修正,
利用经预测的所述车牌字符的每一个字符的位置信息、经修正的所述车牌字符的每一个字符的类别信息和所述标注文件中相应车牌字符的位置信息和类别信息,依次计算神经网络损失度,
根据经依次计算的神经网络损失度进行反向传播,依次改写所述神经网络的当前历史参数,得到所述车牌字符数据集中的车牌字符的最终训练权重。
2.如权利要求1所述的提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,所述将所述车牌字符数据集中的车牌字符的预训练权重加载在所述神经网络上,从而对所述车牌字符数据集进行特征提取,得到相应车牌字符的特征的过程包括:
对所述车牌字符数据集中的车牌图片与包含所述车牌字符位置信息和所述车牌字符类别信息的标注文件进行特征提取,其中所述标注文件与所述车牌图片一一对应。
3.如权利要求2所述的提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,所述利用所述类别信息文件依次对经预测的所述车牌字符的每一个字符的类别信息进行修正的过程包括:
所述类别信息文件将经预测的所述车牌字符的类别信息修正为与所述标注文件中相应的所述车牌字符的类别信息一样的形式。
4.如权利要求1所述的提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,所述得到所述车牌字符数据集中的车牌字符的最终训练权重的过程还包括:
将经改写的所述网络描述文件、所述预训练权重以及经补充的所述类别信息文件的路径和所述车牌字符数据集的路径作为参数进行训练。
5.如权利要求1所述的提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,所述根据所述车牌字符数据集中的中文字符的类别,补充类别信息文件的过程包括:
对所述类别信息文件的补充包括所述车牌字符数据集中的所述车牌字符的类别信息以拼音的形式代表中国各个省份的简称。
6.如权利要求1所述的提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,所述类别信息文件包含所述车牌字符数据集中的所述车牌字符的种类,所述种类包含所述车牌字符中的中文字符、字母字符及数字字符,其中,每一个字符代表一个种类。
7.如权利要求2所述的提升车牌中文字符自动检测识别率的模型训练方法,其特征在于,所述标注文件的形成过程包括:
利用车牌识别算法对所述车牌的图片中的手动标注的数据进行训练,得到车牌识别权重文件;
将所述车牌识别权重文件作为参数代入自动标注模型中,从而对所述车牌的图片进行再标注。
8.一种提升车牌的中文字符自动检测识别率的模型训练装置,其特征在于,包括:
模型前处理模块,其包括:
用于根据对实时采集的车牌图片进行标注得到的标注文件与所述车牌图片,建立车牌字符数据集,
用于根据所述车牌字符数据集中的中文字符的类别,补充类别信息文件,
用于根据经补充的类别信息文件,改写用于对神经网络进行描述的网络描述文件;模型训练模块,其包括,
用于将所述车牌字符数据集中的车牌字符的预训练权重加载在所述神经网络上,从而对所述车牌字符数据集进行特征提取,得到相应的车牌字符的特征,
用于由所述神经网络对相应的所述车牌字符的每一个字符的特征依次进行学习,从而依次预测相应的所述车牌字符的每一个字符的位置信息和所述车牌字符的类别信息,
用于利用所述类别信息文件依次对经预测的所述车牌字符的每一个字符的类别信息进行修正,
用于利用经预测的所述车牌字符的每一个字符的位置信息、经修正的所述车牌字符的每一个字符的类别信息和所述标注文件中相应车牌字符的位置信息和类别信息,依次计算神经网络损失度,
用于根据经依次计算的神经网络损失度进行反向传播,依次改写所述神经网络的当前历史参数,得到所述车牌字符数据集中的车牌字符的最终训练权重。
9.一种车牌识别方法,其特征在于包括,利用权利要求1-7任一所述的提升车牌中文字符自动检测识别率的模型训练方法训练得到的模型,进行模型推理,其中,所述模型推理的过程包括:
将所述车牌字符数据集中的车牌字符的最终训练权重加载在所述神经网络上,从而对实时采集的车牌图片进行特征提取,得到所述车牌图片中的字符特征;
由所述神经网络对所述车牌图片中的字符特征进行学习,从而预测所述车牌图片中的字符的位置信息和所述车牌图片中的字符的类别信息;
利用所述类别信息文件对所述车牌图片中的字符的类别信息进行修正;
利用经修正的所述车牌图片中的字符的类别信息,对所述车牌图片中的字符进行识别;以及
按照经预测的所述车牌图片中的字符的位置信息,对经识别的所述车牌图片中的字符进行排列并输出。
10.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-7中任一项所述的提升车牌中文字符自动检测识别率的模型训练方法。
CN202011309271.7A 2020-11-20 2020-11-20 提升车牌的中文字符自动检测识别率方法、装置及介质 Active CN112257720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011309271.7A CN112257720B (zh) 2020-11-20 2020-11-20 提升车牌的中文字符自动检测识别率方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011309271.7A CN112257720B (zh) 2020-11-20 2020-11-20 提升车牌的中文字符自动检测识别率方法、装置及介质

Publications (2)

Publication Number Publication Date
CN112257720A CN112257720A (zh) 2021-01-22
CN112257720B true CN112257720B (zh) 2024-02-27

Family

ID=74224907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011309271.7A Active CN112257720B (zh) 2020-11-20 2020-11-20 提升车牌的中文字符自动检测识别率方法、装置及介质

Country Status (1)

Country Link
CN (1) CN112257720B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989794B (zh) * 2021-11-12 2022-08-02 珠海安联锐视科技股份有限公司 一种车牌检测和识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107730896A (zh) * 2016-08-31 2018-02-23 西安艾润物联网技术服务有限责任公司 车牌识别方法及装置
CN109523792A (zh) * 2018-11-14 2019-03-26 厦门路桥信息股份有限公司 车牌识别结果的自动修正方法、介质及系统
CN110378331A (zh) * 2019-06-10 2019-10-25 南京邮电大学 一种基于深度学习的端到端车牌识别系统及其方法
KR20200119384A (ko) * 2019-03-26 2020-10-20 (주)아이에스인텍 차량 번호판을 실시간으로 인식하는 장치 및 방법
CN111815960A (zh) * 2020-06-28 2020-10-23 贵州数据宝网络科技有限公司 一种基于大数据的车辆信息展示方法
CN111914839A (zh) * 2020-07-28 2020-11-10 三峡大学 基于YOLOv3的同步端到端车牌定位与识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107730896A (zh) * 2016-08-31 2018-02-23 西安艾润物联网技术服务有限责任公司 车牌识别方法及装置
CN109523792A (zh) * 2018-11-14 2019-03-26 厦门路桥信息股份有限公司 车牌识别结果的自动修正方法、介质及系统
KR20200119384A (ko) * 2019-03-26 2020-10-20 (주)아이에스인텍 차량 번호판을 실시간으로 인식하는 장치 및 방법
CN110378331A (zh) * 2019-06-10 2019-10-25 南京邮电大学 一种基于深度学习的端到端车牌识别系统及其方法
CN111815960A (zh) * 2020-06-28 2020-10-23 贵州数据宝网络科技有限公司 一种基于大数据的车辆信息展示方法
CN111914839A (zh) * 2020-07-28 2020-11-10 三峡大学 基于YOLOv3的同步端到端车牌定位与识别方法

Also Published As

Publication number Publication date
CN112257720A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112395978B (zh) 行为检测方法、装置及计算机可读存储介质
CN109284758B (zh) 一种发票印章消除方法、装置和计算机存储介质
EP3843036A1 (en) Sample labeling method and device, and damage category identification method and device
CN113591866B (zh) 基于db与crnn的特种作业证件检测方法及系统
CN112052850A (zh) 车牌识别方法、装置、电子设备及存储介质
CN111414916A (zh) 图像中文本内容提取生成方法、装置及可读存储介质
CN115034200A (zh) 图纸信息提取方法、装置、电子设备及存储介质
CN112257720B (zh) 提升车牌的中文字符自动检测识别率方法、装置及介质
CN116612479A (zh) 一种轻量级的票据ocr识别方法及系统
CN114267064A (zh) 一种人脸识别方法、装置、电子设备及存储介质
CN113841156B (zh) 基于图像识别的控制方法与装置
CN114064971A (zh) 一种基于深度学习的机坪视频语义检索方法及检索系统
CN113869317A (zh) 车牌识别方法、装置、电子设备和存储介质
CN111898528B (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN117274969A (zh) 一种印章识别方法、装置、设备及介质
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN112883346A (zh) 基于复合数据的安全身份认证方法、装置、设备及介质
CN115294576A (zh) 基于人工智能的数据处理方法、装置、计算机设备及介质
CN112580505B (zh) 网点开关门状态识别方法、装置、电子设备及存储介质
CN115439850A (zh) 基于审单的图文字符识别方法、装置、设备及存储介质
CN115223157A (zh) 一种基于循环神经网络的电网设备铭牌光学字符识别方法
CN112861841B (zh) 票据置信值模型的训练方法、装置、电子设备及存储介质
US20200257737A1 (en) Document handling
CN113469176A (zh) 一种目标检测模型训练方法、目标检测方法及其相关设备
CN113515591A (zh) 文本不良信息识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240305

Address after: Room 1101, Building A4, No. 241, Science Avenue, Huangpu District, Guangzhou City, Guangdong Province, 510000

Patentee after: GUANGZHOU DEFENCE DRIVER INFORMATION TECHNOLOGY Co.,Ltd.

Country or region after: China

Address before: 101301 room 370, 3rd floor, building 1, yard 56, zhaoquanying section, Changjin Road, zhaoquanying Town, Shunyi District, Beijing

Patentee before: Beijing Guardian Information Technology Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right