CN111461134A - 一种基于生成对抗网络的低分辨率车牌识别方法 - Google Patents

一种基于生成对抗网络的低分辨率车牌识别方法 Download PDF

Info

Publication number
CN111461134A
CN111461134A CN202010418529.0A CN202010418529A CN111461134A CN 111461134 A CN111461134 A CN 111461134A CN 202010418529 A CN202010418529 A CN 202010418529A CN 111461134 A CN111461134 A CN 111461134A
Authority
CN
China
Prior art keywords
image
license plate
resolution
loss
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010418529.0A
Other languages
English (en)
Other versions
CN111461134B (zh
Inventor
孙正兴
余佩雯
张胜
朱毅欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202010418529.0A priority Critical patent/CN111461134B/zh
Publication of CN111461134A publication Critical patent/CN111461134A/zh
Application granted granted Critical
Publication of CN111461134B publication Critical patent/CN111461134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • G06T3/4076Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution using the original low-resolution images to iteratively correct the high-resolution images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于生成对抗网络的低分辨率车牌识别方法,包括以下步骤:1)构建图像增强模块:根据输入的低分辨率的车牌字符图像集进行训练,训练得到能生成更逼近真实图像的高分辨率车牌字符的图像生成模型;2)构建图像识别模块:利用生成的高分辨率车牌字符图像和真实的车牌字符图像进行训练,通过迭代优化损失,从而提高判别模型对输入图像的真假判别能力和识别效果;3)整体框架训练:包括数据预处理、模型框架训练及测试三个阶段。本发明方法实现了端到端的低分辨率车牌自动识别,能够有效提高低分辨率车牌的辨识度和识别精度。

Description

一种基于生成对抗网络的低分辨率车牌识别方法
技术领域
本发明属于车牌识别技术领域,具体涉及一种基于生成对抗网络的低分辨率车牌识别方法。
背景技术
近年来,车牌识别在公路卡口、停车场、收费站等场合的应用取得了显著的成功。然而,在监控应用中,感兴趣的对象往往远离摄像机,导致车牌区域分辨率很低、质量很差,甚至无法通过肉眼直接观测。在这种图像信息内容有限的条件下,传统的车牌识别方法的性能急剧下降,导致低分辨率车牌识别成为一个难点问题。
为解决低分辨率车牌信息有限难以识别的问题,目前主要的技术思路是利用现有的超分辨率技术对低分辨率图像进行重建,以获得可辨识度提高的车牌图像。如文献1:Chao Dong,Chen Change Loy,Kaiming He,and Xiaoou Tang,“Learning a deepconvolutional network for image super-resolution,”in European Conference onComputer Vision.Springer,2014,pp.184–199.首次提出了使用CNN结构的超分辨率网络SRCNN,该方法直接学习LR和HR图像之间的端到端映射。文献2:Lim,Bee et al.“EnhancedDeep Residual Networks for Single Image Super-Resolution.”2017IEEE Conferenceon Computer Vision and Pattern Recognition Workshops(CVPRW)(2017):1132-1140.提出了一种称为EDSR的高精度单图像超分辨率方法,该方法学习残差,去除了SRResNet多余的模块,从而可以扩大模型的尺寸来提升结果质量。文献3:Christian Ledig,LucasTheis,Ferenc Husz′ar,Jose Caballero,Andrew Cunningham,Alejandro Acosta,AndrewAitken,Alykhan Tejani,Johannes Totz,Zehan Wang,et al.,“Photo-realistic singleimage super-resolution using a generative adversarial network,”arXiv preprintarXiv:1609.04802,2016.提出了一种用于图像超分辨率的生成对抗网络(SRGAN),利用感知损失和对抗损失来提升SR图像的真实感。
虽然这些超分辨率方法可以生成高视觉质量的图像,但由于超分辨率问题的病态性,其生成的细节和原图像有很大的不同,无法为后续的识别任务提供足够有用的特征信息。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于生成对抗网络(Generative Aderversarial Networks,GAN)的低分辨率车牌识别方法,包括如下步骤:
步骤1,构建图像增强模块:搭建图像生成网络,将低分辨率的车牌字符图像输入到模型中,通过迭代优化图像增强模块的损失函数来使图像增强模块生成高分辨率车牌字符图像;
步骤2,构建图像识别模块:搭建图像判别网络,利用步骤1生成的高分辨率车牌字符图像和真实图像一起输入到模型中,通过迭代优化图像识别模块的损失函数以提高图像判别网络真假判别能力和识别效果;
步骤3,整体框架训练:通过分割高分辨率车牌字符图像得到原始的字符图像集,经过下采样得到低分辨率字符图像集,基于GAN对抗学习的思想交替训练图像增强模块和图像识别模块,利用训练好的图像生成和判别模型实现低分辨率车牌的增强识别。
步骤1包括以下步骤:
步骤1-1,构建图像生成网络模型G;
步骤1-2,设计图像增强模块的损失函数LG
步骤1-3,将输入的低分辨率的车牌字符图像ILR生成高分辨率车牌字符图像
Figure BDA0002495952390000021
并计算损失函数LG,通过不断迭代优化损失函数LG以更新生成网络模型G的参数θG
步骤1-1中,所述图像生成网络G包含五个残差块,每个残差块中包含两个3×3的卷积层,卷积层后连接批规范化层,选取PReLU作为激活函数,再连接两个亚像素卷积层用来增大特征尺寸,亚像素卷积层即上采样网络层。
步骤1-2中,所述图像增强模块的损失函数LG包括三部分:内容损失
Figure BDA0002495952390000022
对抗损失
Figure BDA0002495952390000023
和分类损失LC,采用不同权重进行加权计算如下:
Figure BDA0002495952390000024
其中,所述内容损失
Figure BDA0002495952390000025
为生成的高分辨率车牌字符图像与低分辨率的车牌字符图像之间的欧氏距离,所述对抗损失
Figure BDA0002495952390000031
用来生成让判别器无法区分的数据分布
Figure BDA0002495952390000032
所述分类损失LC用来区分正确的样本类别。
步骤1-2中,所述内容损失包括均方差损失和VGG特征损失,其中均方差损失
Figure BDA0002495952390000033
表示像素空间的最小均方差:
Figure BDA0002495952390000034
其中r表示采样因子,x、y分别表示图像像素点的横、纵坐标,(IHR)x,y表示真实的高分辨率车牌字符图像的各个像素点,
Figure BDA0002495952390000035
表示生成网络合成的高分辨率车牌字符图像的各个像素点,W和H分别表示图像IHR的宽度和高度,
Figure BDA0002495952390000036
表示图像IHR
Figure BDA0002495952390000037
逐像素求差的平方和。
所述的VGG特征损失以文献Simonyan K,Zisserman A.Very deep convolutionalnetworks for large-scale image recognition[J].arXiv preprint arXiv:1409.1556,2014中预训练19层的VGG网络为基础,求生成的高分辨率车牌字符图像与低分辨率的车牌字符图像特征之间的欧式距离,在已经训练好的VGG网络上提取一层的特征图,将生成的高分辨率车牌字符图像当前层的特征图和低分辨率的车牌字符图像所对应的特征图进行比较:
Figure BDA0002495952390000038
其中
Figure BDA0002495952390000039
表示真实高分辨率车牌字符图像IHR和生成的高分辨率车牌字符
Figure BDA00024959523900000310
的VGG特征图之间的欧式距离;Wi,j和Hi,j分别表示VGG网络内各个特征图的宽度和高度;φi,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图。
所述对抗损失
Figure BDA00024959523900000311
用来生成让判别器无法区分的图像:
Figure BDA00024959523900000312
其中
Figure BDA0002495952390000041
为判别器,θD为判别器的权重,N为样本数量;
所述的分类损失LC用来使预测的字符类别更准确:
Figure BDA0002495952390000042
其中P(C=c|IHR)表示真实车牌字符图像IHR分类正确的概率,
Figure BDA0002495952390000043
表示图像生成网络合成的高分辨率车牌字符图像
Figure BDA0002495952390000044
分类正确的概率。
步骤2包括如下步骤:
步骤2-1,构建图像判别网络模型D;
步骤2-2,设计图像识别模块的损失函数LD
步骤2-3,将生成的高分辨率字符图像
Figure BDA0002495952390000045
和真实的高分辨率字符图像IHR输入图像判别网络中,并计算损失LD,通过不断迭代优化LC以更新生成网络模型D的参数θD
步骤2-1中所述的图像判别网络模型D包含两个卷积层,每个卷积层之后都连接批规范化层和LeakyReLU激活函数,最终通过两个预测分支:其一分支将输出值通过Sigmoid函数映射到[0,1],从而得到该模块的输入样本是否来自真实车牌字符图像IHR,如果是,输出为1,否则为0;另一分支将输出值通过Softmax函数映射到Nt维,从而得到该模块的输入样本的分类标签,其中Nt为样本总类别数。
步骤2-2中所述的图像识别模块的损失函数LD包括两部分:判别损失LS和分类损失LC,计算公式如下:
LD=LS+LC
其中,所述判别损失LS用来使判别器区分真假数据,所述分类损失LC用来区分正确的样本类别;
所述判别损失LS表示判别器区分真假数据的能力:
Figure BDA0002495952390000051
其中
Figure BDA0002495952390000052
为判别器,θD为判别器的权重,N为样本数量;
所述的分类损失LC用来使图像识别模块预测的字符类别更准确:
Figure BDA0002495952390000053
其中P(C=c|IHR)表示真实的高分辨率车牌字符图像IHR分类正确的概率,
Figure BDA0002495952390000054
表示图像生成网络G合成的高分辨率车牌字符图像
Figure BDA0002495952390000055
分类正确的概率。
步骤3包括如下步骤:
步骤3-1,数据预处理:对监控场景下获取的整张车牌图像集进行字符分割,去除汉字部分,得到真实的高分辨率字符图像集HR;通过下采样,得到低分辨率字符图像集LR;
步骤3-2,模型框架训练:基于GAN的对抗学习思想交替训练图像增强和识别两个模块,直到图像判别网络D无法区分输入图像的真假且能正确分类或满足迭代终止条件,则完成训练;
步骤3-3,模型框架测试:输入用于测试的低分辨率车牌,经过训练好的图像生成模型G后得到高分辨率车牌字符图像,再由图像判别模型D直接输出车牌识别结果,从而实现低分辨率车牌的增强识别。
步骤3-1包括如下步骤:
步骤3-1-1,对监控场景下获取的整张车牌图像进行垂直投影后计算峰值出现的次数:如果出现次数等于次数阈值7,则计算各峰的峰宽比,峰宽比符合条件的则利用垂直投影法进行字符分割;如果出现次数不等于阈值7,则利用模板匹配进行字符分割,去除汉字部分;
步骤3-1-2,去除汉字部分后,将分割后的高分辨率车牌字符图像归一化,处理到m×n大小,m和n分别表示图像的高度和宽度,归一化后的高分辨车牌字符图像集记为HR;
步骤3-1-3,通过k倍双三次下采样,将高分辨率车牌字符图像集HR降为分辨率大小为(m/k,n/k)的低分辨率车牌字符图像集LR;
步骤3-2包括如下步骤:
步骤3-2-1,利用步骤3-1得到的低分辨率车牌字符图像集LR作为图像增强模块的输入,经过堆叠的卷积层和上采样网络层后,即图像生成网络G,得到特征增强后的高分辨率车牌字符图像集,记为SR;
步骤3-2-2,将真实车牌字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块,输出两个分支,其中一个分支输出Nt维的目标类别,Nt为字符样本类别数目;另一个分支输出1维的向量,用于判别是否为真实样本;
步骤3-2-3,根据整体模型框架的优化目标函数
Figure BDA0002495952390000061
联合训练图像增强模块和图像识别模块,交替更新图像生成网络模型G和图像判别网络模型D的参数θG、θD
Figure BDA0002495952390000062
其中,IHR为真实车牌字符图像集HR中某一样本,
Figure BDA0002495952390000063
为生成的高分辨率车牌字符图像集SR中某一样本,V(G,D)用来衡量样本集HR与SR相近似的程度,
Figure BDA0002495952390000064
表示IHR的期望,
Figure BDA0002495952390000065
表示
Figure BDA0002495952390000066
的期望。
步骤3-1-2中,m=48,n=24。
步骤3-1-3中,k=4,6,8。
所述的字符样本类别数Nt=34,包括除字母I、O外的24类字母和10类数字。
本发明公开的方法基于GAN对抗学习的思想,联合训练图像增强模块和图像识别模块,即将两个独立的过程统一在一个端到端的框架中,使二者在不断的博弈中相互增强。此外,利用分类损失指导图像超分辨网络更关注于生成对识别有益的特征信息。
有益效果:本发明具有以下优点:首先,本发明建立了基于GAN的端到端的神经网络结构,通过对抗训练图像增强网络和识别网络,提高了车牌在低分辨率情况下的识别精度;其次,本发明通过引入分类损失指导图像增强网络,可以更多地生成与识别相关的特征信息,从而提高了低分辨率车牌的辨识度和识别效果。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明的处理流程示意图。
图2a是高分辨率车牌字符图像集示例。
图2b是对应的低分辨率车牌图像集示例。
图2c是低分辨率车牌字符分割后的结果示例。
图2d是图像增强及其识别结果示例。
具体实施方式
本发明公开的一种基于生成对抗网络的低分辨率车牌识别方法,具体按照以下步骤实施(图1是整个方法的流程图):
1、构建图像增强模块
输入:低分辨率车牌字符图像。
输出:生成的高分辨率车牌字符图像。
1.1构建图像生成网络模型G
图像生成网络部分包含多个残差块,每个残差块中包含两个3×3的卷积层,卷积层后连接批规范化层,选取PReLU作为激活函数,再连接两个亚像素卷积层用来增大特征尺寸,即上采样网络层。
1.2设计图像增强模块的损失函数LG
该模块的损失函数目标是使图像生成网络G能生成更逼近于真实图像的高分辨率字符图像,且能生成更多有助于字符识别的特征信息,包括内容损失
Figure BDA0002495952390000071
对抗损失
Figure BDA0002495952390000072
和分类损失LC。采用不同权重进行加权计算如下:
Figure BDA0002495952390000073
其中,所述内容损失
Figure BDA0002495952390000074
为生成图像与原图像之间的欧氏距离,所述对抗损失
Figure BDA0002495952390000075
用来生成让判别网络D无法区分的数据分布
Figure BDA0002495952390000076
所述分类损失LC用来区分正确的样本类别。
步骤1设计内容损失
Figure BDA0002495952390000081
包括均方差损失和VGG特征损失,其中均方差损失
Figure BDA0002495952390000082
表示像素空间的最小均方差:
Figure BDA0002495952390000083
其中r表示采样因子,x、y分别表示图像像素点的横、纵坐标,(IHR)x,y表示真实的高分辨率车牌字符图像的各个像素点,
Figure BDA0002495952390000084
表示生成网络合成的高分辨率车牌字符图像的各个像素点,W和H分别表示图像IHR的宽度和高度,
Figure BDA0002495952390000085
表示图像IHR
Figure BDA0002495952390000086
逐像素求差的平方和。
所述的VGG特征损失以预训练19层的VGG网络为基础,求生成图像与原图像特征之间的欧式距离,在已经训练好的VGG上提取某一层的特征图,将生成图像当前层的特征图和原图像所对应的特征图进行比较:
Figure BDA0002495952390000087
其中
Figure BDA0002495952390000088
表示真实高分辨率车牌字符图像IHR和生成的高分辨率车牌字符
Figure BDA0002495952390000089
的VGG特征图之间的欧式距离;Wi,j和Hi,j分别表示VGG网络内各个特征图的宽度和高度;φi,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图。该损失函数能反映更高感知层次上的误差,而均方误差损失项只能反映低层次的像素点间的误差,因此VGG损失项又称为感知损失项。
步骤2设计对抗损失
Figure BDA00024959523900000810
用来生成让图像判别器D无法区分的图像:
Figure BDA00024959523900000811
其中
Figure BDA00024959523900000812
为判别器,θD为判别器的权重,N为样本数量。
步骤3设计分类损失LC,用来使预测的字符类别更准确:
Figure BDA0002495952390000091
其中P(C=c|IHR)表示真实车牌字符图像IHR中样本C分类正确的概率,
Figure BDA0002495952390000092
表示生成网络合成的高分辨率车牌字符图像
Figure BDA0002495952390000093
中样本C分类正确的概率。
1.3生成高分辨率字符图像,并迭代优化损失LG以更新模型参数θG
将低分辨率字符图像向量化处理,除以255.0使得灰度归一化到[0,1]区间,然后输入到图像生成网络G中,以分辨率大小为8×4为例,经过一层卷积核大小为9,填充为4的CNN网络层和5个残差块后,再通过大小分别为2、3的上采样网络层,最终得到特征增强后的高分辨率车牌字符图像,其大小与原高分辨率图像大小相同,均为48×24,同时反馈损失LG并更新模型参数θG
2、构建图像识别模块
输入:生成的高分辨率车牌字符图像
输出:真假判断及识别结果
2.1构建图像判别网络模型D
图像判别网络部分包含两个卷积层,每个卷积层之后都连接批规范化层和LeakyReLU激活函数,以及两个预测分支,分别用于判断该样本是否来自原始图像IHR以及所属类别c。
2.2设计图像识别模块的损失函数LD
该模块的损失函数目标是使图像判别网络能尽可能区分真假数据且正确分类字符,包括两部分:判别损失LS和分类损失LC,计算公式如下:
LD=LS+LC (6)
其中,所述判别损失LS用来使判别器尽可能区分真假数据,所述分类损失LC用来区分正确的样本类别。
步骤1设计判别损失LS,用于提高判别器区分真假数据的能力:
Figure BDA0002495952390000101
其中
Figure BDA0002495952390000102
为判别器,θD为判别器的权重,N为样本数量。
步骤2设计分类损失LC,用来使识别模块预测的字符类别更准确:
Figure BDA0002495952390000103
其中P(C=c|IHR)表示HR样本中某样本C分类正确的概率,P(C=c|ISR)表示SR样本中某样本C分类正确的概率。
2.3判别输入的真假及所属类别,并迭代优化损失以更新模型参数θD
将生成的高分辨率字符图像输入到判别网络D中,输入的图像分辨率为48×12.首先经过两层卷积核大小为4,步长为2,填充为1的CNN网络层,提取的特征图大小为128×12×6;再将提取的特征图送入两个预测分支,其中判别分支将输出值通过Sigmoid函数映射到[0,1],从而得到该样本是否来自真实图像,若属于为1,否则为另一分类分支将输出值通过softmax函数映射到34维,从而得到该样本的分类标签c。同时反馈损失LD并更新模型参数θD
3、整体框架训练
基于GAN的对抗学习思想交替训练图像增强和识别两个模块,包括数据预处理、模型框架训练及测试阶段。
3.1数据预处理
通过对监控场景下获取的整张车牌图像集进行字符分割、下采样处理,去除汉字部分,获得可用于训练模型的高分辨率和低分辨率字符图像对。
输入:整张车牌图像集。
输出:低分辨率车牌字符图像集
步骤1先将输入的车牌图像二值化,并去除车牌的边框、铆钉等。进行垂直投影后计算峰值出现的次数:如果出现次数等于次数阈值7,则计算各峰的峰宽比,如果峰宽比符合条件则利用字符区域在垂直方向上的白色像素较多,而字符间白色像素较少的特性,通过检测垂直方向上的白色像素的数量来确定字符的边界,从而进行分割操作;如果出现次数不等于阈值7,则继续步骤2;
步骤2利用模板匹配进行字符分割,要先确定车牌区域的上下边界,并设置一个字符大小的窗口,从车牌区域的左侧向右滑动,找到白色像素的最大差值,将字符分割出来。
步骤3将分割后得到的高分辨率车牌字符图像归一化,处理到48×24大小,归一化后的高分辨车牌字符图像集记为HR;
步骤4通过4,6,8倍双三次下采样高分辨率车牌字符图像集HR,可得到分辨率大小为12×6、8×4和6×3的低分辨率车牌字符图像集LR。
3.2模型框架训练
输入:低分辨率字符图像集LR及对应的高分辨率字符图像集HR
输出:真假判别及分类结果
步骤1将低分辨率字符图像集LR输入图像增强模块中,经过堆叠的卷积网络层和上采样网络层后,得到特征增强后的高分辨率车牌字符图像集SR,计算该模块损失函数LG
步骤2将高分辨率字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块,通过图像判别网络判断输入是否为真实样本及其类别信息,计算该模块损失函数LD
步骤3根据整体模型框架的优化目标函数,联合训练图像增强和识别模块,交替更新生成网络G和判别网络D的参数θG、θD,其目标是使图像生成网络能生成更逼近真实图像的数据且判别网络能尽可能判断真假数据和正确分类:
Figure BDA0002495952390000111
其中,IHR为真实车牌字符图像集HR中某一样本,
Figure BDA0002495952390000112
为生成的高分辨率车牌字符图像集SR中某一样本,V(G,D)用来衡量样本集HR与SR相近似的程度,
Figure BDA0002495952390000121
表示IHR的期望,
Figure BDA0002495952390000122
表示
Figure BDA0002495952390000123
的期望。
训练模型时,将所有损失的权衡权值设为1,并使用带有动量项0.9的Adam优化器。对生成网络G和鉴别网络D进行从无到有的训练,每一层的权值初始化为零均值高斯分布,标准差为0.02,偏差初始化为0。该模型采用64例批量训练,迭代100次。初始学习速率设置为0.0002。
训练模型时,将所有损失的权衡权值设为1,并使用带有动量项0.9的Adam优化器。对生成网络G和鉴别网络D进行从无到有的训练,每一层的权值初始化为零均值高斯分布,标准差为0.02,偏差初始化为0。该模型采用64例批量训练,迭代100次。初始学习速率设置为0.0002。
3.3模型框架测试
输入:低分辨率的字符图像
输出:识别结果
步骤1将输入的低分辨率字符图像送入图像增强模块中,利用训练好的生成网络模型可以得到特征增强后的高分辨率车牌字符图像;
步骤2将步骤1得到的高分辨率字符图像送入图像识别模块中,利用训练好的判别网络模型识别其类别。
本发明中,如图2a所示为高分辨率车牌集示例,通过本发明所述的基于GAN的低分辨率识别方法,可对图2b中相应的低分辨率车牌图像进行分割,如图2c,并得到图像增强后的图2d及识别结果。
本发明提供了一种基于生成对抗网络的低分辨率车牌识别方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (10)

1.一种基于生成对抗网络的低分辨率车牌识别方法,其特征在于,包括如下步骤:
步骤1,构建图像增强模块:搭建图像生成网络,将低分辨率的车牌字符图像输入到模型中,通过迭代优化图像增强模块的损失函数来使图像增强模块生成高分辨率车牌字符图像;
步骤2,构建图像识别模块:搭建图像判别网络,利用步骤1生成的高分辨率车牌字符图像和真实图像一起输入到模型中,通过迭代优化图像识别模块的损失函数以提高图像判别网络真假判别能力和识别效果;
步骤3,整体框架训练:通过分割高分辨率车牌字符图像得到原始的字符图像集,经过下采样得到低分辨率字符图像集,基于GAN对抗学习的思想交替训练图像增强模块和图像识别模块,利用训练好的图像生成和判别模型实现低分辨率车牌的增强识别。
2.根据权利要求1所述的方法,其特征在于,步骤1包括以下步骤:
步骤1-1,构建图像生成网络模型G;
步骤1-2,设计图像增强模块的损失函数LG
步骤1-3,将输入的低分辨率的车牌字符图像ILR生成高分辨率车牌字符图像
Figure FDA0002495952380000011
并计算损失函数LG,通过不断迭代优化损失函数LG以更新生成网络模型G的参数θG
3.根据权利要求2所述的方法,其特征在于,步骤1-1中,所述图像生成网络G包含五个残差块,每个残差块中包含两个3×3的卷积层,卷积层后连接批规范化层,选取PReLU作为激活函数,再连接两个亚像素卷积层用来增大特征尺寸,亚像素卷积层即上采样网络层。
4.根据权利要求3所述的方法,其特征在于,步骤1-2中,所述图像增强模块的损失函数LG包括三部分:内容损失
Figure FDA0002495952380000012
对抗损失
Figure FDA0002495952380000013
和分类损失LC,采用不同权重进行加权计算如下:
Figure FDA0002495952380000014
其中,所述内容损失
Figure FDA0002495952380000015
为生成的高分辨率车牌字符图像与低分辨率的车牌字符图像之间的欧氏距离,所述对抗损失
Figure FDA0002495952380000016
用来生成让判别器无法区分的数据分布
Figure FDA0002495952380000017
所述分类损失LC用来区分正确的样本类别。
5.根据权利要求4所述的方法,其特征在于,步骤1-2中,所述内容损失包括均方误差损失和VGG特征损失,其中均方误差损失
Figure FDA0002495952380000021
表示像素空间的最小均方差:
Figure FDA0002495952380000022
其中r表示采样因子,x、y分别表示图像像素点的横、纵坐标,(IHR)x,y表示真实的高分辨率车牌字符图像的各个像素点,
Figure FDA0002495952380000023
表示生成网络合成的高分辨率车牌字符图像的各个像素点,W和H分别表示图像IHR的宽度和高度;
所述的VGG特征损失以预训练19层的VGG网络为基础,求生成的高分辨率车牌字符图像与低分辨率的车牌字符图像特征之间的欧式距离,在已经训练好的VGG网络上提取一层的特征图,将生成的高分辨率车牌字符图像当前层的特征图和低分辨率的车牌字符图像所对应的特征图进行比较:
Figure FDA0002495952380000024
其中
Figure FDA0002495952380000025
表示真实高分辨率车牌字符图像IHR和生成的高分辨率车牌字符
Figure FDA0002495952380000026
的VGG特征图之间的欧式距离;Wi,j和Hi,j分别表示VGG网络内各个特征图的宽度和高度;φi,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图;
所述对抗损失
Figure FDA0002495952380000027
用来生成让判别器无法区分的图像:
Figure FDA0002495952380000028
其中
Figure FDA0002495952380000029
为判别器,θD为判别器的权重,N为样本数量;
所述的分类损失LC用来使预测的字符类别更准确:
Figure FDA0002495952380000031
其中P(C=c|IHR)表示真实的高分辨率车牌字符图像IHR分类正确的概率,
Figure FDA0002495952380000032
表示图像生成网络合成的高分辨率车牌字符图像
Figure FDA0002495952380000033
分类正确的概率。
6.根据权利要求5所述的方法,其特征在于,步骤2包括如下步骤:
步骤2-1,构建图像判别网络模型D;
步骤2-2,设计图像识别模块的损失函数LD
步骤2-3,将生成的高分辨率车牌字符图像
Figure FDA0002495952380000034
和真实车牌字符图像IHR输入图像判别网络模型中,并计算损失LD,通过不断迭代优化LC以更新图像判别网络模型D的参数θD
7.根据权利要求6所述的方法,其特征在于,步骤2-1中所述的图像判别网络模型D包含两个卷积层,每个卷积层之后都连接批规范化层和LeakyReLU激活函数,最终通过两个预测分支:其一分支将输出值通过Sigmoid函数映射到[0,1],从而得到图像识别模块的输入样本是否来自真实车牌字符图像IHR,如果是,输出为1,否则为0;另一分支将输出值通过Softmax函数映射到Nt维,从而得到图像识别模块的输入样本的分类标签,其中Nt为样本总类别数。
8.根据权利要求7所述的方法,其特征在于,步骤2-2中所述的图像识别模块的损失函数LD包括两部分:判别损失LS和分类损失LC,计算公式如下:
LD=LS+LC
其中,所述判别损失LS用来使判别器区分真假数据,所述分类损失LC用来区分正确的样本类别;
所述判别损失LS表示判别器区分真假数据的能力:
Figure FDA0002495952380000041
其中
Figure FDA0002495952380000042
为判别器,θD为判别器的权重,N为样本数量;
所述的分类损失LC用来使图像识别模块预测的字符类别更准确:
Figure FDA0002495952380000045
其中P(C=c|IHR)表示真实的高分辨率车牌字符图像IHR分类正确的概率,
Figure FDA0002495952380000043
表示图像生成网络G合成的高分辨率车牌字符图像
Figure FDA0002495952380000044
分类正确的概率。
9.根据权利要求8所述的方法,其特征在于,步骤3包括如下步骤:
步骤3-1,数据预处理:对监控场景下获取的整张车牌图像集进行字符分割,去除汉字部分,得到真实的高分辨率字符图像集HR;通过下采样,得到低分辨率字符图像集LR;
步骤3-2,模型框架训练:基于GAN的对抗学习思想交替训练图像增强和识别两个模块,直到图像判别网络D无法区分输入图像的真假且能正确分类或满足迭代终止条件,则完成训练;
步骤3-3,模型框架测试:输入用于测试的低分辨率车牌,经过训练好的图像生成模型G后得到高分辨率车牌字符图像,再由图像判别模型D直接输出车牌识别结果,从而实现低分辨率车牌的增强识别。
10.根据权利要求9所述的方法,其特征在于,步骤3-1包括如下步骤:
步骤3-1-1,对监控场景下获取的整张车牌图像进行垂直投影后计算峰值出现的次数:如果出现次数等于次数阈值,则计算各峰的峰宽比,峰宽比符合条件的则利用垂直投影法进行字符分割;如果出现次数不等于阈值,则利用模板匹配进行字符分割,去除汉字部分;
步骤3-1-2,去除汉字部分后,将分割后的高分辨率车牌字符图像归一化,处理到m×n大小,m和n分别表示图像的高度和宽度,归一化后的高分辨车牌字符图像集记为HR;
步骤3-1-3,通过k倍双三次下采样,将高分辨率车牌字符图像集HR降为分辨率大小为(m/k,n/k)的低分辨率车牌字符图像集LR;
步骤3-2包括如下步骤:
步骤3-2-1,利用步骤3-1得到的低分辨率车牌字符图像集LR作为图像增强模块的输入,经过堆叠的卷积层和上采样网络层后,即图像生成网络G,得到特征增强后的高分辨率车牌字符图像集,记为SR;
步骤3-2-2,将真实车牌字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块,输出两个分支,其中一个分支输出Nt维的目标类别,Nt为字符样本类别数目;另一个分支输出1维的向量,用于判别是否为真实样本;
步骤3-2-3,根据整体模型框架的优化目标函数
Figure FDA0002495952380000056
联合训练图像增强模块和图像识别模块,交替更新图像生成网络模型G和图像判别网络模型D的参数θG、θD
Figure FDA0002495952380000051
其中,IHR为真实车牌字符图像集HR中一样本,
Figure FDA0002495952380000052
为真实车牌字符图像集SR中一样本,V(G,D)用来衡量样本集HR与SR相近似的程度,
Figure FDA0002495952380000053
表示IHR的期望,
Figure FDA0002495952380000054
表示
Figure FDA0002495952380000055
的期望。
CN202010418529.0A 2020-05-18 2020-05-18 一种基于生成对抗网络的低分辨率车牌识别方法 Active CN111461134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010418529.0A CN111461134B (zh) 2020-05-18 2020-05-18 一种基于生成对抗网络的低分辨率车牌识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010418529.0A CN111461134B (zh) 2020-05-18 2020-05-18 一种基于生成对抗网络的低分辨率车牌识别方法

Publications (2)

Publication Number Publication Date
CN111461134A true CN111461134A (zh) 2020-07-28
CN111461134B CN111461134B (zh) 2023-04-07

Family

ID=71684773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010418529.0A Active CN111461134B (zh) 2020-05-18 2020-05-18 一种基于生成对抗网络的低分辨率车牌识别方法

Country Status (1)

Country Link
CN (1) CN111461134B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915490A (zh) * 2020-08-14 2020-11-10 深圳清研智城科技有限公司 一种基于多尺度特征的车牌图像超分辨率重建模型及方法
CN112132181A (zh) * 2020-08-20 2020-12-25 黑龙江大学 一种基于生成式对抗网络的图像真伪识别方法
CN112215119A (zh) * 2020-10-08 2021-01-12 华中科技大学 一种基于超分辨率重建的小目标识别方法、装置及介质
CN112288737A (zh) * 2020-11-18 2021-01-29 中国人民解放军国防科技大学 一种基于超分辨率图像的舷号检测方法
CN112784857A (zh) * 2021-01-29 2021-05-11 北京三快在线科技有限公司 一种模型训练以及图像处理方法及装置
CN112906699A (zh) * 2020-12-23 2021-06-04 深圳市信义科技有限公司 一种车牌放大号的检测识别方法
CN112966792A (zh) * 2021-05-19 2021-06-15 腾讯科技(深圳)有限公司 血管图像分类处理方法、装置、设备及存储介质
CN113139906A (zh) * 2021-05-13 2021-07-20 平安国际智慧城市科技股份有限公司 一种生成器的训练方法、装置与存储介质
CN113344110A (zh) * 2021-06-26 2021-09-03 浙江理工大学 一种基于超分辨率重建的模糊图像分类方法
CN113591798A (zh) * 2021-08-23 2021-11-02 京东科技控股股份有限公司 文档文字的重建方法及装置、电子设备、计算机存储介质
CN113743218A (zh) * 2021-08-03 2021-12-03 科大讯飞股份有限公司 一种车牌识别方法、车牌识别装置和计算机可读存储介质
CN113837179A (zh) * 2021-09-16 2021-12-24 南京航空航天大学 一种处理图像的多判别gan网络构建方法、装置、系统和存储介质
CN114092926A (zh) * 2021-10-20 2022-02-25 杭州电子科技大学 一种复杂环境下的车牌定位和识别方法
CN115063876A (zh) * 2022-08-17 2022-09-16 季华实验室 一种图像识别率提升方法、装置、电子设备和存储介质
CN115546780A (zh) * 2022-11-29 2022-12-30 城云科技(中国)有限公司 车牌识别方法、模型及装置
CN116485652A (zh) * 2023-04-26 2023-07-25 北京卫星信息工程研究所 遥感影像车辆目标检测的超分辨率重建方法
CN113743218B (zh) * 2021-08-03 2024-05-31 科大讯飞股份有限公司 一种车牌识别方法、车牌识别装置和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596267A (zh) * 2018-05-03 2018-09-28 Oppo广东移动通信有限公司 一种图像重建方法、终端设备及计算机可读存储介质
CN109509152A (zh) * 2018-12-29 2019-03-22 大连海事大学 一种基于特征融合的生成对抗网络的图像超分辨率重建方法
CN109615582A (zh) * 2018-11-30 2019-04-12 北京工业大学 一种基于属性描述生成对抗网络的人脸图像超分辨率重建方法
CN110136063A (zh) * 2019-05-13 2019-08-16 南京信息工程大学 一种基于条件生成对抗网络的单幅图像超分辨率重建方法
CN110211045A (zh) * 2019-05-29 2019-09-06 电子科技大学 基于srgan网络的超分辨率人脸图像重建方法
CN111127316A (zh) * 2019-10-29 2020-05-08 山东大学 一种基于sngan网络的单幅人脸图像超分辨方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596267A (zh) * 2018-05-03 2018-09-28 Oppo广东移动通信有限公司 一种图像重建方法、终端设备及计算机可读存储介质
CN109615582A (zh) * 2018-11-30 2019-04-12 北京工业大学 一种基于属性描述生成对抗网络的人脸图像超分辨率重建方法
CN109509152A (zh) * 2018-12-29 2019-03-22 大连海事大学 一种基于特征融合的生成对抗网络的图像超分辨率重建方法
CN110136063A (zh) * 2019-05-13 2019-08-16 南京信息工程大学 一种基于条件生成对抗网络的单幅图像超分辨率重建方法
CN110211045A (zh) * 2019-05-29 2019-09-06 电子科技大学 基于srgan网络的超分辨率人脸图像重建方法
CN111127316A (zh) * 2019-10-29 2020-05-08 山东大学 一种基于sngan网络的单幅人脸图像超分辨方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
巨春武: "《基于生成对抗网络的图像复原算法研究》" *
王延年等: "《基于生成对抗网络的单帧图像超分辨算法》" *
邵保泰等: "《基于生成对抗网络的单帧红外图像超分辨算法》" *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915490A (zh) * 2020-08-14 2020-11-10 深圳清研智城科技有限公司 一种基于多尺度特征的车牌图像超分辨率重建模型及方法
CN112132181A (zh) * 2020-08-20 2020-12-25 黑龙江大学 一种基于生成式对抗网络的图像真伪识别方法
CN112132181B (zh) * 2020-08-20 2023-05-05 黑龙江大学 一种基于生成式对抗网络的图像真伪识别方法
CN112215119A (zh) * 2020-10-08 2021-01-12 华中科技大学 一种基于超分辨率重建的小目标识别方法、装置及介质
CN112288737A (zh) * 2020-11-18 2021-01-29 中国人民解放军国防科技大学 一种基于超分辨率图像的舷号检测方法
CN112906699A (zh) * 2020-12-23 2021-06-04 深圳市信义科技有限公司 一种车牌放大号的检测识别方法
CN112784857A (zh) * 2021-01-29 2021-05-11 北京三快在线科技有限公司 一种模型训练以及图像处理方法及装置
CN113139906A (zh) * 2021-05-13 2021-07-20 平安国际智慧城市科技股份有限公司 一种生成器的训练方法、装置与存储介质
CN113139906B (zh) * 2021-05-13 2023-11-24 平安国际智慧城市科技股份有限公司 一种生成器的训练方法、装置与存储介质
CN112966792B (zh) * 2021-05-19 2021-08-13 腾讯科技(深圳)有限公司 血管图像分类处理方法、装置、设备及存储介质
CN112966792A (zh) * 2021-05-19 2021-06-15 腾讯科技(深圳)有限公司 血管图像分类处理方法、装置、设备及存储介质
WO2022242392A1 (zh) * 2021-05-19 2022-11-24 腾讯科技(深圳)有限公司 血管图像分类处理方法、装置、设备及存储介质
CN113344110A (zh) * 2021-06-26 2021-09-03 浙江理工大学 一种基于超分辨率重建的模糊图像分类方法
CN113344110B (zh) * 2021-06-26 2024-04-05 浙江理工大学 一种基于超分辨率重建的模糊图像分类方法
CN113743218A (zh) * 2021-08-03 2021-12-03 科大讯飞股份有限公司 一种车牌识别方法、车牌识别装置和计算机可读存储介质
CN113743218B (zh) * 2021-08-03 2024-05-31 科大讯飞股份有限公司 一种车牌识别方法、车牌识别装置和计算机可读存储介质
CN113591798A (zh) * 2021-08-23 2021-11-02 京东科技控股股份有限公司 文档文字的重建方法及装置、电子设备、计算机存储介质
CN113591798B (zh) * 2021-08-23 2023-11-03 京东科技控股股份有限公司 文档文字的重建方法及装置、电子设备、计算机存储介质
CN113837179A (zh) * 2021-09-16 2021-12-24 南京航空航天大学 一种处理图像的多判别gan网络构建方法、装置、系统和存储介质
CN114092926A (zh) * 2021-10-20 2022-02-25 杭州电子科技大学 一种复杂环境下的车牌定位和识别方法
CN115063876B (zh) * 2022-08-17 2022-11-18 季华实验室 一种图像识别率提升方法、装置、电子设备和存储介质
CN115063876A (zh) * 2022-08-17 2022-09-16 季华实验室 一种图像识别率提升方法、装置、电子设备和存储介质
CN115546780B (zh) * 2022-11-29 2023-04-18 城云科技(中国)有限公司 车牌识别方法、模型及装置
CN115546780A (zh) * 2022-11-29 2022-12-30 城云科技(中国)有限公司 车牌识别方法、模型及装置
CN116485652A (zh) * 2023-04-26 2023-07-25 北京卫星信息工程研究所 遥感影像车辆目标检测的超分辨率重建方法
CN116485652B (zh) * 2023-04-26 2024-03-01 北京卫星信息工程研究所 遥感影像车辆目标检测的超分辨率重建方法

Also Published As

Publication number Publication date
CN111461134B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN111461134B (zh) 一种基于生成对抗网络的低分辨率车牌识别方法
CN108961235B (zh) 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
CN108830188B (zh) 基于深度学习的车辆检测方法
CN111368886B (zh) 一种基于样本筛选的无标注车辆图片分类方法
CN111259930A (zh) 自适应注意力指导机制的一般性目标检测方法
CN111814584A (zh) 基于多中心度量损失的多视角环境下车辆重识别方法
CN107194418B (zh) 一种基于对抗特征学习的水稻蚜虫检测方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN111986142A (zh) 一种热轧板卷表面缺陷图像数据无监督增强的方法
CN111738055A (zh) 多类别文本检测系统和基于该系统的票据表单检测方法
CN112800876A (zh) 一种用于重识别的超球面特征嵌入方法及系统
CN108681735A (zh) 基于卷积神经网络深度学习模型的光学字符识别方法
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
CN108108760A (zh) 一种快速人脸识别方法
CN113688821B (zh) 一种基于深度学习的ocr文字识别方法
CN115439458A (zh) 基于深度图注意力的工业图像缺陷目标检测算法
CN110852358A (zh) 一种基于深度学习的车辆类型判别方法
CN112541491A (zh) 基于图像字符区域感知的端到端文本检测及识别方法
CN113159215A (zh) 一种基于Faster Rcnn的小目标检测识别方法
CN111242046A (zh) 一种基于图像检索的地面交通标志识别方法
CN111368775A (zh) 一种基于局部上下文感知的复杂场景密集目标检测方法
CN113052215A (zh) 基于神经网络可视化的声呐图像自动目标识别方法
CN110188646B (zh) 基于梯度方向直方图与局部二值模式融合的人耳识别方法
CN115082922A (zh) 基于深度学习的水表数字图片处理方法及系统
CN113920364A (zh) 基于注意力机制及检测变换器的宫颈细胞检测与识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant