CN111767908A

CN111767908A - 字符检测方法、装置、检测设备及存储介质

Info

Publication number: CN111767908A
Application number: CN201910262671.8A
Authority: CN
Inventors: 张恒瑞; 郭明坚; 宋翔
Original assignee: SF Technology Co Ltd
Current assignee: SF Technology Co Ltd
Priority date: 2019-04-02
Filing date: 2019-04-02
Publication date: 2020-10-13
Anticipated expiration: 2039-04-02
Also published as: CN111767908B

Abstract

本申请实施例公开了一种字符检测方法、装置、检测设备及存储介质，本申请实施例可以采集待检测图像，并获取所述待检测图像中的字符区域；对所述字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度；将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符；将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符；根据所述至少一个组合字符从预设字符数据库中确定出目标字符。该方案中可以通过通配符来替换字符置信度较低的字符，以便后续可以进行排列组合并从预设字符数据库中匹配出目标字符，提高了字符检测的准确性。

Description

字符检测方法、装置、检测设备及存储介质

技术领域

本申请涉及数据处理技术领域，具体涉及一种字符检测方法、装置、检测设备及存储介质。

背景技术

随着科技的发展，光学字符识别(OCR，Optical Character Recognition)的应用越来越广泛，例如，可以应用于停车场、收费站或中转场等对车辆上的车牌进行识别。

现有技术中，以车牌识别为例，在对车牌进行识别的过程中，首先需要通过监控摄像头采集车牌图像，然后，利用形态学、自适应阈值或图像投影等方法，对车牌图像中的车牌进行识别。由于监控摄像头可能与车辆之间的距离较远或拍摄环境复杂等，采集到的车牌图像可能存在像素面积过小、光照不足、摄像头逆光、车牌反光或遮挡等，得到的图像质量较差，而导致车牌图像中的车牌模糊或无法识别等，使得车牌难以准确识别，识别出车牌的错误率较高，即导致识别准确率较低。

发明内容

本申请实施例提供一种字符检测方法、装置、检测设备及存储介质，可以提高字符检测的准确性。

第一方面，本申请实施例提供了一种字符检测方法，包括：

采集待检测图像，并获取所述待检测图像中的字符区域；

对所述字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度；

将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符；

将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符；

根据所述至少一个组合字符从预设字符数据库中确定出目标字符。

在一些实施方式中，所述采集待检测图像，并获取所述待检测图像中的字符区域包括：

采集多张待检测图像；

将每张待检测图像分别通过第一目标检测网络进行文本定位，得到每张待检测图像对应的文本位置，以及每个文本位置对应的文本置信度；

根据每个文本位置从对应的待检测图像中截取文本区域，得到多个文本区域；

根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域。

在一些实施方式中，所述根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域包括：

获取每个文本区域的像素面积；

根据所述像素面积和文本置信度，计算每个文本区域对应的评价值；

从多个文本区域中，筛选出评价值较高的前预设个文本区域；

对所述预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像；

通过第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置；

根据字符位置从对应的二值化图像中截取字符区域。

在一些实施方式中，所述对所述预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像包括：

对预设个文本区域进行尺寸归一化，得到统一尺寸的预设个文本区域；

通过生成式对抗网络对统一尺寸的预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像。

在一些实施方式中，所述对所述字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度包括：

获取训练后的深度学习网络GoogleNet；

通过所述训练后的深度学习网络GoogleNet对所述字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。

在一些实施方式中，所述预设阈值范围为大于第一阈值且小于第二阈值，所述将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符包括：

从每个字符区域对应字符中，筛选出字符置信度较高的前预设个字符；

将每个字符区域对应的预设个字符中，字符置信度小于或等于第一阈值的字符删除，并将大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。

在一些实施方式中，所述根据所述至少一个组合字符从预设字符数据库中确定出目标字符包括：

获取每个字符区域对应的处理后字符的置信度；

根据处理后字符的置信度计算每个组合字符对应的置信度，并筛选出置信度最大的组合字符，得到候选组合字符。

将所述候选组合字符与预设字符数据库中预先存储的字符串进行匹配，并根据匹配结果确定出目标字符。

第二方面，本申请实施例还提供了一种字符检测装置，包括：

获取模块，用于采集待检测图像，并获取所述待检测图像中的字符区域；

检测模块，用于对所述字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度；

替换模块，用于将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符；

组合模块，用于将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符；

确定模块，用于根据所述至少一个组合字符从预设字符数据库中确定出目标字符。

在一些实施方式中，所述获取模块包括：

采集单元，用于采集多张待检测图像；

定位单元，用于将每张待检测图像分别通过第一目标检测网络进行文本定位，得到每张待检测图像对应的文本位置，以及每个文本位置对应的文本置信度；

截取单元，用于根据每个文本位置从对应的待检测图像中截取文本区域，得到多个文本区域；

确定单元，用于根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域。

在一些实施方式中，所述确定单元包括：

获取子单元，用于获取每个文本区域的像素面积；

计算子单元，用于根据所述像素面积和文本置信度，计算每个文本区域对应的评价值；

筛选子单元，用于从多个文本区域中，筛选出评价值较高的前预设个文本区域；

处理子单元，用于对所述预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像；

识别子单元，用于通过第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置；

截取子单元，用于根据字符位置从对应的二值化图像中截取字符区域。

在一些实施方式中，所述处理子单元具体用于：

在一些实施方式中，所述检测模块具体用于：获取训练后的深度学习网络GoogleNet；通过所述训练后的深度学习网络GoogleNet对所述字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。

在一些实施方式中，所述预设阈值范围为大于第一阈值且小于第二阈值，所述替换模块具体用于：

在一些实施方式中，所述确定模块具体用于：

获取每个字符区域对应的处理后字符的置信度；

第三方面，本申请实施例还提供了一种检测设备，包括存储器和处理器，所述存储器中存储有程序代码，所述处理器调用所述存储器中的程序代码时执行本申请实施例提供的任一种字符检测方法中的步骤。

第四方面，本申请实施例还提供了一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例提供的任一种字符检测方法中的步骤。

本申请实施例可以采集待检测图像，并获取待检测图像中的字符区域，然后对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度。其次，将每个字符区域对应的字符置信度位于预设阈值范围内(即字符置信度较低)的字符，替换为通配符，得到每个字符区域对应的处理后字符；此时，可以将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符，从而可以基于至少一个组合字符从预设字符数据库中确定出目标字符。该方案中可以利用通配符来替换字符置信度较低的字符，得到处理后字符，以便可以基于处理后字符的排列组合所得到的组合字符，从预设字符数据库中匹配出目标字符，避免图像质量较差而识别出错误字符，并利用错误字符作为检测结果，提高了字符检测的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的字符检测方法的流程示意图；

图2是本申请实施例提供的文本区域检测的示意图；

图3是本申请实施例提供的车牌区域检测的示意图；

图4是本申请实施例提供的门牌区域检测的示意图；

图5是本申请实施例提供的路牌区域检测的示意图；

图6是本申请实施例提供的GAN网络的示意图；

图7是本申请实施例提供的字符检测的示意图；

图8是本申请实施例提供的字符组合的示意图；

图9是本申请实施例提供的字符检测方法的另一流程示意图；

图10是本申请实施例提供的车牌检测的示意图；

图11是本申请实施例提供的字符检测装置的结构示意图；

图12是本申请实施例提供的检测设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1是本申请一实施例提供的字符检测方法的流程示意图。该字符检测方法的执行主体可以是本申请实施例提供的字符检测装置，或者集成了该字符检测装置的检测设备，其中，该字符检测装置可以采用硬件或者软件的方式实现，该检测设备可以是终端和服务器等，该终端可以包括智能手机、平板电脑、掌上电脑、台式电脑或者笔记本电脑等。该字符检测方法可以包括：

S101、采集待检测图像，并获取待检测图像中的字符区域。

其中，待检测图像可以包括一张或多张，该待检测图像中可以包括字符区域，该字符区域可以包括门牌区域、车牌区域或路牌区域等，该字符区域的形状、位置、或大小等可以根据实际需要进行灵活设置，可选地，该字符区域可以是矩形区域。

同一张待检测图像可以包括一个或者多个字符区域，该待检测图像中可以包括完整的字符区域，也可以仅包括局部字符区域等，该车辆样本图像中包含的字符区域的拍摄角度可以是正面、侧面或俯视等角度。

需说明的是，该待检测图像中包含的字符区域的拍摄角度、类型和数量等可以根据实际需要进行灵活设置，具体内容在此处不作限定。

例如，字符检测装置可以通过停车场、收费站、道路、或物流中转场等场合的监控摄像头，采集一张或多张包含车辆车牌的待检测图像，然后从待检测图像中提取出车牌区域。

又例如，字符检测装置可以通过小区的监控摄像头、大厦的监控摄像头、或用户手持的手机、照相机或摄像头等，采集一张或多张包含门牌的待检测图像，然后从待检测图像中提取出门牌区域。

又例如，字符检测装置可以通过车辆上安装的摄像头，道路的监控摄像头、或用户手持的手机、照相机或摄像头等，采集一张或多张包含路牌的待检测图像，然后从待检测图像中提取出路牌区域。

又例如，字符检测装置可以在服务器预设的数据库中下载待检测图像等，当然，待检测图像的采集方式还可以是其他的采集方式，具体方式在此处不作限定。

在一些实施方式中，采集待检测图像，并获取待检测图像中的字符区域可以包括：

(1)采集多张待检测图像；

(2)将每张待检测图像分别通过第一目标检测网络进行文本定位，得到每张待检测图像对应的文本位置，以及每个文本位置对应的文本置信度；

(3)根据每个文本位置从对应的待检测图像中截取文本区域，得到多个文本区域；

(4)根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域。

为了提高对文本位置检测的准确性，字符检测装置可以采用第一目标检测网络进行文本定位，其中，第一目标检测网络可以是目标检测网络(SSD，Single Shot MultiBoxDetector)，字符检测装置预先对第一SSD网络进行训练，例如，可以获取多张包含各类目标文本区域的样本图像，以及获取每张样本图像中目标文本区域的真实位置，该真实位置可以是目标文本区域的顶点坐标，根据该顶点坐标可以确定目标文本区域在样本图像中的位置。然后，将多张样本图像分别输入第一SSD网络，并通过第一SSD网络计算每张样本图像中目标文本区域的位置，得到预测位置，此时，可以将真实位置与预测位置进行收敛，通过调整第一SSD网络的参数至合适数值，以降低真实位置与预测位置之间的误差，便可得到训练后的第一SSD网络。

在得到训练后的第一SSD网络后，为了提高字符检测的可靠性，字符检测装置可以采集多张待检测图像，该多张待检测图像可以是在不同位置、不同时间或不同角度拍摄到同一字符区域的图像。在采集到多张待检测图像后，字符检测装置可以利用训练后的第一SSD网络分别对每张待检测图像进行文本定位，得到每张待检测图像对应的文本位置，以及每个文本位置对应的文本置信度。该文本置信度可以是文本位置概率的置信区间，例如，待检测图像A中文本位置a的文本置信度为0.9，待检测图像B中文本位置b的文本置信度为0.6等。在文本定位阶段，用第一SSD网络检测文本位置，该第一SSD网络对不同尺度的目标适应性较好，能精准检测出较大区域的文本位置，也能够精准检测出小区域的文本位置。

其中，该文本可以由字符组成，即文本区域包含字符区域。该文本位置可以是文本所在区域的坐标，例如，如图2所示，该文本位置可以包括文本区域的左下顶角的顶点坐标M(xm，ym)，以及文本区域的右上顶角的顶点坐标N(xn，yn)，此时，根据顶点坐标M和顶点坐标N可以确定文本位置为：xm≤x≤xn且ym≤y≤yn，即文本区域内的每个坐标点(x，y)满足xm≤x≤xn且ym≤y≤yn。其中，xm为文本区域的左下顶角的横坐标值，ym是文本区域的左下顶角的纵坐标值，xn为文本区域的右上顶角的横坐标值，yn为文本区域的右上顶角的纵坐标值。或者，可以获取文本区域的左上顶角的顶点坐标和右下顶角的顶点坐标等，来作为文本位置。

在得到文本位置后，字符检测装置可以根据每个文本位置从对应的待检测图像中截取文本区域，得到多个文本区域；例如，若文本位置a位于待检测图像A中，则此时可以根据文本位置a从待检测图像A中截取文本区域，到文本位置a对应的文本区域N1；若文本位置b位于待检测图像B中，则此时可以根据文本位置b从待检测图像B中截取文本区域，到文本位置b对应的文本区域N2；若文本位置c位于待检测图像C中，则此时可以根据文本位置C从待检测图像B中截取文本区域，到文本位置c对应的文本区域N3；等等，即多个文本区域包括文本区域N1、文本区域N2和文本区域N3等。

例如，如图3所示，当采集到包含车牌的待检测图像时，可以通过SSD网络对该待检测图像进行车牌定位，得到该待检测图像对应的车牌位置和车牌置信度，根据该车牌位置从该待检测图像中截取车牌区域。

又例如，如图4所示，当采集到包含门牌的待检测图像时，可以通过SSD网络对该待检测图像进行门牌定位，得到该待检测图像对应的门牌位置和门牌置信度，根据该门牌位置从该待检测图像中截取门牌区域。

又例如，如图5所示，当采集到包含路牌的待检测图像时，可以通过SSD网络对该待检测图像进行路牌定位，得到该待检测图像对应的路牌位置和路牌置信度，根据该路牌位置从该待检测图像中截取路牌区域。

在得到文本区域后，字符检测装置可以根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域，该字符区域可以是文本区域中组成文本的各个字符所在的区域。例如，若文本区域N1中包含的文本为A123，则可以根据待检测图像A中文本区域N1和文本置信度，确定待检测图像A中的字符A区域、字符1区域、字符2区域和字符3区域等。

在一些实施方式中，根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域可以包括：

(a)获取每个文本区域的像素面积；

(b)根据像素面积和文本置信度，计算每个文本区域对应的评价值；

(c)从多个文本区域中，筛选出评价值较高的前预设个文本区域；

(d)对预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像；

(e)通过第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置；

(f)根据字符位置从对应的二值化图像中截取字符区域。

为了提高对字符检测的准确性和效率，字符检测装置可以从多个文本区域中筛选出质量较好的文本区域进行字符识别。具体地，首先，可以获取每个文本区域的像素面积，该像素面积即为文本区域的面积，例如，可以根据文本区域长边包含的像素点个数X，以及文本区域宽边包含的像素点个数Y，计算该文本区域的像素面积S＝X*Y。然后，可以根据像素面积和文本置信度，计算每个文本区域对应的评价值，例如，评价值＝像素面积*文本置信度，该评价值越高，文本区域的图像质量越好，反之该评价值越低，文本区域的图像质量越差。其次，可以对多个文本区域按照评价值从高至低的顺序进行排序，从排序后的多个文本区域中，筛选出评价值较高的前预设个文本区域，该预设个文本区域的数量可以根据实际需要进行灵活设置，例如，筛选出评价值排在前3个或6个文本区域等。从而可以筛选出图像质量较好的文本区域，去除像素面积过小或较模糊的文本区域，以便后续可以精准识别出文本区域内的字符。

例如，对于包含车牌号均为粤B123的多张待检测图像，在得到每张待检测图像对应的车牌区域后，可以计算每个车牌区域对应的评价值，并从中筛选出评价值较高的前6个粤B123车牌区域。

在筛选出预设个文本区域后，字符检测装置可以对预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像，进行二值化处理的方式可以根据实际需要进行灵活设置，具体内容在此处不作限定。

在一些实施方式中，对预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像可以包括：对预设个文本区域进行尺寸归一化，得到统一尺寸的预设个文本区域；通过生成式对抗网络对统一尺寸的预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像。

为了解决文本区域光照不足、逆光或反光等等复杂光照的影响，可以采用生成式对抗网络(GAN，Generative Adversarial Networks)，对文本区域进行二值化处理。其中，如图6所示，GAN网络可以包括生成器和判别器等，首先，可以对GAN网络进行对抗训练，例如，可以获取多张包含各类文本区域的样本图像(即原始图像)，以及获取每张样本图像中的真实二值化图像，该真实二值化图像可以是样本图像对应的标准二值化图像(即标注好的二值化图像)。然后，将多张样本图像分别输入GAN网络，并通过GAN网络的生成器G输出每张样本图像对应的二值化图像，得到预测二值化图像，此时，可以通过GAN网络的判别器D将真实二值化图像与预测二值化图像进行收敛，通过调整GAN网络的参数至合适数值，以降低真实二值化图像与预测二值化图像之间的误差，便可得到训练后的GAN网络。此时，将一张彩色原始图像输入训练后的GAN网络，即可输出二值化图像。

在得到训练后的GAN网络，以及筛选出预设个文本区域后，为了提高二值化处理的效果及对字符检测的准确性，字符检测装置可以对预设个文本区域进行尺寸归一化，得到统一尺寸的预设个文本区域，即每个文本区域的长和宽均一致，其中，归一化后得到的统一尺寸的大小可以根据实际需要进行灵活设置。此时，可以通过训练后的GAN网络对统一尺寸的预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像，从而可以得到质量较高的二值化图，解决了复杂光照的影响。

其中，第二目标检测网络可以是目标检测网络(SSD，Single Shot MultiBoxDetector)，该第二目标检测网络与上述第一目标检测网络的参数不同。字符检测装置预先对第二目标检测网络进行训练，例如，可以获取多张包含各类目标字符区域的二值化样本图像，以及获取每张二值化样本图像中目标字符区域的真实位置，该真实位置可以是目标字符区域的顶点坐标，根据该顶点坐标可以确定目标字符区域在二值化样本图像中的位置。然后，将多张二值化样本图像分别输入第二目标检测网络，并通过第二目标检测网络计算每张二值化样本图像中目标字符区域的位置，得到预测位置，此时，可以将真实位置与预测位置进行收敛，通过调整第二目标检测网络的参数至合适数值，以降低真实位置与预测位置之间的误差，便可得到训练后的第二目标检测网络。

在得到二值化图像后，可以通过训练后的第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置，该字符位置可以是字符所在区域的坐标，例如，字符区域的顶点坐标，可选地，该字符区域可以是矩形框，该矩形框的大小可以根据实际需要进行灵活设置。此时，可以根据字符位置从对应的二值化图像中截取字符区域。例如，如图7所示，当文本区域内包括的文本为Z8657时，可以通过训练后的第二目标检测网络从该文本区域对应的二值化图像中，定位出字符Z、字符8、字符6、字符5和字符7的位置(如四边形区域)，可以基于各字符的位置截取出各字符区域，从而完成字符分割。使得在字符分割阶段使用第二目标检测网络对每个字符进行定位，省去了人工提取字符特征和调整参数等麻烦。

需要说明的是，为了精准分割出文本区域中的每个字符，可以设置第二目标检测网络识别所有字符位置的矩形框的长和宽之间的比例均相同，即每个字符区域的长和宽之间的比例均相同，这样对于二值化后不同字符边缘之间粘连的情况，也能够精准将各个字符切割出来，减少了字符分割错误，提高了后续字符识别的准确率。

S102、对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度。

其中，该字符可以包括数字、字母或文字等，同一字符区域可以检测出一个或多个字符，该字符置信度可以是字符概率的置信区间(例如是字符A的字符置信度为0.9)，同一字符区域检测出的不同字符之间的置信度可以相同，也可以不同，同一字符区域检测出的不同字符之间的置信度之和为1。

在得到字符区域后，字符检测装置可以对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度。例如，若检测到该张待检测图像中的字符区域包括2个，则可以分别对这2个字符区域进行字符检测，得到字符区域A对应的字符a和字符b，该字符a对应的字符置信度为0.9，该字符b对应的字符置信度为0.1；得到字符区域B对应的字符c、字符d和字符e，该字符c对应的字符置信度为0.6，该字符d对应的字符置信度为0.1，该字符e对应的字符置信度为0.3。同样的，当待检测图像包括多张时，需要分别对每张待检测图像中的每个字符区域进行字符检测。

在一些实施方式中，对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度可以包括：获取训练后的深度学习网络GoogleNet；通过训练后的深度学习网络GoogleNet对字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。

为了提高字符检测的准确性和效率，字符检测装置可以使用深度学习网络GoogleNet对字符进行分类(即对字符进行检测)，其中，该GoogleNet网络GoogleNet的分类性能远优于支持向量机(SVM，Support Vector Machine)等机器学习分类法，同时运行速度也比较快，兼顾了检测速度和精度。

首先，字符检测装置可以预先对GoogleNet网络进行训练，例如，可以获取多张包含各类字符区域的样本图像，以及获取每张样本图像中字符区域对应的真实字符，该真实字符可以是字符区域内正确的字符。然后，将多张样本图像分别输入GoogleNet网络，并通过GoogleNet网络检测每张样本图像中字符区域内的字符，得到预测字符，此时，可以将真实字符与预测字符进行收敛，通过调整GoogleNet网络的参数至合适数值，以降低真实位置与预测位置之间的误差，便可得到训练后的GoogleNet网络。

然后，在得到字符区域后，字符检测装置可以通过训练后的GoogleNet网络对字符区域进行字符识别，得到每个字符区域对应的字符和每个字符对应的字符置信度。例如，若检测到该张待检测图像中的字符区域包括1个，则可以通过训练后的GoogleNet网络分别对该字符区域进行字符识别，得到该字符区域对应的字符1、字符2、字符3、字符4和字符5，该字符1至字符5对应的字符置信度分别为0.1、0.5、0.18、0.12和0.1。

S103、将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符。

为了避免字符识别错误的影响，提高了字符识别的准确性，可以引入通配符，该通配符用于代替真正字符，通配符的类型可以根据实际需要灵活设置，例如，该通配符可以包括下划线_、@、#、￥、％、&、/或～等符号。

例如，字符检测装置可以将每个字符区域对应的字符置信度与预设阈值范围进行比较，该预设阈值范围根据实际需要进行灵活设置，具体取值在此处不作限定。

当同一字符区域对应多个字符时，每个字符对应一个字符置信度，此时该字符区域可以对应有多个字符置信度，此时需要分别将每个字符对应的字符置信度分别与预设阈值范围进行比较。

当该预设阈值范围为大于X1且小于X2时，若字符区域对应的某个字符的字符置信度小于X1，则说明字符的置信度非常低，即该字符区域内正确字符为该某个字符的概率非常小；若字符区域对应的某个字符的字符置信度大于X1且小于X2，则说明字符的置信度比较低；若字符区域对应的某个字符的字符置信度大于或等于X2，则说明字符的置信度比较高，即该字符区域内正确字符为该某个字符的概率比较大。

此时，字符检测装置可以从每个字符区域的每个字符对应的字符置信度与预设阈值范围的比较结果中，筛选出位于预设阈值范围内的字符，并将字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符，当字符区域A对应的字符未全部替换为通配符时，该字符区域A对应的处理后字符中可以包括未被替换的字符和通配符。例如，对于检测到字符区域A对应的字符a、字符b和字符c，若字符b的字符置信度位于预设阈值范围内，则可以将字符b替换为通配符，得到字符区域A的处理后字符包括字符a、通配符和字符c。

需要说明的是，不同字符区域对应的字符被替换成的通配符可以一致，也可以不一致，例如，字符区域A对应的字符a替换为通配符“_”，字符区域B对应的字符b替换为通配符“#”，或者，字符a和字符b均替换为通配符“_”。同一字符区域对应的多个字符被替换成的通配符可以一致，也可以不一致，例如，字符区域C对应的字符c替换为通配符“_”，字符区域C对应的字符d替换为通配符“#”，或者，字符c和字符d均替换为通配符“#”。

在一些实施方式中，当预设阈值范围为大于第一阈值且小于第二阈值时，将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符可以包括：从每个字符区域对应字符中，筛选出字符置信度较高的前预设个字符；将每个字符区域对应的预设个字符中，字符置信度小于或等于第一阈值的字符删除，并将大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。

为了减少计算量，提高检测效率和可靠性，可以对字符进行筛选，例如，可以对每个字符区域对应字符按照字符置信度从高至低进行排序，从每个字符区域对应字符中，筛选出字符置信度排在前的预设个字符，该预设个字符的数量可以根据实际需要进行灵活设置，例如，对于每个字符区域对应多个字符，可以筛选出字符置信度排在前的5个字符。

然后，从每个字符区域对应的预设个字符中，筛选出字符置信度小于或等于第一阈值的字符，并将筛选出的字符置信度小于或等于第一阈值的字符删除；以及，从每个字符区域对应的预设个字符中，筛选出字符置信度大于第一阈值且小于第二阈值的字符，并将筛选出的字符置信度大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。该第一阈值和第二阈值可以根据实际需要进行灵活设置，具体取值在此处不作限定。

其中，某个字符被替换为通配符后，可以为该通配符设置置信度，该通配符的置信度可以是：通配符的置信度＝第一阈值+第二阈值-被替换前的字符的置信度，当然，该通配符的置信度也可以根据实际需要进行灵活设置。

S104、将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符。

在得到每个字符区域对应的处理后字符后，字符检测装置可以将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符。例如，如图8所示，当待检测图像中包括第一字符区域、第二字符区域和第三字符区域等3个字符区域时，若第一字符区域对应的处理后字符包括A和通配符“#”，第二字符区域对应的处理后字符包括1和I，第三字符区域对应的处理后字符包括0和6，则对这三个字符区域对应的处理后字符进行排列组合，得到的组合字符可以包括：A10、A16、AI0、AI6、#10和#16等6个组合字符。

需要说明的是，当待检测图像包括多张时，可以分别获取每张待检测图像中的字符区域，并分别对每张待检测图像对应的字符区域进行字符检测及处理，得到每个字符区域对应的处理后字符，此时，可以分别对每张待检测图像对应的处理后字符进行排列组合，得到每张待检测图像对应的组合字符。

此外，当同一待检测图像中包括多个文本区域时，可以分别对每个文本区域进行字符识别，以得到字符区域，并分别对每个文本区域对应的字符区域进行字符检测及处理，得到每个字符区域对应的处理后字符，此时，可以分别对每个文本区域对应的处理后字符进行排列组合，得到每个文本区域对应的组合字符。

S105、根据至少一个组合字符从预设字符数据库中确定出目标字符。

其中，预设字符数据库可以是预先存储有字符串，该字符串可以是单个字符，或多个字符组合，该字符串中的字符可以包括字母、数字或文字等，该字符串可以是车牌、门牌或路牌等。例如，该预设字符数据库中可以存储有多个不同的车牌号，多个不同的车牌号可以按照不同省或不同市进行分组存储等。又例如，该预设字符数据库中可以存储有多个不同的门牌等，多个不同的门牌可以按照不同区域分组存储等。又例如，该预设字符数据库中可以存储有多个不同的路牌等，多个不同的路牌可以按照不同路段分组存储等。

为了保证得到目标字符的准确性，在得到一个或多个组合字符后，字符检测装置可以从一个或多个组合字符中筛选出最终确定的一个组合字符，得到目标字符。

在一些实施方式中，根据至少一个组合字符从预设字符数据库中确定出目标字符可以包括：获取每个字符区域对应的处理后字符的置信度；根据处理后字符的置信度计算每个组合字符对应的置信度，并筛选出置信度最大的组合字符，得到候选组合字符。将候选组合字符与预设字符数据库中预先存储的字符串进行匹配，并根据匹配结果确定出目标字符。

由于在通过GoogleNet网络对字符区域进行字符检测时，可以得到每个字符区域对应的字符，以及每个字符对应的字符置信度，以及在将字符替换为通配符后，可以根据为该通配符设置置信度，例如，通配符的置信度可以是：通配符的置信度＝第一阈值+第二阈值-被替换前的字符的置信度，因此，字符检测装置可以基于上述获取到每个字符区域对应的处理后字符的置信度，此时可以根据处理后字符的置信度计算每个组合字符对应的置信度，例如，可以取该组合字符中各字符的字符置信度的平均值，作为该组合字符对应的置信度，即：

其中，plate_conf表示组合字符对应的置信度，char_conf_i表示字符的字符置信度，n表示组合字符中包含字符的个数。

在计算得到每个组合字符的置信度后，可以筛选出置信度最大的组合字符，得到候选组合字符。由于候选组合字符中可能包含通配符，或者候选组合字符中可能未包含文本区域中的所有字符，例如，在检测文本区域后，仅检测文本区域中的部分字符，因此，为了提高目标字符检测的准确性和完整性，此时可以将候选组合字符与预设字符数据库中预先存储的字符串进行匹配。

例如，当候选组合字符为B123#，该候选组合字符中包含通配符“#”，此时，可以从预设字符数据库中查找包含B123，且字符3后面还有一位字符的字符串，得到B1236，此时可以将匹配出的B1236作为目标字符，从而可以得到准确的目标字符。

又例如，当候选组合字符中仅包含文本区域中的部分字符时，例如，文本区域中的字符为粤B Z8657，而在进行字符检测时，仅对Z8657的字符区域进行检测，得到候选组合字符为Z8657，此时，可以从预设字符数据库中查找包含Z8657，且字符Z前面还有字符的字符串，得到粤B Z8657，此时可以将匹配出的粤B Z8657作为目标字符，从而可以得到完整的目标字符。

由此可见，通配符的加入与数据库匹配等结合，使得个别字符模糊也能不出错，有效解决远距离、复杂光照条件下字符识别问题，最后可以通过数据库匹配进行纠正。此外，可以舍弃识别部分字符，用已识别的字符去数据库匹配该部分字符，例如可以仅识别字母和数字，然后去数据库匹配中文等，大大提高了字符检测的效率、灵活性和准确性。

需要说明的是，当对多个包含同一文本区域的多张待检测图像进行检测时(例如，通过摄像头对同一车牌进行连续采集，得到多张待检测车牌图像)，可以分别对每张待检测图像进行字符检测，得到每张待检测图像对应的组合字符。此时，可以对各组合字符进行融合处理，确定出一个候选组合字符，例如，筛选出置信度最大的组合字符，或者各组合字符之间进行对应字符的一一比对，当某个位置的字符不一致时，可以筛选出置信度最高的字符作为该位置对应的字符，从而确定出可信度最高的一个候选组合字符。然后，将候选组合字符与预设字符数据库中的字符串进行匹配，根据匹配结果确定出目标字符。

根据上述实施例所描述的字符检测方法，以下将作进一步详细说明。

请参照图9，图9为本申请实施例提供的字符检测方法的另一流程示意图。该字符检测方法可以应用于检测设备，本实施例中将以检测设备对车牌进行检测为例，如图9所示，该字符检测方法的流程可以如下：

S201、采集多张待检测的车牌图像。

为了提高对车牌检测的可靠性，检测设备可以通过停车场、收费站、道路、或物流中转场等场合的监控摄像头，连续或每间隔预设时间采集多张待检测的车牌图像，该车牌图像中可以包括车牌区域，该车牌区域的形状、位置、或大小等可以根据实际需要进行灵活设置。同一张车牌图像可以包括一个或者多个车牌区域，该车牌区域中可以包括完整的车牌，也可以仅包括局部车牌等。

S202、将每张车牌图像分别通过第一目标检测网络进行车牌定位，得到每张车牌图像对应的车牌位置和车牌置信度。

为了提高对车牌位置检测的准确性，检测设备可以采用第一目标检测网络进行车牌定位，其中，第一目标检测网络可以是SSD网络，检测设备可以预先对第一目标检测网络进行训练，得到训练后的第一目标检测网络。

在得到训练后的第一目标检测网络后，检测设备可以利用训练后的第一目标检测网络分别对每张待检测的车牌图像进行车牌定位，得到每张车牌图像对应的车牌位置，以及每个车牌位置对应的车牌置信度。该车牌置信度可以是车牌位置概率的置信区间，例如，车牌图像A中车牌位置a的车牌置信度为0.9，车牌图像B中车牌位置b的车牌置信度为0.6等。在车牌定位阶段，通过对第一目标检测网络进行训练，并调整第一目标检测网络对不同尺度的车牌位置适应性，使用第一目标检测网络检测车牌位置，该第一目标检测网络对不同尺度的车牌位置适应性较好，能精准检测出较大区域的车牌位置，也能够精准检测出小区域的车牌位置。

S203、根据每个车牌位置从对应的车牌图像中截取车牌区域，并获取车牌区域的像素面积。

在得到每张车牌图像对应的车牌位置后，检测设备可以根据每个车牌位置从对应的车牌图像中截取车牌区域，得到多张车牌区域(即多个车牌区域)；例如，若车牌位置a位于车牌图像A中，则此时可以根据车牌位置a从车牌图像A中截取车牌区域，到车牌位置a对应的车牌区域N1；若车牌位置b位于车牌图像B中，则此时可以根据车牌位置b从车牌图像B中截取车牌区域，到车牌位置b对应的车牌区域N2；若车牌位置c位于车牌图像C中，则此时可以根据车牌位置C从车牌图像B中截取车牌区域，到车牌位置c对应的车牌区域N3；等等，即多张车牌区域包括车牌区域N1、车牌区域N2和车牌区域N3等。

例如，如图10所示，检测设备可以基于车牌位置从对应的车牌图像中截取车牌区域。

为了提高对字符检测的准确性和效率，检测设备可以从多张车牌区域中筛选出质量较好的车牌区域进行字符识别。具体地，首先，可以获取每张车牌区域的像素面积，该像素面积即为车牌区域的面积，例如，可以根据车牌区域长边包含的像素点个数X，以及车牌区域宽边包含的像素点个数Y，计算该车牌区域的像素面积S＝X*Y。

S204、根据车牌区域的像素面积和车牌置信度，计算每张车牌区域对应的评价值。

在得到车牌区域的像素面积和车牌置信度后，检测设备可以根据像素面积和车牌置信度，计算每张车牌区域(即每个车牌区域)对应的评价值，例如，评价值＝像素面积*车牌置信度，该评价值越高，车牌区域的图像质量越好，反之该评价值越低，车牌区域的图像质量越差。

S205、从多张车牌区域中，筛选出评价值较高的前预设张车牌区域。

检测设置可以对多张车牌区域按照评价值从高至低的顺序进行排序，从排序后的多张车牌区域中，筛选出评价值较高的前预设张车牌区域，该预设张车牌区域的数量可以根据实际需要进行灵活设置，例如，筛选出评价值排在前3个或6张车牌区域等。

例如，装卸口的监控摄像头一般安装在接近天花板的位置，车辆停靠到位时，监控摄像头与车牌的之间的距离都比较大，而在车辆的停靠和离开过程中，监控摄像头与车牌的之间的距离更加大，导致采集到车牌图像中车牌的像素面积过小，因此，可以从多张车牌区域中筛选出评价值较高的前预设张车牌区域，从而可以筛选出图像质量较好的车牌区域，去除像素面积过小或较模糊的车牌区域，以便后续可以精准识别出车牌区域内的字符。

S206、对预设张车牌区域进行尺寸归一化，得到统一尺寸的预设张车牌区域。

为了提高二值化处理的效果及对字符检测的准确性，检测设备可以对预设张车牌区域进行尺寸归一化，得到统一尺寸的预设张车牌区域，即每张车牌区域的长和宽均一致，其中，归一化后得到的统一尺寸的大小可以根据实际需要进行灵活设置。

S207、通过生成式对抗网络对统一尺寸的预设张车牌区域进行二值化处理，得到每张车牌区域对应的二值化图像。

在筛选出预设张车牌区域并进行尺寸归一化后，检测设备可以对统一尺寸的预设张车牌区域进行二值化处理，得到每张车牌区域对应的二值化图像。

为了解决车牌区域光照不足、逆光或反光等等复杂光照的影响，可以采用GAN网络对车牌区域进行二值化处理。首先，可以对GAN网络进行对抗训练，得到训练后的GAN网络，在得到训练后的GAN网络，以及筛选出统一尺寸的预设张车牌区域后，此时，可以通过训练后的GAN网络对统一尺寸的预设张车牌区域进行二值化处理，得到每张车牌区域对应的二值化图像。例如，如图10所示，可以得到包含Z8657字符的二值化图像，从而可以得到质量较高的二值化图，解决了复杂光照的影响。

S208、通过第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置，并根据字符位置从对应的二值化图像中截取字符区域。

在得到二值化图像后，检测设备可以对每张二值化图像进行字符识别，以确定字符区域，该字符区域可以是车牌区域中组成车牌的各个字符所在的区域。例如，如图10所示，可以从包含车牌为Z8657的二值化图像中，确定字符Z区域、字符8区域、字符6区域、字符5区域和字符7区域等。

其中，第二目标检测网络可以是SSD网络，该第二目标检测网络与上述第一目标检测网络的参数不同。检测设备可以预先对第二目标检测网络进行训练，得到训练后的第二目标检测网络。然后，通过训练后的第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置，该字符位置可以是字符所在区域的坐标，例如，字符区域的顶点坐标，可选地，该字符区域可以是矩形框，该矩形框的大小可以根据实际需要进行灵活设置。此时，可以根据字符位置从对应的二值化图像中截取字符区域。使得在字符截取时使用第二目标检测网络对每个字符进行定位，省去了人工提取字符特征和调整参数等，提高了字符区域截取的效率和精准性。

需要说明的是，为了精准分割出车牌区域中的每个字符，可以设置第二目标检测网络识别所有字符位置的矩形框(也可以称为bounding-box)的长和宽之间的比例均相同，即每个字符区域的长和宽之间的比例均相同，这样对于二值化后不同字符边缘之间粘连的情况，也能够精准将各个字符截取出来，减少了字符检测错误，提高了后续字符检测的准确率。

S209、通过深度学习网络GoogleNet对字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。

在得到字符区域后，检测设备可以对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度。当待检测的车牌图像包括多张时，需要分别对每张车牌图像中的每个字符区域进行字符检测。

为了提高字符检测的准确性和效率，检测设备可以使用深度学习网络GoogleNet对字符进行分类(即对字符进行检测)，其中，该GoogleNet网络GoogleNet的分类性能远优于支持向量机等机器学习分类法，同时运行速度也比较快，兼顾了检测速度和精度。

例如，检测设备可以预先对GoogleNet网络进行训练，得到训练后的GoogleNet网络。然后，可以通过训练后的GoogleNet网络对字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。例如，若检测到车牌图像中的字符区域包括3个，则可以分别对这3个字符区域进行字符检测，得到字符区域A对应的字符a、字符b和字符c，该字符a对应的字符置信度为0.6，该字符b对应的字符置信度为0.1，该字符c对应的字符置信度为0.3。

S210、从每个字符区域对应字符中，筛选出字符置信度较高的前预设个字符。

S211、将每个字符区域对应的预设个字符中，字符置信度小于或等于第一阈值的字符删除，并将大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。

为了避免字符识别错误的影响，提高了字符识别的准确性，可以引入通配符，通配符的类型可以根据实际需要灵活设置，例如，该通配符可以包括下划线_、@、#、￥、％、&、/或～等符号。

例如，检测设备可以将每个字符区域对应的预设个字符的字符置信度，分别与第一阈值和第二阈值等进行比较，该第一阈值和第二阈值可以根据实际需要进行灵活设置，具体取值在此处不作限定。

然后，从每个字符区域对应的预设个字符中，筛选出字符置信度小于或等于第一阈值的字符，若字符置信度小于或等于第一阈值，则说明字符的置信度非常低，即识别出的该字符的正确概率非常小，此时可以将筛选出的字符置信度小于或等于第一阈值的字符删除。以及，从每个字符区域对应的预设个字符中，筛选出字符置信度大于第一阈值且小于第二阈值的字符，此时可以将筛选出的字符置信度大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。当字符区域A对应的字符未全部替换为通配符时，该字符区域A对应的处理后字符中可以包括未被替换的字符和通配符。

S212、将每个字符区域对应的处理后字符进行排列组合，得到多个组合车牌。

在得到每个字符区域对应的处理后字符后，检测设备可以将每个字符区域对应的处理后字符进行排列组合，得到多个组合车牌，例如，如图10所示。

需要说明的是，在对每张车牌图像对应的字符区域进行字符检测及处理，得到每个字符区域对应的处理后字符，此时，可以分别对每张车牌图像对应的处理后字符进行排列组合，得到每张车牌图像对应的组合车牌。

S213、获取每个组合车牌对应的置信度，并筛选出置信度最大的组合车牌，得到候选组合车牌。

为了保证得到目标车牌的准确性，在得到每张车牌图像对应的多个组合车牌后，对于每张车牌图像，检测设备可以分别从每张车牌图像对应的多个组合车牌中，筛选出置信度最大的组合车牌，得到候选组合车牌。该候选组合车牌包括多个，每个候选组合车牌对应为一张车牌图像中置信度最大的组合车牌。

具体地，由于在通过GoogleNet网络对字符区域进行字符检测时，可以得到每个字符区域对应的字符，以及每个字符对应的字符置信度，以及在将字符替换为通配符后，可以计算出该通配符的置信度，因此，检测设备可以基于上述获取到每个字符区域对应的处理后字符的置信度，此时可以根据处理后字符的置信度计算每个组合车牌对应的置信度。例如，可以取该组合车牌中各字符的字符置信度的平均值，作为该组合车牌对应的置信度，然后从每张车牌图像对应的多个组合车牌中筛选出置信度最大的组合车牌，得到从每张车牌图像对应的目标组合车牌。此时，可以对每张车牌图像对应的目标组合车牌进行融合处理，确定出一个候选组合车牌，例如，筛选出置信度最大的组合车牌，或者各目标组合车牌之间进行对应字符的一一比对，当某个位置的字符不一致时，可以筛选出置信度最高的字符作为该位置对应的字符，从而确定出可信度最高的一个候选组合车牌。

S214、将候选组合车牌与预设字符数据库中预先存储的车牌进行匹配，并根据匹配结果确定出目标车牌。

其中，预设字符数据库可以是预设车牌数据库，该预设车牌数据库预先存储有多个不同的车牌。多个不同的车牌号可以按照不同省或不同市进行分组存储等。

在得到候选组合车牌后，由于候选组合车牌中可能包含通配符，或者候选组合车牌中可能未包含车牌区域中的所有字符，例如，在检测车牌区域后，仅检测车牌区域中的部分字符，因此，为了提高目标字符检测的准确性和完整性，此时可以将候选组合车牌与预设字符数据库中预先存储的车牌进行匹配，并根据匹配结果确定出目标车牌。

例如，当候选组合车牌为B123#，该候选组合车牌中包含通配符“#”，此时，可以从预设字符数据库中查找包含B123的字符串，得到B1236，该B1236即为目标车牌，从而可以得到准确的目标车牌。

又例如，对于黄色双层车牌，其包括两行车牌，检测设备可以仅识别下面的第二行车牌，然后用识别出的第二行车牌去数据库中进行匹配，匹配出上面的第一行车牌，从而可以得到完整的车牌号码。

又例如，对于单行车牌，检测设备可以仅识别车牌中的字母和数字，然后用识别出的字母和数字去数据库匹配中文，从而可以得到完整的车牌号码。

又例如，检测设备可以可以直接将车牌全部识别出来，然后去数据库匹配，确定是数据库中否存储有与该车牌一致的车牌，若存在，则说明识别出的该车牌正确，若不存在，则说明识别出的该车牌不正确，并利用数据库中存储的车牌对识别出的该车牌进行纠正。

由此可见，通配符的加入与数据库匹配等结合，使得个别字符模糊也能不出错，有效解决远距离、复杂光照条件下字符识别问题，最后可以通过数据库匹配进行纠正。此外，可以舍弃识别部分字符，用已识别的字符去数据库匹配该部分字符等，大大提高了字符检测的效率、灵活性和准确性。

例如，对于物流装卸口的中转场的车辆主要是大型货车，而货车装卸货时可能只能采集到包含车尾车牌的车牌图像，在该车牌图像中车尾的双层黄色车牌的第一行汉字和字母可能较小，导致识别困难，尤其是笔画较多的汉字，如“赣”、“藏”、“鄂”笔画粘连在一起，就更加难以识别。或者由于摄像头安装位置很高，导致有些车型的车牌上半部会被后保险杠挡住，第一行的字符就无法识别。因此，通过数据库匹配的方式，可以有效检测出难以识别或无法识别的车牌，有效解决远距离或复杂光照条件下等车牌的车牌识别难的问题，使得在物流装卸口这样的复杂场景下也能稳定自动识别出车牌，从而提升车辆的调度管理。

本申请实施例可以采集多张车牌图像，并截取每张车牌图像中的车牌区域，从多张车牌区域中筛选出评价值较高的前预设张车牌区域，然后对预设张车牌区域进行尺寸归一化，通过GAN网络对统一尺寸的预设张车牌区域进行二值化处理，得到二值化图像，以及通过第二目标检测网络分别对每张二值化图像进行字符识别，以得到字符区域。其次，通过GoogleNet网络对字符区域进行字符检测，得到每个字符区域对应的字符，并对字符进行筛选和替换通配符等处理，得到每个字符区域对应的处理后字符。最后，将每个字符区域对应的处理后字符进行排列组合，得到多个组合车牌，此时，可以从多个组合车牌中筛选出候选组合车牌，将候选组合车牌与预设字符数据库中的车牌进行匹配，以确定出目标车牌。该方案通过对车牌区域和字符区域等的筛选及处理，以及通配符的替换与数据库匹配等结合，提高了车牌检测的准确性。效率和灵活性。

为便于更好的实施本申请实施例提供的字符检测方法，本申请实施例还提供一种基于上述字符检测方法的装置。其中名词的含义与上述字符检测方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图11，图11为本申请实施例提供的字符检测装置的结构示意图，其中该字符检测装置300可以包括获取模块301、检测模块302、替换模块303、组合模块304及确定模块305等。

其中，获取模块301，用于采集待检测图像，并获取待检测图像中的字符区域。

检测模块302，用于对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度。

替换模块303，用于将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符。

组合模块304，用于将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符。

确定模块305，用于根据至少一个组合字符从预设字符数据库中确定出目标字符。

在一些实施方式中，获取模块301可以包括采集单元、定位单元、截取单元和确定单元等，具体地：

采集单元，用于采集多张待检测图像；

在一些实施方式中，确定单元可以包括获取子单元、计算子单元、筛选子单元、处理子单元、识别子单元和截取子单元等，具体地：

获取子单元，用于获取每个文本区域的像素面积；

计算子单元，用于根据像素面积和文本置信度，计算每个文本区域对应的评价值；

处理子单元，用于对预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像；

在一些实施方式中，处理子单元具体用于：对预设个文本区域进行尺寸归一化，得到统一尺寸的预设个文本区域；通过生成式对抗网络对统一尺寸的预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像。

在一些实施方式中，检测模块302具体用于：获取训练后的深度学习网络GoogleNet；通过训练后的深度学习网络GoogleNet对字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。

在一些实施方式中，预设阈值范围为大于第一阈值且小于第二阈值，替换模块303具体用于：从每个字符区域对应字符中，筛选出字符置信度较高的前预设个字符；将每个字符区域对应的预设个字符中，字符置信度小于或等于第一阈值的字符删除，并将大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。

在一些实施方式中，确定模块305具体用于：获取每个字符区域对应的处理后字符的置信度；根据处理后字符的置信度计算每个组合字符对应的置信度，并筛选出置信度最大的组合字符，得到候选组合字符。将候选组合字符与预设字符数据库中预先存储的字符串进行匹配，并根据匹配结果确定出目标字符。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

本申请实施例可以由获取模块301采集待检测图像，并获取待检测图像中的字符区域，然后通过检测模块302对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度。其次，由替换模块303将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符；此时，组合模块304可以将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符，从而确定模块305可以基于至少一个组合字符从预设字符数据库中确定出目标字符。该方案中可以利用通配符来替换字符置信度较低的字符，得到处理后字符，以便可以基于处理后字符的排列组合所得到的组合字符，从预设字符数据库中匹配出目标字符，避免图像质量较差而识别出错误字符，并利用错误字符作为检测结果，提高了字符检测的准确性。

本申请实施例还提供一种检测设备，该检测设备可以为服务器或终端等设备。如图12所示，其示出了本申请实施例所涉及的检测设备的结构示意图，具体地：

该检测设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图12中示出的检测设备结构并不构成对检测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该检测设备的控制中心，利用各种接口和线路连接整个检测设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行检测设备的各种功能和处理数据，从而对检测设备进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像采集或播放功能等)等；存储数据区可存储根据检测设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

检测设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该检测设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，检测设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，检测设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现本申请实施例提供的字符检测方法，如下：

采集待检测图像，并获取待检测图像中的字符区域；对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度；将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符；将每个字符区域对应的处理后字符进行排列组合，得到至少一个组合字符；根据至少一个组合字符从预设字符数据库中确定出目标字符。

在一些实施方式中，在采集待检测图像，并获取待检测图像中的字符区域时，处理器180还执行：采集多张待检测图像；将每张待检测图像分别通过第一目标检测网络进行文本定位，得到每张待检测图像对应的文本位置，以及每个文本位置对应的文本置信度；根据每个文本位置从对应的待检测图像中截取文本区域，得到多个文本区域；根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域。

在一些实施方式中，在根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域时，处理器180还执行：获取每个文本区域的像素面积；根据像素面积和文本置信度，计算每个文本区域对应的评价值；从多个文本区域中，筛选出评价值较高的前预设个文本区域；对预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像；通过第二目标检测网络分别对每张二值化图像进行字符识别，得到字符位置；根据字符位置从对应的二值化图像中截取字符区域。

在一些实施方式中，在对预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像时，处理器180还执行：对预设个文本区域进行尺寸归一化，得到统一尺寸的预设个文本区域；通过生成式对抗网络对统一尺寸的预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像。

在一些实施方式中，在对字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度时，处理器180还执行：获取训练后的深度学习网络GoogleNet；通过训练后的深度学习网络GoogleNet对字符区域进行字符检测，得到每个字符区域对应的字符和每个字符对应的字符置信度。

在一些实施方式中，预设阈值范围为大于第一阈值且小于第二阈值，在将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符时，处理器180还执行：从每个字符区域对应字符中，筛选出字符置信度较高的前预设个字符；将每个字符区域对应的预设个字符中，字符置信度小于或等于第一阈值的字符删除，并将大于第一阈值且小于第二阈值的字符替换为通配符，得到每个字符区域对应的处理后字符。

在一些实施方式中，在根据至少一个组合字符从预设字符数据库中确定出目标字符时，处理器180还执行：获取每个字符区域对应的处理后字符的置信度；根据处理后字符的置信度计算每个组合字符对应的置信度，并筛选出置信度最大的组合字符，得到候选组合字符。将候选组合字符与预设字符数据库中预先存储的字符串进行匹配，并根据匹配结果确定出目标字符。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对字符检测方法的详细描述，此处不再赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种字符检测方法中的步骤。例如，该指令可以执行如下步骤：

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种字符检测方法中的步骤，因此，可以实现本申请实施例所提供的任一种字符检测方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种字符检测方法、装置、检测设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种字符检测方法，其特征在于，包括：

采集待检测图像，并获取所述待检测图像中的字符区域；

2.根据权利要求1所述的字符检测方法，其特征在于，所述采集待检测图像，并获取所述待检测图像中的字符区域包括：

采集多张待检测图像；

3.根据权利要求2所述的字符检测方法，其特征在于，所述根据每个文本区域和文本置信度，确定每张待检测图像中的字符区域包括：

获取每个文本区域的像素面积；

根据字符位置从对应的二值化图像中截取字符区域。

4.根据权利要求3所述的字符检测方法，其特征在于，所述对所述预设个文本区域进行二值化处理，得到每个文本区域对应的二值化图像包括：

5.根据权利要求1所述的字符检测方法，其特征在于，所述对所述字符区域进行字符检测，得到每个字符区域对应的字符，以及每个字符对应的字符置信度包括：

获取训练后的深度学习网络GoogleNet；

6.根据权利要求1所述的字符检测方法，其特征在于，所述预设阈值范围为大于第一阈值且小于第二阈值，所述将每个字符区域对应的字符置信度位于预设阈值范围内的字符，替换为通配符，得到每个字符区域对应的处理后字符包括：

7.根据权利要求1至6任一项所述的字符检测方法，其特征在于，所述根据所述至少一个组合字符从预设字符数据库中确定出目标字符包括：

获取每个字符区域对应的处理后字符的置信度；

8.一种字符检测装置，其特征在于，包括：

9.一种检测设备，其特征在于，包括处理器和存储器，所述存储器中存储有程序代码，所述处理器调用所述存储器中的程序代码时执行如权利要求1至7任一项所述的字符检测方法。

10.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至7任一项所述的字符检测方法中的步骤。