CN111914834B

CN111914834B - 图像识别方法、装置、计算机设备和存储介质

Info

Publication number: CN111914834B
Application number: CN202010558495.5A
Authority: CN
Inventors: 张官兴; 王赟; 郭蔚; 黄康莹; 张铁亮
Original assignee: Shanghai Ewa Intelligent Technology Co ltd; Shaoxing Ewa Technology Co ltd
Current assignee: Shanghai Ewa Intelligent Technology Co ltd; Shaoxing Ewa Technology Co ltd
Priority date: 2020-06-18
Filing date: 2020-06-18
Publication date: 2024-04-02
Anticipated expiration: 2040-06-18
Also published as: CN111914834A

Abstract

本申请涉及一种图像识别方法、装置、计算机设备和存储介质。所述方法包括：获取输入图像，并对所述输入图像进行预处理得到第一图像；获取用于检测待检测目标的位置检测模型；将所述第一图像输入至所述位置检测模型中得到所述待检测目标所在的第一区域检测框位置；将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中，并在所述输入图像中截取第一区域检测框位置对应的区域得到第二图像；获取目标识别模型；将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理。采用本方法能够提高图像识别准确性和实时性。

Description

图像识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种图像识别方法、装置、计算机设备和存储介质。

背景技术

随着人工智能技术的发展，出现了图像识别技术，基于端到端的图像检测神经网络模型都是采用复杂神经神经网络，模型复杂、参数多、运算耗时长、复杂环境下识别准确度低；这种端到端的神经网络检测方法图像中目标位置检测精度低，造成后续图像内容识别准确度低；同时由于模型输入的限制，输入图像分辨率低，造成本就占有整幅画面极小的待检测图像感兴趣区域细节更加模糊，进一步降低了识别准确率；由于模型复杂，无法实现在终端高效计算，因此增加了后端部署成本以及不能实现实时检测结果输出。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高图像识别准确性和实时性的图像识别方法、装置、计算机设备和存储介质。

一种图像识别方法，所述方法包括：

获取输入图像，并对所述输入图像进行预处理得到第一图像；

获取用于检测待检测目标的位置检测模型；

将所述第一图像输入至所述位置检测模型中得到所述待检测目标所在的第一区域检测框位置；

将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中，并在所述输入图像中截取所述第一区域检测框位置对应的区域得到第二图像；

获取目标识别模型；

将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理。

在其中一个实施例中，在将所述第一图像输入至位置检测模型中之前，还包括：

将所述第一图像进行降低分辨率处理和/或将所述第一图像转化为灰度图。

在其中一个实施例中，所述位置检测模型包括第一检测模型，所述第一检测模型为轻量级神经网络模型，所述轻量级神经网络模型被配置为用于获得所述待检测目标所在的第一区域检测框的粗略位置；

所述将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中，并在所述输入图像中截取所述第一区域检测框位置对应的区域得到第二图像之前，还包括：

将包含所述待检测目标的所述第一区域检测框的尺寸扩大。

在其中一个实施例中，所述将包含所述待检测目标的所述第一区域检测框的尺寸扩大，包括：

将包含所述待检测目标的所述第一区域检测框的尺寸同比例扩大2倍或1倍。

在其中一个实施例中，所述位置检测模型还包括第二检测模型；所述将所述第二图像输入至所述目标识别模型中之前，还包括：

获取用于检测待检测目标轮廓的精确外接检测框位置的第二检测模型；

将所述第二图像输入至所述第二检测模型中，获得所述待检测目标的精确区域检测框位置；所述待检测目标的精确区域检测框位置是指所述待检测目标的轮廓外接检测框位置；

将所述精确区域检测框位置对应的图像按照所述目标识别模型的输入要求进行仿射变换，得到第三图像，所述第三图像作为所述目标识别模型输入数据，用于目标内容识别。

在其中一个实施例中，所述输入图像为车辆监控图像，对所述第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的第三图像为矩形车牌图像；所述待检测目标为车牌，所述图像内容为车牌信息，所述车牌信息包括车牌字符、车牌颜色、车牌类型中的一种或多种。

在其中一个实施例中，所述将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理，包括：

获取车牌字符识别模型以及对所述第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的矩形车牌图像；

识别所述矩形车牌图像的背景颜色；

获取与所述背景颜色对应的车牌编码规则；

将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息；

将所述车牌信息送入规则检测器，所述规则检测器用于检测所识别的车牌信息是否符合所述车牌编码规则。

在其中一个实施例中，所述车牌字符识别模型包括字符分割模型和字符识别模型；

所述将所述矩形车牌图像输入至车牌识别模型中进行识别得到车牌信息，包括：

获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；

控制所述滑动窗口沿所述矩形车牌图像的长度方向按滑动步长参数对应的滑动步长遍历所述矩形车牌图像；

将各个所述滑动窗口对应的图像块输入至字符分割模型中，获得各个所述滑动窗口对应的图像块内是否是字符的分类概率或置信度；

根据各个所述滑动窗口对应的图像块是否是字符的分类概率或置信度统计分布，按预设条件对所述矩形车牌图像进行字符分割，得到待识别字符块；

将所述字符块输入至字符识别模型获得对应字符信息；

根据所识别得到的字符信息确定车牌信息。

在其中一个实施例中，将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息，包括：

获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；

控制所述滑动窗口沿所述待矩形车牌图像的长度方向遍历所述矩形车牌图像，获得各个所述滑动窗口对应的区域的字符识别分类概率或置信度，并将当前滑动窗口字符识别分类概率或置信度最大的分类结果作为第一输出结果；

对所述所有滑动窗口的第一输出结果集合进行过滤处理，获得字符识别输出结果；

根据所述字符识别输出结果得到车牌信息。

在其中一个实施例中，所述对所述第一输出结果进行过滤处理，获得字符识别输出结果，包括：

对第一输出结果中分类概率或置信度小于预设阈值的结果进行删除处理；

获取删除处理后第一输出结果对应的N个滑动窗口，并构建一个类内字符分类结果为所述滑动窗口对应的区域的元素为元素C_I的候选集合I₁，其中每个所述滑动窗口通过字符的类别参数，即元素C_I、分类概率或置信度、滑动窗口坐标位置以及窗口长宽进行表示；

构建一个最优字符分类滑动窗集合I₂，且初始化为空；

将所述候选集合I₁中的元素C_I按字符识别分类概率或置信度大小排序，选出分类概率或置信度最大且位置最前的滑动窗口对应的元素从所述候选集合I₁中移到所述最优字符分类滑动窗集合I₂中；

遍历所述候选集合I₁中其余的元素C_I，分别与所述最优字符分类滑动窗集合I₂中的进行交并比运算，当所得到的交并比高于第一预设阈值，则将该元素C_I从所述候选集合I₁中删除，并将所选择的元素/>作为第三输出结果；

重复上述过滤过程，直到所述候选集合I₁为空；

对类间元素分别重复上述过滤过程；

返回以为元素并所述滑动窗口坐标位置进行排序的输出集合L₁，其中，j为顺序号；

对所述输出集合L₁中元素进行投票，滤除错误结果，包括：

构建一个最优字符分类滑动窗集合L₂；

构建一个投票组集合Z，且初始化为空；

将所述输出集合L₁中第一个元素移到所述投票组集合Z中；

遍历所述集合L₁中其余的元素分别与所述投票组集合Z中的元素/>进行交并比运算，将交并比大于第二预设阈值的元素/>加入到所述投票组集合Z，对所述投票组集合Z中各元素进行投票处理；

遍历所述候选集合I₁中其余的元素C_I，分别与所述投票组集合Z中各元素进行类内交并比运算，获得高于第一预设阈值的元素个数N_I/或分类概率或置信度总和P_I，作为所述投票组集合Z中各元素投票得分；

将本轮投票得分值最大的元素C^a _score-max添加到最优字符分类滑动窗集合L中，并从所述输出集合L₁中删除所述投票组集合Z中对应的元素，然后对所述投票组集合Z初始化为空，并更新顺序号j；C^a _score-max表示在第a轮所述投票组集合Z中各元素投票分数最大的元素；

然后重复上述对所述输出集合L₁中元素进行投票的过程，将每轮投票分数最高的元素加入到最优字符分类滑动窗集合L₂中，作为获得字符识别输出结果。

在其中一个实施例中，所述将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息，包括：

根据车牌编码规则确定车牌信息在所述矩形车牌图像中的字符位置和字符大小；

根据所确定的字符位置和字符大小对所述矩形车牌图像进行分割，得到待处理字符块；

对所述待处理字符块进行字符识别得到车牌信息。

在其中一个实施例中，所述对所述待处理字符块进行字符识别得到车牌信息，包括：

对所述待处理字符块进行字符识别得到每个待处理字符块对应的字符识别分类概率或置信度；

当每个所述待处理字符块识别分类概率或置信度均小于预设阈值时，将所述待处理字符块所对应的窗口在所述矩形车牌图像上进行扩大和/或左右移动预设距离，获得至少一个窗口尺寸和/或位置修正后对应的字符块；

对修正后的待处理字符块进行字符识别得到字符识别结果；

选取所述字符识别结果中字符识别分类概率或置信度最大的字符识别结果作为车牌信息。

在其中一个实施例中，所述获取至少一种尺寸的滑动窗口以及对应的滑动步长参数，包括：

在模型训练阶段，将所述矩形车牌图像内的字符大小进行聚类分析；

根据字符聚类分析结果，确定至少一种滑动窗口尺寸参数或在标准滑动窗口尺寸基础上对滑动窗口宽度参数进行扩大或缩小，确定至少一种滑动窗口尺寸参数。

一种图像识别装置，所述装置包括：

预处理模块，用于获取输入图像，并对所述输入图像进行预处理得到第一图像；

位置检测模块，用于获取用于检测待检测目标的位置检测模型；将所述第一图像输入至所述位置检测模型中得到所述待检测目标所在的第一区域检测框位置；

映射模块，用于将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中，并在所述输入图像中截取所述第一区域检测框位置对应的区域得到第二图像；

识别模块，用于获取目标识别模型；将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一实施例所述的方法的步骤。

上述图像识别方法、装置、计算机设备和存储介质，首先对输入图像进行预处理这样减少了输入数据量，通过位置检测模型高效地检测出目标所在第一区域检测框的位置，并将第一区域检测框映射到输入图像以截取到第二图像，这样第二图像是保留了输入图像中目标丰富的纹理和颜色等特征细节，大大提高目标识别模型的识别准确性和实时性。

附图说明

图1为一个实施例中图像识别方法的应用环境图；

图2为一个实施例中输入图像的示意图；

图3为一个实施例中第一区域检测框的示意图；

图4为一个实施例中泛车牌区域的示意图；

图5为一个实施例中精确区域检测框的示意图；

图6为一个实施例中矩形车牌图像的示意图；

图7为一个实施例中图像识别装置的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，提供了一种图像识别方法，本实施例以该方法应用于终端计算平台进行举例说明，可以理解的是，该方法也可以应用于服务器或边缘计算平台，也可以通过终端计算平台和远端计算平台的交互实现。本实施例中，该方法包括以下步骤：

S102：获取输入图像，并对输入图像进行预处理得到第一图像。

具体地，输入图像可以是通过图像或视频采集设备获得，例如监控摄像头，其中监控摄像头由镜头、图像传感器和处理器等基本组件组成，可通过软件配置的方式，对处理器器进行配置，使其具有图像预处理、图像识别等功能，或者将终端摄像头采集的视频帧图像发送至服务器或边缘计算平台进行处理。

预处理可以是指对输入图像进行缩放、降噪、灰度化以及调整对比度、亮度等处理中的至少一个，本实例通过对输入图像进行缩放、降噪或灰度化处理的至少一个，以此减小了图像数据处理计算量，提高计算效率。

S104：获取用于检测待检测目标的位置检测模型。

S106：将第一图像输入至位置检测模型中得到待检测目标所在的第一区域检测框位置。

具体地，位置检测模型是预先训练得到的，用于对第一图像进行感兴趣目标位置检测，以确定待检测目标所在的第一区域检测框的位置。其中，位置检测模型的输入是第一图像，该第一图像是经过预处理后的图像。位置检测模型仅关心待检测目标所在的第一区域检测框的位置，例如可以通过采用神经网络模型通过滑窗或区域候选网络(RPN)提取第一图像中目标特征，并选取其中存在待检测目标的置信度最大的区域检测框的位置作为第一区域检测框的位置。或者还可以通过颜色、纹理、大小、形状等特征将感兴趣目标从图像背景中分离出，从而得到待检测目标所在的第一区域检测框位置。

S108：将包含待检测目标的第一区域检测框位置映射到输入图像中，并在输入图像中截取第一区域检测框位置对应的区域得到第二图像。

具体地，由于第一图像是经过预处理的图像，其所包含的信息是小于原始的输入图像的，因此为了后续待检测目标的內容识别的准确性，本实施例中，终端获取第一区域检测框在第一图像中的位置坐标信息，然后终端将该坐标映射到输入图像中，进行裁剪，以得到与第一区域检测框位置对应的第二图像，也就是包含有待检测目标的第二图像，因上述第二图像是从输入图像上截取的，该第二图像包含了丰富的目标纹理、颜色等特征信息，为后续目标精确识别奠定了基础。

S110：获取目标识别模型。

S112：将第二图像输入至目标识别模型中以对图像内容进行识别处理。

具体地，目标识别模型是预先训练完成的，用于对第二图像进行图像內容识别。由于第二图像是终端从输入图像中截取的包含目标的区域图像，因此其数据量大大小于整幅输入图像，可大大提高处理器处理效率，此外，由于第二图像是从输入图像中截取出来的，保留了目标丰富的纹理和颜色特征细节，因此可以提高图像內容目标识别准确度。

上述图像识别方法，首先对输入图像进行预处理这样减少了输入数据量，降低了位置检测模型计算数据量，可更高效快速地检测出目标所在第一区域检测框的位置，并将第一区域检测框映射到输入图像以截取到第二图像，这样第二图像是保留了输入图像中目标丰富的纹理和颜色等特征细节，大大提高目标识别模型的识别准确性和实时性。

在其中一个实施例中，在将第一图像输入至位置检测模型中之前，还包括：将第一图像进行降低分辨率处理和/或将第一图像转化为灰度图。

具体地，此步骤对第一图像进行处理主要是为了降低第一图像数据大小位置检测模型，从而位置检测模型可以高效地、快速地对第一图像进行处理以得到包含目标的第一区域检测框位置。

其中对第一图像的处理可以仅包括降低分辨率处理或者是将第一图像转换为灰度图像，或者是两者都进行，例如先进行降低分辨率处理，然后再将第一图像转换为灰度图像。亦或者是先将第一图像转换为灰度图像，再降低第一图像的分辨率。

上述实施例中，通过将第一图像进行降低分辨率处理和/或将第一图像转化为灰度图，可以降低第一图像的数据量，从而可以提高位置检测模型的处理效率。

在其中一个实施例中，位置检测模型包括第一检测模型，该第一检测模型为轻量级神经网络模型，轻量级神经网络模型被配置为用于获得待检测目标所在的第一区域检测框的粗略位置。将包含待检测目标的第一区域检测框位置映射到输入图像中，并在输入图像中截取第一区域检测框位置对应的区域得到第二图像之前，还包括：将包含待检测目标的第一区域检测框的尺寸扩大。且优选地，将包含待检测目标的第一区域检测框的尺寸扩大，包括：将包含待检测目标的第一区域检测框的尺寸同比例扩大2倍或1倍。

具体地，该实施例中为了进一步提高位置检测模型的处理效率，该位置检测模型可以被配置为轻量级神经网络模型，这样可以在保证获得较为准确的目标检测位置的同时，大大减少处理器计算量。但是轻量级神经网络所带来的结果可能导致第一区域检测框位置不够精确，无法完整的包含目标且检测框亦不能紧密包围目标边界轮廓，为了保证第一区域检测框完整地包含待检测目标，终端可以将第一区域检测框进行尺寸扩大，例如同比例扩大2倍或1倍，即将第一区域检测框的长宽进行同比例扩大，以使得第一区域检测框中完整包含有待检测目标，为后续的图像內容的识别的准确性奠定基础。

上述实施例中，首先通过轻量级神经网络来对第一图像进行目标检测可以得到待检测目标第一区域检测框的粗略位置，然后将该第一区域检测框的粗略位置区域进行扩大，可以使得第一区域检测框完整地包含待检测目标，为后续图像內容的识别的准确性奠定基础。

在其中一个实施例中，位置检测模型还可以包括第二检测模型，将第二图像输入至目标识别模型中之前，还包括：获取用于检测待检测目标轮廓的精确外接检测框位置的第二检测模型；将第二图像输入至第二检测模型中，获得待检测目标轮廓的第二区域检测框位置，待检测目标的精确区域检测框位置是指待检测目标的轮廓外接检测框位置；将第二区域检测框位置对应的图像按照目标识别模型的输入要求进行仿射变换，得到第三图像，第三图像作为目标识别模型输入数据，用于目标内容识别。

具体地，本实施例中主要是为了精确地获得到待检测目标轮廓对应的精确区域检测包围框位置，为后续的目标內容识别奠定基础。

其中该第二检测模型用于对待检测目标轮廓边界包围框位置的精确回归，从而获得只含有待检测目标的第三图像，该第二检测模型可以包括传统算法，例如包含多个算子对图像处理的算法或者是神经网络算法，在此不做具体的限制。

这样终端首先通过轻量级神经网络对第一图像进行检测得到粗略的第一区域检测框，再进行扩大后，保证待检测目标一定在扩大后的第一区域检测框中，从而终端根据第一区域检测框位置映射到输入图像可以截取到高分辨率的第二图像，在对该第二图像进行精确的目标位置检测得到了精确的第二检测框的位置坐标信息。

可选地，在获取到第二区域检测框后，由于拍摄角度关系、目标图像块会出现倾斜、扭曲等，因此终端还需要将第二区域检测框位置对应的图像按照目标识别模型的输入要求进行仿射变换，得到第三图像，第三图像作为目标识别模型输入数据，用于目标内容识别。

上述实施例中，一方面通过第二检测模型进行检测得到了第二区域检测框，为后续內容识别的准确性奠定基础，另一方面充分考虑到了拍摄角度等问题，对第二图像进行仿射变换得到第三图像，使得第三图像可以满足后续目标识别的输入要求。

在其中一个实施例中，输入图像为车辆监控图像，第三图像为经过仿射变换后的矩形车牌图像；对第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的第三图像为矩形车牌图像，图像内容为车牌信息，车牌信息包括车牌字符、车牌颜色、车牌类型中的一种或多种。

具体地，在该实施例中以停车场车辆出入场景为例进行说明，其中所获取到的输入图像是车辆出入时的车辆监控图像，具体可以参见图2所示，终端首先对该车辆监控图像进行预处理得到第一图像，然后终端将该第一图像输入至位置检测模型的第一检测模型中检测得到车牌粗略位置，参见图3所示，即上文中的第一区域检测框位置，终端对该第一区域检测框进行扩大得到泛车牌区域，参见图4所示，将泛车牌区域映射到车辆监控图像中，从车辆监控图像中截取对应的泛车牌区域，终端将该泛车牌区域输入至上述的第二检测模型中，以对该泛车牌区域中的车牌区域进行精确定位得到精确的车牌目标区域检测框，参见图5所示，也就是车牌准确的边界包围框位置，从而终端对该准确位置进行仿射变换得到矩形车牌图像，参见图6所示，以便于后续对于矩形车牌图像中的车牌信息进行识别，其中后续所识别的车牌信息包括但不限于车牌字符、车牌颜色、车牌类型中的一种或多种。

上述实施例中，给出了具体的应用场景，且在该实施例中未做具体说明的特征均可以参见上文的详细说明，在此不再赘述，本实施例中，先在低分辨率图像，即预处理后的图像上做粗检测，先大致定位车牌位置，由于这种粗检测不能精确的定位车牌位置，因此又对包含车牌的粗检测目标区域扩大，并将扩大区域位置映射到原高分辨率的输入图像中，获得高清的具有丰富纹理细节的泛车牌区域，经过这个步骤操作，在这个泛车牌区域内会包含车牌，然后采用传统的算法或神经网络算法对泛车牌区域中的车牌边界位置进行精准回归。

在其中一个实施例中，将第二图像输入至目标识别模型中以对图像内容进行识别处理，包括：获取车牌字符识别模型以及对第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的矩形车牌图像；识别矩形车牌图像的背景颜色；获取与背景颜色对应的车牌编码规则；根据车牌编码规则将矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息。

具体地，车牌字符识别模型是预先训练得到的，用于识别矩形车牌图像中的车牌字符。终端可以首先获取到该车牌字符识别模型，且终端还需要识别矩形车牌的背景颜色，例如终端将矩形车牌图像输入至颜色分类神经网络以得到车牌的背景颜色，或者终端可以对矩形车牌图像进行颜色采样得到若干个像素点，再获取到该若干个像素点对应的RGB信息，通过所获取到的RGB信息确定车牌的背景颜色。

根据现有车牌标准，不同颜色的车牌对应不同的车辆类型，而不同车辆类型对应的车牌编码方式不同(如黄蓝色是普通车车牌，编码规则是省市、自治区直辖市简称+发牌机关代号+5个字母和数字序号；绿色为新能源车牌，编码规则是省市、自治区直辖市简称+发牌机关代号+6个字母和数字序号；白色为军警车牌)，且对于单行字符的车牌，其中的字符长宽和字符间隔是固定的，因此通过先获得的车牌背景颜色确定车牌编码规则，这样便于后续根据车牌编码规则来进行字符识别及对识别结果验证，以获得车牌信息，并可根据车牌背景颜色进行车辆类型的统计。

其中根据上文，车牌信息中的车牌颜色和车牌类型可以较方便的获取到，通过车牌颜色可以获取车牌编码规则，一是可便于车牌字符识别，二是便于对识别结果进行规则化验证，从而进一步提高识别准确率，防止误识别发生，下文中将详细介绍3种方法。其中为了方便，需要说明的是，上文中的仿射变换还可以将车牌高度调整到模型输入要求尺寸，长度方向根据高度变化同比例缩放，这样下文中的滑动窗口可以是预先设置的至少一种尺寸的滑动窗口，包括固定尺寸或是多种宽度尺寸的滑动窗口，具体地，由于车辆距离摄像头距离远近不同，因此最后获得的矩形车牌大小不一，为了方便识别模型的识别，可以将上述矩形车牌图像高度调整到固定高度尺寸，如140Px，长度根据高度调整比例进行同比例调整，同时在理想的标准车牌图像条件下，此时的字符宽和高比为1:2左右，具体大小为45Px*90Px，从而可以确定对应的滑动窗口W*H用于进行字符的检测，例如采用W*H＝49Px*140Px的滑动窗口，这样让滑动窗口的高度和调整后矩形车牌的高一致，宽度扩展几四个像素，让窗口尽可能的包围整个字符。但在实际情况中上文中的第三检测框可能不会精确的定位到车牌的轮廓边缘(如可能或落在边缘内部或外部)无法获取理想条件下的车牌图像，若继续采用上述固定尺寸窗口则可能不能完全包围整个字符或将相邻字符也包围在内，因此作为一种改进，亦可在滑动窗口每一步滑动采样字符图块时采用多种不同宽度的滑动窗口进行字符识别，并输出字符分类置信度最高的窗口作为当前步输出结果；具体的可对第三检测框输出的并经过高度调整的矩形车牌内的字符大小进行聚类分析，从而从大量数据集中确定滑动窗口的经验宽度，或在标准窗口尺寸的基础上(如：W*H＝49Px*140Px)，对窗口宽度W按一定倍数(1.2倍、1.5倍、0.8倍)进行扩大或缩小，来确定窗口尺寸。

其中，获取至少一种尺寸的滑动窗口以及对应的滑动步长参数，包括：在模型训练阶段，将所述矩形车牌图像内的字符大小进行聚类分析；根据字符聚类分析结果，确定至少一种滑动窗口尺寸参数或在标准滑动窗口尺寸基础上对滑动窗口宽度参数进行扩大或缩小，确定至少一种滑动窗口尺寸参数。

上述实施例中，通过识别车牌颜色，以得到车辆类型和车牌编码规则，再根据车牌编码规则对车牌字符进行识别和验证，提高了准确性。

下文将详细介绍3种车牌字符的识别方法，第一种首先通过字符分割模型确定字符分割点，其次对分割后的字符块通过字符识别模型进行字符识别。第二种是将各滑动窗口对应的图像块输入至字符识别模型中，然后对获取的所有滑动窗口输出结果进行过滤筛选，从而获得最终输出结果。第三种是根据车牌编码规则预先确定的字符大小和字符位置进行字符分割，其次对分割后的字符块通过字符识别模型进行字符识别。

可选地，第一种方式中，车牌字符识别模型包括字符分割模型和字符识别模型；根据车牌编码规则将矩形车牌图像输入至车牌识别模型中进行识别得到车牌信息，包括：获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；控制滑动窗口沿矩形车牌图像的长度方向按设定滑动步长遍历矩形车牌图像；将各个滑动窗口对应的区域图像块输入至字符分割模型中，获得各个滑动窗口对应的区域图像块内是否是字符的分类概率或置信度；根据各个滑动窗口对应的区域图像块内是否是字符的类概率或置信度统计分布，按照预设条件对矩形车牌图像进行字符分割，得到待识别字符块；将字符块输入至字符识别模型获得对应字符信息；根据所识别得到的字符信息确定车牌信息。

具体地，终端首先进行字符分割得到待识别字符块后，将待识别字符块输入至字符识别模型中，例如OCR识别模型中得到具体的字符信息，并输出所识别的字符信息。且在输出之前，终端还可以通过车辆编码规则对所识别的字符信息进行验证，以保证所识别的字符信息的准确性。

具体地，通过上述背景颜色(以普通蓝色车牌为例)识别获得车牌编码规则；车牌为蓝色，车型小型民用汽车，车牌规则为省市、自治区直辖市简称+发牌机关代号+5个字母和数字序号；车牌长度为L(单位Px)。

首先生成至少一种尺寸的滑动窗口以及对应的滑动步长参数，例如，生成W×H滑动窗口，以预设步长(例如1Px或2Px…)，然后使滑动窗口沿矩形车牌图像的长度方向按滑动步长参数对应的滑动步长遍历矩形车牌图像，将各个滑动窗口对应的区域图像块输入至字符分割模型中，获得各个滑动窗口对应的区域图像块内是否是字符的分类概率或置信度，即将每一步滑动窗口所选区域的区域图像输入至分类网络(SVN/神经网络等)，终端获得每个滑动窗口的对应的区域字符和/或非字符分类概率或置信度P(X+W/2),(0≤X≤L-W/2)，X为横坐标单位为Px,P_字(X+W/2)为滑动窗口在X+W/2处的是字符的概率大小，P_非字(X+W/2)为滑动窗口在X+W/2处的非字符的概率大小，即该滑动窗口对应的区域图像块内是否是字符的概率，其中P_字概率大于设定阈值的区间为字符区域，P_字概率小于某一阈值的区间为分割区域；P_非字概率大于设定阈值的区间为字符分割区域，P_非字概率小于设定阈值的区间为字符区域；通过上述字符和非字符输出概率进行联合验证实现精准字符分割。具体的可通过计算L(X+W/2)＝P_字(X+W/2)-P_非字(X+W/2),其中L(X+W/2)最小时，此时X+W/2处为最佳分割点；或通过计算对应△X区间范围内的概率均值的差，来获得分割位置点。最后终端将分割好的字符块输入至字符识别模型获得对应字符信息，例如输入至OCR识别模型中得到各个字符块对应的字符信息；从而终端根据所识别得到的字符信息确定车牌信息。且终端还可以根据车牌编码规则对该车牌信息进行验证，以保证识别的准确性。

在其中一个实施例中，第二种车牌字符的识别方法包括根据车牌编码规则将矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息，包括：获取至少一种尺寸的滑动窗口以及对应的滑动步长参数，然后使滑动窗口沿矩形车牌图像的长度方向按滑动步长参数对应的滑动步长遍历矩形车牌图像；控制滑动窗口沿矩形车牌图像的长度方向遍历矩形车牌图像，获得各个滑动窗口对应的区域的字符识别分类概率或置信度；并将当前滑动窗口字符识别分类概率或置信度最大的分类结果作为第一输出结果；对所有滑动窗口的第一输出结果集合进行过滤处理，获得字符识别输出结果，根据字符识别输出结果得到车牌信息。具体地。通过筛选操作将多余的输出结果过滤，例如首先将上述输出结果集合中分类概率或置信度小于预设阈值的结果筛除，然后将剩余的N个可信度高的滑动窗口输出结果中重复的以及错误的结果筛除掉；具体的可将N个可信度高的滑动窗口输出结果构建一个以类内字符分类结果为待处理滑动窗为元素C_I的候选集合I₁；其中每个滑动窗口元素C_I参数为：类别参数C_I即元素C_I、分类概率或置信度、滑动窗口坐标位置以及窗口长宽进行表示。

构建一个最优字符分类滑动窗集合I₂。且初始化为空。

将上述候选集合I₁中的元素C_I按字符识别分类概率或置信度大小排序，选出分类概率或置信度最大且位置最前的滑动窗C_{I_max}，从候选集合I₁中移到最优字符分类滑动窗集合I₂中。

遍历候选集合I₁中其余的元素C_I，分别与最优字符分类滑动窗集合I₂中的C_{I_max}进行交并比IoU(Intersection over Union)运算，如果IoU高于第一预设阈值，则将该元素C_I从候选集合I₁中删除。

并将所选择的元素C_{I_max}作为第三输出结果。

重复上述过程，直到候选集合I₁为空。

然后对其他类间元素分别重复上述过滤过程。其中，相同字符叫类内，不同字符叫类间。

返回以(j为顺序号)为元素并按窗口坐标位置进行排序的输出集合L₁；

对输出集合L₁中元素进行投票，滤除错误结果，包括：

构建一个最优字符分类滑动窗集合L₂。

构建一个投票组集合Z，且初始化为空。

将输出集合L₁中第一个元素移到投票组集合Z中。

遍历输出集合L₁中其余的元素分别与投票组集合Z中的/>进行交并比IoU运算,将交并比大于预设阈值的/>加入到投票组集合Z，对投票组集合Z中各元素进行投票处理；

遍历上述输出集合I₁中其余的滑动窗元素C_I，分别与投票组集合Z中各元素进行类内交并比IoU运算，获得高于第二预设阈值的元素个数N_I或概率总和P_I，作为投票组集合Z中各元素投票得分；

将本轮投票得分值最大的元素C^a _{score_max}(表示在第a轮投票组集合Z中各元素投票分数最大的元素)添加到最优字符分类滑动窗集合L₂中，并从L₁中删除投票组集合Z中对应的元素，并更新顺序号j；

然后对投票组集合Z初始化为空；

然后重复上述过程，将每轮投票分数最高的元素加入到最优字符分类滑动窗集合L₂中，作为最终字符识别输出结果。

具体的以图6所示车牌为例，为了提高模型对不同车牌图像识别的泛化能力，本实例通过采用多个不同宽度的滑动窗口，以步长为1Px，沿车牌长度方向滑动。首先每一步生成多个不同宽度的滑动窗口，用于尽可能在包围字符，然后模型输出每个位置不同尺寸滑动窗口对应字符块的字符分类概率或置信度，选取当前滑动窗口字符分类概率或置信度最大的字符分类结果作为当前滑动窗口输出结果，完成整个遍历后则会得到一系列不同尺寸窗口的字符分类结果集合，这些结果中存在一些概率或置信度过低的不可信结果，因此先过滤掉分类概率或置信度过低的窗口输出结果，将剩余的N个窗口输出结果构建一个以类内字符分类结果为待处理滑动窗为元素C_I的候选集合I₁。由于图6车牌有两个相同的A字符，因此将上述结果中分类结果为C_A的类内k个结果作为一个按分类概率或置信度大小进行排序的集合I_{1_A}{C_A ¹、C_A ²、C_A ³、C_A ⁴…C_A ^k}；然后构建一个最优字符分类滑动窗集合I_{2_A},且初始化为空；然后将I_{1_A}中分类概率或置信度最大的元素C_{A_max_1}移到I_{2_A}中，遍历I_{1_A}中其余的滑动窗元素C_A，分别与I_{2_A}中的C_{A_max_1}进行交并比IoU(Intersection over Union)运算,如果IoU高于第一预设阈值，则将该元素C_A从集合I_{1_A}中删除。

由于图6车牌中存在两个不同位置的A(记为A₁、A₂)，因此第一轮遍历过程中只会将I_{1_A}中与A₁ IoU高于预设阈值高于的结果删除，而由于A₁与A₂有一定间隔，因此以A₂为中心生成的多个窗口与A₁交并比不高或无交集，因此此时集合I_{1_A}保留有与A₂相关的窗口集合，因此重新选取当前集合中分类概率或置信度最高的元素C_{A_max_2}，移到I_{2_A}中，然后遍历I_{1_A}中剩余的滑动窗元素C_A，分别与I_{2_A}中的C_{A_max_2}进行交并比IoU运算，并将超过第一预设阈值的C_A从集合I_{1_A}中删除。重复上述过程，直到集合I_{1_A}为空；然后对其他类间字符分别重复上述过程。

且每次轮询过滤后将上述最优集合I_{2_A}中的元素存入集合L₁，用于对分类概率或置信度高于阈值，但实际识别错误的结果进行滤除，具体的包括：将L₁中的所有最优元素(其中上标为按位置排序的序号)按位置前后进行排序，如L₁{C_京 ¹、C_琼 ²、C_A ³、C_B ⁴、C_A ⁵、C₃ ⁶、C₈ ⁷、C_B ⁸、C₆ ⁹},该集合中为可能出现的结果，由于“京”和“琼”高度相似，因此在某些窗口可能会将“京”字错误分类为“琼”，“B”和“8”同样也可能分错，因此根据识别模型滑动窗口在处于字符最佳位置附近时，产生的正确分类结果多于错误分类结果对上述集合L₁中的元素进行过滤处理。

构建一个最优字符分类滑动窗集合L₂。

构建一个投票组集合Z，且初始化为空。

将L₁中第一个元素C_京 ¹移到Z中。

遍历集合L₁中其余的元素分别与投票组集合Z中的C_京 ¹进行交并比IoU运算,将交并比大于第二预设阈值的元素C_琼 ²加入到投票组集合Z(C_京 ¹、C_琼 ²)，对投票组集合Z中各元素进行投票处理。

遍历上述I_{1_京}中其余的滑动窗元素C_京，分别与投票组集合Z中C_京 ¹类内交并比IoU运算，获得高于第一预设阈值的元素个数N_I或概率总和P_I，作为投票组集合Z中C_京 ¹投票得分，同理求C_琼 ²的投票得分；由于识别模型滑窗在处于字符最佳位置附近时，产生的正确分类结果多于错误分类，因此本轮投票胜利结果为C_京 ¹，将本轮投票得分值最大的元素C_京 ¹添加到L₂{C_京 ¹}中，并从L₁中删除投票组集合Z中对应的元素，然后对投票组集合Z初始化为空，并更新顺序号j，此时L₁{C_B ²、C_A ³、C₃ ⁴、C₈ ⁵、C_B ⁶、C₆ ⁷}；然后重复上述过程，直至为集合L₁空，并将每轮投票分数最高的元素加入到集合L₂中，作为获得字符识别输出结果L₂{C_京、C_A、C_B、C_A、C₃、C₈、C₆}。

可选地，第三种方式中，根据车牌编码规则将矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息，包括：根据车牌编码规则确定车牌信息在矩形车牌图像中的字符位置和字符大小；根据所确定的字符位置和字符大小对矩形车牌图像直接进行分割，得到待处理字符框；对待处理字符框进行字符识别得到车牌信息。

在其中一个实施例中，对待处理字符框进行字符识别得到车牌信息，包括：对待处理字符块进行字符识别得到每个待处理字符块对应的字符识别分类概率或置信度；当该字符框块字符识别分类概率或置信度均小于预设阈值时，将待处理字符块所对应的窗口在所述矩形车牌图像上进行扩大和/或左右移动预设距离，获得至少一个窗口尺寸和/或位置修正后对应的字符块；对修正后的待处理字符块进行字符识别得到字符识别结果；选取字符识别结果中字符识别分类概率或置信度最大的字符识别结果作为车牌信息。即对待处理的字符块所对应的字符框宽度进行扩大或左右分别移动特定像素，然后对扩大处理后或字符框所在新位置的待处理字符图像块进行字符识别得到车牌信息。

具体地，终端可以预设有编码规则，这样根据车牌类型可以确定对应的编码规则以及各个字符的字符位置和字符大小，也就是说所识别得到的矩形车牌图像是比较理想的，因此可以根据预先存储的字符位置和字符大小对矩形车牌图像进行分割，例如在字符位置处按照字符大小分割得到一个待处理字符块，同样地，在其他字符位置处也做相同处理，最后，终端对所分割得到的待处理字符块进行识别得到对应的车牌信息，例如输入到OCR模型中进行识别等。

且可选地，由于一般的矩形车牌图像不是很理想，因此按上述字符分割方法，可能分割不准确，即对的每个待处理字符块会输出属于该图块字符的分类概率或置信度，则识别准确性降低，因此为了识别准确性，终端可以首先对待处理字符块进行扩大处理，例如扩大预设数量的像素，使得待处理字符块中完整地包含一个字符，且扩大后的各个待处理字符块应该不存在重叠和粘连，这样终端将扩大后的待处理字符块输入至OCR模型中进行识别即可以得到车牌信息。

上述实施例中，通过预先设置的字符位置和字符大小对矩形车牌区域进行分割，然后再进行识别，提高准确性，且进一步地，对分割后的待处理字符块所对应的字符框进行扩大或左右平移若干字符，然后将扩大或平移后字符框所对应的字符图款输出至识别模型，保证了待处理字符块中一定完整地包含一个字符，进一步提高了识别准确性。

应该理解的是，虽然图1的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种图像识别装置，包括：预处理模块100、位置检测模块200、映射模块300和识别模块400，其中：

预处理模块，用于获取输入图像，并对输入图像进行预处理得到第一图像。

位置检测模块，用于获取用于检测待检测目标的位置检测模型；将第一图像输入至位置检测模型中得到待检测目标所在的第一区域检测框位置。

映射模块，用于将包含待检测目标的所述第一区域检测框位置映射到输入图像中，并在输入图像中截取所述第一区域检测框位置对应的区域得到第二图像。

识别模块，用于获取目标识别模型；将第二图像输入至所述目标识别模型中以对图像内容进行识别处理。

在其中一个实施例中，上述的图像识别装置还包括：

图像处理模块，用于将第一图像进行降低分辨率处理和/或将第一图像转化为灰度图。

在其中一个实施例中，位置检测模型包括第一检测模型，第一检测模型为轻量级神经网络模型，轻量级神经网络模型被配置为用于获得待检测目标所在的第一区域检测框的粗略位置；

上述的图像识别装置还包括：

尺寸扩大模块，用于将包含待检测目标的第一区域检测框的尺寸扩大。

在其中一个实施例中，上述的尺寸扩大模块用于将包含待检测目标的第一区域检测框的尺寸同比例扩大2倍或1倍。

在其中一个实施例中，位置检测模型还包括第二检测模型；上述的图像识别装置还包括：

精确区域检测框位置检测模块，用于获取用于检测待检测目标轮廓的精确外接检测框位置的第二检测模型；将第二图像输入至第二检测模型中，获得待检测目标的精确区域检测框位置；待检测目标的精确区域检测框位置是指待检测目标的轮廓外接检测框位置；

仿射变换模块，用于将精确区域检测框位置对应的图像按照目标识别模型的输入要求进行仿射变换，得到第三图像，第三图像作为目标识别模型输入数据，用于目标内容识别。

在其中一个实施例中，输入图像为车辆监控图像，对第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的第三图像为矩形车牌图像；待检测目标为车牌，图像内容为车牌信息，车牌信息包括车牌字符、车牌颜色、车牌类型中的一种或多种。

在其中一个实施例中，上述识别模块包括：

模型获取单元，用于获取车牌字符识别模型以及对第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的矩形车牌图像；

颜色识别单元，用于识别矩形车牌图像的背景颜色；

编码规则获取单元，用于获取与背景颜色对应的车牌编码规则；

字符识别单元，用于将矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息；

检测单元，用于将车牌信息送入规则检测器，规则检测器用于检测所识别的车牌信息是否符合车牌编码规则。

在其中一个实施例中，车牌字符识别模型包括字符分割模型和字符识别模型；

上述字符识别单元可以包括：

第一字符分割子单元，用于获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；控制滑动窗口沿矩形车牌图像的长度方向按滑动步长参数对应的滑动步长遍历矩形车牌图像；将各个滑动窗口对应的图像块输入至字符分割模型中，获得各个滑动窗口对应的图像块内是否是字符的分类概率或置信度；

第一字符识别子单元，用于根据各个滑动窗口对应的图像块是否是字符的分类概率或置信度统计分布，按预设条件对矩形车牌图像进行字符分割，得到待识别字符块；将字符块输入至字符识别模型获得对应字符信息；根据所识别得到的字符信息确定车牌信息。

在其中一个实施例中，上述字符识别单元可以包括：

第二字符识别子单元，用于获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；控制滑动窗口沿待矩形车牌图像的长度方向遍历矩形车牌图像，获得各个滑动窗口对应的区域的字符识别分类概率或置信度，并将当前滑动窗口字符识别分类概率或置信度最大的分类结果作为第一输出结果；对所有滑动窗口的第一输出结果集合进行过滤处理，获得字符识别输出结果；根据字符识别输出结果得到车牌信息。

在其中一个实施例中，上述第二字符识别子单元，包括：

删除子单元，用于对第一输出结果中分类概率或置信度小于预设阈值的结果进行删除处理；

类内字符过滤子单元，用于获取删除处理后第一输出结果对应的N个滑动窗口，并构建一个类内字符分类结果为滑动窗口对应的区域的元素为元素C_I的候选集合I₁，其中每个滑动窗口通过字符的类别参数，即元素C_I、分类概率或置信度、滑动窗口坐标位置以及窗口长宽进行表示；构建一个最优字符分类滑动窗集合I₂，且初始化为空；将候选集合I₁中的元素C_I按字符识别分类概率或置信度大小排序，选出分类概率或置信度最大且位置最前的滑动窗口对应的元素C_I—max，从候选集合I₁中移到最优字符分类滑动窗集合I₂中；遍历候选集合I₁中其余的元素C_I，分别与最优字符分类滑动窗集合I₂中的C_I—max进行交并比运算，当所得到的交并比高于第一预设阈值，则将该元素C_I从候选集合I₁中删除，并将所选择的元素C_I—max作为第三输出结果；重复上述过滤过程，直到候选集合I₁为空；

类间字符过滤子单元，用于对类间元素分别重复上述过滤过程；返回以C_I ^j _—max为元素并滑动窗口坐标位置进行排序的输出集合L₁，其中，j为顺序号；

错误滤除子单元，用于对输出集合L₁中元素进行投票，滤除错误结果，包括：构建一个最优字符分类滑动窗集合L₂；构建一个投票组集合Z，且初始化为空；将输出集合L₁中第一个元素移到投票组集合Z中；遍历集合L₁中其余的元素/>分别与投票组集合Z中的元素/>进行交并比运算，将交并比大于第二预设阈值的元素/>加入到投票组集合Z，对投票组集合Z中各元素进行投票处理；遍历候选集合I₁中其余的元素C_I，分别与投票组集合Z中各元素进行类内交并比运算，获得高于第一预设阈值的元素个数N_I/或分类概率或置信度总和P_I，作为投票组集合Z中各元素投票得分；将本轮投票得分值最大的元素C^a _score-max添加到最优字符分类滑动窗集合L中，并从输出集合L₁中删除投票组集合Z中对应的元素，然后对投票组集合Z初始化为空，并更新顺序号j；C^a _score-max表示在第a轮投票组集合Z中各元素投票分数最大的元素；然后重复上述对输出集合L₁中元素进行投票的过程，将每轮投票分数最高的元素加入到最优字符分类滑动窗集合L₂中，作为获得字符识别输出结果。

在其中一个实施例中，上述字符识别单元可以包括：

第二字符分割子单元，用于根据车牌编码规则确定车牌信息在矩形车牌图像中的字符位置和字符大小；

第三字符识别子单元，用于根据所确定的字符位置和字符大小对矩形车牌图像进行分割，得到待处理字符块；对待处理字符块进行字符识别得到车牌信息。

在其中一个实施例中，第三字符识别子单元包括：

字符预识别子单元，用于对待处理字符块进行字符识别得到每个待处理字符块对应的字符识别分类概率或置信度；

字符块修正子单元，用于当每个待处理字符块识别分类概率或置信度均小于预设阈值时，将待处理字符块所对应的窗口在矩形车牌图像上进行扩大和/或左右移动预设距离，获得至少一个窗口尺寸和/或位置修正后对应的字符块；

字符再识别子单元，用于对修正后的待处理字符块进行字符识别得到字符识别结果；选取字符识别结果中字符识别分类概率或置信度最大的字符识别结果作为车牌信息。

在其中一个实施例中，第一字符分割子单元或第一字符识别子单元包括：

聚类分析子单元，用于在模型训练阶段，将矩形车牌图像内的字符大小进行聚类分析；

滑动窗口尺寸确定子单元，用于根据字符聚类分析结果，确定至少一种滑动窗口尺寸参数或在标准滑动窗口尺寸基础上对滑动窗口宽度参数进行扩大或缩小，确定至少一种滑动窗口尺寸参数。

上述图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图形识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种图像识别方法，其特征在于，所述方法包括：

获取用于检测待检测目标的位置检测模型；

获取目标识别模型；

将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理；

所述输入图像为车辆监控图像，对所述第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的第三图像为矩形车牌图像；所述待检测目标为车牌，所述图像内容为车牌信息，所述车牌信息包括车牌字符；

所述将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理，包括：

识别所述矩形车牌图像的背景颜色；

获取与所述背景颜色对应的车牌编码规则；

将所述车牌信息送入规则检测器，所述规则检测器用于检测所识别的车牌信息是否符合所述车牌编码规则；

将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息，包括：

获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；

控制所述滑动窗口沿所述矩形车牌图像的长度方向遍历所述矩形车牌图像，获得各个所述滑动窗口对应的区域的字符识别分类概率或置信度，并将当前滑动窗口字符识别分类概率或置信度最大的分类结果作为第一输出结果；

对所有所述滑动窗口的第一输出结果集合进行过滤处理，获得字符识别输出结果；

根据所述字符识别输出结果得到车牌信息；

所述对所有所述滑动窗口的第一输出结果集合进行过滤处理，获得字符识别输出结果，包括：

构建一个最优字符分类滑动窗集合I₂，且初始化为空；

将所述候选集合I₁中的元素C_I按字符识别分类概率或置信度大小排序，选出分类概率或置信度最大且位置最前的滑动窗口对应的元素C_I—max，从所述候选集合I₁中移到所述最优字符分类滑动窗集合I₂中；

遍历所述候选集合I₁中其余的元素C_I，分别与所述最优字符分类滑动窗集合I₂中的C_I—max进行交并比运算，当所得到的交并比高于第一预设阈值，则将该元素C_I从所述候选集合I₁中删除，并将所选择的元素C_I—max作为第三输出结果；

重复上述过滤过程，直到所述候选集合I₁为空；

对类间元素分别重复上述过滤过程；

返回以C_I ^j _—max为元素并所述滑动窗口坐标位置进行排序的输出集合L₁，其中，j为顺序号；

对所述输出集合L₁中元素进行投票，滤除错误结果，包括：

构建一个最优字符分类滑动窗集合L₂；

构建一个投票组集合Z，且初始化为空；

将所述输出集合L₁中第一个元素C_I ¹ _—max移到所述投票组集合Z中；

遍历所述集合L₁中其余的元素C_I ^j _—max，分别与所述投票组集合Z中的元素C_I ¹ _—max进行交并比运算，将交并比大于第二预设阈值的元素C_I ^j _—max加入到所述投票组集合Z，对所述投票组集合Z中各元素进行投票处理；

遍历所述候选集合I₁中其余的元素C_I，分别与所述投票组集合Z中各元素进行类内交并比运算，获得高于第一预设阈值的元素个数N_I或分类概率或置信度总和P_I，作为所述投票组集合Z中各元素投票得分；

2.根据权利要求1所述的方法，其特征在于，在将所述第一图像输入至位置检测模型中之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述位置检测模型包括第一检测模型，所述第一检测模型为轻量级神经网络模型，所述轻量级神经网络模型被配置为用于获得所述待检测目标所在的第一区域检测框的粗略位置；

将包含所述待检测目标的所述第一区域检测框的尺寸扩大。

4.根据权利要求3所述的方法，其特征在于，所述将包含所述待检测目标的所述第一区域检测框的尺寸扩大，包括：

5.根据权利要求3所述的方法，其特征在于，所述位置检测模型还包括第二检测模型；所述将所述第二图像输入至所述目标识别模型中之前，还包括：

6.根据权利要求1所述的方法，其特征在于，所述获取至少一种尺寸的滑动窗口以及对应的滑动步长参数，包括：

7.一种图像识别装置，其特征在于，所述装置包括：

识别模块，用于获取目标识别模型；将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理；

所述识别模块包括：

模型获取单元，用于获取车牌字符识别模型以及对所述第二图像进行精确检测得到精确区域检测框位置后，再进行仿射变换得到的矩形车牌图像；

颜色识别单元，用于识别所述矩形车牌图像的背景颜色；

编码规则获取单元，用于获取与所述背景颜色对应的车牌编码规则；

字符识别单元，用于将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息；

检测单元，用于将所述车牌信息送入规则检测器，所述规则检测器用于检测所识别的车牌信息是否符合所述车牌编码规则；

所述字符识别单元包括：

第二字符识别子单元，用于获取至少一种尺寸的滑动窗口以及对应的滑动步长参数；控制所述滑动窗口沿所述矩形车牌图像的长度方向遍历所述矩形车牌图像，获得各个所述滑动窗口对应的区域的字符识别分类概率或置信度，并将当前滑动窗口字符识别分类概率或置信度最大的分类结果作为第一输出结果；对所有所述滑动窗口的第一输出结果集合进行过滤处理，获得字符识别输出结果；根据所述字符识别输出结果得到车牌信息；

所述第二字符识别子单元包括：

类内字符过滤子单元，用于获取删除处理后第一输出结果对应的N个滑动窗口，并构建一个类内字符分类结果为所述滑动窗口对应的区域的元素为元素C_I的候选集合I₁，其中每个所述滑动窗口通过字符的类别参数，即元素C_I、分类概率或置信度、滑动窗口坐标位置以及窗口长宽进行表示；构建一个最优字符分类滑动窗集合I₂，且初始化为空；将所述候选集合I₁中的元素C_I按字符识别分类概率或置信度大小排序，选出分类概率或置信度最大且位置最前的滑动窗口对应的元素C_I—max，从所述候选集合I₁中移到所述最优字符分类滑动窗集合I₂中；遍历所述候选集合I₁中其余的元素C_I，分别与所述最优字符分类滑动窗集合I₂中的C_I—max进行交并比运算，当所得到的交并比高于第一预设阈值，则将该元素C_I从所述候选集合I₁中删除，并将所选择的元素C_I—max作为第三输出结果；重复上述过滤过程，直到所述候选集合I₁为空；

类间字符过滤子单元，用于对类间元素分别重复上述过滤过程；返回以C_I ^j _—max为元素并所述滑动窗口坐标位置进行排序的输出集合L₁，其中，j为顺序号；

错误滤除子单元，用于对所述输出集合L₁中元素进行投票，滤除错误结果，包括：构建一个最优字符分类滑动窗集合L₂；构建一个投票组集合Z，且初始化为空；将所述输出集合L₁中第一个元素C_I ¹ _—max移到所述投票组集合Z中；遍历所述集合L₁中其余的元素C_I ^j _—max，分别与所述投票组集合Z中的元素C_I ¹ _—max进行交并比运算，将交并比大于第二预设阈值的元素C_I ^j _—max加入到所述投票组集合Z，对所述投票组集合Z中各元素进行投票处理；遍历所述候选集合I₁中其余的元素C_I，分别与所述投票组集合Z中各元素进行类内交并比运算，获得高于第一预设阈值的元素个数N_I或分类概率或置信度总和P_I，作为所述投票组集合Z中各元素投票得分；将本轮投票得分值最大的元素C^a _score-max添加到最优字符分类滑动窗集合L中，并从所述输出集合L₁中删除所述投票组集合Z中对应的元素，然后对所述投票组集合Z初始化为空，并更新顺序号j；C^a _score-max表示在第a轮所述投票组集合Z中各元素投票分数最大的元素；然后重复上述对所述输出集合L₁中元素进行投票的过程，将每轮投票分数最高的元素加入到最优字符分类滑动窗集合L₂中，作为获得字符识别输出结果。

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

图像处理模块，用于将所述第一图像进行降低分辨率处理和/或将所述第一图像转化为灰度图。

9.根据权利要求7所述的装置，其特征在于，所述位置检测模型包括第一检测模型，所述第一检测模型为轻量级神经网络模型，所述轻量级神经网络模型被配置为用于获得所述待检测目标所在的第一区域检测框的粗略位置；

所述装置还包括：

尺寸扩大模块，用于将包含所述待检测目标的所述第一区域检测框的尺寸扩大。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。