CN112464852B

CN112464852B - 一种车辆行驶证图片自适应矫正与识别方法

Info

Publication number: CN112464852B
Application number: CN202011425952.XA
Authority: CN
Inventors: 黄晟; 徐嘉志; 张小先; 王磊; 刘富强; 葛永新; 洪明坚; 徐玲; 张小洪
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2023-12-05
Anticipated expiration: 2040-12-09
Also published as: CN112464852A

Abstract

本发明涉及信息识别领域，特别涉及一种车辆行驶证图片自适应矫正与识别方法。本发明通过对行驶证进行拍摄，对拍摄得到的图片使用深度神经网络定位红章，基于红章位置状态对行驶证正页进行矫正和提取，并基于霍夫变换采用多种自定义算法对行驶证正页进行处理，使用Tesseract‑OCR引擎对行驶证信息进行识别。该方法节省了人力，能够快速且准确地利用计算机自动化完成对行驶证的信息进行识别，能够排除噪声、图片不清晰、拍摄摄像头色差大、行驶证正页黑色竖直设置的防伪线以及色彩对信息识别的影响，并且不用考虑行驶证拍摄背景，具有极佳的准确性和高鲁棒性。

Description

一种车辆行驶证图片自适应矫正与识别方法

技术领域

本发明涉及信息识别领域，特别涉及一种车辆行驶证图片自适应矫正与识别方法。

背景技术

我国经济高速发展，越来越多的家庭都购买了机动车，随着机动车数量的持续增长，带来了显著交通压力和对车辆管理的巨大挑战。目前对机动车行驶证是准予机动车在我国境内道路上行驶的唯一法定证件，在车辆检测中行驶证必不可少，在与车辆相关的事故、年检流程、保险等场景中有着广泛的应用。但由于行驶证是一种没有芯片的证件，在与车辆相关的事故、年检流程、保险等场景中，只能通过手动的方法对行驶证信息进行录入，这种方法十分浪费人力，速度非常慢，且由于录入人员的主观行为会导致行驶证信息录入的准确率低，效率低。

现有技术通过计算机视觉技术自动化完成行驶证重要文本的识别能有效提高车辆相关行业的效率，实现行业的智能化。一种基于OCR的行驶证信息识别方法【公开号CN105320952B】就是使用光学字符识别Optical Character Recognition，简称OCR，对行驶证的文本进行识别，OCR是利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受、又可以理解的格式。但该发明对行驶证的拍摄要求较高，鲁棒性低，且对图像的预处理粗糙，导致对行驶证的识别准确率低，效率低。

发明内容

针对现有技术存在的上述问题，本发明要解决的技术问题是：车辆行驶证的识别鲁棒性低，准确率低，效率低。

为解决上述技术问题，本发明采用如下技术方案：

一种车辆行驶证图片自适应矫正与识别方法，包括如下步骤：

S1000；行驶证检测；

S1100；对行驶证进行拍摄，得到源图片；

S1200；使用深度学习的卷积网络模型对源图片中红章区域进行检测，并裁剪得到行驶证红章区域图；

S2000；行驶证识别预处理；

S2100；将行驶证红章区域图进行灰度转换，得到红章灰度图；

S2200；使用自适应阈值法对红章灰度图进行二值化处理，得到红章二值化图

S2300；使用图像形态学和去除小连通域方法，将红章二值化图中的行驶证背景的纹理信息去除，得到红章二值化边框图；

S2400；使用轮廓检测法得到红章二值化边框图中红章的边缘信息，并使用高斯滤波器对边缘信息进行平滑处理，平滑处理完成后将边缘信息复刻成边缘信息图；

S2500；使用霍夫变换直线检测方法对边缘信息图进行检测，得到若干条直线和若干个交点；

S2600；将所有交点的横纵坐标收集形成点集，使用最小外接矩形法判断得到点集中所有点组合形成的最小外接矩形，并得到最小外接矩形的中心点坐标、宽、高和矩形旋转角度θ；

S2601；对最小外接矩形使用boxPoints函数，得到最小外接矩形四个顶点在红章区域图中的坐标；

S2700；将源图片进行旋转，当θ时，旋转角度为θ+90°，当θ时，旋转角度为θ，得到矫正源图，并对矫正源图使用行驶证倾斜矫正算法得到行驶证正页图；

S3000；行驶证识别；

S3100；使用裁剪模板对行驶证正页图进行裁剪得到文本块图，并对文本块图进行编号；

S3200；将文本块图二值化处理，再依次使用峰值填充算法，区域填充递归算法，下划线清除算法和冗余空白删除算法，最终得到干净的文本区域图；

S3300；将文本区域图使用Tesseract-OCR引擎进行识别，就可以得到行驶证的内容信息。

本发明通过对行驶证进行拍摄，对拍摄得到的图片使用深度神经网络定位红章，基于红章位置状态对行驶证正页进行矫正和提取，并基于霍夫变换采用多种自定义算法对行驶证正页进行处理，使用Tesseract-OCR引擎对行驶证信息进行识别。该方法节省了人力，能够快速且准确地利用计算机自动化完成对行驶证的信息进行识别，能够排除噪声、图片不清晰、拍摄摄像头色差大、行驶证正页黑色竖直设置的防伪线以及色彩对信息识别的影响，并且不用考虑行驶证拍摄背景，具有极佳的准确性和高鲁棒性。

作为优选，所述步骤S1100中对行驶证进行拍摄时，相机正对于行驶证正页，行驶证正页会产生旋转畸变，行驶证正页旋转角度-45°φ/>45°。对行驶证拍照时，将行驶证进行理想放置，可以节省行驶证的识别时间，增大识别的精确性。

作为优选，所述步骤S2700中行驶证倾斜矫正算法的具体步骤为：

S2710；将最小外接矩形进行旋转，θ时，旋转角度为θ+90°，当θ时，旋转角度为θ，并对旋转后的最小外接矩形四个顶点坐标的距离进行计算，得到红章的宽度和高度；

S2720；根据所述步骤S2710中得到的红章宽度与行驶证正页宽度的比值α和红章高度与行驶证正页高度的比值β，将红章的宽度除以α得到行驶证正页的宽度rw，将红章的高度除以β得到行驶证正页的高度rh；

S2730；通过源图片和红章区域图找到红章左上角在矫正源图中的坐标；

S2740；根据所述步骤S2710中得到的行驶证正页左上角与红章左上角两者的x坐标距离与行驶证正页宽度的比值γ和行驶证正页左上角与红章左上角两者的y坐标距离与行驶证正页高度的比值δ，将红章左上角x坐标减去γ与rw的乘积，得到行驶证正页左上角的x坐标，将红章左上角y坐标减去δ和rh的乘积，得到行驶证正页左上角的y坐标；

S2750；根据行驶证正页左上角的坐标和行驶证正页的宽度和高度，对矫正源图裁剪得到行驶证正页图。

通过红章与行驶证正页的位置和尺寸关系，将拍摄到的源图片矫正裁剪为只包含行驶证正页的图片，降低了源图片的复杂性，从而降低了对行驶证信息的识别难度，使行驶证正页图可以通过所述S3100步骤统一的裁剪模板进行裁剪。

作为优选，所述步骤S3100中，所述裁剪模板对行驶证正页的固定位置进行裁剪，所述固定位置有10个，即一张行驶证正页图对应有10张文本块图，对10个固定位置裁剪的文本块图进行编号；

其中，1号文本块图为号牌号码区域，2号文本块图为车辆类型区域，3号文本块图为使用性质区域，4号文本块图为品牌型号区域，5号文本块图为红章第一行区域，6号文本块图为车辆识别代号区域，7号文本块图为红章第二行区域，8号文本块图为红章第三行区域，9号文本块图为注册日期区域，10号文本块图为发证日期区域。

使用裁剪模板对行驶证正页图进行裁剪，可以将行驶证上所需信息区域化，检测时根据所需的信息针对性地调取所处的区域的文本块图，简化行驶证识别步骤，加快行驶证的识别速度，同时，针对性地检测识别文本块图可以降低的图片的复杂性，从而增加识别的精确度。

作为优选，所述步骤S3200中的峰值填充算法的具体步骤为：

S3211；将像素在x轴上的分布情况制作成直方图或将像素在y轴上的分布情况制作成直方图；

S3212；在直方图中依次试探像素量，当像素量大于0时，记录当前位置inpu，为区域初始位置，并记flag为i，继续依次试探像素量，当像素量变为0，记录当前位置outpu，为区域终止位置，输出该区域的count值，count值为该区域的宽度；

并继续依次试探像素量，当试探到的像素量再次大于0时，记录其区域初始位置，并记flag为i+1，并重复上述动作，直到图中所有像素区域划分完成，并得到所有像素区域的宽度值count；

S3213；设定阈值K，将上述所有的像素区域的宽度值与阈值进行比较，当count＜K，将该区域计入剪切数组Adel；

S3214；清除剪切数组Adel中所有的区域，即可得到文本区域图a。

使用自定义的峰值填充算法，能够有效地将文本块二值化处理后的图像中噪声和边缘上的像素清除，使所需识别的信息得到保留，增加后续信息识别的准确性。

作为优选，所述步骤S3200中的区域填充递归算法将文本区域图a中行驶证边缘外噪声清除，得到文本区域图b。由于文本块距离行驶证边缘过于接近，容易将边缘之外的部分裁剪入文本块，峰值填充算法无法将此类噪声清除，使用区域填充递归算法可以清除此类噪声便于后续的信息识别。

作为优选，所述步骤S3200中的下划线清除算法的具体步骤为：

S3221；对文本区域图b使用canny边缘检测算子进行边缘检测，得到文本边缘信息图；

S3222；对文本边缘信息图进行霍夫变换，找到若干条直线；

S3223；在文本边缘信息图中将找到直线填充为背景色，并对文本边缘信息图进行一次闭操作；

S3224；对进行闭操作后的文本边缘信息图执行一次去除小连通域处理，最终得到文本区域图c。

文本块图中部分下划线和文字部分相接，使用自定义的峰值填充算法和区域填充递归算法无法完全将下划线清除，继续通过自定义的下划线清除算法将文本块图中的剩余的下划线和小连通域进行清除，得到只保留文字信息的文本区域图b。

作为优选，所述步骤S3200中的冗余空白删除算法的具体步骤为：

S3231；沿文本区域图b的x轴正向求和压缩维度后的值P，设定阈值L，当P＞L时，记录该位置的x坐标为x₁，沿文本区域图c的x轴反向求和压缩维度后的值P，设定阈值L，当P＞L时，记录该位置的x坐标为x₂；

S3232；将文本区域图c中x坐标处于[x₁，x₂]的区域保留，其余部分删除；

S3233；将步骤S3232得到的图片沿y轴正向求和压缩维度后的值P，设定阈值L，当P＞L时，记录该位置的y坐标为y₁，沿y轴反向求和压缩维度后的值P，设定阈值L，当P＞L时，记录该位置的y坐标为y₂；

S3234；将步骤S3232得到的图片中y坐标处于[y₁，y₂]的区域保留，其余部分删除，得到最终的文本区域图。

使用上述下划线清除算法对文本区域图处理后得到的文本区域图c上，干扰信息的位置被大片空白区域替代，通过自定义的冗余空白删除算法可以将所述空白区域删除，缩小文本区域图的面积，从而能够加快对文本区域图的识别的速度。

相对于现有技术，本发明至少具有如下优点：

1、本发明通过对行驶证进行拍摄，对拍摄得到的图片使用深度神经网络定位红章，基于红章位置状态对行驶证正页进行矫正和提取，并基于霍夫变换采用包括峰值填充算法，区域填充递归算法，下划线清除算法和冗余空白删除算法的多种自定义算法对行驶证正页进行处理，使用Tesseract-OCR引擎对行驶证信息进行识别。该方法节省了人力，能够快速且准确地利用计算机自动化完成对行驶证的信息进行识别，能够排除噪声、图片不清晰、拍摄摄像头色差大、行驶证正页黑色竖直设置的防伪线以及色彩对信息识别的影响，并且不用考虑行驶证拍摄背景，具有极佳的准确性，及时性和高鲁棒性。

2、本发明采用的自适应阈值法为OpenCV的adaptiveThreshold，不同于普通阈值法，该方法是根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值。这样能够最大限度的获得图片中红章的边框信息而对反光情况具有较强的鲁棒性。

3、Tesseract-OCR引擎使用LSTM长短期记忆网络作为神经网络主干，能够准确地识别文字。

附图说明

图1为一种车辆行驶证图片自适应矫正与识别方法整体流程图。

图2为行驶证识别预处理流程图。

图3为行驶证识别流程图。

图4为红章二值化示意图。

图5为红章二值化边框示意图。

图6为行驶证正页示意图。

图7为红章矫正示意图。

图8为行驶证裁剪模板示意图。

图9为峰值裁剪算法效果示意图。

图10为冗余空白删除算法效果示意图。

图11为文本块图二值化处理流程示意图。

具体实施方式

下面对本发明作进一步详细说明。

本发明采用YOLOv3网络作为基本的目标识别网络。YOLO的基本思想为，先将先将图片划分成若干个方格（默认为7*7），在每个方格中预测回归框（默认每个方格预测两次），若存在物体，置信度为物体和方格的交并比（Intersection over Union，IoU），整合所有框的情况得到物体的位置划分。使用的YOLOv3版本，网络结构使用Darknet53网络，新增了对多标签分类以及多尺度特征图方式预测，保持了原有高速的特性并显著提高了算法精度。该卷积网络中引入了残差结构，在检测上，则是使用的多尺度（总共3个尺度）特征图，搭配9类先验框，在细粒度的检测精度上有了显著的提升。同时在最后的输出预测时，使用logistic函数，能够支持多标签对象的输出。

对行驶证的处理方法基于OpenCV中的各类函数。OpenCV是一个开源计算机视觉库，从图片加载、图片格式转换到高级一些的边界拟合、光流算法等都有它的身影。OpenCV中的计算机视觉方法都被优化过，有着很高的效率。方法中使用了部分OpenCV计算机视觉库的函数，包括二值化、图片反相，尺寸改变以及输入输出流程。

对处理后的行驶证图像采用Tesseract-OCR引擎作为文字识别。Tesseract-OCR引擎使用LSTM长短期记忆网络作为神经网络主干。本次输入是简单的上次网络的输出。而LSTM最大的改变是引入了3类控制门结构：遗忘门、输入门、输出门以及单元状态（cellstate）概念。单元状态能够表示网络中的长期记忆，与其他部分信息交互比较简单，容易保留。同时输入门和遗忘门共同作用与当前时刻输入，表示了短期的记忆。这样的网络兼顾了长短期的记忆，二者表示了字符串之间的长期和短期依赖关系，可以使识别结果更加准确。

实施例：一种车辆行驶证图片自适应矫正与识别方法，包括如下步骤：

S1000；行驶证检测；

S1100；对行驶证进行拍摄，得到源图片；

具体实施时，对行驶证进行拍摄时，相机正对于行驶证正页，行驶证正页会产生旋转畸变，行驶证正页旋转角度-45°φ/>45°。

具体实施时，使用YOLOv3卷积网络模型，并对该模型进行训练，具体训练方法使用标准的YOLOv3训练方法，在batch=64，subdivisions=16的配置下使用服务器的NVIDIATITAN V GPU，从学习率0.001开始，共训练10000个batch，当训练到第6000和8000个batch时时学习率衰减到之前的0.1倍，10000个batch训练结束即完成卷积网络模型的训练，此时训练损失loss达到较小值。YOLOv3卷积网络模型训练时随机选取车检机构提供的非公开数据集中的数据进行训练。

YOLOv3卷积网络模型训练方法为现有技术，此处不做过多说明。

S2000；行驶证识别预处理；

S2200；使用自适应阈值法对红章灰度图进行二值化处理，得到如图4所示的红章二值化图；

具体实施时，使用OpenCV的adaptiveThreshold函数对红章灰度图进行二值化处理。adaptiveThreshold函数为现有技术，此处不做过多说明。

S2300；使用图像形态学和去除小连通域方法，将红章二值化图中的行驶证背景的纹理信息去除，得到如图5所示的红章二值化边框图；

图像形态学和去除小连通域方法均为现有技术，此处不做过多说明。

具体实施时，使用OpenCV的findContours函数得到红章二值化边框图中红章的边缘信息，findContours函数为现有技术，此处不做过多说明。

具体实施时，使用使用3*3像素的高斯滤波器进行滤波。

具体实施时，使用OpenCV提供的霍夫变换直线检测方法HoughLines，设置阈值为70，即直线上若有70个前景像素，则该直线会被检测出来，从而函数返回极坐标表示的直线。通过极坐标表示，我们对获得的直线两两求斜率的积，该积若在0左右一定范围内，则这两条直线之间的交点是一个我们需要的交点。遍历完所有直线后，我们可以获得若干交点，通常情况对于红章的四个顶点位置均分布有一个以上的交点存在。

霍夫变换直线检测方法HoughLines为现有技术，此处不做过多说明。

所得最小外接矩形即为红章外轮廓，最小外接矩形左上角即为红章左上角，最小外接矩形右上角即为红章右上角，最小外接矩形左下角即为红章左下角，最小外接矩形右下角即为红章右下角。

具体实施时，最小外接矩形法使用OpenCV的minAreaRect函数，为现有技术，此处不做过多说明。

S2601；对最小外接矩形使用boxPoints函数，得到最小外接矩形的四个顶点在红章区域图中的坐标；

boxPoints函数为OpenCV中的现有技术，此处不做过多说明。

具体实施时，对源图片进行裁剪的具体步骤为：

S2710；将最小外接矩形进行旋转，θ时，旋转角度为θ+90°，当θ时，旋转角度为θ，并对旋转后的最小外接矩形进行计算，得到红章的宽度和高度；

具体实施时，最小外接矩形的左上角到右上角的距离即为红章的宽度，最小外接矩形的左上角到左下角的距离即为红章的高度。

当夹角-45°0时，即红章对于源图片逆时针旋转角度φ，此时红章左上角点为x值最小点，红章左下角点为y值最小点，红章右上角点为y值最大点，红章右下角点为x值最大点；当0/>45°时，即红章对于源图片顺时针旋转角度φ，此时红章左上角点为y值最大点，红章左下角点为x值最小点，红章右上角点为x值最大点，红章右下角点为y值最小点；当φ=0时，即红章为正置，此时，红章左上角点x值为最小点，y值为最大点；红章左下角点x值与y值均为最小点，红章右上角点x值与y值均为最大点，红章右下角点x值为最大点，y值为最小点。

具体实施时，将红章的边缘信息返回至行驶证正页图中，对红章进行裁剪，得到如图7所示的红章矫正图。

具体实施时，所述比值α为0.233，所述比值β为0.333。

具体实施时，步骤S2601中得到红章左上角在红章区域图中坐标为（x₁，y₁），红章区域图左上角在源图片中的坐标为（x₂，y₂），则红章左上角在源图片中的坐标为（x₁+x₂，y₁+y₂），就可得出源图片进行旋转矫正后，红章左上角在矫正源图中的坐标。

S2740；根据所述步骤S2710中得到的行驶证正页左上角与红章左上角两者的x坐标距离与行驶证正页宽度的比值γ和行驶证正页左上角与红章左上角两者的y坐标距离与行驶证正页高度的比值δ，将红章左上角x坐标减去γ与rw的乘积，得到行驶证正页左上角的x坐标，将红章左上角y坐标减去δ和rh的乘积，得到行驶证正页左上角的y坐标；具体实施时，所述比值γ为0.042，所述比值δ为0.629。

S2750；结合行驶证正页左上角的坐标和行驶证正页的宽度和高度，对矫正源图裁剪得到行驶证正页图。

S3000；行驶证识别；

具体实施时，裁剪模板使用两个数组存储，cutscaley与cutscalex，两个数组中的每个数据表示了y轴和x轴上的裁剪比例，取值在0至1之间。我们定义先裁剪y方向，于是cutscaley设定为一个二维数组，我们需要将y方向裁成5条，于是cutscaley的形状为5×2，每个长度为2的一位数组表示了裁剪的两个边界，边界内的内容是我们需要的内容。因此，cutscalex被设定成一个三维数组，第一维的长度为5，对应y轴方向的5条文本行，最后一维长度为2，对应每个文本块x轴方向上被裁的2个位置，第二个维度长度则决定了该条文本行会被分成多少个文本块。每块文本是不能密铺的，文本块左右上下之间的空白需要多次分配到不同文本块，加宽了每行文本的空白部分，以便在之后的处理中有更好的鲁棒性；操作时，取出cutscaley上第m个二元组表示在y轴上剪切的一长条文本块，再循环找出cutscalex[m]下的二元组，每一个二元组表示在该条文本行上取下的一块完整含有需要文本的文本块。按照这个方式，如图8所示，我们根据标准行驶证图片的比例设计了总共5个文本条，10个文本块。

对这10个文本块图进行编号；其中，1号文本块图为号牌号码区域，2号文本块图为车辆类型区域，3号文本块图为使用性质区域，4号文本块图为品牌型号区域，5号文本块图为红章第一行区域，6号文本块图为车辆识别代号区域，7号文本块图为红章第二行区域，8号文本块图为红章第三行区域，9号文本块图为注册日期区域，10号文本块图为发证日期区域。

具体实施时，以号牌号码、车辆识别代号、注册日期和发证日期作为行驶证的识别主要信息，从而对文本块图进行识别时，只需对1、6、9和10号文本块图进行识别。

具体实施时，对文本块图二值化处理过程如图11所示，依次进行增加对比度、阈值分割、去除小连通域、反相操作。

具体实施时，所述峰值填充算法的具体步骤为：

峰值填充算法可以用于y轴和x轴，但由于作用于x轴中存在一些左右结构的汉字或者本身很细的字符情况时阈值调大后容易发生误删，x轴方向裁剪只能用较小的阈值，一般设置为5。此时能去掉一些噪声和边缘上的像素，但是对于行驶证矫正没有特别到位情况，在文本块右边边缘容易多出来一部分条纹形噪声，达不到去除要求。该条纹是因为行驶证边缘外的部分被二值化形成的。使用后续改编的区域填充递归算法来解决这个问题。

具体实施时，步骤S3200中的区域填充递归算法将文本区域图a中行驶证边缘外噪声清除，得到文本区域图b。

具体实施时，由于文本块距离行驶证边缘过于接近，容易将边缘之外的部分裁剪入文本块，峰值填充算法无法将此类噪声清除，将区域填充递归算法进行改编，用于清除此类噪声，改编方式如下：

区域填充递归算法需要一个种子点和边界信息，由于二值化图片的特殊性我们可以将判断条件简化为只要当前点是前景色就进行填充操作，若是背景色便达到了边缘。如果将种子点置于中央，对于4领域法我们还需要知道下、右、上的边界信息，左的边界信息可以使用简化条件用颜色判定。将种子点设置为右下角点，利用矩形的性质，可以通过“二连通”来遍历所有点：只检测当前点左侧和上侧的点作为下一个点，这样只需要知道上边缘的信息，就能够最终得到完整的区域。并且，在进行该改进的算法前，先将y=0位置的所有像素填为背景色，这样上侧和左侧的边缘都能用简单的当前点像素颜色判定，极大的简化了算法。

具体实施时，文本块图中部分下划线和文字部分相接，使用自定义的峰值填充算法和改进的区域填充递归算法无法完全将下划线清除，继续通过自定义的下划线清除算法将文本块图中的剩余的下划线和小连通域进行清除，得到只保留文字信息的文本区域图c。

所述下划线清除算法的具体步骤为：

S3222；对文本边缘信息图进行霍夫变换，找到若干条直线；

具体实施时，霍夫变换的变换阈值选用70像素。

经过了前三个算法以及预处理流程中还有的去除小连通域等算法后，我们可以得到较为干净的图片了，此时文本周围的干扰信息被慢慢去除，但在他们的位置被大片的空白区域所代替了，这些空白区域会影响到识别的效率和准确率，需要进行一定程度的删除。使用自定义的述冗余空白删除算法对空白区域进行删除。

具体实施时，所述冗余空白删除算法的具体步骤为：

具体实施时，对Tesseract-OCR引擎进行训练的标注阶段使用JAVA开发的jTessBoxEditorFX标注软件。jTessBoxEditorFX软件是款JAVA开发的标注软件，jTessBoxEditorFX软件在对数据进行标注时，可以将多张需标注的图片合并为一个多页的tiff图片格式文件进行数据的标注。使用预训练好的Tesseract先批量对tiff文件生成文字框，将文字位置标记为box文件，使用JTessBoxEditorFX可以加载这些box并可视化，本实施例中，使用JTessBoxEditorFX标注并训练的文字达1201页，共计11650字。

实验验证

为了验证该方法的准确性，我们使用车检机构提供的非公开数据集作为测试集，从测试集中随机选取了318张图片进行识别测试，测试结果如下表所示

表中，“排除客观因素影响”是指排除了行驶证印刷过于歪斜、字符重合、严重反光、塑封线遮挡这几个因素后得到的正确率，“+12”等数字表示在原正确数目上增加的量。日期表示注册日期和发证日期两个日期字符串。

对于YOLOv3检测部分，318张图片中总共识别到314张图片的红章区域，识别到的图片全部正确。因此红章识别的召回率(Recall)为98.7%，准确率(Precision)为100%，未被识别的图片中两张是因为印刷褪色而红章模糊不清，特征不明确，两张清晰图片未被识别。除去这四张后计入行驶证识别模块进行测试，得到的测试结果如上表。由于取的测试图片是随机采样的，加上行驶证印刷过程中出现了大量字符之间的重合、歪斜、塑封折痕过于严重和拍摄时反光，排除了这些因素的正确率更能反应模型自身的能力。

测试也反应了我们设计的以霍夫变换为基础的行驶证倾斜矫正算法的有效性，通过模板裁剪的结果反推行驶证倾斜矫正算法的正确率，高达97%的图片被正确的矫正了畸变、进行了行驶证正页区域的裁剪。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种车辆行驶证图片自适应矫正与识别方法，其特征在于：包括如下步骤：

S1000；行驶证检测；

S1100；对行驶证进行拍摄，得到源图片；

S2000；行驶证识别预处理；

S2200；使用自适应阈值法对红章灰度图进行二值化处理，得到红章二值化图；

S2600；将所有交点的横纵坐标收集形成点集，使用最小外接矩形法判断得到点集中所有点组合形成的最小外接矩形，并得到最小外接矩形的中心点坐标、宽、高和矩形旋转角度θ∈(-90°,0°]；

S2700；将源图片进行旋转，当θ∈(-90°,-45°]时，旋转角度为θ+90°，当θ∈(-45°,-0°]时，旋转角度为θ，得到矫正源图，并对矫正源图使用行驶证倾斜矫正算法得到行驶证正页图；

所述行驶证倾斜矫正算法的具体步骤为：

S2710；将最小外接矩形进行旋转，θ∈(-90°,-45°]时，旋转角度为θ+90°，当θ∈(-45°,-0°]时，旋转角度为θ，并对旋转后的最小外接矩形四个顶点坐标的距离进行计算，得到红章的宽度和高度；

S2750；根据行驶证正页左上角的坐标和行驶证正页的宽度和高度，对矫正源图裁剪得到行驶证正页图；

S3000；行驶证识别；

2.如权利要求1所述的一种车辆行驶证图片自适应矫正与识别方法，其特征在于：所述步骤S1100中对行驶证进行拍摄时，相机正对于行驶证正页，行驶证正页会产生旋转畸变，行驶证正页旋转角度-45°≤φ≤45°。

3.如权利要求1所述的一种车辆行驶证图片自适应矫正与识别方法，其特征在于：所述步骤S3100中，所述裁剪模板对行驶证正页的固定位置进行裁剪，所述固定位置有10个，即一张行驶证正页图对应有10张文本块图，对10个固定位置裁剪的文本块图进行编号；

4.如权利要求3所述的一种车辆行驶证图片自适应矫正与识别方法，其特征在于：所述步骤S3200中的峰值填充算法的具体步骤为：

S3212；在直方图中依次试探像素量，当像素量大于0时，记录当前位置inpu，为区域初始位置，并记flag为i，继续依次试探像素量，当像素量等于0，记录当前位置outpu，为区域终止位置，输出该区域的count值，count值为该区域的宽度；

5.如权利要求4所述的一种车辆行驶证图片自适应矫正与识别方法，其特征在于：所述步骤S3200中的区域填充递归算法将文本区域图a中行驶证边缘外噪声清除，得到文本区域图b。

6.如权利要求5所述的一种车辆行驶证图片自适应矫正与识别方法，其特征在于：所述步骤S3200中的下划线清除算法的具体步骤为：

S3222；对文本边缘信息图进行霍夫变换，找到若干条直线；

7.如权利要求6所述的一种车辆行驶证图片自适应矫正与识别方法，其特征在于：所述步骤S3200中的冗余空白删除算法的具体步骤为：