CN112464852B - 一种车辆行驶证图片自适应矫正与识别方法 - Google Patents
一种车辆行驶证图片自适应矫正与识别方法 Download PDFInfo
- Publication number
- CN112464852B CN112464852B CN202011425952.XA CN202011425952A CN112464852B CN 112464852 B CN112464852 B CN 112464852B CN 202011425952 A CN202011425952 A CN 202011425952A CN 112464852 B CN112464852 B CN 112464852B
- Authority
- CN
- China
- Prior art keywords
- license
- red
- text
- driving license
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012937 correction Methods 0.000 title claims abstract description 26
- 230000009466 transformation Effects 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 claims description 111
- 238000001514 detection method Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 8
- AGOYDEPGAOXOCK-KCBOHYOISA-N clarithromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@](C)([C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)OC)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 AGOYDEPGAOXOCK-KCBOHYOISA-N 0.000 claims description 6
- 238000003708 edge detection Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000010008 shearing Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 5
- 239000003086 colorant Substances 0.000 abstract description 4
- 230000004075 alteration Effects 0.000 abstract description 3
- 238000012015 optical character recognition Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000012549 training Methods 0.000 description 7
- 238000007689 inspection Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013095 identification testing Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及信息识别领域,特别涉及一种车辆行驶证图片自适应矫正与识别方法。本发明通过对行驶证进行拍摄,对拍摄得到的图片使用深度神经网络定位红章,基于红章位置状态对行驶证正页进行矫正和提取,并基于霍夫变换采用多种自定义算法对行驶证正页进行处理,使用Tesseract‑OCR引擎对行驶证信息进行识别。该方法节省了人力,能够快速且准确地利用计算机自动化完成对行驶证的信息进行识别,能够排除噪声、图片不清晰、拍摄摄像头色差大、行驶证正页黑色竖直设置的防伪线以及色彩对信息识别的影响,并且不用考虑行驶证拍摄背景,具有极佳的准确性和高鲁棒性。
Description
技术领域
本发明涉及信息识别领域,特别涉及一种车辆行驶证图片自适应矫正与识别方法。
背景技术
我国经济高速发展,越来越多的家庭都购买了机动车,随着机动车数量的持续增长,带来了显著交通压力和对车辆管理的巨大挑战。目前对机动车行驶证是准予机动车在我国境内道路上行驶的唯一法定证件,在车辆检测中行驶证必不可少,在与车辆相关的事故、年检流程、保险等场景中有着广泛的应用。但由于行驶证是一种没有芯片的证件,在与车辆相关的事故、年检流程、保险等场景中,只能通过手动的方法对行驶证信息进行录入,这种方法十分浪费人力,速度非常慢,且由于录入人员的主观行为会导致行驶证信息录入的准确率低,效率低。
现有技术通过计算机视觉技术自动化完成行驶证重要文本的识别能有效提高车辆相关行业的效率,实现行业的智能化。一种基于OCR的行驶证信息识别方法【公开号CN105320952B】就是使用光学字符识别Optical Character Recognition,简称OCR,对行驶证的文本进行识别,OCR是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、又可以理解的格式。但该发明对行驶证的拍摄要求较高,鲁棒性低,且对图像的预处理粗糙,导致对行驶证的识别准确率低,效率低。
发明内容
针对现有技术存在的上述问题,本发明要解决的技术问题是:车辆行驶证的识别鲁棒性低,准确率低,效率低。
为解决上述技术问题,本发明采用如下技术方案:
一种车辆行驶证图片自适应矫正与识别方法,包括如下步骤:
S1000;行驶证检测;
S1100;对行驶证进行拍摄,得到源图片;
S1200;使用深度学习的卷积网络模型对源图片中红章区域进行检测,并裁剪得到行驶证红章区域图;
S2000;行驶证识别预处理;
S2100;将行驶证红章区域图进行灰度转换,得到红章灰度图;
S2200;使用自适应阈值法对红章灰度图进行二值化处理,得到红章二值化图
S2300;使用图像形态学和去除小连通域方法,将红章二值化图中的行驶证背景的纹理信息去除,得到红章二值化边框图;
S2400;使用轮廓检测法得到红章二值化边框图中红章的边缘信息,并使用高斯滤波器对边缘信息进行平滑处理,平滑处理完成后将边缘信息复刻成边缘信息图;
S2500;使用霍夫变换直线检测方法对边缘信息图进行检测,得到若干条直线和若干个交点;
S2600;将所有交点的横纵坐标收集形成点集,使用最小外接矩形法判断得到点集中所有点组合形成的最小外接矩形,并得到最小外接矩形的中心点坐标、宽、高和矩形旋转角度θ;
S2601;对最小外接矩形使用boxPoints函数,得到最小外接矩形四个顶点在红章区域图中的坐标;
S2700;将源图片进行旋转,当θ时,旋转角度为θ+90°,当θ时,旋转角度为θ,得到矫正源图,并对矫正源图使用行驶证倾斜矫正算法得到行驶证正页图;
S3000;行驶证识别;
S3100;使用裁剪模板对行驶证正页图进行裁剪得到文本块图,并对文本块图进行编号;
S3200;将文本块图二值化处理,再依次使用峰值填充算法,区域填充递归算法,下划线清除算法和冗余空白删除算法,最终得到干净的文本区域图;
S3300;将文本区域图使用Tesseract-OCR引擎进行识别,就可以得到行驶证的内容信息。
本发明通过对行驶证进行拍摄,对拍摄得到的图片使用深度神经网络定位红章,基于红章位置状态对行驶证正页进行矫正和提取,并基于霍夫变换采用多种自定义算法对行驶证正页进行处理,使用Tesseract-OCR引擎对行驶证信息进行识别。该方法节省了人力,能够快速且准确地利用计算机自动化完成对行驶证的信息进行识别,能够排除噪声、图片不清晰、拍摄摄像头色差大、行驶证正页黑色竖直设置的防伪线以及色彩对信息识别的影响,并且不用考虑行驶证拍摄背景,具有极佳的准确性和高鲁棒性。
作为优选,所述步骤S1100中对行驶证进行拍摄时,相机正对于行驶证正页,行驶证正页会产生旋转畸变,行驶证正页旋转角度-45°φ/>45°。对行驶证拍照时,将行驶证进行理想放置,可以节省行驶证的识别时间,增大识别的精确性。
作为优选,所述步骤S2700中行驶证倾斜矫正算法的具体步骤为:
S2710;将最小外接矩形进行旋转,θ时,旋转角度为θ+90°,当θ时,旋转角度为θ,并对旋转后的最小外接矩形四个顶点坐标的距离进行计算,得到红章的宽度和高度;
S2720;根据所述步骤S2710中得到的红章宽度与行驶证正页宽度的比值α和红章高度与行驶证正页高度的比值β,将红章的宽度除以α得到行驶证正页的宽度rw,将红章的高度除以β得到行驶证正页的高度rh;
S2730;通过源图片和红章区域图找到红章左上角在矫正源图中的坐标;
S2740;根据所述步骤S2710中得到的行驶证正页左上角与红章左上角两者的x坐标距离与行驶证正页宽度的比值γ和行驶证正页左上角与红章左上角两者的y坐标距离与行驶证正页高度的比值δ,将红章左上角x坐标减去γ与rw的乘积,得到行驶证正页左上角的x坐标,将红章左上角y坐标减去δ和rh的乘积,得到行驶证正页左上角的y坐标;
S2750;根据行驶证正页左上角的坐标和行驶证正页的宽度和高度,对矫正源图裁剪得到行驶证正页图。
通过红章与行驶证正页的位置和尺寸关系,将拍摄到的源图片矫正裁剪为只包含行驶证正页的图片,降低了源图片的复杂性,从而降低了对行驶证信息的识别难度,使行驶证正页图可以通过所述S3100步骤统一的裁剪模板进行裁剪。
作为优选,所述步骤S3100中,所述裁剪模板对行驶证正页的固定位置进行裁剪,所述固定位置有10个,即一张行驶证正页图对应有10张文本块图,对10个固定位置裁剪的文本块图进行编号;
其中,1号文本块图为号牌号码区域,2号文本块图为车辆类型区域,3号文本块图为使用性质区域,4号文本块图为品牌型号区域,5号文本块图为红章第一行区域,6号文本块图为车辆识别代号区域,7号文本块图为红章第二行区域,8号文本块图为红章第三行区域,9号文本块图为注册日期区域,10号文本块图为发证日期区域。
使用裁剪模板对行驶证正页图进行裁剪,可以将行驶证上所需信息区域化,检测时根据所需的信息针对性地调取所处的区域的文本块图,简化行驶证识别步骤,加快行驶证的识别速度,同时,针对性地检测识别文本块图可以降低的图片的复杂性,从而增加识别的精确度。
作为优选,所述步骤S3200中的峰值填充算法的具体步骤为:
S3211;将像素在x轴上的分布情况制作成直方图或将像素在y轴上的分布情况制作成直方图;
S3212;在直方图中依次试探像素量,当像素量大于0时,记录当前位置inpu,为区域初始位置,并记flag为i,继续依次试探像素量,当像素量变为0,记录当前位置outpu,为区域终止位置,输出该区域的count值,count值为该区域的宽度;
并继续依次试探像素量,当试探到的像素量再次大于0时,记录其区域初始位置,并记flag为i+1,并重复上述动作,直到图中所有像素区域划分完成,并得到所有像素区域的宽度值count;
S3213;设定阈值K,将上述所有的像素区域的宽度值与阈值进行比较,当count<K,将该区域计入剪切数组Adel;
S3214;清除剪切数组Adel中所有的区域,即可得到文本区域图a。
使用自定义的峰值填充算法,能够有效地将文本块二值化处理后的图像中噪声和边缘上的像素清除,使所需识别的信息得到保留,增加后续信息识别的准确性。
作为优选,所述步骤S3200中的区域填充递归算法将文本区域图a中行驶证边缘外噪声清除,得到文本区域图b。由于文本块距离行驶证边缘过于接近,容易将边缘之外的部分裁剪入文本块,峰值填充算法无法将此类噪声清除,使用区域填充递归算法可以清除此类噪声便于后续的信息识别。
作为优选,所述步骤S3200中的下划线清除算法的具体步骤为:
S3221;对文本区域图b使用canny边缘检测算子进行边缘检测,得到文本边缘信息图;
S3222;对文本边缘信息图进行霍夫变换,找到若干条直线;
S3223;在文本边缘信息图中将找到直线填充为背景色,并对文本边缘信息图进行一次闭操作;
S3224;对进行闭操作后的文本边缘信息图执行一次去除小连通域处理,最终得到文本区域图c。
文本块图中部分下划线和文字部分相接,使用自定义的峰值填充算法和区域填充递归算法无法完全将下划线清除,继续通过自定义的下划线清除算法将文本块图中的剩余的下划线和小连通域进行清除,得到只保留文字信息的文本区域图b。
作为优选,所述步骤S3200中的冗余空白删除算法的具体步骤为:
S3231;沿文本区域图b的x轴正向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的x坐标为x1,沿文本区域图c的x轴反向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的x坐标为x2;
S3232;将文本区域图c中x坐标处于[x1,x2]的区域保留,其余部分删除;
S3233;将步骤S3232得到的图片沿y轴正向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的y坐标为y1,沿y轴反向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的y坐标为y2;
S3234;将步骤S3232得到的图片中y坐标处于[y1,y2]的区域保留,其余部分删除,得到最终的文本区域图。
使用上述下划线清除算法对文本区域图处理后得到的文本区域图c上,干扰信息的位置被大片空白区域替代,通过自定义的冗余空白删除算法可以将所述空白区域删除,缩小文本区域图的面积,从而能够加快对文本区域图的识别的速度。
相对于现有技术,本发明至少具有如下优点:
1、本发明通过对行驶证进行拍摄,对拍摄得到的图片使用深度神经网络定位红章,基于红章位置状态对行驶证正页进行矫正和提取,并基于霍夫变换采用包括峰值填充算法,区域填充递归算法,下划线清除算法和冗余空白删除算法的多种自定义算法对行驶证正页进行处理,使用Tesseract-OCR引擎对行驶证信息进行识别。该方法节省了人力,能够快速且准确地利用计算机自动化完成对行驶证的信息进行识别,能够排除噪声、图片不清晰、拍摄摄像头色差大、行驶证正页黑色竖直设置的防伪线以及色彩对信息识别的影响,并且不用考虑行驶证拍摄背景,具有极佳的准确性,及时性和高鲁棒性。
2、本发明采用的自适应阈值法为OpenCV的adaptiveThreshold,不同于普通阈值法,该方法是根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值。这样能够最大限度的获得图片中红章的边框信息而对反光情况具有较强的鲁棒性。
3、Tesseract-OCR引擎使用LSTM长短期记忆网络作为神经网络主干,能够准确地识别文字。
附图说明
图1为一种车辆行驶证图片自适应矫正与识别方法整体流程图。
图2为行驶证识别预处理流程图。
图3为行驶证识别流程图。
图4为红章二值化示意图。
图5为红章二值化边框示意图。
图6为行驶证正页示意图。
图7为红章矫正示意图。
图8为行驶证裁剪模板示意图。
图9为峰值裁剪算法效果示意图。
图10为冗余空白删除算法效果示意图。
图11为文本块图二值化处理流程示意图。
具体实施方式
下面对本发明作进一步详细说明。
本发明采用YOLOv3网络作为基本的目标识别网络。YOLO的基本思想为,先将先将图片划分成若干个方格(默认为7*7),在每个方格中预测回归框(默认每个方格预测两次),若存在物体,置信度为物体和方格的交并比(Intersection over Union,IoU),整合所有框的情况得到物体的位置划分。使用的YOLOv3版本,网络结构使用Darknet53网络,新增了对多标签分类以及多尺度特征图方式预测,保持了原有高速的特性并显著提高了算法精度。该卷积网络中引入了残差结构,在检测上,则是使用的多尺度(总共3个尺度)特征图,搭配9类先验框,在细粒度的检测精度上有了显著的提升。同时在最后的输出预测时,使用logistic函数,能够支持多标签对象的输出。
对行驶证的处理方法基于OpenCV中的各类函数。OpenCV是一个开源计算机视觉库,从图片加载、图片格式转换到高级一些的边界拟合、光流算法等都有它的身影。OpenCV中的计算机视觉方法都被优化过,有着很高的效率。方法中使用了部分OpenCV计算机视觉库的函数,包括二值化、图片反相,尺寸改变以及输入输出流程。
对处理后的行驶证图像采用Tesseract-OCR引擎作为文字识别。Tesseract-OCR引擎使用LSTM长短期记忆网络作为神经网络主干。本次输入是简单的上次网络的输出。而LSTM最大的改变是引入了3类控制门结构:遗忘门、输入门、输出门以及单元状态(cellstate)概念。单元状态能够表示网络中的长期记忆,与其他部分信息交互比较简单,容易保留。同时输入门和遗忘门共同作用与当前时刻输入,表示了短期的记忆。这样的网络兼顾了长短期的记忆,二者表示了字符串之间的长期和短期依赖关系,可以使识别结果更加准确。
实施例:一种车辆行驶证图片自适应矫正与识别方法,包括如下步骤:
S1000;行驶证检测;
S1100;对行驶证进行拍摄,得到源图片;
具体实施时,对行驶证进行拍摄时,相机正对于行驶证正页,行驶证正页会产生旋转畸变,行驶证正页旋转角度-45°φ/>45°。
S1200;使用深度学习的卷积网络模型对源图片中红章区域进行检测,并裁剪得到行驶证红章区域图;
具体实施时,使用YOLOv3卷积网络模型,并对该模型进行训练,具体训练方法使用标准的YOLOv3训练方法,在batch=64,subdivisions=16的配置下使用服务器的NVIDIATITAN V GPU,从学习率0.001开始,共训练10000个batch,当训练到第6000和8000个batch时时学习率衰减到之前的0.1倍,10000个batch训练结束即完成卷积网络模型的训练,此时训练损失loss达到较小值。YOLOv3卷积网络模型训练时随机选取车检机构提供的非公开数据集中的数据进行训练。
YOLOv3卷积网络模型训练方法为现有技术,此处不做过多说明。
S2000;行驶证识别预处理;
S2100;将行驶证红章区域图进行灰度转换,得到红章灰度图;
S2200;使用自适应阈值法对红章灰度图进行二值化处理,得到如图4所示的红章二值化图;
具体实施时,使用OpenCV的adaptiveThreshold函数对红章灰度图进行二值化处理。adaptiveThreshold函数为现有技术,此处不做过多说明。
S2300;使用图像形态学和去除小连通域方法,将红章二值化图中的行驶证背景的纹理信息去除,得到如图5所示的红章二值化边框图;
图像形态学和去除小连通域方法均为现有技术,此处不做过多说明。
S2400;使用轮廓检测法得到红章二值化边框图中红章的边缘信息,并使用高斯滤波器对边缘信息进行平滑处理,平滑处理完成后将边缘信息复刻成边缘信息图;
具体实施时,使用OpenCV的findContours函数得到红章二值化边框图中红章的边缘信息,findContours函数为现有技术,此处不做过多说明。
具体实施时,使用使用3*3像素的高斯滤波器进行滤波。
S2500;使用霍夫变换直线检测方法对边缘信息图进行检测,得到若干条直线和若干个交点;
具体实施时,使用OpenCV提供的霍夫变换直线检测方法HoughLines,设置阈值为70,即直线上若有70个前景像素,则该直线会被检测出来,从而函数返回极坐标表示的直线。通过极坐标表示,我们对获得的直线两两求斜率的积,该积若在0左右一定范围内,则这两条直线之间的交点是一个我们需要的交点。遍历完所有直线后,我们可以获得若干交点,通常情况对于红章的四个顶点位置均分布有一个以上的交点存在。
霍夫变换直线检测方法HoughLines为现有技术,此处不做过多说明。
S2600;将所有交点的横纵坐标收集形成点集,使用最小外接矩形法判断得到点集中所有点组合形成的最小外接矩形,并得到最小外接矩形的中心点坐标、宽、高和矩形旋转角度θ;
所得最小外接矩形即为红章外轮廓,最小外接矩形左上角即为红章左上角,最小外接矩形右上角即为红章右上角,最小外接矩形左下角即为红章左下角,最小外接矩形右下角即为红章右下角。
具体实施时,最小外接矩形法使用OpenCV的minAreaRect函数,为现有技术,此处不做过多说明。
S2601;对最小外接矩形使用boxPoints函数,得到最小外接矩形的四个顶点在红章区域图中的坐标;
boxPoints函数为OpenCV中的现有技术,此处不做过多说明。
S2700;将源图片进行旋转,当θ时,旋转角度为θ+90°,当θ时,旋转角度为θ,得到矫正源图,并对矫正源图使用行驶证倾斜矫正算法得到行驶证正页图;
具体实施时,对源图片进行裁剪的具体步骤为:
S2710;将最小外接矩形进行旋转,θ时,旋转角度为θ+90°,当θ时,旋转角度为θ,并对旋转后的最小外接矩形进行计算,得到红章的宽度和高度;
具体实施时,最小外接矩形的左上角到右上角的距离即为红章的宽度,最小外接矩形的左上角到左下角的距离即为红章的高度。
当夹角-45°0时,即红章对于源图片逆时针旋转角度φ,此时红章左上角点为x值最小点,红章左下角点为y值最小点,红章右上角点为y值最大点,红章右下角点为x值最大点;当0/>45°时,即红章对于源图片顺时针旋转角度φ,此时红章左上角点为y值最大点,红章左下角点为x值最小点,红章右上角点为x值最大点,红章右下角点为y值最小点;当φ=0时,即红章为正置,此时,红章左上角点x值为最小点,y值为最大点;红章左下角点x值与y值均为最小点,红章右上角点x值与y值均为最大点,红章右下角点x值为最大点,y值为最小点。
具体实施时,将红章的边缘信息返回至行驶证正页图中,对红章进行裁剪,得到如图7所示的红章矫正图。
S2720;根据所述步骤S2710中得到的红章宽度与行驶证正页宽度的比值α和红章高度与行驶证正页高度的比值β,将红章的宽度除以α得到行驶证正页的宽度rw,将红章的高度除以β得到行驶证正页的高度rh;
具体实施时,所述比值α为0.233,所述比值β为0.333。
S2730;通过源图片和红章区域图找到红章左上角在矫正源图中的坐标;
具体实施时,步骤S2601中得到红章左上角在红章区域图中坐标为(x1,y1),红章区域图左上角在源图片中的坐标为(x2,y2),则红章左上角在源图片中的坐标为(x1+x2,y1+y2),就可得出源图片进行旋转矫正后,红章左上角在矫正源图中的坐标。
S2740;根据所述步骤S2710中得到的行驶证正页左上角与红章左上角两者的x坐标距离与行驶证正页宽度的比值γ和行驶证正页左上角与红章左上角两者的y坐标距离与行驶证正页高度的比值δ,将红章左上角x坐标减去γ与rw的乘积,得到行驶证正页左上角的x坐标,将红章左上角y坐标减去δ和rh的乘积,得到行驶证正页左上角的y坐标;具体实施时,所述比值γ为0.042,所述比值δ为0.629。
S2750;结合行驶证正页左上角的坐标和行驶证正页的宽度和高度,对矫正源图裁剪得到行驶证正页图。
S3000;行驶证识别;
S3100;使用裁剪模板对行驶证正页图进行裁剪得到文本块图,并对文本块图进行编号;
具体实施时,裁剪模板使用两个数组存储,cutscaley与cutscalex,两个数组中的每个数据表示了y轴和x轴上的裁剪比例,取值在0至1之间。我们定义先裁剪y方向,于是cutscaley设定为一个二维数组,我们需要将y方向裁成5条,于是cutscaley的形状为5×2,每个长度为2的一位数组表示了裁剪的两个边界,边界内的内容是我们需要的内容。因此,cutscalex被设定成一个三维数组,第一维的长度为5,对应y轴方向的5条文本行,最后一维长度为2,对应每个文本块x轴方向上被裁的2个位置,第二个维度长度则决定了该条文本行会被分成多少个文本块。每块文本是不能密铺的,文本块左右上下之间的空白需要多次分配到不同文本块,加宽了每行文本的空白部分,以便在之后的处理中有更好的鲁棒性;操作时,取出cutscaley上第m个二元组表示在y轴上剪切的一长条文本块,再循环找出cutscalex[m]下的二元组,每一个二元组表示在该条文本行上取下的一块完整含有需要文本的文本块。按照这个方式,如图8所示,我们根据标准行驶证图片的比例设计了总共5个文本条,10个文本块。
对这10个文本块图进行编号;其中,1号文本块图为号牌号码区域,2号文本块图为车辆类型区域,3号文本块图为使用性质区域,4号文本块图为品牌型号区域,5号文本块图为红章第一行区域,6号文本块图为车辆识别代号区域,7号文本块图为红章第二行区域,8号文本块图为红章第三行区域,9号文本块图为注册日期区域,10号文本块图为发证日期区域。
具体实施时,以号牌号码、车辆识别代号、注册日期和发证日期作为行驶证的识别主要信息,从而对文本块图进行识别时,只需对1、6、9和10号文本块图进行识别。
S3200;将文本块图二值化处理,再依次使用峰值填充算法,区域填充递归算法,下划线清除算法和冗余空白删除算法,最终得到干净的文本区域图;
具体实施时,对文本块图二值化处理过程如图11所示,依次进行增加对比度、阈值分割、去除小连通域、反相操作。
具体实施时,所述峰值填充算法的具体步骤为:
S3211;将像素在x轴上的分布情况制作成直方图或将像素在y轴上的分布情况制作成直方图;
S3212;在直方图中依次试探像素量,当像素量大于0时,记录当前位置inpu,为区域初始位置,并记flag为i,继续依次试探像素量,当像素量变为0,记录当前位置outpu,为区域终止位置,输出该区域的count值,count值为该区域的宽度;
并继续依次试探像素量,当试探到的像素量再次大于0时,记录其区域初始位置,并记flag为i+1,并重复上述动作,直到图中所有像素区域划分完成,并得到所有像素区域的宽度值count;
S3213;设定阈值K,将上述所有的像素区域的宽度值与阈值进行比较,当count<K,将该区域计入剪切数组Adel;
S3214;清除剪切数组Adel中所有的区域,即可得到文本区域图a。
峰值填充算法可以用于y轴和x轴,但由于作用于x轴中存在一些左右结构的汉字或者本身很细的字符情况时阈值调大后容易发生误删,x轴方向裁剪只能用较小的阈值,一般设置为5。此时能去掉一些噪声和边缘上的像素,但是对于行驶证矫正没有特别到位情况,在文本块右边边缘容易多出来一部分条纹形噪声,达不到去除要求。该条纹是因为行驶证边缘外的部分被二值化形成的。使用后续改编的区域填充递归算法来解决这个问题。
具体实施时,步骤S3200中的区域填充递归算法将文本区域图a中行驶证边缘外噪声清除,得到文本区域图b。
具体实施时,由于文本块距离行驶证边缘过于接近,容易将边缘之外的部分裁剪入文本块,峰值填充算法无法将此类噪声清除,将区域填充递归算法进行改编,用于清除此类噪声,改编方式如下:
区域填充递归算法需要一个种子点和边界信息,由于二值化图片的特殊性我们可以将判断条件简化为只要当前点是前景色就进行填充操作,若是背景色便达到了边缘。如果将种子点置于中央,对于4领域法我们还需要知道下、右、上的边界信息,左的边界信息可以使用简化条件用颜色判定。将种子点设置为右下角点,利用矩形的性质,可以通过“二连通”来遍历所有点:只检测当前点左侧和上侧的点作为下一个点,这样只需要知道上边缘的信息,就能够最终得到完整的区域。并且,在进行该改进的算法前,先将y=0位置的所有像素填为背景色,这样上侧和左侧的边缘都能用简单的当前点像素颜色判定,极大的简化了算法。
具体实施时,文本块图中部分下划线和文字部分相接,使用自定义的峰值填充算法和改进的区域填充递归算法无法完全将下划线清除,继续通过自定义的下划线清除算法将文本块图中的剩余的下划线和小连通域进行清除,得到只保留文字信息的文本区域图c。
所述下划线清除算法的具体步骤为:
S3221;对文本区域图b使用canny边缘检测算子进行边缘检测,得到文本边缘信息图;
S3222;对文本边缘信息图进行霍夫变换,找到若干条直线;
具体实施时,霍夫变换的变换阈值选用70像素。
S3223;在文本边缘信息图中将找到直线填充为背景色,并对文本边缘信息图进行一次闭操作;
S3224;对进行闭操作后的文本边缘信息图执行一次去除小连通域处理,最终得到文本区域图c。
经过了前三个算法以及预处理流程中还有的去除小连通域等算法后,我们可以得到较为干净的图片了,此时文本周围的干扰信息被慢慢去除,但在他们的位置被大片的空白区域所代替了,这些空白区域会影响到识别的效率和准确率,需要进行一定程度的删除。使用自定义的述冗余空白删除算法对空白区域进行删除。
具体实施时,所述冗余空白删除算法的具体步骤为:
S3231;沿文本区域图b的x轴正向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的x坐标为x1,沿文本区域图c的x轴反向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的x坐标为x2;
S3232;将文本区域图c中x坐标处于[x1,x2]的区域保留,其余部分删除;
S3233;将步骤S3232得到的图片沿y轴正向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的y坐标为y1,沿y轴反向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的y坐标为y2;
S3234;将步骤S3232得到的图片中y坐标处于[y1,y2]的区域保留,其余部分删除,得到最终的文本区域图。
S3300;将文本区域图使用Tesseract-OCR引擎进行识别,就可以得到行驶证的内容信息。
具体实施时,对Tesseract-OCR引擎进行训练的标注阶段使用JAVA开发的jTessBoxEditorFX标注软件。jTessBoxEditorFX软件是款JAVA开发的标注软件,jTessBoxEditorFX软件在对数据进行标注时,可以将多张需标注的图片合并为一个多页的tiff图片格式文件进行数据的标注。使用预训练好的Tesseract先批量对tiff文件生成文字框,将文字位置标记为box文件,使用JTessBoxEditorFX可以加载这些box并可视化,本实施例中,使用JTessBoxEditorFX标注并训练的文字达1201页,共计11650字。
实验验证
为了验证该方法的准确性,我们使用车检机构提供的非公开数据集作为测试集,从测试集中随机选取了318张图片进行识别测试,测试结果如下表所示
表中,“排除客观因素影响”是指排除了行驶证印刷过于歪斜、字符重合、严重反光、塑封线遮挡这几个因素后得到的正确率,“+12”等数字表示在原正确数目上增加的量。日期表示注册日期和发证日期两个日期字符串。
对于YOLOv3检测部分,318张图片中总共识别到314张图片的红章区域,识别到的图片全部正确。因此红章识别的召回率(Recall)为98.7%,准确率(Precision)为100%,未被识别的图片中两张是因为印刷褪色而红章模糊不清,特征不明确,两张清晰图片未被识别。除去这四张后计入行驶证识别模块进行测试,得到的测试结果如上表。由于取的测试图片是随机采样的,加上行驶证印刷过程中出现了大量字符之间的重合、歪斜、塑封折痕过于严重和拍摄时反光,排除了这些因素的正确率更能反应模型自身的能力。
测试也反应了我们设计的以霍夫变换为基础的行驶证倾斜矫正算法的有效性,通过模板裁剪的结果反推行驶证倾斜矫正算法的正确率,高达97%的图片被正确的矫正了畸变、进行了行驶证正页区域的裁剪。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (7)
1.一种车辆行驶证图片自适应矫正与识别方法,其特征在于:包括如下步骤:
S1000;行驶证检测;
S1100;对行驶证进行拍摄,得到源图片;
S1200;使用深度学习的卷积网络模型对源图片中红章区域进行检测,并裁剪得到行驶证红章区域图;
S2000;行驶证识别预处理;
S2100;将行驶证红章区域图进行灰度转换,得到红章灰度图;
S2200;使用自适应阈值法对红章灰度图进行二值化处理,得到红章二值化图;
S2300;使用图像形态学和去除小连通域方法,将红章二值化图中的行驶证背景的纹理信息去除,得到红章二值化边框图;
S2400;使用轮廓检测法得到红章二值化边框图中红章的边缘信息,并使用高斯滤波器对边缘信息进行平滑处理,平滑处理完成后将边缘信息复刻成边缘信息图;
S2500;使用霍夫变换直线检测方法对边缘信息图进行检测,得到若干条直线和若干个交点;
S2600;将所有交点的横纵坐标收集形成点集,使用最小外接矩形法判断得到点集中所有点组合形成的最小外接矩形,并得到最小外接矩形的中心点坐标、宽、高和矩形旋转角度θ∈(-90°,0°];
S2601;对最小外接矩形使用boxPoints函数,得到最小外接矩形四个顶点在红章区域图中的坐标;
S2700;将源图片进行旋转,当θ∈(-90°,-45°]时,旋转角度为θ+90°,当θ∈(-45°,-0°]时,旋转角度为θ,得到矫正源图,并对矫正源图使用行驶证倾斜矫正算法得到行驶证正页图;
所述行驶证倾斜矫正算法的具体步骤为:
S2710;将最小外接矩形进行旋转,θ∈(-90°,-45°]时,旋转角度为θ+90°,当θ∈(-45°,-0°]时,旋转角度为θ,并对旋转后的最小外接矩形四个顶点坐标的距离进行计算,得到红章的宽度和高度;
S2720;根据所述步骤S2710中得到的红章宽度与行驶证正页宽度的比值α和红章高度与行驶证正页高度的比值β,将红章的宽度除以α得到行驶证正页的宽度rw,将红章的高度除以β得到行驶证正页的高度rh;
S2730;通过源图片和红章区域图找到红章左上角在矫正源图中的坐标;
S2740;根据所述步骤S2710中得到的行驶证正页左上角与红章左上角两者的x坐标距离与行驶证正页宽度的比值γ和行驶证正页左上角与红章左上角两者的y坐标距离与行驶证正页高度的比值δ,将红章左上角x坐标减去γ与rw的乘积,得到行驶证正页左上角的x坐标,将红章左上角y坐标减去δ和rh的乘积,得到行驶证正页左上角的y坐标;
S2750;根据行驶证正页左上角的坐标和行驶证正页的宽度和高度,对矫正源图裁剪得到行驶证正页图;
S3000;行驶证识别;
S3100;使用裁剪模板对行驶证正页图进行裁剪得到文本块图,并对文本块图进行编号;
S3200;将文本块图二值化处理,再依次使用峰值填充算法,区域填充递归算法,下划线清除算法和冗余空白删除算法,最终得到干净的文本区域图;
S3300;将文本区域图使用Tesseract-OCR引擎进行识别,就可以得到行驶证的内容信息。
2.如权利要求1所述的一种车辆行驶证图片自适应矫正与识别方法,其特征在于:所述步骤S1100中对行驶证进行拍摄时,相机正对于行驶证正页,行驶证正页会产生旋转畸变,行驶证正页旋转角度-45°≤φ≤45°。
3.如权利要求1所述的一种车辆行驶证图片自适应矫正与识别方法,其特征在于:所述步骤S3100中,所述裁剪模板对行驶证正页的固定位置进行裁剪,所述固定位置有10个,即一张行驶证正页图对应有10张文本块图,对10个固定位置裁剪的文本块图进行编号;
其中,1号文本块图为号牌号码区域,2号文本块图为车辆类型区域,3号文本块图为使用性质区域,4号文本块图为品牌型号区域,5号文本块图为红章第一行区域,6号文本块图为车辆识别代号区域,7号文本块图为红章第二行区域,8号文本块图为红章第三行区域,9号文本块图为注册日期区域,10号文本块图为发证日期区域。
4.如权利要求3所述的一种车辆行驶证图片自适应矫正与识别方法,其特征在于:所述步骤S3200中的峰值填充算法的具体步骤为:
S3211;将像素在x轴上的分布情况制作成直方图或将像素在y轴上的分布情况制作成直方图;
S3212;在直方图中依次试探像素量,当像素量大于0时,记录当前位置inpu,为区域初始位置,并记flag为i,继续依次试探像素量,当像素量等于0,记录当前位置outpu,为区域终止位置,输出该区域的count值,count值为该区域的宽度;
并继续依次试探像素量,当试探到的像素量再次大于0时,记录其区域初始位置,并记flag为i+1,并重复上述动作,直到图中所有像素区域划分完成,并得到所有像素区域的宽度值count;
S3213;设定阈值K,将上述所有的像素区域的宽度值与阈值进行比较,当count<K,将该区域计入剪切数组Adel;
S3214;清除剪切数组Adel中所有的区域,即可得到文本区域图a。
5.如权利要求4所述的一种车辆行驶证图片自适应矫正与识别方法,其特征在于:所述步骤S3200中的区域填充递归算法将文本区域图a中行驶证边缘外噪声清除,得到文本区域图b。
6.如权利要求5所述的一种车辆行驶证图片自适应矫正与识别方法,其特征在于:所述步骤S3200中的下划线清除算法的具体步骤为:
S3221;对文本区域图b使用canny边缘检测算子进行边缘检测,得到文本边缘信息图;
S3222;对文本边缘信息图进行霍夫变换,找到若干条直线;
S3223;在文本边缘信息图中将找到直线填充为背景色,并对文本边缘信息图进行一次闭操作;
S3224;对进行闭操作后的文本边缘信息图执行一次去除小连通域处理,最终得到文本区域图c。
7.如权利要求6所述的一种车辆行驶证图片自适应矫正与识别方法,其特征在于:所述步骤S3200中的冗余空白删除算法的具体步骤为:
S3231;沿文本区域图b的x轴正向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的x坐标为x1,沿文本区域图c的x轴反向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的x坐标为x2;
S3232;将文本区域图c中x坐标处于[x1,x2]的区域保留,其余部分删除;
S3233;将步骤S3232得到的图片沿y轴正向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的y坐标为y1,沿y轴反向求和压缩维度后的值P,设定阈值L,当P>L时,记录该位置的y坐标为y2;
S3234;将步骤S3232得到的图片中y坐标处于[y1,y2]的区域保留,其余部分删除,得到最终的文本区域图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011425952.XA CN112464852B (zh) | 2020-12-09 | 2020-12-09 | 一种车辆行驶证图片自适应矫正与识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011425952.XA CN112464852B (zh) | 2020-12-09 | 2020-12-09 | 一种车辆行驶证图片自适应矫正与识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112464852A CN112464852A (zh) | 2021-03-09 |
CN112464852B true CN112464852B (zh) | 2023-12-05 |
Family
ID=74800297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011425952.XA Active CN112464852B (zh) | 2020-12-09 | 2020-12-09 | 一种车辆行驶证图片自适应矫正与识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112464852B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117592917B (zh) * | 2023-10-27 | 2024-05-17 | 深邦智能科技集团(青岛)有限公司 | 一种基于移动执法的行驶证信息快速录入方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156768A (zh) * | 2016-07-01 | 2016-11-23 | 屈桢深 | 基于视觉的机动车行驶证检测方法 |
WO2017056799A1 (ja) * | 2015-09-29 | 2017-04-06 | 京セラドキュメントソリューションズ株式会社 | 画像読取装置及び画像形成装置 |
CN108320290A (zh) * | 2017-12-29 | 2018-07-24 | 中国银联股份有限公司 | 目标图片提取矫正方法及装置、计算机设备和记录介质 |
CN108549881A (zh) * | 2018-05-02 | 2018-09-18 | 杭州创匠信息科技有限公司 | 证件文字的识别方法和装置 |
CN109993160A (zh) * | 2019-02-18 | 2019-07-09 | 北京联合大学 | 一种图像矫正及文本与位置识别方法及系统 |
CN111062374A (zh) * | 2019-12-10 | 2020-04-24 | 爱信诺征信有限公司 | 身份证信息的识别方法、装置、系统、设备及可读介质 |
CN111127327A (zh) * | 2019-11-14 | 2020-05-08 | 贝壳技术有限公司 | 一种图片倾斜检测方法及装置 |
CN111652272A (zh) * | 2020-04-27 | 2020-09-11 | 中国平安财产保险股份有限公司 | 图像处理方法及装置、计算机设备、存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8634644B2 (en) * | 2009-08-25 | 2014-01-21 | Fuji Xerox Co., Ltd. | System and method for identifying pictures in documents |
-
2020
- 2020-12-09 CN CN202011425952.XA patent/CN112464852B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017056799A1 (ja) * | 2015-09-29 | 2017-04-06 | 京セラドキュメントソリューションズ株式会社 | 画像読取装置及び画像形成装置 |
CN106156768A (zh) * | 2016-07-01 | 2016-11-23 | 屈桢深 | 基于视觉的机动车行驶证检测方法 |
CN108320290A (zh) * | 2017-12-29 | 2018-07-24 | 中国银联股份有限公司 | 目标图片提取矫正方法及装置、计算机设备和记录介质 |
CN108549881A (zh) * | 2018-05-02 | 2018-09-18 | 杭州创匠信息科技有限公司 | 证件文字的识别方法和装置 |
CN109993160A (zh) * | 2019-02-18 | 2019-07-09 | 北京联合大学 | 一种图像矫正及文本与位置识别方法及系统 |
CN111127327A (zh) * | 2019-11-14 | 2020-05-08 | 贝壳技术有限公司 | 一种图片倾斜检测方法及装置 |
CN111062374A (zh) * | 2019-12-10 | 2020-04-24 | 爱信诺征信有限公司 | 身份证信息的识别方法、装置、系统、设备及可读介质 |
CN111652272A (zh) * | 2020-04-27 | 2020-09-11 | 中国平安财产保险股份有限公司 | 图像处理方法及装置、计算机设备、存储介质 |
Non-Patent Citations (3)
Title |
---|
Graphical models for joint segmentation and recognition of license plate characters;X.FAN;《IEEE Signal processing letters》;全文 * |
基于TesseractCR的驾驶证识别系统设计与实现;李亮;《中国优秀硕士学位论文全文数据库》;全文 * |
基于深度学习的行驶证车辆识别代号检测系统设计与实现;冯磊;《中国优秀硕士学位论文全文数据库》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112464852A (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596166B (zh) | 一种基于卷积神经网络分类的集装箱箱号识别方法 | |
CN114529459B (zh) | 一种对图像边缘进行增强处理的方法和系统及介质 | |
CN102790841A (zh) | 书籍的书脊区域中数字图像的检测和校正方法 | |
CN111860027B (zh) | 二维码的识别方法及装置 | |
CN116777907A (zh) | 一种钣金件质量检测方法 | |
CN113158895B (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN110570442A (zh) | 一种复杂背景下轮廓检测方法、终端设备及存储介质 | |
CN111126393A (zh) | 车辆外观改装判断方法、装置、计算机设备及存储介质 | |
CN114387591A (zh) | 车牌识别方法、系统、设备及存储介质 | |
CN110738139A (zh) | 一种融合Min-Max目标的NIN车牌识别方法 | |
CN114926441A (zh) | 一种注塑件加工成型的缺陷检测方法及系统 | |
CN112508836A (zh) | 一种基于标注框拼接的深度学习图像增强方法 | |
CN112464852B (zh) | 一种车辆行驶证图片自适应矫正与识别方法 | |
CN113537211A (zh) | 一种基于非对称iou的深度学习车牌框定位方法 | |
CN113177899A (zh) | 医药影印件文本倾斜矫正方法、电子设备和可读储存介质 | |
CN113033558A (zh) | 一种用于自然场景的文本检测方法及装置、存储介质 | |
CN117094975A (zh) | 钢铁表面缺陷检测方法、装置及电子设备 | |
CN115223123A (zh) | 基于计算机视觉识别的路面目标检测方法 | |
CN111738979A (zh) | 证件图像质量自动检查方法及系统 | |
CN112686872B (zh) | 基于深度学习的木材计数方法 | |
CN106778766A (zh) | 一种基于定位点的旋转数字识别方法及系统 | |
CN112364863A (zh) | 证照文档的文字定位方法及系统 | |
JP3733686B2 (ja) | 画像処理方法及び装置 | |
CN112633289B (zh) | 一种粘连字符分割方法和系统 | |
CN111626180B (zh) | 基于偏振成像的车道线检测方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |