CN106023173A - 一种基于支持向量机的号码牌识别方法 - Google Patents
一种基于支持向量机的号码牌识别方法 Download PDFInfo
- Publication number
- CN106023173A CN106023173A CN201610319459.7A CN201610319459A CN106023173A CN 106023173 A CN106023173 A CN 106023173A CN 201610319459 A CN201610319459 A CN 201610319459A CN 106023173 A CN106023173 A CN 106023173A
- Authority
- CN
- China
- Prior art keywords
- image
- numeral
- number slip
- carry out
- recognition methods
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
一种基于支持向量机的号码牌识别方法,包括如下步骤:1)获取号码牌图像I1;2)对图像进行颜色预处理,得到灰度图像I4;3)对图像I4进行Canny算子边缘检测,得到边缘图像I5;4)对边缘图像I5进行数字区域矩形框定,得到包含数字的轮廓集合5)对各个包含数字的轮廓集合结合原始图像I1,利用训练好的数字分类器进行识别,获得具体数字。本发明能够替代传统的人工分类,提升对马拉松照片的分类速度,同时对号码牌的柔性材质有较强适应性,能保持较高识别率。
Description
技术领域
本发明涉及神经网络、计算机视觉、图像处理、模式识别等技术领域,尤其是一种针对拍摄的图片,实现图片中号码牌的识别方法,该方法可用于各类赛事,如马拉松、运动会等。
背景技术
随着中国人民体质健康问题的不断加剧,全民健身再度成为热点议题。城市马拉松的蓬勃发展,使全民健身模式逐渐取代原有的室内健身或不健身模式。近年来中国马拉松赛事呈现指数级的增长,同时也带动了与之相关的运动装备、旅游行业甚至于马拉松照片销售的发展。在这样的大背景下,市场对马拉松服务平台产生了迫切的需求,尤其是对马拉松纪念照的需求。
马拉松赛事举办方普遍没有较好的技术背景,对纪念照的筛选还停留在传统的人工分类水平,效率较低。号码牌不同于车牌等刚性的物体,容易产生较大的形变、遮挡及干扰(如手部、装饰物)等情况,传统的车牌识别技术对号码牌的识别准确率不高,缺乏实用价值。
针对号码牌与遮挡情况开发的算法,除了对柔性物体有较高的识别能力外,也对刚性物体有很强的识别能力。这样的算法能被推广到车牌识别、门牌识别,甚至是娱乐游戏(如扑克牌、麻将、象棋等)的识别等领域,大幅度提高人工识别分类的效率。
发明内容
为了克服已有号码牌识别方式的人工分类、分类速度慢、识别率较低的不足,本发明提供一种能够替代传统的人工分类,提升对马拉松照片的分类速度,同时对号码牌的柔性材质有较强适应性,能保持较高识别率的基于支持向量机的号码牌识别方法。
本发明解决其技术问题所采用的技术方案是:
一种基于支持向量机的号码牌识别方法,所述号码牌识别方法包括如下步骤:
1)获取号码牌图像I1;
2)对图像进行颜色预处理,具体步骤如下:
2.1)将图像I1进行色彩空间转换,得到HSV颜色空间的图像I2;
2.2)将图像I2进行直方图均衡化,得到图像I3;
2.3)将图像I3根据明度阈值进行处理,得到灰度图像I4;
3)对图像I4进行Canny算子边缘检测,得到边缘图像I5;
4)对边缘图像I5进行数字区域矩形框定,具体步骤如下:
4.1)通过对边缘图像I5进行轮廓提取,得到轮廓信息Ki;
4.2)对获取的轮廓信息Ki进行矩形规格化,剔除不符合规范的矩形后得到轮廓信息
4.3)对各个符合规范的轮廓结合原始图像I1,利用训练好的数字判别器进行检测,判断内容是否为数字;若不属于数字,则剔除这个轮廓;最终得到包含数字的轮廓集合
5)对各个包含数字的轮廓集合结合原始图像I1,利用训练好的数字分类器进行识别,获得具体数字。
进一步,所述号码牌识别方法还包括如下步骤:
6)将步骤5)中得到的数字进行漏检测与定位,剔除误判数字,并将遗漏的数字矩形重复进行步骤5);
7)归纳得到的数字,最终拼凑出号码牌序号并输出。
再进一步,所述步骤3)中,Canny算子边缘检测中,利用高斯滤波器平滑图像,高斯滤波器中用到的卷积滤波方程为:
其中,σ为高斯分布参数,x,y为图像中某一像素距离中心的距离;
平滑后的图像通过Sobel算子获得单位像素点的梯度幅值与梯度方向,其中二范数由横纵模板的无穷大范数代替;其中,横纵梯度模板的近似值与梯度方向公式如下所示:
其中,G为梯度度量值,θ为梯度方向,Gx为检测水平边沿的横向模板,Gy为检测垂直边沿的纵向模板;
相邻像素间的梯度幅值通过插值得到,并通过与高低阈值比较,得到细化为1像素宽度的图像边缘。
更进一步,所述步骤4.3)中,所述数字判别器使用HOG特征提取,并对提取出的特征利用SVM支持向量机进行判别,其中,每个待判断的图片区块都被缩放归一到90×45的大小,HOG描述子采样同等的窗口大小,以45×15作为块大小,并以15×5作为胞元大小,经过HOG处理后的特征数据作为一维向量输入SVM,SVM采用C_SVC模型以及线性核函数。
所述步骤5)中,所述数字分类器器使用HOG特征提取,并对提取出的特征利用SVM支持向量机进行判别,其中,每个待判断的图片区块都被缩放归一到90×45的大小,HOG描述子采样同等的窗口大小,以45×15作为块大小,并以15×5作为胞元大小,经过HOG处理后的特征数据作为一维向量输入SVM,SVM采用C_SVC模型以及线性核函数。
所述步骤6),漏检测与定位过程如下:根据每个数字的位置关系,将距离小于设定阈值的数字归为一组,判断组内数字个数,若小于两个则视为误判,将其剔除;对于其余的数字组,通过最小二乘法将各数字坐标拟合,得到号码牌数字所在直线,并根据现有数字坐标计算得到预测的遗漏数字矩形区域,重新进行检测。
本发明的技术构思为:相较传统的数字识别算法,该方法采用了Canny算子进行边缘检测,能较好地应对号码牌的柔性材质。同时,该方法采用的漏检测与重定位策略增强了对遮挡物的鲁棒性,提高了识别准确率。
本发明的有益效果主要表现在:对号码牌柔性材质、遮挡物鲁棒性强,识别准确度较高。
附图说明
图1是的基于支持向量机的号码牌识别方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种基于支持向量机的号码牌识别方法,所述识别方法包括如下步骤:
1)获取号码牌图像I1;
2)对图像进行颜色预处理,具体步骤如下:
2.1)将图像I1进行色彩空间转换,得到HSV颜色空间的图像I2;
2.2)将图像I2进行直方图均衡化,得到图像I3;
2.3)将图像I3根据明度阈值进行处理,得到灰度图像I4;
3)对图像I4进行Canny算子边缘检测,得到边缘图像I5;
4)对边缘图像I5进行数字区域矩形框定,具体步骤如下:
4.1)通过对边缘图像I5进行轮廓提取,得到轮廓信息Ki;
4.2)对获取的轮廓信息Ki进行矩形规格化,剔除不符合规范的矩形后得到轮廓信息
4.3)对各个符合规范的轮廓结合原始图像I1,缩放归一化后得到90×45的图片块,再利用训练好的数字判别器进行检测,判断内容是否为数字。若不属于数字,则剔除这个轮廓。最终得到包含数字的轮廓集合
5)对各个包含数字的轮廓矩形结合原始图像I1,缩放归一化后得到90×45的图片块,再利用训练好的数字分类器进行识别,获得具体数字;
6)将步骤5)中得到的数字进行漏检测与定位,具体步骤如下:
6.1)根据每个数字的位置关系,将距离小于一定阈值的数字归为一组。判断组内数字个数,若小于两个则视为误判,将其剔除;
6.2)对于步骤6.1)中剩余的数字组,通过最小二乘法将数字坐标拟合,得到号码牌数字所在直线,并根据现有数字坐标计算得到遗漏的数字矩形区域。将遗漏矩形加入重复步骤5);
6.3)若遗漏已超出限制,终止漏检测;
7)归纳得到的数字,最终拼凑出号码牌序号并输出。
本实施例中,Canny算子边缘检测:Canny算子先利用高斯滤波器平滑图像,减少由天气、器材等因素引入的噪点。其中,高斯滤波器中用到的卷积滤波方程为:
其中,σ为高斯分布参数,x,y为图像中某一像素距离中心的距离;
平滑后的图像通过Sobel算子获得单位像素点的梯度幅值与梯度方向,其中二范数由横纵模板的无穷大范数代替。其中,横纵梯度模板的近似值与梯度方向公式如下所示:
其中,G为梯度度量值,θ为梯度方向,Gx为检测水平边沿的横向模板,Gy为检测垂直边沿的纵向模板;
相邻像素间的梯度幅值通过插值得到,并通过与高低阈值比较,得到细化为1像素宽度的图像边缘。
相较普通的算子,Canny算子虽然运算量较大,但具有较高的抗干扰性,对柔性材质的检测更为准确。
数字判别器与数字分类器:为了保证判别与分类的正确率,数字判别器与数字分类器使用HOG特征提取,并对提取出的特征利用SVM支持向量机进行判别。其中,每个待判断的图片区块都被缩放归一到90×45的大小,HOG描述子采样同等的窗口大小,以45×15作为块大小,并以15×5作为胞元大小。经过HOG处理后的特征数据作为一维向量输入SVM,SVM采用C_SVC模型以及线性核函数。HOG特征的优势在于,能容许特征内容的细微形变。而SVM的优势在于,相较传统神经网络,其训练更快,逼近能力更强,保证了算法的全局最优性。采用这样的算法,能提高数字判断准确率。
漏检测与定位策略:根据每个数字的位置关系,将距离小于一定阈值的数字归为一组。判断组内数字个数,若小于两个则视为误判,将其剔除。对于其余的数字组,通过最小二乘法将各数字坐标拟合,得到号码牌数字所在直线,并根据现有数字坐标计算得到预测的遗漏数字矩形区域,重新进行检测。这样提高了抗干扰能力,增强了对遮挡物的鲁棒性。
Claims (6)
1.一种基于支持向量机的号码牌识别方法,其特征在于:所述号码牌识别方法包括如下步骤:
1)获取号码牌图像I1;
2)对图像进行颜色预处理,具体步骤如下:
2.1)将图像I1进行色彩空间转换,得到HSV颜色空间的图像I2;
2.2)将图像I2进行直方图均衡化,得到图像I3;
2.3)将图像I3根据明度阈值进行处理,得到灰度图像I4;
3)对图像I4进行Canny算子边缘检测,得到边缘图像I5;
4)对边缘图像I5进行数字区域矩形框定,具体步骤如下:
4.1)通过对边缘图像I5进行轮廓提取,得到轮廓信息Ki;
4.2)对获取的轮廓信息Ki进行矩形规格化,剔除不符合规范的矩形后得到轮廓信息
4.3)对各个符合规范的轮廓结合原始图像I1,利用训练好的数字判别器进行检测,判断内容是否为数字;若不属于数字,则剔除这个轮廓;最终得到包含数字的轮廓集合
5)对各个包含数字的轮廓集合结合原始图像I1,利用训练好的数字分类器进行识别,获得具体数字。
2.如权利要求1所述的一种基于支持向量机的号码牌识别方法,其特征在于:所述号码牌识别方法还包括如下步骤:
6)将步骤5)中得到的数字进行漏检测与定位,剔除误判数字,并将遗漏的数字矩形重复进行步骤5);
7)归纳得到的数字,最终拼凑出号码牌序号并输出。
3.如权利要求1或2所述的一种基于支持向量机的号码牌识别方法,其特征在于:所述步骤3)中,Canny算子边缘检测中,利用高斯滤波器平滑图像,高斯滤波器中用到的卷积滤波方程为:
其中,σ为高斯分布参数,x,y为图像中某一像素距离中心的距离;
平滑后的图像通过Sobel算子获得单位像素点的梯度幅值与梯度方向,其中二范数由横纵模板的无穷大范数代替;其中,横纵梯度模板的近似值与梯度方向公式如下所示:
其中,G为梯度度量值,θ为梯度方向,Gx为检测水平边沿的横向模板,Gy为检测垂直边沿的纵向模板;
相邻像素间的梯度幅值通过插值得到,并通过与高低阈值比较,得到细化为1像素宽度的图像边缘。
4.如权利要求1或2所述的一种基于支持向量机的号码牌识别方法,其特征在于:所述步骤4.3)中,所述数字判别器使用HOG特征提取,并对提取出的特征利用SVM支持向量机进行判别,其中,每个待判断的图片区块都被缩放归一到90×45的大小,HOG描述子采样同等的窗口大小,以45×15作为块大小,并以15×5作为胞元大小,经过HOG处理后的特征数据作为一维向量输入SVM,SVM采用C_SVC模型以及线性核函数。
5.如权利要求1或2所述的一种基于支持向量机的号码牌识别方法,其特征在于:所述步骤5)中,所述数字分类器器使用HOG特征提取,并对提取出的特征利用SVM支持向量机进行判别,其中,每个待判断的图片区块都被缩放归一到90×45的大小,HOG描述子采样同等的窗口大小,以45×15作为块大小,并以15×5作为胞元大小,经过HOG处理后的特征数据作为一维向量输入SVM,SVM采用C_SVC模型以及线性核函数。
6.如权利要求2所述的一种基于支持向量机的号码牌识别方法,其特征在于:所述步骤6),漏检测与定位过程如下:根据每个数字的位置关系,将距离小于设定阈值的数字归为一组,判断组内数字个数,若小于两个则视为误判,将其剔除;对于其余的数字组,通过最小二乘法将各数字坐标拟合,得到号码牌数字所在直线,并根据现有数字坐标计算得到预测的遗漏数字矩形区域,重新进行检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610319459.7A CN106023173B (zh) | 2016-05-13 | 2016-05-13 | 一种基于支持向量机的号码牌识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610319459.7A CN106023173B (zh) | 2016-05-13 | 2016-05-13 | 一种基于支持向量机的号码牌识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106023173A true CN106023173A (zh) | 2016-10-12 |
CN106023173B CN106023173B (zh) | 2018-09-07 |
Family
ID=57100540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610319459.7A Active CN106023173B (zh) | 2016-05-13 | 2016-05-13 | 一种基于支持向量机的号码牌识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106023173B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778754A (zh) * | 2016-11-22 | 2017-05-31 | 南京理工大学 | 一种鲁棒的工业电表数字识别方法 |
CN108596185A (zh) * | 2018-04-25 | 2018-09-28 | 中国联合网络通信集团有限公司 | 手写数字的识别方法及装置 |
CN108764447A (zh) * | 2018-05-16 | 2018-11-06 | 西安交通大学 | 一种群机器人麻将博弈智动化系统及麻将识别学习算法 |
CN108764062A (zh) * | 2018-05-07 | 2018-11-06 | 西安工程大学 | 一种基于视觉的服装裁片识别方法 |
CN108805116A (zh) * | 2018-05-18 | 2018-11-13 | 浙江蓝鸽科技有限公司 | 图像文本检测方法及其系统 |
CN110287959A (zh) * | 2019-06-27 | 2019-09-27 | 浙江工业大学 | 一种基于再识别策略的车牌识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009150783A1 (ja) * | 2008-06-11 | 2009-12-17 | パナソニック株式会社 | パターン認識装置、パターン認識方法、画像処理装置及び画像処理方法 |
CN104156701A (zh) * | 2014-07-26 | 2014-11-19 | 佳都新太科技股份有限公司 | 一种基于决策树和svm的车牌相似字符识别方法 |
CN105224939A (zh) * | 2014-05-29 | 2016-01-06 | 小米科技有限责任公司 | 数字区域的识别方法和识别装置、移动终端 |
-
2016
- 2016-05-13 CN CN201610319459.7A patent/CN106023173B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009150783A1 (ja) * | 2008-06-11 | 2009-12-17 | パナソニック株式会社 | パターン認識装置、パターン認識方法、画像処理装置及び画像処理方法 |
CN105224939A (zh) * | 2014-05-29 | 2016-01-06 | 小米科技有限责任公司 | 数字区域的识别方法和识别装置、移动终端 |
CN104156701A (zh) * | 2014-07-26 | 2014-11-19 | 佳都新太科技股份有限公司 | 一种基于决策树和svm的车牌相似字符识别方法 |
Non-Patent Citations (1)
Title |
---|
MATKO ET AL: "Player number recognition in soccer video using internal contours and temporal redundancy", 《PROCEEDINGS OF THE 10TH WSEAS INTERNATIONAL CONFERENCE ON AUTOMATION & INFORMATION》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778754A (zh) * | 2016-11-22 | 2017-05-31 | 南京理工大学 | 一种鲁棒的工业电表数字识别方法 |
CN108596185A (zh) * | 2018-04-25 | 2018-09-28 | 中国联合网络通信集团有限公司 | 手写数字的识别方法及装置 |
CN108764062A (zh) * | 2018-05-07 | 2018-11-06 | 西安工程大学 | 一种基于视觉的服装裁片识别方法 |
CN108764062B (zh) * | 2018-05-07 | 2022-02-25 | 西安工程大学 | 一种基于视觉的服装裁片识别方法 |
CN108764447A (zh) * | 2018-05-16 | 2018-11-06 | 西安交通大学 | 一种群机器人麻将博弈智动化系统及麻将识别学习算法 |
CN108805116A (zh) * | 2018-05-18 | 2018-11-13 | 浙江蓝鸽科技有限公司 | 图像文本检测方法及其系统 |
CN110287959A (zh) * | 2019-06-27 | 2019-09-27 | 浙江工业大学 | 一种基于再识别策略的车牌识别方法 |
CN110287959B (zh) * | 2019-06-27 | 2021-06-29 | 浙江工业大学 | 一种基于再识别策略的车牌识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106023173B (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106023173A (zh) | 一种基于支持向量机的号码牌识别方法 | |
CN106529424B (zh) | 一种基于选择性搜索算法的车标检测识别方法及系统 | |
CN104809481B (zh) | 一种基于自适应色彩聚类的自然场景文本检测方法 | |
CN107103317A (zh) | 基于图像融合和盲反卷积的模糊车牌图像识别算法 | |
CN104933720B (zh) | 一种基于视觉的sop元件定位和缺陷检测方法 | |
CN106530297A (zh) | 基于点云配准的物体抓取区域定位方法 | |
CN106909941A (zh) | 基于机器视觉的多表字符识别系统及方法 | |
CN107545239A (zh) | 一种基于车牌识别与车辆特征匹配的套牌检测方法 | |
CN103325122B (zh) | 基于双向排序的行人检索方法 | |
CN105930848B (zh) | 基于sar-sift特征的sar图像目标识别方法 | |
CN101866427A (zh) | 织物瑕疵检测与分类方法 | |
CN105574063A (zh) | 基于视觉显著性的图像检索方法 | |
CN108985170A (zh) | 基于三帧差分法及深度学习的输电线路悬挂物识别方法 | |
CN106446952A (zh) | 一种乐谱图像识别方法及装置 | |
CN106529532A (zh) | 一种基于积分特征通道与灰度投影的车牌识别系统 | |
CN101930549B (zh) | 基于第二代曲线波变换的静态人体检测方法 | |
CN104766046A (zh) | 一种利用交通标识颜色及形状特征进行检测与识别算法 | |
CN100561501C (zh) | 一种图像检测方法及装置 | |
CN109376740A (zh) | 一种基于视频的水尺读数检测方法 | |
CN104598885A (zh) | 街景图像中的文字标牌检测与定位方法 | |
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
CN106203237A (zh) | 集装箱拖车编号的识别方法和装置 | |
TW201211913A (en) | A method for recognizing the identity of user by palm vein biometric | |
CN108268865A (zh) | 一种基于级联卷积网络的自然场景下车牌识别方法及系统 | |
CN102819733A (zh) | 一种快速的街景图像中人脸的检测模糊方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |