CN111104946A - 一种基于svm分类器的纸币冠字号字符分割方法 - Google Patents
一种基于svm分类器的纸币冠字号字符分割方法 Download PDFInfo
- Publication number
- CN111104946A CN111104946A CN201911344253.XA CN201911344253A CN111104946A CN 111104946 A CN111104946 A CN 111104946A CN 201911344253 A CN201911344253 A CN 201911344253A CN 111104946 A CN111104946 A CN 111104946A
- Authority
- CN
- China
- Prior art keywords
- crown word
- word number
- zero sequence
- svm classifier
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 239000000969 carrier Substances 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/2016—Testing patterns thereon using feature extraction, e.g. segmentation, edge detection or Hough-transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种基于SVM分类器的纸币冠字号字符分割方法,包括训练步骤和分割步骤;所述训练步骤包括:S1.1,获取冠字号图像样本,并对冠字号图像进行预处理,之后转换为灰度图像;S1.2,对灰度图像在垂直方向上进行像素值投影形成零序列集;S1.3,根据零序列建立训练集的正负样本,对正样本训练集与负样本训练集中的冠字号样本图片提取HOG特征后,将提取出的HOG特征输入至SVM分类器进行训练。本发明具有很高的字符分割正确率,在复杂的环境中鲁棒性强,并且与硬件载体,固件程序等无关,极大的提高了软件的适应性,具有丰富的应用场景,且可远程更新下发相关数据、训练模型等。
Description
技术领域
本发明涉及一种基于SVM分类器的纸币冠字号字符分割方法。
背景技术
当前ATM模块由于受制于固件程序,在纸币的OCR识别方面基本使用模板匹配的方案,此方案有以下几种问题:
1、由于市面上的纸币流通,因此存在很多不确定因素,如污损、油脂、旧币等,这些不确定因素导致采用常规方案进行OCR识别时,经常会出现误识别或者漏识别。
2、当中国人民银行发行新版本纸币,或者纸币冠字号字符位数发生变化时,通常需要调整更新固件程序,才能适配当前的新版人民币,相对效率不高。
针对上述ATM机模块在冠字号识别率方面存在的问题,申请人设计了一种字符分割正确率高,并且在复杂的环境中鲁棒性强的纸币冠字号字符分割方法。
发明内容
本发明的目的是提供一种字符分割正确率高,并且在复杂的环境中鲁棒性强的基于SVM分类器的纸币冠字号字符分割方法。
实现本发明目的的技术方案是:一种基于SVM分类器的纸币冠字号字符分割方法,包括训练步骤和分割步骤;
所述训练步骤包括:
S1.1,获取冠字号图像样本,并对冠字号图像进行预处理,之后转换为灰度图像;
S1.2,对灰度图像在垂直方向上进行像素值投影形成零序列集;
S1.3,根据零序列建立训练集的正负样本,对正样本训练集与负样本训练集中的冠字号样本图片提取HOG(Histogram oforiented gradient,方向梯度直方图)特征后,将提取出的HOG特征输入至SVM分类器进行训练;
所述分割步骤包括:
S2.1,获取待处理的冠字号图片,通过对冠字号图像进行预处理后直接转换为灰度图像;
S2.2,根据扩展后的零序列集中的连续0元素段位置对待处理的冠字号图片的灰度图像进行垂直方向的截取,对截取的图片进行HOG特征提取,并将HOG特征输入SVM分类器进行预测,若SVM分类器输出结果为正,则保留截取的图片所对应的零序列集中该连续0元素段位置,否则删除该连续0元素段位置;全部截取的图片均输入SVM分类器之后,最终得到的零序列集即为当前冠字号分割结果。
所述训练步骤S1.1中对冠字号图像进行预处理包括锐化、矫正倾斜和降噪。
所述训练步骤S1.2具体为:对灰度图像在垂直方向上进行像素值投影得到投影向量,然后根据投影向量计算得到阈值,并通过该阈值对投影向量进行二值化处理,将低于阈值的元素置0,记录投影向量中每一连续0元素段的起始位置与终止位置,从而形成零序列集。
所述阈值的计算方法具体为:选择投影向量的处于中段位置的元素,通过求中段位置元素的均值与标准差得到阈值T_H,计算公式为:
T_H=T_M+W×T_S
其中,T_M为中段位置元素的均值,T_S为中段位置元素的标准差,W为权重系数。
所述训练步骤S1.3中根据零序列建立训练集的正负样本具体为:根据零序列集中每一连续0元素段进行左右扩展,得到扩展后的零序列集;从起始位置向零序列集的左端和右端扩展的距离不超过先验的单个冠字号字符宽度的1/4;根据扩展后的零序列集中的连续0元素段位置对各冠字号样本图片进行垂直方向的截取,得到正样本训练集;再对冠字号样本图片等间隔进行垂直方向截取到负样本训练集。
所述训练步骤S2.1中对冠字号图像进行预处理包括锐化、矫正倾斜和降噪。
采用了上述技术方案,本发明具有以下的有益效果:(1)本发明具有很高的字符分割正确率,在复杂的环境中鲁棒性强,并且与硬件载体,固件程序等无关,极大的提高了软件的适应性,具有丰富的应用场景,且可远程更新下发相关数据、训练模型等。
(2)本发明基于SVM分类器,训练的的数据模型,在复杂环境种鲁棒性强,可以实时根据外界情况,及时调整和更新训练数据模型,且支持神经网络混合模型。
(3)本发明具有跨平台系统支持的优点,可同时支持Windows,Linux等操作系统。
具体实施方式
(实施例1)
本实施例的基于SVM分类器的纸币冠字号字符分割方法,包括训练步骤和分割步骤;
其中,训练步骤包括:
S1.1,获取冠字号图像样本,通过锐化、矫正倾斜、降噪,实现对冠字号图像的预处理,之后转换为灰度图像;
S1.2,对灰度图像在垂直方向上进行像素值投影得到投影向量,然后根据投影向量计算得到阈值,并通过该阈值对投影向量进行二值化处理,将低于阈值的元素置0,记录投影向量中每一连续0元素段的起始位置与终止位置,从而形成零序列集。
阈值的计算方法具体为:选择投影向量的处于中段位置的元素,通过求中段位置元素的均值与标准差得到阈值T_H,计算公式为:
T_H=T_M+W×T_S
其中,T_M为中段位置元素的均值,T_S为中段位置元素的标准差,W为权重系数。
S1.3,先根据零序列建立训练集的正负样本:根据零序列集中每一连续0元素段进行左右扩展,得到扩展后的零序列集;从起始位置向零序列集的左端和右端扩展的距离不超过先验的单个冠字号字符宽度的1/4;根据扩展后的零序列集中的连续0元素段位置对各冠字号样本图片进行垂直方向的截取,得到正样本训练集;再对冠字号样本图片等间隔进行垂直方向截取到负样本训练集;
然后对正样本训练集与负样本训练集中的冠字号样本图片提取HOG(特征后,将提取出的HOG特征输入至SVM分类器进行训练。
分割步骤包括:
S2.1,获取待处理的冠字号图片,通过对冠字号图像锐化,矫正倾斜、降噪等预处理后直接转换为灰度图像;
S2.2,根据扩展后的零序列集中的连续0元素段位置对待处理的冠字号图片的灰度图像进行垂直方向的截取,对截取的图片进行HOG特征提取,并将HOG特征输入SVM分类器进行预测,若SVM分类器输出结果为正,则保留截取的图片所对应的零序列集中该连续0元素段位置,否则删除该连续0元素段位置;全部截取的图片均输入SVM分类器之后,最终得到的零序列集即为当前冠字号分割结果。
本实施例提供的字符分割方法具有很高的字符分割正确率,在复杂的环境中鲁棒性强,并且与硬件载体,固件程序等无关,极大的提高了软件的适应性,具有丰富的应用场景,且可远程更新下发相关数据、训练模型等。基于SVM分类器,训练的的数据模型,在复杂环境种鲁棒性强,可以实时根据外界情况,及时调整和更新训练数据模型,且支持神经网络混合模型。本实施例提供的字符分割方法可同时支持Windows,Linux等操作系统。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于SVM分类器的纸币冠字号字符分割方法,其特征在于:包括训练步骤和分割步骤;
所述训练步骤包括:
S1.1,获取冠字号图像样本,并对冠字号图像进行预处理,之后转换为灰度图像;
S1.2,对灰度图像在垂直方向上进行像素值投影形成零序列集;
S1.3,根据零序列建立训练集的正负样本,对正样本训练集与负样本训练集中的冠字号样本图片提取HOG特征后,将提取出的HOG特征输入至SVM分类器进行训练;
所述分割步骤包括:
S2.1,获取待处理的冠字号图片,并对冠字号图像进行预处理后直接转换为灰度图像;
S2.2,根据扩展后的零序列集中的连续0元素段位置对待处理的冠字号图片的灰度图像进行垂直方向的截取,对截取的图片进行HOG特征提取,并将HOG特征输入SVM分类器进行预测,若SVM分类器输出结果为正,则保留截取的图片所对应的零序列集中该连续0元素段位置,否则删除该连续0元素段位置;全部截取的图片均输入SVM分类器之后,最终得到的零序列集即为当前冠字号分割结果。
2.根据权利要求1所述的一种基于SVM分类器的纸币冠字号字符分割方法,其特征在于:所述训练步骤S1.1中对冠字号图像进行预处理包括锐化、矫正倾斜和降噪。
3.根据权利要求1所述的一种基于SVM分类器的纸币冠字号字符分割方法,其特征在于:所述训练步骤S1.2具体为:对灰度图像在垂直方向上进行像素值投影得到投影向量,然后根据投影向量计算得到阈值,并通过该阈值对投影向量进行二值化处理,将低于阈值的元素置0,记录投影向量中每一连续0元素段的起始位置与终止位置,从而形成零序列集。
4.根据权利要求3所述的一种基于SVM分类器的纸币冠字号字符分割方法,其特征在于:所述阈值的计算方法具体为:选择投影向量的处于中段位置的元素,通过求中段位置元素的均值与标准差得到阈值T_H,计算公式为:
T_H=T_M+W×T_S
其中,T_M为中段位置元素的均值,T_S为中段位置元素的标准差,W为权重系数。
5.根据权利要求1所述的一种基于SVM分类器的纸币冠字号字符分割方法,其特征在于:所述训练步骤S1.3中根据零序列建立训练集的正负样本具体为:根据零序列集中每一连续0元素段进行左右扩展,得到扩展后的零序列集;从起始位置向零序列集的左端和右端扩展的距离不超过先验的单个冠字号字符宽度的1/4;根据扩展后的零序列集中的连续0元素段位置对各冠字号样本图片进行垂直方向的截取,得到正样本训练集;再对冠字号样本图片等间隔进行垂直方向截取到负样本训练集。
6.根据权利要求1所述的一种基于SVM分类器的纸币冠字号字符分割方法,其特征在于:所述训练步骤S2.1中对冠字号图像进行预处理包括锐化、矫正倾斜和降噪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911344253.XA CN111104946A (zh) | 2019-12-24 | 2019-12-24 | 一种基于svm分类器的纸币冠字号字符分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911344253.XA CN111104946A (zh) | 2019-12-24 | 2019-12-24 | 一种基于svm分类器的纸币冠字号字符分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111104946A true CN111104946A (zh) | 2020-05-05 |
Family
ID=70424173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911344253.XA Pending CN111104946A (zh) | 2019-12-24 | 2019-12-24 | 一种基于svm分类器的纸币冠字号字符分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111104946A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318238A (zh) * | 2014-11-10 | 2015-01-28 | 广州御银科技股份有限公司 | 一种验钞模块中对扫描的钞票图提取冠字号的方法 |
CN105184317A (zh) * | 2015-08-29 | 2015-12-23 | 电子科技大学 | 一种基于svm分类的车牌字符分割方法 |
CN108320374A (zh) * | 2018-02-08 | 2018-07-24 | 中南大学 | 一种基于图像指纹的多国纸币冠字号字符识别方法 |
CN109345684A (zh) * | 2018-07-11 | 2019-02-15 | 中南大学 | 一种基于gmdh-svm的多国纸币冠字号识别方法 |
-
2019
- 2019-12-24 CN CN201911344253.XA patent/CN111104946A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318238A (zh) * | 2014-11-10 | 2015-01-28 | 广州御银科技股份有限公司 | 一种验钞模块中对扫描的钞票图提取冠字号的方法 |
CN105184317A (zh) * | 2015-08-29 | 2015-12-23 | 电子科技大学 | 一种基于svm分类的车牌字符分割方法 |
CN108320374A (zh) * | 2018-02-08 | 2018-07-24 | 中南大学 | 一种基于图像指纹的多国纸币冠字号字符识别方法 |
CN109345684A (zh) * | 2018-07-11 | 2019-02-15 | 中南大学 | 一种基于gmdh-svm的多国纸币冠字号识别方法 |
Non-Patent Citations (1)
Title |
---|
柳杨: "《数字图像物体识别理论详解与实战》", 北京邮电大学出版社, pages: 4 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111784747B (zh) | 一种基于关键点检测和校正的车辆多目标跟踪系统及方法 | |
CN102982519B (zh) | 一种视频图像的前景识别提取和拼接方法 | |
CN108229475B (zh) | 车辆跟踪方法、系统、计算机设备及可读存储介质 | |
CN109697440A (zh) | 一种身份证信息提取方法 | |
US20130129160A1 (en) | Face image registration device and method | |
CN103577818A (zh) | 一种图像文字识别的方法和装置 | |
CN114119676B (zh) | 基于多特征信息融合的目标检测跟踪识别方法和系统 | |
CN111144366A (zh) | 一种基于联合人脸质量评估的陌生人脸聚类方法 | |
EP3905104B1 (en) | Living body detection method and device | |
TWI765469B (zh) | 車牌辨識系統與方法及提取車牌中複數個字元段的方法 | |
CN115131590B (zh) | 目标检测模型的训练方法、目标检测方法及相关设备 | |
Zhu et al. | Automatic object detection and segmentation from underwater images via saliency-based region merging | |
CN115082922A (zh) | 基于深度学习的水表数字图片处理方法及系统 | |
CN114694161A (zh) | 一种特定版式证件的文本识别方法、设备及存储介质 | |
CN104408430B (zh) | 一种车牌定位方法及装置 | |
CN111104946A (zh) | 一种基于svm分类器的纸币冠字号字符分割方法 | |
CN113837067B (zh) | 器官轮廓检测方法、装置、电子设备及可读存储介质 | |
CN110956664A (zh) | 一种手持式三维扫描系统的相机位置实时重定位方法 | |
CN116309780A (zh) | 一种基于目标检测的水尺水位识别方法 | |
CN105335717A (zh) | 基于智能移动终端视频抖动分析的人脸识别系统 | |
KR101845280B1 (ko) | 그림자 신호를 제거하는 차량번호 인식 시스템 및 방법 | |
CN112069995B (zh) | 一种深度域人脸稠密特征提取方法、系统和存储介质 | |
CN112085683B (zh) | 一种显著性检测中的深度图可信度检测方法 | |
CN114359332A (zh) | 基于深度图像的目标跟踪方法、装置、设备和介质 | |
CN110610455B (zh) | 一种鱼眼图像的有效区域提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |