CN105261110B - 一种高效dsp纸币冠字号识别方法 - Google Patents

一种高效dsp纸币冠字号识别方法 Download PDF

Info

Publication number
CN105261110B
CN105261110B CN201510702688.2A CN201510702688A CN105261110B CN 105261110 B CN105261110 B CN 105261110B CN 201510702688 A CN201510702688 A CN 201510702688A CN 105261110 B CN105261110 B CN 105261110B
Authority
CN
China
Prior art keywords
point
image
crown word
word number
paper money
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510702688.2A
Other languages
English (en)
Other versions
CN105261110A (zh
Inventor
钟宬
潘惠彬
凌志峰
邹相
赵旦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Guoguang Electronic Information Technology Co Ltd
Original Assignee
Jiangsu Guoguang Electronic Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Guoguang Electronic Information Technology Co Ltd filed Critical Jiangsu Guoguang Electronic Information Technology Co Ltd
Priority to CN201510702688.2A priority Critical patent/CN105261110B/zh
Publication of CN105261110A publication Critical patent/CN105261110A/zh
Application granted granted Critical
Publication of CN105261110B publication Critical patent/CN105261110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种高效DSP纸币冠字号识别方法,该技术涉及图像识别技术等技术领域。该发明方法主要涉及纸币边缘提取、面向朝向识别、冠字号定位、字符分割、字符识别等关键步骤。纸币边缘提取完成对图像中的纸币边缘的搜索和拟合的工作。面向朝向识别是为了判别纸币的正反面以及是否倒置的情况,从而大致知道冠字号的位置。冠字号的定位是利用先验知识对冠字号进行粗定位,在此基础上对其进行倾斜校正,并利用水平投影对冠字号进行精确定位,接着,对精确定位的冠字号字符进行字符分割,得到独立的字符。在此基础上,将得到的划分后的字符进行灰度和大小的归一化处理,最后,提取字符图像的全像素特征,使用神经网络方法对字符进行识别。

Description

一种高效DSP纸币冠字号识别方法
技术领域
本发明属于数字图像处理领域,尤其涉及一种高效DSP(digital signalprocessing,数字信号处理)纸币冠字号识别方法。
背景技术
纸币作为流通币,在人们的日常生活中起着举足轻重的作用。为了方便统一管理以及防止假钞的流通,每张纸币都印制了独一无二的编号,即冠字号。由于纸币的发行数量大,使用频率快,通过人工的方法去进行记录和处理是不现实的。纸币冠字号识别要求识别结果准确,运行效率高,有实时性方面的要求。随着DSP技术的发展,可以通过DSP平台,集合计算机视觉技术和图像处理技术进行纸币冠字号的识别。
目前国内外纸币冠字号识别的方法有:有的通过USB将纸币图像传至上位机进行处理,由于受限于USB传输速度,实时性效果差;有的通过DSP平台进行纸币冠字号识别,但由于纸币图像的寻边、面向朝向的识别、冠字号区域的定位分割以及冠字号的识别采用了低效率的方法,导致识别效果及软件的健壮性较差。例如在纸币图像的寻边,没有进行异常点的去除,导致寻找的纸币边缘不准确,影响纸币冠字号的定位和识别。又如纸币的面向朝向识别,采用了粗网格特征,严重影响了程序的效率。
这些方法最主要的缺点就是效率低下,识别效果差,冠字号识别率不高。
发明内容
针对现有技术的不足,本发明提供一种高效DSP纸币冠字号识别方法,对冠字号能够精确定位,识别效率高,效果更好。
本发明解决其技术问题所采用的技术方案如下,
一种高效DSP纸币冠字号识别方法,包括以下步骤:
a)采集纸币图像,寻找纸币的边缘点;
b)将找到的纸币边缘点中的异常边缘点排除,并拟合边直线,得到纸币上、下、左、右四条边的斜率和截距;
c)对纸币的面向以及朝向进行识别;
d)对纸币上的冠字号进行定位;
e)对最后得到的精确定位的冠字号图像进行冠字号分割;
f)通过神经网络算法对冠字号进行识别。
进一步的,所述步骤a采集纸币图像,寻找纸币的边缘点,具体为:
a1)对纸币进行图像采集,选择采集到的图像的中心列,从该列的最上端的像素点开始向下查找,找到第一个灰度值大于阈值T的像素点的坐标,此点即为查找到的纸币上边缘的第一个点,记作Pm,设其坐标为(xm,ym),其中xm表示起始点Pm的横坐标,ym表示起始点的纵坐标;
a2)以Pm为基准点向右查找纸币上边缘的边缘点:选取Pm向右位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,其中,delta>0,range表示纵坐标方向的搜索范围,并从该列从上到下依次查找第一个灰度值大于阈值T的像素点,该点即为上边缘的Pm点的右边点Pm+1,再以Pm+1为基准点,以同样的方式查找Pm+2点,Pm+3点,……,直到无法找到灰度值大于阈值T的像素点,则搜索停止,设最后一个找到的点为Pm+b
a3)以Pm为基准点向左查找纸币上边缘的边缘点:选取Pm向左位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,其中,delta>0,range表示纵坐标方向的搜索范围,并从该列从上到下依次查找第一个灰度值大于阈值T的像素点,该点即为上边缘的Pm点的左边点Pm-1,再以Pm-1为基准点,以同样的方式查找Pm-2点,Pm-3点,……,直到无法找到灰度值大于阈值T的像素点,则搜索停止,设最后一个找到的点为Pm-f
a4)最终找到纸币上边缘的点集为Pm-f,…Pm,…Pm+b,并将此点集记为Eu
a5)基于步骤a1)-a4)同样的原理查找纸币下边缘的点集、左边缘的点集和右边缘的点集,并将其分别记作Ed,El,Er
进一步的,所述步骤b)将找到的纸币边缘点中的异常边缘点排除,并拟合边直线,得到纸币上、下、左、右四条边的斜率和截距具体为:
b1)计算Eu点集中点的相关系数、斜率以及截距,分别记做Cu、ku和bu,计算Ed点集中点的相关系数、斜率以及截距,分别记做Cd、kd和bd
b2)比较Cu与Cd,若Cu<Cd,则转至步骤b3),若Cu>Cd,则转至步骤b6);
b3)首先处理Ed,若Cd小于阈值CT,则去除Ed中离直线y=kdx+bd距离最大的一个点,并计算新的点集的Cd、kd和bd,重复该步骤,直到Cd≥CT
b4)其次处理Eu,若Cu<CT,则进入步骤b5),若Cu≥CT则比较Cu与Cd,若此时Cu<Cd则结束处理,若Cu>Cd则进入步骤b6);
b5)计算Eu的点集中前后两点的斜率,若其与kd的差的绝对值大于阈值kT,则在点集Eu中去除相应的两点,用Eu剩下的点重新计算ku和bu,然后再比较Cu与Cd,若Cu<Cd则结束处理,若Cu>Cd则进入步骤b6);
b6)首先处理Eu,若Cu小于阀值CT,则去除Eu中直线y=kux+bu距离最大的一个点,并计算新的点集的Cu、ku和bu,重复该步骤,直到Cu≥CT
b7)其次处理Ed,若Cd<CT,则进入步骤b8),若Cd≥CT则比较Cu与Cd,若此时Cu>Cd则结束处理,若Cu<Cd则进入步骤b3);
b8)计算Ed的点集中前后两点的斜率,若其与ku的差的绝对值大于阀值kT,则在点集Ed中去除相应的两点,用Ed剩下的点重新计算kd和bd
b9)基于步骤b1)-b8)同样的原理处理El和Er,从而得到左、右边缘的斜率和截距kl和bl以及kr和br
进一步的,所述步骤c)对纸币的面向以及朝向进行识别具体包括:
c1)选取纸币图像的中心w×h像素区域,其中,w为中心区域的宽,h为中心区域的高,并计算该区域特征;
c2)设定决策面方程
(w0,w1,w2,w3)为权值,(f1,f2,f3)为特征,此处特征为该区域的全局平均值、行平均值的标准差以及左、右半图标准差中的较小值;
c3)将判断面向的训练参数代入(w0,w1,w2,w3),若g(w0,w1,w2,w3)≥0,则说明当前处理的第一张图像即为正面图像;若g(w0,w1,w2,w3)<0,则说明处理的第二张图像为正面图像;
c4)选择正面图像作为接下来要处理的对象;
c5)抠取区域为(x',y',w',h')的左下角矩形区域R,其中,x'和y'表示R的左上角的横坐标和纵坐标,w'和h'表示R的宽度和高度;此时,如果纸币是正置的,则选到的图像为一片空白区域,如果纸币是倒置的,则选择到的图像为带有纹理的区域,计算该区域的全局平均值、行平均值的标准差以及左、右半图标准差中的较小值作为特征;
c6)根据式(1),将判断朝向的训练参数代入(w0,w1,w2,w3),若g(w0,w1,w2,w3)≥0,则说明纸币为正置的,冠字号在左下角区域;若g(w0,w1,w2,w3)<0,则说明纸币为倒置的,冠字号在右上角区域。
进一步的,所述步骤d)对纸币上的冠字号进行定位具体如下:
d1)设冠字号区域上、下、左、右边缘的斜率和截距分别为kgu,bgu;kgd,bgd;kgl,bgl;kgr,bgr;若纸币是正置的,则有:kgu=kd,bgu=bd-p0,kgd=kd,bgd=bd-p1,kgl=kl,bgl=bl+p2,kgr=kl,bgr=bl+p3,若纸币是倒置的,则有:kgu=ku,bgu=bu+p0,kgd=ku,bgd=bu+p1,kgl=kr,bgl=br-p2,kgr=kr,bgr=br-p3,其中,p0、p1、p2、p3分别为为上、下、左、右边缘的参数;
d2)由于此时的冠字号图像是倾斜的,因此通过确定的冠字号区域的斜率截距参数即可以将冠字号图像仿射变换至宽为wg,高为hg的正置的冠字号图像中;称此图像为粗定位的冠字号图像,记为Ig_c
d3)首先计算Ig_c中每隔两行的水平投影,结果为一向量,如式(2)所示
其中hg-1表示第hg-1行;
d4)然后计算投影结果中每相邻三项的和,找到和的最小值所对应的三个下标值,取中间的坐标数作为精确定位的冠字码区域的中心行数,以此行数为中心,分别向上向下取n行,最后组成的图像即为精确定位的冠字号图像。
进一步的,所述步骤e)对最后得到的精确定位的冠字号图像中的冠字号进行冠字号分割具体为:e1)对精确定位的冠字号图像进行自适应二值化,从而得到相应的二值图BW,其中黑色为背景,白色为前景;
e2)BW第一行的设置:从左到右扫描,当遇到一段连续的前景(以下称为前景段),就赋予其新的标号,标号为一个数字,用于标记不同的连通域,并且将当前段的尺寸属性作为新的标号的初始尺寸属性,即连通域的上、下、左、右坐标;
e3)BW第i行的设置:从左到右扫描,当遇到前景段时,查看该前景段的上一行是否也有前景段,若无,则赋予当前前景段新的标号,并且将当前段的尺寸属性作为新的标号的初始尺寸属性,若上一行有一个或多个前景段,则跳转至e4);
e4)将上一行所有前景段对应的标号记录下来,找到其中最小的标号,将当前前景段赋予该标号,并且找到记录的标号所指向的最底层标号中的最小标号,接下来,将记录的标号全部指向该最小标号,同时,更新该最小标号中的四项尺寸属性(即连通域的上、下、左、右坐标);
e5)遍历当前所有标号,将所有不重复的最底层标号的四项尺寸属性作为最终外接矩形的属性;
e6)将高度大于阀值hT像素的矩形全部排除;
e7)判断外接矩形的个数ns是否大于10,若大于10,则计算所有外接矩形质心的纵坐标的平均值,并去除质心纵坐标距平均值偏移量最大的ns-10个外接矩形,最后根据外接矩形的起始横坐标对所有外接矩形从小到大排序,最终完成对冠字号的分割。
再进一步的,所述步骤f)通过神经网络算法对冠字号进行识别具体包括:f1)将分割的字符进行灰度归一化,即统计分割出的字符的灰度直方图,获得由黑到白的第20%处像素对应的灰度值T1和由白到黑的第20%处像素对应的灰度值T2,从而将原图中像素值范围在[T1,T2]的像素线性映射到[0,255],并将小于T1的像素值映射为0,将大于T2的像素值映射为255;
f2)大小归一化,即将灰度归一化后的字符缩放为wc×hc大小,其中,wc为归一化后的字符宽度,hc为归一化后的字符高度,归一化后的wc×hc的像素值即作为后续神经网络的输入特征;
f3)根据训练好的参数和神经网络模型计算神经网络中各个节点的参数;
f4)在神经网络实际输出的34个节点中找到最大的那个值,其对应的字母或者数字即为输入图像的识别结果;
f5)按顺序将分割好的10个字符依次输入神经网络,即可得到冠字号识别的最终结果。
本发明的有益效果是:能够对冠字号进行精确定位,并且对冠字号的识别效率和效果都有大幅提高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明的总体流程示意图;
图2为本发明的寻找纸币边缘算法流程示意图;
图3为本发明的排除异常点并拟合直线算法流程示意图;
图4为本发明的纸币面向和朝向识别算法流程示意图;
图5为本发明的冠字号定位算法流程示意图;
图6为本发明的冠字号分割算法流程示意图;
图7为本发明的冠字号的神经网络识别算法流程示意图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
如图1-图7所示,一种高效DSP纸币冠字号识别方法,包括以下步骤:
a)采集纸币图像,寻找纸币的边缘点,具体为:
a1)对纸币进行图像采集,选择采集到的图像的中心列,从该列的最上端的像素点开始向下查找,找到第一个灰度值大于阈值T的像素点的坐标,此点即为查找到的纸币上边缘的第一个点,记作Pm,设其坐标为(xm,ym),其中xm表示起始点Pm的横坐标,ym表示起始点的纵坐标;
a2)以Pm为基准点向右查找纸币上边缘的边缘点:选取Pm向右位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,其中,delta>0,range表示纵坐标方向的搜索范围,并从该列从上到下依次查找第一个灰度值大于阈值T的像素点,该点即为上边缘的Pm点的右边点Pm+1,再以Pm+1为基准点,以同样的方式查找Pm+2点,Pm+3点,……,直到无法找到灰度值大于阈值T的像素点,则搜索停止,设最后一个找到的点为Pm+b
a3)以Pm为基准点向左查找纸币上边缘的边缘点:选取Pm向左位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,其中,delta>0,range表示纵坐标方向的搜索范围,并从该列从上到下依次查找第一个灰度值大于阈值T的像素点,该点即为上边缘的Pm点的左边点Pm-1,再以Pm-1为基准点,以同样的方式查找Pm-2点,Pm-3点,……,直到无法找到灰度值大于阈值T的像素点,则搜索停止,设最后一个找到的点为Pm-f
a4)最终找到纸币上边缘的点集为Pm-f,…Pm,…Pm+b,并将此点集记为Eu
a5)基于步骤a1)-a4)同样的原理查找纸币下边缘的点集、左边缘的点集和右边缘的点集,并将其分别记作Ed,El,Er。例如,在寻找下边缘点的时候,在步骤a1)中从最下端的像素点开始向上查找;在步骤a2)中则选取Pm向左位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,并且从下到上查找第一个灰度值大于阈值T的像素点,该点即为下边缘的Pm点的左边点Pm+1;在步骤a3)中以Pm为基准点向右查找纸币下边缘的边缘点:选取Pm向右位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,并从该列从下到上依次查找第一个灰度值大于阈值T的像素点,该点即为下边缘的Pm点的右边点Pm-1
b)将找到的纸币边缘点中的异常边缘点排除,并拟合边缘直线,得到纸币上、下、左、右四条边的斜率和截距,具体为:
b1)计算Eu点集中点的相关系数、斜率以及截距,分别记做Cu、ku和bu,计算Ed点集中点的相关系数、斜率以及截距,分别记做Cd、kd和bd
b2)比较Cu与Cd,若Cu<Cd,则转至步骤b3),若Cu>Cd,则转至步骤b6);
b3)首先处理Ed,若Cd小于阈值CT,则去除Ed中离直线y=kdx+bd距离最大的一个点,并计算新的点集的Cd、kd和bd,重复该步骤,直到Cd≥CT
b4)其次处理Eu,若Cu<CT,则进入步骤b5),若Cu≥CT则比较Cu与Cd,若此时Cu<Cd则结束处理,若Cu>Cd则进入步骤b6);
b5)计算Eu的点集中前后两点的斜率,若其与kd的差的绝对值大于阈值kT,则在点集Eu中去除相应的两点,用Eu剩下的点重新计算ku和bu,然后再比较Cu与Cd,若Cu<Cd则结束处理,若Cu>Cd则进入步骤b6);
b6)首先处理Eu,若Cu小于阀值CT,则去除Eu中直线y=kux+bu距离最大的一个点,并计算新的点集的Cu、ku和bu,重复该步骤,直到Cu≥CT
b7)其次处理Ed,若Cd<CT,则进入步骤b8),若Cd≥CT则比较Cu与Cd,若此时Cu>Cd则结束处理,若Cu<Cd则进入步骤b3);
b8)计算Ed的点集中前后两点的斜率,若其与ku的差的绝对值大于阀值kT,则在点集Ed中去除相应的两点,用Ed剩下的点重新计算kd和bd
b9)基于步骤b1)-b8)同样的原理处理El和Er,从而得到左、右边缘的斜率和截距kl和bl以及kr和br
c)对纸币的面向以及朝向进行识别,具体为:
c1)选取纸币图像的中心w×h像素区域,其中,w为中心区域的宽,h为中心区域的高,并计算该区域特征;
c2)设定决策面方程
(w0,w1,w2,w3)为权值,(f1,f2,f3)为特征,此处特征为该区域的全局平均值、行平均值的标准差以及左、右半图标准差中的较小值;
c3)将判断面向的训练参数代入(w0,w1,w2,w3),该训练参数通logisticregression方法训练得出,若g(w0,w1,w2,w3)≥0,则说明当前处理的第一张图像即为正面图像;若g(w0,w1,w2,w3)<0,则说明处理的第二张图像为正面图像;
c4)选择正面图像作为接下来要处理的对象;
c5)抠取区域为(x',y',w',h')的左下角矩形区域R,其中,x'和y'表示R的左上角的横坐标和纵坐标,w'和h'表示R的宽度和高度;此时,如果纸币是正置的,则选到的图像为一片空白区域,如果纸币是倒置的,则选择到的图像为带有纹理的区域,计算该区域的全局平均值、行平均值的标准差以及左、右半图标准差中的较小值(即左半图标准差和右半图标准差中较小的那一个)作为特征;
c6)根据式(1),将判断朝向的训练参数代入(w0,w1,w2,w3),该训练参数通logistic regression方法训练得出,若g(w0,w1,w2,w3)≥0,则说明纸币为正置的,冠字号在左下角区域;若g(w0,w1,w2,w3)<0,则说明纸币为倒置的,冠字号在右上角区域;
d)对纸币上的冠字号进行定位,具体为:
d1)设冠字号区域上、下、左、右边缘的斜率和截距分别为kgu,bgu;kgd,bgd;kgl,bgl;kgr,bgr;若纸币是正置的,则有:kgu=kd,bgu=bd-p0,kgd=kd,bgd=bd-p1,kgl=kl,bgl=bl+p2,kgr=kl,bgr=bl+p3,若纸币是倒置的,则有:kgu=ku,bgu=bu+p0,kgd=ku,bgd=bu+p1,kgl=kr,bgl=br-p2,kgr=kr,bgr=br-p3,其中,p0、p1、p2、p3分别为为上、下、左、右边缘的参数;
d2)由于此时的冠字号图像是倾斜的,因此通过确定的冠字号区域的斜率截距参数即可以将冠字号图像仿射变换至宽为wg,高为hg的正置的冠字号图像中;称此图像为粗定位的冠字号图像,记为Ig_c
d3)首先计算Ig_c中每隔两行的水平投影(即每隔两行后的那一行的水平投影),结果为一向量,如式(2)所示
其中hg-1表示第hg-1行;
d4)然后计算投影结果中每相邻三项的和,找到和的最小值所对应的三个下标值,取中间的坐标数作为精确定位的冠字码区域的中心行数,以此行数为中心,分别向上向下取n行,最后组成的图像即为精确定位的冠字号图像。
e)对最后得到的精确定位的冠字号图像进行冠字号分割,具体为:
具体为:e1)对精确定位的冠字号图像进行自适应二值化,从而得到相应的二值图BW,其中黑色为背景,白色为前景;
e2)BW第一行的设置:从左到右扫描,当遇到一段连续的前景(以下称为前景段),就赋予其新的标号,标号为一个数字,用于标记不同的连通域,并且将当前段的尺寸属性作为新的标号的初始尺寸属性,即连通域的上、下、左、右坐标;
e3)BW第i行的设置(i为第二行至最后一行的任意行):从左到右扫描,当遇到前景段时,查看该前景段的上一行是否也有前景段,若无,则赋予当前前景段新的标号,并且将当前段的尺寸属性作为新的标号的初始尺寸属性,若上一行有一个或多个前景段,则跳转至e4);
e4)将上一行所有前景段对应的标号记录下来,找到其中最小的标号,将当前前景段赋予该标号,并且找到记录的标号所指向的最底层标号中的最小标号,接下来,将记录的标号全部指向该最小标号,同时,更新该最小标号中的四项尺寸属性(即连通域的上、下、左、右坐标);
e5)遍历当前所有标号,将所有不重复的最底层标号的四项尺寸属性作为最终外接矩形的属性;
e6)将高度大于阀值hT像素的矩形全部排除这里hT取12,由于真实的冠字号中的单个字符在纵向80dpi的情况下,高度不大于12像素,因此将高度大于12像素的矩形全部排除;
e7)判断外接矩形的个数ns是否大于10,若大于10,则计算所有外接矩形质心的纵坐标的平均值,并去除质心纵坐标距平均值偏移量最大的ns-10个外接矩形,最后根据外接矩形的起始横坐标对所有外接矩形从小到大排序,最终完成对冠字号的分割。
f)通过神经网络算法对冠字号进行识别,具体为:
f1)将分割的字符进行灰度归一化,即统计分割出的字符的灰度直方图,获得由黑到白的第20%处像素对应的灰度值T1和由白到黑的第20%处像素对应的灰度值T2,从而将原图中像素值范围在[T1,T2]的像素线性映射到[0,255],并将小于T1的像素值映射为0,将大于T2的像素值映射为255;
f2)大小归一化,即将灰度归一化后的字符缩放为wc×hc大小,其中,wc为归一化后的字符宽度,hc为归一化后的字符高度,归一化后的wc×hc的像素值即作为后续神经网络的输入特征;
f3)根据训练好的参数和神经网络模型计算神经网络中各个节点的参数;
f4)在神经网络实际输出的34个节点中找到最大的那个值,其对应的字母或者数字即为输入图像的识别结果;
f5)按顺序将分割好的10个字符依次输入神经网络,即可得到冠字号识别的最终结果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书所限定的保护范围为准。

Claims (6)

1.一种高效DSP纸币冠字号识别方法,其特征在于,包括以下步骤:
a)采集纸币图像,寻找纸币的边缘点;
b)将找到的纸币边缘点中的异常边缘点排除,并拟合边缘直线,得到纸币上、下、左、右四条边的斜率和截距;
c)对纸币的面向以及朝向进行识别;
d)对纸币上的冠字号进行定位;
e)对最后得到的精确定位的冠字号图像进行冠字号分割;
f)通过神经网络算法对冠字号进行识别;
所述步骤b)将找到的纸币边缘点中的异常边缘点排除,并拟合边直线,得到纸币上、下、左、右四条边的斜率和截距具体为:
b1)计算Eu点集中点的相关系数、斜率以及截距,分别记做Cu、ku和bu,计算Ed点集中点的相关系数、斜率以及截距,分别记做Cd、kd和bd
b2)比较Cu与Cd,若Cu<Cd,则转至步骤b3),若Cu>Cd,则转至步骤b6);
b3)首先处理Ed,若Cd小于阈值CT,则去除Ed中离直线y=kdx+bd距离最大的一个点,并计算新的点集的Cd、kd和bd,重复该步骤,直到Cd≥CT
b4)其次处理Eu,若Cu<CT,则进入步骤b5),若Cu≥CT则比较Cu与Cd,若此时Cu<Cd则结束处理,若Cu>Cd则进入步骤b6);
b5)计算Eu的点集中前后两点的斜率,若其与kd的差的绝对值大于阈值kT,则在点集Eu中去除相应的两点,用Eu剩下的点重新计算ku和bu,然后再比较Cu与Cd,若Cu<Cd则结束处理,若Cu>Cd则进入步骤b6);
b6)首先处理Eu,若Cu小于阀值CT,则去除Eu中直线y=kux+bu距离最大的一个点,并计算新的点集的Cu、ku和bu,重复该步骤,直到Cu≥CT
b7)其次处理Ed,若Cd<CT,则进入步骤b8),若Cd≥CT则比较Cu与Cd,若此时Cu>Cd则结束处理,若Cu<Cd则进入步骤b3);
b8)计算Ed的点集中前后两点的斜率,若其与ku的差的绝对值大于阀值kT,则在点集Ed中去除相应的两点,用Ed剩下的点重新计算kd和bd
b9)基于步骤b1)-b8)同样的原理处理El和Er,从而得到左、右边缘的斜率和截距kl和bl以及kr和br
2.根据权利要求1所述的一种高效DSP纸币冠字号识别方法,其特征在于:所述步骤a采集纸币图像,寻找纸币的边缘点,具体为:
a1)对纸币进行图像采集,选择采集到的图像的中心列,从该列的最上端的像素点开始向下查找,找到第一个灰度值大于阈值T的像素点的坐标,此点即为查找到的纸币上边缘的第一个点,记作Pm,设其坐标为(xm,ym),其中xm表示起始点Pm的横坐标,ym表示起始点的纵坐标;
a2)以Pm为基准点向右查找纸币上边缘的边缘点:选取Pm向右位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,其中,delta>0,range表示纵坐标方向的搜索范围,并从该列从上到下依次查找第一个灰度值大于阈值T的像素点,该点即为上边缘的Pm点的右边点Pm+1,再以Pm+1为基准点,以同样的方式查找Pm+2点,Pm+3点,……,直到无法找到灰度值大于阈值T的像素点,则搜索停止,设最后一个找到的点为Pm+b
a3)以Pm为基准点向左查找纸币上边缘的边缘点:选取Pm向左位移delta处,纵坐标为[ym-range/2,ym+range/2]这一列,其中,delta>0,range表示纵坐标方向的搜索范围,并从该列从上到下依次查找第一个灰度值大于阈值T的像素点,该点即为上边缘的Pm点的左边点Pm-1,再以Pm-1为基准点,以同样的方式查找Pm-2点,Pm-3点,……,直到无法找到灰度值大于阈值T的像素点,则搜索停止,设最后一个找到的点为Pm-f
a4)最终找到纸币上边缘的点集为Pm-f,…Pm,…Pm+b,并将此点集记为Eu
a5)基于步骤a1)-a4)同样的原理查找纸币下边缘的点集、左边缘的点集和右边缘的点集,并将其分别记作Ed,El,Er
3.根据权利要求1所述的一种高效DSP纸币冠字号识别方法,其特征在于:
所述步骤c)对纸币的面向以及朝向进行识别具体包括:
c1)选取纸币图像的中心w×h像素区域,其中,w为中心区域的宽,h为中心区域的高,并计算该区域特征;
c2)设定决策面方程
<mrow> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mn>0</mn> </msub> <mo>,</mo> <msub> <mi>w</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>w</mi> <mn>2</mn> </msub> <mo>,</mo> <msub> <mi>w</mi> <mn>3</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mn>0</mn> </msub> <mo>+</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>3</mn> </msubsup> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
(w0,w1,w2,w3)为权值,(f1,f2,f3)为特征,此处特征为该区域的全局平均值、行平均值的标准差以及左、右半图标准差中的较小值;
c3)将判断面向的训练参数代入(w0,w1,w2,w3),若g(w0,w1,w2,w3)≥0,则说明当前处理的第一张图像即为正面图像;若g(w0,w1,w2,w3)<0,则说明处理的第二张图像为正面图像;
c4)选择正面图像作为接下来要处理的对象;
c5)抠取区域为(x',y',w',h')的左下角矩形区域R,其中,x'和y'表示R的左上角的横坐标和纵坐标,w'和h'表示R的宽度和高度;此时,如果纸币是正置的,则选到的图像为一片空白区域,如果纸币是倒置的,则选择到的图像为带有纹理的区域,计算该区域的全局平均值、行平均值的标准差以及左、右半图标准差中的较小值作为特征;
c6)根据式(1),将判断朝向的训练参数代入(w0,w1,w2,w3),若g(w0,w1,w2,w3)≥0,则说明纸币为正置的,冠字号在左下角区域;若g(w0,w1,w2,w3)<0,则说明纸币为倒置的,冠字号在右上角区域。
4.根据权利要求1所述的一种高效DSP纸币冠字号识别方法,其特征在于:所述步骤d)对纸币上的冠字号进行定位具体如下:
d1)设冠字号区域上、下、左、右边缘的斜率和截距分别为kgu,bgu;kgd,bgd;kgl,bgl;kgr,bgr;若纸币是正置的,则有:kgu=kd,bgu=bd-p0,kgd=kd,bgd=bd-p1,kgl=kl,bgl=bl+p2,kgr=kl,bgr=bl+p3,若纸币是倒置的,则有:kgu=ku,bgu=bu+p0,kgd=ku,bgd=bu+p1,kgl=kr,bgl=br-p2,kgr=kr,bgr=br-p3,其中,p0、p1、p2、p3分别为为上、下、左、右边缘的参数;
d2)由于此时的冠字号图像是倾斜的,因此通过确定的冠字号区域的斜率截距参数即可以将冠字号图像仿射变换至宽为wg,高为hg的正置的冠字号图像中;称此图像为粗定位的冠字号图像,记为Ig_c
d3)首先计算Ig_c中每隔两行的水平投影,结果为一向量,如式(2)所示
<mrow> <mo>&amp;lsqb;</mo> <msub> <mi>p</mi> <mn>0</mn> </msub> <mo>,</mo> <msub> <mi>p</mi> <mn>3</mn> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>p</mi> <mrow> <msub> <mi>h</mi> <mi>g</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>&amp;rsqb;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中hg-1表示第hg-1行;
d4)然后计算投影结果中每相邻三项的和,找到和的最小值所对应的三个下标值,取中间的坐标数作为精确定位的冠字码区域的中心行数,以此行数为中心,分别向上向下取n行,最后组成的图像即为精确定位的冠字号图像。
5.根据权利要求1所述的一种高效DSP纸币冠字号识别方法,其特征在于:所述步骤e)对最后得到的精确定位的冠字号图像中的冠字号进行冠字号分割具体为:e1)对精确定位的冠字号图像进行自适应二值化,从而得到相应的二值图BW,其中黑色为背景,白色为前景;
e2)BW第一行的设置:从左到右扫描,当遇到一段连续的前景,就赋予其新的标号,标号为一个数字,用于标记不同的连通域,并且将当前段的尺寸属性作为新的标号的初始尺寸属性,即连通域的上、下、左、右坐标;
e3)BW第i行的设置:从左到右扫描,当遇到前景段时,查看该前景段的上一行是否也有前景段,若无,则赋予当前前景段新的标号,并且将当前段的尺寸属性作为新的标号的初始尺寸属性,若上一行有一个或多个前景段,则跳转至e4);
e4)将上一行所有前景段对应的标号记录下来,找到其中最小的标号,将当前前景段赋予该标号,并且找到记录的标号所指向的最底层标号中的最小标号,接下来,将记录的标号全部指向该最小标号,同时,更新该最小标号中的四项尺寸属性;
e5)遍历当前所有标号,将所有不重复的最底层标号的四项尺寸属性作为最终外接矩形的属性;
e6)将高度大于阀值hT像素的矩形全部排除;
e7)判断外接矩形的个数ns是否大于10,若大于10,则计算所有外接矩形质心的纵坐标的平均值,并去除质心纵坐标距平均值偏移量最大的ns-10个外接矩形,最后根据外接矩形的起始横坐标对所有外接矩形从小到大排序,最终完成对冠字号的分割。
6.根据权利要求1所述的一种高效DSP纸币冠字号识别方法,其特征在于:所述步骤f)通过神经网络算法对冠字号进行识别具体包括:
f1)将分割的字符进行灰度归一化,即统计分割出的字符的灰度直方图,获得由黑到白的第20%处像素对应的灰度值T1和由白到黑的第20%处像素对应的灰度值T2,从而将原图中像素值范围在[T1,T2]的像素线性映射到[0,255],并将小于T1的像素值映射为0,将大于T2的像素值映射为255;
f2)大小归一化,即将灰度归一化后的字符缩放为wc×hc大小,其中,wc为归一化后的字符宽度,hc为归一化后的字符高度,归一化后的wc×hc的像素值即作为后续神经网络的输入特征;
f3)根据训练好的参数和神经网络模型计算神经网络中各个节点的参数;
f4)在神经网络实际输出的34个节点中找到最大的那个值,其对应的字母或者数字即为输入图像的识别结果;
f5)按顺序将分割好的10个字符依次输入神经网络,即可得到冠字号识别的最终结果。
CN201510702688.2A 2015-10-26 2015-10-26 一种高效dsp纸币冠字号识别方法 Active CN105261110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510702688.2A CN105261110B (zh) 2015-10-26 2015-10-26 一种高效dsp纸币冠字号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510702688.2A CN105261110B (zh) 2015-10-26 2015-10-26 一种高效dsp纸币冠字号识别方法

Publications (2)

Publication Number Publication Date
CN105261110A CN105261110A (zh) 2016-01-20
CN105261110B true CN105261110B (zh) 2018-04-06

Family

ID=55100780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510702688.2A Active CN105261110B (zh) 2015-10-26 2015-10-26 一种高效dsp纸币冠字号识别方法

Country Status (1)

Country Link
CN (1) CN105261110B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240185A (zh) * 2017-06-23 2017-10-10 深圳怡化电脑股份有限公司 一种冠字号识别方法、装置、设备及存储介质
CN110132978A (zh) * 2019-04-28 2019-08-16 无锡和博永新科技有限公司 电阻片整片检测装置及检测方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056751B (zh) * 2016-05-20 2019-04-12 聚龙股份有限公司 冠字号码的识别方法及系统
CN105957238B (zh) 2016-05-20 2019-02-19 聚龙股份有限公司 一种纸币管理方法及其系统
CN106022346B (zh) * 2016-05-24 2019-06-07 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106447615A (zh) * 2016-08-02 2017-02-22 浪潮软件股份有限公司 一种扫描文档图像的倾斜校正方法
CN106652167A (zh) * 2016-12-16 2017-05-10 西安电子科技大学 基于fpga的人民币冠字识别系统
CN106803307B (zh) * 2016-12-16 2023-05-02 恒银金融科技股份有限公司 一种基于模板匹配的纸币面值面向识别方法
CN106846609A (zh) * 2016-12-16 2017-06-13 恒银金融科技股份有限公司 一种基于感知哈希的纸币面值面向识别方法
CN106815561A (zh) * 2016-12-22 2017-06-09 北京五八信息技术有限公司 营业执照版面分析方法及装置
CN106683257A (zh) * 2016-12-30 2017-05-17 深圳怡化电脑股份有限公司 冠字号定位方法及装置
CN106803258A (zh) * 2017-01-13 2017-06-06 深圳怡化电脑股份有限公司 一种图像处理方法及装置
CN106845542B (zh) * 2017-01-18 2019-12-03 江苏阿瑞斯智能设备有限公司 基于dsp的纸币冠字号智能识别方法
CN106683259B (zh) * 2017-03-06 2019-04-26 深圳怡化电脑股份有限公司 一种纸币的鉴别方法及装置
CN107025716B (zh) * 2017-06-05 2019-12-10 深圳怡化电脑股份有限公司 检测纸币冠字号污损的方法及装置
CN107464335B (zh) * 2017-08-03 2020-01-17 恒银金融科技股份有限公司 一种纸币冠字号定位方法
CN107610320A (zh) * 2017-09-06 2018-01-19 深圳怡化电脑股份有限公司 一种票据识别方法和装置
CN107680249B (zh) * 2017-09-29 2020-01-14 深圳怡化电脑股份有限公司 古巴纸币面向识别方法及装置
CN109993749A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 提取目标图像的方法和装置
CN108492446B (zh) * 2018-02-07 2020-09-15 深圳怡化电脑股份有限公司 一种纸币边缘查找方法以及系统
CN108492447B (zh) * 2018-03-20 2020-09-15 深圳怡化电脑股份有限公司 美元面向识别方法、电子装置及计算机可读存储介质
CN111104940A (zh) * 2018-10-26 2020-05-05 深圳怡化电脑股份有限公司 图像旋转校正方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272906A (ja) * 1995-03-31 1996-10-18 Hitachi Ltd 文字認識装置
CN101408937B (zh) * 2008-11-07 2011-12-21 东莞市微模式软件有限公司 一种字符行定位的方法及装置
CN102779275B (zh) * 2012-07-04 2015-06-17 广州广电运通金融电子股份有限公司 一种纸类字符识别方法及相关装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240185A (zh) * 2017-06-23 2017-10-10 深圳怡化电脑股份有限公司 一种冠字号识别方法、装置、设备及存储介质
CN107240185B (zh) * 2017-06-23 2019-09-20 深圳怡化电脑股份有限公司 一种冠字号识别方法、装置、设备及存储介质
CN110132978A (zh) * 2019-04-28 2019-08-16 无锡和博永新科技有限公司 电阻片整片检测装置及检测方法

Also Published As

Publication number Publication date
CN105261110A (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
CN105261110B (zh) 一种高效dsp纸币冠字号识别方法
CN102663382B (zh) 基于子网格特征自适应加权的视频图像文字识别方法
CN101515325B (zh) 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN102663378B (zh) 连笔手写字符的识别方法
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
CN108133216B (zh) 基于机器视觉的可实现小数点读取的数码管读数识别方法
CN104899965B (zh) 一种基于清分机的多国纸币序列号识别方法
CN103577818A (zh) 一种图像文字识别的方法和装置
CN104298982A (zh) 一种文字识别方法及装置
CN107423735B (zh) 一种利用水平梯度和饱和度的车牌定位方法
CN105809651A (zh) 基于边缘非相似性对比的图像显著性检测方法
CN109740572A (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN105809673B (zh) 基于surf算法和合并最大相似区域的视频前景分割方法
CN106294705A (zh) 一种批量遥感影像预处理方法
CN104517101A (zh) 一种基于像素平方差匹配的游戏扑克牌识别方法
CN107766854A (zh) 一种基于模板匹配实现快速页码识别的方法
CN103218833A (zh) 边缘加强型的彩色空间最稳极值区域检测方法
CN110598581B (zh) 基于卷积神经网络的光学乐谱识别方法
CN109409356A (zh) 一种基于swt的多方向中文印刷体文字检测方法
CN108491883B (zh) 一种基于条件随机场的显著性检测优化方法
CN107680246B (zh) 一种纸币图案中的曲线边界定位方法及设备
CN105354566B (zh) 用于冠字号识别的字符污染去除方法
CN112329641A (zh) 一种表格识别方法、装置、设备及可读存储介质
CN109460763B (zh) 一种基于多层次文本组件定位与生长的文本区域提取方法
CN108256475B (zh) 一种票据图像倒置检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant