CN104036271B

CN104036271B - 一种字符和纸币冠字号码的识别方法及装置和atm机

Info

Publication number: CN104036271B
Application number: CN201410258528.9A
Authority: CN
Inventors: 李武强; 张林法; 郭礼虎
Original assignee: Ndt Science & Technology Co Ltd
Current assignee: Ndt Science & Technology Co Ltd
Priority date: 2014-06-11
Filing date: 2014-06-11
Publication date: 2017-08-25
Anticipated expiration: 2034-06-11
Also published as: CN104036271A

Abstract

本发明提供本发明的通过采用矢量特征自动提取网络和BP网络对字符图像进行识别的字符图像识别方法，同时提供一种基于该字符图像识别的纸币冠字号码识别方法以及实现字符识别方法的装置和具有识别冠字号码能力的ATM机。本发明在应用于ATM的现金存取款过程中提取和自动识别纸币的冠字号码能达到99.6%以上的识别率，未能识别部分的原因主要是纸币号码的污损、纸币号码折叠和纸币太旧导致号码和背景分不开等问题。

Description

一种字符和纸币冠字号码的识别方法及装置和ATM机

技术领域

本发明涉及模式识别领域，特别涉及字符识别，是一种采用特征矢量自动提取网络和识别网络组合的双重网络字符识别方法和采用这种方法的装置。

背景技术

在电脑和电信领域中，字符(Character)是一个资讯单位。对使用字母系统或音节文字等自然语言，它大约对应为一个音位、类音位的单位或符号。字符的例子有：字母、数字系统或标点符号。目前，采用一串字符(字符串)来表示身份特征是非常普遍，也为字符自动识别技术提供了广阔的应用空间。例如在货币上都有一串唯一的字符串，也就是冠字号码，支票上也有支票帐号识别记录，这些冠字号码和帐号识别记录都是采用A、B、C等26个英文字母大写和0、1、2、3、4、5、6、7、8、9十个数字组合而成，当然作为字符串用来做ID，小写字母也可以使用，但使用频率不如大字字母，因此，目前大多是采用26个大写英文字母和10个数字共36个字符。

目前，ATM的现金存取款过程中要提取和自动识别纸币的冠字号码、在支票支付转账过程中也要对支票账号识别记录、在停车场上由于车辆越来越多，也要对每辆车实行车牌号码识别登记管理。在这种具有唯一性的号码确认的应用场合下，字符自动识别就发挥它的举足轻重的作用。

早期很多人对号码检测和自动识别展开了深入的研究工作。到目前为止，字符(号码)识别方法有统计特征、模板匹配、单独BP网络、单独RBF 网络、支持向量机等等。然而在这些方法当中，都是围绕着一个核心问题：就是如何设计更好的分类器或识别器提高号码识别率。

目前，ATM的现金存取款过程中要提取和自动识别纸币的冠字号码进行识别，一般是将冠字号码中的每个字符截取，分别进行识别，然后将识别后的字符按照号码的顺序组合。

而在这些方法当中发现虽然用网络作分类器或识别器识别号码效果更好些，但同时又发现单独使用一种网络作为分类器或识别器，会容易使得网络预测能力出现过拟合，难以控制把握这种非线性映射，使得网络结构过于复杂，导致隐层储存大量的冗余信息，大大加重网络的负载能力，影响识别精度。

因此，有必要提供某种方法解决上述单独使用一种网络缺陷，通过改进网络或设计不同网络来达到既能提高网络预测能力，又能抑制隐层储存冗余信息，减少网络的负载能力，提高识别精度。

发明内容

本发明的目的是提供一种基于特征矢量自动提取网络和识别网络组合的双重网络字符识别方法，通过改进网络或设计不同网络来达到既能提高网络预测能力，又能抑制隐层储存冗余信息，减少网络的负载能力，提高识别精度。

本发明的技术方案是：一种字符识别方法，该方法中，字符的二值化图像与样本库内的字符二值化标准样本比对识别，采用特征矢量自动提取网络提取字符图像的特征输出到BP网络进行识别；包括以下步骤：

步骤1、特征矢量自动提取网络和BP网络学习和训练的步骤，该步骤结束后，BP网络输出层每位向量输出代表标准样本库中一个标准样本的位置；

步骤2、将待识别的字符的二值化图像输入到经过步骤1中学习和训练后的特征矢量自动提取网络，提取特征矢量；

步骤3、将步骤2中提取的特征矢量输入到BP网络；

步骤4、查找到BP网络当前输出的最大值向量位置，该位置对应步骤中标准样本所对应的字符就是将待识别的字符。

进一步的，上述的字符识别方法中：所述的特征矢量自动提取网络由两层神经网络组成，包括输入层和输出层，在这两层之间通过正向传递和反向调整，使得网络正反两个方向的误差传递，动态调整网络各个单元权值方式将输入的高维参数压缩和提取后输出低维特征矢量；

所述的特征矢量自动提取网络学习和训练的包括以下步骤：

步骤11、初始化，给每个网络权值向量W_ij赋予(-1，1)内的随机数值；

步骤12、输入二值化样本提供给网络；

步骤13、用输入样本参数和网络各个权值向量W_ij，计算出输出层各个单元的输出M_z：

步骤14、通过输出层各个单元的输出M_j及输入层各个单元的参数P_i和网络各个单元权值向量W_ij，计算出各个单元的误差向量e_ij：

e_ij＝e_i(j-1)-W_ijM_j i＝(1,2,3,...,n)，j＝(1,2,3,...,v)

当j＝1时，e_i(j-1)＝e_i0＝P_i；

步骤15、利用各个单元的误差向量e_ij和输出层各个单元的输出M_j，修正网络各个单元权值向量W_ij：

在这里，使用f(x)＝atan(x)作为网络激励函数；

步骤16、重新返回步骤12，再对下一个样本二值化样本P_x进行训练；如此这样对所有样本训练200-300次后结束网络训练；

步骤17、网络训练完毕后，对输出层各个单元的输出M_j进行特征参数归一化：

M_j＝M_j/X j＝(1,2,3,...,v)

其中N是代表样本总数量，M_j代表网络输出第j个单元向量；

k为样本数，n为特征矢量自动提取网络输入维数，这里是每个输入的二值化样本图像像素数，v为特征矢量自动提取网络输出维数，

进一步的，上述的字符识别方法中：所述的BP网络由输入层、隐层、输出层构成的三层前馈网络；所述的BP网络的学习和训练包括以下步骤：

步骤21、初始化步骤，该步骤给每个网络权值向量W_ij赋予(-1，1)内的随机数值；

步骤22、将特征矢量网络输出的特征向量提供给BP网络；

步骤23、用输入特征矢量M_z＝(S₁,S₂,...,S_v)和网络输入层各个权值向量W_zj，计算隐层各个单元的输出B_j,网络的激励函数采用

其中x是代表BP网络隐层单元数量，B_j代表网络隐层输出第j个单元向量，v是代表BP网络输入层单元数，该单元数与特征矢量自动提取网络输出层单元数相等；

步骤24、用网络隐层输出单元向量B_j和网络隐层各个权值向量w_jt，计算输出层各个单元的输出O_t,网络的激励函数采用

其中s是代表BP网络输出层单元数量，O_t代表网络输出层输出第t个单元向量；

步骤25、计算BP网络输出层的误差E_t

E_t＝O_t·(1.0-O_t)·(T_t-O_t) t＝(1,2,3,...,s)

其中T_t为期望输出第t个单元向量，O_t网络输出层第t个单元向量；

步骤26、计算BP网络反向传播隐层的误差hE_j

hE_j＝B_j·(1.0-B_j)·Y_j；

步骤27、BP网络反向传播修正调整输入层权值向量W_zj和隐层层权值向量w_jt

w_jt(n+1)＝δ·E_t·B_j+θ·w_jt(n)

W_zj(n+1)＝δ·hE_j·M_z+θ·W_zj(n)

其中，δ为学习因子，θ为动量因子；

步骤28、重新返回步骤22，再对下一个特征向量进行训练。直到所有特征向量训练完成并收敛于某个值，结束网络训练。

本发明还提供了一种识别纸币的冠字号码的方法，包括以下步骤：

A、对纸币的冠字号码的检测获得冠字号码区域图像的步骤；

B、将冠字号码区域图像切割成单独字符图像的步骤；

C、对字符图像进行二值化形成字符的二值化图像；

D、如前面所述的字符识别方法对字符的二值化图像识别的步骤；

E、将识别到的字符组成纸币的冠字号码的步骤。

上面步骤D中：使用三组特征矢量自动提取网络和BP网络；

第一组特征矢量自动提取网络和BP网络使用的样本为标准样本中的数字0-9进行学习和训练；

第二组特征矢量自动提取网络和BP网络使用的样本为标准样本中的字符A-M进行学习和训练；

第三组特征矢量自动提取网络和BP网络使用的样本为标准样本中的字符N-Z进行学习和训练；

将步骤C中形成字符的二值化图像分别输入学习和训练好的第一、二、三组特征矢量自动提取网络和BP网络对；

判断三组特征矢量自动提取网络和BP网络对的BP网络输出最大值的位置就是所要识别的字符。

本发明中还提供一种实现上述字符识别方法的字符装置，该装置对获取到的字符图像进行识别，包括将获取到的字符图像进行二值化的模块，保存有标准样本的数据库，其特征在于：还包括特征矢量自动提取网络和BP网络、对所述的特征矢量自动提取网络和BP网络学习和训练的模块；

所述的特征矢量自动提取网络由两层神经网络组成，包括输入层和输出层，在这两层之间通过正向传递和反向调整，使得网络正反两个方向的误差传递，动态调整网络各个单元权值方式将输入的高维参数压缩和提取后输出低维特征矢量；所述特征矢量自动提取网络的输入层在所述的学习和训练的模块控制下分别与数据库和二值化的模块相连；

所述的BP网络由输入层、隐层、输出层构成的三层前馈网络，在所述的学习和训练的模块控制下所述的BP网络的输入层与所述特征矢量自动提取网络的输出层相连。

本发明还提供一种具有识别纸币的冠字号码能力的ATM机，该ATM机中包括识别纸币的冠字号码的装置，所述的识别纸币的冠字号码的装置包括：

对纸币的冠字号码的检测获得冠字号码区域图像的模块；

将冠字号码区域图像切割成单独字符图像的模块；

对字符图像进行二值化形成字符的二值化图像的模块；

上述的字符识别装置；

将识别到的字符组成纸币的冠字号码的模块。

本发明的通过改进网络或设计不同网络来达到既能提高网络预测能力，又能抑制隐层储存冗余信息，减少网络的负载能力，提高识别精度。

本发明在应用于ATM的现金存取款过程中提取和自动识别纸币的冠字号码能达到99.6％以上的识别率，未能识别部分的原因主要是纸币号码的污损、纸币号码折叠和纸币太旧导致号码和背景分不开等问题。

下面结合具体实施例对本发明作较为详细的描述。

附图说明

图1是特征矢量自动提取网络从输入层传向输出层正向传递过程示意图。

图2是特征矢量自动提取网络从输出层传向输入层反向传递过程示意图。

图3是识别网络(BP网络)拓扑结构示意图。

图4是字符识别过程示意图。

具体实施方式

本实施例实现对纸币冠字号码进行识别，主要是将需要识别的纸币冠字号码进行提取、剪切、二值化等预处理后形成的字符的图像进行识别处理，目前作为纸币冠字号码主要是由26个英文字母大写和10个数字组成，因此，本实施例中采用的标准样本库中保存有以下字符：

A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、T、U、V、W、X、Y、Z、1、2、3、4、5、6、7、8、9、0。

在本样库中，保存的是这些字符样本的标准化二值图，根据实践使用，这些二值图的大小为16×16，也可以为较大的或者更小的，取这样的样本不失一般性。

本实施例中，字符的二值化图像与样本库内的字符二值化标准样本比对识别，采用特征矢量自动提取网络提取字符图像的特征输出到BP网络进行识别；包括以下步骤：

步骤3、将步骤2中提取的特征矢量输入到BP网络；

其中，特征矢量自动提取网络的是由两层神经网络组成，主要是包括输入层和输出层。在这两层之间通过正向传递和反向调整，使得网络正反两个方向的误差传递，动态调整网络各个单元权值方式将输入的高维参数压缩和提取后输出低维特征矢量。参考附图1、附图2。一般对特征矢量自动提取网络设计都要求输入层的神经元个数要远远大于输出层的神经元个数这样才完成高维输入经过压缩、提取映射到低维特征输出。为了更清楚描述，需要对各个符号形式及意义进行说明：

(1)网络输入向量P_k＝(a₁,a₂,,...,a_n)

(2)网络输出向量M_z＝(S₁,S₂,...,S_v)

(3)网络误差向量e_ij，i＝(1,2,3,...,n),j＝(1,2,3,...,v)

(4)网络权值向量W_ij，i＝(1,2,3,...,n),j＝(1,2,3,...,v)

(5)网络的激励函数f(x)＝atan(x)或

对特征矢量自动提取网络，这里我们使用的是16×16图片，因此，可以将n定为256，v为34，网络的激励函数为f(x)＝atan(x)。一般情况，输入的维数(即n取值)大于输出维数(即v取值)达到网络从高维压缩到低维特输出的效果，一般计算

下面，对特征矢量自动提取网络学习具体步骤进行描述：

1)初始化给每个网络权值向量W_ij赋予(-1，1)内的随机数值。

2)输入二值化样本提供给网络。

3)用输入样本参数和网络各个权值向量W_ij，计算出输出层各个单元的输出M_z。

4)通过输出层各个单元的输出M_j及输入层各个单元的参数P_i和网络各个单元权值向量W_ij，计算出各个单元的误差向量e_ij。

e_ij＝e_i(j-1)-W_ijM_j i＝(1,2,3,...,n)，j＝(1,2,3,...,v)

当j＝1时，e_i(j-1)＝e_i0＝P_i

5)利用各个单元的误差向量e_ij和输出层各个单元的输出M_j，修正网络各个单元权值向量W_ij。

在这里，本文使用f(x)＝atan(x)作为网络激励函数。

6)重新返回2)步骤，再对下一个样本二值化样本P_x进行训练。如此这样对所有样本一般训练200-300次左右后就结束网络训练。

7)网络训练完毕后，对输出层各个单元的输出M_j进行特征参数归一化。

M_j＝M_j/X j＝(1,2,3,...,v)

其中N是代表样本总数量，M_j代表网络输出第j个单元向量

8)完成网络特征参数归一化后，就将输出层的特征向量传送到识别网络作特征识别。

以上是描述特征矢量自动提取网络学习过程。在这过程网络反复学习、调整网络权值将样本n维压缩到一个v维输出的特征向量。由于我们这里用到样本规格大小为16*16，故n＝256.

识别网络主要是使用最为广泛的误差信号反向传播网络(Back-Propogation,简称BP网络)。参考附图3。BP网络由输入层、隐层、输出层构成的三层前馈网络，是通过应用误差反向传播原理不断调整网络权值使网络期望输出值与已知的训练样本输出值之间的误差平方和达到最小或小于某一期望值。

下面参考文献：公开了有关BP网络的资料：

边肇祺，张学工.模式识别【M】.北京：清华大学出版,2000

阎平凡，对多层前向神经网络研究的进一步看法【J】，电子学报，1999，27(5)：82-85.

焦李成著，神经网络系统理论，西安：西安电子科技大学出版社，1996下面，描述BP网络学习特征矢量网络输出的特征向量过程：

1)初始化给每个网络权值向量W_ij赋予(-1，1)内的随机数值。

2)将特征矢量网络输出的特征向量提供给网络。

3)用输入特征矢量M_z＝(S₁,S₂,...,S_v)和网络输入层各个权值向量W_zj，计算隐层各个单元的输出B_j,网络的激励函数采用

其中x是代表BP网络隐层单元数量，B_j代表网络隐层输出第j个单元向量。v是代表BP网络输入层单元数并且一定要跟特征矢量自动提取网络输出层单元数相等。

4)用网络隐层输出单元向量B_j和网络隐层各个权值向量w_jt，计算输出层各个单元的输出O_t,网络的激励函数采用

其中s是代表BP网络输出层单元数量，O_t代表网络输出层输出第t个单元向量。

这里，S既代表输出层输出单元数量，也代表识别字符个数，样本库中样本的数量，这是BP网络自定义的，很好理解，由于每个样本通过学习和训练以后，都会使有一个O_t输出接近“1”，只有输出单元数量与样本数量相同或者输出单元数量大于样本数量。目前，BP网络的输出单元数s的确定值在很多神经网络理论中都无法给出确定的值，其网络输出单元数s的确定值往往根据实际工程项目需求来确定，目前我们将BP网络的输出映射成一个具体的类别。其实现过程是,选择BP网络具有最大值的输出节点所在的位置标号,则该位置标号对应一个具体的输出类别。

如要识别0～9，则S＝10，

要识别A～M，则S＝13，

要识别A～Z，则S＝26.

S跟识别字符个数有关。

5)计算BP网络输出层的误差E_t

E_t＝O_t·(1.0-O_t)·(T_t-O_t) t＝(1,2,3,...,s)

其中T_t为期望输出第t个单元向量，O_t网络输出层第t个单元向量。

6)计算BP网络反向传播隐层的误差hE_j

hE_j＝B_j·(1.0-B_j)·Y_j

7)BP网络反向传播修正调整输入层权值向量W_zj和隐层层权值向量w_jt

w_jt(n+1)＝δ·E_t·B_j+θ·w_jt(n)

W_zj(n+1)＝δ·hE_j·M_z+θ·W_zj(n)

其中，δ为学习因子，θ为动量因子。

重新返回2)步骤，再对下一个特征向量进行训练。直到所有特征向量训练完成并收敛于某个值，结束网络训练。

以上是识别网络(BP网络)学习训练过程。在这过程也是BP网络竞争选择与抑制过程。

下面描述双重网络对号码识别过程，参考附图4。

通过上面步骤完成对两个网络的训练和学习。

上面的步骤中，双重网络识别号码都是基于已经训练好的网络来对号码进行识别，目前大多数号码都是由26个英文字母和10个数字组成。对于号码识别的双重网络设计如下：使用两个双重网络识别26个英文字母即一个识别A-M英文字母双重网络识和一个识别N-Z英文字母双重网络，而识别数字0-9使用一个双重网络就可以了。在识别网络(BP网络)的输出层每位向量输出代表某个号码标识位置。查找当前输出的最大值向量为识别某个号码标位置，再转换为识别出某个号码。

这样，具体的做法是，将图片输入到了A-M网络、N-Z网络和0-9网络中，在这三个网络中找出一个输出最大的位置来确定识别出怎样的字符。

如需要识别的字符是“5”，我们将“5”的图片输入到了A-M网络、N-Z网络和0-9网络中，可能A-M网络输出最大值为0.1,而N-Z网络输出最大值为0.2，而0-9网络输出最大值为0.85.故在0-9网络找出一个输出最大值为0.85的位置来转换相应的识别字符。

本实施例中，字符识别的装置对获取到的字符图像进行识别，包括将获取到的字符图像进行二值化的模块，保存有标准样本的数据库，还包括特征矢量自动提取网络和BP网络、对特征矢量自动提取网络和BP网络学习和训练的模块；特征矢量自动提取网络由两层神经网络组成，包括输入层和输出层，在这两层之间通过正向传递和反向调整，使得网络正反两个方向的误差传递，动态调整网络各个单元权值方式将输入的高维参数压缩和提取后输出低维特征矢量；特征矢量自动提取网络的输入层在所述的学习和训练的模块控制下分别与数据库和二值化的模块相连；BP网络由输入层、隐层、输出层构成的三层前馈网络，在学习和训练的模块控制下所述的BP网络的输入层与所述特征矢量自动提取网络的输出层相连。

采用上述识别字符的方法可以识别纸币上的冠字号码，识别包括以下步骤：

A、对纸币的冠字号码的检测获得冠字号码区域图像的步骤；

B、将冠字号码区域图像切割成单独字符图像的步骤；

C、对字符图像进行二值化形成字符的二值化图像；

D、采用上面字符识别方法对字符的二值化图像识别的步骤；

E、将识别到的字符组成纸币的冠字号码的步骤。

本实施例还提供一种ATM机，该ATM机中包括识别纸币的冠字号码的装置，所述的识别纸币的冠字号码的装置包括：

对纸币的冠字号码的检测获得冠字号码区域图像的模块；

将冠字号码区域图像切割成单独字符图像的模块；

对字符图像进行二值化形成字符的二值化图像的模块；

上述的字符识别装置；

将识别到的字符组成纸币的冠字号码的模块。

Claims

1.一种字符识别方法，该方法中，字符的二值化图像与样本库内的字符二值化标准样本比对识别，其特征在于：采用特征矢量自动提取网络提取字符图像的特征输出到BP网络进行识别；包括以下步骤：

步骤3、将步骤2中提取的特征矢量输入到BP网络；

步骤4、查找到BP网络当前输出的最大值向量位置，该位置对应步骤中标准样本所对应的字符就是将待识别的字符；

所述的特征矢量自动提取网络由两层神经网络组成，包括输入层和输出层，在这两层之间通过正向传递和反向调整，使得网络正反两个方向的误差传递，动态调整网络各个单元权值方式将输入的高维参数压缩和提取后输出低维特征矢量；

所述的特征矢量自动提取网络学习和训练的包括以下步骤：

步骤11、初始化给每个网络权值向量W_ij赋予(-1，1)内的随机数值；

步骤12、输入二值化样本提供给网络；

e_ij＝e_i(j-1)-W_ijM_j i＝(1,2,3,...,n)，j＝(1,2,3,...,v)

当j＝1时，e_i(j-1)＝e_i0＝P_i；

在这里，使用f(x)＝atan(x)作为网络激励函数；

M_j＝M_j/X j＝(1,2,3,...,v)

其中N是代表样本总数量，M_j代表网络输出第j个单元向量；

2.根据权利要求1所述的字符识别方法，其特征在于：所述的BP网络由输入层、隐层、输出层构成的三层前馈网络；所述的BP网络的学习和训练包括以下步骤：

步骤22、将特征矢量网络输出的特征向量提供给BP网络；

步骤25、计算BP网络输出层的误差E_t

E_t＝O_t·(1.0-O_t)·(T_t-O_t) t＝(1,2,3,...,s)

步骤26、计算BP网络反向传播隐层的误差hE_j

hE_j＝B_j·(1.0-B_j)·Y_j；

步骤27、BP网络反向传播修正调整输入层权值向量W_zj和隐层权值向量w_jt

w_jt(n+1)＝δ·E_t·B_j+θ·w_jt(n)

W_zj(n+1)＝δ·hE_j·M_z+θ·W_zj(n)

其中，δ为学习因子，θ为动量因子；

步骤28、重新返回步骤22，再对下一个特征向量进行训练，直到所有特征向量训练完成并收敛于某个值，结束网络训练。

3.一种识别纸币的冠字号码的方法，其特征在于：包括以下步骤，

A、对纸币的冠字号码的检测获得冠字号码区域图像的步骤；

B、将冠字号码区域图像切割成单独字符图像的步骤；

C、对字符图像进行二值化形成字符的二值化图像；

D、如权利要求1所述的字符识别方法对字符的二值化图像识别的步骤；

E、将识别到的字符组成纸币的冠字号码的步骤。

4.根据权利要求3所述的识别纸币的冠字号码的方法，其特征在于：所述的步骤D中使用三组特征矢量自动提取网络和BP网络；

5.一种根据权利要求1所述的字符识别方法的字符识别装置，对获取到的字符图像进行识别，包括将获取到的字符图像进行二值化的模块，保存有标准样本的数据库，其特征在于：还包括特征矢量自动提取网络和BP网络、对所述的特征矢量自动提取网络和BP网络学习和训练的模块；

6.一种ATM机，其特征在于：包括识别纸币的冠字号码的装置，其特征在于：所述的识别纸币的冠字号码的装置包括：

对纸币的冠字号码的检测获得冠字号码区域图像的模块；

将冠字号码区域图像切割成单独字符图像的模块；

对字符图像进行二值化形成字符的二值化图像的模块；

权利要求5所述的字符识别装置；

将识别到的字符组成纸币的冠字号码的模块。