1.一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,其特征在于:
步骤1建立各类别字符的识别样本库
根据中华人民共和国机动车号牌标准GA36-2007,车牌中用到所有的数字字符及除I和O之外的所有字母字符,总共34类字符,针对第j类字符Lj建立样本数量为Nj的字符样本库Sj,得到样本总数量为N的总样本库S,
S={Sj},j=1,2,...34,
Sj={Wjk},k=1,2,...Nj,
式中,Wjk是大小被归一化为80×40像素的二值化字符图像,表示第j类字符的样本库Sj中第k个样本,字符样本库S1~S10按顺序对应于数字0~9,字符样本库S11~S18按顺序对应于字母A~H,字符样本库S19~S23按顺序对应于字母J~N,字符样本库S24~S34按顺序对应于字母P~Z,
步骤2最小错误率贝叶斯分类器的设计
步骤2.1:对第j类字符而言,计算其字符样本库S
j中所有样本W
jk的粗网格特征
其中,
是粗网格特征
的第i
1个分量,m
1和n
1分别是
所对应的块的横、纵坐标,W
jk(x
1,y
1)是字符图像W
jk中坐标为(x
1,y
1)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i
1,4)为i
1除以4之后的余数,
步骤2.2:计算字符样本库Sj中所有样本Wjk的粗网格特征均值
式中,
是第j类字符L
j的粗网格特征均值
的第i
1个分量,
是字符样本库S
j中第k个样本W
jk的粗网格特征
的第i
1个分量,
步骤2.3:计算字符样本库Sj中所有样本的粗网格特征的协方差矩阵Cj,
式中,
是协方差矩阵C
j中行、列坐标分别为a、b的元素的数值,
是字符样本库S
j中第k个样本W
jk的粗网格特征
的第a个分量,
是字符样本库S
j中第k个样本W
jk的粗网格特征
的第b个分量,
步骤2.4:计算在总样本库中第j类字符Lj的先验概率Pj,
步骤2.5:定义与第j类字符Lj相对应的判别函数Hj(W),得到最小错误率贝叶斯分类器H(W),
H(W)={Hj(W)},j=1,2,...34,
式中,W是任意的大小被归一化为80×40像素的二值字符图像,FW是二值字符图像W的粗网格特征,Cj -1是协方差矩阵Cj的逆矩阵,|Cj|是协方差矩阵Cj的行列式,
步骤3基于最小错误率贝叶斯分类器的第一级分类
步骤3.1:对需要进行识别的大小被归一化为80×40像素的二值字符图像W而言,计算其粗网格特征FW,
其中,
Fw(i2)是粗网格特征Fw的第i2个分量,m2和n2分别是Fw(i2)所对应的块的横、纵坐标,W(x2,y2)是字符图像W中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
步骤3.2:计算最小错误率贝叶斯分类器H(W)中所有判别函数Hj(W)的值,取最大的判别函数值HM(W)所对应的字符类别作为该二值字符图像W的类别,
HM(W)=max(Hj(W)),j=1,2,...34,
数值M与34种字符类别的对应关系为:M分别为1~10时按顺序对应于数字0~9,M分别为11~18时按顺序对应于字母A~H,M分别为19~23时按顺序对应于字母J~N,M分别为24~34时按顺序对应于字母P~Z,
如果与数值M所对应的字符类别是集合{D,0,Q,8,B,2,Z,5,S,4,A}中的一种,则表明第一级分类得到的字符类别属于相似字符,可能存在错误,转到步骤4进行第二级分类,否则表明第一级分类得到的字符类别不属于相似字符,以之作为该字符的最终分类结果,结束分类,
步骤4相似字符的第二级分类
以第一级分类结果为基础,对易混淆的5组字符提取局部特征进行第二级分类,
(1)“D”、“0”和“Q”
如果第一级分类得到的字符类别为“D”、“0”和“Q”,则计算字符图像W的局部特征T1和T2,
利用局部特征T1和T2对字符图像W进行第二级分类:
如果T1≥195,则识别字符图像W为字母“Q”,如果T1<195且T2<73则识别字符图像W为数字“0”,如果T1<195且T2≥73则识别字符图像W为字母“D”,
(2)“8”和“B”
如果第一级分类得到的字符类别为“8”和“B”,则计算字符图像W的局部特征T3、T4和T5,
利用局部特征T3、T4和T5对字符图像W进行第二级分类:
如果T3<24、T4<20且T5<20,则识别字符图像W为数字“8”,否则识别字符图像W为字母“B”,
(3)“2”和“Z”
如果第一级分类得到的字符类别为“2”和“Z”,则计算字符图像W的局部特征T6和T7,
利用局部特征T6和T7对字符图像W进行第二级分类:
如果T6≤260且T7≥15,则识别字符图像W为数字“2”,否则识别字符图像W为字母“Z”,
(4)“5”和“S”
如果第一级分类得到的字符类别为“5”和“S”,则计算字符图像W的局部特征T8和T9,
利用局部特征T8和T9对字符图像W进行第二级分类:
如果T7≥290且T9≥270,则识别字符图像W为数字“5”,否则识别字符图像W为字母“S”,
(5)“4”和“A”
如果第一级分类得到的字符类别为“4”和“A”,则计算字符图像W的局部特征T10,
利用局部特征T10对字符图像W进行第二级分类:
如果T10<180,则识别字符图像W为数字“4”,否则识别字符图像W为字母“A”。