CN102184412B - 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法 - Google Patents

基于最小错误率贝叶斯分类器的车牌数字及字母识别方法 Download PDF

Info

Publication number
CN102184412B
CN102184412B CN 201110120361 CN201110120361A CN102184412B CN 102184412 B CN102184412 B CN 102184412B CN 201110120361 CN201110120361 CN 201110120361 CN 201110120361 A CN201110120361 A CN 201110120361A CN 102184412 B CN102184412 B CN 102184412B
Authority
CN
China
Prior art keywords
character
sigma
class
classification
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110120361
Other languages
English (en)
Other versions
CN102184412A (zh
Inventor
路小波
朱周
杨军飞
熊阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN 201110120361 priority Critical patent/CN102184412B/zh
Publication of CN102184412A publication Critical patent/CN102184412A/zh
Application granted granted Critical
Publication of CN102184412B publication Critical patent/CN102184412B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,该方法为:以粗网格特征作为字符识别的特征,针对34类数字及字母字符,建立各自的字符样本库,根据样本库计算各类字符粗网格特征的均值、协方差矩阵及字符的先验概率,进而得到各类字符的判别函数,完成最小错误率贝叶斯分类器的设计,之后提取待识别字符图像的粗网格特征,利用最小错误率贝叶斯分类器对该字符图像进行第一级分类,如果第一级分类得到的类别属于相近字符的类别,则分5种情况分别提取该字符图像不同位置的局部特征,进行相近字符的第二次分类。本发明中最小错误率贝叶斯分类器所用的判别函数简单且对字符进行二级分类,具有识别速度快、识别准确性高的优点。

Description

基于最小错误率贝叶斯分类器的车牌数字及字母识别方法
技术领域
本发明涉及一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,其目的在于对车牌后六位数字及字母字符进行分类和识别,属于交通监控技术领域。
背景技术
随着经济的不断发展和城市化进程的快速进行,我国机动车保有数量急剧增加,交通管理的问题越来越突出。在很多情况下,为了更好地进行交通管理往往需要对车辆进行识别。车牌识别系统利用图像处理、模式识别等技术自动定位和识别车牌,能够大大地提高车辆识别的效率。它可以用于停车场管理、交通信息采集、交警稽查、海关物流监控等领域,具有广泛的应用范围。
字符识别是车牌识别系统的核心模块,其性能对整个车牌识别系统具有很大的影响。最常用的字符识别方法是神经网络法,这种方法总的来说具有较好的识别准确性,但是对相近字符的识别依然具有一定的错误率,且其训练和识别需要较多的时间。本发明提供一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,能够快速、准确地对车牌的数字及字母进行识别,且提高了对相近字符的识别率。
发明内容
技术问题
本发明提供一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,该方法具有识别精度高、识别速度快等优点。
技术方案
一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,其特征在于:
步骤1建立各类别字符的识别样本库
根据中华人民共和国机动车号牌标准(GA36-2007),车牌中用到所有的数字字符及除I和O之外的所有字母字符,总共34类字符,针对第j类字符Lj建立样本数量为Nj的字符样本库Sj,得到样本总数量为N的总样本库S,
S={Sj},j=1,2,...34,
Sj={Wjk},k=1,2,...Nj
N = Σ j = 1 34 N j ,
式中,Wjk是大小被归一化为80×40像素的二值化字符图像,表示第j类字符的样本库Sj中第k个样本,字符样本库S1~S10按顺序对应于数字0~9,字符样本库S11~S18按顺序对应于字母A~H,字符样本库S19~S23按顺序对应于字母J~N,字符样本库S24~S34按顺序对应于字母P~Z,步骤2最小错误率贝叶斯分类器的设计
步骤2.1:对第j类字符而言,计算其字符样本库Sj中所有样本Wjk的粗网格特征
Figure BSA00000492841100021
F W jk ( i 1 ) = Σ x 1 = ( m 1 - 1 ) × 10 + 1 m 1 × 10 Σ y 1 = ( n 1 - 1 ) × 10 + 1 n 1 × 10 W jk ( x 1 , y 1 ) , i1=1,2,...32,
其中, m 1 = i 1 - n 1 4 + 1 ,
是粗网格特征
Figure BSA00000492841100026
的第i1个分量,m1和n1分别是
Figure BSA00000492841100027
所对应的块的横、纵坐标,Wjk(x1,y1)是字符图像Wjk中坐标为(x1,y1)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i1,4)为i1除以4之后的余数,
步骤2.2:计算字符样本库Sj中所有样本Wjk的粗网格特征均值
Figure BSA00000492841100028
F j ‾ ( i 1 ) = Σ k = 1 N j F W jk ( i 1 ) N j , i1=1,2,...32,
式中,
Figure BSA000004928411000210
是第j类字符Lj的粗网格特征均值
Figure BSA000004928411000211
的第i1个分量,是字符样本库Sj中第k个样本Wjk的粗网格特征
Figure BSA000004928411000213
的第i1个分量,
步骤2.3:计算字符样本库Sj中所有样本的粗网格特征的协方差矩阵Cj
C j ab = 1 N j - 1 Σ k = 1 N j ( F W jk ( a ) - F j ‾ ( a ) ) ( F W jk ( b ) - F j ‾ ( b ) ) , a,b=1,2,...32,
式中,
Figure BSA000004928411000215
是协方差矩阵Cj中行、列坐标分别为a、b的元素的数值,
Figure BSA000004928411000216
是字符样本库Sj中第k个样本Wjk的粗网格特征
Figure BSA000004928411000217
的第a个分量,是字符样本库Sj中第k个样本Wjk的粗网格特征的第b个分量,
步骤2.4:计算在总样本库中第j类字符Lj的先验概率Pj
P j = N j N , j=1,2,...34,
步骤2.5:定义与第j类字符Lj相对应的判别函数Hj(W),得到最小错误率贝叶斯分类器H(W),H(W)={Hj(W)},j=1,2,...34,
H j ( w ) = - 1 2 ( F W - F j ‾ ) T C j - 1 ( F W - F j ‾ ) + ln P ( j ) - 1 2 j ln | C j | ,
式中,W是任意的大小被归一化为80×40像素的二值字符图像,FW是二值字符图像W的粗网格特征,Cj -1是协方差矩阵Cj的逆矩阵,|Cj|是协方差矩阵Cj的行列式,
步骤3基于最小错误率贝叶斯分类器的第一级分类
步骤3.1:对需要进行识别的大小被归一化为80×40像素的二值字符图像W而言,计算其粗网格特征FW
F W ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W ( x 2 , y 2 ) , i2=1,2,...32,
其中,
Figure BSA00000492841100033
m 2 = i 2 - n 2 4 + 1 ,
Fw(i2)是粗网格特征Fw的第i2个分量,m2和n2分别是Fw(i2)所对应的块的横、纵坐标,W(x2,y2)是字符图像W中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
步骤3.2:计算最小错误率贝叶斯分类器H(W)中所有判别函数Hj(W)的值,取最大的判别函数值HM(W)所对应的字符类别作为该二值字符图像W的类别,
HM(W)=max(Hj(W)),j=1,2,...34,
数值M与34种字符类别的对应关系为:M分别为1~10时按顺序对应于数字0~9,M分别为11~18时按顺序对应于字母A~H,M分别为19~23时按顺序对应于字母J~N,M分别为24~34时按顺序对应于字母P~Z,
如果与数值M所对应的字符类别是集合{D,0,Q,8,B,2,Z,5,S,4,A}中的一种,则表明第一级分类得到的字符类别属于相似字符,可能存在一定的错误,转到步骤4进行第二级分类,否则表明第一级分类得到的字符类别不属于相似字符,以之作为该字符的最终分类结果,结束分类,步骤4相似字符的第二级分类
以第一级分类结果为基础,对易混淆的5组字符提取局部特征进行第二级分类,
(1)“D”、“0”和“Q”
如果第一级分类得到的字符类别为“D”、“0”和“Q”,则计算字符图像W的局部特征T1和T2
T 1 = Σ x = 60 80 Σ y = 20 30 W ( x , y ) ,
T 2 = Σ x = 1 12 Σ y = 2 8 W ( x , y ) + Σ x = 73 80 Σ y = 2 8 W ( x , y ) ,
利用局部特征T1和T2对字符图像W进行第二级分类:
如果T1≥195,则识别字符图像W为字母“Q”,如果T1<195且T2<73则识别字符图像W为数字“0”,如果T1<195且T2≥73则识别字符图像W为字母“D”,
(2)“8”和“B”
如果第一级分类得到的字符类别为“8”和“B”,则计算字符图像W的局部特征T3、T4和T5
T 3 = Σ x = 75 80 Σ y = 2 8 W ( x , y ) ,
T 4 = Σ x = 1 5 Σ y = 2 8 W ( x , y ) ,
T 5 = Σ x = 38 42 Σ y = 1 5 W ( x , y ) ,
利用局部特征T3、T4和T5对字符图像W进行第二级分类:
如果T3<24、T4<20且T5<20,则识别字符图像W为数字“8”,否则识别字符图像W为字母“B”,
(3)“2”和“Z”
如果第一级分类得到的字符类别为“2”和“Z”,则计算字符图像W的局部特征T6和T7
T 6 = Σ x = 1 8 Σ y = 1 40 W ( x , y ) ,
T 7 = Σ x = 15 25 Σ y = 1 10 W ( x , y ) ,
利用局部特征T6和T7对字符图像W进行第二级分类:
如果T6≤260且T7≥15,则识别字符图像W为数字“2”,否则识别字符图像W为字母“Z”,
(4)“5”和“S”
如果第一级分类得到的字符类别为“5”和“S”,则计算字符图像W的局部特征T8和T9
T 8 = Σ x = 1 10 Σ y = 1 40 W ( x , y ) ,
T 9 = Σ x = 1 40 Σ y = 1 10 W ( x , y ) ,
利用局部特征T8和T9对字符图像W进行第二级分类:
如果T7≥290且T9≥270,则识别字符图像W为数字“5”,否则识别字符图像W为字母“S”,
(5)“4”和“A”
如果第一级分类得到的字符类别为“4”和“A”,则计算字符图像W的局部特征T10
T 10 = Σ x = 70 80 Σ y = 1 15 W ( x , y ) ,
利用局部特征T10对字符图像W进行第二级分类:
如果T10<180,则识别字符图像W为数字“4”,否则识别字符图像W为字母“A”。
有益效果
1.识别速度快。直接根据识别样本计算判别函数的参数,并设计最小错误率贝叶斯分类器,无需像神经网络训练一样进行复杂、重复的参数调整,而且分类器所用的判别函数简单,能够节省很多的计算时间。
2.识别准确性高。首先利用基于最小错误率的贝叶斯分类器进行第一级分类,然后在第一级分类的基础上,针对可能出现的相近字符分别利用局部特征进行第二级分类,提高了相相近字符的识别准确性。
附图说明
图1是基于最小错误率贝叶斯分类器的车牌数字及字母识别方法流程图。
图2是需要进行字符识别的车牌P。
图3是车牌的第二个字符W2
图4是车牌的第三个字符W3
图5是车牌的第四个字符W4
图6是车牌的第五个字符W5
图7是车牌的第六个字符W6
图8是车牌的第七个字符W7
具体实施方式
本发明的具体实例结合图5-16说明如下:
需要进行字符识别的车牌图像P如图2所示,对车牌图像P进行二值化、字符分割及字符大小归一化,得到车牌的第2-7个二值字符图像为W2-W7,分别如图3-8所示,
步骤1建立各类别字符的识别样本库
根据中华人民共和国机动车号牌标准(GA36-2007),车牌中用到所有的数字字符及除I和O之外的所有字母字符,总共34类字符,针对第j类字符Lj建立样本数量为Nj的字符样本库Sj,得到样本总数量为N的总样本库S,
S={Sj},j=1,2,...34,
Sj={Wjk},k=1,2,...Nj
N = Σ j = 1 34 N j ,
式中,Wjk是大小被归一化为80×40像素的二值化字符图像,表示第j类字符的样本库Sj中第k个样本,字符样本库S1~S10按顺序对应于数字0~9,字符样本库S11~S18按顺序对应于字母A~H,字符样本库S19~S23按顺序对应于字母J~N,字符样本库S24~S34按顺序对应于字母P~Z,Nj=50,N=1700,
步骤2最小错误率贝叶斯分类器的设计
步骤2.1:对第j类字符而言,计算其字符样本库Sj中所有样本Wjk的粗网格特征
F W jk ( i 1 ) = Σ x 1 = ( m 1 - 1 ) × 10 + 1 m 1 × 10 Σ y 1 = ( n 1 - 1 ) × 10 + 1 n 1 × 10 W jk ( x 1 , y 1 ) , i1=1,2,...32,
其中, m 1 = i 1 - n 1 4 + 1 ,
Figure BSA00000492841100066
是粗网格特征
Figure BSA00000492841100067
的第i1个分量,m1和n1分别是
Figure BSA00000492841100068
所对应的块的横、纵坐标,Wjk(x1,y1)是字符图像Wjk中坐标为(x1,y1)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i1,4)为i1除以4之后的余数,
步骤2.2:计算字符样本库Sj中所有样本Wjk的粗网格特征均值
Figure BSA00000492841100069
F j ‾ ( i 1 ) = Σ k = 1 N j F W jk ( i 1 ) N j , i1=1,2,...32,
式中,
Figure BSA000004928411000611
是第j类字符Lj的粗网格特征均值
Figure BSA000004928411000612
的第i1个分量,
Figure BSA000004928411000613
是字符样本库Sj中第k个样本Wjk的粗网格特征
Figure BSA00000492841100071
的第i1个分量,
步骤2.3:计算字符样本库Sj中所有样本的粗网格特征的协方差矩阵Cj
C j ab = 1 N j - 1 Σ N j - 1 N 1 ( F W jk ( a ) - F j ‾ ( a ) ) ( F W jk ( b ) - F j ‾ ( b ) ) , a,b=1,2,...32,
式中,
Figure BSA00000492841100073
是协方差矩阵Cj中行、列坐标分别为a、b的元素的数值,
Figure BSA00000492841100074
是字符样本库Sj中第k个样本Wjk的粗网格特征
Figure BSA00000492841100075
的第a个分量,
Figure BSA00000492841100076
是字符样本库Sj中第k个样本Wjk的粗网格特征
Figure BSA00000492841100077
的第b个分量,
步骤2.4:计算在总样本库中第j类字符Lj的先验概率Pj
P j = N j N , j=1,2,...34,
步骤2.5:定义与第j类字符Lj相对应的判别函数Hj(W),得到最小错误率贝叶斯分类器H(W),H(W)={Hj(W)},j=1,2,...34,
H j ( W ) = - 1 2 ( F W - F j ‾ ) T C j - 1 ( F W - F j ‾ ) + ln P ( j ) - 1 2 j ln | C j | ,
式中,W是任意的大小被归一化为80×40像素的二值字符图像,FW是二值字符图像W的粗网格特征,Cj -1是协方差矩阵Cj的逆矩阵,|Cj|是协方差矩阵Cj的行列式,
步骤3基于最小错误率贝叶斯分类器的第一级分类
步骤3.1第二个字符W2的第一级分类
首先,计算第二个字符W2(如图3所示)的粗网格特征
Figure BSA000004928411000710
F w 2 ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W 2 ( x 2 , y 2 ) , i2=1,2,...32,
其中,
Figure BSA000004928411000712
m 2 = i 2 - n 2 4 + 1 ,
Figure BSA000004928411000714
是粗网格特征的第i2个分量,m2和n2分别是
Figure BSA000004928411000716
所对应的块的横、纵坐标,W2(x2,y2)是字符图像W2中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
然后,利用粗网格特征计算所有判别函数Hj(W2)的值,得到最大的判别函数值为H7(W2),
H7(W2)=max(Hj(W2)),j=1,2,...34,
判别函数H7(W)所对应的字符为“8”,即第二个字符W2在第一级分类中被识别为“8”,
步骤3.2第三个字符W3的第一级分类
首先,计算第三个字符W3(如图4所示)的粗网格特征
Figure BSA00000492841100082
F W 3 ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W 3 ( x 2 , y 2 ) , i2=1,2,...32,
其中,
Figure BSA00000492841100084
m 2 = i 2 - n 2 4 + 1 ,
是粗网格特征
Figure BSA00000492841100087
的第i2个分量,m2和n2分别是
Figure BSA00000492841100088
所对应的块的横、纵坐标,W3(x2,y2)是字符图像W3中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
然后,利用粗网格特征
Figure BSA00000492841100089
计算所有判别函数Hj(W3)的值,得到最大的判别函数值为H15(W3),
H15(W3)=max(Hj(W3)),j=1,2,...34,
判别函数H15(W)所对应的字符为“E”,即第三个字符W3在第一级分类中被识别为“E”,
步骤3.3第四个字符W4的第一级分类
首先,计算第四个字符W4(如图5所示)的粗网格特征
Figure BSA000004928411000810
F W 4 ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W 4 ( x 2 , y 2 ) , i2=1,2,...32,
其中,
Figure BSA000004928411000812
m 2 = i 2 - n 2 4 + 1 ,
Figure BSA000004928411000814
是粗网格特征
Figure BSA000004928411000815
的第i2个分量,m2和n2分别是
Figure BSA000004928411000816
所对应的块的横、纵坐标,W4(x2,y2)是字符图像W4中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
然后,利用粗网格特征计算所有判别函数Hj(W4)的值,得到最大的判别函数值为H3(W4),
H3(W4)=max(Hj(W4)),j=1,2,...34,
判别函数H3(W)所对应的字符为“4”,即第四个字符W4在第一级分类中被识别为“4”,
步骤3.4第五个字符W5的第一级分类
首先,计算第五个字符W5(如图6所示)的粗网格特征
F W 5 ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W 5 ( x 2 , y 2 ) , i2=1,2,...32,
其中, m 2 = i 2 - n 2 4 + 1 ,
是粗网格特征
Figure BSA00000492841100097
的第i2个分量,m2和n2分别是
Figure BSA00000492841100098
所对应的块的横、纵坐标,W5(x2,y2)是字符图像W5中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
然后,利用粗网格特征
Figure BSA00000492841100099
计算所有判别函数Hj(W5)的值,得到最大的判别函数值为H4(W5),
H4(W5)=max(Hj(W5)),j=1,2,...34,
判别函数H4(W5)所对应的字符为“5”,即第五个字符W5在第一级分类中被识别为“5”,
步骤3.5第六个字符W6的第一级分类
首先,计算第六个字符W6(如图7所示)的粗网格特征
Figure BSA000004928411000910
F W 6 ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W 6 ( x 2 , y 2 ) , i2=1,2,...32,
其中,
Figure BSA000004928411000912
m 2 = i 2 - n 2 4 + 1 ,
Figure BSA000004928411000914
是粗网格特征
Figure BSA000004928411000915
的第i2个分量,m2和n2分别是
Figure BSA000004928411000916
所对应的块的横、纵坐标,W6(x2,y2)是字符图像W6中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
然后,利用粗网格特征
Figure BSA000004928411000917
计算所有判别函数Hj(W6)的值,得到最大的判别函数值为H5(W6),
H5(W6)=max(Hj(W6)),j=1,2,...34,
判别函数H5(W)所对应的字符为“6”,即第六个字符W2在第一级分类中被识别为“6”,
步骤3.6第七个字符W7的第一级分类
首先,计算第七个字符W7(如图8所示)的粗网格特征
Figure BSA00000492841100101
F W 7 ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W 7 ( x 2 , y 2 ) , i2=1,2,...32,
其中,
Figure BSA00000492841100103
m 2 = i 2 - n 2 4 + 1 ,
Figure BSA00000492841100105
是粗网格特征
Figure BSA00000492841100106
的第i2个分量,m2和n2分别是
Figure BSA00000492841100107
所对应的块的横、纵坐标,W7(x2,y2)是字符图像W7中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
然后,利用粗网格特征计算所有判别函数Hj(W7)的值,得到最大的判别函数值为H8(W7),
H8(W7)=max(Hj(W7)),j=1,2,...34,
判别函数H8(W)所对应的字符为“9”,即第七个字符W7在第一级分类中被识别为“9”,
经过上述步骤3.1-3.6完成了对车牌后六位字符的第一级分类,其中第二位字符W2和第四位字符W4所对应的字符类别属于集合{D,0,Q,8,B,2,Z,5,S,4,A},需要转到步骤4进行第二级分类,其他四位字符的类别不属于集合{D,0,Q,8,B,2,Z,5,S,4,A},不需进行第二级分类,以该四个类别作为该四个字符的最终分类结果,结束其分类,
步骤4相似字符的第二级分类
以第一级分类结果为基础,对第二位字符W2和第四位字符W4提取局部特征进行第二级分类,
步骤4.1对第二位字符W2进行第二级分类
第二位字符W2在第一级分类中被分类为字符“8”,字符“8”和字符“B”属于一组相近字符,这两个字符的区别主要在字符的左边缘,字符“8”的左边缘为弧线,而“B”的左边缘为直线,针对这个特点,定义字符图像W的左上角局部特征T3、左中部局部特征T4和左下角局部特征T5
T 3 = Σ x = 75 80 Σ y = 2 8 W ( x , y ) ,
T 4 = Σ x = 1 5 Σ y = 2 8 W ( x , y ) ,
T 5 = Σ x = 38 42 Σ y = 1 5 W ( x , y ) ,
经过对大量车牌字符的统计实验,取分类临界线为T3=24,T4=20,T5=20,
按上式计算第二位字符图像W2的局部特征T3、T4和T5,得到T3=27、T4=25和T5=21,由于T3≥24、T4≥20且T5≥20,识别第二位字符W2为字母“B”,
步骤4.2对第四位字符W4进行第二级分类
第四位字符W4在第一级分类中被分类为字符“4”,字符“4”和字符“A”属于一组相近字符,这两个字符的区别主要在字符的左下角,字符“4”左下角没有白色像素,而字符“A”左下角的白色像素较多,针对这个特点,定义字符图像W的左下角局部特征T10
T 10 = Σ x = 70 80 Σ y = 1 15 W ( x , y ) ,
经过对大量车牌字符的统计实验,取分类临界线为T10=180,
按上式计算第四位字符图像W4的局部特征T10,得到T10=136,由于T10<180,则识别第四位字符W4为数字“4”,
最终的识别结果为:第二位字符W2被设别为“B”,第三位字符W3被设别为“E”,第四位字符W4被设别为“4”,第五位字符W5被设别为“5”,第六位字符W6被设别为“6”,第七位字符W7被设别为“9”,从图3-8可见,识别结果完全正确。

Claims (1)

1.一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,其特征在于:
步骤1建立各类别字符的识别样本库
根据中华人民共和国机动车号牌标准GA36-2007,车牌中用到所有的数字字符及除I和O之外的所有字母字符,总共34类字符,针对第j类字符Lj建立样本数量为Nj的字符样本库Sj,得到样本总数量为N的总样本库S,
S={Sj},j=1,2,...34,
Sj={Wjk},k=1,2,...Nj
N = Σ j = 1 34 N j ,
式中,Wjk是大小被归一化为80×40像素的二值化字符图像,表示第j类字符的样本库Sj中第k个样本,字符样本库S1~S10按顺序对应于数字0~9,字符样本库S11~S18按顺序对应于字母A~H,字符样本库S19~S23按顺序对应于字母J~N,字符样本库S24~S34按顺序对应于字母P~Z,
步骤2最小错误率贝叶斯分类器的设计
步骤2.1:对第j类字符而言,计算其字符样本库Sj中所有样本Wjk的粗网格特征
Figure FDA00002443498800012
F w jk ( i 1 ) = Σ x 1 = ( m 1 - 1 ) × 10 + 1 m 1 × 10 Σ y 1 = ( n 1 - 1 ) × 10 + 1 n 1 × 10 W jk ( x 1 , y 1 ) , i 1 = 1,2 , . . . 32 ,
其中,
Figure FDA00002443498800014
m 1 = i 1 - n 1 4 + 1 ,
是粗网格特征
Figure FDA00002443498800017
的第i1个分量,m1和n1分别是
Figure FDA00002443498800018
所对应的块的横、纵坐标,Wjk(x1,y1)是字符图像Wjk中坐标为(x1,y1)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i1,4)为i1除以4之后的余数,
步骤2.2:计算字符样本库Sj中所有样本Wjk的粗网格特征均值
F j ‾ ( i 1 ) = Σ k = 1 N j F w jk ( i 1 ) N j , i 1 = 1,2 , . . . 32 ,
式中,
Figure FDA000024434988000111
是第j类字符Lj的粗网格特征均值的第i1个分量,
Figure FDA000024434988000113
是字符样本库Sj中第k个样本Wjk的粗网格特征的第i1个分量,
步骤2.3:计算字符样本库Sj中所有样本的粗网格特征的协方差矩阵Cj
C j ab = 1 N j - 1 Σ k = 1 N j ( F w jk ( a ) - F j ‾ ( a ) ) ( F w jk ( b ) - F j ‾ ( b ) ) , a , b = 1,2 , . . . 32 ,
式中,
Figure FDA00002443498800023
是协方差矩阵Cj中行、列坐标分别为a、b的元素的数值,
Figure FDA00002443498800024
是字符样本库Sj中第k个样本Wjk的粗网格特征的第a个分量,
Figure FDA00002443498800026
是字符样本库Sj中第k个样本Wjk的粗网格特征的第b个分量,
步骤2.4:计算在总样本库中第j类字符Lj的先验概率Pj
P j = N j N , j = 1,2 , . . . 34 ,
步骤2.5:定义与第j类字符Lj相对应的判别函数Hj(W),得到最小错误率贝叶斯分类器H(W),
H(W)={Hj(W)},j=1,2,...34,
H j ( W ) = - 1 2 ( F W - F j ‾ ) T C j - 1 ( F W - F j ‾ ) + ln P ( j ) - 1 2 j ln | C j | ,
式中,W是任意的大小被归一化为80×40像素的二值字符图像,FW是二值字符图像W的粗网格特征,Cj -1是协方差矩阵Cj的逆矩阵,|Cj|是协方差矩阵Cj的行列式,
步骤3基于最小错误率贝叶斯分类器的第一级分类
步骤3.1:对需要进行识别的大小被归一化为80×40像素的二值字符图像W而言,计算其粗网格特征FW
F w ( i 2 ) = Σ x 2 = ( m 2 - 1 ) × 10 + 1 m 2 × 10 Σ y 2 = ( n 2 - 1 ) × 10 + 1 n 2 × 10 W ( x 2 , y 2 ) , i 2 = 1,2 , . . . 32 ,
其中,
Figure FDA000024434988000211
m 2 = i 2 - n 2 4 + 1 ,
Fw(i2)是粗网格特征Fw的第i2个分量,m2和n2分别是Fw(i2)所对应的块的横、纵坐标,W(x2,y2)是字符图像W中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,
步骤3.2:计算最小错误率贝叶斯分类器H(W)中所有判别函数Hj(W)的值,取最大的判别函数值HM(W)所对应的字符类别作为该二值字符图像W的类别,
HM(W)=max(Hj(W)),j=1,2,...34,
数值M与34种字符类别的对应关系为:M分别为1~10时按顺序对应于数字0~9,M分别为11~18时按顺序对应于字母A~H,M分别为19~23时按顺序对应于字母J~N,M分别为24~34时按顺序对应于字母P~Z,
如果与数值M所对应的字符类别是集合{D,0,Q,8,B,2,Z,5,S,4,A}中的一种,则表明第一级分类得到的字符类别属于相似字符,可能存在错误,转到步骤4进行第二级分类,否则表明第一级分类得到的字符类别不属于相似字符,以之作为该字符的最终分类结果,结束分类,
步骤4相似字符的第二级分类
以第一级分类结果为基础,对易混淆的5组字符提取局部特征进行第二级分类,
(1)“D”、“0”和“Q”
如果第一级分类得到的字符类别为“D”、“0”和“Q”,则计算字符图像W的局部特征T1和T2
T 1 = Σ x = 60 80 Σ y = 20 30 W ( x , y ) ,
T 2 = Σ x = 1 12 Σ y = 2 8 W ( x , y ) + Σ x = 73 80 Σ y = 2 8 W ( x , y ) .
利用局部特征T1和T2对字符图像W进行第二级分类:
如果T1≥195,则识别字符图像W为字母“Q”,如果T1<195且T2<73则识别字符图像W为数字“0”,如果T1<195且T2≥73则识别字符图像W为字母“D”,
(2)“8”和“B”
如果第一级分类得到的字符类别为“8”和“B”,则计算字符图像W的局部特征T3、T4和T5
T 3 = &Sigma; x = 75 80 &Sigma; y = 2 8 W ( x , y ) ,
T 4 = &Sigma; x = 1 5 &Sigma; y = 2 8 W ( x , y ) ,
T 5 = &Sigma; x = 38 42 &Sigma; y = 1 5 W ( x , y ) ,
利用局部特征T3、T4和T5对字符图像W进行第二级分类:
如果T3<24、T4<20且T5<20,则识别字符图像W为数字“8”,否则识别字符图像W为字母“B”,
(3)“2”和“Z”
如果第一级分类得到的字符类别为“2”和“Z”,则计算字符图像W的局部特征T6和T7
T 6 = &Sigma; x = 1 8 &Sigma; y = 1 40 W ( x , y ) ,
T 7 = &Sigma; x = 15 25 &Sigma; y = 1 10 W ( x , y ) ,
利用局部特征T6和T7对字符图像W进行第二级分类:
如果T6≤260且T7≥15,则识别字符图像W为数字“2”,否则识别字符图像W为字母“Z”,
(4)“5”和“S”
如果第一级分类得到的字符类别为“5”和“S”,则计算字符图像W的局部特征T8和T9
T 8 = &Sigma; x = 1 10 &Sigma; y = 1 40 W ( x , y ) ,
T 9 = &Sigma; x = 1 40 &Sigma; y = 1 10 W ( x , y ) ,
利用局部特征T8和T9对字符图像W进行第二级分类:
如果T7≥290且T9≥270,则识别字符图像W为数字“5”,否则识别字符图像W为字母“S”,
(5)“4”和“A”
如果第一级分类得到的字符类别为“4”和“A”,则计算字符图像W的局部特征T10
T 10 = &Sigma; x = 70 80 &Sigma; y = 1 15 W ( x , y ) ,
利用局部特征T10对字符图像W进行第二级分类:
如果T10<180,则识别字符图像W为数字“4”,否则识别字符图像W为字母“A”。
CN 201110120361 2011-05-09 2011-05-09 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法 Expired - Fee Related CN102184412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110120361 CN102184412B (zh) 2011-05-09 2011-05-09 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110120361 CN102184412B (zh) 2011-05-09 2011-05-09 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法

Publications (2)

Publication Number Publication Date
CN102184412A CN102184412A (zh) 2011-09-14
CN102184412B true CN102184412B (zh) 2013-05-01

Family

ID=44570585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110120361 Expired - Fee Related CN102184412B (zh) 2011-05-09 2011-05-09 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法

Country Status (1)

Country Link
CN (1) CN102184412B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8565486B2 (en) * 2012-01-05 2013-10-22 Gentex Corporation Bayesian classifier system using a non-linear probability function and method thereof
CN103324628B (zh) * 2012-03-21 2016-06-08 腾讯科技(深圳)有限公司 一种针对发布文本的行业分类方法和系统
CN103530600B (zh) * 2013-06-06 2016-08-24 东软集团股份有限公司 复杂光照下的车牌识别方法及系统
CN103984943B (zh) * 2014-05-30 2018-06-19 厦门大学 一种基于贝叶斯概率框架的场景文本识别方法
CN104156701A (zh) * 2014-07-26 2014-11-19 佳都新太科技股份有限公司 一种基于决策树和svm的车牌相似字符识别方法
CN109034166B (zh) * 2017-06-08 2021-09-24 北京君正集成电路股份有限公司 易混淆字符识别模型训练方法和装置
CN109753967A (zh) * 2018-12-29 2019-05-14 北京师范大学 一种图片文字识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1684096A (zh) * 2004-04-16 2005-10-19 中国科学院自动化研究所 门牌号自动识别系统及方法
CN101097605A (zh) * 2006-06-30 2008-01-02 河南工业大学 Etc电子不停车收费中的车辆身份识别系统
CN101408933A (zh) * 2008-05-21 2009-04-15 浙江师范大学 基于粗网格特征提取和bp神经网络的车牌字符识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6026177A (en) * 1995-08-29 2000-02-15 The Hong Kong University Of Science & Technology Method for identifying a sequence of alphanumeric characters

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1684096A (zh) * 2004-04-16 2005-10-19 中国科学院自动化研究所 门牌号自动识别系统及方法
CN101097605A (zh) * 2006-06-30 2008-01-02 河南工业大学 Etc电子不停车收费中的车辆身份识别系统
CN101408933A (zh) * 2008-05-21 2009-04-15 浙江师范大学 基于粗网格特征提取和bp神经网络的车牌字符识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
US 6,026,177 A,2000.02.15,
路小波,凌小静,黄卫.一种基于模板匹配的汽车牌照识别方法.《交通与计算机》.2004,第22卷(第6期), *

Also Published As

Publication number Publication date
CN102184412A (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
CN102184412B (zh) 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法
CN101859382B (zh) 一种基于最大稳定极值区域的车牌检测与识别的方法
Han et al. Small-scale pedestrian detection based on deep neural network
CN105335710A (zh) 一种基于多级分类器的精细车辆型号识别方法
Xie et al. A robust license plate detection and character recognition algorithm based on a combined feature extraction model and BPNN
CN107506763A (zh) 一种基于卷积神经网络的多尺度车牌精准定位方法
CN103971097B (zh) 一种基于多尺度笔画模型的车牌识别方法与系统
CN105938560A (zh) 一种基于卷积神经网络的车型精细分类系统
CN107862340A (zh) 一种车型识别方法及装置
CN105868700A (zh) 一种基于监控视频的车型识别与跟踪方法及系统
Kuang et al. Feature selection based on tensor decomposition and object proposal for night-time multiclass vehicle detection
CN108830254B (zh) 一种基于数据均衡策略和密集注意网络的细粒度车型检测与识别方法
CN109635784A (zh) 基于改进的卷积神经网络的交通标志识别方法
Al Faqheri et al. A real-time Malaysian automatic license plate recognition (M-ALPR) using hybrid fuzzy
CN103164697B (zh) 一种处理时间与识别精度自适应的车牌识别方法
Yao et al. Coupled multivehicle detection and classification with prior objectness measure
Soin et al. Moving vehicle detection using deep neural network
CN111428735B (zh) 一种基于迁移学习深层网络融合模型的货车品牌分类方法
Chaabouni et al. Static and dynamic features for writer identification based on multi-fractals.
CN109800762A (zh) 一种基于动态匹配因子的模糊车牌识别算法
Peng et al. Vehicle classification using sparse coding and spatial pyramid matching
Chen et al. Vehicle type classification based on convolutional neural network
Sharma et al. Deep Learning and SVM-Based Approach for Indian Licence Plate Character Recognition.
Li et al. A novel approach for vehicle detection using an AND–OR-graph-based multiscale model
CN108647679B (zh) 一种基于车窗粗定位的车标识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Lu Xiaobo

Inventor after: Zhu Zhou

Inventor after: Yang Junfei

Inventor after: Xiong Yang

Inventor before: Lu Xiaobo

Inventor before: Zhu Zhou

Inventor before: Yang Junfei

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: LU XIAOBO ZHU ZHOU YANG JUNFEI TO: LU XIAOBO ZHU ZHOU YANG JUNFEI XIONG YANG

GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130501

Termination date: 20160509