CN102375991A - 分类器训练方法和装置以及字符识别方法和装置 - Google Patents

分类器训练方法和装置以及字符识别方法和装置 Download PDF

Info

Publication number
CN102375991A
CN102375991A CN2010102620706A CN201010262070A CN102375991A CN 102375991 A CN102375991 A CN 102375991A CN 2010102620706 A CN2010102620706 A CN 2010102620706A CN 201010262070 A CN201010262070 A CN 201010262070A CN 102375991 A CN102375991 A CN 102375991A
Authority
CN
China
Prior art keywords
search
chinese character
region
band
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102620706A
Other languages
English (en)
Other versions
CN102375991B (zh
Inventor
邓亚峰
王俊艳
黄英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Zhongxing Micro Artificial Intelligence Chip Technology Co Ltd
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CN201010262070.6A priority Critical patent/CN102375991B/zh
Publication of CN102375991A publication Critical patent/CN102375991A/zh
Application granted granted Critical
Publication of CN102375991B publication Critical patent/CN102375991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种分类器训练方法和装置以及字符识别方法和装置。本发明利用基于宏块的分块LBP特征来实现字符识别,其中,分块LBP特征针对的不是像素点、而是位置区域,且每个位置区域的分块LBP特征中不但包括该位置区域的纹理特征,还进一步包括以该位置区域若干方向上的多个邻域的纹理特征,因而每个位置区域的分块LBP特征能够反映出包含具有一定宽度、以及较长延伸距离的字符笔画的较大范围内的特征,相比于利用仅针对像素点的LBP特征的方案,能够提高字符识别的准确性。

Description

分类器训练方法和装置以及字符识别方法和装置
技术领域
本发明涉及模式识别技术,特别涉及用于字符识别的一种分类器训练方法和一种分类器训练装置、以及一种字符识别方法、一种字符识别装置。
背景技术
车牌识别技术是一种字符识别技术,其属于智能交通领域的一项重要技术,其在路口收费、小区进出控制、以及自动违章车辆检测等领域具有重要的实用价值。
车牌识别主要是对车牌图像中例如汉字、数字、以及字母等车牌字符的识别,而由于车牌字符均是由在不同方向延伸的笔画所构成,因而在对车牌图像的各位置处进行识别时,除了要考虑当前位置处的特征之外,还需要考虑当前位置处的邻域特征。
具体说,现有技术中常采用局部二值模式(Local Binary Pattern,LBP)特征作为车牌图像各位置处的特征,LBP特征通过对当前位置处的像素点与邻域像素的取值关系进行编码,从而获得当前位置处的像素点与其邻域像素点所构成的位置区域的纹理特征,进而基于各位置区域的纹理特征来识别车牌图像中是否包含应有的车牌字符。
假定图像中像素坐标为(i,j)的像素点对应的像素值为li,j,以该像素点为中心取3×3邻域,则各像素点的像素值如下:
Figure BSA00000243552000011
则,定义像素坐标为(i,j)的像素点的LBP特征可以表示为:
Figure BSA00000243552000012
即,可以表示为二进制序列[B(i+1,j+1),B(i,j+1),B(i-1,j+1),B(i+1,j),B(i,j),B(i-1,j),B(i+1,j-1),B(i,j-1),B(i-1,j-1)];
其中, B ( i + m , j + n ) = 1 ifl ( i + m , j + n ) ≥ l ( i , j ) 0 else ;
即,如果l(i+m,j+n)≥l(i,j),则B(i+m,j+n)取1,否则,B(i+m,j+n)取0。
然而,虽然LBP特征能够一定程度上反映每个像素点的邻域特征,但由于车牌图像中的车牌字符笔画都具有一定的宽度、以及较长的延伸距离,因而仅考虑3×3邻域的LBP特征无法反映出包含有字符笔画的较大范围内的特征,从而导致例如车牌识别等字符识别技术的准确性不高。
发明内容
有鉴于此,本发明提供了用于字符识别的一种分类器训练方法和一种分类器训练装置、以及一种字符识别方法、一种字符识别装置,能够提高字符识别的准确度。
本发明提供的一种用于字符识别的分类器训练方法,该方法分别针对每一车牌字符执行如下步骤:
a、对包含有当前车牌字符的各正样本图像、以及未包含当前车牌字符的反样本图像进行尺度归一化;
b、从尺度归一化后的各正、反样本图像中提取各位置区域的分块区域二值化模式LBP特征,得到各正、反样本图像的分块LBP特征向量;
c、利用各正、反样本图像的分块LBP特征向量训练当前车牌字符的分类器,以使该分类器可依据输入图像的分块LBP特征向量得到该输入图像中包含有当前车牌字符的置信度;
其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征。
每个位置区域r(0)i,j为矩形区域,每个位置区域r(0)i,j的邻域为该位置区域四边相邻的位置区域r(1)i,j~r(4)i,j,i表示位置区域所在行、j表示位置区域所在列,i、j均大于1;
且,每个位置区域r(0)i,j的分块LBP特征
Figure BSA00000243552000031
如果r(n)i,j中的像素值之和大于预定阈值则MB_B(n)i,j取1,否则MB_B(n)i,j取0。
针对每一车牌字符的所述步骤c具体包括如下步骤:
c0、给定样本集LB={(xp,yp)},其中,xp为第p个样本图像中提取出的分块LBP特征向量;yp为表示第p个样本图像为正样本图像还是反样本图像的样本标识,yp∈{+1,-1};p大于等于1且小于等于正、反样本图像总数M;
c1、设置每个分块LBP样本特征向量xp的初始权重
Figure BSA00000243552000032
c2、对每个分块LBP样本特征向量xp进行T轮迭代,其中,在第t轮迭代过程中,先依据以分块LBP样本特征向量xp所有可能的取值为横坐标、以分块LBP样本特征向量xp的权重累积值为纵坐标的第t轮离散分布Dt,为每个分块LBP样本特征向量xp构造一弱分类器ht(xp),然后从设定的所有弱分类器中选择可使正反样本分类误差最小的一个作为第t次迭代的最优弱分类器ht(Xp),再利用每个分块LBP样本特征向量xp的最优弱分类器ht(Xp)更新该分块LBP样本特征向量xp下一次迭代的权重,T为预先设定的迭代次数;
c3、利用T次迭代得到的所有最优弱分类器ht(Xp)计算得到表示识别结果的强分类器
Figure BSA00000243552000033
所述步骤c2在第t次迭代过程中包括如下步骤:
c20、将Dt(p)累积分布的分块LBP样本特征向量xp取值空间划分为Q个互不相交的区间;
c21、统计每一区间Xq内出现正样本的概率
Figure BSA00000243552000034
以及每
一区间Xq内出现反样本特征的概率
Figure BSA00000243552000041
c22、每一分块LBP样本特征向量xp的弱分类器ht(xp)设定为:
Figure BSA00000243552000042
ε为避免
Figure BSA00000243552000043
为0时引起数字溢出的预定系数;
c23、从设定的所有弱分类器ht(xp)中选择可使正反样本特征向量的分类误差最小的一个,作为第t次迭代的最优弱分类器ht(Xp),其中,弱分类器ht(xp)的分类误差上界
c24、通过计算来更新分块LBP样本特征向量xp下一次迭代的权重Dt+1(p)。
本发明提供的一种用于字符识别的分类器训练装置,该装置分别针对每一车牌字符包括:
对齐归一化单元,用于对包含有当前车牌字符的各正样本图像、以及未包含当前车牌字符的反样本图像进行尺度归一化;
块特征提取单元,用于从尺度归一化后的各正、反样本图像中提取各位置区域的分块区域二值化模式LBP特征,得到各正、反样本图像的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
置信度训练单元,用于利用各正、反样本图像的分块LBP特征向量训练当前车牌字符的分类器,以使该分类器可依据输入图像的分块LBP特征向量得到该输入图像中包含有当前车牌字符的置信度。
每个位置区域r(0)i,j为矩形区域,每个位置区域r(0)i,j的邻域为该位置区域四边相邻的位置区域r(1)i,j~r(4)i,j,i表示位置区域所在行、j表示位置区域所在列,i、j均大于1;
且,每个位置区域r(0)i,j的分块LBP特征
Figure BSA00000243552000051
如果r(n)i,j中的像素值之和大于预定阈值则MB_B(n)i,j取1,否则MB_B(n)i,j取0。
针对每一车牌字符的置信度训练单元包括:
样本配置模块,用于配置给定样本集LB={(xp,yp)},其中,xp为第p个样本图像中提取出的分块LBP特征向量;yp为表示第p个样本图像为正样本图像还是反样本图像的样本标识,yp∈{+1,-1};p大于等于1且小于等于正、反样本图像总数M;
权重配置模块,用于设置每个分块LBP样本特征向量xp的初始权重 D 1 ( p ) = 1 M ;
迭代处理模块,用于对每个分块LBP样本特征向量xp进行T轮迭代,其中,在第t轮迭代过程中,先依据以分块LBP样本特征向量xp所有可能的取值为横坐标、以分块LBP样本特征向量xp的权重累积值为纵坐标的第t轮离散分布Dt,为每个分块LBP样本特征向量xp构造一弱分类器ht(xp),然后从设定的所有弱分类器中选择可使正反样本分类误差最小的一个作为第t次迭代的最优弱分类器ht(Xp),再利用每个分块LBP样本特征向量xp的最优弱分类器ht(Xp)更新该分块LBP样本特征向量xp下一次迭代的权重,T为预先设定的迭代次数;
结果输出模块,用于利用T次迭代得到的所有最优弱分类器ht(Xp)计算得到表示识别结果的强分类器
Figure BSA00000243552000053
迭代处理模块包括:
区间划分子模块,用于将Dt(p)累积分布的分块LBP样本特征向量xp取值空间划分为Q个互不相交的区间;
概率统计子模块,用于统计每一区间Xq内出现正样本的概率
Figure BSA00000243552000061
以及每一区间Xq内出现反样本特征的概率 W - 1 q = Σ i : x p ∈ X q ∩ y p = - 1 D t ( p ) ;
分类器设定子模块,用于将每一分块LBP样本特征向量xp的弱分类器ht(xp)设定为:ε为避免
Figure BSA00000243552000064
为0时引起数字溢出的预定系数;
分类器选择子模块,用于从设定的所有弱分类器ht(xp)中选择可使正反样本特征向量的分类误差最小的一个,作为第t次迭代的最优弱分类器ht(Xp),其中,弱分类器ht(xp)的分类误差上界
Figure BSA00000243552000065
权重更新子模块,通过计算
Figure BSA00000243552000066
来更新分块LBP样本特征向量xp下一次迭代的权重Dt+1(p)。
本发明提供的一种字符识别方法,包括:
从输入图像各字符搜索区域中的各位置区域提取分块区域二值化模式LBP特征,得到各字符搜索区域的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
利用前述的训练方法得到的分别针对各车牌字符的分类器,得到输入图像中各字符搜索区域分别针对各车牌字符的置信度;
依据各字符搜索区域所分别对应的针对各车牌字符的置信度,得到该输入图像中各字符搜索区域所包含的车牌字符。
所述字符为车牌字符并包括汉字、字母、以及数字,字符搜索区域包括汉字搜索区域、字母搜索区域、以及数字搜索区域;
该方法先从汉字搜索区域提取得到分块LBP特征向量、利用前述的训练方法得到的分别针对各汉字的分类器得到汉字搜索区域针对各汉字的置信度、以及依据汉字搜索区域的置信度得到汉字搜索区域所包含的汉字;然后,再利用汉字搜索区域定位得到字母搜索区域和数字搜索区域,并分别从字母搜索区域和数字搜索搜索区域提取得到分块LBP特征向量、前述的训练方法得到的分别针对各字母和数字的分类器分别得到字母搜索区域针对各字母的置信度和各数字搜索区域针对各数字的置信度、以及依据字母搜索区域和数字搜索区域的置信度得到字母搜索区域包含的字母和数字搜索区域包含的数字。
该方法针对汉字搜索区域、字母搜索区域、数字搜索区域,分别选取大于预定阈值的最大置信度所对应的汉字、字母、数字作为汉字搜索区域、字母搜索区域、数字搜索区域分别包含的汉字、字母、数字。
该方法针对汉字搜索区域,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;针对字母搜索区域、数字搜索区域,分别选取同时满足置信度、以及与汉字之间距离最优的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
同时满足置信度、以及与汉字之间距离最优为
Figure BSA00000243552000071
最大,其中:
表示字母搜索区域或数字搜索区域在车牌中的位置排列序号,η(L|μ,σ)为第m个字母搜索区域中的字母、或第m个数字搜索区域中的数字与汉字之间归一化距离L符合高斯分布模型η(μ,σ)的概率值,高斯分布模型η(μ,σ)预先统计得到,
Figure BSA00000243552000073
为第m个字母搜索区域针对任意字母的置信度、或第m个数字搜索区域针对任意数字的置信度。
本发明提供的一种字符识别装置,包括:
特征提取单元,用于从输入图像各字符搜索区域中的各位置区域提取分块区域二值化模式LBP特征,得到各字符搜索区域的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
由前述的训练装置训练得到的分别针对各车牌字符的若干分类器,每一分类器用于产生输入图像中各字符搜索区域针对该分类器所对应车牌字符的置信度;
结果判定单元,用于依据各字符搜索区域所分别对应的针对各车牌字符的置信度,得到该输入图像中各字符搜索区域所包含的车牌字符。
所述字符为车牌字符并包括汉字、字母、以及数字,字符搜索区域包括汉字搜索区域、字母搜索区域、以及数字搜索区域;
特征提取单元包括针对汉字搜索区域的第一特征提取子单元、以及针对字母搜索区域和数字搜索区域的第二特征提取子单元;
结果判定单元包括分别针对汉字搜索区域的第一结果判定子单元、以及针对字母搜索区域和数字搜索区域的第二结果判定子单元;
且,针对汉字搜索区域的第一结果判定子单元在得到汉字搜索区域包含有对应汉字的分类结果后,进一步利用汉字搜索区域定位得到字母搜索区域和数字搜索区域,并触发针对字母搜索区域和数字搜索区域的第二特征提取子单元和第二结果判定子单元。
针对汉字搜索区域的第一结果判定子单元,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;
针对字母搜索区域和数字搜索区域的第二结果判定子单元,分别选取大于预定阈值的最大置信度所对应的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
针对汉字搜索区域的第一结果判定子单元,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;
针对字母搜索区域和数字搜索区域的第二结果判定子单元,分别选取同时满足置信度、以及与汉字之间距离最优的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
同时满足置信度、以及与汉字之间距离最优为
Figure BSA00000243552000081
最大,其中:
表示字母搜索区域或数字搜索区域在车牌中的位置序号,η(L|μ,σ)为第m个字母搜索区域中的字母、或第m个数字搜索区域中的数字与汉字之间归一化距离L符合高斯分布模型η(μ,σ)的概率值,高斯分布模型η(μ,σ)预先统计得到,
Figure BSA00000243552000091
为第m个字母搜索区域针对任意字母的置信度、或第m个数字搜索区域针对任意数字的置信度。
由上述技术方案可见,本发明利用基于宏块的分块LBP特征来实现字符识别,其中,分块LBP特征针对的不是像素点、而是位置区域,且每个位置区域的分块LBP特征中不但包括该位置区域的纹理特征,还进一步包括以该位置区域若干方向上的多个邻域的纹理特征,因而每个位置区域的分块LBP特征能够反映出包含具有一定宽度、以及较长延伸距离的字符笔画的较大范围内的特征,相比于现有技术中利用仅针对像素点的LBP特征的方案,能够提高字符识别的准确性。
此外,本发明还可以先识别车牌字符中的汉字,只有在识别出汉字之后,再依据识别出的汉字位置定位其他字符的搜索位置、并进行识别,从而能够利用汉字的定位提高识别速度、并避免不必要的处理过程。
附图说明
图1为本发明实施例中基于宏块的分块LBP特征所对应的位置区域及邻域的一种实例示意图;
图2为本发明实施例中基于宏块的分块LBP特征所对应的位置区域及邻域的另一种实例示意图;
图3为本发明实施例中用于字符识别的分类器训练方法的流程示意图;
图4为本发明实施例中字符识别方法的流程示意图;
图5为本发明实施例中用于字符识别的分类器训练装置的结构示意图;
图6为本发明实施例中字符识别装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
在本实施例中,为了更好地鉴别车牌图像中的车牌字符的笔画走向,提出了一种改进的基于宏块的分块LBP特征,该分块LBP特征针对的不是像素点、而是位置区域,每个位置区域的分块LBP特征中不但包括该位置区域的纹理特征,还进一步包括以该位置区域为中心、并在该位置区域若干方向上的多个邻域的纹理特征,从而,每个位置区域的分块LBP特征能够反映出包含具有一定宽度、以及较长延伸距离的字符笔画的较大范围内的特征。
参见图1,假设每个位置区域r(0)i,j为Wb×Hb的矩形区域,Wb、Hb均为大于等于2的正整数,且Wb与Hb可以相同也可以不同,每个位置区域r(0)i,j的邻域为该位置区域r(0)i,j四边相邻的位置区域r(1)i,j~r(4)i,j,i表示位置区域所在行、j表示位置区域所在列,i大于1且小于行总数,j大于1且小于列总数;
那么,每个位置区域r(0)i,j的分块LBP特征MB_LBPi,j可表示为:
Figure BSA00000243552000101
即,MB_LBPi,j可以表示为二进制序列[MB_B(0)i,j,MB_B(1)i,j,MB_B(2)i,j,MB_B(3)i,j,MB_B(4)i,j],MB_B(0)i,j表示位置区域r(0)i,j的纹理特征,MB_B(1)i,j~MB_B(4)i,j则表示位置区域r(0)i,j的四个方向上的多个邻域r(1)i,j~r(4)i,j的纹理特征;当然,上述二进制序列中各元素也可以采用其他顺序排列。
其中,在车牌识别等字符识别的实际应用中,由于例如车牌图像等包含有字符的图像的背景部分通常为暗色的像素值较低的像素点、字符部分通常为两色的像素值较高的像素点,因而,纹理特征
Figure BSA00000243552000102
即,如果r(n)i,j中的像素值之和大于预定阈值T(车牌图像中经常为暗底色、亮字符),则MB_B(n)i,j取1,表示位置区域r(n)内包含车牌字符的笔画像素;否则MB_B(n)i,j取0,表示位置区域r(n)内没有车牌字符的笔画像素。即,MB_LBPi,j的最大取值为31、最小取值为0。
假设车牌字符的笔画覆盖了r(0)i,j、以及r(1)i,j和r(3)i,j,则MB_B(0)i,j、MB_B(1)i,j、MB_B(3)i,j取值为1,MB_B(2)i,j、MB_B(4)i,j取值为0,即MB_LBPi,j=11010=26。
实际应用中,还可以按照如图2所示的方式,选择位置区域r(0)i,j四角相邻的位置区域r(1)i,j~r(4)i,j;或者,只要能够体现车牌字符笔画走向的其他方式选择邻域。
需要说明的是,本实施例中所使用的n、i、j等标记,与背景技术部分出现的标记无关。
下面,先对本实施例中用于字符识别的分类器训练方法、以及字符识别方法进行详细说明。
图3为本发明实施例中用于字符识别的分类器训练方法的流程示意图。如图3所示,为了将一个车牌字符与多个车牌字符之间的多类分类问题,转换为每个车牌字符是否为真的两类分类问题,本发明实施例中用于字符识别的分类器训练方法分别针对每一车牌字符执行如下步骤:
步骤301,对包含有当前车牌字符的各正样本图像、以及未包含当前车牌字符的反样本图像进行尺度归一化。
步骤302,从尺度归一化后的各正、反样本图像中提取各位置区域的分块LBP特征,得到各正、反样本图像的分块LBP特征向量,分块LBP特征向量为一个二进制特征向量,分块LBP特征向量也可以称之为分块LBP特征图像。
本步骤中,各位置区域可以紧密相邻、也可以部分重叠、还可以间隔预定的间隙,实际应用中可依据需要确定各位置区域之间的位置关系。
步骤303,利用各正、反样本图像的分块LBP特征向量训练当前车牌字符的分类器,以使该分类器可依据输入图像的分块LBP特征向量得到该输入图像中包含有当前车牌字符的置信度。
具体说,本步骤中的处理过程可以包括:
1)给定样本集LB={(xp,yp)},xp为第p个样本图像中提取出的分块LBP特征向量,xp的维数、即分块LBP特征向量的维数,取决于第p个样本图像中所提取出的分块LBP特征总数;yp为表示第p个样本图像为正样本图像还是反样本图像的样本标识,yp∈{+1,-1}、第p个样本图像为正样本图像、即xp为正样本特征向量时,yp取+1,第p个样本图像为反样本图像、即xp为反样本特征向量时,yp取-1;p大于等于1且小于等于正、反样本图像总数M,M为大于1的正整数;
2)设置每个分块LBP样本特征向量xp的初始权重
Figure BSA00000243552000121
这里设置的权重可以看作是分块LBP样本特征向量xp出现的概率值;
3)对每个分块LBP样本特征向量xp进行T轮迭代、T为预先设定的迭代次数,在第t轮迭代过程中:
3.1)依据以分块LBP样本特征向量xp所有可能的取值为横坐标、以分块LBP样本特征向量xp的权重累积值为纵坐标的第t轮离散分布Dt,为每个分块LBP样本特征向量xp构造一弱分类器ht(xp),ht(xp)表示基于对应的分块LBP样本特征向量xp取值可确定为真的概率、即对应的分块LBP样本特征向量xp属于当前车牌字符对应位置的置信度;分块LBP特征向量xp为一个二进制特征向量,本文所述的分块LBP样本特征向量的取值,可以表示为二进制取值、或者也可以表示为由二进制转换得到的十进制取值。
例如:可以先将Dt(p)累积分布的分块LBP样本特征向量xp取值空间划分为Q个互不相交的区间;
然后,统计每一区间Xq内出现正样本的概率:
W + 1 q = P ( x p ∈ X q , y p = + 1 ) = Σ i : x p ∈ X q ∩ y p = + 1 D t ( p ) ,
以及,每一区间Xq内出现反样本特征的概率:
W - 1 q = P ( x p ∈ X q , y p = - 1 ) = Σ i : x p ∈ X q ∩ y p = - 1 D t ( p ) ;
然后,即可将每一区间Xq内的每一分块LBP样本特征向量xp的弱分类器ht(xp)设定为:
Figure BSA00000243552000132
ε为避免
Figure BSA00000243552000133
为0时引起数字溢出的预定系数。
3.2)从设定的所有弱分类器ht(xp)中选择可使正反样本特征向量的分类误差最小的一个,作为第t次迭代的最优弱分类器ht(Xp)。
例如,对于弱分类器ht(xp),其分类误差上界
Figure BSA00000243552000134
3.3)分别利用每个分块LBP样本特征向量xp的最优弱分类器ht(Xp),更新该分块LBP样本特征向量xp下一次迭代的权重,以使得正样本特征向量的权重越来越小、反样本特征向量的权重随着迭代过程的继续而越来越大,从而使最优弱分类器ht(Xp)的精度随着迭代过程的继续而越来越高,t大于等于1且小于等于T。
实际应用中,可以计算
Figure BSA00000243552000135
来更新该分块LBP样本特征向量xp下一次迭代的权重Dt+1(p)。
4)利用T次迭代得到的所有最优弱分类器ht(Xp)计算得到表示识别结果的强分类器
Figure BSA00000243552000136
Figure BSA00000243552000137
为表示输入图像中包含有当前车牌字符的置信度。
至此,本流程结束。
基于上述流程训练得到的分类器,即可得到待认证的任意输入图像中各字符位置包含有每一字符的置信度,并依据各字符位置所对应的最大置信度,识别出该输入图像中各字符位置是否包含有对应车牌字符的分类结果
Figure BSA00000243552000141
b为预定的置信度阈值,sign()为表示
Figure BSA00000243552000142
是否大于b的符号函数,其输出正表示真、输出负表示假,从而实现字符识别。
而且,由于分块LBP特征针对的不是像素点、而是位置区域,且每个位置区域的分块LBP特征中不但包括该位置区域的纹理特征,还进一步包括以该位置区域若干方向上的多个邻域的纹理特征,因而每个位置区域的分块LBP特征能够反映出包含具有一定宽度、以及较长延伸距离的字符笔画的较大范围内的特征,从而相比于现有技术中利用仅针对像素点的LBP特征的方案,利用由分块LBP特征训练得到的分类器进行字符识别能够提高字符识别的准确性。
图4为本发明实施例中字符识别方法的流程示意图。如图4所示,基于上述训练方法得到的分类器,以车牌识别为例,本实施例中的字符识别方法包括如下步骤:
步骤401,对待识别图像进行定位,确定车牌区域。
步骤402,按照现有的统计方法确定车牌区域中的汉字搜索区域。
由于车牌图像中通常只包含例如“京”、或“沪”、或“苏”等一个汉字,因而本步骤中所确定的汉字搜索区域通常为一个。
步骤403,从所确定的汉字搜索区域内提取各位置区域的分块LBP特征,得到汉字搜索区域所对应的分块LBP特征向量、或称之为分块LBP特征图像。
步骤404,将汉字搜索区域所对应的分块LBP特征图像,同时输入至由如图3所示训练方法得到的针对每一汉字的分类器,得到与每一汉字对应的置信度。
步骤405,从所有置信度中选择最大的一个,并将最大的一个置信度与预定的阈值进行比较,如果大于等于该阈值,则认为汉字搜索区域内包含该最大的置信度所对应的汉字、并执行步骤406,否则,认为汉字搜索区域内未包含车牌字符中应有的汉字、并结束本流程。
本步骤中,即等同于得到了针对汉字的分类结果
步骤406,依据确定包含有汉字的汉字搜索区域的位置、并按照现有的统计方法,确定车牌区域中的字母搜索区域和数字搜索区域。
步骤407,分别从所确定的字母搜索区域和数字搜索区域内提取各位置区域的分块LBP特征,得到字母搜索区域和数字搜索区域所分别对应的分块LBP特征向量、或称之为分块LBP特征图像。
步骤408,将各字母搜索区域所分别对应的分块LBP特征图像分别同时输入至由如图3所示训练方法得到的针对每一字母的分类器、将各数字搜索区域所分别对应的分块LBP特征图像分别同时输入至由如图3所示训练方法得到的针对每一数字的分类器,得到与每一字母和数字所分别对应的置信度。
步骤409,分别从每个字母搜索区域和数字搜索区域得到的所有置信度中选择最大的一个,并将所有字母搜索区域和数字搜索区域最大的一个置信度分别与对应的阈值进行比较,如果所有字母搜索区域和数字搜索区域最大的一个置信度均大于对应的阈值,则认为待识别图像中包含所有应有的字母和数字、并结束本流程,否则认为待识别图像中未包含所有应有的字母和数字、并结束本流程。
当然,针对字母搜索区域、数字搜索区域,也可以不按照如步骤409所述的方式仅考虑置信度最大的字母、数字,而是可以分别选取同时满足置信度、以及与汉字之间距离最优的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字,即同时兼顾置信度、以及字母和数字与汉字之间的距离,以避免由于搜索区域位置偏离而导致的误识别。
例如,“1”和“3”之间应当存在一定的距离,但如果不考虑距离而仅考虑字符本身的置信度,则容易将“1”和“3”识别为“8”或“B”。
在本实施例中,为了同时满足置信度、以及与汉字之间距离最优,可以定义:
Figure BSA00000243552000161
此处的m表示字母搜索区域或数字搜索区域在车牌中的位置排列序号,η(L|μ,σ)为第m个字母搜索区域中的字母、或第m个数字搜索区域中的数字与汉字之间归一化距离L符合高斯分布模型η(μ,σ)的概率值,高斯分布模型η(μ,σ)预先统计得到,
Figure BSA00000243552000162
为第m个字母搜索区域针对任意字母的置信度、或第m个数字搜索区域针对任意数字的置信度,m大于等于1、且小于等于车牌中除汉字之外的字母与数字的总位数。
那么,
Figure BSA00000243552000163
最大即表示同时满足置信度、以及与汉字之间距离最优。
至此,本流程结束。
如上述流程可见,本实施例优选地先识别车牌字符中的汉字,只有在识别出汉字之后,再依据识别出的汉字位置定位其他字符的搜索位置、并进行识别,从而能够利用汉字的定位提高识别速度、并避免不必要的处理过程。
以上是对本实施例中用于字符识别的分类器训练方法、以及字符识别方法的说明。下面,再对本实施例中用于字符识别的分类器训练装置、以及字符识别装置进行详细说明。
图5为本发明实施例中用于字符识别的分类器训练装置的结构示意图。如图5所示,本实施例中用于字符识别的分类器训练装置分别针对每一车牌字符包括(图5中仅示出了针对一个车牌字符的结构,针对其他字符的结构与图5中的相同、故采用省略号予以表示):
对齐归一化单元,用于对包含有当前车牌字符的各正样本图像、以及未包含当前车牌字符的反样本图像进行尺度归一化;
块特征提取单元,用于从尺度归一化后的各正、反样本图像中提取各位置区域的分块LBP特征,得到各正、反样本图像的分块LBP特征向量;
置信度训练单元,用于利用各正、反样本图像的分块LBP特征向量训练当前车牌字符的分类器,以使该分类器可依据输入图像的分块LBP特征向量得到该输入图像中包含有当前车牌字符的置信度。
具体说,针对每一车牌字符的置信度训练单元包括(图5中未示出):
样本配置模块,用于配置给定样本集LB={(xp,yp)},其中,xp为第p个样本图像中提取出的分块LBP特征向量;yp为表示第p个样本图像为正样本图像还是反样本图像的样本标识,yp∈{+1,-1};p大于等于1且小于等于正、反样本图像总数M;
权重配置模块,用于设置每个分块LBP样本特征向量xp的初始权重 D 1 ( p ) = 1 M ;
迭代处理模块,用于对每个分块LBP样本特征向量xp进行T轮迭代,其中,在第t轮迭代过程中,先依据以分块LBP样本特征向量xp所有可能的取值为横坐标、以分块LBP样本特征向量xp的权重累积值为纵坐标的第t轮离散分布Dt,为每个分块LBP样本特征向量xp构造一弱分类器ht(xp),然后从设定的所有弱分类器中选择可使正反样本分类误差最小的一个作为第t次迭代的最优弱分类器ht(Xp),再利用每个分块LBP样本特征向量xp的最优弱分类器ht(Xp)更新该分块LBP样本特征向量xp下一次迭代的权重,T为预先设定的迭代次数;
结果输出模块,用于利用T次迭代得到的所有最优弱分类器ht(Xp)计算得到表示识别结果的强分类器
进一步地,迭代处理模块又可以包括(图5中未示出):
区间划分子模块,用于将Dt(p)累积分布的分块LBP样本特征向量xp取值空间划分为Q个互不相交的区间;
概率统计子模块,用于统计每一区间Xq内出现正样本的概率
Figure BSA00000243552000173
以及每一区间Xq内出现反样本特征的概率 W - 1 q = Σ i : x p ∈ X q ∩ y p = - 1 D t ( p ) ;
分类器设定子模块,用于将每一分块LBP样本特征向量xp的弱分类器ht(xp)设定为:
Figure BSA00000243552000182
ε为避免
Figure BSA00000243552000183
为0时引起数字溢出的预定系数;
分类器选择子模块,用于从设定的所有弱分类器ht(xp)中选择可使正反样本特征向量的分类误差最小的一个,作为第t次迭代的最优弱分类器ht(Xp),其中,弱分类器ht(xp)的分类误差上界
权重更新子模块,通过计算
Figure BSA00000243552000185
来更新分块LBP样本特征向量xp下一次迭代的权重Dt+1(p)。
图6为本发明实施例中字符识别装置的结构示意图。如图6所示,本实施例中的字符识别装置包括:
特征提取单元,用于从输入图像各字符搜索区域中的各位置区域提取分块区域二值化模式LBP特征,得到各字符搜索区域的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
由如图5所示的训练装置训练得到的分别针对各车牌字符的若干分类器,每一分类器用于产生输入图像中各字符搜索区域针对该分类器所对应车牌字符的置信度;
结果判定单元,用于依据各字符搜索区域所分别对应的针对各车牌字符的置信度,得到该输入图像中各字符搜索区域所包含的车牌字符。
如上可见,由于分块LBP特征针对的不是像素点、而是位置区域,且每个位置区域的分块LBP特征中不但包括该位置区域的纹理特征,还进一步包括以该位置区域若干方向上的多个邻域的纹理特征,因而每个位置区域的分块LBP特征能够反映出包含具有一定宽度、以及较长延伸距离的字符笔画的较大范围内的特征,从而相比于现有技术中利用仅针对像素点的LBP特征的方案,利用由分块LBP特征训练得到的分类器进行字符识别能够提高字符识别的准确性。
可选地,对于车牌识别这一具体应用,特征提取单元可以包括针对汉字搜索区域的第一特征提取子单元、以及针对字母搜索区域和数字搜索区域的第二特征提取子单元(图6中未示出);结果判定单元可以包括分别针对汉字搜索区域的第一结果判定子单元、以及针对字母搜索区域和数字搜索区域的第二结果判定子单元(图6中未示出);
此时,针对汉字搜索区域的第一结果判定子单元在得到汉字搜索区域包含有对应汉字的分类结果后,进一步利用汉字搜索区域定位得到字母搜索区域和数字搜索区域,然后再触发针对字母搜索区域和数字搜索区域的第二特征提取子单元和第二结果判定子单元。
也就是说,先识别车牌字符中的汉字,只有在识别出汉字之后,再依据识别出的汉字位置定位其他字符的搜索位置、并进行识别,从而能够利用汉字的定位提高识别速度、并避免不必要的处理过程。
而且,针对汉字搜索区域的第一结果判定子单元,可以选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;针对字母搜索区域和数字搜索区域的第二结果判定子单元,分别选取大于预定阈值的最大置信度所对应的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
或者,针对汉字搜索区域的第一结果判定子单元,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;但针对字母搜索区域和数字搜索区域的第二结果判定子单元,分别选取同时满足置信度、以及与汉字之间距离最优的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字,即同时兼顾置信度、以及字母和数字与汉字之间的距离,以避免由于搜索区域位置偏离而导致的误识别。
例如,为了同时满足置信度、以及与汉字之间距离最优,可以定义:
Figure BSA00000243552000201
此处的m表示字母搜索区域或数字搜索区域在车牌中的位置排列序号,η(L|μ,σ)为第m个字母搜索区域中的字母、或第m个数字搜索区域中的数字与汉字之间归一化距离L符合高斯分布模型η(μ,σ)的概率值,高斯分布模型η(μ,σ)预先统计得到,
Figure BSA00000243552000202
为第m个字母搜索区域针对任意字母的置信度、或第m个数字搜索区域针对任意数字的置信度,m大于等于1、且小于等于车牌中除汉字之外的字母与数字的总位数。
那么,最大即表示同时满足置信度、以及与汉字之间距离最优。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种用于字符识别的分类器训练方法,其特征在于,该方法分别针对每一车牌字符执行如下步骤:
a、对包含有当前车牌字符的各正样本图像、以及未包含当前车牌字符的反样本图像进行尺度归一化;
b、从尺度归一化后的各正、反样本图像中提取各位置区域的分块区域二值化模式LBP特征,得到各正、反样本图像的分块LBP特征向量;
c、利用各正、反样本图像的分块LBP特征向量训练当前车牌字符的分类器,以使该分类器可依据输入图像的分块LBP特征向量得到该输入图像中包含有当前车牌字符的置信度;
其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征。
2.如权利要求1所述的分类器训练方法,其特征在于,每个位置区域r(0)i,j为矩形区域,每个位置区域r(0)i,j的邻域为该位置区域四边相邻的位置区域r(1)i,j~r(4)i,j,i表示位置区域所在行、j表示位置区域所在列,i、j均大于1;
且,每个位置区域r(0)i,j的分块LBP特征
Figure FSA00000243551900011
如果r(n)i,j中的像素值之和大于预定阈值则MB_B(n)i,j取1,否则MB_B(n)i,j取0。
3.如权利要求1所述的分类器训练方法,其特征在于,针对每一车牌字符的所述步骤c具体包括如下步骤:
c0、给定样本集LB={(xp,yp)},其中,xp为第p个样本图像中提取出的分块LBP特征向量;yp为表示第p个样本图像为正样本图像还是反样本图像的样本标识,yp∈{+1,-1};p大于等于1且小于等于正、反样本图像总数M;
c1、设置每个分块LBP样本特征向量xp的初始权重
Figure FSA00000243551900012
c2、对每个分块LBP样本特征向量xp进行T轮迭代,其中,在第t轮迭代过程中,先依据以分块LBP样本特征向量xp所有可能的取值为横坐标、以分块LBP样本特征向量xp的权重累积值为纵坐标的第t轮离散分布Dt,为每个分块LBP样本特征向量xp构造一弱分类器ht(xp),然后从设定的所有弱分类器中选择可使正反样本分类误差最小的一个作为第t次迭代的最优弱分类器ht(Xp),再利用每个分块LBP样本特征向量xp的最优弱分类器ht(Xp)更新该分块LBP样本特征向量xp下一次迭代的权重,T为预先设定的迭代次数;
c3、利用T次迭代得到的所有最优弱分类器ht(Xp)计算得到表示识别结果的强分类器
Figure FSA00000243551900021
4.如权利要求3所述的分类器训练方法,其特征在于,所述步骤c2在第t次迭代过程中包括如下步骤:
c20、将Dt(p)累积分布的分块LBP样本特征向量xp取值空间划分为Q个互不相交的区间;
c21、统计每一区间Xq内出现正样本的概率
Figure FSA00000243551900022
以及每一区间Xq内出现反样本特征的概率
Figure FSA00000243551900023
c22、每一分块LBP样本特征向量xp的弱分类器ht(xp)设定为:
Figure FSA00000243551900024
ε为避免
Figure FSA00000243551900025
为0时引起数字溢出的预定系数;
c23、从设定的所有弱分类器ht(xp)中选择可使正反样本特征向量的分类误差最小的一个,作为第t次迭代的最优弱分类器ht(Xp),其中,弱分类器ht(xp)的分类误差上界
Figure FSA00000243551900026
c24、通过计算
Figure FSA00000243551900027
来更新分块LBP样本特征向量xp下一次迭代的权重Dt+1(p)。
5.一种用于字符识别的分类器训练装置,其特征在于,该装置分别针对每一车牌字符包括:
对齐归一化单元,用于对包含有当前车牌字符的各正样本图像、以及未包含当前车牌字符的反样本图像进行尺度归一化;
块特征提取单元,用于从尺度归一化后的各正、反样本图像中提取各位置区域的分块区域二值化模式LBP特征,得到各正、反样本图像的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
置信度训练单元,用于利用各正、反样本图像的分块LBP特征向量训练当前车牌字符的分类器,以使该分类器可依据输入图像的分块LBP特征向量得到该输入图像中包含有当前车牌字符的置信度。
6.如权利要求5所述的分类器训练装置,其特征在于,每个位置区域r(0)i,j为矩形区域,每个位置区域r(0)i,j的邻域为该位置区域四边相邻的位置区域r(1)i,j~r(4)i,j,i表示位置区域所在行、j表示位置区域所在列,i、j均大于1;
且,每个位置区域r(0)i,j的分块LBP特征
Figure FSA00000243551900031
如果r(n)i,j中的像素值之和大于预定阈值则MB_B(n)i,j取1,否则MB_B(n)i,j取0。
7.如权利要求5所述的分类器训练装置,其特征在于,针对每一车牌字符的置信度训练单元包括:
样本配置模块,用于配置给定样本集LB={(xp,yp)},其中,xp为第p个样本图像中提取出的分块LBP特征向量;yp为表示第p个样本图像为正样本图像还是反样本图像的样本标识,yp∈{+1,-1};p大于等于1且小于等于正、反样本图像总数M;
权重配置模块,用于设置每个分块LBP样本特征向量xp的初始权重 D 1 ( p ) = 1 M ;
迭代处理模块,用于对每个分块LBP样本特征向量xp进行T轮迭代,其中,在第t轮迭代过程中,先依据以分块LBP样本特征向量xp所有可能的取值为横坐标、以分块LBP样本特征向量xp的权重累积值为纵坐标的第t轮离散分布Dt,为每个分块LBP样本特征向量xp构造一弱分类器ht(xp),然后从设定的所有弱分类器中选择可使正反样本分类误差最小的一个作为第t次迭代的最优弱分类器ht(Xp),再利用每个分块LBP样本特征向量xp的最优弱分类器ht(Xp)更新该分块LBP样本特征向量xp下一次迭代的权重,T为预先设定的迭代次数;
结果输出模块,用于利用T次迭代得到的所有最优弱分类器ht(Xp)计算得到表示识别结果的强分类器
Figure FSA00000243551900042
8.如权利要求7所述的分类器训练装置,其特征在于,迭代处理模块包括:
区间划分子模块,用于将Dt(p)累积分布的分块LBP样本特征向量xp取值空间划分为Q个互不相交的区间;
概率统计子模块,用于统计每一区间Xq内出现正样本的概率
Figure FSA00000243551900043
以及每一区间Xq内出现反样本特征的概率 W - 1 q = Σ i : x p ∈ X q ∩ y p = - 1 D t ( p ) ;
分类器设定子模块,用于将每一分块LBP样本特征向量xp的弱分类器ht(xp)设定为:
Figure FSA00000243551900045
ε为避免
Figure FSA00000243551900046
为0时引起数字溢出的预定系数;
分类器选择子模块,用于从设定的所有弱分类器ht(xp)中选择可使正反样本特征向量的分类误差最小的一个,作为第t次迭代的最优弱分类器ht(Xp),其中,弱分类器h1(xp)的分类误差上界
Figure FSA00000243551900051
权重更新子模块,通过计算
Figure FSA00000243551900052
来更新分块LBP样本特征向量xp下一次迭代的权重Dt+1(p)。
9.一种字符识别方法,其特征在于,包括如下步骤:
从输入图像各字符搜索区域中的各位置区域提取分块区域二值化模式LBP特征,得到各字符搜索区域的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
利用如权利要求1至4中任一项所述的训练方法得到的分别针对各车牌字符的分类器,得到输入图像中各字符搜索区域分别针对各车牌字符的置信度;
依据各字符搜索区域所分别对应的针对各车牌字符的置信度,得到该输入图像中各字符搜索区域所包含的车牌字符。
10.如权利要求9所述的字符识别方法,其特征在于,所述字符为车牌字符并包括汉字、字母、以及数字,字符搜索区域包括汉字搜索区域、字母搜索区域、以及数字搜索区域;
该方法先从汉字搜索区域提取得到分块LBP特征向量、利用如权利要求1至4中任一项所述的训练方法得到的分别针对各汉字的分类器得到汉字搜索区域针对各汉字的置信度、以及依据汉字搜索区域的置信度得到汉字搜索区域所包含的汉字;然后,再利用汉字搜索区域定位得到字母搜索区域和数字搜索区域,并分别从字母搜索区域和数字搜索搜索区域提取得到分块LBP特征向量、利用如权利要求1至4中任一项所述的训练方法得到的分别针对各字母和数字的分类器分别得到字母搜索区域针对各字母的置信度和各数字搜索区域针对各数字的置信度、以及依据字母搜索区域和数字搜索区域的置信度得到字母搜索区域包含的字母和数字搜索区域包含的数字。
11.如权利要求10所述的字符识别方法,其特征在于,该方法针对汉字搜索区域、字母搜索区域、数字搜索区域,分别选取大于预定阈值的最大置信度所对应的汉字、字母、数字作为汉字搜索区域、字母搜索区域、数字搜索区域分别包含的汉字、字母、数字。
12.如权利要求10所述的字符识别方法,其特征在于,该方法针对汉字搜索区域,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;针对字母搜索区域、数字搜索区域,分别选取同时满足置信度、以及与汉字之间距离最优的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
13.如权利要求12所述的字符识别方法,其特征在于,同时满足置信度、以及与汉字之间距离最优为最大,其中:
Figure FSA00000243551900062
表示字母搜索区域或数字搜索区域在车牌中的位置排列序号,η(L|μ,σ)为第m个字母搜索区域中的字母、或第m个数字搜索区域中的数字与汉字之间归一化距离L符合高斯分布模型η(μ,σ)的概率值,高斯分布模型η(μ,σ)预先统计得到,
Figure FSA00000243551900063
为第m个字母搜索区域针对任意字母的置信度、或第m个数字搜索区域针对任意数字的置信度。
14.一种字符识别装置,其特征在于,包括:
特征提取单元,用于从输入图像各字符搜索区域中的各位置区域提取分块区域二值化模式LBP特征,得到各字符搜索区域的分块LBP特征向量;其中,每个位置区域的分块LBP特征中包括该位置区域的纹理特征、以及该位置区域若干方向上的邻域的纹理特征;
由权利要求5至8中任一项所述的训练装置训练得到的分别针对各车牌字符的若干分类器,每一分类器用于产生输入图像中各字符搜索区域针对该分类器所对应车牌字符的置信度;
结果判定单元,用于依据各字符搜索区域所分别对应的针对各车牌字符的置信度,得到该输入图像中各字符搜索区域所包含的车牌字符。
15.如权利要求14所述的字符识别装置,其特征在于,所述字符为车牌字符并包括汉字、字母、以及数字,字符搜索区域包括汉字搜索区域、字母搜索区域、以及数字搜索区域;
特征提取单元包括针对汉字搜索区域的第一特征提取子单元、以及针对字母搜索区域和数字搜索区域的第二特征提取子单元;
结果判定单元包括分别针对汉字搜索区域的第一结果判定子单元、以及针对字母搜索区域和数字搜索区域的第二结果判定子单元;
且,针对汉字搜索区域的第一结果判定子单元在得到汉字搜索区域包含有对应汉字的分类结果后,进一步利用汉字搜索区域定位得到字母搜索区域和数字搜索区域,并触发针对字母搜索区域和数字搜索区域的第二特征提取子单元和第二结果判定子单元。
16.如权利要求15所述的字符识别装置,其特征在于,
针对汉字搜索区域的第一结果判定子单元,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;
针对字母搜索区域和数字搜索区域的第二结果判定子单元,分别选取大于预定阈值的最大置信度所对应的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
17.如权利要求15所述的字符识别装置,其特征在于,
针对汉字搜索区域的第一结果判定子单元,选取大于预定阈值的最大置信度所对应的汉字作为汉字搜索区域包含的汉字;
针对字母搜索区域和数字搜索区域的第二结果判定子单元,分别选取同时满足置信度、以及与汉字之间距离最优的字母、数字作为字母搜索区域、数字搜索区域分别包含的字母、数字。
18.如权利要求17所述的字符识别装置,其特征在于,同时满足置信度、以及与汉字之间距离最优为最大,其中:
Figure FSA00000243551900081
表示字母搜索区域或数字搜索区域在车牌中的位置序号,η(L|μ,σ)为第m个字母搜索区域中的字母、或第m个数字搜索区域中的数字与汉字之间归一化距离L符合高斯分布模型η(μ,σ)的概率值,高斯分布模型η(μ,σ)预先统计得到,
Figure FSA00000243551900082
为第m个字母搜索区域针对任意字母的置信度、或第m个数字搜索区域针对任意数字的置信度。
CN201010262070.6A 2010-08-24 2010-08-24 分类器训练方法和装置以及字符识别方法和装置 Active CN102375991B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010262070.6A CN102375991B (zh) 2010-08-24 2010-08-24 分类器训练方法和装置以及字符识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010262070.6A CN102375991B (zh) 2010-08-24 2010-08-24 分类器训练方法和装置以及字符识别方法和装置

Publications (2)

Publication Number Publication Date
CN102375991A true CN102375991A (zh) 2012-03-14
CN102375991B CN102375991B (zh) 2016-04-13

Family

ID=45794569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010262070.6A Active CN102375991B (zh) 2010-08-24 2010-08-24 分类器训练方法和装置以及字符识别方法和装置

Country Status (1)

Country Link
CN (1) CN102375991B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831244A (zh) * 2012-09-13 2012-12-19 重庆立鼎科技有限公司 一种房产文档图像的分类检索方法
CN106203383A (zh) * 2016-07-21 2016-12-07 成都之达科技有限公司 基于图像的车辆安全预警方法
CN106203539A (zh) * 2015-05-04 2016-12-07 杭州海康威视数字技术股份有限公司 识别集装箱箱号的方法和装置
CN107239786A (zh) * 2016-03-29 2017-10-10 阿里巴巴集团控股有限公司 一种字符识别方法和装置
CN107273898A (zh) * 2017-07-10 2017-10-20 武汉珞珈博研科技有限责任公司 基于字符纹理区域分割的打印文件鉴别方法
CN107392111A (zh) * 2017-06-27 2017-11-24 青岛海信电器股份有限公司 广告识别方法及装置
CN107688811A (zh) * 2017-09-12 2018-02-13 北京文安智能技术股份有限公司 车牌识别方法及装置
CN108809873A (zh) * 2018-06-14 2018-11-13 中国科学院声学研究所 一种信号合成方法及系统
CN110084232A (zh) * 2018-01-25 2019-08-02 浙江宇视科技有限公司 车牌中汉字字符的识别方法、装置及终端设备
CN115937837A (zh) * 2022-11-09 2023-04-07 粤丰科盈智能投资(广东)有限公司 一种基于位置编码的车牌检测方法、装置及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719222A (zh) * 2009-11-27 2010-06-02 北京中星微电子有限公司 分类器训练方法和装置以及人脸认证方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719222A (zh) * 2009-11-27 2010-06-02 北京中星微电子有限公司 分类器训练方法和装置以及人脸认证方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUN ZHANG等: "Face Detection Based on Multi-Block LBP Representation", 《LECTURE NOTES IN COMPUTER SCIENCE》, vol. 4642, 29 August 2007 (2007-08-29), pages 13 - 15 *
贾曌峰等: "基于字符检测的车牌定位方法", 《计算机工程》, vol. 36, no. 3, 28 February 2010 (2010-02-28), pages 193 - 194 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831244B (zh) * 2012-09-13 2015-09-30 重庆立鼎科技有限公司 一种房产文档图像的分类检索方法
CN102831244A (zh) * 2012-09-13 2012-12-19 重庆立鼎科技有限公司 一种房产文档图像的分类检索方法
CN106203539B (zh) * 2015-05-04 2020-01-17 杭州海康威视数字技术股份有限公司 识别集装箱箱号的方法和装置
CN106203539A (zh) * 2015-05-04 2016-12-07 杭州海康威视数字技术股份有限公司 识别集装箱箱号的方法和装置
CN107239786A (zh) * 2016-03-29 2017-10-10 阿里巴巴集团控股有限公司 一种字符识别方法和装置
TWI766855B (zh) * 2016-03-29 2022-06-11 香港商阿里巴巴集團服務有限公司 一種字符識別方法和裝置
US10872274B2 (en) 2016-03-29 2020-12-22 Alibaba Group Holding Limited Character recognition method and device
CN106203383A (zh) * 2016-07-21 2016-12-07 成都之达科技有限公司 基于图像的车辆安全预警方法
CN106203383B (zh) * 2016-07-21 2019-06-11 成都之达科技有限公司 基于图像的车辆安全预警方法
CN107392111A (zh) * 2017-06-27 2017-11-24 青岛海信电器股份有限公司 广告识别方法及装置
CN107392111B (zh) * 2017-06-27 2020-06-23 海信视像科技股份有限公司 广告识别方法及装置
CN107273898A (zh) * 2017-07-10 2017-10-20 武汉珞珈博研科技有限责任公司 基于字符纹理区域分割的打印文件鉴别方法
CN107688811B (zh) * 2017-09-12 2020-11-03 北京文安智能技术股份有限公司 车牌识别方法及装置
CN107688811A (zh) * 2017-09-12 2018-02-13 北京文安智能技术股份有限公司 车牌识别方法及装置
CN110084232A (zh) * 2018-01-25 2019-08-02 浙江宇视科技有限公司 车牌中汉字字符的识别方法、装置及终端设备
CN110084232B (zh) * 2018-01-25 2021-01-29 浙江宇视科技有限公司 车牌中汉字字符的识别方法、装置及终端设备
CN108809873B (zh) * 2018-06-14 2020-03-31 中国科学院声学研究所 一种信号合成方法及系统
CN108809873A (zh) * 2018-06-14 2018-11-13 中国科学院声学研究所 一种信号合成方法及系统
CN115937837A (zh) * 2022-11-09 2023-04-07 粤丰科盈智能投资(广东)有限公司 一种基于位置编码的车牌检测方法、装置及计算机可读存储介质
CN115937837B (zh) * 2022-11-09 2023-10-27 粤丰科盈智能投资(广东)有限公司 一种基于位置编码的车牌检测方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN102375991B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN102375991A (zh) 分类器训练方法和装置以及字符识别方法和装置
CN110969160B (zh) 一种基于深度学习的车牌图像校正、识别方法及系统
CN101859382B (zh) 一种基于最大稳定极值区域的车牌检测与识别的方法
CN103136528B (zh) 一种基于双边缘检测的车牌识别方法
CN101339601B (zh) 一种基于sift算法的车牌汉字识别方法
CN101937508A (zh) 一种基于高清图像的车牌定位与识别方法
CN101154271A (zh) 基于快速区域标号算法和车牌大间隔定位方法的车牌字符分割方法
CN105868700A (zh) 一种基于监控视频的车型识别与跟踪方法及系统
CN101739566B (zh) 基于自适应投影模板法的车牌定位方法
CN109271991A (zh) 一种基于深度学习的车牌检测方法
CN107563380A (zh) 一种基于mser和swt相结合的车辆车牌检测识别方法
CN103116987A (zh) 一种基于监控视频处理的车流统计和违规检测的方法
CN104766042A (zh) 交通标志板识别方法及装置
CN103810505A (zh) 基于多层描述子的车辆标识方法与系统
Yan et al. Automated asphalt highway pavement crack detection based on deformable single shot multi-box detector under a complex environment
CN104200207A (zh) 一种基于隐马尔可夫模型的车牌识别方法
CN102542244A (zh) 人脸检测方法与系统及计算机程序产品
CN104036244A (zh) 一种适用于低质量图像的棋盘格角点检测方法及装置
CN109657676A (zh) 基于卷积神经网络的车牌识别方法及系统
CN103310199A (zh) 基于高分辨率遥感数据的车辆型号识别方法
CN101154270A (zh) 基于补偿原理和中心区域扫描的车牌二值化方法
CN104346628A (zh) 基于多尺度多方向Gabor特征的车牌汉字识别方法
CN111488854A (zh) 一种道路交通标志自动识别与分类方法
CN104834891A (zh) 一种中文图像型垃圾邮件过滤方法及系统
CN109271904A (zh) 一种基于像素自适应分割和贝叶斯模型的黑烟车检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: VIMICRO ELECTRONICS CORPORATION

Effective date: 20120131

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20120131

Address after: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Applicant after: Beijing Vimicro Corporation

Co-applicant after: Vimicro Electronics Co., Ltd.

Address before: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Applicant before: Beijing Vimicro Corporation

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180130

Address after: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Patentee after: Beijing Vimicro Corporation

Address before: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Co-patentee before: Vimicro Electronics Co., Ltd.

Patentee before: Beijing Vimicro Corporation

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191125

Address after: 401120 No. 117-338, Yunhan Avenue, Beibei District, Chongqing

Patentee after: Chongqing Zhongxing micro artificial intelligence chip technology Co., Ltd

Address before: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Patentee before: Beijing Vimicro Corporation