CN101630367A - 基于多分类器的手写体字符识别拒识方法 - Google Patents
基于多分类器的手写体字符识别拒识方法 Download PDFInfo
- Publication number
- CN101630367A CN101630367A CN200910089147A CN200910089147A CN101630367A CN 101630367 A CN101630367 A CN 101630367A CN 200910089147 A CN200910089147 A CN 200910089147A CN 200910089147 A CN200910089147 A CN 200910089147A CN 101630367 A CN101630367 A CN 101630367A
- Authority
- CN
- China
- Prior art keywords
- identifying
- output
- confidence
- sorter
- rejection method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
基于多分类器的手写体字符识别拒识方法,属于手写字符识别领域。将拒识方法引入手写体字符识别系统,可以有效提高识别系统的可靠性,从而提高识别系统的识别率。该发明提出了一种基于单分类器的拒识方法和一种基于多分类器的拒识方法。针对单个特征拒识方法存在的局限性,采用多分类器系统的思想为每一种特征设计单独的分类器,进而对各分类器的拒识结果进行集成,可以发挥各种特征的优势,进一步提高拒识的可靠性。该发明以单分类器拒识方法为基础,给出多分类器拒识方法。该方法可以更好的解决手写体识别系统的识别率和拒识率之间的矛盾,提高识别系统的可靠性。
Description
技术领域
本发明提出了几种基于多分类器的手写体字符识别拒识方法,能够有效提高识别拒识字符的可靠性和识别其余字符的准确性。
背景技术
在模式识别领域中,脱机手写体字符识别依然是一个具有挑战性的难题,在某些应用领域中要达到较低的错误率往往会带来很大的系统风险。因此在手写体字符识别的实际应用中,为了提高系统的稳定性和可靠性,将拒识算法应用到系统中,从而提高系统的整体性能。此外,还可以检测出未正确识别的字符,将其提交给一个辅助的识别系统中,或提交给人工处理。
目前普遍采用的一种方法是计算每个字符的置信度。利用简单的阈值操作便可以实现拒识。置信度的计算方法主要有两种,一种方法是置信度由一个简单的函数组成,在识别处理中产生合适的参数,或者被看成是一种学习任务,通过训练数据得到新的分类器输出。另一种方法是在识别处理后计算置信度。这种方法计算的置信度可以用识别评分,似然比,后验概率估计,指数概率,和负熵来表示。
为了克服单分类器的局限性,采用多分类器的思想可以进一步提高系统的性能。分类器集成的方法可分为:抽象级(类标签),排序级(排序),和测量级(类置信度)。本发明在抽象级,提出了0R,AND和VOTING的拒识方法;在测量级,提出了均值和权值线性结合的拒识方法。具有不同特征、结构、学习算法和训练数据的分类器会表现出不同的分类特性,将这些特性进行融合会优于最好的单分类器。
发明内容
为了提高手写体字符识别系统的可靠性,更好的解决识别率和拒识率的矛盾,本发明提出了一种基于单分类器的拒识方法和一种基于多分类器的拒识方法。
本发明以单分类器拒识方法为基础,研究了抽象级和测量级的多分类器拒识方法。在抽象级,提出了OR,AND和VOTING三种投票组合拒识方法;在测量级,提出了求和(均值)和加权两种线性组合拒识方法。本发明提出的拒识方法能够有效的提高识别拒识字符的可靠性和识别其余字符的准确性。
本发明的技术方案是:首先,给出单分类器拒识方法,然后,以单分类器拒识方法为基础,给出多分类器拒识方法。
1.单分类器拒识方法
单分类器拒识方法分为三个步骤:(1)初始归一化,(2)置信度计算和(3)拒识。分类器输出经过初始归一化变换到一个适当的范围,使得不同分类器的输出值具有可比性。用激活函数将经过初始归一化的输出值变换成置信度。相应的激活函数有三种:log-likelihood,likelihood,和sigmoid。归一化函数包括全局归一化,一维高斯密度模型,和多维高斯密度。
1.1.初始归一化
选取归一化函数的一个基本原则是,分类器的输出经归一化函数的变换将分布在0附近。经过归一化函数变换的置信度的理想值应能表示输入模式属于一个具体类别的概率。
确定分类器输出范围的一个简单的方法是将输出变换到均值为0,标准差为1,即:
这里d表示分类器的输出,μ0和σ0 2分别代表分类器输出的均值和方差。这个归一化函数为全局归一化函数。
假设对于每个类别,分类器的输出满足多维高斯分布,方差为σ2。分类器输出经过排序,目标类别的输出值排位高其他类别的输出值排位低,假设输出值有两种:目标类为μ+,其他类为μ-,即对于ωi类,mii=μ+和mij=μ-,j≠i。如果负样本均值为μr,则归一化函数为:
假设每类的输出满足一维高斯分布,则归一化函数为:
fi(d)=α[di-(β+γ/α)], (3)
1.2.置信度计算
在神经网络中普遍使用的sigmoid函数,能够很好的将网络输出逼近概率分布。将其作为置信度变换的激活函数:
许多参数分类器(如LDF和QDF)的类别判定方法是贝叶斯估计的对数或反对数,其输出值为di(x):
di(x)=log[p(ωi)p(x|ωi)]
其中di(x)表示输入样本x对应的分类器输出,这样可以计算后验概率为:
经过指数运算可以得到一种置信度:
第三种类型的置信度是似然对数。当用指数逼近贝叶斯估计,对数似然就是一种简单的线性归一化函数:
gi(d)=fi(d) (6)
为了使类别后验概率满足概率公理,上述指数和sigmoid值将进行“概率”形式归一化:
1.3.拒识
经过初始归一化(公式(1),(3)和(4))和置信度计算(公式(4),(5)和(6)),最后是拒识。最简单的拒识方法是阈值操作。
假设输入样本为x,类别数为M,经过降序排列的识别系统的输出为 对这个输出直接进行阈值操作:
得到0≤r1(x)≤1。还可以通过计算输出前两位的相关比率:
此外,也可以用上面公式的变换形式:
类似的,得到0≤r2(x)≤1。
如果置信度值很大,公式(7)更适合。相反,如果类别区分明显,则公式(8)更合理。一种混合的方法是用两个权值将上面两种方法进行线性结合,
这里α+β=1,α和β的值可以通过实验或学习来获得(例如,GA算法)。类似的,得到0≤r3(x)≤1。
2.多分类器的拒识方法
将单分类器中使用的拒识方法用于多分类器中。假设给定K个分类器{H1,H2,...,HK},每个分类器采用公式(9)的拒识方法。
即,
也就是说,如果 则拒绝,否则接受。
2.1.多分类器投票组合
本发明提出了三种基于多分类器手写体字符识别的拒识方法:(1)OR,(2)AND,和(3)VOTING。假设多分类器输出的类标签是相同的。也就是在公式(10)中,对样本x,有,
如果对样本x输出的类标签不同,则拒绝。
如果FI(x|ωi)=1,则拒绝,否则接受。
如果FII(x|ωi)=1,则拒绝,否则接受。
如果FIII(x|ωi)<Nthres,则拒绝,否则接受。Nthres可以预定义。通常,Nthres>N/2,这就是多数投票表决。
2.2.多分类器线性组合
这种方式的拒识方法有两种:均值组合和加权组合。
(1)均值组合
对于M个类别,K个分类器,分类器输出经归一化变换得到置信度gm k(x),k=1,..,K,m=1,...,M。则总的置信度为:
这相当于类别的平均置信度。
拒识方法和单分类器相同(公式(10)),即:
这里{gm(x),m=1,...,M}经降序排列成
(2)加权组合
这种方式中每个分类器的所有类别共享一个权值。因此,置信度为:
分类器权值w={w1,w2,...,wK},可以通过有效数据集经CE,MSE或MCE优化得到。
本发明提出的手写体字符识别拒识方法,能够有效的提高识别系统的可靠性,并且针对单个特征拒识方法存在的局限性,采用多分类器系统的思想为每一种特征设计单独的分类器,进而对各分类器的拒识结果进行集成,可以发挥各种特征的优势,进一步提高拒识的可靠性,从而提高识别系统的识别率。
附图说明
图1是拒识方法流程图。
图2是单分类器拒识方法流程图。
图3是抽象级的多分类器拒识方法流程图。
图4是测量级的多分类器拒识方法流程图。
具体实施方式
以手写体数字识别为例,用三种分类器:三层BP神经网络,改进二次判别函数(MQDF),和支持向量机(SVMs)。特征用加权方向直方图。
在单分类器试验中,用公式(1) 所述的初始归一化函数,用公式(4) 所述的置信度计算方法,用公式(9) 所述的拒识方法。
其中α=β=0.5,TH3=0.6。试验结果表明,公式(9)所述的拒识方法表现出了最好的性能。
在多分类器试验中,对于每个单分类器,用公式(1) 所述的初始归一化函数,公式(4) 所述的置信度计算方法和公式(10) 所述的拒识方法。抽象级分类器组合分别用用AND,OR和VOTING三种拒识方法进行了试验;测量级分类器组合分别用均值组合和加权组合的拒识方法进行了试验。试验结果表明,AND拒识方法表现出了最好的性能,OR拒识方法强调了拒识,VOTING拒识方法的表现不如其它两种方法。在多分类器线性组合中,加权组合方法的表现略优于求和方法。
Claims (6)
1、基于多分类器的手写体字符识别拒识方法,其特征在于:所述方法由两个或两个以上的单分类器拒识结果为基础的多分类器拒识方法;其中单分类器拒识方法分为三个步骤:初始归一化、置信度计算和拒识;将两个或两个以上的单分类器拒识方法所得到的结果,通过投票组合方式或线性组合方法,最终得到拒识结果;
1)初始归一化
选取归一化函数的一个基本原则是:分类器的输出经归一化函数的变换将分布在0附近,经过归一化函数变换的置信度的理想值能表示输入模式属于一个具体类别的概率;
确定分类器输出范围的一个简单的方法是将输出变换到均值为0,标准差为1,即:
其中d代表分类器的输出,μ0和σ0 2分别代表分类器输出的均值和方差,这个归一化函数为全局归一化函数;
2)置信度计算
在神经网络中普遍使用的sigmoid函数,能够很好的将网络输出逼近概率分布;将其作为置信度变换的激活函数:
3)拒识
得到0≤r1(x)≤1。
2、如权利要求1所述的拒识方法,其特征在于:所述的归一化函数,当分类器的输出满足多维高斯分布,方差为σ2,分类器输出d经过排序,目标类别的输出值排位高其他类别的输出值排位低,输出值为:目标类为μ+,其他类为μ-,对于ωi类,mii=μ+和mij=μ-,j≠i,当负样本均值为μr,则归一化函数为:
当每类的输出满足一维高斯分布,则归一化函数为:
fi(d)=α[d-(β+γ/α)];
其中 γ=ln(P(ωi)/P(ωi)),和P(ωi)分别表示负样本和正样本的先验概率。
3、如权利要求1所述的拒识方法,其特征在于:所述的置信度变换函数,在当参数分类器的类别判定方法是贝叶斯估计的对数或反对数:
di(x)=log[p(ωi)p(x|ωi)]
其中di(x)表示输入样本x对应的分类器输出,计算后验概率为:
经过指数运算得到一种置信度:
或者当置信度是似然对数,当用指数逼近贝叶斯估计,对数似然就是一种简单的线性归一化函数:
gi(d)=fi(d)
为了使类别后验概率满足概率公理,指数和sigmoid值将进行“概率”形式归一化:
4、如权利要求1所述的拒识方法,其特征在于:所述的拒识步骤中,通过计算输出前两位的相关比率:
用比率公式的变换形式:
得到0≤r2(x)≤1;
当置信度值很大,公式(7)更适合;相反,当类别区分明显,则公式(8)更合理;一种混合的方法是用两个权值将上面两种方法进行线性结合,
这里α+β=1,α和β的值通过实验或学习来获得,通过此公式得到0≤r3(x)≤1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910089147A CN101630367A (zh) | 2009-07-31 | 2009-07-31 | 基于多分类器的手写体字符识别拒识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910089147A CN101630367A (zh) | 2009-07-31 | 2009-07-31 | 基于多分类器的手写体字符识别拒识方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101630367A true CN101630367A (zh) | 2010-01-20 |
Family
ID=41575470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910089147A Pending CN101630367A (zh) | 2009-07-31 | 2009-07-31 | 基于多分类器的手写体字符识别拒识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101630367A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102279927A (zh) * | 2010-06-08 | 2011-12-14 | 富士通株式会社 | 拒识方法和拒识装置 |
CN102622610A (zh) * | 2012-03-05 | 2012-08-01 | 西安电子科技大学 | 一种基于分类器集成的手写维文字符识别方法 |
CN103390173A (zh) * | 2013-07-24 | 2013-11-13 | 佳都新太科技股份有限公司 | 一种基于svm置信度的车牌字符投票算法 |
CN103530607A (zh) * | 2013-09-30 | 2014-01-22 | 智慧城市系统服务(中国)有限公司 | 一种人手检测与识别的方法与装置 |
CN103927550A (zh) * | 2014-04-22 | 2014-07-16 | 苏州大学 | 一种手写体数字识别方法及系统 |
CN103984856A (zh) * | 2014-06-19 | 2014-08-13 | 江苏新瑞峰信息科技有限公司 | 一种基于神经网络的墙体纵向裂缝宽度预测系统及方法 |
CN106127198A (zh) * | 2016-06-20 | 2016-11-16 | 华南师范大学 | 一种基于多分类器集成的图像文字识别方法 |
CN106156784A (zh) * | 2015-03-30 | 2016-11-23 | 联想(北京)有限公司 | 一种特征识别方法及电子设备 |
CN103679185B (zh) * | 2012-08-31 | 2017-06-16 | 富士通株式会社 | 卷积神经网络分类器系统、其训练方法、分类方法和用途 |
CN107004160A (zh) * | 2014-11-27 | 2017-08-01 | 隆沙有限公司 | 采用多个二进制支持向量机计算类的后验概率 |
CN107025452A (zh) * | 2016-01-29 | 2017-08-08 | 富士通株式会社 | 图像识别方法和图像识别设备 |
WO2017167046A1 (zh) * | 2016-03-29 | 2017-10-05 | 阿里巴巴集团控股有限公司 | 一种字符识别方法和装置 |
CN109145765A (zh) * | 2018-07-27 | 2019-01-04 | 华南理工大学 | 人脸检测方法、装置、计算机设备和存储介质 |
CN109271544A (zh) * | 2018-07-11 | 2019-01-25 | 中国科学院自动化研究所 | 自动挑选画家代表作的方法及装置 |
CN110084225A (zh) * | 2019-05-16 | 2019-08-02 | 中国联合网络通信集团有限公司 | 基于5g云存储的扫描、数字运算及打印装置和系统 |
CN111770706A (zh) * | 2017-12-28 | 2020-10-13 | 数眠公司 | 具有打鼾检测特征的床 |
-
2009
- 2009-07-31 CN CN200910089147A patent/CN101630367A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102279927B (zh) * | 2010-06-08 | 2013-10-23 | 富士通株式会社 | 拒识方法和拒识装置 |
CN102279927A (zh) * | 2010-06-08 | 2011-12-14 | 富士通株式会社 | 拒识方法和拒识装置 |
CN102622610A (zh) * | 2012-03-05 | 2012-08-01 | 西安电子科技大学 | 一种基于分类器集成的手写维文字符识别方法 |
CN103679185B (zh) * | 2012-08-31 | 2017-06-16 | 富士通株式会社 | 卷积神经网络分类器系统、其训练方法、分类方法和用途 |
CN103390173A (zh) * | 2013-07-24 | 2013-11-13 | 佳都新太科技股份有限公司 | 一种基于svm置信度的车牌字符投票算法 |
CN103530607A (zh) * | 2013-09-30 | 2014-01-22 | 智慧城市系统服务(中国)有限公司 | 一种人手检测与识别的方法与装置 |
CN103530607B (zh) * | 2013-09-30 | 2016-11-09 | 深圳市中智科创机器人有限公司 | 一种人手检测与识别的方法与装置 |
CN103927550A (zh) * | 2014-04-22 | 2014-07-16 | 苏州大学 | 一种手写体数字识别方法及系统 |
CN103927550B (zh) * | 2014-04-22 | 2017-09-08 | 苏州大学 | 一种手写体数字识别方法及系统 |
CN103984856A (zh) * | 2014-06-19 | 2014-08-13 | 江苏新瑞峰信息科技有限公司 | 一种基于神经网络的墙体纵向裂缝宽度预测系统及方法 |
CN107004160A (zh) * | 2014-11-27 | 2017-08-01 | 隆沙有限公司 | 采用多个二进制支持向量机计算类的后验概率 |
US10726349B2 (en) | 2014-11-27 | 2020-07-28 | Longsand Limited | Calculating posterior probability of classes |
CN106156784A (zh) * | 2015-03-30 | 2016-11-23 | 联想(北京)有限公司 | 一种特征识别方法及电子设备 |
CN107025452A (zh) * | 2016-01-29 | 2017-08-08 | 富士通株式会社 | 图像识别方法和图像识别设备 |
WO2017167046A1 (zh) * | 2016-03-29 | 2017-10-05 | 阿里巴巴集团控股有限公司 | 一种字符识别方法和装置 |
CN107239786A (zh) * | 2016-03-29 | 2017-10-10 | 阿里巴巴集团控股有限公司 | 一种字符识别方法和装置 |
US10872274B2 (en) | 2016-03-29 | 2020-12-22 | Alibaba Group Holding Limited | Character recognition method and device |
TWI766855B (zh) * | 2016-03-29 | 2022-06-11 | 香港商阿里巴巴集團服務有限公司 | 一種字符識別方法和裝置 |
CN106127198A (zh) * | 2016-06-20 | 2016-11-16 | 华南师范大学 | 一种基于多分类器集成的图像文字识别方法 |
CN111770706A (zh) * | 2017-12-28 | 2020-10-13 | 数眠公司 | 具有打鼾检测特征的床 |
CN109271544A (zh) * | 2018-07-11 | 2019-01-25 | 中国科学院自动化研究所 | 自动挑选画家代表作的方法及装置 |
CN109271544B (zh) * | 2018-07-11 | 2020-11-13 | 中国科学院自动化研究所 | 自动挑选画家代表作的方法及装置 |
CN109145765A (zh) * | 2018-07-27 | 2019-01-04 | 华南理工大学 | 人脸检测方法、装置、计算机设备和存储介质 |
CN110084225A (zh) * | 2019-05-16 | 2019-08-02 | 中国联合网络通信集团有限公司 | 基于5g云存储的扫描、数字运算及打印装置和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101630367A (zh) | 基于多分类器的手写体字符识别拒识方法 | |
Waegeman et al. | ROC analysis in ordinal regression learning | |
Cortes et al. | Confidence intervals for the area under the ROC curve | |
CN103632168B (zh) | 一种机器学习中的分类器集成方法 | |
CN101359372B (zh) | 分类器的训练方法及装置、识别敏感图片的方法及装置 | |
Shanthi et al. | Feature relevance analysis and classification of road traffic accident data through data mining techniques | |
CN102436589B (zh) | 一种基于多类基元自主学习的复杂目标自动识别方法 | |
CN100595780C (zh) | 一种基于模块神经网络的手写体数字自动识别方法 | |
CN102324038B (zh) | 一种基于数字图像的植物种类识别方法 | |
CN109783879B (zh) | 一种雷达辐射源信号识别效能评估方法及系统 | |
CN105389593A (zh) | 基于surf特征的图像物体识别方法 | |
CN106599913A (zh) | 一种基于聚类的多标签不平衡生物医学数据分类方法 | |
CN105205501A (zh) | 一种多分类器联合的弱标注图像对象检测方法 | |
CN102254193A (zh) | 基于相关向量机的多类数据分类方法 | |
CN106326913A (zh) | 一种洗钱账户的确定方法及装置 | |
CN106651574A (zh) | 一种个人信用评估方法及装置 | |
CN106778603A (zh) | 一种基于梯度式级联svm分类器的行人识别方法 | |
CN105975611A (zh) | 自适应组合降采样增强学习机 | |
CN103679160A (zh) | 一种人脸识别方法和装置 | |
CN106570076A (zh) | 一种计算机文本分类系统 | |
CN109255029A (zh) | 一种采用加权优化训练集增强自动Bug报告分配的方法 | |
CN103631753A (zh) | 递减子空间集成学习算法 | |
CN103077399A (zh) | 基于集成级联架构的生物显微图像分类方法 | |
Sanlı et al. | Comparison of the accuracy of classification algorithms on three data-sets in data mining: Example of 20 classes | |
CN106780422A (zh) | 一种基于Choquet积分的显著图融合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100120 |