CN101630368B - 一种用于手写汉字识别的用户书写风格自适应方法 - Google Patents
一种用于手写汉字识别的用户书写风格自适应方法 Download PDFInfo
- Publication number
- CN101630368B CN101630368B CN2009100421175A CN200910042117A CN101630368B CN 101630368 B CN101630368 B CN 101630368B CN 2009100421175 A CN2009100421175 A CN 2009100421175A CN 200910042117 A CN200910042117 A CN 200910042117A CN 101630368 B CN101630368 B CN 101630368B
- Authority
- CN
- China
- Prior art keywords
- sample
- average
- incremental learning
- lda
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明提供一种用于手写汉字识别的用户书写风格自适应方法,主要包括普通ILDA书写者自适应方法,基于权重的ILDA书写者自适应方法。其原理为利用具有用户个性风格的增量学习样本动态更新LDA识别模型,使更新后的LDA识别模型能自适应用户的书写风格。从而达到提高识别率的效果。本发明创新性的把ILDA应用于汉字识别领域,解决了手写汉字识别引擎对特定用户识别率不高的问题。利用本发明提供的方法,手写汉字识别引擎能自适应用户的手写风格,提高识别准确度。
Description
技术领域
本发明属于利用计算机处理设备识别手写文字图像的技术领域,特别是涉及一种用于手写汉字识别的书写自适应方法。
技术背景
手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来,对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。
发明内容
本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应用户书写风格从而提高识别率的方法。
本发明采用的技术方案为:
一种用于手写汉字识别的用户书写风格自适应方法,其步骤如下:
(1)、选取用户少量的增量学习样本;
(2)、动态更新模板均值;
(3)、基于ILDA的增量学习,通过采用增量的线性判决分析ILDA方法进行增量学习;
(4)、动态更新识别分类器;
所述步骤(2)利用增量学习样本动态更新模板均值,其步骤包括:
(A)、恢复模板样本均值。当前识别引擎使用的模板都是经过线性判决分析LDA变换,LDA变换的目的是使各个汉字类别能最大程度的分开,从而提高识别率。但是在动态更新模板过程中,需要使用到原始模板均值。为此需要对汉字模板进行逆LDA变换。设LDA变换矩阵为Wlda,其逆矩阵为类别c经过LDA变换后的模板为原始模板均值为通过以下公式可求得原始模板均值。
(B)、增量学习样本特征提取。对于每一个样本,都采用八方向特征提取方法对增量学习样本提取其八方向特征。
所述步骤(3)利用增量学习样本,更新LDA模型。LDA变换矩阵由类间散度矩阵Sb与类内散度矩阵Sw决定。由于引入了增量学习样本,Sb与Sw都发生了变化。所以需要重新计算出Sb与Sw。其步骤包括:
(A)、求类间散度矩阵S′b,计算S′b的公式为
(B)、求类内散度矩阵S′w,计算S′w的公式为
用此公式计算类内散度矩阵Sw,计算量大且没有利用以前计算的Sw矩阵,通过对此公式进行化简,可得新的计算公式:
此公式中,Sw为原先识别引擎的样本类内散度矩阵,Syw为增量学习样本的类内散度矩阵,Ψ为存在增量样本的类别的集合,M为原始训练样本与增量样本混合后的总类别数,通过此公式,可以快速的求出S′w矩阵。
所述步骤(4)动态更新识别分类器,利用新的LDA变换矩阵W′lda,对每一类别新的模板均值做LDA变换,变换公式如下:
经过(1)~(4)步骤,基于增量LDA的书写者自适应过程更新完毕。
本发明首次提出了与用户相关的手写自适应技术,手写识别引擎能自动的根据用户的书写风格自动调整其识别模型及参数,把用户无关的识别系统转变为用户相关的识别系统,从而大大提高了对相关用户手写汉字的识别准确率,同时,该识别引擎对于其他用户,其识别准确率仍能基本保持不变。
附图说明
图1是本发明的系统结构框图;
图2是本发明的动态更新模板均值的流程框图;
图3是对基于ILDA的增量学习的流程框图;
图4是识别引擎进行汉字识别的流程框图。
具体实施方式
下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板书写汉字,用计算机进行识别,用纯平型显示器显示用户图形界面,可采用C语言编制各类处理程序,便能较好地实施本发明。
本发明的系统结构如附图1所示,采用八方向特征提取方法对增量学习样本进行特征提取,更新每一个类别的模板均值,接着求出新的类内散度矩阵和类间散度矩阵,通过类内散度矩阵与类间散度矩阵求出新的LDA变换矩阵,最后通过新的LDA变换矩阵对新的模板均值进行变换,计算出新的模板与分类器。
本发明中的选择用户少量的样本,用于更新模板及识别引擎,具体实施方法为在用户样本选择时,应能充分体现用户的书写风格。设增量学习样本均值为总个数为L。原始样本总个数为N,原始样本总均值为由于在实际实施过程中,每一个类别L的个数不一样,有的甚至相差很大,把增量学习样本的个数统一成固定值,并以假设占原始样本总个数N的r百分比。则新的样本总均值为
本发明中的利用增量学习样本动态更新模板均值过程如附图2所示,具体包括以下三个骤:
(A)、恢复模板样本均值。当前识别引擎使用的模板都是经过LDA变换,LDA变换的目的是使各个汉字类别能最大程度的分开,从而提高识别率。但是在动态更新模板过程中,需要使用到原始模板均值。为此需要对汉字模板进行逆LDA变换。设LDA变换矩阵为Wlda,其逆矩阵为类别c经过LDA变换后的模板为原始模板均值为通过公式以下可求得原始模板均值。
(B)、增量学习样本特征提取。对于每一个样本,都采用八方向特征提取方法对增量学习样本提取其八方向特征。
本发明中的利用增量学习样本过程如附图3所示,更新LDA模型,其具体实施步骤包括以下三个步骤:
LDA变换矩阵由类间散度矩阵Sb与类内散度矩阵Sw决定。由于引入了增量学习样本,Sb与Sw都发生了变化。所以需要重新计算出Sb与Sw。其步骤包括:
(A)、求类间散度矩阵S′b,计算S′b的公式为
(B)、求类内散度矩阵S′w,计算S′w的公式为
用此公式计算类内散度矩阵Sw,计算量大且没有利用以前计算的Sw矩阵,通过对此公式进行化简,可得新的计算公式:
此公式中,Sw为原先识别引擎的样本类内散度矩阵,Syw为增量学习样本的类内散度矩阵,Ψ为存在增量样本的类别的集合,M为原始训练样本与增量样本混合后的总的类别数。通过此公式,可以快速的求出S′w矩阵。
本发明中的动态更新识别分类器,具体实施为利用新的LDA变换矩阵W′lda,对每一类别新的模板均值做LDA变换,变换公式如下:
采用本发明的基于增量LDA的书写者自适应技术用其优异的性能通过大样本和大类别的实验得到了证实。利用本发明的识别引擎进行汉字识别的流程如附图4所示。
下面描述采用本发明所述的方法,对大量联机手写汉字样本的进行相关实验的结果。
本发明采用的了两个数据库的子集作为实验使用数据,一是由本实验室采集并已公开发布SCUT-COUCH联机手写样本数据库中的一级汉字样本数据子集,该子集包括168位不同书写者的3755个国标一级汉字样本,每位书写者独立书写完成一套样本数据,称此数据库为数据库A。二是由本实验室采集的8888个汉字词组,把这些词组全切出来变成单字构成的数据库。这些词组中的单字均为一二级汉字,经过统计分析,这些词组切成单字后,共包括2078类一级汉字,该子集包括30位不同书写者的8888个词组,共19595个汉字,称为数据库B。
对于数据库A,为了对3755个类进行测试,每个类的样本数目,随机选取总数的80%左右进行训练,余下20%左右进行测试,对于SCUT-COUCH数据,每个类别随机选取134套样本进行训练,剩下34套样本进行测试,称为数据库A测试集。
对于数据库B,对于每一套数据,由于其中的汉字大部分都有重复。故按照实验的需要,随机取一定比例重复的汉字,作为更新集,称为数据库B更新集,剩下的数据作为测试集,称为数据库B测试集。
下表列出的是当增量学习样本占总样本的比例不同时,没有采用本发明与采用本发明对特定用户书写汉字的识别率。
由表可知,对于指定的用户,采用基于增量LDA的书写者自适应技术后,对该用户的汉字识别率有较大幅度的提高。
下表中列出的是当增量学习样本占总样本的比例不同时,没有采用本发明与采用本发明对普通用户书写汉字的识别率。
由表可知,采用了基于增量LDA的书写者自适应技术后,对其他用户的手写汉字的识别率,影响非常的小。
Claims (1)
1.一种用于手写汉字识别的用户书写风格自适应方法,其特征在于包括如下步骤:
(1)、选取用于更新模板及识别引擎的用户增量学习样本;
(2)、采用增量学习样本动态更新模板均值;
(3)、采用增量学习样本更新线性判决分析模型;
(4)、动态更新识别分类器;
所述步骤(2)具体更新步骤如下:
所述步骤(3)具体包括如下步骤:
(32)、计算类内散度矩阵S′w,并进行简化,得到其中,Sw为原先识别引擎的样本类内散度矩阵,Syw为增量学习样本的类内散度矩阵,Ψ为存在增量样本的类别的集合,M为原始训练样本与增量样本混合后的总的类别数;
(33)、计算新的线性判决分析变换矩阵,即计算的特征向量,以特征向量作为列向量生成线性判决分析变换矩阵W′lda;
所述步骤(4)利用新的线性判决分析变换矩阵W′lda,对每一类别新的模板均值做线性判决分析变换,变换公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100421175A CN101630368B (zh) | 2009-08-25 | 2009-08-25 | 一种用于手写汉字识别的用户书写风格自适应方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100421175A CN101630368B (zh) | 2009-08-25 | 2009-08-25 | 一种用于手写汉字识别的用户书写风格自适应方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101630368A CN101630368A (zh) | 2010-01-20 |
CN101630368B true CN101630368B (zh) | 2011-09-14 |
Family
ID=41575471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100421175A Expired - Fee Related CN101630368B (zh) | 2009-08-25 | 2009-08-25 | 一种用于手写汉字识别的用户书写风格自适应方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101630368B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184426B (zh) * | 2011-04-28 | 2013-03-20 | 华南理工大学 | 一种使手写汉字识别引擎能动态适应用户书写风格的方法 |
CN102298704A (zh) * | 2011-04-28 | 2011-12-28 | 华南理工大学 | 一种基于加权增量二次鉴别函数的书写者自适应方法 |
CN102184425B (zh) * | 2011-04-28 | 2014-04-02 | 华南理工大学 | 一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法 |
CN102184424B (zh) * | 2011-04-28 | 2013-07-10 | 华南理工大学 | 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法 |
CN105844286A (zh) * | 2016-03-11 | 2016-08-10 | 博康智能信息技术有限公司 | 新增车标的识别方法和装置 |
CN108764195B (zh) * | 2018-06-04 | 2023-04-18 | 平安科技(深圳)有限公司 | 手写模型训练方法、手写字识别方法、装置、设备及介质 |
-
2009
- 2009-08-25 CN CN2009100421175A patent/CN101630368B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101630368A (zh) | 2010-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101630368B (zh) | 一种用于手写汉字识别的用户书写风格自适应方法 | |
US20060274943A1 (en) | Personalized implicit and explicit character shape adaptation and recognition | |
CN101627398B (zh) | 用于手写东亚字符的基于偏旁的hmm建模 | |
CN102736821B (zh) | 基于滑动轨迹确定候选词的方法和装置 | |
WO2009023648A2 (en) | Hidden markov model based handwriting/calligraphy generation | |
CN102663454B (zh) | 一种字符书写规范度评测的方法和装置 | |
CN101630362B (zh) | 一种基于置信度的汉字书写质量评价方法 | |
CN106529525A (zh) | 一种中日文手写字符的识别方法 | |
CN102073706B (zh) | 分布式文件存储系统和关系数据库的结合应用方法 | |
CN102750552B (zh) | 一种手写识别方法、系统及手写识别终端 | |
JP2009506464A5 (zh) | ||
CN102013010A (zh) | 一种交互式篇章级手写识别方法及系统 | |
CN101339703A (zh) | 基于计算机的练习文字书写的方法 | |
CN110502655A (zh) | 一种嵌入场景文字信息的图像自然描述语句生成方法 | |
CN108304424A (zh) | 文本关键词提取方法及文本关键词提取装置 | |
CN111273911A (zh) | 基于双向lstm和注意力机制的软件技术债务识别方法 | |
CN105893809A (zh) | 使用svm分类器识别智能终端用户身份的方法 | |
CN104347071A (zh) | 生成口语考试参考答案的方法及系统 | |
CN104166860A (zh) | 基于约束的面向单个测试样本的人脸识别方法 | |
CN106650686A (zh) | 一种基于隐马尔科夫模型的联机手写化学符号识别方法 | |
CN101604392B (zh) | 一种用于联机手写汉字识别的汉字笔画特征并行提取方法 | |
CN101604393B (zh) | 一种用于联机手写汉字识别的汉字笔画特征提取方法 | |
CN102184426B (zh) | 一种使手写汉字识别引擎能动态适应用户书写风格的方法 | |
Kunwar et al. | Online handwritten Kannada word recognizer with unrestricted vocabulary | |
CN102184424B (zh) | 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110914 Termination date: 20170825 |