CN101630368B - 一种用于手写汉字识别的用户书写风格自适应方法 - Google Patents

一种用于手写汉字识别的用户书写风格自适应方法 Download PDF

Info

Publication number
CN101630368B
CN101630368B CN2009100421175A CN200910042117A CN101630368B CN 101630368 B CN101630368 B CN 101630368B CN 2009100421175 A CN2009100421175 A CN 2009100421175A CN 200910042117 A CN200910042117 A CN 200910042117A CN 101630368 B CN101630368 B CN 101630368B
Authority
CN
China
Prior art keywords
sample
average
incremental learning
lda
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100421175A
Other languages
English (en)
Other versions
CN101630368A (zh
Inventor
金连文
黄志斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN2009100421175A priority Critical patent/CN101630368B/zh
Publication of CN101630368A publication Critical patent/CN101630368A/zh
Application granted granted Critical
Publication of CN101630368B publication Critical patent/CN101630368B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明提供一种用于手写汉字识别的用户书写风格自适应方法,主要包括普通ILDA书写者自适应方法,基于权重的ILDA书写者自适应方法。其原理为利用具有用户个性风格的增量学习样本动态更新LDA识别模型,使更新后的LDA识别模型能自适应用户的书写风格。从而达到提高识别率的效果。本发明创新性的把ILDA应用于汉字识别领域,解决了手写汉字识别引擎对特定用户识别率不高的问题。利用本发明提供的方法,手写汉字识别引擎能自适应用户的手写风格,提高识别准确度。

Description

一种用于手写汉字识别的用户书写风格自适应方法
技术领域
本发明属于利用计算机处理设备识别手写文字图像的技术领域,特别是涉及一种用于手写汉字识别的书写自适应方法。
技术背景
手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来,对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。
发明内容
本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应用户书写风格从而提高识别率的方法。
本发明采用的技术方案为:
一种用于手写汉字识别的用户书写风格自适应方法,其步骤如下:
(1)、选取用户少量的增量学习样本;
(2)、动态更新模板均值;
(3)、基于ILDA的增量学习,通过采用增量的线性判决分析ILDA方法进行增量学习;
(4)、动态更新识别分类器;
所述步骤(1)为选择用户少量的样本,用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设增量学习样本均值为总个数为L。原始样本总个数为N,原始样本总均值为
Figure GSB00000546050700022
则新的样本总均值为
x ′ ‾ = N x ‾ + L y ‾ N + L
所述步骤(2)利用增量学习样本动态更新模板均值,其步骤包括:
(A)、恢复模板样本均值。当前识别引擎使用的模板都是经过线性判决分析LDA变换,LDA变换的目的是使各个汉字类别能最大程度的分开,从而提高识别率。但是在动态更新模板过程中,需要使用到原始模板均值。为此需要对汉字模板进行逆LDA变换。设LDA变换矩阵为Wlda,其逆矩阵为
Figure GSB00000546050700024
类别c经过LDA变换后的模板为
Figure GSB00000546050700025
原始模板均值为
Figure GSB00000546050700026
通过以下公式可求得原始模板均值。
x ‾ c = W lda - 1 x ldac
(B)、增量学习样本特征提取。对于每一个样本,都采用八方向特征提取方法对增量学习样本提取其八方向特征。
(C)、更新模板均值。设样本类别数为p,每一类别经过LDA逆变换后的原始模板均值为
Figure GSB00000546050700031
原始样本个数为nc,增量学习样本的均值为
Figure GSB00000546050700032
增量学习样本的个数为lc,则新的样本均值为
Figure GSB00000546050700033
可由以下公式求得:
Figure GSB00000546050700034
其中r为增量学习样本占原始样本总个数的百分比;
所述步骤(3)利用增量学习样本,更新LDA模型。LDA变换矩阵由类间散度矩阵Sb与类内散度矩阵Sw决定。由于引入了增量学习样本,Sb与Sw都发生了变化。所以需要重新计算出Sb与Sw。其步骤包括:
(A)、求类间散度矩阵S′b,计算S′b的公式为
S ′ b = Σ c = 1 M c ′ c ( x ′ ‾ c - x ′ ‾ ) ( x ′ ‾ c - x ′ ‾ ) T
其中n′c为此类别样本总数,
Figure GSB00000546050700036
为每一类别的模板均值,
Figure GSB00000546050700037
为所有类别的总均值,T代表矩阵的转置,M为原始训练样本与增量样本混合后的总类别数。
(B)、求类内散度矩阵S′w,计算S′w的公式为
S ′ w = Σ c = 1 M Σ ′ c = Σ c = 1 T Σ j = 1 n ′ c ( x cj - x ′ ‾ c ) ( x cj - x ′ ‾ c ) T
用此公式计算类内散度矩阵Sw,计算量大且没有利用以前计算的Sw矩阵,通过对此公式进行化简,可得新的计算公式:
S ′ w = S w + S yw + Σ c ∈ Ψ n c l c n c + l c ( y ‾ c - x ‾ c ) ( y ‾ c - x ‾ c ) T
此公式中,Sw为原先识别引擎的样本类内散度矩阵,Syw为增量学习样本的类内散度矩阵,Ψ为存在增量样本的类别的集合,M为原始训练样本与增量样本混合后的总类别数,通过此公式,可以快速的求出S′w矩阵。
(C)、求新LDA变换矩阵。计算
Figure GSB00000546050700041
的特征向量,以特征向量作为列向量生成LDA变换矩阵W′lda
所述步骤(4)动态更新识别分类器,利用新的LDA变换矩阵W′lda,对每一类别新的模板均值做LDA变换,变换公式如下:
x ′ ‾ ldac = W lda ′ x ′ ‾ c
经过(1)~(4)步骤,基于增量LDA的书写者自适应过程更新完毕。
本发明首次提出了与用户相关的手写自适应技术,手写识别引擎能自动的根据用户的书写风格自动调整其识别模型及参数,把用户无关的识别系统转变为用户相关的识别系统,从而大大提高了对相关用户手写汉字的识别准确率,同时,该识别引擎对于其他用户,其识别准确率仍能基本保持不变。
附图说明
图1是本发明的系统结构框图;
图2是本发明的动态更新模板均值的流程框图;
图3是对基于ILDA的增量学习的流程框图;
图4是识别引擎进行汉字识别的流程框图。
具体实施方式
下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板书写汉字,用计算机进行识别,用纯平型显示器显示用户图形界面,可采用C语言编制各类处理程序,便能较好地实施本发明。
本发明的系统结构如附图1所示,采用八方向特征提取方法对增量学习样本进行特征提取,更新每一个类别的模板均值,接着求出新的类内散度矩阵和类间散度矩阵,通过类内散度矩阵与类间散度矩阵求出新的LDA变换矩阵,最后通过新的LDA变换矩阵对新的模板均值进行变换,计算出新的模板与分类器。
本发明中的选择用户少量的样本,用于更新模板及识别引擎,具体实施方法为在用户样本选择时,应能充分体现用户的书写风格。设增量学习样本均值为
Figure GSB00000546050700051
总个数为L。原始样本总个数为N,原始样本总均值为
Figure GSB00000546050700052
由于在实际实施过程中,每一个类别L的个数不一样,有的甚至相差很大,把增量学习样本的个数统一成固定值,并以假设占原始样本总个数N的r百分比。则新的样本总均值为
x ‾ ′ = N x ‾ + ( N × r ) y ‾ ( 1 + r ) × N = x ‾ + r × y ‾ ( 1 + r )
本发明中的利用增量学习样本动态更新模板均值过程如附图2所示,具体包括以下三个骤:
(A)、恢复模板样本均值。当前识别引擎使用的模板都是经过LDA变换,LDA变换的目的是使各个汉字类别能最大程度的分开,从而提高识别率。但是在动态更新模板过程中,需要使用到原始模板均值。为此需要对汉字模板进行逆LDA变换。设LDA变换矩阵为Wlda,其逆矩阵为
Figure GSB00000546050700054
类别c经过LDA变换后的模板为
Figure GSB00000546050700055
原始模板均值为
Figure GSB00000546050700056
通过公式以下可求得原始模板均值。
x ‾ c = W lda - 1 x ldac
(B)、增量学习样本特征提取。对于每一个样本,都采用八方向特征提取方法对增量学习样本提取其八方向特征。
(C)、更新模板均值。设样本类别数为p,每一类别经过LDA逆变换后的原始模板均值为
Figure GSB00000546050700061
原始样本个数为nc,增量学习样本的均值为
Figure GSB00000546050700062
增量学习样本的个数为lc,则新的样本均值为
Figure GSB00000546050700063
可由以下公式求得:
x ′ ‾ c = n c x ‾ c + ( r × n c ) y ‾ c ( 1 + r ) n c = x ‾ c + r × y ‾ c ( 1 + r )
本发明中的利用增量学习样本过程如附图3所示,更新LDA模型,其具体实施步骤包括以下三个步骤:
LDA变换矩阵由类间散度矩阵Sb与类内散度矩阵Sw决定。由于引入了增量学习样本,Sb与Sw都发生了变化。所以需要重新计算出Sb与Sw。其步骤包括:
(A)、求类间散度矩阵S′b,计算S′b的公式为
S ′ b = Σ c = 1 M n ′ c ( x ′ ‾ c - x ′ ‾ ) ( x ′ ‾ c - x ′ ‾ ) T
其中n′c为此类别样本总数,
Figure GSB00000546050700066
为每一类别的模板均值,为所有类别的总均值,T代表矩阵的转置,M为原始训练样本与增量样本混合后的总类别数。
(B)、求类内散度矩阵S′w,计算S′w的公式为
S ′ w = Σ c = 1 M Σ ′ c = Σ c = 1 T Σ j = 1 n ′ c ( x cj - x ′ ‾ c ) ( x cj - x ′ ‾ c ) T
用此公式计算类内散度矩阵Sw,计算量大且没有利用以前计算的Sw矩阵,通过对此公式进行化简,可得新的计算公式:
S ′ w = S w + S yw + Σ c ∈ Ψ n c l c n c + l c ( y ‾ c - x ‾ c ) ( y ‾ c - x ‾ c ) T
此公式中,Sw为原先识别引擎的样本类内散度矩阵,Syw为增量学习样本的类内散度矩阵,Ψ为存在增量样本的类别的集合,M为原始训练样本与增量样本混合后的总的类别数。通过此公式,可以快速的求出S′w矩阵。
(C)、求新LDA变换矩阵。计算
Figure GSB00000546050700071
的特征向量,以特征向量作为列向量生成LDA变换矩阵W′lda
本发明中的动态更新识别分类器,具体实施为利用新的LDA变换矩阵W′lda,对每一类别新的模板均值做LDA变换,变换公式如下:
x ′ ‾ ldac = W lda ′ x ′ ‾ c
采用本发明的基于增量LDA的书写者自适应技术用其优异的性能通过大样本和大类别的实验得到了证实。利用本发明的识别引擎进行汉字识别的流程如附图4所示。
下面描述采用本发明所述的方法,对大量联机手写汉字样本的进行相关实验的结果。
本发明采用的了两个数据库的子集作为实验使用数据,一是由本实验室采集并已公开发布SCUT-COUCH联机手写样本数据库中的一级汉字样本数据子集,该子集包括168位不同书写者的3755个国标一级汉字样本,每位书写者独立书写完成一套样本数据,称此数据库为数据库A。二是由本实验室采集的8888个汉字词组,把这些词组全切出来变成单字构成的数据库。这些词组中的单字均为一二级汉字,经过统计分析,这些词组切成单字后,共包括2078类一级汉字,该子集包括30位不同书写者的8888个词组,共19595个汉字,称为数据库B。
对于数据库A,为了对3755个类进行测试,每个类的样本数目,随机选取总数的80%左右进行训练,余下20%左右进行测试,对于SCUT-COUCH数据,每个类别随机选取134套样本进行训练,剩下34套样本进行测试,称为数据库A测试集。
对于数据库B,对于每一套数据,由于其中的汉字大部分都有重复。故按照实验的需要,随机取一定比例重复的汉字,作为更新集,称为数据库B更新集,剩下的数据作为测试集,称为数据库B测试集。
下表列出的是当增量学习样本占总样本的比例不同时,没有采用本发明与采用本发明对特定用户书写汉字的识别率。
Figure GSB00000546050700081
由表可知,对于指定的用户,采用基于增量LDA的书写者自适应技术后,对该用户的汉字识别率有较大幅度的提高。
下表中列出的是当增量学习样本占总样本的比例不同时,没有采用本发明与采用本发明对普通用户书写汉字的识别率。
Figure GSB00000546050700082
由表可知,采用了基于增量LDA的书写者自适应技术后,对其他用户的手写汉字的识别率,影响非常的小。

Claims (1)

1.一种用于手写汉字识别的用户书写风格自适应方法,其特征在于包括如下步骤:
(1)、选取用于更新模板及识别引擎的用户增量学习样本;
(2)、采用增量学习样本动态更新模板均值;
(3)、采用增量学习样本更新线性判决分析模型;
(4)、动态更新识别分类器;
所述步骤(1)选取用户的增量学习样本,用于更新模板及识别引擎,具体操作为:令增量学习的全部样本均值为
Figure FSB00000546050600011
总个数为L,原始样本总个数为N,全部原始样本的均值为
Figure FSB00000546050600012
经过增量学习后,新的全体样本的均值为
Figure FSB00000546050600013
所述步骤(2)具体更新步骤如下:
(21)、恢复模板样本均值,令线性判决分析变换矩阵为Wlda,其逆矩阵为类别c经过线性判决分析变换后的模板为
Figure FSB00000546050600015
该类别的原始的模板均值为
Figure FSB00000546050600016
通过该公式可以利用
Figure FSB00000546050600017
来计算
Figure FSB00000546050600018
x ‾ c = W lda - 1 x ldac
(22)、更新模板均值,令样本类别数为p,每一类别经过线性判决分析逆变换后的原始模板均值为
Figure FSB000005460506000110
原始样本个数为nc,增量学习样本的均值为
Figure FSB000005460506000111
增量学习样本的个数为lc,则新的样本均值为
Figure FSB000005460506000112
由以下公式求得:
Figure FSB00000546050600021
其中r为增量学习样本占原始样本总个数的百分比;
所述步骤(3)具体包括如下步骤:
(31)、计算类间散度矩阵S′b
Figure FSB00000546050600022
其中n′c为此类别样本总数,为新的样本均值,
Figure FSB00000546050600024
为所有类别的总均值,T代表矩阵的转置,M为原始训练样本与增量样本混合后的总的类别数;
(32)、计算类内散度矩阵S′w
Figure FSB00000546050600025
并进行简化,得到
Figure FSB00000546050600026
其中,Sw为原先识别引擎的样本类内散度矩阵,Syw为增量学习样本的类内散度矩阵,Ψ为存在增量样本的类别的集合,M为原始训练样本与增量样本混合后的总的类别数;
(33)、计算新的线性判决分析变换矩阵,即计算的特征向量,以特征向量作为列向量生成线性判决分析变换矩阵W′lda
所述步骤(4)利用新的线性判决分析变换矩阵W′lda,对每一类别新的模板均值做线性判决分析变换,变换公式如下:
x ′ ‾ ldac = W lda ′ x ′ ‾ c .
CN2009100421175A 2009-08-25 2009-08-25 一种用于手写汉字识别的用户书写风格自适应方法 Expired - Fee Related CN101630368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100421175A CN101630368B (zh) 2009-08-25 2009-08-25 一种用于手写汉字识别的用户书写风格自适应方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100421175A CN101630368B (zh) 2009-08-25 2009-08-25 一种用于手写汉字识别的用户书写风格自适应方法

Publications (2)

Publication Number Publication Date
CN101630368A CN101630368A (zh) 2010-01-20
CN101630368B true CN101630368B (zh) 2011-09-14

Family

ID=41575471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100421175A Expired - Fee Related CN101630368B (zh) 2009-08-25 2009-08-25 一种用于手写汉字识别的用户书写风格自适应方法

Country Status (1)

Country Link
CN (1) CN101630368B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184426B (zh) * 2011-04-28 2013-03-20 华南理工大学 一种使手写汉字识别引擎能动态适应用户书写风格的方法
CN102298704A (zh) * 2011-04-28 2011-12-28 华南理工大学 一种基于加权增量二次鉴别函数的书写者自适应方法
CN102184425B (zh) * 2011-04-28 2014-04-02 华南理工大学 一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法
CN102184424B (zh) * 2011-04-28 2013-07-10 华南理工大学 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法
CN105844286A (zh) * 2016-03-11 2016-08-10 博康智能信息技术有限公司 新增车标的识别方法和装置
CN108764195B (zh) * 2018-06-04 2023-04-18 平安科技(深圳)有限公司 手写模型训练方法、手写字识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN101630368A (zh) 2010-01-20

Similar Documents

Publication Publication Date Title
CN101630368B (zh) 一种用于手写汉字识别的用户书写风格自适应方法
US20060274943A1 (en) Personalized implicit and explicit character shape adaptation and recognition
CN101627398B (zh) 用于手写东亚字符的基于偏旁的hmm建模
CN102736821B (zh) 基于滑动轨迹确定候选词的方法和装置
WO2009023648A2 (en) Hidden markov model based handwriting/calligraphy generation
CN102663454B (zh) 一种字符书写规范度评测的方法和装置
CN101630362B (zh) 一种基于置信度的汉字书写质量评价方法
CN106529525A (zh) 一种中日文手写字符的识别方法
CN102073706B (zh) 分布式文件存储系统和关系数据库的结合应用方法
CN102750552B (zh) 一种手写识别方法、系统及手写识别终端
JP2009506464A5 (zh)
CN102013010A (zh) 一种交互式篇章级手写识别方法及系统
CN101339703A (zh) 基于计算机的练习文字书写的方法
CN110502655A (zh) 一种嵌入场景文字信息的图像自然描述语句生成方法
CN108304424A (zh) 文本关键词提取方法及文本关键词提取装置
CN111273911A (zh) 基于双向lstm和注意力机制的软件技术债务识别方法
CN105893809A (zh) 使用svm分类器识别智能终端用户身份的方法
CN104347071A (zh) 生成口语考试参考答案的方法及系统
CN104166860A (zh) 基于约束的面向单个测试样本的人脸识别方法
CN106650686A (zh) 一种基于隐马尔科夫模型的联机手写化学符号识别方法
CN101604392B (zh) 一种用于联机手写汉字识别的汉字笔画特征并行提取方法
CN101604393B (zh) 一种用于联机手写汉字识别的汉字笔画特征提取方法
CN102184426B (zh) 一种使手写汉字识别引擎能动态适应用户书写风格的方法
Kunwar et al. Online handwritten Kannada word recognizer with unrestricted vocabulary
CN102184424B (zh) 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110914

Termination date: 20170825