CN102184426A

CN102184426A - 一种使手写汉字识别引擎能动态适应用户书写风格的方法

Info

Publication number: CN102184426A
Application number: CN 201110108782
Authority: CN
Inventors: 金连文; 刘岗; 丁凯
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2011-04-28
Filing date: 2011-04-28
Publication date: 2011-09-14
Anticipated expiration: 2031-04-28
Also published as: CN102184426B

Abstract

本发明提供一种使手写汉字识别引擎能动态适应用户书写风格的方法，包括如下步骤：（1）选取用于更新模板及识别引擎的用户增量书写样本；（2）提取增量书写样本的汉字特征，并根据原始LDA模型对该汉字特征进行LDA变换；（3）采用增量书写样本动态更新每个类别的均值向量；（4）采用增量书写样本动态更新每个类别的协方差矩阵；（5）采用增量书写样本更新改进的二次判决函数分类器。利用本发明提供的方法，手写汉字识别引擎能自适应用户的手写风格，提高识别准确度。

Description

一种使手写汉字识别引擎能动态适应用户书写风格的方法

技术背景

手写汉字识别一般是指用户通过手写输入设备（比如：手写板、触摸屏、鼠标等）书写汉字，同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别，即书写一个汉字识别一个汉字。使用的识别引擎与用户无关，即识别引擎事先通过大量的训练样本训练出来，对于不同用户，识别引擎使用的模型及参数都是一样的，事先由开发人员训练并设置好。由于采用了大数据量的训练样本，所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大，每个用户书写风格除了存在共性外，往往还包括自己个性化的地方，与用户无关的识别引擎针对这类用户时书写汉字时，识别准确率往往不尽人意，有待改进。

发明内容

本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足，提供一种让识别引擎能动态适应用户书写风格从而提高识别率的方法。

本发明采用的技术方案为：

一种使手写汉字识别引擎能动态适应用户书写风格的方法，其步骤如下：

（1）、选取用户少量的增量书写样本；

（2）、对增量书写样本提取特征，并根据原始线性判决分析（LDA）模型对增量书写样本特征进行线性判决分析（LDA）变换；

（3）、采用增量书写样本动态更新每个类别的均值向量；

（4）、采用增量书写样本动态更新每个类别的协方差矩阵；

（5）、根据新的均值向量和协方差矩阵，更新改进的二次判决函数（MQDF）分类器。

所述步骤（1）为选择用户少量的样本，用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为X = {x _i } (i=1, … , N)，N为样本数，并设其类别数是M；设增量书写样本为Y = {y _j } (j=1,…,L)，L为增量样本数，并设其类别数是P。则合并后的总的样本可表示为Z =X∪Y = {z _k } (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P。不失一般性，我们假设对于合并后的总样本中的第i (i=1,…,C)类，分别在原始样本N和增量书写样本L中有n _i和l _i个样本。因此，对于合并后新的样本，属于第i (i=1,…,C)类的样本数为s _i =n _i +l _i。

所述步骤（2）对增量书写样本提取特征并进行线性判决分析（LDA）变换，其步骤包括：

（A）、增量书写样本特征提取，对于每一个增量书写样本，都采用八方向特征提取方法提取其方向特征，

（B）、对增量书写样本特征进行线性判决分析（LDA）变换，线性判决分析变换的目的是使各个汉字类别能最大程度的分开，从而提高识别率设经过八方向特征提取后，类别i(i=1,…,C)的原始特征向量为

Figure 2011101087827100002DEST_PATH_IMAGE001

，令原始线性判决分析变换矩阵为

，设经过线性判决分析变换后的特征向量为

Figure 2011101087827100002DEST_PATH_IMAGE003

，则通过以下公式求得

：

。

所述步骤（3）利用增量书写样本动态更新均值向量，其步骤包括：

（A）、设类别i(i=1,…,C)经过线性判决分析变换后的原始均值向量为

Figure 2011101087827100002DEST_PATH_IMAGE005

，原始样本个数为

，则通过以下公式求得

：

Figure 2011101087827100002DEST_PATH_IMAGE007

（B）、设类别i(i=1,…,C)经过线性判决分析变换后的增量书写样本均值向量为，原始样本个数为

，则通过以下公式求得

：

（C）、根据上述（A）、（B）的结果，则设合并后新的样本经过线性判决分析变换后的均值向量为，由以下公式求得：

。

所述步骤（4）利用增量书写样本动态更新协方差矩阵。要求新的合并后的类别i(i=1,…,C)的协方差矩阵，必须先分别求出原始样本协方差矩阵

Figure 2011101087827100002DEST_PATH_IMAGE013

和增量书写样本的协方差矩阵

。其步骤包括：

（A）、求原始样本中类别i(i=1,…,C)的协方差矩阵，原始样本中类别i经过线性判决分析变换后的均值向量为

，样本个数为

，则其协方差矩阵

由以下公式求得：

Figure 2011101087827100002DEST_PATH_IMAGE015

（B）、求增量书写样本中类别i(i=1,…,C)的协方差矩阵，增量书写样本中类别i经过线性判决分析变换后的均值向量为，样本个数为

，则其协方差矩阵

由以下公式求得：

（C）、求合并后新的样本中类别i(i=1,…,C)的协方差矩阵，因上述（A）、（B）步骤已求出原始样本协方差矩阵和增量书写样本的协方差矩阵

，则其协方差矩阵由以下公式求得：

。

所述步骤（5）更新最终的改进的二次判决函数（MQDF）分类器，其步骤包括：

（A）、设

Figure 2011101087827100002DEST_PATH_IMAGE019

代表第i个类别(i=1,…,C)，和

Figure 2011101087827100002DEST_PATH_IMAGE021

分别表示根据步骤（3）和（4）得到的更新后的均值向量和协方差矩阵，并设每个类别的先验概率相等，则原始的二次判决函数（QDF）由以下公式求得：

（B）、根据K-L变换，对协方差矩阵

进行对角化，求得：

Figure 2011101087827100002DEST_PATH_IMAGE023

其中，Λ_i = diag[λ _i1,…,λ _iD]，λ _ij, j=1,…,D是协方差矩阵

的特征值，D是特征的维数。Φ_i = [φ _i1,…,φ _iD]，φ _ij, j=1,…,D是对应的特征向量。Φ_i是标准正交的，Φ^T _iΦ_i = I.

（C）、根据上述公式，将原始的二次判决函数（QDF）写成特征向量和特征值的形式：

（D）、用常量

Figure 2011101087827100002DEST_PATH_IMAGE025

替代较小的特征值，设K为主导特征向量的个数，就得到了最终的修正的二次判决函数（MQDF）分类器，由以下公式求得：

。

经过（1）~（5）步骤，基于增量MQDF的书写者自适应过程更新完毕。

本发明首次提出了与用户相关的手写自适应技术，手写识别引擎能自动的根据用户的书写风格自动调整其识别模型及参数，把用户无关的识别系统转变为用户相关的识别系统，从而大大提高了对相关用户手写汉字的识别准确率，同时，该识别引擎对于其他用户，其识别准确率仍能基本保持不变。

附图说明

图1是本发明的系统结构框图；

图2是本发明的对增量样本进行特征提取的流程框图；

图3是本发明的动态更新均值向量的流程框图；

图4是本发明的动态更新协方差矩阵的流程框图；

图5是识别引擎进行汉字识别的流程框图。

具体实施方式

下面结合附图对本发明做进一步的说明，实施本发明所用的识别设备可以采用手写板书写汉字，用计算机进行识别，用纯平型显示器显示用户图形界面，可采用C语言编制各类处理程序，便能较好地实施本发明。

本发明的系统结构如附图1所示，采用八方向特征提取方法对增量书写样本进行特征提取，并通过原始线性判决分析（LDA）模型来进行线性判决分析（LDA）变换，然后分别计算出原始样本和增量书写样本的每一个类别的模板均值向量和协方差矩阵，接着再根据前面的结果重新求出合并后新的总样本中每一个类别的模版均值向量和协方差矩阵，最后通过新的模版均值向量和协方差矩阵更新改进的二次判决函数（MQDF）分类器。

本发明中的选择用户少量的样本，用于更新模板及识别引擎，具体实施方法为在用户样本选择时，应能充分体现用户的书写风格。设原始样本为X = {x _i } (i=1, … , N)，N为样本数，并设其类别数是M；设增量书写样本为Y = {y _j } (j=1,…,L)，L为增量样本数，并设其类别数是P。则合并后的总的样本可表示为Z =X∪Y = {z _k } (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P。不失一般性，我们假设对于合并后的总样本中的第C _i (i=1,…,C)类，分别在原始样本N和增量书写样本L中有n _i和l _i个样本。因此，对于合并后新的样本，属于第C _i (i=1,…,C)类的样本数为s _i =n _i +l _i。

本发明中的对增量样本进行特征提取过程如附图2所示，具体包括以下两个骤：

，令原始线性判决分析变换矩阵为

，设经过线性判决分析变换后的特征向量为

，则通过以下公式求得

：

。

本发明中的利用增量书写样本动态更新均值向量过程如附图3所示，具体包括以下三个步骤：

，原始样本个数为

，则通过以下公式求得

：

，则通过以下公式求得

：

（C）、根据上述（A）、（B）的结果，则设合并后新的样本经过线性判决分析变换后的均值向量为

，由以下公式求得：

。

本发明中的利用增量书写样本动态更新协方差矩阵过程如附图4所示，具体包括以下三个骤：

要求新的合并后的类别i(i=1,…,C)的协方差矩阵，必须先分别求出原始样本协方差矩阵

和增量书写样本的协方差矩阵

，其步骤包括：

，样本个数为

，则其协方差矩阵由以下公式求得：

（B）、求增量书写样本中类别i(i=1,…,C)的协方差矩阵，增量书写样本中类别i经过线性判决分析变换后的均值向量为

，样本个数为

，则其协方差矩阵由以下公式求得：

（C）、求合并后新的样本中类别i(i=1,…,C)的协方差矩阵，因上述（A）、（B）步骤已求出原始样本协方差矩阵

和增量书写样本的协方差矩阵

，则其协方差矩阵

由以下公式求得：

。

本发明中的更新最终的改进的二次判决函数（MQDF）分类器，其步骤包括：

（A）、设

代表第i个类别(i=1,…,C)，

和分别表示更新后的均值向量和协方差矩阵，并设每个类别的先验概率相等，则原始的二次判决函数（QDF）由以下公式求得：

（B）、根据K-L变换，对协方差矩阵

进行对角化，求得：

（D）、用常量

。

采用本发明的基于增量MQDF的书写者自适应技术用其优异的性能通过大样本和大类别的实验得到了证实。利用本发明的识别引擎进行汉字识别的流程如附图5所示。

下面描述采用本发明所述的方法，对大量联机手写汉字样本的进行相关实验的结果。

本发明采用由本实验室采集并已公开发布的SCUT-COUCH联机手写样本数据库中的WORD8888汉字词组样本数据子集作为实验数据，该子集包括130位不同书写者的8888个常用汉字词组样本，每位书写者独立书写完成一套样本数据。我们选择其中的30套作为实验数据，并手动把这些词组全切出来变成单字。这些词组中的单字均为一二级汉字，经过统计分析，这些词组切成单字后，共包括2078类一级汉字，共19595个汉字。我们把这30套由词组切分出来的单字字库成为数据库A。

对于数据库A，每个类的样本数目，随机选取总数的50%进行增量MQDF模型的训练，余下50%进行用户书写风格自适应性能的测试。

下表列出的是对于数据库A中的每一套数据（即某一特定用户），没有采用本发明与采用本发明对书写汉字的识别率。

用户	未采用自适应技术	采用自适应技术	错误下降率	用户	未采用自适应技术	采用自适应技术	错误下降率
								1	92.84%	96.21%	46.98%	16	94.64%	97.88%	60.39%
2	86.44%	94.03%	55.95%	17	79.96%	89.93%	49.74%
								3	85.83%	95.63%	69.15%	18	86.31%	92.52%	45.33%
4	95.60%	98.35%	62.45%	19	61.29%	79.08%	45.96%
								5	85.38%	93.12%	52.96%	20	59.78%	74.44%	36.46%
6	96.39%	98.76%	65.69%	21	72.58%	86.39%	50.37%
								7	83.99%	92.88%	55.55%	22	92.14%	97.90%	73.23%
8	82.07%	91.02%	49.92%	23	90.90%	96.41%	60.55%
								9	86.14%	94.49%	60.22%	24	53.95%	76.34%	48.61%
10	85.33%	94.14%	60.05%	25	93.86%	97.14%	53.36%
								11	93.63%	97.30%	57.62%	26	88.86%	94.88%	54.05%
12	92.99%	96.47%	49.59%	27	93.04%	96.65%	51.86%
								13	95.51%	98.25%	61.11%	28	91.01%	95.10%	45.51%
14	92.66%	97.48%	65.71%	29	81.77%	92.00%	56.11%
								15	92.65%	97.18%	61.57%	30	94.54%	96.95%	44.11%
平均	86.07%	93.30%	51.88%

由表可知，对于指定的用户，采用基于增量MQDF的书写者自适应技术后，对该用户的汉字识别率有较大幅度的提高。

Claims

1.一种使手写汉字识别引擎能动态适应用户书写风格的方法，其特征在于包括如下步骤：

（1）、选取用于更新模板及识别引擎的用户增量书写样本；

（2）、提取增量书写样本的汉字特征，并根据原始线性判决分析模型对该汉字特征进行线性判决分析变换；

（3）、采用增量书写样本动态更新每个类别的均值向量；

（4）、采用增量书写样本动态更新每个类别的协方差矩阵；

（5）、采用增量书写样本更新改进的二次判决函数分类器。

2.根据权利要求1所述的使手写汉字识别引擎能动态适应用户书写风格的方法，其特征在于所述步骤（1）选取用户的增量书写样本的具体步骤如下：

设定原始样本为X = {x _i } (i=1, … , N)，N为样本数，并设其类别数是M；设增量书写样本为Y = {y _j } (j=1,…,L)，L为增量样本数，并设其类别数是P，则合并后的总的样本可表示为Z =X∪Y = {z _k } (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P，再设定合并后的总样本中的第i (i=1,…,C)类，分别在原始样本N和增量书写样本L中有n _i和l _i个样本，因此，对于合并后新的样本，属于第i (i=1,…,C)类的样本数为s _i =n _i +l _i。

3.根据权利要求2所述的使手写汉字识别引擎能动态适应用户书写风格的方法，其特征在于所述步骤（2）具体更新步骤如下：

（21）、增量书写样本特征提取，对于每一个增量书写样本，都采用八方向特征提取方法提取其方向特征，

（22）、对增量书写样本特征进行线性判决分析变换，设经过八方向特征提取后，类别i(i=1,…,C)的原始特征向量为