CN102184424A

CN102184424A - 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法

Info

Publication number: CN102184424A
Application number: CN 201110108770
Authority: CN
Inventors: 金连文; 刘岗; 丁凯
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2011-04-28
Filing date: 2011-04-28
Publication date: 2011-09-14
Anticipated expiration: 2031-04-28
Also published as: CN102184424B

Abstract

本发明提供一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法，其利用具有特定用户书写风格的增量样本动态更新二次鉴别函数（MQDF）识别模型，使更新后的MQDF识别模型能适应特定用户的书写风格，从而达到提高该特定用户的识别率的效果。本发明创新性的将一种加权的增量学习机制与汉字识别中的MQDF分类算法以及ILDA算法相结合提出了一种基于加权鉴别子空间的增量二次鉴别函数（WILDAIMQDF）算法，并把WILDAIMQDF应用于基于手写汉字识别的书写者自适应领域，解决了手写汉字识别引擎对特定用户识别率不高的问题。利用本发明提供的方法，手写汉字识别引擎能自适应特定用户的手写风格，提高识别准确度。

Description

一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法

技术领域

本发明属于利用计算机处理设备识别手写文字图像的技术领域，特别是涉及一种基于加权鉴别子空间的增量二次鉴别函数的书写者自适应方法。

背景技术

手写汉字识别一般是指用户通过手写输入设备（比如：手写板、触摸屏、鼠标等）书写汉字，同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别，即书写一个汉字识别一个汉字。使用的识别引擎与用户无关，即识别引擎事先通过大量的训练样本训练出来，对于不同用户，识别引擎使用的模型及参数都是一样的，事先由开发人员训练并设置好。由于采用了大数据量的训练样本，所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大，每个用户书写风格除了存在共性外，往往还包括自己个性化的地方，与用户无关的识别引擎针对这类用户时书写汉字时，识别准确率往往不尽人意，有待改进。

发明内容

本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足，提供一种让识别引擎能动态适应特定用户书写风格从而提高识别率的方法。

本发明采用的技术方案为：

一种基于加权鉴别子空间的增量二次鉴别函数的书写者自适应方法，其步骤如下：

（1）、选取少量的特定用户的增量样本；

（2）、对增量样本提取特征，并利用增量线性鉴别分析（ILDA）技术对原始的线性鉴别分析（LDA）模型进行更新生成新的线性鉴别分析（LDA）模型；

（3）、利用增量样本并结合加权的增量二次鉴别函数（WIMQDF）算法，动态更新每个类别在新的线性鉴别分析（LDA）特征空间中基于加权的均值向量和协方差矩阵；

（4）、采用更新后的在新的线性鉴别分析（LDA）特征空间中基于加权的每个类的均值向量和协方差矩阵，更新改进的二次鉴别函数分类器；

所述步骤（1）为选择用户少量的样本，用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为X = {x _i } (i=1, … , N)，N为样本数，并设其类别数是M；设增量样本为Y = {y _j } (j=1,…,L)，L为增量样本数，并设其类别数是P。则合并后的总的样本可表示为Z =XèY = {z _k } (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P。不失一般性，我们假设对于合并后的总样本中的第i (i=1,…,C)类，分别在原始样本N和增量样本L中有n _i和l _i个样本。因此，对于合并后新的样本，属于第i (i=1,…,C)类的样本数为s _i =n _i +l _i。

所述步骤（2）对增量样本提取特征，并利用增量线性鉴别分析（ILDA）技术对原始的线性鉴别分析（LDA）模型进行更新生成新的线性鉴别分析（LDA）模型，其步骤包括：

（A）、增量样本特征提取，对于每一个增量样本，都采用八方向特征提取方法提取其方向特征；

（B）、令原始线性鉴别分析变换（LDA）矩阵为

，设经过八方向特征提取后，增量样本中类别i(i=1,…,C)的特征向量为

，则可根据增量线性鉴别分析（ILDA）技术并结合全部增量样本的特征向量将原始线性鉴别分析变换矩阵

更新为

。

所述步骤（3）利用增量样本并结合加权的增量二次鉴别函数（WIMQDF）算法，动态更新每个类别在新的线性鉴别分析（LDA）特征空间中基于加权的均值向量和协方差矩阵，其步骤包括：

（A）、设增量样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为

，样本个数为

，则通过以下公式求得

：

（B）、设增量样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中的均值向量为

，样本个数为。根据加权的增量二次鉴别函数（WIMQDF）算法，增量样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中基于加权的均值向量与

一致，可通过以下公式求得：

（C）、设增量样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中的基于加权的协方差矩阵为

，样本个数为

，采用加权的增量二次鉴别函数（WIMQDF）算法，并设加权系数为r，根据（31）、（32）的结果，可通过以下公式求得

：

（D）、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为

，样本个数为

，则通过以下公式求得

：

（E）、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的协方差矩阵

，样本个数为

，则通过以下公式求得

：

（F）、设原始样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中的均值向量为

，根据（34）的结果，可通过以下公式求得

：

（G）、设原始样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中的协方差矩阵为

，原始样本个数为

，根据（34）、（35）的结果，可通过以下公式求得：

（H）、设合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中的基于加权的均值向量为

，采用加权的增量二次鉴别函数（WIMQDF）算法，并设加权系数为r，可通过以下公式求得

：

（I）、设合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析（LDA）特征空间中的基于加权的协方差矩阵为

：

。

所述步骤（4）根据合并后总样本在新的线性鉴别分析（LDA）特征空间中基于加权的每个类的均值向量和协方差矩阵，更新最终的改进的二次鉴别函数（MQDF）分类器，其步骤包括：

（A）、设

代表第i个类别(i=1,…,C)，

和分别表示根据步骤（3）得到的合并后总样本在新的线性鉴别分析（LDA）特征空间中基于加权的每个类的均值向量和协方差矩阵，并设每个类别的先验概率相等，则原始的二次鉴别函数（QDF）由以下公式求得：

（B）、根据K-L变换，对协方差矩阵

进行对角化，求得：

其中，Λ_i = diag[λ _i1,…,λ _iD]，λ _ij, j=1,…,D是协方差矩阵

的特征值，D是特征的维数。Φ_i = [φ _i1,…,φ _iD]，φ _ij, j=1,…,D是对应的特征向量。Φ_i是标准正交的，Φ^T _iΦ_i = I.

（C）、根据上述公式，将原始的二次鉴别函数（QDF）写成特征向量和特征值的形式：

（D）、用常量

替代较小的特征值，设K为主导特征向量的个数，就得到了最终的改进的二次鉴别函数（MQDF）分类器，由以下公式求得：

经过（1）~（4）步骤，基于加权鉴别子空间的增量二次鉴别函数（WILDAIMQDF）的书写者自适应过程更新完毕。

本发明首次提出了与特定用户相关的手写自适应技术，手写识别引擎能自动的根据特定用户的书写风格自动调整其识别模型及参数，把用户无关的识别系统转变为用户相关的识别系统，从而大大提高了对相关用户手写汉字的识别准确率，同时，该识别引擎对于其他用户，其识别准确率仍能基本保持不变。

附图说明

图1是本发明的系统结构框图；

图2是本发明的对增量样本提取特征，并利用增量线性鉴别分析（ILDA）技术对原始的线性鉴别分析（LDA）模型进行更新生成新的线性鉴别分析（LDA）模型的流程框图；

图3是本发明的利用增量样本并结合加权的增量二次鉴别函数（WIMQDF）算法，动态更新每个类别在新的线性鉴别分析（LDA）特征空间中基于加权的均值向量和协方差矩阵的流程框图；

图4是识别引擎进行汉字识别的流程框图。

具体实施方式

下面结合附图对本发明做进一步的说明，实施本发明所用的识别设备可以采用手写板书写汉字，用计算机进行识别，用纯平型显示器显示用户图形界面，可采用C语言编制各类处理程序，便能较好地实施本发明。

本发明的系统结构如附图1所示，采用八方向特征提取方法对增量样本进行特征提取，并利用增量线性鉴别分析（ILDA）技术对原始的线性鉴别分析（LDA）模型进行更新生成新的线性鉴别分析（LDA）模型；然后，利用增量样本并结合加权的增量二次鉴别函数（WIMQDF）算法，动态更新每个类别在新的线性鉴别分析（LDA）特征空间中基于加权的均值向量和协方差矩阵。最后，通过合并后总样本在新的线性鉴别分析（LDA）特征空间中基于加权的每个类的均值向量和协方差矩阵，更新改进的二次鉴别函数（MQDF）分类器。

本发明中的选择用户少量的样本，用于更新模板及识别引擎，具体实施方法为在用户样本选择时，应能充分体现用户的书写风格。设原始样本为X = {x _i } (i=1, … , N)，N为样本数，并设其类别数是M；设增量样本为Y = {y _j } (j=1,…,L)，L为增量样本数，并设其类别数是P。则合并后的总的样本可表示为Z =XèY = {z _k } (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P。不失一般性，对于合并后的总样本中的第i (i=1,…,C)类，分别在原始样本N和增量样本L中有n _i和l _i个样本。因此，对于合并后新的样本，属于第i (i=1,…,C)类的样本数为s _i =n _i +l _i。

本发明中的对增量样本提取特征，并利用增量线性鉴别分析（ILDA）技术对原始的线性鉴别分析（LDA）模型进行更新生成新的线性鉴别分析（LDA）模型过程如附图2所示，具体包括以下两个步骤：

（B）、令原始线性鉴别分析变换（LDA）矩阵为

，则可根据增量线性鉴别分析（ILDA）技术并结合全部增量样本的特征向量将原始线性鉴别分析变换矩阵更新为

。

本发明中的利用增量样本并结合加权的增量二次鉴别函数（WIMQDF）算法，动态更新每个类别在新的线性鉴别分析（LDA）特征空间中基于加权的均值向量和协方差矩阵过程如附图3所示，具体包括以下九个步骤：

，样本个数为

，则通过以下公式求得

：

一致，可通过以下公式求得

：

，样本个数为

：

，样本个数为

，则通过以下公式求得：

（E）、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的协方差矩阵，样本个数为

，则通过以下公式求得

：

，根据（34）的结果，可通过以下公式求得

：

，原始样本个数为

，根据（34）、（35）的结果，可通过以下公式求得

：

：

：

。

本发明中的根据合并后总样本在新的线性鉴别分析（LDA）特征空间中基于加权的每个类的均值向量和协方差矩阵，更新改进的二次鉴别函数分类器，其步骤包括：

（A）、设

代表第i个类别(i=1,…,C)，

和

分别表示合并后总样本在新的线性鉴别分析（LDA）特征空间中基于加权的每个类的均值向量和协方差矩阵，并设每个类别的先验概率相等，则原始的二次鉴别函数（QDF）由以下公式求得：

（B）、根据K-L变换，对协方差矩阵

进行对角化，求得：

（D）、用常量

。

采用本发明的基于加权鉴别子空间的增量二次鉴别函数（WILDAIMQDF）的书写者自适应技术用其优异的性能通过大样本和大类别的实验得到了证实。利用本发明的识别引擎进行汉字识别的流程如附图4所示。

下面描述采用本发明所述的方法，对大量联机手写汉字样本的进行相关实验的结果。

本发明采用由本实验室采集并已公开发布的SCUT-COUCH联机手写样本数据库中的WORD8888汉字词组样本数据子集作为实验数据，该子集包括130位不同书写者的8888个常用汉字词组样本，每位书写者独立书写完成一套样本数据。本实施例选择其中的30套作为实验数据，并手动把这些词组全切出来变成单字。这些词组中的单字均为一二级汉字，经过统计分析，这些词组切成单字后，共包括2078类一级汉字，共19595个汉字。把这30套由词组切分出来的单字字库成为数据库A。

对于数据库A，每个类的样本数目，随机选取总数的50%进行增量MQDF模型的训练，余下50%进行用户书写风格自适应性能的测试。

下表列出的是基于不同的加权系数r，数据库A中30套数据没有采用本发明与采用本发明对书写汉字的平均识别率的对比。

可以看到，采用本发明后，识别率有了很大的提高。其中，当r取0.3时，识别率达到最高值。

下表列出的是，当r取0.3时，对于数据库A中的每一套数据（即某一特定用户），没有采用本发明与采用本发明对书写汉字的识别率。

用户	未采用自适应技术	采用自适应技术	错误下降率	用户	未采用自适应技术	采用自适应技术	错误下降率
								1	92.84%	97.03%	58.52%	16	94.64%	98.56%	73.12%
2	86.44%	95.90%	69.76%	17	79.96%	92.77%	63.92%
								3	85.83%	97.52%	82.51%	18	86.31%	93.54%	52.77%
4	95.60%	99.04%	78.17%	19	61.29%	86.91%	66.18%
								5	85.38%	96.32%	74.84%	20	59.78%	82.47%	56.42%
6	96.39%	99.25%	79.26%	21	72.58%	90.11%	63.92%
								7	83.99%	96.01%	75.10%	22	92.14%	98.70%	83.50%
8	82.07%	94.79%	70.97%	23	90.90%	97.45%	72.05%
								9	86.14%	96.28%	73.18%	24	53.95%	90.95%	80.35%
10	85.33%	96.23%	74.26%	25	93.86%	97.80%	64.16%
								11	93.63%	98.16%	71.04%	26	88.86%	96.49%	68.53%
12	92.99%	97.71%	67.40%	27	93.04%	97.66%	66.35%
								13	95.51%	98.92%	76.07%	28	91.01%	95.86%	53.95%
14	92.66%	98.18%	81.68%	29	81.77%	95.35%	74.50%
								15	92.65%	97.03%	75.29%	30	94.54%	97.45%	53.25%
平均	86.07%	95.74%	69.39%

由表可知，对于特定的用户，采用基于加权鉴别子空间的增量二次鉴别函数（WILDAIMQDF）的书写者自适应技术后，对该用户的汉字识别率有较大幅度的提高。

Claims

1.一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法，其特征在于包括如下步骤：

（1）、选取用户的增量样本，用于更新模板及识别引擎；

（2）、对增量样本进行特征提取，并利用增量线性鉴别分析方法对原始的线性鉴别分析模型进行更新，以生成新的线性鉴别分析模型；

（3）、利用增量样本并结合加权的增量二次鉴别函数算法，动态更新每个类别在新的线性鉴别分析特征空间中基于加权的均值向量和协方差矩阵；

（4）、采用更新后的新的线性鉴别分析特征空间中基于加权的每个类的均值向量和协方差矩阵，更新改进的二次鉴别函数分类器。

2.根据权利要求1所述的基于加权鉴别子空间的增量二次鉴别函数的自适应方法，其特征在于所述步骤（1）具体操作如下：

设定原始样本为X = {x _i } (i=1, … , N)，N为样本数，并设其类别数是M；设增量样本为Y = {y _j } (j=1,…,L)，L为增量样本数，并设其类别数是P，则合并后的总的样本表示为Z =Xè Y = {z _k } (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P，对于合并后的总样本中的第i (i=1,…,C)类，分别在原始样本N和增量样本L中有n _i和l _i个样本，合并后新的样本，属于第i (i=1,…,C)类的样本数为s _i =n _i +l _i。

3.根据权利要求2所述的基于加权鉴别子空间的增量二次鉴别函数的书写者方法，其特征在于所述步骤（2）具体更新步骤如下：

（21）、增量样本特征提取，对于每一个增量样本，都采用八方向特征提取方法提取其方向特征；

（22）、令原始线性鉴别分析变换矩阵为