CN102184424A - 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法 - Google Patents

一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法 Download PDF

Info

Publication number
CN102184424A
CN102184424A CN 201110108770 CN201110108770A CN102184424A CN 102184424 A CN102184424 A CN 102184424A CN 201110108770 CN201110108770 CN 201110108770 CN 201110108770 A CN201110108770 A CN 201110108770A CN 102184424 A CN102184424 A CN 102184424A
Authority
CN
China
Prior art keywords
increment
sample
weighting
discriminant analysis
linear discriminant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201110108770
Other languages
English (en)
Other versions
CN102184424B (zh
Inventor
金连文
刘岗
丁凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN 201110108770 priority Critical patent/CN102184424B/zh
Publication of CN102184424A publication Critical patent/CN102184424A/zh
Application granted granted Critical
Publication of CN102184424B publication Critical patent/CN102184424B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法,其利用具有特定用户书写风格的增量样本动态更新二次鉴别函数(MQDF)识别模型,使更新后的MQDF识别模型能适应特定用户的书写风格,从而达到提高该特定用户的识别率的效果。本发明创新性的将一种加权的增量学习机制与汉字识别中的MQDF分类算法以及ILDA算法相结合提出了一种基于加权鉴别子空间的增量二次鉴别函数(WILDAIMQDF)算法,并把WILDAIMQDF应用于基于手写汉字识别的书写者自适应领域,解决了手写汉字识别引擎对特定用户识别率不高的问题。利用本发明提供的方法,手写汉字识别引擎能自适应特定用户的手写风格,提高识别准确度。

Description

一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法
技术领域
本发明属于利用计算机处理设备识别手写文字图像的技术领域,特别是涉及一种基于加权鉴别子空间的增量二次鉴别函数的书写者自适应方法。
背景技术
手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来,对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。
发明内容
本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应特定用户书写风格从而提高识别率的方法。
本发明采用的技术方案为:
一种基于加权鉴别子空间的增量二次鉴别函数的书写者自适应方法,其步骤如下:
(1)、选取少量的特定用户的增量样本;
(2)、对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型;
(3)、利用增量样本并结合加权的增量二次鉴别函数(WIMQDF)算法,动态更新每个类别在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量和协方差矩阵;
(4)、采用更新后的在新的线性鉴别分析(LDA)特征空间中基于加权的每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数分类器;
所述步骤(1)为选择用户少量的样本,用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为 = {x i } (i=1, … , N)N为样本数,并设其类别数是M;设增量样本为Y  = {y j } (j=1,…,L)L为增量样本数,并设其类别数是P。则合并后的总的样本可表示为Z =XèY = {z k } (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥MC≥P。不失一般性,我们假设对于合并后的总样本中的第i (i=1,…,C)类,分别在原始样本N和增量样本L中有n i l i 个样本。因此,对于合并后新的样本,属于第i (i=1,…,C)类的样本数为s i =n i +l i
所述步骤(2)对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型,其步骤包括:
(A)、增量样本特征提取,对于每一个增量样本,都采用八方向特征提取方法提取其方向特征;
(B)、令原始线性鉴别分析变换(LDA)矩阵为                                                
Figure 826021DEST_PATH_IMAGE001
,设经过八方向特征提取后,增量样本中类别i(i=1,…,C)的特征向量为
Figure 158913DEST_PATH_IMAGE002
,则可根据增量线性鉴别分析(ILDA)技术并结合全部增量样本的特征向量将原始线性鉴别分析变换矩阵
Figure 442127DEST_PATH_IMAGE001
更新为
Figure 733431DEST_PATH_IMAGE003
所述步骤(3)利用增量样本并结合加权的增量二次鉴别函数(WIMQDF)算法,动态更新每个类别在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量和协方差矩阵,其步骤包括:
(A)、设增量样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为
Figure 469306DEST_PATH_IMAGE004
,样本个数为
Figure 137047DEST_PATH_IMAGE005
,则通过以下公式求得
Figure 743609DEST_PATH_IMAGE004
Figure 202885DEST_PATH_IMAGE006
(B)、设增量样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的均值向量为
Figure 426056DEST_PATH_IMAGE007
,样本个数为。根据加权的增量二次鉴别函数(WIMQDF)算法,增量样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量与
Figure 889715DEST_PATH_IMAGE007
一致,可通过以下公式求得
Figure 702130DEST_PATH_IMAGE008
(C)、设增量样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的基于加权的协方差矩阵为
Figure 711675DEST_PATH_IMAGE009
,样本个数为
Figure 558408DEST_PATH_IMAGE005
,采用加权的增量二次鉴别函数(WIMQDF)算法,并设加权系数为r,根据(31)、(32)的结果,可通过以下公式求得
Figure 627995DEST_PATH_IMAGE009
Figure 560179DEST_PATH_IMAGE010
(D)、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为
Figure 373414DEST_PATH_IMAGE011
,样本个数为
Figure 74654DEST_PATH_IMAGE012
,则通过以下公式求得
Figure 315143DEST_PATH_IMAGE011
(E)、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的协方差矩阵
Figure 85969DEST_PATH_IMAGE014
,样本个数为
Figure 904365DEST_PATH_IMAGE012
,则通过以下公式求得
Figure 315755DEST_PATH_IMAGE014
Figure 691373DEST_PATH_IMAGE015
(F)、设原始样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的均值向量为
Figure 846411DEST_PATH_IMAGE016
,根据(34)的结果,可通过以下公式求得
Figure 522242DEST_PATH_IMAGE016
Figure 104534DEST_PATH_IMAGE017
(G)、设原始样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的协方差矩阵为
Figure 498606DEST_PATH_IMAGE018
,原始样本个数为
Figure 191755DEST_PATH_IMAGE012
,根据(34)、(35)的结果,可通过以下公式求得
(H)、设合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的基于加权的均值向量为
Figure 356654DEST_PATH_IMAGE020
,采用加权的增量二次鉴别函数(WIMQDF)算法,并设加权系数为r,可通过以下公式求得
Figure 853495DEST_PATH_IMAGE020
(I)、设合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的基于加权的协方差矩阵为
Figure 428013DEST_PATH_IMAGE022
,采用加权的增量二次鉴别函数(WIMQDF)算法,并设加权系数为r,可通过以下公式求得
Figure 531098DEST_PATH_IMAGE022
Figure 43681DEST_PATH_IMAGE023
    。
所述步骤(4)根据合并后总样本在新的线性鉴别分析(LDA)特征空间中基于加权的每个类的均值向量和协方差矩阵,更新最终的改进的二次鉴别函数(MQDF)分类器,其步骤包括:
(A)、设
Figure 345349DEST_PATH_IMAGE024
代表第i个类别(i=1,…,C)
Figure 909186DEST_PATH_IMAGE025
分别表示根据步骤(3)得到的合并后总样本在新的线性鉴别分析(LDA)特征空间中基于加权的每个类的均值向量和协方差矩阵,并设每个类别的先验概率相等,则原始的二次鉴别函数(QDF)由以下公式求得:
Figure 338210DEST_PATH_IMAGE027
(B)、根据K-L变换,对协方差矩阵
Figure 963226DEST_PATH_IMAGE026
进行对角化,求得:
Figure 229123DEST_PATH_IMAGE028
其中,Λ i  = diag[λ i1 ,…,λ iD ],λ ij j=1,…,D是协方差矩阵
Figure 306800DEST_PATH_IMAGE026
的特征值,D是特征的维数。Φ i  = [φ i1 ,…,φ iD ],φ ij j=1,…,D是对应的特征向量。Φi是标准正交的,ΦT iΦi  = I.
(C)、根据上述公式,将原始的二次鉴别函数(QDF)写成特征向量和特征值的形式:
Figure 683555DEST_PATH_IMAGE029
(D)、用常量
Figure 163078DEST_PATH_IMAGE030
替代较小的特征值,设K为主导特征向量的个数,就得到了最终的改进的二次鉴别函数(MQDF)分类器,由以下公式求得:
Figure 599875DEST_PATH_IMAGE031
经过(1)~(4)步骤,基于加权鉴别子空间的增量二次鉴别函数(WILDAIMQDF)的书写者自适应过程更新完毕。
本发明首次提出了与特定用户相关的手写自适应技术,手写识别引擎能自动的根据特定用户的书写风格自动调整其识别模型及参数,把用户无关的识别系统转变为用户相关的识别系统,从而大大提高了对相关用户手写汉字的识别准确率,同时,该识别引擎对于其他用户,其识别准确率仍能基本保持不变。
附图说明
图1是本发明的系统结构框图;
图2是本发明的对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型的流程框图;
图3是本发明的利用增量样本并结合加权的增量二次鉴别函数(WIMQDF)算法,动态更新每个类别在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量和协方差矩阵的流程框图;
图4是识别引擎进行汉字识别的流程框图。
具体实施方式
下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板书写汉字,用计算机进行识别,用纯平型显示器显示用户图形界面,可采用C语言编制各类处理程序,便能较好地实施本发明。
本发明的系统结构如附图1所示,采用八方向特征提取方法对增量样本进行特征提取,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型;然后,利用增量样本并结合加权的增量二次鉴别函数(WIMQDF)算法,动态更新每个类别在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量和协方差矩阵。最后,通过合并后总样本在新的线性鉴别分析(LDA)特征空间中基于加权的每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数(MQDF)分类器。
本发明中的选择用户少量的样本,用于更新模板及识别引擎,具体实施方法为在用户样本选择时,应能充分体现用户的书写风格。设原始样本为 = {x i } (i=1, … , N)N为样本数,并设其类别数是M;设增量样本为Y  = {y j } (j=1,…,L)L为增量样本数,并设其类别数是P。则合并后的总的样本可表示为Z =XèY = {z k } (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥MC≥P。不失一般性,对于合并后的总样本中的第i (i=1,…,C)类,分别在原始样本N和增量样本L中有n i l i 个样本。因此,对于合并后新的样本,属于第i (i=1,…,C)类的样本数为s i =n i +l i
本发明中的对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型过程如附图2所示,具体包括以下两个步骤:
(A)、增量样本特征提取,对于每一个增量样本,都采用八方向特征提取方法提取其方向特征;
(B)、令原始线性鉴别分析变换(LDA)矩阵为
Figure 164849DEST_PATH_IMAGE001
,设经过八方向特征提取后,增量样本中类别i(i=1,…,C)的特征向量为
Figure 345294DEST_PATH_IMAGE002
,则可根据增量线性鉴别分析(ILDA)技术并结合全部增量样本的特征向量将原始线性鉴别分析变换矩阵更新为
Figure 287022DEST_PATH_IMAGE003
本发明中的利用增量样本并结合加权的增量二次鉴别函数(WIMQDF)算法,动态更新每个类别在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量和协方差矩阵过程如附图3所示,具体包括以下九个步骤:
(A)、设增量样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为
Figure 336362DEST_PATH_IMAGE004
,样本个数为
Figure 320499DEST_PATH_IMAGE005
,则通过以下公式求得
Figure 509035DEST_PATH_IMAGE004
Figure 287635DEST_PATH_IMAGE006
(B)、设增量样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的均值向量为
Figure 827201DEST_PATH_IMAGE007
,样本个数为。根据加权的增量二次鉴别函数(WIMQDF)算法,增量样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中基于加权的均值向量与
Figure 658071DEST_PATH_IMAGE007
一致,可通过以下公式求得
Figure 607572DEST_PATH_IMAGE007
Figure 103275DEST_PATH_IMAGE008
(C)、设增量样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的基于加权的协方差矩阵为
Figure 163635DEST_PATH_IMAGE009
,样本个数为
Figure 326763DEST_PATH_IMAGE005
,采用加权的增量二次鉴别函数(WIMQDF)算法,并设加权系数为r,根据(31)、(32)的结果,可通过以下公式求得
Figure 712745DEST_PATH_IMAGE009
(D)、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为
Figure 825375DEST_PATH_IMAGE011
,样本个数为
Figure 108589DEST_PATH_IMAGE012
,则通过以下公式求得
(E)、设原始样本中类别i(i=1,…,C)经过八方向特征提取后的协方差矩阵,样本个数为
Figure 407141DEST_PATH_IMAGE012
,则通过以下公式求得
Figure 869347DEST_PATH_IMAGE014
Figure 92518DEST_PATH_IMAGE015
(F)、设原始样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的均值向量为
Figure 298371DEST_PATH_IMAGE016
,根据(34)的结果,可通过以下公式求得
Figure 290598DEST_PATH_IMAGE016
Figure 189284DEST_PATH_IMAGE017
(G)、设原始样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的协方差矩阵为
Figure 899751DEST_PATH_IMAGE018
,原始样本个数为
Figure 643716DEST_PATH_IMAGE012
,根据(34)、(35)的结果,可通过以下公式求得
Figure 756028DEST_PATH_IMAGE018
Figure 560036DEST_PATH_IMAGE019
(H)、设合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的基于加权的均值向量为
Figure 757799DEST_PATH_IMAGE020
,采用加权的增量二次鉴别函数(WIMQDF)算法,并设加权系数为r,可通过以下公式求得
Figure 305455DEST_PATH_IMAGE020
Figure 269345DEST_PATH_IMAGE021
(I)、设合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析(LDA)特征空间中的基于加权的协方差矩阵为
Figure 509833DEST_PATH_IMAGE022
,采用加权的增量二次鉴别函数(WIMQDF)算法,并设加权系数为r,可通过以下公式求得
Figure 929313DEST_PATH_IMAGE022
Figure 280660DEST_PATH_IMAGE032
本发明中的根据合并后总样本在新的线性鉴别分析(LDA)特征空间中基于加权的每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数分类器,其步骤包括:
(A)、设
Figure 570827DEST_PATH_IMAGE024
代表第i个类别(i=1,…,C)
Figure 982217DEST_PATH_IMAGE025
Figure 888993DEST_PATH_IMAGE026
分别表示合并后总样本在新的线性鉴别分析(LDA)特征空间中基于加权的每个类的均值向量和协方差矩阵,并设每个类别的先验概率相等,则原始的二次鉴别函数(QDF)由以下公式求得:
Figure 778452DEST_PATH_IMAGE027
(B)、根据K-L变换,对协方差矩阵
Figure 719863DEST_PATH_IMAGE026
进行对角化,求得:
Figure 302154DEST_PATH_IMAGE028
其中,Λ i  = diag[λ i1 ,…,λ iD ],λ ij j=1,…,D是协方差矩阵
Figure 696226DEST_PATH_IMAGE026
的特征值,D是特征的维数。Φ i  = [φ i1 ,…,φ iD ],φ ij j=1,…,D是对应的特征向量。Φi是标准正交的,ΦT iΦi  = I.
(C)、根据上述公式,将原始的二次鉴别函数(QDF)写成特征向量和特征值的形式:
(D)、用常量
Figure 919714DEST_PATH_IMAGE030
替代较小的特征值,设K为主导特征向量的个数,就得到了最终的改进的二次鉴别函数(MQDF)分类器,由以下公式求得:
采用本发明的基于加权鉴别子空间的增量二次鉴别函数(WILDAIMQDF)的书写者自适应技术用其优异的性能通过大样本和大类别的实验得到了证实。利用本发明的识别引擎进行汉字识别的流程如附图4所示。
下面描述采用本发明所述的方法,对大量联机手写汉字样本的进行相关实验的结果。
本发明采用由本实验室采集并已公开发布的SCUT-COUCH联机手写样本数据库中的WORD8888汉字词组样本数据子集作为实验数据,该子集包括130位不同书写者的8888个常用汉字词组样本,每位书写者独立书写完成一套样本数据。本实施例选择其中的30套作为实验数据,并手动把这些词组全切出来变成单字。这些词组中的单字均为一二级汉字,经过统计分析,这些词组切成单字后,共包括2078类一级汉字,共19595个汉字。把这30套由词组切分出来的单字字库成为数据库A。
对于数据库A,每个类的样本数目,随机选取总数的50%进行增量MQDF模型的训练,余下50%进行用户书写风格自适应性能的测试。
下表列出的是基于不同的加权系数r,数据库A中30套数据没有采用本发明与采用本发明对书写汉字的平均识别率的对比。
可以看到,采用本发明后,识别率有了很大的提高。其中,当r取0.3时,识别率达到最高值。
下表列出的是,当r取0.3时,对于数据库A中的每一套数据(即某一特定用户),没有采用本发明与采用本发明对书写汉字的识别率。
用户 未采用自适应技术 采用自适应技术 错误下降率 用户 未采用自适应技术 采用自适应技术 错误下降率
1 92.84% 97.03% 58.52% 16 94.64% 98.56% 73.12%
2 86.44% 95.90% 69.76% 17 79.96% 92.77% 63.92%
3 85.83% 97.52% 82.51% 18 86.31% 93.54% 52.77%
4 95.60% 99.04% 78.17% 19 61.29% 86.91% 66.18%
5 85.38% 96.32% 74.84% 20 59.78% 82.47% 56.42%
6 96.39% 99.25% 79.26% 21 72.58% 90.11% 63.92%
7 83.99% 96.01% 75.10% 22 92.14% 98.70% 83.50%
8 82.07% 94.79% 70.97% 23 90.90% 97.45% 72.05%
9 86.14% 96.28% 73.18% 24 53.95% 90.95% 80.35%
10 85.33% 96.23% 74.26% 25 93.86% 97.80% 64.16%
11 93.63% 98.16% 71.04% 26 88.86% 96.49% 68.53%
12 92.99% 97.71% 67.40% 27 93.04% 97.66% 66.35%
13 95.51% 98.92% 76.07% 28 91.01% 95.86% 53.95%
14 92.66% 98.18% 81.68% 29 81.77% 95.35% 74.50%
15 92.65% 97.03% 75.29% 30 94.54% 97.45% 53.25%
平均 86.07% 95.74% 69.39%
由表可知,对于特定的用户,采用基于加权鉴别子空间的增量二次鉴别函数(WILDAIMQDF)的书写者自适应技术后,对该用户的汉字识别率有较大幅度的提高。

Claims (5)

1.一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法,其特征在于包括如下步骤:
(1)、选取用户的增量样本,用于更新模板及识别引擎;
(2)、对增量样本进行特征提取,并利用增量线性鉴别分析方法对原始的线性鉴别分析模型进行更新,以生成新的线性鉴别分析模型;
(3)、利用增量样本并结合加权的增量二次鉴别函数算法,动态更新每个类别在新的线性鉴别分析特征空间中基于加权的均值向量和协方差矩阵; 
(4)、采用更新后的新的线性鉴别分析特征空间中基于加权的每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数分类器。
2.根据权利要求1所述的基于加权鉴别子空间的增量二次鉴别函数的自适应方法,其特征在于所述步骤(1)具体操作如下:
设定原始样本为 = {x i } (i=1, … , N)N为样本数,并设其类别数是M;设增量样本为Y  = {y j } (j=1,…,L)L为增量样本数,并设其类别数是P,则合并后的总的样本表示为Z =Xè Y = {z k } (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥MC≥P,对于合并后的总样本中的第i (i=1,…,C)类,分别在原始样本N和增量样本L中有n i l i 个样本,合并后新的样本,属于第i (i=1,…,C)类的样本数为s i =n i +l i
3.根据权利要求2所述的基于加权鉴别子空间的增量二次鉴别函数的书写者方法,其特征在于所述步骤(2)具体更新步骤如下:
(21)、增量样本特征提取,对于每一个增量样本,都采用八方向特征提取方法提取其方向特征;
(22)、令原始线性鉴别分析变换矩阵为                                                
Figure 220443DEST_PATH_IMAGE001
,经过八方向特征提取后,增量样本中类别i(i=1,…,C)的特征向量为
Figure 717283DEST_PATH_IMAGE002
,则根据增量线性鉴别分析技术并结合全部增量样本的特征向量将原始线性鉴别分析变换矩阵
Figure 367708DEST_PATH_IMAGE001
更新为
Figure 26222DEST_PATH_IMAGE003
4.根据权利要求3所述的基于加权鉴别子空间的增量二次鉴别函数的书写者方法,其特征在于所述步骤(3)具体更新步骤如下:
(31)、设定增量样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为,样本个数为
Figure 429839DEST_PATH_IMAGE005
,则通过以下公式求得
Figure 200349DEST_PATH_IMAGE004
Figure 29764DEST_PATH_IMAGE006
(32)、设定增量样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中的均值向量为
Figure 354566DEST_PATH_IMAGE007
,样本个数为
Figure 190280DEST_PATH_IMAGE005
,根据加权的增量二次鉴别函数算法,增量样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中基于加权的均值向量与
Figure 549717DEST_PATH_IMAGE007
一致,通过以下公式求得
Figure 815613DEST_PATH_IMAGE007
Figure 893291DEST_PATH_IMAGE008
(33)、设定增量样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中的基于加权的协方差矩阵为
Figure 535625DEST_PATH_IMAGE009
,样本个数为
Figure 15147DEST_PATH_IMAGE005
,采用加权的增量二次鉴别函数算法,并设加权系数为r,根据步骤(31)、(32)的处理结果,通过以下公式求得
Figure 451945DEST_PATH_IMAGE009
: 
Figure 16918DEST_PATH_IMAGE010
(34)、设定原始样本中类别i(i=1,…,C)经过八方向特征提取后的均值向量为
Figure 197364DEST_PATH_IMAGE011
,样本个数为
Figure 235DEST_PATH_IMAGE012
,则通过以下公式求得
Figure 660204DEST_PATH_IMAGE013
(35)、设定原始样本中类别i(i=1,…,C)经过八方向特征提取后的协方差矩阵
Figure 378761DEST_PATH_IMAGE014
,样本个数为
Figure 832876DEST_PATH_IMAGE012
,则通过以下公式求得
Figure 611476DEST_PATH_IMAGE014
Figure 148112DEST_PATH_IMAGE015
(36)、设定原始样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中的均值向量为
Figure 670360DEST_PATH_IMAGE016
,根据步骤(34)的处理结果,通过以下公式求得
Figure 978982DEST_PATH_IMAGE016
Figure 928483DEST_PATH_IMAGE017
(37)、设定原始样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中的协方差矩阵为
Figure 689766DEST_PATH_IMAGE018
,原始样本个数为
Figure 15705DEST_PATH_IMAGE012
,根据步骤(34)、(35)的处理结果,通过以下公式求得
Figure 178833DEST_PATH_IMAGE018
: 
Figure 299236DEST_PATH_IMAGE019
(38)、设定合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中的基于加权的均值向量为
Figure 813394DEST_PATH_IMAGE020
,采用加权的增量二次鉴别函数算法,并设加权系数为r,通过以下公式求得
Figure 677445DEST_PATH_IMAGE020
Figure 695079DEST_PATH_IMAGE021
(39)、设定合并后总样本中类别i(i=1,…,C) 在新的线性鉴别分析特征空间中的基于加权的协方差矩阵为
Figure 251963DEST_PATH_IMAGE022
,采用加权的增量二次鉴别函数算法,并设加权系数为r,通过以下公式求得
5.根据权利要求4所述的基于加权鉴别子空间的增量二次鉴别函数的自适应方法,其特征在于所述步骤(4)具体更新步骤如下:
(51)、设定
Figure 527720DEST_PATH_IMAGE024
代表第i个类别(i=1,…,C)
Figure 255505DEST_PATH_IMAGE025
Figure 487465DEST_PATH_IMAGE026
分别表示根据步骤(3)得到的合并后总样本在新的线性鉴别分析特征空间中基于加权的每个类的均值向量和协方差矩阵,并设每个类别的先验概率相等,则原始的二次鉴别函数由以下公式求得:
Figure 693318DEST_PATH_IMAGE027
(52)、根据K-L变换,对协方差矩阵
Figure 154386DEST_PATH_IMAGE026
进行对角化,求得:
Figure 53072DEST_PATH_IMAGE028
其中,Λ i  = diag[λ i1 ,…,λ iD ],λ ij j=1,…,D是协方差矩阵
Figure 497960DEST_PATH_IMAGE026
的特征值,D是特征的维数,Φ i  = [φ i1 ,…,φ iD ],φ ij j=1,…,D是对应的特征向量,Φi是标准正交的,ΦT iΦi  = I
(53)、根据上述公式,将原始的二次鉴别函数写成特征向量和特征值的形式:
Figure 507504DEST_PATH_IMAGE029
(54)、用常量
Figure 619817DEST_PATH_IMAGE030
替代较小的特征值,设K为主导特征向量的个数,就得到了最终的改进的二次鉴别函数分类器,由以下公式求得:
Figure 423825DEST_PATH_IMAGE031
CN 201110108770 2011-04-28 2011-04-28 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法 Expired - Fee Related CN102184424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110108770 CN102184424B (zh) 2011-04-28 2011-04-28 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110108770 CN102184424B (zh) 2011-04-28 2011-04-28 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法

Publications (2)

Publication Number Publication Date
CN102184424A true CN102184424A (zh) 2011-09-14
CN102184424B CN102184424B (zh) 2013-07-10

Family

ID=44570597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110108770 Expired - Fee Related CN102184424B (zh) 2011-04-28 2011-04-28 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法

Country Status (1)

Country Link
CN (1) CN102184424B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488543A (zh) * 2014-09-16 2016-04-13 科大讯飞股份有限公司 一种获得识别模型的方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630368A (zh) * 2009-08-25 2010-01-20 华南理工大学 一种用于手写汉字识别的用户书写风格自适应方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630368A (zh) * 2009-08-25 2010-01-20 华南理工大学 一种用于手写汉字识别的用户书写风格自适应方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Neurocomputing》 20100312 Lianwen Jin等 Incremental learning of LDA model for Chinese writer adaptation 1614-1623 第73卷, 第10-12期 *
《中国优秀硕士学位论文全文数据库》 20101231 黄志斌 基于ILDA的用户书写风格自适应方法及其应用 , *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488543A (zh) * 2014-09-16 2016-04-13 科大讯飞股份有限公司 一种获得识别模型的方法及装置
CN105488543B (zh) * 2014-09-16 2019-07-09 科大讯飞股份有限公司 一种获得识别模型的方法及装置

Also Published As

Publication number Publication date
CN102184424B (zh) 2013-07-10

Similar Documents

Publication Publication Date Title
CN102622610B (zh) 一种基于分类器集成的手写维文字符识别方法
US7865018B2 (en) Personalized implicit and explicit character shape adaptation and recognition
US7496547B2 (en) Handwriting recognition using a comparative neural network
CN104463101B (zh) 用于文字性试题的答案识别方法及系统
CN101866417B (zh) 一种手写体维吾尔字符识别方法
CN101630362B (zh) 一种基于置信度的汉字书写质量评价方法
JP2009506464A (ja) 筆跡入力のスタイルを意識した使用
CN103226388A (zh) 一种基于Kinect的手写方法
CN108664975B (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
CN101630368B (zh) 一种用于手写汉字识别的用户书写风格自适应方法
CN107742095A (zh) 基于卷积神经网络的汉语手语识别方法
CN104899601A (zh) 一种手写维吾尔文单词识别方法
Xu et al. Air-writing characters modelling and recognition on modified CHMM
CN105868796A (zh) 基于核空间的线性鉴别稀疏表示分类器的设计方法
Saraf et al. Devnagari script character recognition using genetic algorithm for get better efficiency
CN110032948B (zh) 一种基于交互时序信息的草图手势识别方法
CN101604393B (zh) 一种用于联机手写汉字识别的汉字笔画特征提取方法
CN101604392B (zh) 一种用于联机手写汉字识别的汉字笔画特征并行提取方法
CN106650686A (zh) 一种基于隐马尔科夫模型的联机手写化学符号识别方法
CN102184426B (zh) 一种使手写汉字识别引擎能动态适应用户书写风格的方法
CN101697200A (zh) 一种旋转无关的手写中文草书词组识别方法
CN102184424B (zh) 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法
CN106648149B (zh) 一种基于加速度计和陀螺仪的空中手写字符识别方法
CN102298704A (zh) 一种基于加权增量二次鉴别函数的书写者自适应方法
CN101604378B (zh) 一种用于联机手写汉字识别的汉字笔画特征串行提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130710

CF01 Termination of patent right due to non-payment of annual fee