CN102184426A - 一种使手写汉字识别引擎能动态适应用户书写风格的方法 - Google Patents
一种使手写汉字识别引擎能动态适应用户书写风格的方法 Download PDFInfo
- Publication number
- CN102184426A CN102184426A CN 201110108782 CN201110108782A CN102184426A CN 102184426 A CN102184426 A CN 102184426A CN 201110108782 CN201110108782 CN 201110108782 CN 201110108782 A CN201110108782 A CN 201110108782A CN 102184426 A CN102184426 A CN 102184426A
- Authority
- CN
- China
- Prior art keywords
- sample
- increment
- classification
- write
- covariance matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 50
- 230000009466 transformation Effects 0.000 claims abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明提供一种使手写汉字识别引擎能动态适应用户书写风格的方法,包括如下步骤:(1)选取用于更新模板及识别引擎的用户增量书写样本;(2)提取增量书写样本的汉字特征,并根据原始LDA模型对该汉字特征进行LDA变换;(3)采用增量书写样本动态更新每个类别的均值向量;(4)采用增量书写样本动态更新每个类别的协方差矩阵;(5)采用增量书写样本更新改进的二次判决函数分类器。利用本发明提供的方法,手写汉字识别引擎能自适应用户的手写风格,提高识别准确度。
Description
技术背景
手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来,对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。
发明内容
本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应用户书写风格从而提高识别率的方法。
本发明采用的技术方案为:
一种使手写汉字识别引擎能动态适应用户书写风格的方法,其步骤如下:
(1)、选取用户少量的增量书写样本;
(2)、对增量书写样本提取特征,并根据原始线性判决分析(LDA)模型对增量书写样本特征进行线性判决分析(LDA)变换;
(3)、采用增量书写样本动态更新每个类别的均值向量;
(4)、采用增量书写样本动态更新每个类别的协方差矩阵;
(5)、根据新的均值向量和协方差矩阵,更新改进的二次判决函数(MQDF)分类器。
所述步骤(1)为选择用户少量的样本,用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为X = {x i } (i=1, … , N),N为样本数,并设其类别数是M;设增量书写样本为Y = {y j } (j=1,…,L),L为增量样本数,并设其类别数是P。则合并后的总的样本可表示为Z =X∪Y = {z k } (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥M、C≥P。不失一般性,我们假设对于合并后的总样本中的第i (i=1,…,C)类,分别在原始样本N和增量书写样本L中有n i 和l i 个样本。因此,对于合并后新的样本,属于第i (i=1,…,C)类的样本数为s i =n i +l i 。
所述步骤(2)对增量书写样本提取特征并进行线性判决分析(LDA)变换,其步骤包括:
(A)、增量书写样本特征提取,对于每一个增量书写样本,都采用八方向特征提取方法提取其方向特征,
(B)、对增量书写样本特征进行线性判决分析(LDA)变换,线性判决分析变换的目的是使各个汉字类别能最大程度的分开,从而提高识别率设经过八方向特征提取后,类别i(i=1,…,C)的原始特征向量为 ,令原始线性判决分析变换矩阵为,设经过线性判决分析变换后的特征向量为,则通过以下公式求得:
所述步骤(3)利用增量书写样本动态更新均值向量,其步骤包括:
(C)、根据上述(A)、(B)的结果,则设合并后新的样本经过线性判决分析变换后的均值向量为,由以下公式求得:
所述步骤(5)更新最终的改进的二次判决函数(MQDF)分类器,其步骤包括:
其中,Λ i = diag[λ i1 ,…,λ iD ],λ ij , j=1,…,D是协方差矩阵的特征值,D是特征的维数。Φ i = [φ i1 ,…,φ iD ],φ ij , j=1,…,D是对应的特征向量。Φi是标准正交的,ΦT iΦi = I.
(C)、根据上述公式,将原始的二次判决函数(QDF)写成特征向量和特征值的形式:
经过(1)~(5)步骤,基于增量MQDF的书写者自适应过程更新完毕。
本发明首次提出了与用户相关的手写自适应技术,手写识别引擎能自动的根据用户的书写风格自动调整其识别模型及参数,把用户无关的识别系统转变为用户相关的识别系统,从而大大提高了对相关用户手写汉字的识别准确率,同时,该识别引擎对于其他用户,其识别准确率仍能基本保持不变。
附图说明
图1是本发明的系统结构框图;
图2是本发明的对增量样本进行特征提取的流程框图;
图3是本发明的动态更新均值向量的流程框图;
图4是本发明的动态更新协方差矩阵的流程框图;
图5是识别引擎进行汉字识别的流程框图。
具体实施方式
下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板书写汉字,用计算机进行识别,用纯平型显示器显示用户图形界面,可采用C语言编制各类处理程序,便能较好地实施本发明。
本发明的系统结构如附图1所示,采用八方向特征提取方法对增量书写样本进行特征提取,并通过原始线性判决分析(LDA)模型来进行线性判决分析(LDA)变换,然后分别计算出原始样本和增量书写样本的每一个类别的模板均值向量和协方差矩阵,接着再根据前面的结果重新求出合并后新的总样本中每一个类别的模版均值向量和协方差矩阵,最后通过新的模版均值向量和协方差矩阵更新改进的二次判决函数(MQDF)分类器。
本发明中的选择用户少量的样本,用于更新模板及识别引擎,具体实施方法为在用户样本选择时,应能充分体现用户的书写风格。设原始样本为X = {x i } (i=1, … , N),N为样本数,并设其类别数是M;设增量书写样本为Y = {y j } (j=1,…,L),L为增量样本数,并设其类别数是P。则合并后的总的样本可表示为Z =X∪Y = {z k } (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥M、C≥P。不失一般性,我们假设对于合并后的总样本中的第C i (i=1,…,C)类,分别在原始样本N和增量书写样本L中有n i 和l i 个样本。因此,对于合并后新的样本,属于第C i (i=1,…,C)类的样本数为s i =n i +l i 。
本发明中的对增量样本进行特征提取过程如附图2所示,具体包括以下两个骤:
(A)、增量书写样本特征提取,对于每一个增量书写样本,都采用八方向特征提取方法提取其方向特征,
(B)、对增量书写样本特征进行线性判决分析(LDA)变换,线性判决分析变换的目的是使各个汉字类别能最大程度的分开,从而提高识别率设经过八方向特征提取后,类别i(i=1,…,C)的原始特征向量为,令原始线性判决分析变换矩阵为,设经过线性判决分析变换后的特征向量为,则通过以下公式求得:
本发明中的利用增量书写样本动态更新均值向量过程如附图3所示,具体包括以下三个步骤:
本发明中的利用增量书写样本动态更新协方差矩阵过程如附图4所示,具体包括以下三个骤:
本发明中的更新最终的改进的二次判决函数(MQDF)分类器,其步骤包括:
其中,Λ i = diag[λ i1 ,…,λ iD ],λ ij , j=1,…,D是协方差矩阵的特征值,D是特征的维数。Φ i = [φ i1 ,…,φ iD ],φ ij , j=1,…,D是对应的特征向量。Φi是标准正交的,ΦT iΦi = I.
(C)、根据上述公式,将原始的二次判决函数(QDF)写成特征向量和特征值的形式:
采用本发明的基于增量MQDF的书写者自适应技术用其优异的性能通过大样本和大类别的实验得到了证实。利用本发明的识别引擎进行汉字识别的流程如附图5所示。
下面描述采用本发明所述的方法,对大量联机手写汉字样本的进行相关实验的结果。
本发明采用由本实验室采集并已公开发布的SCUT-COUCH联机手写样本数据库中的WORD8888汉字词组样本数据子集作为实验数据,该子集包括130位不同书写者的8888个常用汉字词组样本,每位书写者独立书写完成一套样本数据。我们选择其中的30套作为实验数据,并手动把这些词组全切出来变成单字。这些词组中的单字均为一二级汉字,经过统计分析,这些词组切成单字后,共包括2078类一级汉字,共19595个汉字。我们把这30套由词组切分出来的单字字库成为数据库A。
对于数据库A,每个类的样本数目,随机选取总数的50%进行增量MQDF模型的训练,余下50%进行用户书写风格自适应性能的测试。
下表列出的是对于数据库A中的每一套数据(即某一特定用户),没有采用本发明与采用本发明对书写汉字的识别率。
用户 | 未采用自适应技术 | 采用自适应技术 | 错误下降率 | 用户 | 未采用自适应技术 | 采用自适应技术 | 错误下降率 |
1 | 92.84% | 96.21% | 46.98% | 16 | 94.64% | 97.88% | 60.39% |
2 | 86.44% | 94.03% | 55.95% | 17 | 79.96% | 89.93% | 49.74% |
3 | 85.83% | 95.63% | 69.15% | 18 | 86.31% | 92.52% | 45.33% |
4 | 95.60% | 98.35% | 62.45% | 19 | 61.29% | 79.08% | 45.96% |
5 | 85.38% | 93.12% | 52.96% | 20 | 59.78% | 74.44% | 36.46% |
6 | 96.39% | 98.76% | 65.69% | 21 | 72.58% | 86.39% | 50.37% |
7 | 83.99% | 92.88% | 55.55% | 22 | 92.14% | 97.90% | 73.23% |
8 | 82.07% | 91.02% | 49.92% | 23 | 90.90% | 96.41% | 60.55% |
9 | 86.14% | 94.49% | 60.22% | 24 | 53.95% | 76.34% | 48.61% |
10 | 85.33% | 94.14% | 60.05% | 25 | 93.86% | 97.14% | 53.36% |
11 | 93.63% | 97.30% | 57.62% | 26 | 88.86% | 94.88% | 54.05% |
12 | 92.99% | 96.47% | 49.59% | 27 | 93.04% | 96.65% | 51.86% |
13 | 95.51% | 98.25% | 61.11% | 28 | 91.01% | 95.10% | 45.51% |
14 | 92.66% | 97.48% | 65.71% | 29 | 81.77% | 92.00% | 56.11% |
15 | 92.65% | 97.18% | 61.57% | 30 | 94.54% | 96.95% | 44.11% |
平均 | 86.07% | 93.30% | 51.88% |
由表可知,对于指定的用户,采用基于增量MQDF的书写者自适应技术后,对该用户的汉字识别率有较大幅度的提高。
Claims (6)
1.一种使手写汉字识别引擎能动态适应用户书写风格的方法,其特征在于包括如下步骤:
(1)、选取用于更新模板及识别引擎的用户增量书写样本;
(2)、提取增量书写样本的汉字特征,并根据原始线性判决分析模型对该汉字特征进行线性判决分析变换;
(3)、采用增量书写样本动态更新每个类别的均值向量;
(4)、采用增量书写样本动态更新每个类别的协方差矩阵;
(5)、采用增量书写样本更新改进的二次判决函数分类器。
2.根据权利要求1所述的使手写汉字识别引擎能动态适应用户书写风格的方法,其特征在于所述步骤(1)选取用户的增量书写样本的具体步骤如下:
设定原始样本为X = {x i } (i=1, … , N),N为样本数,并设其类别数是M;设增量书写样本为Y = {y j } (j=1,…,L),L为增量样本数,并设其类别数是P,则合并后的总的样本可表示为Z =X∪Y = {z k } (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥M、C≥P,再设定合并后的总样本中的第i (i=1,…,C)类,分别在原始样本N和增量书写样本L中有n i 和l i 个样本,因此,对于合并后新的样本,属于第i (i=1,…,C)类的样本数为s i =n i +l i 。
6.根据权利要求5所述的使手写汉字识别引擎能动态适应用户书写风格的方法,其特征在于所述步骤(5)具体更新步骤如下:
其中,Λ i = diag[λ i1 ,…, λ iD ],λ ij , j=1,…,D是协方差矩阵的特征值,D是特征的维数,Φ i = [φ i1 ,…, φ iD ],φ ij , j=1,…,D是对应的特征向量,Φi是标准正交的,ΦT iΦi = I;
(53)、根据上述公式,将原始的二次判决函数写成特征向量和特征值的形式:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110108782 CN102184426B (zh) | 2011-04-28 | 2011-04-28 | 一种使手写汉字识别引擎能动态适应用户书写风格的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110108782 CN102184426B (zh) | 2011-04-28 | 2011-04-28 | 一种使手写汉字识别引擎能动态适应用户书写风格的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102184426A true CN102184426A (zh) | 2011-09-14 |
CN102184426B CN102184426B (zh) | 2013-03-20 |
Family
ID=44570599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110108782 Expired - Fee Related CN102184426B (zh) | 2011-04-28 | 2011-04-28 | 一种使手写汉字识别引擎能动态适应用户书写风格的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102184426B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488543A (zh) * | 2014-09-16 | 2016-04-13 | 科大讯飞股份有限公司 | 一种获得识别模型的方法及装置 |
CN109493400A (zh) * | 2018-09-18 | 2019-03-19 | 平安科技(深圳)有限公司 | 手写样本生成方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0261997A1 (fr) * | 1986-09-11 | 1988-03-30 | Anatex | Procédé de reconnaissance d'écriture manuscrite |
US5799107A (en) * | 1993-05-31 | 1998-08-25 | Fujitsu Limited | Control system for pen-input type computer |
CN1573799A (zh) * | 2003-05-21 | 2005-02-02 | 微软公司 | 自适应手写识别的系统和方法 |
CN101630368A (zh) * | 2009-08-25 | 2010-01-20 | 华南理工大学 | 一种用于手写汉字识别的用户书写风格自适应方法 |
-
2011
- 2011-04-28 CN CN 201110108782 patent/CN102184426B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0261997A1 (fr) * | 1986-09-11 | 1988-03-30 | Anatex | Procédé de reconnaissance d'écriture manuscrite |
US5799107A (en) * | 1993-05-31 | 1998-08-25 | Fujitsu Limited | Control system for pen-input type computer |
CN1573799A (zh) * | 2003-05-21 | 2005-02-02 | 微软公司 | 自适应手写识别的系统和方法 |
CN101630368A (zh) * | 2009-08-25 | 2010-01-20 | 华南理工大学 | 一种用于手写汉字识别的用户书写风格自适应方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488543A (zh) * | 2014-09-16 | 2016-04-13 | 科大讯飞股份有限公司 | 一种获得识别模型的方法及装置 |
CN105488543B (zh) * | 2014-09-16 | 2019-07-09 | 科大讯飞股份有限公司 | 一种获得识别模型的方法及装置 |
CN109493400A (zh) * | 2018-09-18 | 2019-03-19 | 平安科技(深圳)有限公司 | 手写样本生成方法、装置、计算机设备及存储介质 |
CN109493400B (zh) * | 2018-09-18 | 2024-01-19 | 平安科技(深圳)有限公司 | 手写样本生成方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102184426B (zh) | 2013-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102622610B (zh) | 一种基于分类器集成的手写维文字符识别方法 | |
CN101630362B (zh) | 一种基于置信度的汉字书写质量评价方法 | |
US7865018B2 (en) | Personalized implicit and explicit character shape adaptation and recognition | |
CN101866417B (zh) | 一种手写体维吾尔字符识别方法 | |
US7496547B2 (en) | Handwriting recognition using a comparative neural network | |
CN109871851B (zh) | 一种基于卷积神经网络算法的汉字书写规范性判定方法 | |
CN101976354A (zh) | 一种书写汉字规范性评判的方法和装置 | |
CN101881999B (zh) | 甲骨文视频输入系统及实现方法 | |
CN101630368B (zh) | 一种用于手写汉字识别的用户书写风格自适应方法 | |
CN104156690B (zh) | 一种基于图像空间金字塔特征包的手势识别方法 | |
CN107861947A (zh) | 一种基于跨语言资源的柬语命名实体识别的方法 | |
Xu et al. | Air-writing characters modelling and recognition on modified CHMM | |
Xu et al. | An improved method based on weighted grid micro-structure feature for text-independent writer recognition | |
CN101604393B (zh) | 一种用于联机手写汉字识别的汉字笔画特征提取方法 | |
CN101452357B (zh) | 一种手写字符输入方法及系统 | |
CN107909003B (zh) | 一种针对大词汇量的手势识别方法 | |
CN102184426B (zh) | 一种使手写汉字识别引擎能动态适应用户书写风格的方法 | |
Saraf et al. | Devnagari script character recognition using genetic algorithm for get better efficiency | |
CN101697200B (zh) | 一种旋转无关的手写中文草书词组识别方法 | |
CN101604392B (zh) | 一种用于联机手写汉字识别的汉字笔画特征并行提取方法 | |
CN101604378B (zh) | 一种用于联机手写汉字识别的汉字笔画特征串行提取方法 | |
CN102298704A (zh) | 一种基于加权增量二次鉴别函数的书写者自适应方法 | |
CN102184424B (zh) | 一种基于加权鉴别子空间的增量二次鉴别函数的自适应方法 | |
CN101216947B (zh) | 基于笔段网格的手写汉字输入方法和汉字识别方法 | |
Singh et al. | Data capturing process for online Gurmukhi script recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130320 |
|
CF01 | Termination of patent right due to non-payment of annual fee |