CN101149804A - 自适应手写识别系统和方法 - Google Patents

自适应手写识别系统和方法 Download PDF

Info

Publication number
CN101149804A
CN101149804A CNA2006101542690A CN200610154269A CN101149804A CN 101149804 A CN101149804 A CN 101149804A CN A2006101542690 A CNA2006101542690 A CN A2006101542690A CN 200610154269 A CN200610154269 A CN 200610154269A CN 101149804 A CN101149804 A CN 101149804A
Authority
CN
China
Prior art keywords
character
user
template
written
hand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101542690A
Other languages
English (en)
Other versions
CN101149804B (zh
Inventor
陈又新
胡洪涛
王炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Samsung Telecommunications Technology Research Co Ltd
Original Assignee
Beijing Samsung Telecommunications Technology Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Samsung Telecommunications Technology Research Co Ltd filed Critical Beijing Samsung Telecommunications Technology Research Co Ltd
Priority to CN2006101542690A priority Critical patent/CN101149804B/zh
Publication of CN101149804A publication Critical patent/CN101149804A/zh
Application granted granted Critical
Publication of CN101149804B publication Critical patent/CN101149804B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

提供了一种自适应手写识别系统和方法。该自适应手写识别系统包括:手写字符输入单元,用于使用户输入字符,并生成与所述字符对应的特征向量;通用字符特征模板库,用于存储通过预先样本训练得到的字符集及其对应的特征模板;用户字符特征模板库,用于存储用户手写笔迹特征模板;输入字符识别单元,基于所述特征向量和通用字符特征模板库中的通用字符特征模板,对输入字符进行识别,并根据识别结果,来更新用户字符特征模板库。因此,根据本发明的系统和方法,不仅能够提高手写识别的正确率,而且能够适应不同用户的手写特点。

Description

自适应手写识别系统和方法
技术领域
本发明涉及一种手写识别系统和方法,尤其涉及一种能够自动适应不同用户的手写字符特点的自适应手写识别系统和方法。
背景技术
利用数字化设备进行手写字符的输入已经成为一种非常普遍的现象,这些数字化设备通常指具有触摸屏等传感器等装置的Tablet-PC,PDA和手写手机等设备,与之相应的手写识别技术被广泛的使用。
在当前的比较成熟而且商用的手写识别系统中,识别字符所用的字符特征模板基本上是通过大量的训练样本训练得来的,不同人书写同一个字符便可能会有多种不同的写法,通过大量的不同人书写的样本采用模式识别的训练算法进行训练,从中得到该字符的书写的共性,即得到每一个字符的特征模板代表的是该手写字符不同写法的共同特征,但是这种做法没有能够考虑对不同人的不同写法的各自独有特征。如果用户的书写风格和上面得到的字符的共性特征差异过大,那么针对该用户的手写识别率会低于平均水平。所以,这样的系统不能很好的满足每一个用户的需要。
为了考虑不同用户的不同写法的独有特征,当前采用改进方法的手写识别系统通常采用下列两种方式:(1)预先让使用者书写一些特定的文字,从中找到该用户的书写特点,这个过程叫做用户手写注册,这个过程不仅给用户带来了不方便,而且由于用户预先书写的字符数量相对于能够识别的全部字符集是非常少量的,并不能准确地反映该用户的手写字符各自的特点。举例来说,简体汉字6700多八,而用来注册的汉字如果控制在100个以内,远远小于6700个,其注册得到的信息并不足以代表用户手写字符的全部特征。如果注册的文字数量增大,则并不方便用户的使用;(2)根据用户手写特点选择不同分类器,这种方式同样需要进行用户手写注册过程,提取其独有的特征,然后自动挑选多个分类器。这种方法依赖于多个分类器的挑选是否适合,即便是挑选的分类器比较准确,但对于不同用户的不同写法,便会不断的提高算法的复杂度,不断的增加相应的存储空间的消耗,由此换来的手写识别准确率的提高仍然是有限的。
另外,用户的手写笔迹特点会随着用户的年龄或者身体肌肉等条件的变化而变化,如果采用以上的方法,则需要用户重新注册或者调整分类器,由此看来,现有的方法都不能很好的适用于个体用户的使用。
因此,当前的手写识别系统不仅需要结合不同用户的独有特征来满足不同用户的需求,同时提高手写字符识别的正确率,而且需要降低实现系统改进所占用的存储和计算资源。
发明内容
发明的目的是提供一种简单的方便的自适应手写识别系统和方法,从而可以自动的适应不同用户的写法,提高手写识别的准确率,同时降低实现系统改进所占用的存储和计算资源。
根据本发明的一方面,提供了一种自适应手写识别系统,手写字符输入单元,用于使用户输入字符,并生成包含有字符笔迹点坐标的手写笔迹数据;至少一个通用字符特征模板库,用于存储通过预先样本训练得到的字符集及其对应的特征模板;至少一个用户字符特征模板库,用于存储用户字符特征模板;输入字符识别单元,接收来自手写输入单元的手写笔迹数据,从手写笔迹数据中提取输入的手写字符笔迹的特征向量,从通用字符特征模板库中调用通用字符特征模板,基于所述特征向量和通用字符特征模板,对输入字符进行识别,并根据识别结果,来更新用户字符特征模板库中的用户字符特征模板。
根据本发明的一方面,所述的自适应手写识别系统还可包括用户登录单元,用于使不同用户输入含有各自的标识信息的用户登录信息,输入字符识别单元根据用户信息来更新不同用户对应的用户字符特征模板。
根据本发明的一方面,所述输入字符识别单元包括:特征向量提取单元,用于从所述手写笔迹数据中提取所述输入字符的特征向量;至少一个共用分类器,比较所述字符的特征向量与所述通用字符特征模板库中的特征模板之间的近似度,根据近似度从高到低顺序给出多个候选字;控制选择单元,用于使用户从多个候选字中选择自己所输入的正确的字符;更新或创建单元,如果用户所选择的正确的字符不是多个候选字的首选字,则更新用户字符特征模板库中的特征模板或创建用户字符特征模板。
根据本发明的一方面,如果用户字符特征模板存储器中已经存储有用户字符特征模板,则共用分类器还从用户字符特征模板存储器中调用用户字符特征模板,在比较所述字符的特征向量与所述通用字符特征模板的近似度的同时,还比较与所述用户字符特征模板之间的近似度。
根据本发明的一方面,所述更新或创建单元根据所述字符的字符编码查找用户字符特征模板库中查找和所述字符编码对应的特征模板,如果查找到对应的模板,则将用户输入的字符的特征向量和所查找到的特征模板进行特征融合,生成新的模板,存储到用户字符特征模板库中,从而更新用户字符特征模板。
根据本发明的一方面,如果没有查找到与所述字符编码对应的特征模板,则所述更新或创建单元根据用户输入的字符的特征向量创建特征模板并将其添加到用户字符特征模板库中,从而创建用户字符特征模板。
其中,所述更新或创建单元采用加权平均的方式进行融合。
根据本发明的一方面,所述的自适应手写识别系统,还包括显示单元,用于显示所述多个候选字,以使用户进行选择。
根据本发明的一方面,提供了一种自适应手写识别方法,可包括:(a)根据用户手写输入的字符,生成包含手写字符笔迹的坐标信息的手写笔迹数据;(b)从手写笔迹数据中提取所述字符的特征向量,将所述字符的特征向量与通用字符特征模板库中的特征模板进行匹配来对字符进行识别;(c)根据匹配结果来判断识别结果;(d)如果判断出的识别结果为不能正确识别,则更新用户字符特征模板库中的用户字符特征模板。
根据本发明的一方面,所述的自适应手写识别方法还可包括使不同用户输入含有各自的标识信息的用户登录信息的步骤,从而根据用户的标识信息来对输入字符进行识别,并根据识别结果更新用户字符特征模板库中的各个用户对应的特征模板。
根据本发明的一方面,所述步骤(b)可包括:(b1)调用通用字符特征模板,比较所述字符的特征向量与通用字符特征模板之间的近似度,根据近似度从高到底给出与特征模板对应的多个候选字;(b2)使用户从多个候选字中选择其想要输入的正确的字符。
根据本发明的一方面,所述步骤(c)包括:判断用户所选择的字符是否是多个候选字中的首选字,如果不是首选字,则判断结果为不能正确识别。
根据本发明的一方面,如果用户字符特征模板存储器中已经存储有用户字符特征模板,则步骤(b1)还包括调用用户字符特征模板,并比较所述字符的特征向量与所述用户字符特征模板之间的近似度的步骤。
根据本发明的一方面,在步骤(d)中,根据所述字符的字符编码查找用户字符特征模板库中查找和所述字符编码对应的特征模板,如果查找到对应的模板,则将用户输入的字符的特征向量和所查找到的特征模板进行特征融合,生成新的模板,存储到用户字符特征模板库中,从而更新用户字符特征模板。
如果没有查找到与所还字符编码对应的特征模板,则根据用户输入的字符的特征向量创建特征模板并将其添加到用户字符特征模板库中,从而创建用户字符特征模板。
根据本发明的一方面,将用户输入的字符的特征向量和所查找到的特征模板进行特征融合采用加权平均的方式进行融合。
根据本发明的一方面,所述的自适应手写识别方法还包括显示所述多个候选字以使用户进行选择的步骤。
附图说明
通过下面结合示例性地示出一例的附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1是根据本发明实施例的自适应手写识别系统的框图;
图2是图1中的自适应手写识别系统中的识别结果处理单元的结构框图;
图3是根据本发明实施例的自适应手写识别方法的流程图;
图4是图3中的更新用户字符特征模板库中的用户字符特征模板的步骤的详细流程图;
图5是根据本发明实施例的自适应手写识别系统能够运行的计算环境的一个示例;
图6是根据本发明实施例的自适应手写识别系统运行的常见物理平台的示例。
具体实施方式
以下,将参照附图详细描述本发明的优选实施例。在下面的描述中,为了清晰和简明起见,省略了对公知功能或结构的详细描述。
在本发明中使用的术语“组件”指的是与本发明系统相关的实体,或者是硬件,硬件和软件的结合、软件,或者是执行中的软件。例如,组件可以是,但不局限于,运行在处理器上的进程、处理器、对象、可以执行的东西、执行的线程、程序和计算机。作为示例,运行在服务器上的应用程序和/或服务器可以是组件。另外组件可以包括一个或多个组件。
图1是根据本发明实施例的自适应手写识别系统的框图。如图1所示,该自适应手写识别系统包括:手写字符输入单元101、特征向量提取单元102、通用字符特征模板库103、共用分类器104、用户字符特征模板库105、识别结果处理单元106。
手写字符输入单元101在用户输入字符时生成手写笔迹数据,所述手写笔迹数据表示用户进行手写输入时外部组件提供的包含字符笔迹点坐标的数据集合。
特征向量提取单元102,用于从手写笔迹数据中提取输入字符的手写笔迹的特征向量。
通用字符特征模板库103存储可以被识别的字符的所有或者部分特征模板,通用字符特征模板可以通过大量样本训练得到的字符集和其对应的特征模板,也可以是人为设定,代表各个手写字符的共性特征的字符集和其对应的特征模板。这些字符集包含字符的种类和数量,即该手写识别系统的识别范围。通用字符特征模板库103可以是一个或多个。
用户字符特征模板库105用来存储用户手写字符的特征模板,如果是多用户系统,则用户字符特征模板库存放与不同用户对应的用户字符特征模板。用户字符特征模板库中的特征模板的数量同用户数量多少相关,用户越多,用户字符特征模板数就越多。用户字符特征模板库105可以是一个或多个。
共用分类器104用来根据特征模板进行文字识别的组件,可以包含一个分类器,也可以是多个分类器的组合。分类器指的是在模式识别领域提供的各种可以被用于文字字符识别的分类方法,例如,贝叶斯分类器等。共用分类器104从特征向量提取单元102接收用户输入字符的特征向量,将该特征向量和通用字符特征模板库103中的通用字符特征模板和用户字符特征模板库105中的用户字符特征模板进行匹配比较,给出识别结果。
识别结果处理单元106根据识别结果,判断是否将字符的特征向量同用户字符特征模板库105中的对应的字符模板相结合,生成新的特征模板,再存入用户字符特征模板库105中。
识别结果处理单元可包括如图2所示的显示单元107、选择控制单元108和更新或创建单元109。显示单元107显示共用分类器104的识别结果,用户通过选择控制单元108对识别结果进行选择和控制。更新或创建单元109根据用户选择的结果来确定是否更新或创建用户字符特征模板。
如果根据本发明的自适应手写识别系统是用于多个用户的,则该系统还包括用户登录单元110,用于提供用户的各自标识,以区分不同的用户,从而对用户字符特征模板库105进行创建和管理。如果该手写识别系统仅用于单个用户,则该用户登录单元110可以省略。
在根据本发明的自适应手写识别系统中所涉及到特征向量、特征模板和分类器均是模式识别领域中定义的和能够被公开获取的算法和概念,并不指特定的格式或者特定的实现方法。因为文字字符是以数字编码的形式存放于计算机或者其他设备中,所以通用字符特征模板库103和用户字符特征模板库105中存放着特征模板和字符编码的对应关系。例如:在UNICODE编码情况下,汉字“志”,对应的数字编码值为“5FD7”,假定特征模板R={r1,r2,...,rn}(n>0)是“志”的特征模板,则特征模板R与“5FD7”相对应存放于特征模板库中,这样根据特征模板便可以找到相对应的字符编码,即找到其对应的字符。这种对应关系同样适用于其他各种字符编码方式。
下面,将参照图1、图2和图3详细描述根据本发明实施例的自适应手写识别系统的自适应识别过程。
图3是根据本发明实施例的自适应手写识别方法的流程图。在步骤S301中,用户从手写字符输入单元101手写输入字符,然后,手写字符输入单元101根据用户输入的字符生成手写笔迹数据,手写笔迹数据中至少要包含手写字符笔迹所经过的点的部分或者全部坐标信息。在步骤S302中,特征向量提取单元102从字符笔迹数据中提取输入的手写字符笔迹的特征向量。
在步骤S303中,共用分类器104从通用字符特征模板库103中调用通用字符特征模板,将提取的字符笔迹的特征向量同通用字符特征模板库103中的全部或者部分模板进行匹配比较。如果用户字符特征模板库105中已经存储有用户字符特征模板,则该步骤还包括从用户字符特征模板库105中调用用户字符特征模板,然后与提取的字符笔迹的特征向量进行匹配比较。如果是多用尸系统,则根据输入的用户登录信息提供的用户标识,从用户字符特征模板库105中调出与该用户对应的字符特征模板,然后进行匹配比较。通用字符特征模板库103中存放这通过大量样本事先训练好的特征模板,训练算法属于各种模式识别领域中的公知常识或已有技术,这里不再详细描述。
下面,详细说明在步骤S303中共用分类器的分类过程。共用分类器计算输入字符的特征向量与通用字符特征模板库103和用户字符特征模板库105提供的特征模板两两之间的识别距离值。识别距离的计算方式有多种,同样其量度单位也是不大相同的。这个过程使用任何能够准确反映特征向量与已存的特征模板相似度的数值或其他可以比较大小的代码。例如可以使用特征向量和特征模板之间的欧式距离作为识别距离,当然也存在其它的表现形式,但是其功用是相同或相似的。在识别距离为数值的情况下,该数值的越小,说明输入字符的特征向量与该特征模板越相似,或者越大越相似。总之识别距离和相似度之间存在这正比或者反比的关系。为了节约计算比较的时间,可以使用快捷的计算方法,例如分级搜索等。
共用分类器104根据计算得到的识别距离的大小将特征模板对应的字符按照相似度由高到低进行排列,最终得到与输入手写字符最为相似的候选字组,该候选字组中包含文字的个数可以设定,一般小于20个。这里,首选字指代的是排在第一位的系统认为最为相似的候选字符,系统默认首选字为正确的识别结果。通过步骤S303得到的候选字组在步骤S304中通过显示单元107显示给使用该系统的用户。如果首选字不是用户想要输入的字符,则在步骤S305中,用户通过选择控制单元108从候选字组中选择正确的识别结果,然后在步骤S306中,判断正确字符结果是否等于首选字。如果不是首选字,则说明原有分类器还不能很好的适应用户手写这个字符的写法特点。因此,在步骤S307中,更新或创建单元109需要根据字符特征向量更新用户字符特征模板库105中的字符特征模板,来创建或者更新用户字符特征模板库105中的特征模板。如果在步骤S306中,判断结果为所选择的正确的字符为首选字,则说明原有的分类器可以正确的识别用户手写这个字符的写法,因而不需要创建或更新用户的特征模板。
下面,照图4详细描述在步骤S307中根据字符特征向量更新用户字符特征模板库105的过程。
图4是根据本发明实施例的自适应字符识别方法的更新用户字符特征模板库的方法的流程图,即更新或创建单元109的操作过程。
在步骤S401中,更新或创建单元109根据和正确字符结果对应的字符编码以及用户登录信息中的用户标识,从用户字符特征模板库中查找和字符编码对应的特征模板。根据步骤S401的查找结果,在步骤S402,判断在用户字符特征模板库中是否已经存在该字符的特征模板。如果存在,则在步骤S404中,更改用户字符特征模板库中的特征模板,将用户输入的该字符的特征向量和用户字符特征模板库中对应的特征模板进行特征融合。特征融合方法有多种,根据特征模板和特征向量的构成的不同,其对应的融合方法也不相同,这里不是特指某种融合方法。本发明的实施例中,对于特征维数相同的情况下,可以采用加权平均的方式进行融合,例如用户库中原有的特征模板为T={t1,t2,...,tn}(n>0),n为特征维数。输入字符的特征向量为A={a1,a2,...,an},则新的特征模板B={(t1+a1)/2,(t2+a2)/2,...,(tn+an)/2},(n>0)。这只是一种实现方法,其他模式识别中所用到的特征融合方法也可以应用于本发明的实施例中,如均值聚类等。
如果原来的用户字符特征模板库中不存在与所述输入的字符对应的特征模板,则在步骤S403中,根据在步骤图3的步骤S303中提取的用户输入的该字符的特征向量,创建特征模板并将其添加到用户字符特征模板库中。根据特征向量创建特征模板的方法不是唯一的,可以采用目前或者将来在模式识别领域公开的各种方法。作为示例,如果特征向量和特征模板维数相同,那么可以采用直接等同的方式,即此时该字符的特征向量即为要添加到用户库中的特征模板。在步骤S403或者步骤S404处理完成后,该流程分别结束。字符特征模板能够代表用户手写字符的特点,因而本发明提供的这种更新机制使本系统能够自动的适应用户手写字符特点的变化。
用户通过本发明进行手写识别时,会不断的重复图3和图4所示流程,这样随着用户不断的使用该自适应手写识别系统,用户的手写字符的特征便被不断地记录下来。另外根据用户字符特征模板融合或者添加的判断准则,系统只记录共用分类器组件不能够识别的字符,这样对于曾经不能够被共用分类器组件正确识别的字符,在下次书写时便可以得到正确的结果。
本发明涉及的模式识别领域提供的特征提取方法和共用分类器并不是特定的,同样识别手写字符的范围也不是特定的。作为示例,下面描述一个手写字符通过本发明的处理过程:假定用户第一次使用本系统,用户通过数字化仪手写输入汉字“新”,其图案为:,数字化仪给出该符号图案的笔迹数据Q{(x1,y1,...),(x2,y2,...),...,(xn,yn,...)};其中n为自然数,表示该手写字符所包含的采样点的个数,(x1,y1),...,(xn,yn),指代这些采样点的坐标值。然后得到该符号的特征向量P{p1,p2,...,pm},m>0,指代特征向量的长度。通过共用分类器将通用字符特征模板库中存放的特征模板和该特征向量进行匹配,可以得到一组识别结果候选字:“刻敦新教......”,首选字为“刻”,而不是用户想要输入的正确结果“新”,此时,用户会从侯选字中选择第三个,即“新”字。这样系统判断出共用分类器给出的首选字并不是与输入手写字符正确对应的,即识别结果不正确。这时,系统将特征向量P{}转变为特征模板R{}和“新”字对应的字符编码(如果是UNICODE编码,则该字符的编码为“65B0”)存放于用户字符特征模板库中。特征向量转变为特征模板的方法很多,这里可以直接让R{}=P{},这样R{}便包含了手写字符的特征。当用户再一次写入汉字“新”时,其图案为:,可以看出这两种写法的特点是相似的,在完成特征向量提取之后,共用分类器将其与通用字符特征模板和用户字符特征模板库中特征模板进行匹配,由于此时用户字符特征模板库已经存放了“新”字对应的具有同样手写特点的特征模板R{},这种情况下共用分类器会认为R{}与的特征向量最为匹配,则显示识别候选结果为:“新刻敦教......”,首选字为“新”字,则识别结果正确。由此可以看出,本发明提供的系统和方法具有自动适应用户的手写字符特点,从而使用户写得越多,识别系统的识别准确率越高。
根据本发明实施例的自适应手写识别方法,采用共用分类器,通用字符特征模板库和不同用户字符特征模板库相结合的方式,基于共用分类器的识别结果,能够根据用户选择自动地将共用分类器识别错误的结果记录下来,根据该用户的手写字符特征生成该用户自己独有的字符特征模板,使用户在下一次书写中能够通过共用分类器得到正确的识别结果,从而提高手写识别的正确率。
图5表示的本发明能够运行的计算环境的一个示例。该计算环境包括手写输入单元501,中央处理单元502,显示单元503,选择控制单元504,程序和数据库505和电源506共六个组件。这六个组件可以进行合并或者分裂,但是其所实现的功能要具备。501可以是能够购买的或者专用的将手写笔迹转换为坐标,并且能够被存储到组件内的设备,例如手写板,PDA和Tablet-PC上的触摸屏/触摸键盘等。502可以是一切能够购买的常用处理器或者专用的处理器,另外,502可以由多于一个的处理器通过诸如并行或串行组合连接形成的多处理器。显示单元503是可以显示候选字结果的组件,例如PC的显示器LCD,PDA的LCD和手机屏幕等。选择控制单元504的功能是给用户一种进行正确识别结果选择的组件,例如键盘和触摸屏等。程序和数据库505用来指代本发明用到的通用字符特征模板库,用户字符特征模板库和计算程序等数据信息,其存储格式根据存储介质的不同而不同。这些信息可以分开存储。506为给本发明的系统供电的组件,例如手机电池,计算机电源等。图5中的各个单元之间的连线是提供了一种连接方式,但并不局限于此方式。另外,各个单元之间也可以依靠其他通信组件通过网络相连,例如有线/无线网卡,调制解调器,蓝牙,红外和移动通信设备的发送/接收天线等。
图6示出了根据本发明实施例的自适应手写识别系统运行的常见的物理平台的一个示例,如手写板和PC相连601进行手写字符输入,有触摸屏的PDA602和有触摸屏的手机603。
本发明在三星SCH-W399平台上进行了测试,测试样本是由3位不同的人分别在该平台上手写了含有3000个常用汉字的短文,共用分类器为常见的贝叶斯分类器。这三组汉字中相同汉字的重复次数是不定的,有的是没有重复,有的是重复30次等,这是为了很好的模拟用户实际的使用情况,因为对于不同的用户而言不同的汉字使用的频率也是不同的。将这三组汉字作为手写数据分别送入到运行在SCH-W399手机上的自适应手写识别系统和无自适应功能的手写识别系统,识别准确率如表1所示。识别准确率的定义为:准确率=首选字正确的个数/手写字符的总数。这里三组汉字所包括的手写字符的总数均为3000个。
表1识别准确率对照表
  测试样本组   无自适应识别的准确率   自适应识别的准确率
  A   0.938   0.958
  B   0.915   0.948
  C   0.966   0.981
因为并没有过多的增加运算复杂度,所以在该平台上平均处理单个字符识别的时间增加值低于0.01%.从表1中可以看到本发明提供的自适应识别系统能够有效的适应不同用户的手写特点,提高各自的手写字符的识别准确率。
实验证明该系统能保存不同用户的特性,弥补了共用分类器的不足,从而提高系统的识别准确率。针对不同的用户创建各自的用户库文件,这样用户库之间不会产生任何影响。对于单个用户增加的容量空间都是极为有限的。尤其是PDA和手机等移动终端来说,其运算能力和空间都是有限的,而且往往是长时间被一个人使用,因而该自适应手写识别系统适用于这些终端设备上。实验还证明通过本发明可以在增加较少的计算量和空间的消耗下有效地提高手写识别的准确率。
根据本发明实施例的自适应手写识别系统和方法,具有下面几方面的优点:无需进行用户手写注册过程,自动适应用户的书写特点的变化;只需要共用分类器即可,基本没有提高算法复杂度;针对不同用户的手写特点自动建立特征库,适应不同用户的手写特点,从而弥补共用分类器的不足。
本发明可以广泛的运用于各种可以进行手写输入的移动终端设备上,也可以用于有外接录入设备的有计算能力的设备上,如PC,服务器等。其涉及到的各个组件不局限于一个单一设备,可以分布在多个设备上,比如通过互联网连接的服务器PC和客户端PC上。
另外,根据本发明实施例的自适应手写识别系统和方法具有很好的扩展性和易用性,适合Tablet-PC,PDA和手写手机等设备使用,尤其是对于手机这种计算能力弱,存储空间有限的终端来说,其优点尤为明显。支持多用户使用,可以分别提高每一个用户的手写识别准确率。
尽管已经参照示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对这些实施例进行形式和细节上的各种改变。

Claims (17)

1.一种自适应手写识别系统,包括:
手写字符输入单元,用于使用户输入字符,并生成包含有字符笔迹点坐标的手写笔迹数据;
至少一个通用字符特征模板库,用于存储通过预先样本训练得到的字符集及其对应的特征模板;
至少一个用户字符特征模板库,用于存储用户字符特征模板;
输入字符识别单元,接收来自手写输入单元的手写笔迹数据,从手写笔迹数据中提取输入的手写字符笔迹的特征向量,从通用字符特征模板库中调用通用字符特征模板,基于所述特征向量和通用字符特征模板,对输入字符进行识别,并根据识别结果,来更新用户字符特征模板库中的用户字符特征模板。
2.如权利要求1所述的自适应手写识别系统,还包括用户登录单元,用于使不同用户输入含有各自的标识信息的用户登录信息,输入字符识别单元根据用户信息来更新不同用户对应的用户字符特征模板。
3.如权利要求1所述的自适应手写识别系统,其中,所述输入字符识别单元包括:
特征向量提取单元,用于从所述手写笔迹数据中提取所述输入字符的特征向量;
至少一个共用分类器,比较所述字符的特征向量与所述通用字符特征模板库中的特征模板之间的近似度,根据近似度从高到低顺序给出多个候选字;
控制选择单元,用于使用户从多个候选字中选择自己所输入的正确的字符;
更新或创建单元,如果用户所选择的正确的字符不是多个候选字的首选字,则更新用户字符特征模板库中的特征模板或创建用户字符特征模板。
4.如权利要求3所述的自适应手写识别系统,其中,如果用户字符特征模板存储库中已经存储有用户字符特征模板,则共用分类器还从用户字符特征模板存储库中调用用户字符特征模板,在比较所述字符的特征向量与所述通用字符特征模板的近似度的同时,还比较与所述用户字符特征模板之间的近似度。
5.如权利要求3或4所述的自适应手写识别系统,其中,所述更新或创建单元根据所述字符的字符编码查找用户字符特征模板库中查找和所述字符编码对应的特征模板,如果查找到对应的模板,则将用户输入的字符的特征向量和所查找到的特征模板进行特征融合,生成新的模板,存储到用户字符特征模板库中,从而更新用户字符特征模板。
6.如权利要求5所述的自适应手写识别系统,其中,如果没有查找到与所述字符编码对应的特征模板,则所述更新或创建单元根据用户输入的字符的特征向量创建特征模板并将其添加到用户字符特征模板库中,从而创建用户字符特征模板。
7.如权利要求5所述的自适应手写识别系统,其中,所述更新或创建单元采用加权平均的方式进行融合。
8.如权利要求3所述的自适应手写识别系统,还包括显示单元,用于显示所述多个候选字,以使用户进行选择。
9.一种自适应手写识别方法,包括:
(a)根据用户手写输入的字符,生成包含手写字符笔迹的坐标信息的手写笔迹数据;
(b)从手写笔迹数据中提取所述字符的特征向量,将所述字符的特征向量与通用字符特征模板库中的特征模板进行匹配来对字符进行识别;
(c)根据匹配结果来判断识别结果;
(d)如果判断出的识别结果为不能正确识别,则更新用户字符特征模板库中的用户字符特征模板。
10.如权利要求9所述的自适应手写识别方法,还包括使不同用户输入含有各自的标识信息的用户登录信息的步骤,从而根据用户的标识信息来对输入字符进行识别,并根据识别结果更新用户字符特征模板库中的各个用户对应的特征模板。
11.如权利要求9所述的自适应手写识别方法,其中,所述步骤(b)包括:
(b1)调用通用字符特征模板,比较所述字符的特征向量与通用字符特征模板之间的近似度,根据近似度从高到低给出与特征模板对应的多个候选字;
(b2)使用户从多个候选字中选择其想要输入的正确的字符。
12.如权利要求11所述的自适应手写识别方法,其中,所述步骤(c)包括:判断用户所选择的字符是否是多个候选字中的首选字,如果不是首选字,则判断结果为不能正确识别。
13.如权利要求11所述的自适应手写识别方法,其中,如果用户字符特征模板存储器中已经存储有用户字符特征模板,则步骤(b1)还包括调用用户字符特征模板,并比较所述字符的特征向量与所述用户字符特征模板之间的近似度的步骤。
14.如权利要求12所述的自适应手写识别方法,其中,在步骤(d)中,根据所述字符的字符编码查找用户字符特征模板库中查找和所述字符编码对应的特征模板,如果查找到对应的模板,则将用户输入的字符的特征向量和所查找到的特征模板进行特征融合,生成新的模板,存储到用户字符特征模板库中,从而更新用户字符特征模板。
15.如权利要求14所述的自适应手写识别方法,其中,如果没有查找到与所述字符编码对应的特征模板,则根据用户输入的字符的特征向量创建特征模板并将其添加到用户字符特征模板库中,从而创建用户字符特征模板。
16.如权利要求14所述的自适应手写识别方法,其中,将用户输入的字符的特征向量和所查找到的特征模板进行特征融合采用加权平均的方式进行融合。
17.如权利要求11所述的自适应手写识别方法,还包括显示所述多个候选字,以使用户进行选择。
CN2006101542690A 2006-09-19 2006-09-19 自适应手写识别系统和方法 Expired - Fee Related CN101149804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006101542690A CN101149804B (zh) 2006-09-19 2006-09-19 自适应手写识别系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101542690A CN101149804B (zh) 2006-09-19 2006-09-19 自适应手写识别系统和方法

Publications (2)

Publication Number Publication Date
CN101149804A true CN101149804A (zh) 2008-03-26
CN101149804B CN101149804B (zh) 2010-11-10

Family

ID=39250319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101542690A Expired - Fee Related CN101149804B (zh) 2006-09-19 2006-09-19 自适应手写识别系统和方法

Country Status (1)

Country Link
CN (1) CN101149804B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010078698A1 (zh) * 2008-12-30 2010-07-15 广东国笔科技股份有限公司 一种手写字符识别方法及系统
CN102455866A (zh) * 2011-09-29 2012-05-16 北京壹人壹本信息科技有限公司 一种手写文字信息的匹配处理方法及装置
CN103413078A (zh) * 2013-07-25 2013-11-27 武汉汉德瑞庭科技有限公司 基于用户标识和笔迹的两层在线认证系统及认证方法
CN103455741A (zh) * 2013-09-06 2013-12-18 武汉汉德瑞庭科技有限公司 一种基于字符的在线笔迹认证的模板扩充方法
CN103473493A (zh) * 2013-09-06 2013-12-25 武汉汉德瑞庭科技有限公司 一种基于字符字根的在线笔迹认证及模板扩充方法
CN103824094A (zh) * 2012-11-16 2014-05-28 方正国际软件(武汉)有限公司 笔迹校验装置和笔迹校验方法
CN104007836A (zh) * 2014-05-07 2014-08-27 惠州Tcl移动通信有限公司 一种手写字输入的处理方法及终端设备
CN105488504A (zh) * 2015-12-28 2016-04-13 四川长虹网络科技有限责任公司 基于摄像头的汉字识别方法
CN106339726A (zh) * 2015-07-17 2017-01-18 佳能株式会社 用于手写识别的方法及装置
CN106776501A (zh) * 2016-12-13 2017-05-31 深圳爱拼信息科技有限公司 一种文本错别字自动更正方法和服务器
CN106951890A (zh) * 2017-02-16 2017-07-14 广东小天才科技有限公司 一种词典笔的文字识别方法及装置
CN107861684A (zh) * 2017-11-23 2018-03-30 广州视睿电子科技有限公司 书写识别方法、装置、存储介质及计算机设备
CN108197953A (zh) * 2017-12-28 2018-06-22 王道顺 对防伪产品监控方法及装置
CN108228069A (zh) * 2017-12-21 2018-06-29 北京壹人壹本信息科技有限公司 手写字体输入方法、移动终端及装置
CN108279841A (zh) * 2018-01-05 2018-07-13 西安电子科技大学 基于音节字的全手写联机藏文输入系统
CN108388898A (zh) * 2018-01-31 2018-08-10 宁波市科技园区明天医网科技有限公司 基于连接体和模板的字符识别方法
CN108416249A (zh) * 2017-02-10 2018-08-17 肖奇 一种书写笔迹鉴别系统及方法
CN108563360A (zh) * 2018-04-18 2018-09-21 佛山市龙生光启科技有限公司 一种高速手写触摸板
CN108932514A (zh) * 2017-05-26 2018-12-04 上海大唐移动通信设备有限公司 一种图像识别方法和装置
CN109032383A (zh) * 2018-09-13 2018-12-18 广东工业大学 基于手写识别的输入方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101377856B (zh) * 2008-10-07 2011-06-29 广东威创视讯科技股份有限公司 笔迹书写的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010078698A1 (zh) * 2008-12-30 2010-07-15 广东国笔科技股份有限公司 一种手写字符识别方法及系统
CN102455866A (zh) * 2011-09-29 2012-05-16 北京壹人壹本信息科技有限公司 一种手写文字信息的匹配处理方法及装置
CN103824094A (zh) * 2012-11-16 2014-05-28 方正国际软件(武汉)有限公司 笔迹校验装置和笔迹校验方法
CN103413078B (zh) * 2013-07-25 2016-04-27 武汉汉德瑞庭科技有限公司 基于用户标识和笔迹的两层在线认证系统及认证方法
CN103413078A (zh) * 2013-07-25 2013-11-27 武汉汉德瑞庭科技有限公司 基于用户标识和笔迹的两层在线认证系统及认证方法
CN103455741A (zh) * 2013-09-06 2013-12-18 武汉汉德瑞庭科技有限公司 一种基于字符的在线笔迹认证的模板扩充方法
CN103473493A (zh) * 2013-09-06 2013-12-25 武汉汉德瑞庭科技有限公司 一种基于字符字根的在线笔迹认证及模板扩充方法
CN103473493B (zh) * 2013-09-06 2017-04-12 武汉汉德瑞庭科技有限公司 一种基于字符字根的在线笔迹认证及模板扩充方法
CN104007836A (zh) * 2014-05-07 2014-08-27 惠州Tcl移动通信有限公司 一种手写字输入的处理方法及终端设备
CN104007836B (zh) * 2014-05-07 2018-03-16 惠州Tcl移动通信有限公司 一种手写字输入的处理方法及终端设备
CN106339726A (zh) * 2015-07-17 2017-01-18 佳能株式会社 用于手写识别的方法及装置
CN105488504A (zh) * 2015-12-28 2016-04-13 四川长虹网络科技有限责任公司 基于摄像头的汉字识别方法
CN106776501A (zh) * 2016-12-13 2017-05-31 深圳爱拼信息科技有限公司 一种文本错别字自动更正方法和服务器
CN108416249A (zh) * 2017-02-10 2018-08-17 肖奇 一种书写笔迹鉴别系统及方法
CN106951890A (zh) * 2017-02-16 2017-07-14 广东小天才科技有限公司 一种词典笔的文字识别方法及装置
CN108932514A (zh) * 2017-05-26 2018-12-04 上海大唐移动通信设备有限公司 一种图像识别方法和装置
CN107861684A (zh) * 2017-11-23 2018-03-30 广州视睿电子科技有限公司 书写识别方法、装置、存储介质及计算机设备
CN108228069A (zh) * 2017-12-21 2018-06-29 北京壹人壹本信息科技有限公司 手写字体输入方法、移动终端及装置
CN108197953A (zh) * 2017-12-28 2018-06-22 王道顺 对防伪产品监控方法及装置
CN108279841A (zh) * 2018-01-05 2018-07-13 西安电子科技大学 基于音节字的全手写联机藏文输入系统
CN108388898A (zh) * 2018-01-31 2018-08-10 宁波市科技园区明天医网科技有限公司 基于连接体和模板的字符识别方法
CN108563360A (zh) * 2018-04-18 2018-09-21 佛山市龙生光启科技有限公司 一种高速手写触摸板
CN109032383A (zh) * 2018-09-13 2018-12-18 广东工业大学 基于手写识别的输入方法
CN109032383B (zh) * 2018-09-13 2022-09-16 广东工业大学 基于手写识别的输入方法

Also Published As

Publication number Publication date
CN101149804B (zh) 2010-11-10

Similar Documents

Publication Publication Date Title
CN101149804B (zh) 自适应手写识别系统和方法
CN101611417B (zh) 用于字符识别的方法
CN103814351B (zh) 基于协同姿势的输入语言
CN105630856B (zh) 在线用户简档的自动聚合
CN101128838B (zh) 辨认图
CN101593270B (zh) 一种手绘形状识别的方法及装置
US8893054B2 (en) Devices, systems, and methods for conveying gesture commands
CN102449640B (zh) 识别手写单词
CN101128837A (zh) 基于分割的辨认方法
US9711117B2 (en) Method and apparatus for recognising music symbols
US20180300542A1 (en) Drawing emojis for insertion into electronic text-based messages
CN111339990A (zh) 一种基于人脸特征动态更新的人脸识别系统和方法
CN111667056B (zh) 用于搜索模型结构的方法和装置
CN102819567B (zh) 一种电子设备的联系人信息检索方法和系统
CN104020943A (zh) 字符串替换
CN105844216A (zh) 一种利用WiFi信号识别手写字母的检测与匹配机制
CN104007836B (zh) 一种手写字输入的处理方法及终端设备
CN107832035B (zh) 一种智能终端的语音输入方法
CN111695458A (zh) 一种视频图像帧处理方法及装置
CN101405693A (zh) 多模式输入的个人协作过滤
CN113190646A (zh) 一种用户名样本的标注方法、装置、电子设备及存储介质
CN102360265B (zh) 一种手写输入中确定待选字的方法及装置
JP2019109924A (ja) 情報処理システム、情報処理方法、プログラム
CN107077617B (zh) 指纹提取方法及装置
CN112989922A (zh) 基于人工智能的脸部识别方法、装置、设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101110

CF01 Termination of patent right due to non-payment of annual fee