CN104008363A - 手写轨迹的检测、规范化和在线识别以及异常字根的收集 - Google Patents

手写轨迹的检测、规范化和在线识别以及异常字根的收集 Download PDF

Info

Publication number
CN104008363A
CN104008363A CN201310202701.9A CN201310202701A CN104008363A CN 104008363 A CN104008363 A CN 104008363A CN 201310202701 A CN201310202701 A CN 201310202701A CN 104008363 A CN104008363 A CN 104008363A
Authority
CN
China
Prior art keywords
stroke
standard
radical
abnormal
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310202701.9A
Other languages
English (en)
Other versions
CN104008363B (zh
Inventor
许梅芳
李建杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CN201310202701.9A priority Critical patent/CN104008363B/zh
Publication of CN104008363A publication Critical patent/CN104008363A/zh
Application granted granted Critical
Publication of CN104008363B publication Critical patent/CN104008363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明涉及用于手写轨迹的检测、规范化和在线识别以及异常字根的收集的方法和装置。根据本公开一个实施例,提供了一种对字符的手写轨迹进行检测的方法,包括:基于预定的异常字根,对于手写轨迹的每一笔画,根据该笔画的几何特征进行第一判断,以判断是否该笔画是异常字根;如果不是,则进行第二判断,以判断是否该笔画是异常字根的一部分并且其与相邻笔画的组合是异常字根,所述第二判断是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。

Description

手写轨迹的检测、规范化和在线识别以及异常字根的收集
技术领域
本公开涉及用于字符的手写轨迹的检测、规范化、以及在线识别方法和装置,以及用于收集异常字根的方法和装置。
背景技术
以中文以及日文汉字(kanji)为代表的字符系统(其也被称为方块字或象形文字(ideographic character))通常包含多个笔画(stroke),其中的某些笔画或笔画组合常常被作为字根(radical)(例如但不限于,中文中的偏旁部首)。另外,某些字根可以与例如相邻的笔画组成更高级别的字根。
象形文字之类的字符的书写通常要比以英文为代表的表音字符系统要复杂得多。例如,中文(汉字)对于每一个字都具有标准的书写方式(writing style),包括:笔画的数目、笔画的书写顺序(笔顺)和方向,等等。
对于以中文(汉字)为代表的字符系统,键盘式的输入(到终端设备,例如计算机、移动终端等)常常是麻烦和低效的。随着手写板以及手机等便携式设备的普及,手写字符输入成为一种趋势。
然而,中文(汉字)字符众多,书写方式多样。并且,在书写时,为了简化和快捷,很多人并不是严格遵循标准的书写方式,并且笔画形状(stroke shape)和/或字根形状也可能发生变形,例如行书和草书等。并且,对于一些字根,特别是由较少笔画构成的字根,为了书写的便利,很多人会倾向于简化其书写,从而使得所写就的字根不符合标准的书写方式。通常,可以将这样的不符合标准的书写方式(例如,具有异常的笔画连接)的字根称为异常字根(abnormal radical)。例如,图8B示出了异常字根的一个示例。因此,这对高准确率地识别手写字符提出了挑战。
典型地,字符识别包括基于在线信息的在线识别和基于离线信息的离线识别。字符识别通常使用字典,字典可以包括用于字符的标准模板和/或基准模型。标准模板可以包括例如下列中的一项或多项:笔画构成,笔画数量,笔画的位置(起止点坐标),其它参考点坐标,等等。基准模型可以包括例如字符笔画的概率分布,笔画的起止点统计信息等等。本领域中已知用于字符识别的多种字典以及多种标准模板和/或基准模型。
在线识别将每一字符看作是笔移动(书写)的时间上的序列。也就是说,将手写轨迹看作具有分离笔画指示的坐标点的序列。因此,对于每一字符(文字),存在标准的序列,据此可以构造用于该字符(文字)的基准模型(reference model)以用于在线识别。从而,可以评估手写轨迹与用于在线识别的基准模型的匹配度,由此得到候选字符。例如但不限于,该匹配度可以作为识别置信度。
由于在线识别是基于轨迹序列的匹配,而一些常用的弹性的序列匹配方法(譬如隐马尔科夫模型(Hidden Markov Model,HMM)算法、动态时间归整(Dynamic Time Warping,DTW)算法等)对变形的字符具有较为鲁棒的匹配结果,因此即使对于形状变形了的字符,也能够实现相对精确的输入的序列和基准序列(reference sequence)之间的匹配。然而,在线识别对书写的顺序敏感,而书写顺序与笔画的数目、笔画的书写顺序和方向(也即,书写方式)高度相关,其中的变化很可能导致不准确的识别。
另外,与离线识别相比,某些在线书写信息易于提取,例如,笔画的数目、笔画的书写顺序、每一笔画的书写方向。然而,由于笔画的不同书写方式,字符的手写迹线的笔画的数目、笔画的书写顺序、每一笔画的书写方向常常会发生变化。因而,书写方式的变化将影响在线识别的识别性能。
对此,在现有技术中提出了一些在字符识别字典中记录书写方式变化(原型)的方法,例如可以见:
现有技术文献1:Masaki N,Kaoru M所著“Collection of on-linehandwritten Japanese character pattern databases and theiranalyses”,IJDAR(2004)7:69-81;
现有技术文献2:Akihito K,Masaki N所著“Prototype learning ofstructured pattern representation applied to on-line recognition ofhandwritten Japanese characters”,IJDAR(2007)10:101-112
现有技术文献3:US09/020838;
现有技术文献4:US13/214222。
在此,可以将每一种书写方式称为一种原型。在这些基于原型登记的在线识别技术中,将在字典中记录同一字符的多个原型,每一原型代表了一种书写方式。另一方面,对于基于统计的在线识别技术,诸如HMM、神经网络技术等等,字典中要存储对于同一字符的不同书写方式的更加复杂的统计模型,例如,HMM方法中的高斯密度分量来表示概率分布。
因此,针对不同书写方式,需要登记各种书写方式变化(原型),这通常需要复杂的计算和大得多的字典,这也意味着需要高的硬件成本和/或较长的识别时间(识别响应时间)。另外,对于这种基于原型登记的技术,其识别性能(例如,准确率)取决于训练样本的多样性。换句而言之,其仅能识别训练样本中已有的书写方式变化。离线识别从手写轨迹的图像提取笔画或笔画段的空间分布信息作为离线特征进行匹配。其通常是在书写完成之后进行识别的,一般其不利用动态书写信息(诸如,前述的笔画的数目、笔画的书写顺序(笔顺)和方向等)。离线识别依赖于手写轨迹图像的空间特征,从而对于书写方式的变化鲁棒。但是由于笔画形状的变形,离线识别的最佳候选(例如,第一最佳候选)的识别准确率通常没有在线识别的高。并且为了对笔画形状的变形鲁棒,离线识别需要高得多的处理能力和存储器成本,否则难以实现与在线识别相当的准确率。
至少针对上述的部分或全部问题,提出了本发明。
发明内容
根据本公开一个方面,提供了一种对字符的手写轨迹进行检测的方法和装置。所述方法包括:基于预定的异常字根,对于手写轨迹的每一笔画,根据该笔画的几何特征进行第一判断,以判断是否该笔画是异常字根;以及如果不是,则进行第二判断,以判断是否该笔画是异常字根的一部分并且其与相邻笔画的组合是异常字根,所述第二判断是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。
根据本公开一个方面,提供了一种对字符的手写轨迹进行规范化的方法和装置。所述方法包括:根据前述的方法对字符的手写轨迹进行检测;以及对所检测到的异常字根进行修正以使其符合对应的标准字根的书写方式。
根据本公开一个方面,提供了一种手写字符在线识别方法和装置,所述手写字符具有手写轨迹。所述方法包括:根据前述的方法对手写字符的手写轨迹进行规范化;以及基于所述规范化后的手写轨迹,通过在线识别来识别该手写字符。
根据本公开一个方面,提供了一种收集异常字根的方法和装置。所述方法包括:获得非标准书写方式的字符手写轨迹及其对应的标准字符;通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画;根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中;以及如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。
根据本公开一个方面,提供了一种针对书写者自适应的在线字符识别方法和装置。所述方法包括:根据前述的方法收集异常字根;接收所述书写者的字符手写轨迹;根据前述的方法对所接收的字符手写轨迹进行识别,其中以所收集的异常字根作为所述预定的异常字根。
根据本公开的实施例,可以以较低的成本(例如,较小的字典,较低的计算处理能力)实现紧凑的高准确率的手写识别引擎。根据本公开的实施例的方法或装置,对于书写方式的变化相比于现有技术更加鲁棒。并且由于本发明基于字根级别的识别和/或书写方式规范化,而不是如现有技术中那样基于笔画级别,而字根是可以在若干不同字符之间共享的,因此可以降低或消除对训练样本的依赖性。此外,根据本公开的实施例,对于笔画形状变形也更加鲁棒。与现有技术相比,本发明可以实现对手写轨迹的更高准确率的识别,特别是,可以显著改善对于第一(最佳)候选的识别准确率。
从下面参考附图的说明中,本发明的另外的特性、特征、和优点将更加清楚。
附图说明
本申请包括附图,并且附图构成本申请的一部分,附图示出了本公开的实施例并且与说明书一起用于解释本发明的原理。
图1是示出可以实现本公开的某些实施例的一种机器系统的硬件配置的框图。
图2示意性地示出了根据本公开一个实施例的用于对字符的手写轨迹进行检测的方法的流程图。
图3示意性地示出了根据本公开一个实施例的用于对字符的手写轨迹进行检测的装置的示意框图。
图4示意性地示出了根据本公开一实施例的判断笔画或笔画的组合是否是异常字根的示例处理过程的流程图。
图5示意性示出了根据本公开一实施例的收集异常字根的示例处理过程的流程图。
图6示意性地示出了根据本公开一个实施例的检测非标准笔画的示例处理过程的流程图。
图7示意性示出了根据本公开一个实施例的对字符的手写轨迹进行规范化的装置的示意框图。
图8A示意性地示出了作为一个示例的手写字符的视图,图8B示出了根据该示例的一个异常字根,图8C示出了对该异常字根的修正。
图9示意性地示出了根据本公开一个实施例的对异常字根进行修正的处理过程的流程图。
图10A-10D示出了根据本公开的一个实例的异常字根,其角点、其笔画连接点、和根据笔画连接点划分的笔画的例子。
图11示出了根据本公开一个实施例的手写字符在线识别装置的示意框图。
图12示出了根据本公开一个实施例的收集异常字根的装置的示意框图。
图13示出了根据本公开一个实施例的针对书写者自适应的在线字符识别装置的示意框图。
具体实施方式
下面将参考附图详细描述本公开的实施例。
注意,在附图中类似的附图标记和字母表示类似的项,并且因此一旦在一个附图中定义了一个项,则对于以后的附图无需再就该项进行讨论。
图1是示出可以实现本发明实施例的机器(例如,计算机)系统1000的硬件配置的框图。
如图1中所示,计算机系统包括计算机1110。计算机1110包括经由系统总线1121连接的处理单元1120、系统存储器1130、固定非易失性存储器接口1140、可移动非易失性存储器接口1150、用户输入接口1160、网络接口1170、视频接口1190和输出外围接口1195。
系统存储器1130包括ROM(只读存储器)1131和RAM(随机存取存储器)1132。BIOS(基本输入输出系统)1133驻留在ROM1131中。操作系统1134、应用程序1135、其它程序模块1136和某些程序数据1137驻留在RAM1132中。
诸如硬盘之类的固定非易失性存储器1141连接到固定非易失性存储器接口1140。固定非易失性存储器1141例如可以存储操作系统1144、应用程序1145、其它程序模块1146和某些程序数据1147。
诸如软盘驱动器1151和CD-ROM驱动器1155之类的可移动非易失性存储器连接到可移动非易失性存储器接口1150。例如,软盘1152可以被插入到软盘驱动器1151中,以及CD(光盘)1156可以被插入到CD-ROM驱动器1155中。
诸如麦克风1161和键盘1162之类的输入设备被连接到用户输入接口1160。计算机1110还可以包括手写输入单元(诸如,手写板)1163,以用于接收用户输入的手写字符,所述手写字符可以具有手写轨迹。
计算机1110可以通过网络接口1170连接到远程计算机1180。例如,网络接口1170可以经由局域网1171连接到远程计算机1180。或者,网络接口1170可以连接到调制解调器(调制器-解调器)1172,以及调制解调器1172经由广域网1173连接到远程计算机1180。
远程计算机1180可以包括诸如硬盘之类的存储器1181,其存储远程应用程序1185。
视频接口1190连接到监视器1191。
输出外围接口1195连接到打印机1196和扬声器1197。
图1所示的计算机系统仅仅是说明性的并且决不意图对本发明、其应用或用途进行任何限制。
图1所示的计算机系统可以被实施于任何实施例,可作为独立计算机,或者也可作为设备中的处理系统,可以移除一个或更多个不必要的组件,也可以向其添加一个或更多个附加的组件。
图2示出了根据本公开一个实施例的用于对字符的手写轨迹进行检测的方法的流程图。在该实施例中,在步骤S201,基于预定的异常字根,对于手写轨迹的每一笔画,根据该笔画的几何特征判断(第一判断)是否该笔画是异常字根。
在一个实现方式中,可以通过对多个书写者的多种书写方式进行统计分析,预先针对每一字符(例如,常用汉字)定义可能的异常字根,例如,具有异常笔画连接的字根,从而,形成预定的异常字根。在另外的实现方式中,可以以例如自适应的方式收集异常字根。图5示出了根据本公开一实施例的收集异常字根的处理过程的流程图,将在稍后对其详细说明。可以在数据库或者字典等中存储所预先定义或者收集的异常字根。
如果在步骤S201,判断该笔画是异常字根,则确定该笔画是异常字根。如果不是,则判断(第二判断)是否该笔画是异常字根的一部分并且其与相邻笔画的组合是异常字根(步骤S203)。如果是,则确定该笔画是异常字根。如果不是,则确定该笔画不是异常字根。这里,所述第二判断可以是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。
所述几何特征包括所述笔画或笔画的组合中的线段的长度、线段的方向、以及线段的中点的坐标。在一个具体示例中,所述线段可以是在所述笔画或笔画的组合中的角点处将该笔画或笔画的组合分隔而成的多个(两个或更多个)线段。
图8A示意性地示出了作为一个示例的手写字符的视图。显然,对其正确的识别将得到字符“位”。图8B示出了对于该手写轨迹,一个可能的异常字根,是由一笔写成的
下表1以示例的方式示出了某些示例字符内的可能的异常字根。
表1
在本公开的一些优选示例中,在此仅仅检测低级别的字根,这样的字根具有较小笔画数(例如,三笔(画)或者更少笔画)并且难以进一步分解成更小字根。在实际书写中,这样的字根常常被写成连笔,例如,被写成一笔或两笔,从而在识别时成为异常字根。因此,异常字根也可以被称为具有异常笔画的字根。对于上述的低级别的异常字根,其通常仅具有1个异常笔画。在这样的实施例中,在步骤S201,可以判断是否该笔画是1笔画的异常字根。而在步骤S203中,可以判断是否该笔画是二笔画的异常字根的一部分并且其与相邻笔画的组合是二笔画的异常字根。本发明并不限于上述示例,例如也可以应用于更多笔画的异常字根。
图3示意性地示出了根据本公开一个实施例的对字符的手写轨迹进行检测的装置(也称作检测装置)300的示意框图。
如图所示,装置300包括处理单元301,其适于执行图2所示的方法。在某些另外的实施例中,装置300还可以可选地包括手写输入单元303,用于接收用户输入的字符的手写轨迹。
在某些另外的实施例中,所述装置300还可以包括适于进行前述第一判断的第一判断单元(未示出),以及适于进行前述第二判断的第二判断单元(未示出)。所述第一和第二判断单元可以被包括在处理单元中作为其组件,或者,可以替代所述处理单元。
根据本公开的不同实施例,可以通过如图1所示的计算机系统来实现图3所示的手写字符识别装置,也可以例如通过支持手写输入(例如,具有触摸屏)的移动装置(在图中未示出)等来实现该手写字符识别装置。
图4示意性地示出了根据本公开一个具体实例的判断笔画或笔画的组合是否是异常字根的处理过程的流程图。图10A示出了对于字根“口”的一种异常书写方式,其中该字根被以顺时针方向一笔写成。以该字根(异常笔画)为例对图4进行说明。
对于该笔画,检测该笔画内的角点,并在所述角点处将该笔画分成多个线段(步骤S401)。在该步骤,检测该笔画内的角点的方式可以是多样的,并且也可以根据不同的笔画或字根而采取不同的方式。例如,在一个实例中,可以将笔画中具有较大方向改变(例如,大于50°)之处检测作为角点,如图10B所示。在角点处对笔画进行划分,将该笔画划分为4个线段,如图10A所示。
针对每一线段,计算其几何特征(步骤S403)。这里,所述几何特征可以包括(但不限于)下列中的至少一项:线段的长度、线段的方向、以及线段的中点的坐标。
之后,可以根据所述几何特征确定所述多个线段是否与前述预先定义的异常字根的线段对应(步骤S405)。例如,字根应当具有两个近乎水平的线段和两个近乎垂直的线段。在一个实例中,当水平线段的长度与该字根的边界框(即,包含整个该字根的最小外接框)的宽度之间的比例大于一阈值(例如,0.75),并且垂直线段的长度与该字根的边界框的高度之间的比例大于一阈值(例如,0.75)时,认为存在对应。
在一个具体示例中,如果存在对应,就可以确定该笔画是异常字根(S409)。在一个更加优选的示例中,在存在对应的情况下,还另外评估所述多个线段之间的相互关系以确定是否与对应的异常字根的线段的相互关系相符(步骤S407)。这里,所述相互关系可以包括(但不限于)下列中的至少一项:所述多个线段之间的交叉角以及所述多个线段之间的距离。例如,对于字根中的两个水平线段,两者的交叉角应当小于阈值(例如,15°)。对于不同的异常字根,可以预先定义不同的相互关系即阈值。如果相符,则确定该笔画是异常字根(步骤S409)。
上述的处理过程同样适用于笔画的组合。也即,可以将笔画的组合看作一个整体笔画,对其进行图4所示的处理。
图5示出了根据本公开一实施例的收集异常字根的处理过程的流程图。在步骤S501,获得非标准书写方式的字符手写轨迹及其对应的标准字符。通常,用户输入手写字符(其具有手写轨迹),并从字符识别的多个候选字符中选择正确的识别字符。由此,可以根据用户对手写输入的手写轨迹的选择来确定非标准书写方式的字符手写轨迹及其对应的标准字符。例如,如果用户并未选择第一候选字符,则可以确定该字符手写轨迹是非标准书写方式的,并以用户所选择的字符作为对应的标准字符。应理解,本发明并不限于此。
在步骤S503中,通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集。这里,所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画。
在步骤S505,根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中。所述几何特征至少包括有关以该非标准笔画集中每一笔画的各角点分隔的各线段的信息。例如,当非标准笔画集中仅包括一个非标准笔画时,所述几何特征至少包括有关以该非标准笔画的各角点分隔的各线段的信息。所述线段的信息可以包括下列中一项或多项:线段的起始点坐标、线段的长度、线段的方向、线段的中点坐标、线段的角点坐标。所述几何特征还可以包括所述各线段之间的相互关系。该相互关系例如可以包括:平行、相交等等。
在步骤S507,如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。该阈值可以例如是基于统计分析预先定义的。
该处理过程还可以包括确定与所述异常字根对应的标准字根。在一个示例性的实现方式中,可以计算以该非标准笔画集中每一笔画的各角点分隔的各线段的每一组合与所述标准字符的标准模板中的标准笔画的组合的匹配距离。然后选择该非标准笔画集的匹配距离最小的线段组合作为对应的标准字根。在一个示例中,所述非标准笔画集仅具有一个非标准笔画而不包括与该非标准笔画相邻的一个或多个笔画。在这样的情况下,可以计算以该非标准笔画的各角点分隔的各线段的每一组合与所述标准字符的标准模板中的每一标准笔画的匹配距离。选择该非标准笔画的匹配距离最小的线段组合作为对应的标准字根。
图6示意性地示出了根据本公开一个实施例的检测非标准笔画的示例处理过程的流程图。在步骤S601,对于所述手写轨迹内的每一笔画,生成该笔画的特征序列。这里,所述特征序列可以包括,例如,笔画的起点坐标、终点坐标、以及各角点坐标。
在步骤S603,计算所述特征序列与对应的标准字符的标准模板中的所有笔画的特征序列的匹配距离。所述匹配距离可以包括(但不限于)城市距离。例如,假设与该笔画对应的4维特征向量为[x1,y1,x2,y2],标准字符的标准模板内的相应笔画的预先定义的特征向量为[x’1,y’1,x’2,y’2],则二者之间的城市距离(city distance)可以等于|x1-x1’|+|y1-y1’|+|x2-x2’|+|y2-y2’|。然而,本发明并不限于此;例如,也可以使用欧几里德距离等等。并且,在某些实例中,可以使用每一笔画的匹配距离的平均值来作为该异常字根的匹配距离。
在步骤S605,如果对于该笔画的最小匹配距离大于预定的阈值,则确定该笔画为非标准笔画。
图7示意性地示出了根据本公开一个实施例的对字符的手写轨迹进行规范化的装置700的示意框图。装置700包括前述的检测装置300,以检测异常字根。装置700还包括修正装置703,用于对所检测到的异常字根进行修正以使其符合对应的标准字根的书写方式。
因此,根据该实施例,还公开了一种对字符的手写轨迹进行规范化的方法,包括:根据前面参考图2-6所述的方法对字符的手写轨迹进行检测;以及对所检测到的异常字根进行修正以使其符合对应的标准字根的书写方式。
图9示出了根据本公开一个实施例的对异常字根进行修正的处理过程的流程图。在该实施例中,对于每一检测的异常字根(如前所述,其可以是笔画或者笔画的组合),执行下列操作。
检测该异常字根的角点(步骤S901)。这里检测角点的方法可以与上面的步骤S401所描述的类似。接着,根据字根的标准书写方式选择角点中的至少一个作为笔画连接点(步骤S903)。例如,对于图10A所示的异常字根(其对应于“口”),其标准书写方式是3笔写成。因此,根据其标准书写其有两个笔画连接点,如图10C所示。
然后,将该异常字根在所述笔画连接点处分离成笔画(步骤S905)。对于图10A所示的异常字根,其被划分成3个笔画,如图10D所示。
之后,根据标准书写方式重新排序每一分离的笔画中的轨迹点。如图10D中所示,该异常字根的笔画2和3具有与标准书写方式相反的书写方向,这可以通过例如笔画起始点以及另外的中点的坐标容易地判断出。因此,对其轨迹点重新排序,以例如使其符合标准书写方式。
另外,图10D所示笔画之间的书写顺序也不符合标准书写方式(例如,标准书写方式为笔画3→笔画1→笔画2)。可选地,在这种情况下,还可以根据标准书写方式重新排序所分离的笔画(S909),以例如使其符合标准书写方式。
根据本公开的某些实施例,如果修正后的异常字根能够与相邻的笔画组合形成更高级别的字根,则还可以根据该更高级别的字根的标准书写方式对所述分离的笔画和所述相邻的笔画重新排序。
在此,以图8A的手写轨迹作为另一示例进行说明。假设对于该手写轨迹,检测到如图8B中粗线所示的异常字根于是,可以对该手写轨迹的前述的异常字根进行修正。图8C示出了根据该示例的修正,其中,异常字根被分别拆分为线段(笔画)6和7。
图11示出了根据本公开一个实施例的手写字符在线识别装置1100的示意框图。在线识别装置1100包括:对手写字符的手写轨迹进行规范化的装置700;以及在线识别单元1101,适于基于所述规范化后的手写轨迹,通过在线识别来识别该手写字符。
因此,本申请还公开了一种手写字符在线识别方法,包括:根据前面所述的方法对手写字符的手写轨迹进行规范化;以及基于所述规范化后的手写轨迹,通过在线识别来识别该手写字符。
图12示出了根据本公开一个实施例的收集异常字根的装置1200的示意框图。装置1200可以执行例如前面参考图5和6所述的收集异常字根的处理过程。根据一个具体实现方式,装置1200可以包括:获取单元1201,其适于获得非标准书写方式的字符手写轨迹及其对应的标准字符;检测单元1203,适于通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画;确定单元1205,其适于根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中,以及如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。
装置1200还可以包括标准字根确定单元,适于确定与所述异常字根对应的标准字根。
图13示出了根据本公开一个实施例的针对书写者自适应的在线字符识别装置1300的示意框图。装置1300可以包括如前所述的收集异常字根的装置1200,适于收集异常字根;手写输入单元1301,适于接收所述书写者的字符手写轨迹;以及如前所述的手写字符在线识别装置1100,适于对所接收的字符手写轨迹进行识别,其中以所收集的异常字根作为所述预定的异常字根。
因此,根据该实施例,还提供了一种针对书写者自适应的在线字符识别方法,包括:根据如前所述的方法收集异常字根;接收所述书写者的字符手写轨迹;根据如前所述的方法对所接收的字符手写轨迹进行识别,其中以所收集的异常字根作为所述预定的异常字根。
根据本发明,可以以较低的成本实现对手写轨迹的更高准确率的识别。另外,根据本发明的实施例的识别方法或装置,对于书写方式的变化以及笔画形状变形相比于现有技术更加鲁棒。另外,还可以降低或消除对训练样本的依赖性。
根据本发明,可以实现识别准确率(特别是,第一候选字符识别准确率)高的紧凑的手写字符识别引擎,而无需复杂的大容量字典。因此,这也降低了对硬件以及对计算等处理能力的要求。另外,本发明对于具有在线识别模块(单元)不支持(也即,不能识别)的书写方式变化的手写字符的识别尤其有效,识别准确率有极大改善。
发明人对来自50位日文书写者的444750个日文汉字样本进行了实验。在该实验中,将25位书写者的书写数据作为学习样本,将其余25位书写者的书写数据作为评价样本,并利用了小且快速的紧凑式的在线识别模块,其中用于在线识别的字典为1402千字节(KB)。对于该在线识别模块,由于其所不支持的书写方式,其不能正确识别这些学习样本中4.8%的样本。
下表2示出了示例性的两组典型的异常字根,以及用根据本发明一个实施例的方法(装置)和根据现有技术的不利用书写方式规范化的方法对具有该异常字根的样本的第一(最佳)候选的识别准确率。
表2
由表2可见,根据现有技术的方法,对具有上述异常字根的手写字符的识别准确率极低,而根据本发明,则对识别准确率有了极大的提高。
下表3示出了对于表2中所示的异常字根,利用根据本发明一个实施例的方法(装置)和根据现有技术的基于原型登记的方法对具有所有样本的第一(最佳)候选的识别准确率以及所使用的字典大小的比较。
表3
由表3可见,相比现有技术的方法,根据本发明,对具有异常字根的手写轨迹的识别准确率有明显改善,并且显著降低了所使用的字典的大小,从而可以降低对处理能力的要求。
根据本公开的另外的方面,本发明的手写字符识别装置可以被实施为一种终端。本发明的手写字符识别方法也可以在终端中实施。所终端可以是支持手写识别功能的任何设备(尤其是,电子设备),包括但不限于,计算机、客户机、移动终端(例如,笔记本电脑、平板电脑、移动电话、移动手持机、音乐播放器等等),等等。
应当理解,上述方法中,某些步骤、单元或装置可以合并成一个步骤、单元或装置,或者,某些单个步骤、单元或装置可以拆分成若干步骤、单元或装置。另外,本公开的实施例可以彼此自由组合而不偏离本发明的精神和范围。
可以通过许多方式来实施本发明的方法和设备。例如,可以通过软件、硬件、固件、或其任何组合来实施本发明的方法和设备。上述的方法步骤的次序仅是说明性的,本发明的方法步骤不限于以上具体描述的次序,除非以其他方式明确说明。此外,在一些实施例中,本发明还可以被实施为记录在记录介质中的程序,其包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于实现根据本发明的方法的程序的记录介质。
已经通过示例的方式详细展示了本发明的一些具体实施例,但是应当理解,上述示例仅意图是说明性的而不限制本发明的范围。还应理解,可以对上述的实施例进行多种修改而不脱离如所附权利要求所限定的本发明的范围和实质。

Claims (38)

1.一种对字符的手写轨迹进行检测的方法,包括:
基于预定的异常字根,对于手写轨迹的每一笔画,
根据该笔画的几何特征进行第一判断,以判断是否该笔画是异常字根;
如果不是,则进行第二判断,以判断是否该笔画是异常字根的一部分并且其与相邻笔画的组合是异常字根,所述第二判断是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。
2.根据权利要求1所述的方法,其中所述判断是否该笔画或笔画的组合是异常字根的步骤包括:
检测该笔画或笔画的组合内的角点,并在所述角点处将该笔画或笔画的组合分成多个线段;
确定每一线段的几何特征;
根据所述几何特征确定所述多个线段是否与所述预定的异常字根的线段对应;
如果对应,则确定该笔画或笔画的组合是异常字根。
3.根据权利要求1所述的方法,其中所述判断是否该笔画或该笔画与相邻笔画的组合是异常字根的步骤包括:
检测该笔画或笔画的组合内的角点,并在所述角点处将该笔画或笔画的组合分成多个线段;
确定每一线段的几何特征;
根据所述几何特征确定所述多个线段是否与所述预定的异常字根的线段对应;
如果确定所述多个线段与所述预定的异常字根的线段对应,则评估所述多个线段之间的相互关系以确定是否与对应的异常字根的线段的相互关系相符;
如果相符,则确定该笔画或笔画的组合是异常字根。
4.根据权利要求1-3中任一项所述的方法,其中所述几何特征包括下列中的至少一项:线段的长度、线段的方向、以及线段的中点的坐标。
5.根据权利要求3所述的方法,其中所述相互关系包括下列中的至少一项:所述多个线段之间的交叉角以及所述多个线段之间的距离。
6.根据权利要求1所述的方法,其中通过如下步骤收集获得所述预定的异常字根:
获得非标准书写方式的字符手写轨迹及其对应的标准字符;
通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画;
根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中;以及
如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。
7.根据权利要求6所述的方法,其中所述检测非标准笔画的步骤包括,对于所述手写轨迹内的每一笔画:
生成该笔画的特征序列;
计算所述特征序列与所述对应的标准字符的标准模板中的所有笔画的特征序列的匹配距离;以及
如果对于该笔画的最小匹配距离大于预定的阈值,则确定该笔画为非标准笔画。
8.一种对字符的手写轨迹进行规范化的方法,包括:
根据权利要求1-7中任一项所述的方法对字符的手写轨迹进行检测;以及
对所检测到的异常字根进行修正以使其符合对应的标准字根的书写方式。
9.根据权利要求8所述的方法,其中所述修正步骤包括,对于每一检测的异常字根:
检测该异常字根的角点;
根据该异常字根的相应的标准书写方式选择角点中的至少一个作为笔画连接点;
将该异常字根在所述笔画连接点处分离成笔画;以及
根据标准书写方式重新排序每一分离的笔画中的轨迹点。
10.根据权利要求9所述的方法,其中所述修正步骤还包括:
根据标准书写方式重新排序所分离的笔画。
11.根据权利要求9或10所述的方法,其中所述修正步骤还包括:
如果修正后的异常字根能够与相邻的笔画组合形成更高级别的字根,则根据该更高级别的字根的标准书写方式对所述分离的笔画和所述相邻的笔画重新排序。
12.一种手写字符在线识别方法,所述手写字符具有手写轨迹,所述方法包括:
根据权利要求8-11中任一项所述的方法对手写字符的手写轨迹进行规范化;以及
基于所述规范化后的手写轨迹,通过在线识别来识别该手写字符。
13.一种收集异常字根的方法,包括:
获得非标准书写方式的字符手写轨迹及其对应的标准字符;
通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画;
根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中;以及
如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。
14.根据权利要求13所述的方法,其中所述检测非标准笔画的步骤包括,对于所述手写轨迹内的每一笔画:
生成该笔画的特征序列;
计算所述特征序列与对应的标准字符的标准模板中的所有笔画的特征序列的匹配距离;以及
如果对于该笔画的最小匹配距离大于预定的阈值,则确定该笔画为非标准笔画。
15.根据权利要求13所述的方法,其中所述几何特征至少包括有关以该非标准笔画集中每一笔画的各角点分隔的各线段的信息。
16.根据权利要求15所述的方法,其中所述几何特征还包括所述各线段之间的相互关系;
其中所述线段的信息包括下列中一项或多项:线段的起始点坐标、线段的长度、线段的方向、线段的中点坐标、线段的角点坐标。
17.根据权利要求13所述的方法,还包括:
确定与所述异常字根对应的标准字根。
18.根据权利要求17所述的方法,其中确定与所述异常字根对应的标准字根包括:
计算以该非标准笔画集中每一笔画的各角点分隔的各线段的每一组合与所述标准字符的标准模板中的标准笔画的组合之间的匹配距离;以及
选择该非标准笔画集的匹配距离最小的线段组合作为对应的标准字根。
19.一种针对书写者自适应的在线字符识别方法,包括:
根据权利要求13-18中任一项所述的方法收集异常字根;
接收所述书写者的字符手写轨迹;
根据权利要求12所述的方法对所接收的字符手写轨迹进行识别,其中以所收集的异常字根作为所述预定的异常字根。
20.一种对字符的手写轨迹进行检测的装置,包括:
手写输入单元,适于接收用户输入的字符的手写轨迹,
处理单元,适于:
基于预定的异常字根,对于所述手写轨迹的每一笔画,
根据该笔画的几何特征进行第一判断,以判断是否该笔画是异常字根;以及
如果不是,则进行第二判断,以判断是否该笔画是异常字根的一部分并且其与相邻笔画的组合是异常字根,所述第二判断是基于该笔画的几何特征和所述相邻笔画的几何特征进行的。
21.根据权利要求20所述的装置,其中所述判断是否该笔画或笔画的组合是异常字根包括:
检测该笔画或笔画的组合内的角点,并在所述角点处将该笔画或笔画的组合分成多个线段;
确定每一线段的几何特征;
根据所述几何特征确定所述多个线段是否与所述预定的异常字根的线段对应;
如果对应,则确定该笔画或笔画的组合是异常字根。
22.根据权利要求20所述的装置,其中所述判断是否该笔画或该笔画与相邻笔画的组合是异常字根包括:
检测该笔画或笔画的组合内的角点,并在所述角点处将该笔画或笔画的组合分成多个线段;
确定每一线段的几何特征;
根据所述几何特征确定所述多个线段是否与所述预定的异常字根的线段对应;
如果确定所述多个线段与所述预定的异常字根的线段对应,则评估所述多个线段之间的相互关系以确定是否与对应的异常字根的线段的相互关系相符;
如果相符,则确定该笔画或笔画的组合是异常字根。
23.根据权利要求20-22中任一项所述的装置,其中所述几何特征包括下列中的至少一项:线段的长度、线段的方向、以及线段的中点的坐标。
24.根据权利要求22所述的装置,其中所述相互关系包括下列中的至少一项:所述多个线段之间的交叉角以及所述多个线段之间的距离。
25.根据权利要求20所述的装置,还包括:
收集装置,用于收集获得所述预定的异常字根,所述收集装置适于:
获得非标准书写方式的字符手写轨迹及其对应的标准字符;
通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画;
根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中;以及
如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。
26.根据权利要求25所述的装置,其中所述检测非标准笔画包括,对于所述手写轨迹内的每一笔画:
生成该笔画的特征序列;
计算所述特征序列与所述对应的标准字符的标准模板中的所有笔画的特征序列的匹配距离;以及
如果对于该笔画的最小匹配距离大于预定的阈值,则确定该笔画为非标准笔画。
27.一种对字符的手写轨迹进行规范化的装置,包括:
根据权利要求20-26中任一项所述的对字符的手写轨迹进行检测的装置;
修正装置,用于对所检测到的异常字根进行修正以使其符合对应的标准字根的书写方式。
28.根据权利要求27所述的装置,其中所述修正装置适于:
对于每一检测的异常字根,检测该异常字根的角点;
根据该异常字根的相应的标准书写方式选择角点中的至少一个作为笔画连接点;
将该异常字根在所述笔画连接点处分离成笔画;以及
根据标准书写方式重新排序每一分离的笔画中的轨迹点。
29.根据权利要求28所述的装置,其中所述修正装置还适于:
根据标准书写方式重新排序所分离的笔画。
30.根据权利要求28或29所述的装置,其中所述修正装置还适于:
如果修正后的异常字根能够与相邻的笔画组合形成更高级别的字根,则根据该更高级别的字根的标准书写方式对所述分离的笔画和所述相邻的笔画重新排序。
31.一种手写字符在线识别装置,所述手写字符具有手写轨迹,所述装置包括:
根据权利要求27-30中任一项所述的对手写字符的手写轨迹进行规范化的装置;
在线识别单元,适于基于所述规范化后的手写轨迹,通过在线识别来识别该手写字符。
32.一种收集异常字根的装置,包括:
获取单元,适于获得非标准书写方式的字符手写轨迹及其对应的标准字符;
检测单元,适于通过将所述非标准书写方式的字符手写轨迹与对应的标准字符的标准模板的比较,检测非标准笔画以得到非标准笔画集,其中所述非标准笔画集至少包括一个非标准笔画,并且还能够包括与该非标准笔画相邻的一个或多个笔画;
确定单元,适于根据该非标准笔画集的几何特征,确定该非标准笔画集是否被包含在其它字符的手写轨迹中,以及如果包含该非标准笔画集的不同字符的数目大于一阈值,则将该非标准笔画集确定为异常字根。
33.根据权利要求32所述的装置,其中所述检测非标准笔画包括,对于所述手写轨迹内的每一笔画:
生成该笔画的特征序列;
计算所述特征序列与对应的标准字符的标准模板中的所有笔画的特征序列的匹配距离;以及
如果对于该笔画的最小匹配距离大于预定的阈值,则确定该笔画为非标准笔画。
34.根据权利要求32所述的装置,其中所述几何特征至少包括有关以该非标准笔画集中每一笔画的各角点分隔的各线段的信息。
35.根据权利要求34所述的装置,其中所述几何特征还可包括所述各线段之间的相互关系;
其中所述线段的信息包括下列中一项或多项:线段的起始点坐标、线段的长度、线段的方向、线段的中点坐标、线段的角点坐标。
36.根据权利要求32所述的装置,还包括:
标准字根确定单元,适于确定与所述异常字根对应的标准字根。
37.根据权利要求36所述的装置,其中确定与所述异常字根对应的标准字根包括:
计算以该非标准笔画集中每一笔画的各角点分隔的各线段的每一组合与所述标准字符的标准模板中的标准笔画的组合的匹配距离;以及
选择该非标准笔画集的匹配距离最小的线段组合作为对应的标准字根。
38.一种针对书写者自适应的在线字符识别装置,包括:
根据权利要求32-37中任一项所述的收集异常字根的装置,适于收集异常字根;
手写输入单元,适于接收所述书写者的字符手写轨迹;以及
根据权利要求31所述的手写字符在线识别装置,适于对所接收的字符手写轨迹进行识别,其中以所收集的异常字根作为所述预定的异常字根。
CN201310202701.9A 2013-02-26 2013-05-28 手写轨迹的检测、规范化和在线识别以及异常字根的收集 Active CN104008363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310202701.9A CN104008363B (zh) 2013-02-26 2013-05-28 手写轨迹的检测、规范化和在线识别以及异常字根的收集

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201310058965 2013-02-26
CN2013100589651 2013-02-26
CN201310058965.1 2013-02-26
CN201310202701.9A CN104008363B (zh) 2013-02-26 2013-05-28 手写轨迹的检测、规范化和在线识别以及异常字根的收集

Publications (2)

Publication Number Publication Date
CN104008363A true CN104008363A (zh) 2014-08-27
CN104008363B CN104008363B (zh) 2017-08-01

Family

ID=51369012

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201310202627.0A Pending CN104008405A (zh) 2013-02-26 2013-05-28 手写字符识别方法和装置
CN201310202701.9A Active CN104008363B (zh) 2013-02-26 2013-05-28 手写轨迹的检测、规范化和在线识别以及异常字根的收集

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201310202627.0A Pending CN104008405A (zh) 2013-02-26 2013-05-28 手写字符识别方法和装置

Country Status (1)

Country Link
CN (2) CN104008405A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339726A (zh) * 2015-07-17 2017-01-18 佳能株式会社 用于手写识别的方法及装置
CN106855945A (zh) * 2016-12-22 2017-06-16 上海云丞聚智能科技有限公司 电子字帖的书写检测方法及装置、电子字帖
CN107169517A (zh) * 2017-05-11 2017-09-15 广东小天才科技有限公司 判断重复笔画的方法、终端设备及计算机可读存储介质
CN107563456A (zh) * 2017-08-17 2018-01-09 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
WO2019232855A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写模型训练方法、手写字识别方法、装置、设备及介质
CN111310548A (zh) * 2019-12-04 2020-06-19 武汉汉德瑞庭科技有限公司 一种在线手写笔迹中笔画类型的识别方法
CN112633243A (zh) * 2020-12-31 2021-04-09 安徽鸿程光电有限公司 信息识别方法、装置、设备及计算机存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046289B (zh) * 2015-08-07 2019-04-26 北京旷视科技有限公司 一种文字域类型识别方法和文字域类型识别系统
CN105184328B (zh) * 2015-08-17 2018-11-27 浪潮金融信息技术有限公司 一种识别图像的方法及装置
CN107330379B (zh) * 2017-06-13 2020-10-13 内蒙古大学 一种蒙古语手写识别方法和装置
CN109992124B (zh) * 2018-01-02 2024-05-31 北京搜狗科技发展有限公司 输入方法、装置和机器可读介质
CN108416300A (zh) * 2018-03-09 2018-08-17 广东小天才科技有限公司 一种识别书写轨迹的方法、装置及终端设备
CN108733304A (zh) * 2018-06-15 2018-11-02 蒋渊 一种自动识别及处理手写字符方法、装置
CN110378869B (zh) * 2019-06-05 2021-05-11 北京交通大学 一种样本自动标注的钢轨扣件异常检测方法
CN110633673B (zh) * 2019-09-17 2023-04-18 江苏科技大学 一种手写轨迹修改方法
CN112508016B (zh) * 2020-12-15 2024-04-16 深圳万兴软件有限公司 一种图像处理方法、装置、计算机设备及存储介质
CN112686134B (zh) * 2020-12-29 2023-12-01 科大讯飞股份有限公司 手写识别方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1096110A (zh) * 1993-06-04 1994-12-07 珠海巨人高科技集团公司 微机汉字手写输入设备
CN101308578A (zh) * 2008-06-20 2008-11-19 华南理工大学 一种手写汉字美化方法
US20090003706A1 (en) * 2007-06-28 2009-01-01 Microsoft Corporation Combining online and offline recognizers in a handwriting recognition system
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179938A (ja) * 1995-12-25 1997-07-11 Oki Electric Ind Co Ltd オンライン手書き文字認識装置
JPH09288717A (ja) * 1996-04-24 1997-11-04 Brother Ind Ltd 文字認識装置
JP3595900B2 (ja) * 1998-09-28 2004-12-02 富士通株式会社 手書き文字認識装置及び記録媒体
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法
CN101976354B (zh) * 2010-11-10 2012-07-25 广东因豪信息科技有限公司 一种书写汉字规范性评判的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1096110A (zh) * 1993-06-04 1994-12-07 珠海巨人高科技集团公司 微机汉字手写输入设备
US20090003706A1 (en) * 2007-06-28 2009-01-01 Microsoft Corporation Combining online and offline recognizers in a handwriting recognition system
CN101308578A (zh) * 2008-06-20 2008-11-19 华南理工大学 一种手写汉字美化方法
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘晓娟: "联机手写汉字识别中字根提取算法研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339726A (zh) * 2015-07-17 2017-01-18 佳能株式会社 用于手写识别的方法及装置
CN106855945A (zh) * 2016-12-22 2017-06-16 上海云丞聚智能科技有限公司 电子字帖的书写检测方法及装置、电子字帖
CN107169517A (zh) * 2017-05-11 2017-09-15 广东小天才科技有限公司 判断重复笔画的方法、终端设备及计算机可读存储介质
CN107563456A (zh) * 2017-08-17 2018-01-09 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
CN107563456B (zh) * 2017-08-17 2019-12-13 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
WO2019232855A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写模型训练方法、手写字识别方法、装置、设备及介质
CN111310548A (zh) * 2019-12-04 2020-06-19 武汉汉德瑞庭科技有限公司 一种在线手写笔迹中笔画类型的识别方法
CN111310548B (zh) * 2019-12-04 2023-09-19 武汉汉德瑞庭科技有限公司 一种在线手写笔迹中笔画类型的识别方法
CN112633243A (zh) * 2020-12-31 2021-04-09 安徽鸿程光电有限公司 信息识别方法、装置、设备及计算机存储介质
CN112633243B (zh) * 2020-12-31 2023-01-03 安徽鸿程光电有限公司 信息识别方法、装置、设备及计算机存储介质

Also Published As

Publication number Publication date
CN104008405A (zh) 2014-08-27
CN104008363B (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
CN104008363A (zh) 手写轨迹的检测、规范化和在线识别以及异常字根的收集
CN102609735B (zh) 一种字符书写规范度评测的方法和装置
KR102326395B1 (ko) 다수의 객체 입력을 인식하기 위한 시스템 및 그 방법 및 제품
CN102449640B (zh) 识别手写单词
CN100412861C (zh) 用于搜索数字墨水查询的设备和方法
CN101253513B (zh) 对书写输入的知晓风格的使用
US10242296B2 (en) Method and device for realizing chinese character input based on uncertainty information
US20150278167A1 (en) Automatic measure of visual similarity between fonts
JP5604279B2 (ja) ジェスチャー認識装置、方法、プログラム、および該プログラムを格納したコンピュータ可読媒体
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
KR20120011010A (ko) 수기 인식 방법 및 장치
JPH0792816B2 (ja) パターン認識方法及び装置
KR20210017090A (ko) 필기 입력을 텍스트로 변환하는 방법 및 전자 장치
CN110032734B (zh) 近义词扩展及生成对抗网络模型训练方法和装置
CN102663454A (zh) 一种字符书写规范度评测的方法和装置
CN109086336A (zh) 试卷数据存储方法、装置及电子设备
KR101927064B1 (ko) 전자책 또는 전자노트에 대한 요약 데이터 생성 장치 및 방법
CN113779970A (zh) 一种文本纠错方法及其相关设备
CN109002803A (zh) 一种基于智能手表的握笔姿势检测和汉字笔顺识别方法
JP2007272473A (ja) 文字認識装置、方法およびプログラム
US20140037154A1 (en) Automatically determining a name of a person appearing in an image
CN111090989B (zh) 一种基于文字识别的提示方法及电子设备
US9195887B2 (en) Retrieving apparatus, retrieving method, and computer program product
CN105825196B (zh) 一种信息处理方法和电子设备
CN112487897A (zh) 笔迹内容评价方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant