CN106940596A - 一种手写输入多个字符的识别方法和系统 - Google Patents

一种手写输入多个字符的识别方法和系统 Download PDF

Info

Publication number
CN106940596A
CN106940596A CN201610003592.1A CN201610003592A CN106940596A CN 106940596 A CN106940596 A CN 106940596A CN 201610003592 A CN201610003592 A CN 201610003592A CN 106940596 A CN106940596 A CN 106940596A
Authority
CN
China
Prior art keywords
character
identification character
input
word
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610003592.1A
Other languages
English (en)
Inventor
张礼林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Feng Sheng Boyuan Polytron Technologies Inc
Original Assignee
Beijing Feng Sheng Boyuan Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Feng Sheng Boyuan Polytron Technologies Inc filed Critical Beijing Feng Sheng Boyuan Polytron Technologies Inc
Priority to CN201610003592.1A priority Critical patent/CN106940596A/zh
Publication of CN106940596A publication Critical patent/CN106940596A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Abstract

本发明公开了一种手写输入多个字符的识别方法和系统,其中,所述方法,包括:基于多个手写字符的运笔轨迹,对所述多个字符进行识别,以得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;基于所述每个识别字符的输入顺序以及所述每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合以得到分词结果。本发明所提供的手写输入法,能够实现在手写输入区输入多个字符,并对多个字符进行识别,能够实现手写输入汉字、手写输入汉语拼音、手写输入英文单词、以及手写同时输入汉字和字母,大大提升了用户书写的体验感。

Description

一种手写输入多个字符的识别方法和系统
技术领域
本发明涉及模式识别与人工智能技术领域,特别涉及一种手写输入多个字符的识别方法和系统。
背景技术
目前存在着各种基于键盘的汉字输入法、英文输入法以及各种手写汉字输入法和手写单独字母输入法。其中,基于键盘的输入方法(比如五笔字型、汉语拼音)一般都需要比较好的训练才可以让用户记住利用声、形、义来定义汉字编码,并把它们映射到键盘上,不易使用。
现有技术中的手写输入法,将用户在手写输入区所画的所有笔划默认为一个汉字或一个字母的笔画,即用户若想输入一个2个汉字的词语,需将该词语分为两个汉字,每次在手写输入手写区中输入一个汉字,每次只对一个汉字进行识别。这种方法尚可实现汉字的输入。
然而,用户在实际操作过程中手写输入汉字时,通常会偶尔忘记某个汉字应该怎么写,而记得改汉字的汉语拼音应该怎么拼,但是在现有技术中,用户若想手写输入一个具有2个字母的汉语拼音或英文单词,若采用类似汉字的方法将该单词分为3个字母,每次在手写输入手写区中输入一个字母,那么最后得到的是3个单独的字母,并不是组合在一起所形成的汉语拼音或英文单词。
因此,现有技术中需要一种可以在手写输入区中输入多个字符(包括汉字、字母、数字、符号)的手写输入识别方法。
发明内容
本发明的目的是提供一种简便、快速,可以在手写输入区中输入多个字符(包括汉字、字母、数字、符号)的手写输入识别方法。
根据本发明的一个方面,提供了一种手写输入多个字符的识别方法,包括以下步骤:
基于多个手写字符的运笔轨迹,对所述多个字符进行识别以得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;
基于所述每个识别字符的输入顺序以及所述每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合以得到分词结果。
进一步,在所述对多个字符进行识别的步骤之前,还包括:
提供汉语拼音输入法、英文单词输入法、汉字输入法和混合输入法以供用户择取其中一种。
进一步,当用户选择汉语拼音输入法或英文单词输入法时,所述对多个识别字符进行拼合的步骤具体为:
基于字母分词算法,对所述识别字符进行拼合,以得到一个或多个汉字的汉语拼音,或得到一个或多个英文单词。
进一步,当用户选择汉字输入法时,所述对多个识别字符进行拼合的步骤具体为:
将所述多个识别字符中的每个识别字符进行单独保存,以得到一个或多个汉字。
进一步,当用户选择混合输入法时,所述对多个识别字符进行拼合的步骤具体为:
基于所述多个识别字符,逐一判断每个识别字符是否为字母,若是则采用字母分词算法,若否则采用非字母分词算法。
进一步,所述字母分词算法包括以下步骤:
步骤S1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤S8;
若否,则执行步骤S2;
步骤S2:根据所述多个识别字符的输入顺序,从输入记录中取出在先输入的识别字符,执行步骤S3;
步骤S3:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤S7;
若否,则执行步骤S4;
步骤S4:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤S5;
步骤S5:判断所述距离是否大于或等于预设值;
若是,则执行步骤S7;
若否,则执行步骤S6;
步骤S6:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤S1;
步骤S7:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤S1;
步骤S8:结束流程。
进一步,所述非字母分词算法包括以下步骤:
步骤A1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤A10;
若否,则执行步骤A2;
步骤A2:根据所述识别字符输入的先后顺序,从输入记录中取出在先输入的字符,执行步骤A3;
步骤A3:判断当前取出的识别字符是否为字母;
若是,则执行步骤A4;
若否,则执行步骤A9;
步骤A4:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤A8;
若否,则执行步骤A5;
步骤A5:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤A6;
步骤A6:判断所述距离是否为大于或等于预设值;
若是,则执行步骤A8;
若否,则执行步骤A7;
步骤A7:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤A1;
步骤A8:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤A1;
步骤A9:将当前取出的识别字符单独保存,返回步骤A1;
步骤A10:结束流程。
进一步,还包括以下步骤:
存储所述分词结果;
将所存储的分词结果在词库中进行检索,从而获得至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号;
动态显示所获得的至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
根据本发明的另一方面,还提供一种手写输入多个字符的识别系统,包括:
运笔轨迹识别模块,用于基于多个手写字符的运笔轨迹,对所述多个字符进行识别以得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;
字符分词模块,用于基于所述每个识别字符的输入顺序以及所述每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合以得到分词结果。
进一步,还包括输入法类型切换模块,用于提供汉语拼音输入法、英文单词输入法、汉字输入法、和混合输入法以供用户择取其中一种。
进一步,当用户选择汉语拼音输入法或英文单词输入法时,所述字符分词模块基于字母分词算法,对所述识别字符进行拼合,以得到一个或多个汉字的汉语拼音,或得到一个或多个英文单词。
进一步,当用户选择汉字输入法时,所述字符分词模块,用于将所述多个识别字符中的每个识别字符进行单独保存,以得到一个或多个汉字。
进一步,当用户选择混合输入法时,所述字符分词模块基于所述多个识别字符,逐一判断每个识别字符是否为字母,若是则采用字母分词算法,若否则采用非字母分词算法。
进一步,所述字母分词算法包括以下步骤:
步骤S1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤S8;
若否,则执行步骤S2;
步骤S2:根据所述多个识别字符的输入顺序,从输入记录中取出在先输入的识别字符,执行步骤S3;
步骤S3:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤S7;
若否,则执行步骤S4;
步骤S4:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤S5;
步骤S5:判断所述距离是否大于或等于预设值;
若是,则执行步骤S7;
若否,则执行步骤S6;
步骤S6:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤S1;
步骤S7:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤S1;
步骤S8:结束流程。
进一步,所述非字母分词算法包括以下步骤:
步骤A1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤A10;
若否,则执行步骤A2;
步骤A2:根据所述识别字符输入的先后顺序,从输入记录中取出在先输入的字符,执行步骤A3;
步骤A3:判断当前取出的识别字符是否为字母;
若是,则执行步骤A4;
若否,则执行步骤A9;
步骤A4:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤A8;
若否,则执行步骤A5;
步骤A5:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤A6;
步骤A6:判断所述距离是否为大于或等于预设值;
若是,则执行步骤A8;
若否,则执行步骤A7;
步骤A7:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤A1;
步骤A8:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤A1;
步骤A9:将当前取出的识别字符单独保存,返回步骤A1;
步骤A10:结束流程。
进一步,分词结果存储模块,用于存储所述分词结果。
检索模块,用于将所述分词结果存储模块中所存储的分词结果在词库中进行检索,从而获得至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
词库,存储于计算机存储器中,包括汉字库、英语单词库、汉语拼音库和符号库。
显示模块,用于动态显示所述检索模块所获得的至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
本发明所提供的手写输入法,能够实现在手写输入区输入多个字符,并对多个字符进行识别,能够实现手写输入汉字、手写输入汉语拼音、手写输入英文单词、以及手写同时输入汉字和字母,并且可以使得用户在四种输入方式中的任意切换,大大提升了用户书写的体验感。
附图说明
图1是本发明一种手写输入多个字符的识别方法的步骤流程示意图;
图2为本发明所述的字母分词算法的步骤流程图;
图3为本发明所述的非字母分词算法的步骤流程图;
图4为本发明一种手写输入多个字符的识别系统的模块关系示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
图1是本发明一种手写输入多个字符的识别方法的步骤流程示意图。
如图1所示,手写输入多个字符的识别方法,包括以下步骤:
步骤S001,接收用户在手写输入区所输入的多个字符。
用户通过现有技术中的手写输入识别设备(例如触摸屏),在一个平面手写输入区中画出多个字符。在计算机和电信技术中,一个字符是一个单位的字形、类字形单位或符号的基本信息,如字母、数字、汉字和符号等。
其中,字母包括26个英文大写字母(A、B、C……X、Y、Z)以及26个英文小写字母(a、b、c……x、y、z)。数字包括10个阿拉伯数字(0、1、2、3、4、5、6、7、8、9)。汉字包括《现代汉语通用字表》中所收录的汉字,或者可根据需要收录康熙字典中的汉字以及现有技术中计算机输入法的词库中所存储的汉字。符号包括汉语标点符号、英语标点符号等现有技术中计算机输入法的词库中所存储的符号。
步骤S002,根据用户按笔画手写字符时的运笔轨迹,采用现有技术对连续输入的多个字符进行识别,得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离。
根据用户按笔画手写字符时的运笔轨迹对字符进行识别为现有技术中常见的技术,例如申请号为98106953.3的中国发明专利《手写汉字识别方法及装置》中详细描述了这种现有技术,本发明在此不再详述。
需要说明的是,为了区别采用现有技术识别之前的字符与采用现有技术识别之后的字符,在表述中,将采用现有技术识别之前的字符称之为“字符”,将采用现有技术识别之后的字符称之为“识别字符”。
在用户手写输入的同时,记录输入顺序。在用户手写输入完成之后,得到用户在输入区中所输入字符的图片,采用现有技术对图片中的字符进行识别后,得到多个识别字符,计算多个识别字符的两两之间的距离,每两个相邻的识别字符之间的距离包括横向距离和纵向距离。
步骤S003,将步骤S002中所得到的多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离存储到输入记录中。
步骤S004,根据每个识别字符的输入顺序以及每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合,以得到分词结果。
若两个识别字符之间的横向距离大于或等于预设值,则认为这两个字符属于不同的单位的字形,并将这两个识别字符分别保存到各自所在的单位字形中。若两个识别字符之间的横向距离小于预设值,则认为这两个识别字符属于同一单位的字形,并将这两个识别字符根据输入顺序当做同一个单位字形进行保存。
例如,设定预设值为X1,若用户在手写输入区中依次输入多个字符“感kai”。经过现有技术识别后,得到识别字符“感kai”,其中,识别字符“感”和“k”之间的距离大于或等于预设值X1,则认为这两个识别字符属于不同的单位的字形,将“感”作为一个识别字符进行保存,将“k”作为另一个识别字符进行保存。识别字符“k”和“a”之间的距离小于预设值X1,则认为“k”和“a”属于同一个汉语拼音,且“k”的输入顺序在前,“a”的输入顺序在后,将“a”作为“k”的后顺字母进行保存。
在上述步骤S004之前,还包括以下步骤:提供汉语拼音输入法、英文单词输入法、汉字输入法和混合输入法以供用户择取其中一种。
具体的,可通过可显示的人机交互界面为用户提供汉语拼音输入法、英文单词输入法、汉字输入法和混合输入法这四种输入法的图标控件。
当用户选择汉语拼音输入法或英文单词输入法时,步骤S004中对多个识别字符进行拼合的步骤具体为:基于字母分词算法,对所述识别字符进行拼合,以得到一个或多个汉字的汉语拼音,或得到一个或多个英文单词。
图2为本发明所述的字母分词算法的步骤流程图。
如图2所示,字母分词算法包括以下步骤:
步骤S1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤S8;
若否,则执行步骤S2;
步骤S2:根据所述多个识别字符的输入顺序,从输入记录中取出在先输入的识别字符,执行步骤S3;
步骤S3:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤S7;
若否,则执行步骤S4;
步骤S4:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤S5;
步骤S5:判断所述距离是否大于或等于预设值;
若是,则执行步骤S7;
若否,则执行步骤S6;
步骤S6:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤S1;
步骤S7:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤S1;
步骤S8:结束流程。
当用户选择汉字输入法时,步骤S004中对多个识别字符进行拼合的步骤具体为:将所述多个识别字符中的每个识别字符进行单独保存,以得到一个或多个汉字。
由于用户选择的是汉字输入法,则用户在输入区中所输入的字符均为汉字或标点符号等符号字符,当采用先有技术对输入的字符进行识别后,所得到的识别字符无需拼合,每个识别字符都是一个独立的字符,在现代汉语中具有明确的含义,因此,可以将多个识别字符中的每个识别字符进行单独保存。
当用户选择混合输入法时,步骤S004中对多个识别字符进行拼合的步骤具体为:基于所述多个识别字符,逐一判断每个识别字符是否为字母,若是则采用字母分词算法,若否则采用非字母分词算法。
图3为本发明所述的非字母分词算法的步骤流程图。
如图3所示,所述非字母分词算法包括以下步骤:
步骤A1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤A10;
若否,则执行步骤A2;
步骤A2:根据所述识别字符输入的先后顺序,从输入记录中取出在先输入的字符,执行步骤A3;
步骤A3:判断当前取出的识别字符是否为字母;
若是,则执行步骤A4;
若否,则执行步骤A9;
步骤A4:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤A8;
若否,则执行步骤A5;
步骤A5:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤A6;
步骤A6:判断所述距离是否为大于或等于预设值;
若是,则执行步骤A8;
若否,则执行步骤A7;
步骤A7:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤A1;
步骤A8:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤A1;
步骤A9:将当前取出的识别字符单独保存,返回步骤A1;
步骤A10:结束流程。
在步骤S004之后,还包括步骤S005,存储所述分词结果。
在步骤S005之后,还包括步骤S006,将所存储的分词结果在词库中进行检索,从而获得至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。其中,所述汉语拼音既可以为完整的汉语拼音,或一个或多个汉字拼音的缩写组合。
在步骤S006之后,还包括步骤S007,动态显示所获得的至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
图4为本发明一种手写输入多个字符的识别系统的模块关系示意图。
如图4所示,手写输入多个字符的识别系统包括:
手写输入接收模块,用于接收用户在手写输入区所输入的多个字符;
运笔轨迹识别模块,用于基于多个手写字符的运笔轨迹,对所述多个字符进行识别以得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;
输入记录存储模块,用于存储所述多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;
字符分词模块,用于基于所述每个识别字符的输入顺序以及所述每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合以得到分词结果。
输入法类型切换模块,用于提供汉语拼音输入法、英文单词输入法、汉字输入法、和混合输入法以供用户择取其中一种。
当用户选择汉语拼音输入法或英文单词输入法时,所述字符分词模块基于字母分词算法,对所述识别字符进行拼合,以得到一个或多个汉字的汉语拼音,或得到一个或多个英文单词。
当用户选择汉字输入法时,所述字符分词模块,用于将所述多个识别字符中的每个识别字符进行单独保存,以得到一个或多个汉字。
当用户选择混合输入法时,所述字符分词模块基于所述多个识别字符,逐一判断每个识别字符是否为字母,若是则采用字母分词算法,若否则采用非字母分词算法。
分词结果存储模块,用于存储所述分词结果。
检索模块,用于将所述分词结果存储模块中所存储的分词结果在词库中进行检索,从而获得至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
词库,存储于计算机存储器中,包括汉字库、英语单词库、汉语拼音库和符号库。
显示模块,用于动态显示所述检索模块所获得的至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
本发明所提供的手写输入法,能够实现在手写输入区输入多个字符,并对多个字符进行识别,能够实现手写输入汉字、手写输入汉语拼音、手写输入英文单词、以及手写同时输入汉字和字母,并且可以使得用户在四种输入方式中的任意切换,大大提升了用户书写的体验感。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (16)

1.一种手写输入多个字符的识别方法,其特征在于,包括以下步骤:
基于多个手写字符的运笔轨迹,对所述多个字符进行识别,以得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;
基于所述每个识别字符的输入顺序以及所述每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合以得到分词结果。
2.根据权利要求1所述的方法,在所述对多个字符进行识别的步骤之前,还包括:
提供汉语拼音输入法、英文单词输入法、汉字输入法和混合输入法以供用户择取其中一种。
3.根据权利要求2所述的方法,其中,当用户选择汉语拼音输入法或英文单词输入法时,所述对多个识别字符进行拼合的步骤具体为:
基于字母分词算法,对所述识别字符进行拼合,以得到一个或多个汉字的汉语拼音,或得到一个或多个英文单词。
4.根据权利要求2所述的方法,其中,当用户选择汉字输入法时,所述对多个识别字符进行拼合的步骤具体为:
将所述多个识别字符中的每个识别字符进行单独保存,以得到一个或多个汉字。
5.根据权利要求2所述的方法,其中,当用户选择混合输入法时,所述对多个识别字符进行拼合的步骤具体为:
基于所述多个识别字符,逐一判断每个识别字符是否为字母,若是则采用字母分词算法,若否则采用非字母分词算法。
6.根据权利要求3或5所述的方法,其中,所述字母分词算法包括以下步骤:
步骤S1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤S8;
若否,则执行步骤S2;
步骤S2:根据所述多个识别字符的输入顺序,从输入记录中取出在先输入的识别字符,执行步骤S3;
步骤S3:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤S7;
若否,则执行步骤S4;
步骤S4:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤S5;
步骤S5:判断所述距离是否大于或等于预设值;
若是,则执行步骤S7;
若否,则执行步骤S6;
步骤S6:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤S1;
步骤S7:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤S1;
步骤S8:结束流程。
7.根据权利要求4或5所述的方法,其中,所述非字母分词算法包括以下步骤:
步骤A1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤A10;
若否,则执行步骤A2;
步骤A2:根据所述识别字符输入的先后顺序,从输入记录中取出在先输入的字符,执行步骤A3;
步骤A3:判断当前取出的识别字符是否为字母;
若是,则执行步骤A4;
若否,则执行步骤A9;
步骤A4:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤A8;
若否,则执行步骤A5;
步骤A5:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤A6;
步骤A6:判断所述距离是否为大于或等于预设值;
若是,则执行步骤A8;
若否,则执行步骤A7;
步骤A7:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤A1;
步骤A8:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤A1;
步骤A9:将当前取出的识别字符单独保存,返回步骤A1;
步骤A10:结束流程。
8.根据权利要求1所述的方法,还包括以下步骤:
存储所述分词结果;
将所存储的分词结果在词库中进行检索,从而获得至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号;
动态显示所获得的至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
9.手写输入多个字符的识别系统,其特征在于,包括:
运笔轨迹识别模块,用于基于多个手写字符的运笔轨迹,对所述多个字符进行识别以得到多个识别字符、每个识别字符的输入顺序以及每两个相邻识别字符之间的距离;
字符分词模块,用于基于所述每个识别字符的输入顺序以及所述每两个相邻识别字符之间的距离,对所述多个识别字符进行拼合以得到分词结果。
10.根据权利要求9所述的系统,还包括输入法类型切换模块,用于提供汉语拼音输入法、英文单词输入法、汉字输入法、和混合输入法以供用户择取其中一种。
11.根据权利要求10所述的系统,其中,当用户选择汉语拼音输入法或英文单词输入法时,所述字符分词模块基于字母分词算法,对所述识别字符进行拼合,以得到一个或多个汉字的汉语拼音,或得到一个或多个英文单词。
12.根据权利要求10所述的系统,其中,当用户选择汉字输入法时,所述字符分词模块,用于将所述多个识别字符中的每个识别字符进行单独保存,以得到一个或多个汉字。
13.根据权利要求10所述的系统,其中,当用户选择混合输入法时,所述字符分词模块基于所述多个识别字符,逐一判断每个识别字符是否为字母,若是则采用字母分词算法,若否则采用非字母分词算法。
14.根据权利要求11或13所述的系统,其中,所述字母分词算法包括以下步骤:
步骤S1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤S8;
若否,则执行步骤S2;
步骤S2:根据所述多个识别字符的输入顺序,从输入记录中取出在先输入的识别字符,执行步骤S3;
步骤S3:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤S7;
若否,则执行步骤S4;
步骤S4:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤S5;
步骤S5:判断所述距离是否大于或等于预设值;
若是,则执行步骤S7;
若否,则执行步骤S6;
步骤S6:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤S1;
步骤S7:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤S1;
步骤S8:结束流程。
15.根据权利要求12或13所述的系统,其中,所述非字母分词算法包括以下步骤:
步骤A1:判断所述多个识别字符是否拼合完毕;
若是,则执行步骤A10;
若否,则执行步骤A2;
步骤A2:根据所述识别字符输入的先后顺序,从输入记录中取出在先输入的字符,执行步骤A3;
步骤A3:判断当前取出的识别字符是否为字母;
若是,则执行步骤A4;
若否,则执行步骤A9;
步骤A4:判断当前取出的识别字符的输入顺序是否为第一;
若是,则执行步骤A8;
若否,则执行步骤A5;
步骤A5:从输入记录中获取当前取出的识别字符与该识别字符之前的识别字符之间的距离,执行步骤A6;
步骤A6:判断所述距离是否为大于或等于预设值;
若是,则执行步骤A8;
若否,则执行步骤A7;
步骤A7:将当前取出的识别字符作为上次取出的识别字符所在的英文单词或汉语拼音的后顺字母进行保存,返回步骤A1;
步骤A8:将当前取出的识别字符作为一个英文单词或汉语拼音的首字母进行保存,返回步骤A1;
步骤A9:将当前取出的识别字符单独保存,返回步骤A1;
步骤A10:结束流程。
16.根据权利要求9所述的系统,还包括:
分词结果存储模块,用于存储所述分词结果。
检索模块,用于将所述分词结果存储模块中所存储的分词结果在词库中进行检索,从而获得至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
词库,存储于计算机存储器中,包括汉字库、英语单词库、汉语拼音库和符号库。
显示模块,用于动态显示所述检索模块所获得的至少一个候选英文单词、至少一个候选汉语拼音、至少一个候选汉字、至少一个候选数字或至少一个候选符号。
CN201610003592.1A 2016-01-04 2016-01-04 一种手写输入多个字符的识别方法和系统 Pending CN106940596A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610003592.1A CN106940596A (zh) 2016-01-04 2016-01-04 一种手写输入多个字符的识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610003592.1A CN106940596A (zh) 2016-01-04 2016-01-04 一种手写输入多个字符的识别方法和系统

Publications (1)

Publication Number Publication Date
CN106940596A true CN106940596A (zh) 2017-07-11

Family

ID=59468383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610003592.1A Pending CN106940596A (zh) 2016-01-04 2016-01-04 一种手写输入多个字符的识别方法和系统

Country Status (1)

Country Link
CN (1) CN106940596A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783956A (zh) * 2017-11-23 2018-03-09 掌阅科技股份有限公司 文字信息的排版方法、电子设备及计算机存储介质
CN113052179A (zh) * 2021-03-09 2021-06-29 安徽淘云科技股份有限公司 多音字处理方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1127044A (zh) * 1993-05-20 1996-07-17 阿哈软件公司 手写、印刷和作图的电子表示的分组和处理方法与装置
US20060062468A1 (en) * 2004-09-22 2006-03-23 Microsoft Corporation Analyzing scripts and determining characters in expression recognition
CN101576783A (zh) * 2008-05-09 2009-11-11 诺基亚公司 用于手写输入的用户接口、设备和方法
CN102208039A (zh) * 2011-06-01 2011-10-05 汉王科技股份有限公司 一种多语言混合手写文本行的识别方法及装置
CN103019590A (zh) * 2012-11-26 2013-04-03 上海量明科技发展有限公司 手写文字与字符串进行输入的方法、客户端及系统
CN103019397A (zh) * 2011-09-20 2013-04-03 汉王科技股份有限公司 一种多语言混合的文本行输入方法及装置
CN104598148A (zh) * 2014-12-16 2015-05-06 任文 一种电脑触摸屏手写汉字技术

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1127044A (zh) * 1993-05-20 1996-07-17 阿哈软件公司 手写、印刷和作图的电子表示的分组和处理方法与装置
US20060062468A1 (en) * 2004-09-22 2006-03-23 Microsoft Corporation Analyzing scripts and determining characters in expression recognition
CN101576783A (zh) * 2008-05-09 2009-11-11 诺基亚公司 用于手写输入的用户接口、设备和方法
CN102208039A (zh) * 2011-06-01 2011-10-05 汉王科技股份有限公司 一种多语言混合手写文本行的识别方法及装置
CN103019397A (zh) * 2011-09-20 2013-04-03 汉王科技股份有限公司 一种多语言混合的文本行输入方法及装置
CN103019590A (zh) * 2012-11-26 2013-04-03 上海量明科技发展有限公司 手写文字与字符串进行输入的方法、客户端及系统
CN104598148A (zh) * 2014-12-16 2015-05-06 任文 一种电脑触摸屏手写汉字技术

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783956A (zh) * 2017-11-23 2018-03-09 掌阅科技股份有限公司 文字信息的排版方法、电子设备及计算机存储介质
CN113052179A (zh) * 2021-03-09 2021-06-29 安徽淘云科技股份有限公司 多音字处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US9881224B2 (en) User interface for overlapping handwritten text input
US20170206002A1 (en) User-centric soft keyboard predictive technologies
US8994660B2 (en) Text correction processing
US20080294982A1 (en) Providing relevant text auto-completions
US9360955B2 (en) Text entry for electronic devices
US20080260252A1 (en) System, Method, and Apparatus for Continuous Character Recognition
CN104704452A (zh) 移动计算设备上的拆分虚拟键盘
KR102240663B1 (ko) 필기 입력의 진행 디스플레이
CN101256462A (zh) 基于全混合联想库的手写输入方法和装置
CN103606305A (zh) 一种汉字书写学习系统
US20150169537A1 (en) Using statistical language models to improve text input
US7702145B2 (en) Adapting a neural network for individual style
CN103176737B (zh) 手写句子系统的基于多点触摸的校正的方法和设备
CN105074643A (zh) 非词典字符串的手势键盘输入
CN112686134A (zh) 手写识别方法、装置、电子设备和存储介质
EP2856285A1 (en) Methods, controllers and devices for assembling a word
CN101877183A (zh) 文字演示方法、文字演示装置、电子设备
CN103649944B (zh) 中文单词输入装置及方法
CN106940596A (zh) 一种手写输入多个字符的识别方法和系统
US20140253457A1 (en) Inputting Chinese Characters
US9207775B2 (en) Systems and methods for positioning keys in limited key space of handheld mobile wireless devices
CN113687724A (zh) 候选字显示方法、装置和电子设备
CN104635949A (zh) 一种汉字输入装置及方法
CN110073351A (zh) 通过组合来自用户尝试的候选来预测文本
US8386236B2 (en) Method for prompting by suggesting stroke order of chinese character, electronic device, and computer program product

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170711

RJ01 Rejection of invention patent application after publication