CN104063176A - 手写序列可编辑的连续手写输入方法与系统 - Google Patents

手写序列可编辑的连续手写输入方法与系统 Download PDF

Info

Publication number
CN104063176A
CN104063176A CN201410295010.2A CN201410295010A CN104063176A CN 104063176 A CN104063176 A CN 104063176A CN 201410295010 A CN201410295010 A CN 201410295010A CN 104063176 A CN104063176 A CN 104063176A
Authority
CN
China
Prior art keywords
handwriting
sequence
character
word
written
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410295010.2A
Other languages
English (en)
Other versions
CN104063176B (zh
Inventor
陈清财
黄佳
刘欣
吴湘平
操苏立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201410295010.2A priority Critical patent/CN104063176B/zh
Publication of CN104063176A publication Critical patent/CN104063176A/zh
Application granted granted Critical
Publication of CN104063176B publication Critical patent/CN104063176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种手写序列可编辑的连续手写输入方法及系统,该连续手写输入方法包括手写文字连续书写步骤、手写文字识别与排版步骤、校对步骤、切换输入步骤、编辑步骤,手写文字连续书写步骤、校对步骤、切换输入步骤、编辑步骤能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序。本发明的有益效果是:用户可以一次性连续输入多个文字,在发生切分或者识别结果错误的情况下,实现单个手写字符的修改或者重新输入。解决了用户连续输入字符的修改受限问题,提高了文字的输入效率,极大改善了用户的书写体验。

Description

手写序列可编辑的连续手写输入方法与系统
技术领域
本发明涉及文字输入和人机交互技术领域,尤其涉及手写序列可编辑的连续手写输入方法与系统。
背景技术
随着近些年数码、电子产品的飞速发展,大量的触屏终端产品不断产生,并受到了广大用户的认可和欢迎。由于超大屏幕的设计方式,传统的设备上的硬键盘转而由软键盘取代,这让使用以非字符组合方式文字的用户更加难以适应。在这种形势和需求下,开发出具有更高效、更便捷、更符合用户手写习惯和风格特点的手写输入法已经成为了广泛终端用户的迫切需求。
随着近几年手写输入法的不断改进,当前手写输入法已经由原来的单个字输入发展到多个字甚至是语句级的输入,用户输入不同种类字符的时候,根据输入法界面中设计的输入区域,可以在不同区域中输入不同字符。然而当前所有手写输入法多字或语句级输入的编辑方式仍然在一定程度上限制了用户的书写自由,当用户书写多字然而切分或者识别结果有误时,用户无法任意修改错误字符,必须删除一次性所写的所有文字并重新书写,用户必须逐字或者逐词确认候选,这不仅影响了用户的书写速度,也影响了用户书写的自然性和流畅性,使得用户体验满意度急剧降低。
针对上述技术问题,当前手写输入法还没有具体的解决方法,究其原因有三点:(1)没有一种可编辑的识别模式;(2)多字切分算法还不成熟;(3)连续书写过程中的候选结果呈现方法未能反映手写文字候选集合具有不完备性的特点。
发明内容
为了解决现有技术中的问题,本发明提供了一种手写序列可编辑的连续手写输入方法。
本发明提供了一种手写序列可编辑的连续手写输入方法,包括如下步骤:
手写文字连续书写步骤,接收连续写入的手写笔画序列并切分成手写字符序列,切分结果传给手写文字识别与排版步骤;
手写文字识别与排版步骤,在后台进行模式识别,并采用多种策略对模式识别得到的候选结果集进行排序,并根据不同策略的排序结果,将手写文字序列所对应的文字识别结果序列分3级进行组织并对照输出到校对区域;
校对步骤,将不同级别候选文字集合中所包含文字与手写文字序列逐字对照显示在校对区域,供用户快速确认正确识别结果;
切换输入步骤,用户在多级候选文字集合中无法找到正确识别结果时,在候选集合窗口中直接切换到其他输入方式,以输入对应手写文字的正确书面文字,并对照显示在校对区域;
编辑步骤,在校对区域对已经写入的手写文字序列进行编辑,对编辑后的手写文字序列调整排版和识别结果并据此调整校对区域的显示内容;
所述手写文字连续书写步骤、所述校对步骤、所述切换输入步骤、所述编辑步骤能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序;或者,用户发出提交手写文字序列的指令直接提交根据应用窗口排版的图形化手写文字序列到应用程序。
作为本发明的进一步改进,手写文字连续书写步骤包括如下步骤:
连续手写与实时呈现步骤,用户在具有辅助参考线的连续书写区域进行连续书写并以数字墨水方式实时呈现书写文字;
书写区域写满或用户暂停手写后手写字符序列自动提交给手写字符切分步骤;
手写字符切分步骤,根据手写字符序列的特征分布以及手写字符序列和辅助参考线之间的相对关系切分成独立的手写文字单元序列,并提交给手写文字识别与排版步骤。
作为本发明的进一步改进,在所述手写字符切分步骤中包括如下步骤:
切分预处理步骤:包括去噪、归一化、插点处理;
基于垂直投影的粗切分步骤对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
字符分类步骤:根据初切分文字序列中每个初切分字符在y方向上的平均高度分布的统计特征,包括均值和方差,结合初切分点序列在中文和英文辅助参考线附近的分布情况,判定切分后的文字序列中每个初切分文字为中文、英文、数字;
基于辅助参考线的细切分:包括基于参考线的再切分字块选取、合并在相邻两条中文参考线中间被初切分模块切分开的中文手写字符、切分在英文参考线附近x方向上投影接近于零但未被切分的英文字符,以及基于改进的中点连线法的重叠字符切分方法、基于前景分析的粘连字符切分方法。
作为本发明的进一步改进,在所述手写文字识别与排版步骤中包括手写文字识别步骤和自动排版步骤;
在所述手写文字识别步骤中,自动识别手写手符切分步骤中已切分的文字序列,其中手写文字的识别结果是根据多种不同策略排序得到并分三级进行组织;
在自动排版步骤中,将手写文字识别步骤中得到的结果自动排版一一对照呈现出来;
在所述手写文字识别步骤中,包括如下策略对候选文字的可靠性进行排序:手写文字识别器输出的置信度、用户的个性化词库匹配度、N元统计语言模型得到的候选文字组成的不同词序列的联合概率;其中采用多策略排序后的识别候选文字有序集合组织成3个级别的候选集,第1级只包括是经过对所有排序策略综合计算后得到的手写文字识别的最佳首选文字、第2级是由多个策略生成的候选文字有序集合的首选文字所构成的集合,第3级是模式识别器所得到的所有候选文字中的前M个候选文字。
作为本发明的进一步改进,在所述校对步骤中,根据设备显示区域的大小,将手写文字序列中每个手写文字对应的第1级候选或者第1级和第2级候选集合对照着显示在校对区域供用户确认;如果第1级候选结果是正确识别结果,用户不用做任何操作;如果是第2级候选集中的文字是正确结果,用户直接点击正确文字,该正确文字将替换第1级的候选文字;
如果当前呈现的候选文字集合中没有正确结果,用户点击第1级候选文字并在一个新窗口中显示所对应手写文字的第3级候选文字集合供用户选择,用户点击正确文字后,该文字将替换第1级候选文字;
在所述切换输入步骤中,如果当前第3级候选文字集合也没有正确文字,第3级窗口中切换到其他输入法输入正确的文字;
在所述编辑步骤中,对已输入的手写文字序列中的任意一个文字进行删除或在其后插入一个或者多个文字。
本发明还提供了一种手写序列可编辑的连续手写输入系统,包括:
手写文字连续书写单元,用于接收连续写入的手写笔画序列并切分成手写字符序列,切分结果传给手写文字识别与排版单元;
手写文字识别与排版单元,用于在后台进行模式识别,并采用多种策略对模式识别得到的候选结果集进行排序,并根据不同策略的排序结果,将手写文字序列所对应的文字识别结果序列分3级进行组织并对照输出到校对区域;
校对单元,将不同级别候选文字集合中所包含文字与手写文字序列逐字对照显示在校对区域,供用户快速确认正确识别结果;
切换输入单元,用户在多级候选文字集合中无法找到正确识别结果时,在候选集合窗口中直接切换到其他输入方式,以输入对应手写文字的正确书面文字,并对照显示在校对区域;
编辑单元,在校对区域对已经写入的手写文字序列进行编辑,对编辑后的手写文字序列调整排版和识别结果并据此调整校对区域的显示内容;
所述手写文字连续书写单元、所述校对单元、所述切换输入单元、所述编辑单元能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序;或者,用户发出提交手写文字序列的指令直接提交根据应用窗口排版的图形化手写文字序列到应用程序。
作为本发明的进一步改进,所述手写文字连续书写单元包括:
连续手写与实时呈现模块,用户在具有辅助参考线的连续书写区域进行连续书写并以数字墨水方式实时呈现书写文字;
书写区域写满或用户暂停手写后手写字符序列自动提交给手写字符切分模块;
手写字符切分模块,用于根据手写字符序列的特征分布以及手写字符序列和辅助参考线之间的相对关系切分成独立的手写文字单元序列,并提交给手写文字识别与排版单元。
作为本发明的进一步改进,在所述手写字符切分模块中包括:
切分预处理模块:包括去噪、归一化、插点处理;
基于垂直投影的粗切分模块:用于对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
字符分类模块:用于根据初切分文字序列中每个初切分字符在y方向上的平均高度分布的统计特征,包括均值和方差,结合初切分点序列在中文和英文辅助参考线附近的分布情况,判定切分后的文字序列中每个初切分文字为中文、英文、数字;
基于辅助参考线的细切分模块:包括基于参考线的再切分字块选取、合并在相邻两条中文参考线中间被初切分模块切分开的中文手写字符、切分在英文参考线附近x方向上投影接近于零但未被切分的英文字符,以及基于改进的中点连线法的重叠字符切分方法、基于前景分析的粘连字符切分方法。
作为本发明的进一步改进,在所述手写文字识别与排版单元中包括手写文字识别模块和自动排版模块;
在所述手写文字识别模块中,自动识别手写手符切分模块中已切分的文字序列,其中手写文字的识别结果是根据多种不同策略排序得到并分三级进行组织;
在自动排版模块中,将手写文字识别模块中得到的结果自动排版一一对照呈现出来;
在所述手写文字识别模块中,包括如下策略对候选文字的可靠性进行排序:手写文字识别器输出的置信度、用户的个性化词库匹配度、N元统计语言模型得到的候选文字组成的不同词序列的联合概率;其中采用多策略排序后的识别候选文字有序集合组织成3个级别的候选集,第1级只包括是经过对所有排序策略综合计算后得到的手写文字识别的最佳首选文字、第2级是由多个策略生成的候选文字有序集合的首选文字所构成的集合,第3级是模式识别器所得到的所有候选文字中的前M个候选文字。
作为本发明的进一步改进,在所述校对单元中,根据设备显示区域的大小,将手写文字序列中每个手写文字对应的第1级候选或者第1级和第2级候选集合对照着显示在校对区域供用户确认;如果第1级候选结果是正确识别结果,用户不用做任何操作;如果是第2级候选集中的文字是正确结果,用户直接点击正确文字,该正确文字将替换第1级的候选文字;
如果当前呈现的候选文字集合中没有正确结果,用户点击第1级候选文字并在一个新窗口中显示所对应手写文字的第3级候选文字集合供用户选择,用户点击正确文字后,该文字将替换第1级候选文字;
在所述切换输入单元中,如果当前第3级候选文字集合也没有正确文字,第3级窗口中切换到其他输入法输入正确的文字;
在所述编辑单元中,对已输入的手写文字序列中的任意一个文字进行删除或在其后插入一个或者多个文字。
本发明的有益效果是:本发明提出一种手写序列可编辑的连续手写输入方法及系统,用户可以一次性连续输入多个文字,在发生切分或者识别结果错误的情况下,实现单个手写字符的修改或者重新输入。解决了用户连续输入字符的修改受限问题,提高了文字的输入效率,极大改善了用户的书写体验。
附图说明
图1是本发明的手写序列可编辑的连续手写输入方法流程图;
图2是本发明的连续输入手写文字示例图,其中输入的是汉字;
图3是本发明的连续输入手写文字示例图,其中输入的是英文;
图4是本发明在终端横竖屏的自动排版结果示例图;
图5是本发明的手写字符切分步骤流程图;
图6是本发明的手写文字识别步骤中的候选排序策略图;
图7是本发明的校对步骤中的第2级候选结果示例图;
图8是本发明的校对步骤中的第3级候选结果示例图;
图9是本发明的切换输入示例图;
图10是本发明的编辑功能展示图。
具体实施方式
本发明公开了一种手写序列可编辑的连续手写输入方法,包括如下步骤手写文字连续书写步骤、手写文字识别与排版步骤、校对步骤、切换输入步骤、编辑步骤。
在手写文字连续书写步骤中,接收连续写入的手写笔画序列并切分成手写字符序列,切分结果传给手写文字识别与排版步骤;
在手写文字连续书写步骤中,用户可以输入一个或连续输入多个文字。
在手写文字识别与排版步骤中,对传入的手写文字序列排版显示,在后台进行模式识别,并采用多种策略对模式识别得到的候选结果集进行排序,并根据不同策略的排序结果,将手写文字序列所对应的文字识别结果序列分3级进行组织并对照输出到校对区域;
如图1所示,手写文字连续书写步骤包括如下步骤:
在步骤S1中,连续手写与实时呈现步骤,用户在具有辅助参考线的连续书写区域进行连续书写并以数字墨水方式实时呈现书写文字;
书写区域写满或用户暂停手写后手写字符序列自动提交给手写字符切分步骤;
在步骤S2中,手写字符切分步骤,根据手写字符序列的特征分布以及手写字符序列和辅助参考线之间的相对关系切分成独立的手写文字单元序列,并提交给手写文字识别与排版步骤。
在手写文字识别与排版步骤中,包括:
在步骤S3中,手写文字识别:自动识别手写手符切分步骤中已切分的文字序列,其中手写文字的识别结果是根据多种不同策略排序得到并分三级进行组织;
在步骤S4中,自动排版:将手写文字识别步骤中得到的结果自动排版一一对照呈现出来;
其中,步骤S2、步骤S3、步骤S4兼在后台并行时实现。
校对步骤,将不同级别候选文字集合中所包含文字与手写文字序列逐字对照显示在校对区域,供用户快速确认正确识别结果;
切换输入步骤,用户在多级候选文字集合中无法找到正确识别结果时,在候选集合窗口中直接切换到其他输入方式,以输入对应手写文字的正确书面文字,并对照显示在校对区域;
编辑步骤,在校对区域对已经写入的手写文字序列进行编辑,对编辑后的手写文字序列调整排版和识别结果并据此调整校对区域的显示内容;
所述手写文字连续书写步骤、所述校对步骤、所述切换输入步骤、所述编辑步骤能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序;或者,用户发出提交手写文字序列的指令直接提交根据应用窗口排版的图形化手写文字序列到应用程序。
在连续手写与实时呈现步骤中,用户在具有辅助参考线的连续书写区域进行连续书写,将以数字墨水方式实时呈现书写文字;图2为在本发明一种可编辑手写连续输入的示例图,图中连续手写区域的辅助参考线包含竖向的ASCII字符切分参考线和竖向的中文字符切分参考线两种参考线,且两种参考线交替、竖向分布,用户连续书写的文字通过数字墨水的方式实时呈现;图2展示了连续手写汉字在具有辅助参考线的区域的书写示例,图3展示了连续手写ASCII字符在具有辅助参考线的区域的书写示例。
手写字符切分步骤,借助辅助参考线与手写文字序列的相对位置关系将手写字符序列切分成独立的手写文字单元序列,并提交给手写文字识别与排版步骤;图4为该连续手写文字的某一结果示例图,图中格子框实时呈现连续写入的手写字符及其识别结果,已输入的手写字符以及每个手写字符对应的第1、2级候选书面文字一起对照着呈现出来,对照呈现方式可上,可下,可左,可右。
如图5所示,在手写字符切分步骤中,包括如下步骤:
步骤2001:切分预处理:包括去噪、归一化、插点处理;
步骤2002:基于垂直投影的粗切分:对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
步骤2003:字符分类:根据初切分文字序列中每个初切分字符在y方向上的平均高度分布的统计特征,包括均值和方差,结合初切分点序列在中文和英文辅助参考线附近的分布情况,判定切分后的文字序列中每个初切分文字为中文、英文、数字;
步骤2004:基于辅助参考线的细切分:包括基于参考线的再切分字块选取、合并在相邻两条中文参考线中间被初切分模块切分开的中文手写字符、切分在英文参考线附近x方向上投影接近于零但未被切分的英文字符,以及基于改进的中点连线法的重叠字符切分方法、基于前景分析的粘连字符切分方法。
在手写文字识别步骤中,对切分后获得的每个手写文字单元进行后台实时识别,其采用多策略对手写文字识别结果的可靠性进行排序,每个手写文字进行识别后获得的多个候选识别结果在该手写文字附近对照输出出来;图4也是手写文字的结果示例图,手写文字单元在后台实时识别,识别结果与对应的手写文字分3级上下对照输出,当然这种对照方式并不局限于上下对照。
在自动排版步骤中,通过数字墨水渲染后根据校对区域窗口的要求将手写文字序列自动排版输出;图4展示了同一段连续文字在不同校对区域窗口下的自动排版结果。
在校对步骤中,校对区域可以是固定在屏幕上的某个位置,也可以是随着应用中文字输入光标的位置而移动;校对区域的尺寸可以是固定的,或者随着输入的手写文字的增加而自动增大。
如图6所示,在所述手写文字识别步骤中,包括如下策略对候选文字的可靠性进行排序:手写文字识别器输出的置信度、用户的个性化词库匹配度、N元统计语言模型得到的候选文字组成的不同词序列的联合概率;其中采用多策略排序后的识别候选文字有序集合组织成3个级别的候选集,第1级只包括是经过对所有排序策略综合计算后得到的手写文字识别的最佳首选文字、第2级是由多个策略生成的候选文字有序集合的首选文字所构成的集合,第3级是模式识别器所得到的所有候选文字中的前M个候选文字;图4中同时展示了采用多策略对候选文字的可靠性进行排序的结果图。
在校对步骤中,为用户提供快速确认正确识别结果,包括:
根据设备显示区域的大小,将手写文字序列中每个手写文字对应的第1级候选或者第1级和第2级候选集合对照着显示在校对区域供用户确认。如果第1级候选结果是正确识别结果,用户不用做任何操作;如果是第2级候选集中的文字是正确结果,用户直接点击正确文字,该正确文字将替换第1级的候选文字;图7为该状况的展示示例图。图7(a)中“写”字的第1候选错误,用户单击“写”字对应的第2级候选即将第2候选替换成为第1候选,图7(b)为矫正后的结果示例图。
如果当前呈现的候选文字集合中没有正确结果,用户点击第1级候选文字并在一个新窗口中显示所对应手写文字的第3级候选文字集合供用户选择,用户点击正确文字后,该文字将替换第1级候选文字;图8为该状况的展示示例图。图8(a)中“手”字的第1、2级候选识别错误,用户单击“手”字对应的第1级候选后将弹出识别候选框如图8(b)所示,从识别结果中可以找到正确识别结果并选择,图8(c)为矫正后的结果示例图。
如果当前第3级候选文字集合也没有正确文字,可第3级窗口中切换的其他输入法输入正确的文字。图9(b)中第3级候选框中没有“续”字对应的文字,用户可点击候选框中“拼音”,将切换到本系统提供的简易拼音输入法界面输入拼音并选择正确候选如图9(c),最终将回到本发明手写界面如图9(d)所示,用户可继续连续输入手写文字。
如图10所示,在编辑步骤中:用户可对已输入的手写文字序列中的任意一个文字进行删除或在其后插入一个或者多个文字。图(a)中为已输入的手写文字序列,图(b)为删除“可编辑”三字之后的结果图,图(c)为在“写”字后面接着插入“可编辑”三字的结果图。
本发明还公开了一种手写序列可编辑的连续手写输入系统,包括:
手写文字连续书写单元,用于接收连续写入的手写笔画序列并切分成手写字符序列,切分结果传给手写文字识别与排版单元;
手写文字识别与排版单元,用于在后台进行模式识别,并采用多种策略对模式识别得到的候选结果集进行排序,并根据不同策略的排序结果,将手写文字序列所对应的文字识别结果序列分3级进行组织并对照输出到校对区域;
校对单元,将不同级别候选文字集合中所包含文字与手写文字序列逐字对照显示在校对区域,供用户快速确认正确识别结果;
切换输入单元,用户在多级候选文字集合中无法找到正确识别结果时,在候选集合窗口中直接切换到其他输入方式,以输入对应手写文字的正确书面文字,并对照显示在校对区域;
编辑单元,在校对区域对已经写入的手写文字序列进行编辑,对编辑后的手写文字序列调整排版和识别结果并据此调整校对区域的显示内容;
所述手写文字连续书写单元、所述校对单元、所述切换输入单元、所述编辑单元能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序;或者,用户发出提交手写文字序列的指令直接提交根据应用窗口排版的图形化手写文字序列到应用程序。
所述手写文字连续书写单元包括:
连续手写与实时呈现模块,用户在具有辅助参考线的连续书写区域进行连续书写并以数字墨水方式实时呈现书写文字;
书写区域写满或用户暂停手写后手写字符序列自动提交给手写字符切分模块;
手写字符切分模块,用于根据手写字符序列的特征分布以及手写字符序列和辅助参考线之间的相对关系切分成独立的手写文字单元序列,并提交给手写文字识别与排版单元。
在所述手写字符切分模块中包括:
切分预处理模块:包括去噪、归一化、插点处理;
基于垂直投影的粗切分模块:用于对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
字符分类模块:用于对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
基于辅助参考线的细切分模块:包括基于参考线的再切分字块选取、合并在相邻两条中文参考线中间被初切分模块切分开的中文手写字符、切分在英文参考线附近x方向上投影接近于零但未被切分的英文字符,以及基于改进的中点连线法的重叠字符切分方法、基于前景分析的粘连字符切分方法。
在所述手写文字识别与排版单元中包括手写文字识别模块和自动排版模块;
在所述手写文字识别模块中,自动识别手写手符切分模块中已切分的文字序列,其中手写文字的识别结果是根据多种不同策略排序得到并分三级进行组织;
在自动排版模块中,将手写文字识别模块中得到的结果自动排版一一对照呈现出来;
在所述手写文字识别模块中,包括如下策略对候选文字的可靠性进行排序:手写文字识别器输出的置信度、用户的个性化词库匹配度、N元统计语言模型得到的候选文字组成的不同词序列的联合概率;其中采用多策略排序后的识别候选文字有序集合组织成3个级别的候选集,第1级只包括是经过对所有排序策略综合计算后得到的手写文字识别的最佳首选文字、第2级是由多个策略生成的候选文字有序集合的首选文字所构成的集合,第3级是模式识别器所得到的所有候选文字中的前M个候选文字。
在所述校对单元中,根据设备显示区域的大小,将手写文字序列中每个手写文字对应的第1级候选或者第1级和第2级候选集合对照着显示在校对区域供用户确认;如果第1级候选结果是正确识别结果,用户不用做任何操作;如果是第2级候选集中的文字是正确结果,用户直接点击正确文字,该正确文字将替换第1级的候选文字;
如果当前呈现的候选文字集合中没有正确结果,用户点击第1级候选文字并在一个新窗口中显示所对应手写文字的第3级候选文字集合供用户选择,用户点击正确文字后,该文字将替换第1级候选文字;
在所述切换输入单元中,如果当前第3级候选文字集合也没有正确文字,第3级窗口中切换到其他输入法输入正确的文字;
在所述编辑单元中,对已输入的手写文字序列中的任意一个文字进行删除或在其后插入一个或者多个文字。
在本发明可用于各种触摸屏设备的手写字符序列可编辑连续手写输入,借助具有辅助参考线指示的输入区域,对连续手写字符序列进行实时呈现、与书写并行的后台切分与识别以及自动对照排版显示手写字符和识别结果,支持用户在已有手写字符序列任意位置进行插入删除手写字符以及序列中的字符识别错误进行快速修订或者快速切换至其他输入法来补写个别字符,解决当前连续手写切分不准确、连续手写输入时无法对同时输入的多个文字序列中的单个手写文字错误进行删除或插入编辑、连续手写输入时每个手写文字的候选呈现方式效率不高、手写识别候选不完备时切换到其他输入法的便捷性差、连续输入时也需要逐字或者逐词确认候选等关键问题,从而充分保证用户书写连贯性,大幅提升触屏设备上手写输入方法的输入效率与用户体验,帮助突破智能移动设备的输入瓶颈。
本发明提出一种手写序列可编辑的连续手写输入方法及系统,用户可以一次性连续输入多个文字,在发生切分或者识别结果错误的情况下,实现单个手写字符的修改或者重新输入。解决了用户连续输入字符的修改受限问题,提高了文字的输入效率,极大改善了用户的书写体验。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种手写序列可编辑的连续手写输入方法,其特征在于,包括如下步骤:
手写文字连续书写步骤,接收连续写入的手写笔画序列并切分成手写字符序列,切分结果传给手写文字识别与排版步骤;
手写文字识别与排版步骤,在后台进行模式识别,并采用多种策略对模式识别得到的候选结果集进行排序,并根据不同策略的排序结果,将手写文字序列所对应的文字识别结果序列分3级进行组织并对照输出到校对区域;
校对步骤,将不同级别候选文字集合中所包含文字与手写文字序列逐字对照显示在校对区域,供用户快速确认正确识别结果;
切换输入步骤,用户在多级候选文字集合中无法找到正确识别结果时,在候选集合窗口中直接切换到其他输入方式,以输入对应手写文字的正确书面文字,并对照显示在校对区域;
编辑步骤,在校对区域对已经写入的手写文字序列进行编辑,对编辑后的手写文字序列调整排版和识别结果并据此调整校对区域的显示内容;
所述手写文字连续书写步骤、所述校对步骤、所述切换输入步骤、所述编辑步骤能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序;或者,用户发出提交手写文字序列的指令直接提交根据应用窗口排版的图形化手写文字序列到应用程序。
2.根据权利要求1所述的连续手写输入方法,其特征在于,手写文字连续书写步骤包括如下步骤:
连续手写与实时呈现步骤,用户在具有辅助参考线的连续书写区域进行连续书写并以数字墨水方式实时呈现书写文字;
书写区域写满或用户暂停手写后手写字符序列自动提交给手写字符切分步骤;
手写字符切分步骤,根据手写字符序列的特征分布以及手写字符序列和辅助参考线之间的相对关系切分成独立的手写文字单元序列,并提交给手写文字识别与排版步骤。
3.根据权利要求2所述的连续手写输入方法,其特征在于,在所述手写字符切分步骤中包括如下步骤:
切分预处理步骤:包括去噪、归一化、插点处理;
基于垂直投影的粗切分步骤:对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
字符分类步骤:根据初切分文字序列中每个初切分字符在y方向上的平均高度分布的统计特征,包括均值和方差,结合初切分点序列在中文和英文辅助参考线附近的分布情况,判定切分后的文字序列中每个初切分文字为中文、英文、数字;
基于辅助参考线的细切分:包括基于参考线的再切分字块选取、合并在相邻两条中文参考线中间被初切分模块切分开的中文手写字符、切分在英文参考线附近x方向上投影接近于零但未被切分的英文字符,以及基于改进的中点连线法的重叠字符切分方法、基于前景分析的粘连字符切分方法。
4.根据权利要求3所述的连续手写输入方法,其特征在于,在所述手写文字识别与排版步骤中包括手写文字识别步骤和自动排版步骤;
在所述手写文字识别步骤中,自动识别手写手符切分步骤中已切分的文字序列,其中手写文字的识别结果是根据多种不同策略排序得到并分三级进行组织;
在自动排版步骤中,将手写文字识别步骤中得到的结果自动排版一一对照呈现出来;
在所述手写文字识别步骤中,包括如下策略对候选文字的可靠性进行排序:手写文字识别器输出的置信度、用户的个性化词库匹配度、N元统计语言模型得到的候选文字组成的不同词序列的联合概率;其中采用多策略排序后的识别候选文字有序集合组织成3个级别的候选集,第1级只包括是经过对所有排序策略综合计算后得到的手写文字识别的最佳首选文字、第2级是由多个策略生成的候选文字有序集合的首选文字所构成的集合,第3级是模式识别器所得到的所有候选文字中的前M个候选文字。
5.根据权利要求4所述的连续手写输入方法,其特征在于,在所述校对步骤中,根据设备显示区域的大小,将手写文字序列中每个手写文字对应的第1级候选或者第1级和第2级候选集合对照着显示在校对区域供用户确认;如果第1级候选结果是正确识别结果,用户不用做任何操作;如果是第2级候选集中的文字是正确结果,用户直接点击正确文字,该正确文字将替换第1级的候选文字;
如果当前呈现的候选文字集合中没有正确结果,用户点击第1级候选文字并在一个新窗口中显示所对应手写文字的第3级候选文字集合供用户选择,用户点击正确文字后,该文字将替换第1级候选文字;
在所述切换输入步骤中,如果当前第3级候选文字集合也没有正确文字,第3级窗口中切换到其他输入法输入正确的文字;
在所述编辑步骤中,对已输入的手写文字序列中的任意一个文字进行删除或在其后插入一个或者多个文字。
6.一种手写序列可编辑的连续手写输入系统,其特征在于,包括:
手写文字连续书写单元,用于接收连续写入的手写笔画序列并切分成手写字符序列,切分结果传给手写文字识别与排版单元;
手写文字识别与排版单元,用于在后台进行模式识别,并采用多种策略对模式识别得到的候选结果集进行排序,并根据不同策略的排序结果,将手写文字序列所对应的文字识别结果序列分3级进行组织并对照输出到校对区域;
校对单元,将不同级别候选文字集合中所包含文字与手写文字序列逐字对照显示在校对区域,供用户快速确认正确识别结果;
切换输入单元,用户在多级候选文字集合中无法找到正确识别结果时,在候选集合窗口中直接切换到其他输入方式,以输入对应手写文字的正确书面文字,并对照显示在校对区域;
编辑单元,在校对区域对已经写入的手写文字序列进行编辑,对编辑后的手写文字序列调整排版和识别结果并据此调整校对区域的显示内容;
所述手写文字连续书写单元、所述校对单元、所述切换输入单元、所述编辑单元能够随时交替进行,直到用户发出提交识别结果的指令时将整个手写字符序列对应的第1级候选中的书面字符串提交到等待字符输入的应用程序;或者,用户发出提交手写文字序列的指令直接提交根据应用窗口排版的图形化手写文字序列到应用程序。
7.根据权利要求6所述的连续手写输入系统,其特征在于,所述手写文字连续书写单元包括:
连续手写与实时呈现模块,用户在具有辅助参考线的连续书写区域进行连续书写并以数字墨水方式实时呈现书写文字;
书写区域写满或用户暂停手写后手写字符序列自动提交给手写字符切分模块;
手写字符切分模块,用于根据手写字符序列的特征分布以及手写字符序列和辅助参考线之间的相对关系切分成独立的手写文字单元序列,并提交给手写文字识别与排版单元。
8.根据权利要求7所述的连续手写输入系统,其特征在于,在所述手写字符切分模块中包括:
切分预处理模块:包括去噪、归一化、插点处理;
基于垂直投影的粗切分模块:用于对插点后的手写文字序列做横坐标x上和纵坐标y上的投影,将x上投影值为0或者接近于0的点作为切分点初步切分手写文字序列;
字符分类模块:用于根据初切分文字序列中每个初切分字符在y方向上的平均高度分布的统计特征,包括均值和方差,结合初切分点序列在中文和英文辅助参考线附近的分布情况,判定切分后的文字序列中每个初切分文字为中文、英文、数字;
基于辅助参考线的细切分模块:包括基于参考线的再切分字块选取、合并在相邻两条中文参考线中间被初切分模块切分开的中文手写字符、切分在英文参考线附近x方向上投影接近于零但未被切分的英文字符,以及基于改进的中点连线法的重叠字符切分方法、基于前景分析的粘连字符切分方法。
9.根据权利要求6所述的连续手写输入系统,其特征在于,在所述手写文字识别与排版单元中包括手写文字识别模块和自动排版模块;
在所述手写文字识别模块中,自动识别手写手符切分模块中已切分的文字序列,其中手写文字的识别结果是根据多种不同策略排序得到并分三级进行组织;
在自动排版模块中,将手写文字识别模块中得到的结果自动排版一一对照呈现出来;
在所述手写文字识别模块中,包括如下策略对候选文字的可靠性进行排序:手写文字识别器输出的置信度、用户的个性化词库匹配度、N元统计语言模型得到的候选文字组成的不同词序列的联合概率;其中采用多策略排序后的识别候选文字有序集合组织成3个级别的候选集,第1级只包括是经过对所有排序策略综合计算后得到的手写文字识别的最佳首选文字、第2级是由多个策略生成的候选文字有序集合的首选文字所构成的集合,第3级是模式识别器所得到的所有候选文字中的前M个候选文字。
10.根据权利要求9所述的连续手写输入系统,其特征在于,在所述校对单元中,根据设备显示区域的大小,将手写文字序列中每个手写文字对应的第1级候选或者第1级和第2级候选集合对照着显示在校对区域供用户确认;如果第1级候选结果是正确识别结果,用户不用做任何操作;如果是第2级候选集中的文字是正确结果,用户直接点击正确文字,该正确文字将替换第1级的候选文字;
如果当前呈现的候选文字集合中没有正确结果,用户点击第1级候选文字并在一个新窗口中显示所对应手写文字的第3级候选文字集合供用户选择,用户点击正确文字后,该文字将替换第1级候选文字;
在所述切换输入单元中,如果当前第3级候选文字集合也没有正确文字,第3级窗口中切换到其他输入法输入正确的文字;
在所述编辑单元中,对已输入的手写文字序列中的任意一个文字进行删除或在其后插入一个或者多个文字。
CN201410295010.2A 2014-06-25 2014-06-25 手写序列可编辑的连续手写输入方法与系统 Active CN104063176B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410295010.2A CN104063176B (zh) 2014-06-25 2014-06-25 手写序列可编辑的连续手写输入方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410295010.2A CN104063176B (zh) 2014-06-25 2014-06-25 手写序列可编辑的连续手写输入方法与系统

Publications (2)

Publication Number Publication Date
CN104063176A true CN104063176A (zh) 2014-09-24
CN104063176B CN104063176B (zh) 2017-08-08

Family

ID=51550909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410295010.2A Active CN104063176B (zh) 2014-06-25 2014-06-25 手写序列可编辑的连续手写输入方法与系统

Country Status (1)

Country Link
CN (1) CN104063176B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718435A (zh) * 2014-12-23 2016-06-29 联想(新加坡)私人有限公司 手写内容的重排方法及电子设备
CN107219935A (zh) * 2017-05-25 2017-09-29 哈尔滨工业大学 一种面向连续书写汉字的、支持交互的汉字输入系统及方法
WO2019000681A1 (zh) * 2017-06-28 2019-01-03 广州视源电子科技股份有限公司 信息排版方法、装置、设备及计算机存储介质
WO2019037354A1 (zh) * 2017-08-21 2019-02-28 广州视源电子科技股份有限公司 一种手写内容的显示方法、装置、设备及存储介质
CN109582946A (zh) * 2018-11-28 2019-04-05 龙马智芯(珠海横琴)科技有限公司 文字区域排版方向的确定方法及装置
CN110348306A (zh) * 2019-06-06 2019-10-18 上海学印教育科技有限公司 一种手写输入方法及系统
JP2023041318A (ja) * 2021-09-13 2023-03-24 アイラボ株式会社 プログラム、誤り文字検出装置及び誤り文字検出方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05128297A (ja) * 1991-11-07 1993-05-25 Hitachi Ltd 文字認識装置
CN101256462A (zh) * 2007-02-28 2008-09-03 北京三星通信技术研究有限公司 基于全混合联想库的手写输入方法和装置
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
CN102013010A (zh) * 2010-12-10 2011-04-13 哈尔滨工业大学深圳研究生院 一种交互式篇章级手写识别方法及系统
JP2013214187A (ja) * 2012-04-02 2013-10-17 Sharp Corp 文字入力装置、文字入力装置の制御方法、制御プログラム、および記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05128297A (ja) * 1991-11-07 1993-05-25 Hitachi Ltd 文字認識装置
CN101256462A (zh) * 2007-02-28 2008-09-03 北京三星通信技术研究有限公司 基于全混合联想库的手写输入方法和装置
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
CN102013010A (zh) * 2010-12-10 2011-04-13 哈尔滨工业大学深圳研究生院 一种交互式篇章级手写识别方法及系统
JP2013214187A (ja) * 2012-04-02 2013-10-17 Sharp Corp 文字入力装置、文字入力装置の制御方法、制御プログラム、および記録媒体

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718435A (zh) * 2014-12-23 2016-06-29 联想(新加坡)私人有限公司 手写内容的重排方法及电子设备
US10698597B2 (en) 2014-12-23 2020-06-30 Lenovo (Singapore) Pte. Ltd. Reflow of handwriting content
CN107219935A (zh) * 2017-05-25 2017-09-29 哈尔滨工业大学 一种面向连续书写汉字的、支持交互的汉字输入系统及方法
CN107219935B (zh) * 2017-05-25 2021-03-02 哈尔滨工业大学 一种面向连续书写汉字的、支持交互的汉字输入系统及方法
WO2019000681A1 (zh) * 2017-06-28 2019-01-03 广州视源电子科技股份有限公司 信息排版方法、装置、设备及计算机存储介质
WO2019037354A1 (zh) * 2017-08-21 2019-02-28 广州视源电子科技股份有限公司 一种手写内容的显示方法、装置、设备及存储介质
CN109582946A (zh) * 2018-11-28 2019-04-05 龙马智芯(珠海横琴)科技有限公司 文字区域排版方向的确定方法及装置
CN110348306A (zh) * 2019-06-06 2019-10-18 上海学印教育科技有限公司 一种手写输入方法及系统
JP2023041318A (ja) * 2021-09-13 2023-03-24 アイラボ株式会社 プログラム、誤り文字検出装置及び誤り文字検出方法
JP7285018B2 (ja) 2021-09-13 2023-06-01 アイラボ株式会社 プログラム、誤り文字検出装置及び誤り文字検出方法

Also Published As

Publication number Publication date
CN104063176B (zh) 2017-08-08

Similar Documents

Publication Publication Date Title
CN104063176A (zh) 手写序列可编辑的连续手写输入方法与系统
US9323456B2 (en) Multi-character continuous handwriting input method
CN100587660C (zh) 一种手写字符预测识别的方法和装置
US20210216819A1 (en) Method, electronic device, and storage medium for extracting spo triples
CN102013010B (zh) 一种交互式篇章级手写识别方法及系统
CN104020943A (zh) 字符串替换
CN104375665A (zh) 输入法纠错方法及装置
CN100555312C (zh) 利用字符结构信息进行后处理的手写识别的方法和装置
CN102937864A (zh) 一种用于在触摸终端上确定所选文本的方法与设备
CN102063620A (zh) 一种手写识别方法、系统及手写识别终端
CN107219935B (zh) 一种面向连续书写汉字的、支持交互的汉字输入系统及方法
CN103294175A (zh) 一种电子设备及其自动切换输入模式的方法
CN103257810B (zh) 手写数学公式识别方法及装置
CN103513852A (zh) 电子装置的文本编辑系统及方法
CN102207824B (zh) 一种基于触摸屏设备的滑行拼音输入法
CN112417875A (zh) 配置信息的更新方法、装置、计算机设备及介质
CN104731766A (zh) 拼音文字词库构建方法和装置及输入方法和系统
US20230096728A1 (en) System and method for text line and text block extraction
CN105677718A (zh) 文字检索方法及装置
CN102750272B (zh) 字符手写输入候选项优化方法及系统
CN102810095B (zh) 一种学词方法和装置
US20230054848A1 (en) Structural decomposition in handwriting
An et al. Automatic matching of character strokes for computer-aided Chinese handwriting education
CN101488044A (zh) 一种语音和单笔混合式计算机汉字输入法
CN104112287B (zh) 切分图片中文字的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant