CN102156577B - 实现连续手写识别输入的方法及系统 - Google Patents
实现连续手写识别输入的方法及系统 Download PDFInfo
- Publication number
- CN102156577B CN102156577B CN 201110076004 CN201110076004A CN102156577B CN 102156577 B CN102156577 B CN 102156577B CN 201110076004 CN201110076004 CN 201110076004 CN 201110076004 A CN201110076004 A CN 201110076004A CN 102156577 B CN102156577 B CN 102156577B
- Authority
- CN
- China
- Prior art keywords
- stroke
- buffer area
- historical
- new entering
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明涉及手写输入技术领域,公开了一种实现连续手写识别输入的方法及系统。该方法包括:跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;否则,将新输入笔画存储到第一缓存区;对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;显示识别得到的完整字符。利用本发明,可以有效地提高输入效率及识别率。
Description
技术领域
本发明涉及手写输入技术领域,特别涉及一种实现连续手写识别输入的方法及系统。
背景技术
近年来,随着手持电子设备的热销,其功能正逐步从最为简单的电子地址信息簿转向带有触摸显示的微型电脑并支持无限网络的多媒体终端设备。随着这些小型设备上的文本输入需求从简短的信息,如电子地址簿等转向更长的笔记或电子邮件消息,自然高效而连续的输入需求正受到越来越多的重视。
大屏幕设备由于书写区域比较宽泛,用户得以延续日常的连续输入的书写习惯。然而在便携性小型触摸屏设备上,由于触摸屏尺寸的限制,导致单次输入的笔迹有限,连续手写输入能力受到了限制,输入效率较低。
针对这种情况,目前这类小屏幕设备上支持的手写大部分是基于单字符模式,也就是说。用户在确定的书写区内(如预置的书写框或全屏)逐字输入,在单字结束后提笔等待系统反馈,然后清空书写屏幕继续下个字符的输入。这种单字符输入模式避免了连续手写识别的字符切分难题,往往具有较高的识别率。然而这样的输入方式不符合人们日常的书写习惯,而且提笔轮候和等待识别影响了输入效率。
显然基于小屏幕设备的手写模式有待提高,迫切需要在功能化、人性化、智能化方面取得突破,作为一种真正可用、易用、实用的技术,更广泛地应用于人们的日常生活和商务工作领域中。为此,现有技术中提出了一种解决方案,该方案允许用户在预先设定的书写区域内以叠加覆盖的方式连续输入多个字符,实现在有限书写区域内的连续输入需求。但该方案在用户书写体验和识别性能方面依然存在以下缺点:
首先,该方案采用了无切分的连续识别技术,在用户完成所有字符输入后才启动后端识别,由于需要等待识别,因此输入效率受到一定的影响。而且,由于现有技术叠加覆盖输入方式是直接在原始的空间叠加笔迹上提取特征,为了避免空间重叠信息对字符识别的影响,提取的都是与位置无关的笔画方向特征。而根据传统手写识别技术,位置特征对字符特别是某些易混淆字的区分能力较强,位置特征的缺失会影响对输入字符的识别率。
发明内容
本发明实施例提供一种实现连续手写识别输入的方法及系统,以解决现有技术中通过叠加覆盖方式实现连续输入时,输入效率及识别率低的问题。
为此,本发明实施例提供如下技术方案:
一种实现连续手写识别输入的方法,包括:
跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;
确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;
如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;
否则,将新输入笔画存储到第一缓存区;
对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;
显示识别得到的完整字符。
一种实现连续手写识别输入的系统,包括:
数据采集模块,用于跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;
断点分析模块,用于确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;
笔画整理模块,用于在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于不同字符时,清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;并在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于同一字符时,将新输入笔画存储到第一缓存区;
字符识别模块,用于对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;
字符显示模块,用于显示所述字符识别模块识别得到的完整字符。
本发明实施例提供的实现连续手写识别输入的方法及系统,针对现有技术中通过叠加覆盖方式实现连续输入时,采用无切分的连续识别技术输入效率低的问题,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。由于断点分析和字符识别的处理是与用户输入同步进行的,即在用户输入过程中,确定新输入笔画和缓存区中历史笔画隶属于不同字符时即该对历史笔画进行字符识别,从而避免了现有叠加覆盖输入方式下的轮候等待时间,提高了输入效率。而且,由于通过断点分析,可以对判断为独立字符的历史笔画集合进行识别,因此,可以有效地提高识别率。
进一步地,通过对历史笔画的淡化处理,可以使用户清晰地区分历史笔迹和当前输入的笔画,将用户输入的内容清楚地展现给用户。
附图说明
为了更清楚地说明本发明实施的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例实现连续手写识别输入的方法的流程图;
图2是本发明实施例中跟踪用户笔画输入笔迹的流程图;
图3是本发明实施例实现连续手写识别输入的系统的一种结构示意图;
图4是本发明实施例实现连续手写识别输入的系统的另一种结构示意图;
图5是本发明实施例中用户书写笔画示例;
图6是本发明实施例中在书写区对书写笔画的显示效果示例。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例实现连续手写识别输入的方法,针对现有技术中通过叠加覆盖方式实现连续输入时,采用无切分的连续识别技术输入效率低的问题,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。
如图1所示,是本发明实施例实现连续手写识别输入的方法的流程图,包括以下步骤:
步骤101,跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列。
其中,每个笔画是指从落笔点至抬笔点之间的连续笔触轨迹。
步骤102,确定新输入笔画与第一缓存区存储的历史笔画的隶属关系。
前后书写的两个笔画可能属于同一字符也可能属于不同的两个字符,在本发明实施例中,可以根据笔画书写特性及前后笔画的相关性来确定不同笔画间的隶属关系。
具体地,可以根据新输入笔画和第一缓存区中存储的历史笔画的位置关系确定新输入笔画与第一缓存区存储的历史笔画的隶属关系。
首先,根据记录的笔画的二维坐标点列,计算新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置,有以下几种情况:
(1)所述起点位置与所述终点位置的距离小于第一距离阈值,比如,可以将第一距离阈值设为0.2倍的字框长度。这里字框大小可以是自适应于用户书写习惯的,在系统初始化没有输入时将其设置为相当于书写区大小的数值,随后根据用户输入的多笔画可以重新计算字框大小,则确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;
(2)所述起点位置与所述终点位置的距离大于第二距离阈值,比如,可以将第一距离阈值设为0.35倍的字框长度,则确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;
(3)所述起点位置与所述终点位置的距离大于等于第一距离阈值、并且小于等于第二距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,也就是说,仅根据新输入笔画和第一缓存区中存储的历史笔画的位置关系还不能准确判断新输入笔画与历史笔画是否属于同一字符。
对于这种隶属关系属于模糊状态的情况,可以做进一步地辅助判断,具体地,可以按以下方式处理:
A.根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响来判断:如果新输入笔画使得累计笔画的均衡度增加值超过某个预定值,则可确定新输入笔画和第一缓存区中的历史笔画隶属于同一字符;否则确定新输入笔画和第一缓存区中的历史笔画隶属于不同字符。
所述笔画分布均衡度用于衡量笔画的所有笔段(指采样点之间的直线距离)在书写框各个区间内的分布。在此,需要分别计算历史笔画的分布均衡度以及添加新笔画后所有笔画的分布均衡度。比如,首先计算待考察笔画集合(即第一缓存区中的所有笔画)的字框,并将该字框划分成四个字框,分别为左上部,左下部,右上部以及右下部。随后计算待考察笔画在这四个空间上的累积笔段长度和。最后计算笔画集合在四个子空间上笔段方差,将该方差作为笔画分布均衡度,可见方差越小则笔段分布越均衡。如果新输入笔画加入到第一缓存区中的历史笔画集合后,计算得到的笔画分布均衡度比未添加新输入笔画之前第一缓存区中的历史笔画的比笔画分布均衡度增加值超过某个预先设定的阈值,比如原来的0.15倍,则确定新输入笔画和第一缓存区中的历史笔画隶属于同一字符。
B.考虑到新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况,一般来说,字符内部笔画间重叠有一定规律,比如新输入笔画和历史笔画相交点的个数较少。因此,若新输入笔画和历史笔画的重叠度很高且较为杂乱没有规律,则很大程度上其为一个新的字符笔画,也就是说,新输入笔画和第一缓存区中的历史笔画隶属于不同字符。
比如,算新输入笔画和第一缓存区中的历史笔画两两相交的夹角大小,若平均夹角小于预先设定的域值,比如20度,则确定新笔画和历史笔画为不同字符
当然,本发明实施例并不仅限于上述判断方式,还可以采用其他判断方式,在此不再一一举例。
步骤103,如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;否则,将新输入笔画存储到第一缓存区。
对于可以明确判断属于不同字符的情况,可以认为第一缓存区中的历史笔画已经是一个完整字符的所有笔画,因此,需要首先将第一缓存区中的历史笔画转存到第二缓存区,以等待后台相应的识别模块对其进行识别;
对于可以明确判断属于同一字符的情况,由于与第一缓存区中的历史笔画属于同一字符,因此,可以直接将该新输入笔画存储到第一缓存区中。
步骤104,对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;
在本发明实施例中,对第二缓存区中的历史笔画进行字符的识别是实时进行的,也就是说,一旦确定新输入笔画与第一缓存区中的历史笔画隶属于不同字符时,即触发后台字符识别模块对第二缓存区中的已判定为完整字符的历史笔画的集合进行识别处理。当然,字符识别模块也可以实时地读取第二缓存区中的历史笔画的集合,进行识别处理。
步骤105,显示识别得到的完整字符。
对于每个判定为完整字符的历史笔画集合进行识别时,可能会得到多个识别结果。在显示时,可以将生成的识别结果中的首选字符置于文本编辑区,而其他候选字符可以通过缓存或其他方式保存,比如在候选区内排列显示或在编辑状态下通过菜单的方式显示,用于后续用户对识别结果的编辑更正。
由此可见,本发明实施例实现连续手写识别输入的方法,针对现有技术中通过叠加覆盖方式实现连续输入时,采用无切分的连续识别技术输入效率低的问题,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。由于断点分析和字符识别的处理是与用户输入同步进行的,即在用户输入过程中,确定新输入笔画和缓存区中历史笔画隶属于不同字符时即该对历史笔画进行字符识别,从而避免了现有叠加覆盖输入方式下的轮候等待时间,提高了输入效率。
在本发明实施例中,跟踪用户笔画输入笔迹的流程如图2所示,包括以下步骤:
步骤201,清空各计数器和缓存区,并设置相邻笔画停顿时间计算器T=0;
步骤202,清空书写区,以给用户后续输入提供空间;
步骤203,等待输入;
步骤204,判断笔触是否落笔;如果是,则执行步骤205;否则,执行步骤207;
步骤205,跟踪用户笔画输入笔迹,将笔画记录为一个二维坐标点列,直至笔触离开触摸屏;然后将相邻笔画停顿时间计数器T重置为0;
步骤206,将记录的一系列二维坐标点列输入到后端处理系统;
步骤207,将相邻笔画停顿时间计数器T加1;
步骤208,相邻笔画停顿时间计数器T的值是否大于预设的停顿时间阈值Tr;如果是,则执行步骤209;否则,返回步骤203;
步骤209,确定已输入一完整历史字符,启动后端处理系统对第二缓存区中的历史笔画集合进行字符识别。
所述后端处理系统是一个集成化的对用户输入笔迹进行实时分析处理的系统,其主要功能是对用户输入的历史笔迹进行断点分析、字符识别等处理,即图1中步骤102至步骤104的过程。也就是说,在本发明实施例实现连续手写识别输入的方法的实际应用时,可以分别应用于一个系统的前端和后端两个层面。在前端实时监测并采集用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列,在后端对采集到的用户笔画输入笔迹进行整理、识别等处理,从而可以提高输入及识别效率。
另外,需要说明的是,在本发明实施例中,在进行字符识别时,由于是对判定为完整字符的历史笔画集合进行识别,而不是如前面提到的现有技术那样直接在原始的空间叠加笔迹上提取特征,因此可以集成各种经典的识别算法,有效地提高了识别率。
比如利用具有很高区分度的八方向特征进行字符识别,主要过程如下:
(1)预处理
首先,进行归一化,即将字符外框归整到系统预设大小,比如512*512;然后将远离字符主要笔迹的采样点去除,并进行平滑处理,一般是用采样点前后N个点的均值替代当前采样点位置坐标;然后通过重采样等方式减少采集到的笔迹信号中的噪音。所述重采样是指将原时间均等的采样点序列重采样为空间均等的采样点序列。
(2)特征提取
比如,定义八方向为相应于汉字笔画特点的横竖撇捺八个方向。系统首先将字符外框划分为N*N个字框(通常N取8)。随后通过计算相邻采样点间的笔段在八方向上的投影并累加计算N*N个子框笔迹的投影矢量和,得到N*N*8维的特征向量。在计算相邻采样点间笔段在八方向投影时可以仅将其投影在最近的两个方向上,而将其他方向上的投影矢量计为0。
(3)特征变换
对步骤(2)中得到的N*N*8维的原始特征矢量作区分性特征变换,以降低维数并提高识别率。具体可以采用模式识别领域常用的LDA(LinearDiscriminant Analysis,线性判别分析)特征变换方法,利用系统预置的LDA变换矩阵将原始N*N*8的特征矢量降为M维的特征矢量(N*N*8)M)。
(4)根据语言模型及字符模型进行模式匹配
计算给定的M维特征矢量和字库中每个字符模型的相似度,并将具有最大相似度的字符作为首选识别结果。
(5)生成候选字符序列
按照步骤(4)中模型相似度得分排序,将得分最高的几个(比如4个)字符作为候选字符集展示给用户。
通过上述字符识别处理过程,可以将用户原始输入的书写笔迹映射为一组可能的ASCII候选字符,也就是说,对于每个判定为完整字符的历史笔画集合进行识别时,可能会得到多个识别结果。在显示时,可以将生成的识别结果中的首选字符置于文本编辑区,而其他候选字符可以通过缓存或其他方式保存,比如在候选区内排列显示或在编辑状态下通过菜单的方式显示,用于后续用户对识别结果的编辑更正。由于本发明实施例实现连续手写识别输入的方法支持的是连续手写识别,在用户不断输入的过程中得到的语义信息会不断丰富,因此,在进行字符识别时,还可以结合语言模型信息,根据后续识别结果对历史识别结果进行实时自动更正,进一步提高识别率。
在现有技术叠加覆盖输入方式中,由于用户是在设定的书写空间内以叠加覆盖方式输入多个字符,随着字符的增多,字符的笔画之间相互混杂,很难区分历史笔迹和当前输入的笔画。输入的字迹难以清晰展现,从而不能将用户输入的内容清楚地展现给用户。
针对这种问题,本发明实施例进一步采取了笔迹淡化处理的方式,使用户可以清晰地甄别输入字符,提高用户的书写体验,下面对此进行详细说明。
在本发明实施例中,进一步对第一缓存区中的历史笔画进行淡化处理,并在屏幕书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。具体地,对历史笔画进行淡化处理的方式有多种,比如:
(1)按照第一缓存区中各笔画的生成时间先后顺序对各笔画进行匀速的渐进淡化,即生成时间越久的笔画越先淡化。
(2)根据断点分析的结果对第一缓存区中的笔画进行淡化处理,具体包括:
如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失,在这种情况下,可以将历史笔画的淡化值设为0;
如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显示,在这种情况下,可以将历史笔画的淡化值设为1;
如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示,在这种情况下,可以将历史笔画的淡化值设为0.5。
需要说明的是,不论在上述哪种淡化处理方式下,均可将新输入笔画进行正常显示。
上述第(2)种方式可以自适应于用户输入的速度,避免了恒定淡化时间引起的可能等待问题。
可见,本发明实施例实现连续手写识别输入的方法,不仅可以有效地提高输入及识别效率,而且,通过对历史笔画的淡化处理,可以在小屏幕设备上采用叠加输入的方式,也可以使用户清晰地甄别输入的字符,在实现连续输入的同时,提高了用户的书写体验。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
相应地,本发明实施例还提供一种实现连续手写识别输入的系统,如图3所示,是本发明实施例实现连续手写识别输入的系统的一种结构示意图。
在该实施例中,所述系统包括:
数据采集模块301,用于跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;
断点分析模块302,用于确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;
笔画整理模块303,用于在所述断点分析模块302确定新输入笔画与第一缓存区存储的历史笔画隶属于不同字符时,清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;并在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于同一字符时,将新输入笔画存储到第一缓存区;
字符识别模块304,用于对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;
字符显示模块305,用于显示所述字符识别模块识别得到的完整字符。
需要说明的是,在字符识别模块304对于每个判定为完整字符的历史笔画集合进行识别时,可能会得到多个识别结果。在字符显示模块305对识别结果显示时,可以将其中的首选字符置于文本编辑区,而其他候选字符可以通过缓存或其他方式保存,比如在候选区内排列显示或在编辑状态下通过菜单的方式显示,用于后续用户对识别结果的编辑更正。
在本发明实施例中,所述断点分析模块302,具体用于根据新输入笔画和第一缓存区中存储的历史笔画的位置关系确定新输入笔画与第一缓存区存储的历史笔画的隶属关系,具体可以包括:位置确定单元、计算单元、第一判断单元和第二判断单元,其中:
所述位置确定单元,用于确定新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置;
所述计算单元,用于计算所述起点位置与所述终点位置的距离;
所述第一判断单元,用于根据所述计算单元的计算结果,在所述起点位置与所述终点位置的距离大于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;在所述起点位置与所述终点位置的距离小于第二距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;在所述起点位置与所述终点位置的距离大于等于第二距离阈值、并且小于等于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态;
所述第二判断单元,用于在所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态时,根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系,或者根据新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系。
由此可见,本发明实施例实现连续手写识别输入的系统,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。由于断点分析和字符识别的处理是与用户输入同步进行的,即在用户输入过程中,确定新输入笔画和缓存区中历史笔画隶属于不同字符时即该对历史笔画进行字符识别,从而避免了现有叠加覆盖输入方式下的轮候等待时间,提高了输入效率。
如图4所示,是本发明实施例实现连续手写识别输入的系统的另一种结构示意图。
与图3所示实施例不同的是,在该实施例中,所述系统进一步包括:
淡化处理模块401,用于对第一缓存区中的历史笔画进行淡化处理;
书写显示模块402,用于在书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。
在具体应用时,所述淡化处理模块401可以有多种实现方式。
比如,淡化处理模块401可以按照第一缓存区中各笔画的生成时间先后顺序对所述历史笔画进行匀速的渐进淡化。
再比如,淡化处理模块401还可以按照以下方式对第一缓存区中的历史笔画进行淡化处理:
如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失;
如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显示;
如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示。
本发明实施例的系统可以应用于小型触摸屏设备,满足用户连续手写识别输入的需求,在有限的书写区内进行叠加输入,通过对历史笔画的淡化处理,可以使用户清晰地区分历史笔迹和当前输入的笔画,将用户输入的内容清楚地展现给用户,提高用户的书写体验。
本发明实施例实现连续手写识别输入的方法及系统,至少可以适用于以下两种情形:
1)智能设备安装有触摸板(一般为设备的外围设施,例如手写板等),用户在触摸板上的固定区域反复书写;
2)智能设备安装有触摸屏(通常为系统集成的设备),但用户可以在触摸屏的某个固定区域反复书写。
下面通过举例进一步详细说明本发明实施例。
假设用户在触摸屏设备上连续输入“大人”两个汉字,即图5所示的自左向右的笔画,则利用本发明实施例,输入笔迹在屏幕书写区的显示如图6所示。
下面对图5到图6的过程进行详细说明,主要包括:
1.当用户从左至右输入第一笔时,由于是第一笔,所以断点分析模块判断其与历史笔画隶属于同一字符,淡化处理模块设定其为正常显示。
2.当用户输入第二笔时,断点分析模块确定第二笔和第一笔的隶属关系。确定第二笔和第一笔隶属于同一个字符,因此淡化处理模块将第二笔也设定为正常显示。
3.当用户输入第三笔时,断点分析模块确定第三笔和前二笔的隶属关系,并判断为模糊状态情况,这时将前面输入过的笔迹淡化显示,如图6所示。
4.当用户输入第四笔时,断点分析模块确定第三笔和第四笔分别属于两个字符,因此将第一笔到第三笔从屏幕中清除或以水印方式显示。图6中给出了以水印方式显示的例子。
5.当用户输入第五笔时,断点分析模块判断第四笔和第五笔隶属于同一字符,因此笔迹正常显示。
在上述过程中,如果抬笔时间过长,如超过0.5秒,则认为接下来要写的笔画和已经输入的笔画分别属于不同的字符。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的模块及单元可以是或者也可以不是物理上分开的,比如,可以将系统中的数据采集模块部署在设备的前端,而将系统中的其他模块部署在设备的后端,使其同步运行,实现连续手写识别输入。另外,还可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
Claims (8)
1.一种实现连续手写识别输入的方法,其特征在于,包括:
跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;
确定新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置;
如果所述起点位置与所述终点位置的距离大于第一距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;
如果所述起点位置与所述终点位置的距离小于第二距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;
如果所述起点位置与所述终点位置的距离大于等于第二距离阈值、并且小于等于第一距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态;
如果所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系,或者根据新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系;
如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;
否则,将新输入笔画存储到第一缓存区;
对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;
显示识别得到的完整字符。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
对第一缓存区中的历史笔画进行淡化处理;
在书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。
3.如权利要求2所述的方法,其特征在于,所述对第一缓存区中的历史笔画进行淡化处理包括:
按照第一缓存区中各笔画的生成时间先后顺序对所述历史笔画进行匀速的渐进淡化。
4.如权利要求2所述的方法,其特征在于,所述对第一缓存区中的历史笔画进行淡化处理包括:
如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失;
如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显示;
如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示。
5.一种实现连续手写识别输入的系统,其特征在于,包括:
数据采集模块,用于跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;
位置确定单元,用于确定新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置;
计算单元,用于计算所述起点位置与所述终点位置的距离;
第一判断单元,用于根据所述计算单元的计算结果,在所述起点位置与所述终点位置的距离大于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;在所述起点位置与所述终点位置的距离小于第二距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;在所述起点位置与所述终点位置的距离大于等于第二距离阈值、并且小于等于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态;
第二判断单元,用于在所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态时,根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系,或者根据新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系;
笔画整理模块,用于在确定新输入笔画与第一缓存区存储的历史笔画隶属于不同字符时,清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;并在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于同一字符时,将新输入笔画存储到第一缓存区;
字符识别模块,用于对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;
字符显示模块,用于显示所述字符识别模块识别得到的完整字符。
6.如权利要求5所述的系统,其特征在于,所述系统还包括:
淡化处理模块,用于对第一缓存区中的历史笔画进行淡化处理;
书写显示模块,用于在书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。
7.如权利要求6所述的系统,其特征在于,
所述淡化处理模块,具体用于按照第一缓存区中各笔画的生成时间先后顺序对所述历史笔画进行匀速的渐进淡化。
8.如权利要求6所述的系统,其特征在于,
所述淡化处理模块,具体用于按照以下方式对第一缓存区中的历史笔画进行淡化处理:
如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失;
如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显示;
如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110076004 CN102156577B (zh) | 2011-03-28 | 2011-03-28 | 实现连续手写识别输入的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110076004 CN102156577B (zh) | 2011-03-28 | 2011-03-28 | 实现连续手写识别输入的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102156577A CN102156577A (zh) | 2011-08-17 |
CN102156577B true CN102156577B (zh) | 2013-05-29 |
Family
ID=44438094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110076004 Active CN102156577B (zh) | 2011-03-28 | 2011-03-28 | 实现连续手写识别输入的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102156577B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102508598B (zh) * | 2011-10-09 | 2014-03-05 | 北京捷通华声语音技术有限公司 | 一种字符笔画渐变消隐方法及装置 |
CN102521577A (zh) * | 2011-12-20 | 2012-06-27 | 安徽科大讯飞信息科技股份有限公司 | 一种交互式多媒体设备的笔迹识别、合成和跟踪方法 |
JP5349645B1 (ja) * | 2012-05-11 | 2013-11-20 | 株式会社東芝 | 電子機器および手書き文書処理方法 |
CN105095924A (zh) * | 2014-04-25 | 2015-11-25 | 夏普株式会社 | 手写识别方法和设备 |
US10013603B2 (en) * | 2016-01-20 | 2018-07-03 | Myscript | System and method for recognizing multiple object structure |
CN107219935B (zh) * | 2017-05-25 | 2021-03-02 | 哈尔滨工业大学 | 一种面向连续书写汉字的、支持交互的汉字输入系统及方法 |
JP7298290B2 (ja) | 2018-06-19 | 2023-06-27 | 株式会社リコー | 手書き入力表示装置、手書き入力表示方法およびプログラム |
CN109358799B (zh) * | 2018-09-11 | 2021-06-15 | 北京思骏教育科技有限公司 | 在手写设备上添加用户输入的手写批注信息的方法 |
CN109858323A (zh) * | 2018-12-07 | 2019-06-07 | 广州光大教育软件科技股份有限公司 | 一种字符手写识别方法及系统 |
CN113168254A (zh) * | 2018-12-25 | 2021-07-23 | 深圳市柔宇科技股份有限公司 | 续笔方法与显示终端 |
CN111931710B (zh) * | 2020-09-17 | 2021-03-30 | 开立生物医疗科技(武汉)有限公司 | 一种联机手写文字识别方法、装置、电子设备及存储介质 |
CN112668434A (zh) * | 2020-12-23 | 2021-04-16 | 贵州树精英教育科技有限责任公司 | 一种智能笔书写数据采集方法 |
CN112633243B (zh) * | 2020-12-31 | 2023-01-03 | 安徽鸿程光电有限公司 | 信息识别方法、装置、设备及计算机存储介质 |
WO2024021078A1 (zh) * | 2022-07-29 | 2024-02-01 | 京东方科技集团股份有限公司 | 一种图文交互的方法及显示设备 |
CN118411729B (zh) * | 2024-07-02 | 2024-09-06 | 山东声通信息科技有限公司 | 一种图片中文字抽取识别处理方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101561725A (zh) * | 2008-04-16 | 2009-10-21 | 汉王科技股份有限公司 | 一种手写快速输入的方法和系统 |
CN101964048A (zh) * | 2010-07-19 | 2011-02-02 | 安徽科大讯飞信息科技股份有限公司 | 一种字符识别方法及系统 |
-
2011
- 2011-03-28 CN CN 201110076004 patent/CN102156577B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101561725A (zh) * | 2008-04-16 | 2009-10-21 | 汉王科技股份有限公司 | 一种手写快速输入的方法和系统 |
CN101964048A (zh) * | 2010-07-19 | 2011-02-02 | 安徽科大讯飞信息科技股份有限公司 | 一种字符识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102156577A (zh) | 2011-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102156577B (zh) | 实现连续手写识别输入的方法及系统 | |
CN102135836B (zh) | 叠加手写输入的方法及系统 | |
US11481656B2 (en) | Method and apparatus for evaluating a matching degree of multi-domain information based on artificial intelligence, device and medium | |
CN104008363B (zh) | 手写轨迹的检测、规范化和在线识别以及异常字根的收集 | |
CN100535928C (zh) | 检测墨水输入中的手绘对象的系统和方法 | |
CN102141892A (zh) | 叠加手写输入显示方法及系统 | |
CN103765440A (zh) | 使用背景信息的移动装置上的光学字符辨识 | |
JPS6079485A (ja) | 手書き文字認識処理装置 | |
CN101308503A (zh) | 图像处理设备、图像处理方法和图像检索方法 | |
KR20110016994A (ko) | 사용자 인터페이스 제어를 위한 카메라 제스처들 | |
CN103390013A (zh) | 电子装置和手写文档处理方法 | |
CN102663454B (zh) | 一种字符书写规范度评测的方法和装置 | |
CN104063167B (zh) | 曲线图显示装置以及曲线图显示方法 | |
CN107194213A (zh) | 一种身份识别方法及装置 | |
CN113673432A (zh) | 手写识别方法、触摸显示设备、计算机设备及存储介质 | |
CN104123608A (zh) | 一种建立记账记录的方法与装置 | |
CN106356077A (zh) | 一种笑声检测方法及装置 | |
CN103390011A (zh) | 电子装置和手写文档检索方法 | |
KR101927064B1 (ko) | 전자책 또는 전자노트에 대한 요약 데이터 생성 장치 및 방법 | |
CN112132033A (zh) | 车型识别方法、装置、电子设备及存储介质 | |
US6421461B1 (en) | Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor | |
CN114037998A (zh) | 一种使用模型分析笔迹提升账户安全的方法及装置 | |
CN1195151A (zh) | 汉字书法练习装置 | |
CN103176651A (zh) | 一种手写信息快速采集方法 | |
CN107807917A (zh) | 文本内容提取方法、装置、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee |
Owner name: IFLYTEK CO., LTD. Free format text: FORMER NAME: ANHUI USTC IFLYTEK CO., LTD. |
|
CP03 | Change of name, title or address |
Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Patentee after: Iflytek Co., Ltd. Address before: 230088 No. 616, Mount Huangshan Road, hi tech Development Zone, Anhui, Hefei Patentee before: Anhui USTC iFLYTEK Co., Ltd. |