CN106033316A - 一种手写输入的方法和装置 - Google Patents
一种手写输入的方法和装置 Download PDFInfo
- Publication number
- CN106033316A CN106033316A CN201510112581.2A CN201510112581A CN106033316A CN 106033316 A CN106033316 A CN 106033316A CN 201510112581 A CN201510112581 A CN 201510112581A CN 106033316 A CN106033316 A CN 106033316A
- Authority
- CN
- China
- Prior art keywords
- tracing point
- phonetic
- information
- submodule
- tone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明实施例提供了一种手写输入的方法和装置,该方法包括:检测滑行轨迹中的多个轨迹点;对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;查找与所述一个或多个拼音匹配的一个或多个候选信息。一方面,可以解决由于只会读但是不会写导致无法输入候选信息的问题,另一方面,由于拼音比结构复杂的候选信息的识别准确率高,提高了输入结构复杂的候选信息的输入效率。
Description
技术领域
本发明涉及输入法技术领域,特别是涉及一种手写输入的方法和一种手写输入的装置。
背景技术
随着用户对电子产品移动性能和便携性能的要求,目前电子产品呈小型化发展趋势。
而电子产品的多媒体功能又要求其具有较好的输入输出性,如现在使用的便携式掌上电脑、个人数字助理、智能手机等电子设备,很多都采用触摸屏输入。
用户在应用触摸屏时广泛使用手写输入,以提高输入速度。
目前的手写输入方式,一般是通过手写汉字,手写输入应用把手写的各种汉字转换为电子产品可识别的标准字体显示在屏幕上。
在无法记清楚需要输入的汉字的笔画时,用户往往无法通过手写汉字的输入方式输入汉字。
在需要输入的汉字的结构较为复杂时,如“龍”,在手写汉字时,很多笔画将会交错在一起,使得手写输入应用识别准确率低,用户需要多次输入才可以输入,甚至无法输入,这种情况在小型化的电子产品尤为明显。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种手写输入的方法和相应的一种手写输入的装置。
为了解决上述问题,本发明实施例公开了一种手写输入的方法,包括:
检测滑行轨迹中的多个轨迹点;
对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;
查找与所述一个或多个拼音匹配的一个或多个候选信息。
优选地,所述一个或多个拼音包括一个或多个音节;
所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤包括:
对所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段;所述一个或多个第一轨迹点片段具有一个或多个第一特征信息;
分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配;每个第一样本特征信息关联拼音字母;
至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节。
优选地,所述将所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段的步骤包括:
将所述多个轨迹点投影至水平轴上,以获得水平投影;
确定所述水平投影中的一个或多个第一切分位置;所述第一切分位置为水平轴上,超过预设的第一距离的空白位置;
在垂直方向上,按照所述一个或多个第一切分位置对所述多个轨迹点进行切分,获得一个或多个第一轨迹点片段。
优选地,所述第一特征信息为所述第一轨迹点片段在水平轴上的第一投影密度信息,所述第一样本特征信息为拼音字母在水平轴上的第二投影密度信息;
所述分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配的步骤包括:
针对每个第一投影密度信息,计算至少部分的第一投影密度信息与一个或多个第二投影密度信息的第一匹配度;
当所述第一匹配度大于预设的第一匹配度阈值时,确定所述第一投影密度信息所述第二投影密度信息匹配成功。
优选地,所述一个或多个拼音还包括一个或多个声调;
所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
在所述第一轨迹点片段中确定与第一样本特征信息匹配的一个或多个拼音字母轨迹点;
对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段;所述一个或多个第二轨迹点片段具有一个或多个第二特征信息;
分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配;每个第二样本特征信息关联拼音字母;
将匹配成功之外的,至少部分的第二轨迹点片段与预设的声调轨迹进行匹配;所述声调轨迹具有关联的声调;
当与所述声调轨迹匹配成功时,提取所述声调轨迹关联的声调。
优选地,所述对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段的步骤包括:
将所述一个或多个拼音字母轨迹点投影至垂直轴上,以获得垂直投影;
确定所述垂直投影中的一个或多个第二切分位置;所述第二切分位置为垂直轴上,超过预设的第二距离的空白位置;
在水平方向上,按照所述一个或多个第二切分位置对所述一个或多个拼音字母轨迹点进行切分,获得一个或多个第二轨迹点片段。
优选地,所述第二特征信息为所述第二轨迹点片段在垂直轴上的第三投影密度信息,所述第二样本特征信息为拼音字母在垂直轴上的第四投影密度信息;
所述分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配的步骤包括:
针对每个第三投影密度信息,计算至少部分的第三投影密度信息与一个或多个第四投影密度信息的第二匹配度;
当所述第二匹配度大于预设的第二匹配度阈值时,确定所述第三投影密度信息所述第四投影密度信息匹配成功。
优选地,所述至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节的步骤包括:
将匹配成功的,每个第一轨迹点片段对应的一个或多个拼音字母,以及,每个第二轨迹点片段对应的一个或多个拼音字母,组合成一个或多个音节。
优选地,所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
对所述多个轨迹点进行预处理;
其中,所述预处理包括以下至少一种:
去噪处理、归一处理。
优选地所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
采用识别出的一个或多个拼音与预设的拼音样本进行匹配;所述拼音包括拼音字母与声调中的至少一者;
过滤匹配失败的拼音。
优选地,所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
采用每个拼音字母的第一匹配度和/或第二匹配度,计算识别出的一个或多个拼音的整体匹配度;
按照所述整体匹配度对识别出的一个或多个拼音进行排序。
优选地,所述候选信息包括第一候选信息,或者,第二候选信息;
所述查找与所述一个或多个拼音匹配的一个或多个候选信息的步骤包括:
查找与一个或多个音节匹配的一个或多个第一候选信息;
或者,
查找与一个或多个音节匹配的一个或多个第一候选信息;
在所述一个或多个第一候选信息中查找与声调匹配的第二候选信息。
优选地,所述查找与所述一个或多个拼音匹配的一个或多个候选信息的步骤还包括:
对查找出的一个或多个候选信息进行排序。
优选地,该方法还包括:
显示所述一个或多个拼音以及所述一个或多个候选信息。
本发明实施例还公开了一种手写输入的装置,包括:
轨迹点检测模块,用于检测滑行轨迹中的多个轨迹点;
拼音识别模块,用于对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;
候选信息查找模块,用于查找与所述一个或多个拼音匹配的一个或多个候选信息。
优选地,所述一个或多个拼音包括一个或多个音节;所述拼音识别模块包括:
第一切分子模块,用于对所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段;所述一个或多个第一轨迹点片段具有一个或多个第一特征信息;
第一样本匹配子模块,用于分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配;每个第一样本特征信息关联拼音字母;
音节组合子模块,用于至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节。
优选地,所述第一切分子模块包括:
水平投影子模块,用于将所述多个轨迹点投影至水平轴上,以获得水平投影;
第一切分位置确定子模块,用于确定所述水平投影中的一个或多个第一切分位置;所述第一切分位置为水平轴上,超过预设的第一距离的空白位置;
垂直切分子模块,用于在垂直方向上,按照所述一个或多个第一切分位置对所述多个轨迹点进行切分,获得一个或多个第一轨迹点片段。
优选地,所述第一特征信息为所述第一轨迹点片段在水平轴上的第一投影密度信息,所述第一样本特征信息为拼音字母在水平轴上的第二投影密度信息;
所述第一样本匹配子模块包括:
第一匹配度计算子模块,用于针对每个第一投影密度信息,计算至少部分的第一投影密度信息与一个或多个第二投影密度信息的第一匹配度;
第一匹配成功确定子模块,用于在所述第一匹配度大于预设的第一匹配度阈值时,确定所述第一投影密度信息所述第二投影密度信息匹配成功。
优选地,所述一个或多个拼音还包括一个或多个声调;
所述拼音识别模块还包括:
拼音字母轨迹点确定子模块,用于在所述第一轨迹点片段中确定与第一样本特征信息匹配的一个或多个拼音字母轨迹点;
第二切分子模块,用于对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段;所述一个或多个第二轨迹点片段具有一个或多个第二特征信息;
第二样本匹配子模块,用于分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配;每个第二样本特征信息关联拼音字母;
声调轨迹匹配子模块,用于将匹配成功之外的,至少部分的第二轨迹点片段与预设的声调轨迹进行匹配;所述声调轨迹具有关联的声调;
声调提取子模块,用于在与所述声调轨迹匹配成功时,提取所述声调轨迹关联的声调。
优选地,所述第二切分子模块包括:
垂直投影子模块,用于将所述一个或多个拼音字母轨迹点投影至垂直轴上,以获得垂直投影;
第二切分位置确定子模块,用于确定所述垂直投影中的一个或多个第二切分位置;所述第二切分位置为垂直轴上,超过预设的第二距离的空白位置;
水平切分子模块,用于在水平方向上,按照所述一个或多个第二切分位置对所述一个或多个拼音字母轨迹点进行切分,获得一个或多个第二轨迹点片段。
优选地,所述第二特征信息为所述第二轨迹点片段在垂直轴上的第三投影密度信息,所述第二样本特征信息为拼音字母在垂直轴上的第四投影密度信息;
所述第二样本匹配子模块包括:
第二匹配度计算子模块,用于针对每个第三投影密度信息,计算至少部分的第三投影密度信息与一个或多个第四投影密度信息的第二匹配度;
第二匹配成功确定子模块,用于在所述第二匹配度大于预设的第二匹配度阈值时,确定所述第三投影密度信息所述第四投影密度信息匹配成功。
优选地,所述音节组合子模块包括:
双拼音字母组合子模块,用于将匹配成功的,每个第一轨迹点片段对应的一个或多个拼音字母,以及,每个第二轨迹点片段对应的一个或多个拼音字母,组合成一个或多个音节。
优选地,所述拼音识别模块还包括:
预处理子模块,用于对所述多个轨迹点进行预处理;
其中,所述预处理包括以下至少一种:
去噪处理、归一处理。
优选地,所述拼音识别模块还包括:
拼音样本匹配子模块,用于采用识别出的一个或多个拼音与预设的拼音样本进行匹配;所述拼音包括拼音字母与声调中的至少一者;
过滤子模块,用于过滤匹配失败的拼音。
优选地,所述拼音识别模块还包括:
整体匹配度计算子模块,用于采用每个拼音字母的第一匹配度和/或第二匹配度,计算识别出的一个或多个拼音的整体匹配度;
第一排序子模块,用于按照所述整体匹配度对识别出的一个或多个拼音进行排序。
优选地,所述候选信息包括第一候选信息,或者,第二候选信息;
所述候选信息查找模块包括:
第一查找子模块,用于查找与一个或多个音节匹配的一个或多个第一候选信息;
或者,
第一查找子模块,用于查找与一个或多个音节匹配的一个或多个第一候选信息;
第二查找子模块,用于在所述一个或多个第一候选信息中查找与声调匹配的第二候选信息。
优选地,所述候选信息查找模块还包括:
第二排序子模块,用于对查找出的一个或多个候选信息进行排序。
优选地,该装置还包括:
显示模块,用于显示所述一个或多个拼音以及所述一个或多个候选信息。
本发明实施例包括以下优点:
本发明实施例对检测到的滑行轨迹中的多个轨迹点进行轨迹识别,查找与识别出的拼音匹配的一个或多个候选信息,实现了手写拼音输入,一方面,可以解决由于只会读但是不会写导致无法输入候选信息的问题,另一方面,由于拼音比结构复杂的候选信息的识别准确率高,提高了输入结构复杂的候选信息的输入效率。
本发明实施例通过水平切分和垂直切分,从水平和垂直的角度进行识别,进一步提高识别拼音字母的准确率。
本发明实施例对拼音进行排序,对查找出的候选信息进行排序,从不同的维度提高合理的候选信息的展示优先度,减少翻页查找等操作的几率,进一步提高了输入的效率。
附图说明
图1是本发明的一种手写输入的方法实施例的步骤流程图;
图2是本发明的一种轨迹点的示例图;
图3是本发明的一种轨迹点的垂直切分的示例图;
图4是本发明的一种轨迹点的水平投影密度的示例图;
图5是本发明的一种轨迹点的识别示例图;
图6是本发明的一种轨迹点的水平切分的示例图;
图7是本发明的一种轨迹点的垂直投影密度的示例图;
图8是本发明的一种轨迹点的轨迹方位的示例图;
图9是本发明的一种手写输入的装置实施例的结构框图
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种手写输入的方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,检测滑行轨迹中的多个轨迹点;
需要说明的是,本发明实施例可以应用于具有触摸装置的电子设备中。
该触摸装置可以包括矢量压力传感技术触摸装置、电阻技术触摸装置、电容技术触摸装置、红外线技术触摸装置、表面声波技术触摸装置等等,本发明实施例对此不加以限制。
该电子设备可以包括手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑、个人电脑等等,本发明实施例对此也不加以限制。
在一种情况中,触摸装置可以是电子设备本身固有的部件,例如,手机、平板等电子设备中的触摸屏。
在另一种情况中,触摸装置可以是从外部接入电子设备的部件,例如,在个人电脑中通过USB(Universal Serial Bus,通用串行总线)接口接入的手写板。
这些电子设备可以支持包括Windows、Android(安卓)、IOS、WindowsPhone等操作系统,通常可以运行通过手写输入等方式进行文本信息输入的应用程序,例如,输入法程序等等。
手写输入,可以是用户通过手部在触摸装置上进行滑动操作,产生滑行轨迹,也可以是用户通过手写笔等输入部件在触摸装置上进行滑动操作,产生滑行轨迹,本发明实施例对此不加以限制。
通常,触摸装置可以检测滑动操作触发的触摸信号(例如触摸事件),例如,按下事件(Down)、移动事件(Move)、抬起事件(Up)。
其中,按下事件(Down)可以表示在触摸装置按下未移动、未抬起,移动事件(Move)可以表示在触摸装置按下后开始移动(或滑行),抬起事件(Up)可以表示在触摸装置抬起。
触摸装置可以将该触摸信号转换成轨迹点坐标(例如直角坐标系,即X坐标和Y坐标),每个轨迹点可以包含时间信息,以表征轨迹点的滑行顺序,多个轨迹点识别可以表征滑行轨迹。
步骤102,对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;
应用本发明实施例中,用户可以通过手写输入拼音的方式输入文本信息,滑动操作触发的多个轨迹点可以表征拼音,则本发明实施例可以对该轨迹点进行轨迹识别,以识别出一个或多个拼音。
其中,拼音主要用于汉语普通话读音的标注,作为汉字的一种普通话音标。
拼音通常由音节,或者,音节与声调组成。每个音节可以由一个或多个拼音字母组成,如,Aɑ、Bb、Cc、Dd、Ee、Ff、Gɡ、Hh、Ii、Jj、Kk、Ll、Mm、Nn、Oo、Pp、Qq、Rr、Ss、Tt、Uu、Vv、Ww、Xx、Yy、Zz(V一般用来拼写外来语、少数民族语言和方言)。
例如,若用户想输入“好”,则可以通过滑动操作,输入“好”的拼音“hǎo”或者“hao”,其中,该拼音“hǎo”的轨迹点200的示例如图2所示。
在本发明的一种优选实施例中,步骤102可以包括如下子步骤:
子步骤S11,对所述多个轨迹点进行预处理;
在实际应用中,对输入的轨迹点进行特征抽取、切分和匹配前所进行的处理,可以成为预处理。
预处理的目的之一,可以是消除轨迹点中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、轨迹点切分、匹配和识别的可靠性。
其中,所述预处理可以包括但不限于以下至少一种:
去噪处理、归一处理。
去噪处理可以指去除轨迹点中的噪点,一般可以通过平滑消除中轨迹点中的噪点。常用的平滑方法包括中值法、局部求平均法和近邻平均法等等。
归一处理可以使轨迹点的某些特征在给定变换下具有不变性质。轨迹点的某些性质,例如面积和周长,本来对于坐标旋转来说就具有不变的性质。
在一般情况下,某些因素或变换对轨迹点一些性质的影响可通过归一化处理得到消除或减弱,从而可以被选作测量轨迹点的依据。灰度归一化、几何归一化和变换归一化是获取轨迹点不变性质的常用的三种归一化方式。
当然,上述预处理只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他预处理,例如,数字化、几何变换等等,本发明实施例对此不加以限制。另外,除了上述预处理外,本领域技术人员还可以根据实际需要采用其它预处理,本发明实施例对此也不加以限制。
在本发明的一种优选实施例中,所述一个或多个拼音可以包括一个或多个音节,一个拼音至少可以包括一个音节,则该拼音可以查找出对应的文本信息。
在实际应用中,把声母、韵母拼合,或者,把一个或韵母拼合,可以组成音节,例如,“chang”、“ai”、“o”等等。
则在本发明实施例中,步骤102可以包括如下子步骤:
子步骤S21,对所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段;
在实际应用中,一个音节通常由多个拼音字母组成,拼音字母通常是垂直书写的,则本发明实施例可以对多个轨迹点进行垂直切分,获得一个或多个第一轨迹点片段,以方便后续的拼音字母识别。
在本发明的一种优选实施例中,子步骤S21可以包括如下子步骤:
子步骤S211,将所述多个轨迹点投影至水平轴上,以获得水平投影;
子步骤S212,确定所述水平投影中的一个或多个第一切分位置;
子步骤S213,在垂直方向上,按照所述一个或多个第一切分位置对所述多个轨迹点进行切分,获得一个或多个第一轨迹点片段。
基于某些用户的手写输入习惯,在手写输入时,通常在手写一个拼音字母后,再手写另一个拼音字母,因此,拼音字母之间存在断点,可以根据该断点进行切分,切分后的第一轨迹点片段实质也可以是轨迹点。
基于某些用户的手写输入习惯,在手写输入时,习惯将拼音字母连起来写,使得切分后的第一轨迹点片段可能表征单独的拼音字母,也可能表征多个拼音字母的组合。
在本发明实施例中,可以将轨迹点投影至水平轴上,即统计轨迹点在水平轴的坐标。
通过在水平轴上的水平投影,可以寻找到滑行轨迹的断点(即第一切分位置),第一切分位置可以为水平轴上,超过预设的第一距离的空白位置。
例如,如图3所示,将拼音“hǎo”的轨迹点200投影至水平轴上,获得水平投影301和水平投影303,在水平投影301和水平投影303之间存在空白位置302,若其距离超过了第一距离,则可以判断该空白位置302为断点(即第一切分位置),在垂直方向304上对拼音“hǎo”的轨迹点200进行切分,获得表征“h”的第一轨迹点片段201和表征“ǎo”的第一轨迹点片段202。
在实际应用中,所述一个或多个第一轨迹点片段可以具有一个或多个第一特征信息,即每个第一轨迹点片段可以具有至少一个第一特征信息;
其中,第一特征信息可以为表征第一轨迹点片段的特征的信息。
子步骤S22,分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配;
应用本发明实施例,可以选择标准的拼音字母作为匹配的样本,预先提取可以标识该拼音字母的特征的信息(即第一样本特征信息),建立第一样本特征信息与拼音字母的关联关系,即每个第一样本特征信息可以关联拼音字母。
在实际应用中,可以采用第一轨迹点片段的第一特征信息与每个第一样本特征信息进行匹配,当匹配成功时,可以认为该第一轨迹点片段表征该第一样本特征信息关联的拼音字母。
在本发明的一种优选实施例中,所述第一特征信息可以为所述第一轨迹点片段在水平轴上的第一投影密度信息,所述第一样本特征信息可以为拼音字母在水平轴上的第二投影密度信息;
其中,第一投影密度信息可以表征第一轨迹点片段在水平轴上的投影的密集程度,第二投影密码信息可以表征拼音字母(样本)的轨迹点在水平轴上的投影的密集程度。
则在本发明实施例中,子步骤S22可以包括如下子步骤:
子步骤S221,针对每个第一投影密度信息,计算至少部分的第一投影密度信息与一个或多个第二投影密度信息的第一匹配度;
子步骤S222,当所述第一匹配度大于预设的第一匹配度阈值时,确定所述第一投影密度信息所述第二投影密度信息匹配成功。
每个拼音字母的结构存在或大或小的差异,即每个拼音字母的结构基本是唯一的。
拼音字母在水平轴上的投影密度可以在一定程度反映出拼音字母的结构,可以用于拼音字母的识别。
计算第一投影密度信息与第二投影密度信息的第一匹配度,可以是指计算水平投影的投影密度之间的差异,若差异在一定范围(即第一匹配度阈值)内,则可以认为匹配成功,否则,可以认为匹配失败。
例如,如图4所示,对于表征“h”的第一轨迹点片段201,其第一投影密度信息可以表示为,在水平投影301中,水平投影3011的投影密度最大,大概为水平投影3013的投影密度的三倍,水平投影3012的投影密度最小,水平投影3011和水平投影3013的区域相近,水平投影3012的区域最大。
若判断第一投影密度信息与作为样本的拼音字母“h”的第二投影密度信息匹配,则可以认为第一轨迹点片段201为拼音字母“h”。
由于每个用户手写习惯不同,若“h”左侧的“丨”的长度不够,第一轨迹点片段201的第一投影密度信息可能表示为,在水平投影301中,水平投影3011的投影密度为水平投影3013的投影密度的两倍,水平投影3012的投影密度较小,水平投影3011和水平投影3013的区域相近,水平投影3012的区域最大,则第一轨迹点片段201可能识别为拼音字母“n”。
同样地,表征拼音字母和声调的“ǎ”的第一轨迹点片段202可能识别为拼音字母“a”或“o”。
需要说明的是,在计算第一投影密度信息与第二投影密度信息的第一匹配度时,可以自端点(初始为第一轨迹点片段的两个端点)依次增加第一轨迹点片段的区域,即依次自端点增加第一投影密度信息的数据量,在匹配失败时,增加第一轨迹点片段的区域重新计算第一匹配度,在匹配成功时,以匹配成功的点为新的端点继续计算第一匹配度直至遍历完第一轨迹点片段。
例如,如图4所示,在计算第一轨迹点片段201的第一投影密度信息与第二投影密度信息的第一匹配度时,可以先计算水平投影3011的第一投影密度信息与第二投影密度信息的第一匹配度;在匹配失败时,继续计算水平投影3011和水平投影3012的第一投影密度信息与第二投影密度信息的第一匹配度;在匹配失败时,继续计算水平投影3011、水平投影3012和水平投影3013的第一投影密度信息与第二投影密度信息的第一匹配度。
又例如,如图3所示,在计算第一轨迹点片段202的第一投影密度信息与第二投影密度信息的第一匹配度时,可以先识别成功拼音字母“a”,再识别出拼音字母“0”,也可以先识别成功拼音字母“0”,再识别出拼音字母“a”。
子步骤S23,至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节。
在本发明实施例中,可以至少由第一轨迹点片段对应的拼音字母组成音节,由于第一轨迹点片段可以识别出一个或多个拼音字母,因此,可以组成一个或多个音节。
在本发明的一种优选实施例中,所述一个或多个拼音还可以包括一个或多个声调;
在实际应用中,汉语拼音中一般四个声调:
第一声,(阴平,或平调,“ˉ”);
第二声,(阳平,或升调,“ˊ”);
第三声,(上声,或上音,“ˇ”);
第四声,(去声,或去音,“ˋ”)。
则在本发明实施例中,步骤102还可以包括如下子步骤:
子步骤S31,在所述第一轨迹点片段中确定与第一样本特征信息匹配的一个或多个拼音字母轨迹点;
在与第一样本特征信息匹配之后,可以识别出第一轨迹点片段可能表征的单独的拼音字母,也可能表征的多个拼音字母的组合,从而确定拼音字母轨迹点。
大多数情况下,该拼音字母轨迹点一般表征一个单独的拼音字母。而由于声调一般是写在拼音字母之上,拼音字母轨迹点也有可能表征一个单独的拼音字母与声调。
需要说明的是,拼音字母轨迹点的实质可以是轨迹点。
例如,如图5所示,对于第一轨迹点片段202,可以确定表征拼音字母“a”与声调“ˇ”(即“ǎ”)的拼音字母轨迹点2021,表征拼音字母“0”,的拼音字母轨迹点2022。
子步骤S32,对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段;
在实际应用中,一个拼音通常包括一个声调,声调通常是与音节是平行的,则本发明实施例可以对拼音字母轨迹点进行水平切分,获得一个或多个第二轨迹点片段,以方便后续的拼音字母识别和声调识别。
在本发明的一种优选实施中,子步骤S32可以包括如下子步骤:
子步骤S321,将所述一个或多个拼音字母轨迹点投影至垂直轴上,以获得垂直投影;
子步骤S322,确定所述垂直投影中的一个或多个第二切分位置;
子步骤S323,在水平方向上,按照所述一个或多个第二切分位置对所述一个或多个拼音字母轨迹点进行切分,获得一个或多个第二轨迹点片段。
基于某些用户的手写输入习惯,在手写输入时,通常在手写一个音节后,再在上方手写声调,因此,音节中的某个拼音字母与声调之间存在断点,可以根据该断点进行切分,切分后的第二轨迹点片段实质也可以是轨迹点。
基于某些用户的手写输入习惯,在手写输入声调时,可能与拼音字母接连起来写,使得切分后的第二轨迹点片段可能表征单独的拼音字母,也可能表征拼音字母与声调的组合。
一般情况下,切分后位于上部的第二轨迹点片段一般是声调,切分后位于下部的第二轨迹点片段一般是拼音字母。
但是,“i”、“j”、“ü”等拼音字母本身也是分开的结构,因此,切分后位于上部的第二轨迹点片段也可能是拼音字母。
在本发明实施例中,可以将轨迹点投影至垂直轴上,即统计轨迹点在垂直轴的坐标。
通过在垂直轴上的垂直投影,可以寻找到滑行轨迹的断点(即第二切分位置),第二切分位置可以为垂直轴上,超过预设的第二距离的空白位置。
例如,如图6所示,将拼音字母与声调“ǎ”的拼音字母轨迹点2021投影至垂直轴上,获得垂直投影601和垂直投影603,在垂直投影601和垂直投影603之间存在空白位置602,若其距离超过了第二距离,则可以判断该空白位置602为断点(即第二切分位置),在水平方向604上对拼音字母与声调“ǎ”的拼音字母轨迹点2021进行切分,获得表征声调“ˇ”的第二轨迹点片段605和表征拼音字母“a”的第二轨迹点片段606。
在实际应用中,所述一个或多个第二轨迹点片段可以具有一个或多个第二特征信息,即每个第二轨迹点片段可以具有至少一个第二特征信息;
其中,第二特征信息可以为表征第二轨迹点片段的特征的信息。
子步骤S33,分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配;
应用本发明实施例,可以选择标准的拼音字母作为匹配的样本,预先提取可以标识该拼音字母的特征的信息(即第二样本特征信息),建立第二样本特征信息与拼音字母的关联关系,即每个第二样本特征信息可以关联拼音字母。
在本发明的一种优选实施例中,所述第二特征信息可以为所述第二轨迹点片段在垂直轴上的第三投影密度信息,所述第二样本特征信息可以为拼音字母在垂直轴上的第四投影密度信息;
其中,第三投影密度信息可以表征第二轨迹点片段在垂直轴上的投影的密集程度,第四投影密码信息可以表征拼音字母(样本)的轨迹点在垂直轴上的投影的密集程度。
则在本发明实施例中,子步骤S33可以包括如下子步骤:
子步骤S331,针对每个第三投影密度信息,计算至少部分的第三投影密度信息与一个或多个第四投影密度信息的第二匹配度;
子步骤S332,当所述第二匹配度大于预设的第二匹配度阈值时,确定所述第三投影密度信息所述第四投影密度信息匹配成功。
同样地,拼音字母在垂直轴上的投影密度也可以在一定程度反映出拼音字母的结构,也可以用于拼音字母的识别。
计算第三投影密度信息与第四投影密度信息的第二匹配度,可以是指计算垂直投影的投影密度之间的差异,若差异在一定范围(即第二匹配度阈值)内,则可以认为匹配成功,否则,可以认为匹配失败。
例如,如图7所示,对于表征“a”的第二轨迹点片段606,其第二投影密度信息可以表示为,在垂直投影603中,垂直投影6033的投影密度最大,垂直投影6032的投影密度次之,垂直投影6031的投影密度最小,垂直投影6031和垂直投影6033的区域相近,垂直投影6032的区域最大。
若判断第一投影密度信息与作为样本的拼音字母“a”的第二投影密度信息匹配,则可以认为第二轨迹点片段606为拼音字母“a”。
由于每个用户手写习惯不同,若“a”尾部的长度不够,第二轨迹点片段606的第二投影密度信息可能表示为,在垂直投影603中,垂直投影6033的投影密度和垂直投影6032的投影密度相当,为垂直投影6031的投影密度的两倍,垂直投影6032和垂直投影6033的区域占垂直投影603区域的大部分,则第二轨迹点片段606可能识别为拼音字母“u”。
需要说明的是,在计算第三投影密度信息与第四投影密度信息的第二匹配度时,可以以第三投影密度信息整体的数据量进行匹配。
本发明实施例通过水平切分和垂直切分,从水平和垂直的角度进行识别,进一步提高识别拼音字母的准确率。
在本发明的一种优选实施中,子步骤S23可以包括如下子步骤:
子步骤S231,将匹配成功的,每个第一轨迹点片段对应的一个或多个拼音字母,以及,每个第二轨迹点片段对应的一个或多个拼音字母,组合成一个或多个音节。
在本发明实施例中,可以第一轨迹点片段、第二轨迹点片段对应的拼音字母组成音节,由于第二轨迹点片段可以识别出一个或多个拼音字母,因此,可以组成一个或多个音节。
需要说明的是,若第一轨迹点片段、第二轨迹点片段对应相同的拼音字母,可能造成音节重复的情况,则在本发明实施例中,可以过滤重复的音节。
子步骤S34,将匹配成功之外的,至少部分的第二轨迹点片段与预设的声调轨迹进行匹配;
子步骤S35,当与所述声调轨迹匹配成功时,提取所述声调轨迹关联的声调。
一般情况下,匹配成功之外的第二轨迹点片段是位于上部的第二轨迹点片段,可能是“i”、“j”、“ü”等拼音字母本身的结构,也可能是声调。
应用本发明实施例,可以选择标准的声调作为匹配的样本,预先提取可以标识该声调的轨迹(即声调轨迹),建立声调轨迹与升到的关联关系,所述声调轨迹可以具有关联的声调。
在本发明实施例的一种优选示例中,可以对第二轨迹点片段进行数字化,以数字标识第二轨迹点片段的轨迹,与预先数字化的声调轨迹进行匹配。
具体而言,可以以数字标识下一轨迹点相对于当前轨迹点的方位,即n(n为正整数)个轨迹点的轨迹可以由(n-1)个数字进行表征。
例如,如图8所示,可以设置当前的轨迹点的位置为“5”,下一轨迹点相对于当前轨迹点的方位与数字的关系如表1所示:
表1
方位 | 数字 | 方位 | 数字 |
左上 | 1 | 右侧 | 6 |
上方 | 2 | 坐下 | 7 |
右上 | 3 | 下方 | 8 |
左侧 | 4 | 右下 | 9 |
在本示例中,数字化的声调轨迹可以如表2所示:
表2
声调 | 声调轨迹 |
阴平“ˉ” | 666666666…… |
阳平“ˊ” | 333333333…… |
上声“ˇ” | 999999……333333…… |
去声“ˋ” | 999999999…… |
对第二轨迹点片段与声调轨迹进行匹配,可以是指计算第二轨迹点片段与声调轨迹之间的差异,若差异在一定范围内,则可以认为匹配成功,否则,可以认为匹配失败。
例如,数字化后的第二轨迹点片段605为“999999……333363……”,存在一个噪音“6”,在允许的差异范围内,可以认为与上声“ˇ”的声调轨迹匹配,则可以判断第二轨迹点片段605为上声“ˇ”。
当然,本发明实施例可以预先对第二轨迹点片段进行去噪处理等预处理,去除噪音等干扰信息,也可以不进行预处理,本发明实施例对此不加以限制。
在本发明的一种优选实施例中,步骤102还可以包括如下子步骤:
子步骤S41,采用识别出的一个或多个拼音与预设的拼音样本进行匹配;所述拼音可以包括拼音字母与声调中的至少一者;
子步骤S42,过滤匹配失败的拼音。
应用本发明实施例,可以预先设置作为样本的拼音(即拼音样本),将识别出的拼音与其进行匹配,当匹配成功时,保留该拼音,否则,过滤该拼音。
在具体实现中,拼音样本可以包括音节样本、声调样本中的至少一种。
其中,音节样本、声调样本可以为合法(符合拼音规范)的音节、声调。
例如,拼音字母“b”可以与拼音字母“a”、“o”组成合法的音节“ba”、“bo”,拼音字母“b”与拼音字母“e”组成的音节“be”是不合法的,无法拼写出汉字。
需要说明的是,在简拼、联想输入等情况下,某些不合法的音节可以匹配上合法音节,也可以认为匹配成功。
例如,不合法的音节“be”可以在联想输入的情况下,匹配上“ben”、“bei”等合法的音节。
对于音调,其一般是在韵母上进行标记,不在声母上进行标记;若韵母有两个元音,且第一个元音为i、u、或是ü时,则将声调标示在第二个元音上,其余状况下声调皆应标示于第一个元音之上。
若音调之下的拼音字母为韵母,可以认为该拼音字母是合法的;
若音调之下的拼音字母为声母,可以认为该拼音字母是不合法的。
对于图2所示的表征拼音“hǎo”的轨迹点200,第一轨迹点201可能识别为“h”、“n”等拼音字母,第二轨迹点606可能识别为“a”、“o”、“u”等拼音字母,第二轨迹点604可以识别为声调“ˇ”,拼音轨迹点2022可以识别为拼音字母“o”,则轨迹点200可以组成“hao”、“hoo”、“nao”、“nuo”等音节,由于音节“hoo”是不合法的音节,因此过滤音节“hoo”,而由于声调“ˇ”不会标在“u”上,因此过滤音节“nuo”,保留了音节“hao”和“nao”,与声调“ˇ”组成拼音“hǎo”和“nǎo”。
在本发明的一种优选实施例中,步骤102还可以包括如下子步骤:
子步骤S51,采用每个拼音字母的第一匹配度和/或第二匹配度,计算识别出的一个或多个拼音的整体匹配度;
子步骤S52,按照所述整体匹配度对识别出的一个或多个拼音进行排序。
在本发明实施例中,整体匹配度可以表示识别出的拼音的合理程度。
通常,第一匹配度和/或第二匹配度越高,整体匹配度越高,该拼音的识别正确性越高;第一匹配度和/或第二匹配度越低,整体匹配度越低,该拼音的识别正确性越低。
在具体实现中,可以采用加权之和作为整体匹配度。
具体而言,可以对第一匹配度和/或第二匹配度配置合适的权重,计算第一匹配度和/或第二匹配度与权重的乘积,将乘积之和作为整体匹配度。
步骤103,查找与所述一个或多个拼音匹配的一个或多个候选信息。
应用本发明实施例,可以在词库中存储拼音与候选信息的匹配关系,对于识别出的拼音,可以在词库中查找与拼音匹配的候选信息。
或者,至少将拼音发送至云服务器,由云服务器查找与该拼音匹配的候选信息。
在实际应用中,该候选信息可以是汉字、英文、符号、图片等等。
需要说明的是,在该匹配关系中,可以对音调进行数字化存储。
例如,阴平“ˉ”可以存储为“1”、阳平“ˊ”可以存储为“2”、上声“ˇ”可以存储为“3”、去声“ˋ”可以存储为“4”。
则对于拼音“hǎo”,在词库中可以存储为“hao3”,以“hao3”在词库中进行匹配。
本发明实施例对检测到的滑行轨迹中的多个轨迹点进行轨迹识别,查找与识别出的拼音匹配的一个或多个候选信息,实现了手写拼音输入,一方面,可以解决由于只会读但是不会写导致无法输入候选信息的问题,另一方面,由于拼音比结构复杂的候选信息的识别准确率高,提高了输入结构复杂的候选信息的输入效率。
在本发明的一种优选实施例中,所述候选信息可以包括第一候选信息,则在本发明实施例中,步骤103可以包括如下子步骤:
子步骤S61,查找与一个或多个音节匹配的一个或多个第一候选信息;
在本发明实施例中,识别出的拼音包括音节,可以查找与该音频匹配的第一候选信息。
在该第一候选信息中,可以与一个或多个音调匹配。
例如,与音节“hao”匹配的第一候选信息可以包括“好”、“浩”、“号”、“OK”、“\(^o^)/~”和表示笑脸的图片。
在本发明的一种优选实施例中,所述候选信息可以包括第二候选信息,则在本发明实施例中,步骤103可以包括如下子步骤:
子步骤S62,查找与一个或多个音节匹配的一个或多个第一候选信息;
子步骤S63,在所述一个或多个第一候选信息中查找与声调匹配的第二候选信息。
在本发明实施例中,识别出的拼音包括音节和音调,可以在查找到与该音频匹配的第一候选信息的基础上,通过音调进一步筛选。
在该第二候选信息中,可以与特定的音调匹配。
例如,与音节“hao”匹配的第一候选信息可以包括“好”、“浩”、“号”、“OK”、“\(^o^)/~”和表示笑脸的图片,通过上声“ˇ”可以进一步筛选出第二候选信息“好”、“OK”、“\(^o^)/~”和表示笑脸的图片。
在本发明的一种优选实施例中,步骤103还可以包括如下子步骤:
子步骤S64,对查找出的一个或多个候选信息进行排序。
在具体实现中,可以以以下至少一种方式进行排序:
第一,依据候选信息的原始词频进行排序;
每个候选信息可以有一个在线下利用群体用户的大数据统计出来的原始词频,作为排序的依据。
原始词频的实质可以为使用频次,原始词频越大,候选信息排序越前;原始词频越小,候选信息排序越后。
第二,根据当前用户对每个候选信息的历史使用情况进行排序;
使用情况一般包括两个因素:使用量和使用间隔。
使用量越大、使用间隔越小,原始词频越小,候选信息排序越前;使用量越小、使用间隔越大,候选信息排序越后。
第三,根据输入的前后文进行排序;
可以查询用户上一次的输入与该次输入的候选信息是否会构成一对共现关系,若是,提前候选信息的排序。
第四,根据输入的环境进行排序;
检测用户当前输入环境(应用类型、时间、输入框等等),将符合当前输入情景的候选信息的排序提前。
当然,上述排序方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他排序方式,本发明实施例对此不加以限制。另外,除了上述排序方式外,本领域技术人员还可以根据实际需要采用其它排序方式,本发明实施例对此也不加以限制。
本发明实施例对拼音进行排序,对查找出的候选信息进行排序,从不同的维度提高合理的候选信息的展示优先度,减少翻页查找等操作的几率,进一步提高了输入的效率。
在本发明的一种优选实施例中,该方法实施例还可以包括如下步骤:
步骤104,显示所述一个或多个拼音以及所述一个或多个候选信息。
本发明实施例中,可以将识别出的拼音及其对应的候选信息进行展示,以让用户进行选择。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图9,示出了本发明的一种手写输入的装置实施例的结构框图,具体可以包括如下模块:
轨迹点检测模块901,用于检测滑行轨迹中的多个轨迹点;
拼音识别模块902,用于对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;
候选信息查找模块903,用于查找与所述一个或多个拼音匹配的一个或多个候选信息。
在本发明的一种优选实施例中,所述一个或多个拼音可以包括一个或多个音节;所述拼音识别模块902可以包括如下子模块:
第一切分子模块,用于对所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段;所述一个或多个第一轨迹点片段具有一个或多个第一特征信息;
第一样本匹配子模块,用于分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配;每个第一样本特征信息关联拼音字母;
音节组合子模块,用于至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节。
在本发明的一种优选实施例中,所述第一切分子模块可以包括如下子模块:
水平投影子模块,用于将所述多个轨迹点投影至水平轴上,以获得水平投影;
第一切分位置确定子模块,用于确定所述水平投影中的一个或多个第一切分位置;所述第一切分位置为水平轴上,超过预设的第一距离的空白位置;
垂直切分子模块,用于在垂直方向上,按照所述一个或多个第一切分位置对所述多个轨迹点进行切分,获得一个或多个第一轨迹点片段。
在本发明的一种优选实施例中,所述第一特征信息可以为所述第一轨迹点片段在水平轴上的第一投影密度信息,所述第一样本特征信息可以为拼音字母在水平轴上的第二投影密度信息;
所述第一样本匹配子模块可以包括如下子模块:
第一匹配度计算子模块,用于针对每个第一投影密度信息,计算至少部分的第一投影密度信息与一个或多个第二投影密度信息的第一匹配度;
第一匹配成功确定子模块,用于在所述第一匹配度大于预设的第一匹配度阈值时,确定所述第一投影密度信息所述第二投影密度信息匹配成功。
在本发明的一种优选实施例中,所述一个或多个拼音还可以包括一个或多个声调;
所述拼音识别模块902还可以包括如下子模块:
拼音字母轨迹点确定子模块,用于在所述第一轨迹点片段中确定与第一样本特征信息匹配的一个或多个拼音字母轨迹点;
第二切分子模块,用于对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段;所述一个或多个第二轨迹点片段具有一个或多个第二特征信息;
第二样本匹配子模块,用于分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配;每个第二样本特征信息关联拼音字母;
声调轨迹匹配子模块,用于将匹配成功之外的,至少部分的第二轨迹点片段与预设的声调轨迹进行匹配;所述声调轨迹具有关联的声调;
声调提取子模块,用于在与所述声调轨迹匹配成功时,提取所述声调轨迹关联的声调。
在本发明的一种优选实施例中,所述第二切分子模块可以包括如下子模块:
垂直投影子模块,用于将所述一个或多个拼音字母轨迹点投影至垂直轴上,以获得垂直投影;
第二切分位置确定子模块,用于确定所述垂直投影中的一个或多个第二切分位置;所述第二切分位置为垂直轴上,超过预设的第二距离的空白位置;
水平切分子模块,用于在水平方向上,按照所述一个或多个第二切分位置对所述一个或多个拼音字母轨迹点进行切分,获得一个或多个第二轨迹点片段。
在本发明的一种优选实施例中,所述第二特征信息可以为所述第二轨迹点片段在垂直轴上的第三投影密度信息,所述第二样本特征信息可以为拼音字母在垂直轴上的第四投影密度信息;
所述第二样本匹配子模块可以包括如下子模块:
第二匹配度计算子模块,用于针对每个第三投影密度信息,计算至少部分的第三投影密度信息与一个或多个第四投影密度信息的第二匹配度;
第二匹配成功确定子模块,用于在所述第二匹配度大于预设的第二匹配度阈值时,确定所述第三投影密度信息所述第四投影密度信息匹配成功。
在本发明的一种优选实施例中,所述音节组合子模块可以包括如下子模块:
双拼音字母组合子模块,用于将匹配成功的,每个第一轨迹点片段对应的一个或多个拼音字母,以及,每个第二轨迹点片段对应的一个或多个拼音字母,组合成一个或多个音节。
在本发明的一种优选实施例中,所述拼音识别模块902还可以包括如下子模块:
预处理子模块,用于对所述多个轨迹点进行预处理;
其中,所述预处理包括以下至少一种:
去噪处理、归一处理。
在本发明的一种优选实施例中,,所述拼音识别模块902还可以包括如下子模块:
拼音样本匹配子模块,用于采用识别出的一个或多个拼音与预设的拼音样本进行匹配;所述拼音包括拼音字母与声调中的至少一者;
过滤子模块,用于过滤匹配失败的拼音。
在本发明的一种优选实施例中,所述拼音识别模块902还可以包括如下子模块:
整体匹配度计算子模块,用于采用每个拼音字母的第一匹配度和/或第二匹配度,计算识别出的一个或多个拼音的整体匹配度;
第一排序子模块,用于按照所述整体匹配度对识别出的一个或多个拼音进行排序。
在本发明的一种优选实施例中,所述候选信息可以包括第一候选信息,或者,第二候选信息;
所述候选信息查找模块903可以包括如下子模块:
第一查找子模块,用于查找与一个或多个音节匹配的一个或多个第一候选信息;
或者,
第一查找子模块,用于查找与一个或多个音节匹配的一个或多个第一候选信息;
第二查找子模块,用于在所述一个或多个第一候选信息中查找与声调匹配的第二候选信息。
在本发明的一种优选实施例中,所述候选信息查找模块903还可以包括如子模块:
第二排序子模块,用于对查找出的一个或多个候选信息进行排序。
在本发明的一种优选实施例中,该装置实施例还可以包括如下模块:
显示模块,用于显示所述一个或多个拼音以及所述一个或多个候选信息。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种手写输入的方法和一种手写输入的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (28)
1.一种手写输入的方法,其特征在于,包括:
检测滑行轨迹中的多个轨迹点;
对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;
查找与所述一个或多个拼音匹配的一个或多个候选信息。
2.根据权利要求1所述的方法,其特征在于,所述一个或多个拼音包括一个或多个音节;
所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤包括:
对所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段;所述一个或多个第一轨迹点片段具有一个或多个第一特征信息;
分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配;每个第一样本特征信息关联拼音字母;
至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节。
3.根据权利要求2所述的方法,其特征在于,所述将所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段的步骤包括:
将所述多个轨迹点投影至水平轴上,以获得水平投影;
确定所述水平投影中的一个或多个第一切分位置;所述第一切分位置为水平轴上,超过预设的第一距离的空白位置;
在垂直方向上,按照所述一个或多个第一切分位置对所述多个轨迹点进行切分,获得一个或多个第一轨迹点片段。
4.根据权利要求2所述的方法,其特征在于,所述第一特征信息为所述第一轨迹点片段在水平轴上的第一投影密度信息,所述第一样本特征信息为拼音字母在水平轴上的第二投影密度信息;
所述分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配的步骤包括:
针对每个第一投影密度信息,计算至少部分的第一投影密度信息与一个或多个第二投影密度信息的第一匹配度;
当所述第一匹配度大于预设的第一匹配度阈值时,确定所述第一投影密度信息所述第二投影密度信息匹配成功。
5.根据权利要求2或3或4所述的方法,其特征在于,所述一个或多个拼音还包括一个或多个声调;
所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
在所述第一轨迹点片段中确定与第一样本特征信息匹配的一个或多个拼音字母轨迹点;
对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段;所述一个或多个第二轨迹点片段具有一个或多个第二特征信息;
分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配;每个第二样本特征信息关联拼音字母;
将匹配成功之外的,至少部分的第二轨迹点片段与预设的声调轨迹进行匹配;所述声调轨迹具有关联的声调;
当与所述声调轨迹匹配成功时,提取所述声调轨迹关联的声调。
6.根据权利要求5所述的方法,其特征在于,所述对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段的步骤包括:
将所述一个或多个拼音字母轨迹点投影至垂直轴上,以获得垂直投影;
确定所述垂直投影中的一个或多个第二切分位置;所述第二切分位置为垂直轴上,超过预设的第二距离的空白位置;
在水平方向上,按照所述一个或多个第二切分位置对所述一个或多个拼音字母轨迹点进行切分,获得一个或多个第二轨迹点片段。
7.根据权利要求5所述的方法,其特征在于,所述第二特征信息为所述第二轨迹点片段在垂直轴上的第三投影密度信息,所述第二样本特征信息为拼音字母在垂直轴上的第四投影密度信息;
所述分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配的步骤包括:
针对每个第三投影密度信息,计算至少部分的第三投影密度信息与一个或多个第四投影密度信息的第二匹配度;
当所述第二匹配度大于预设的第二匹配度阈值时,确定所述第三投影密度信息所述第四投影密度信息匹配成功。
8.根据权利要求5所述的方法,其特征在于,所述至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节的步骤包括:
将匹配成功的,每个第一轨迹点片段对应的一个或多个拼音字母,以及,每个第二轨迹点片段对应的一个或多个拼音字母,组合成一个或多个音节。
9.根据权利要求2或3或4或6或7或8所述的方法,其特征在于,所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
对所述多个轨迹点进行预处理;
其中,所述预处理包括以下至少一种:
去噪处理、归一处理。
10.根据权利要求2或3或4或6或7或8所述的方法,其特征在于,所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
采用识别出的一个或多个拼音与预设的拼音样本进行匹配;所述拼音包括拼音字母与声调中的至少一者;
过滤匹配失败的拼音。
11.根据权利要求2或3或4或6或7或8所述的方法,其特征在于,所述对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音的步骤还包括:
采用每个拼音字母的第一匹配度和/或第二匹配度,计算识别出的一个或多个拼音的整体匹配度;
按照所述整体匹配度对识别出的一个或多个拼音进行排序。
12.根据权利要求1或2或3或4或6或7或8所述的方法,其特征在于,所述候选信息包括第一候选信息,或者,第二候选信息;
所述查找与所述一个或多个拼音匹配的一个或多个候选信息的步骤包括:
查找与一个或多个音节匹配的一个或多个第一候选信息;
或者,
查找与一个或多个音节匹配的一个或多个第一候选信息;
在所述一个或多个第一候选信息中查找与声调匹配的第二候选信息。
13.根据权利要求12所述的方法,其特征在于,所述查找与所述一个或多个拼音匹配的一个或多个候选信息的步骤还包括:
对查找出的一个或多个候选信息进行排序。
14.根据权利要求1或2或3或4或6或7或8或13所述的方法,其特征在于,还包括:
显示所述一个或多个拼音以及所述一个或多个候选信息。
15.一种手写输入的装置,其特征在于,包括:
轨迹点检测模块,用于检测滑行轨迹中的多个轨迹点;
拼音识别模块,用于对所述多个轨迹点进行轨迹识别,以识别出一个或多个拼音;
候选信息查找模块,用于查找与所述一个或多个拼音匹配的一个或多个候选信息。
16.根据权利要求15所述的装置,其特征在于,所述一个或多个拼音包括一个或多个音节;所述拼音识别模块包括:
第一切分子模块,用于对所述多个轨迹点进行垂直切分,以获得一个或多个第一轨迹点片段;所述一个或多个第一轨迹点片段具有一个或多个第一特征信息;
第一样本匹配子模块,用于分别采用每个第一特征信息与预设的一个或多个第一样本特征信息进行匹配;每个第一样本特征信息关联拼音字母;
音节组合子模块,用于至少将匹配成功的每个第一轨迹点片段对应的一个或多个拼音字母组合成一个或多个音节。
17.根据权利要求16所述的装置,其特征在于,所述第一切分子模块包括:
水平投影子模块,用于将所述多个轨迹点投影至水平轴上,以获得水平投影;
第一切分位置确定子模块,用于确定所述水平投影中的一个或多个第一切分位置;所述第一切分位置为水平轴上,超过预设的第一距离的空白位置;
垂直切分子模块,用于在垂直方向上,按照所述一个或多个第一切分位置对所述多个轨迹点进行切分,获得一个或多个第一轨迹点片段。
18.根据权利要求16所述的装置,其特征在于,所述第一特征信息为所述第一轨迹点片段在水平轴上的第一投影密度信息,所述第一样本特征信息为拼音字母在水平轴上的第二投影密度信息;
所述第一样本匹配子模块包括:
第一匹配度计算子模块,用于针对每个第一投影密度信息,计算至少部分的第一投影密度信息与一个或多个第二投影密度信息的第一匹配度;
第一匹配成功确定子模块,用于在所述第一匹配度大于预设的第一匹配度阈值时,确定所述第一投影密度信息所述第二投影密度信息匹配成功。
19.根据权利要求16或17或18所述的装置,其特征在于,所述一个或多个拼音还包括一个或多个声调;
所述拼音识别模块还包括:
拼音字母轨迹点确定子模块,用于在所述第一轨迹点片段中确定与第一样本特征信息匹配的一个或多个拼音字母轨迹点;
第二切分子模块,用于对所述一个或多个拼音字母轨迹点进行水平切分,以获得一个或多个第二轨迹点片段;所述一个或多个第二轨迹点片段具有一个或多个第二特征信息;
第二样本匹配子模块,用于分别采用每个第二特征信息与预设的一个或多个第二样本特征信息进行匹配;每个第二样本特征信息关联拼音字母;
声调轨迹匹配子模块,用于将匹配成功之外的,至少部分的第二轨迹点片段与预设的声调轨迹进行匹配;所述声调轨迹具有关联的声调;
声调提取子模块,用于在与所述声调轨迹匹配成功时,提取所述声调轨迹关联的声调。
20.根据权利要求19所述的装置,其特征在于,所述第二切分子模块包括:
垂直投影子模块,用于将所述一个或多个拼音字母轨迹点投影至垂直轴上,以获得垂直投影;
第二切分位置确定子模块,用于确定所述垂直投影中的一个或多个第二切分位置;所述第二切分位置为垂直轴上,超过预设的第二距离的空白位置;
水平切分子模块,用于在水平方向上,按照所述一个或多个第二切分位置对所述一个或多个拼音字母轨迹点进行切分,获得一个或多个第二轨迹点片段。
21.根据权利要求19所述的装置,其特征在于,所述第二特征信息为所述第二轨迹点片段在垂直轴上的第三投影密度信息,所述第二样本特征信息为拼音字母在垂直轴上的第四投影密度信息;
所述第二样本匹配子模块包括:
第二匹配度计算子模块,用于针对每个第三投影密度信息,计算至少部分的第三投影密度信息与一个或多个第四投影密度信息的第二匹配度;
第二匹配成功确定子模块,用于在所述第二匹配度大于预设的第二匹配度阈值时,确定所述第三投影密度信息所述第四投影密度信息匹配成功。
22.根据权利要求19所述的装置,其特征在于,所述音节组合子模块包括:
双拼音字母组合子模块,用于将匹配成功的,每个第一轨迹点片段对应的一个或多个拼音字母,以及,每个第二轨迹点片段对应的一个或多个拼音字母,组合成一个或多个音节。
23.根据权利要求16或17或18或20或21或22所述的装置,其特征在于,所述拼音识别模块还包括:
预处理子模块,用于对所述多个轨迹点进行预处理;
其中,所述预处理包括以下至少一种:
去噪处理、归一处理。
24.根据权利要求16或17或18或20或21或22所述的装置,其特征在于,所述拼音识别模块还包括:
拼音样本匹配子模块,用于采用识别出的一个或多个拼音与预设的拼音样本进行匹配;所述拼音包括拼音字母与声调中的至少一者;
过滤子模块,用于过滤匹配失败的拼音。
25.根据权利要求16或17或18或20或21或22所述的装置,其特征在于,所述拼音识别模块还包括:
整体匹配度计算子模块,用于采用每个拼音字母的第一匹配度和/或第二匹配度,计算识别出的一个或多个拼音的整体匹配度;
第一排序子模块,用于按照所述整体匹配度对识别出的一个或多个拼音进行排序。
26.根据权利要求15或16或17或18或20或21或22所述的装置,其特征在于,所述候选信息包括第一候选信息,或者,第二候选信息;
所述候选信息查找模块包括:
第一查找子模块,用于查找与一个或多个音节匹配的一个或多个第一候选信息;
或者,
第一查找子模块,用于查找与一个或多个音节匹配的一个或多个第一候选信息;
第二查找子模块,用于在所述一个或多个第一候选信息中查找与声调匹配的第二候选信息。
27.根据权利要求26所述的装置,其特征在于,所述候选信息查找模块还包括:
第二排序子模块,用于对查找出的一个或多个候选信息进行排序。
28.根据权利要求15或16或17或18或20或21或22或27所述装置,其特征在于,还包括:
显示模块,用于显示所述一个或多个拼音以及所述一个或多个候选信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510112581.2A CN106033316A (zh) | 2015-03-13 | 2015-03-13 | 一种手写输入的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510112581.2A CN106033316A (zh) | 2015-03-13 | 2015-03-13 | 一种手写输入的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106033316A true CN106033316A (zh) | 2016-10-19 |
Family
ID=57151206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510112581.2A Pending CN106033316A (zh) | 2015-03-13 | 2015-03-13 | 一种手写输入的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106033316A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557260A (zh) * | 2016-11-30 | 2017-04-05 | 深圳天珑无线科技有限公司 | 手写输入方法和装置 |
CN108549493A (zh) * | 2018-04-04 | 2018-09-18 | 科大讯飞股份有限公司 | 候选词筛选方法及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1707509A (zh) * | 2004-06-10 | 2005-12-14 | 微软公司 | 用于亚洲语言的手写输入 |
WO2010150764A1 (ja) * | 2009-06-24 | 2010-12-29 | 京セラ株式会社 | 携帯端末、言語設定プログラムおよび言語設定方法 |
CN102063620A (zh) * | 2010-12-31 | 2011-05-18 | 北京捷通华声语音技术有限公司 | 一种手写识别方法、系统及手写识别终端 |
CN104156704A (zh) * | 2014-08-04 | 2014-11-19 | 胡艳艳 | 一种新的车牌识别方法及系统 |
-
2015
- 2015-03-13 CN CN201510112581.2A patent/CN106033316A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1707509A (zh) * | 2004-06-10 | 2005-12-14 | 微软公司 | 用于亚洲语言的手写输入 |
WO2010150764A1 (ja) * | 2009-06-24 | 2010-12-29 | 京セラ株式会社 | 携帯端末、言語設定プログラムおよび言語設定方法 |
CN102063620A (zh) * | 2010-12-31 | 2011-05-18 | 北京捷通华声语音技术有限公司 | 一种手写识别方法、系统及手写识别终端 |
CN104156704A (zh) * | 2014-08-04 | 2014-11-19 | 胡艳艳 | 一种新的车牌识别方法及系统 |
Non-Patent Citations (1)
Title |
---|
朱萌,刘长松,陈御天,邹燕明: "《计算机工程》", 30 April 2010 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557260A (zh) * | 2016-11-30 | 2017-04-05 | 深圳天珑无线科技有限公司 | 手写输入方法和装置 |
CN108549493A (zh) * | 2018-04-04 | 2018-09-18 | 科大讯飞股份有限公司 | 候选词筛选方法及相关设备 |
CN108549493B (zh) * | 2018-04-04 | 2022-10-04 | 科大讯飞股份有限公司 | 候选词筛选方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106940788B (zh) | 智能评分方法及装置、计算机设备及计算机可读介质 | |
KR20190094078A (ko) | 모호한 엔티티 단어에 기반한 텍스트 처리 방법과 장치 | |
US9904847B2 (en) | System for recognizing multiple object input and method and product for same | |
KR20080019625A (ko) | 신경 회로망을 사용하는 필기 인식 | |
CN110569335B (zh) | 基于人工智能的三元组校验方法、装置及存储介质 | |
JPH07334296A (ja) | システム動作方法及びプロセッサ制御システム | |
JPH06176199A (ja) | パターン認識方法及び装置 | |
CN107748744B (zh) | 一种勾勒框知识库的建立方法及装置 | |
CN110032734B (zh) | 近义词扩展及生成对抗网络模型训练方法和装置 | |
CN107608618B (zh) | 一种用于可穿戴设备的交互方法、装置和可穿戴设备 | |
CN104541288A (zh) | 手写文档处理设备和方法 | |
CN105956053A (zh) | 一种基于网络信息的搜索方法及装置 | |
CN104182381A (zh) | 文字输入用方法和系统 | |
CN107526721B (zh) | 一种对电商产品评论词汇的歧义消除方法及装置 | |
KR20210017090A (ko) | 필기 입력을 텍스트로 변환하는 방법 및 전자 장치 | |
Celikyilmaz et al. | Resolving referring expressions in conversational dialogs for natural user interfaces | |
US9710701B2 (en) | Handwriting data search | |
CN113673432A (zh) | 手写识别方法、触摸显示设备、计算机设备及存储介质 | |
CN107844531B (zh) | 答案输出方法、装置和计算机设备 | |
CN112784009A (zh) | 一种主题词挖掘方法、装置、电子设备及存储介质 | |
Abuzaraida et al. | Online handwriting Arabic recognition system using k-nearest neighbors classifier and DCT features | |
CN106033316A (zh) | 一种手写输入的方法和装置 | |
CN105786803A (zh) | 翻译方法及翻译装置 | |
Wieprecht et al. | Word spotting in historical document collections with online-handwritten queries | |
CN110929749B (zh) | 文本识别方法、装置、介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161019 |
|
RJ01 | Rejection of invention patent application after publication |