CN102541393A - 手写体文字编辑方法 - Google Patents

手写体文字编辑方法 Download PDF

Info

Publication number
CN102541393A
CN102541393A CN2010105875425A CN201010587542A CN102541393A CN 102541393 A CN102541393 A CN 102541393A CN 2010105875425 A CN2010105875425 A CN 2010105875425A CN 201010587542 A CN201010587542 A CN 201010587542A CN 102541393 A CN102541393 A CN 102541393A
Authority
CN
China
Prior art keywords
handwritten text
handwritten
stroke
text
edit methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105875425A
Other languages
English (en)
Inventor
吴勇
彭昌
孙暐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BLACKSPACE INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI BLACKSPACE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BLACKSPACE INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI BLACKSPACE INFORMATION TECHNOLOGY Co Ltd
Priority to CN2010105875425A priority Critical patent/CN102541393A/zh
Publication of CN102541393A publication Critical patent/CN102541393A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明涉及手写体文字编辑方法。该方法包括步骤:接收单个手写体文字的预设尺寸数据;采集手写体输入设备每个输入周期的笔画数据,所述笔画数据包括笔画轨迹和起止时间;将采集的多个周期的笔画数据组合成手写体文字组;将所述手写体文字组拆分为单个手写体文字;将拆分出的单个手写体文字根据所述预设尺寸进行等比例缩放;将缩放后的单个手写体文字按原有顺序显示在指定区域。与现有技术相比,本发明所请求保护的手写体文字编辑方法,在对一组手写体文字组拆分为单个手写体文字后,可以如编辑普通印刷体文字的字号一般将单个手写体文字的尺寸进行归一化缩放,从而达到手写体文字的尺寸均一的目的。

Description

手写体文字编辑方法
技术领域
本发明涉及手写体文字处理技术领域,特别涉及手写体文字编辑方法。
背景技术
在电子设备上进行文字输入,一般采用键盘或模拟键盘通过拼音规则或笔画规则映射字库的方法来完成。随着触摸输入设备的普及,越来越多的电子设备,特别是手持式电子设备会采用手写输入的方法来进行文字输入。
所谓的手写输入的技术方案有两种方案,即识别模式和笔迹模式。
识别模式是指用户通过电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等触摸输入设备以惯常的手写文字的方式向电子设备输入一系列的笔画数据,而电子设备对这些手写笔画进行手写识别后转换为电子设备可识别的标准字体文字并显示出来,从而大幅提高文字输入的速度。手写识别,是指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。手写识别能够使用户按照最自然、最方便的输入方式进行文字输入,并取代键盘或者鼠标。进行手写识别的方法有很多种,例如惠普公司获得授权的中国专利第ZL95109911.6号公开了三种手写体匹配方法:合成匹配器法、字匹配器法和弹性匹配器法。合成匹配器法根据手写体在速度最低区域内的形状对输入的手写体进行编码。该方法包括步骤:确定手写输入中速度最小值的位置;用一系列符号对上述手写输入加以编码,其中每一个符号均表示手写输入在速度最低时的一个特征;再用串编辑测距法将上述符号序列与手写输入其它样本的代码进行匹配,从而完成。另外,字匹配器利用连续的高度编码方案根据速度最低值相对一参照线的高度对输入的手写体进编码。而弹性匹配器根据速度最低值和中间点的类别对手写体进行编码。
笔迹模式是指用户向电子设备输入笔画数据后,电子设备不对文字的内容进行识别,而是直接将笔画数据转换成位图并拼接成一幅“画”有用户笔迹的图片。例如TCL集团股份有限公司提交的中国专利申请第200910105330.6号公开了一种原笔迹手写输入显示方法,该方法包括以下步骤:确定后一扫描点相对于前一扫描点的步进方向;根据前后两个扫描点的位置坐标数据确定步长;根据步进方向和步长确定若干最佳连接点;依次连接上述最佳连接点并显示。上述方法可以得到平滑和逼真的连接线,满足原笔迹手写输入的需求。
从上述分析可知,在识别模式下,无法保留用户个体的手写个性化结果,例如书法好或不好的用户都会得到统一的书写结果。而在采用笔迹模式进行手写输入时,书法不好的用户,例如字写得大小不一的用户,所得到的手写输入结果并不令人满意。
发明内容
本发明的实施方式所要解决的技术问题是:如何提高笔迹模式下手写输入的文字的尺寸均一性。
为解决上述技术问题,在本发明的实施方式中提供一种手写体文字编辑方法,包括步骤:接收单个手写体文字的预设尺寸数据;采集手写体输入设备每个输入周期的笔画数据,所述笔画数据包括笔画轨迹和起止时间;将采集的多个周期的笔画数据组合成手写体文字组,所述手写体文字组包括多个手写体汉字、外文单词、外文字母和/或数字;将所述手写体文字组拆分为单个手写体文字;将拆分出的单个手写体文字根据所述预设尺寸进行等比例缩放;将缩放后的单个手写体文字按原有顺序显示在指定区域。
可选地,所述将手写体文字组拆分为单个手写体文字的步骤中,判断笔画归属于同一个手写体文字的依据选自以下三个标准中的一个或多个:所述笔画之间的间隔时间小于笔画间平均间隔时间的135%;笔画存在交叠;笔画在书写方向上的投影有重合。
可选地,还包括步骤:识别单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字;所述将拆分出的单个手写体文字根据所述预设尺寸进行等比例缩放的步骤具体为将拆分出的单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字根据所述预设尺寸进行等比例缩放。
可选地,还包括步骤:对单个手写体文字进行平滑处理。
可选地,还包括步骤:对单个手写体文字进行压缩。
可选地,所述的压缩为矢量压缩。
可选地,还包括步骤:储存缩放后的单个手写体文字。
可选地,所述手写体输入设备的输入周期为手写体输入设备连续产生书写信号的一段时间。
与现有技术相比,本发明所请求保护的手写体文字编辑方法,在对一组手写体文字组拆分为单个手写体文字后,可以如编辑普通印刷体文字的字号一般将单个手写体文字的尺寸进行归一化缩放,从而达到手写体文字的尺寸均一的目的。
另外,还可以对手写体文字进行识别后再进行缩放,从而仅对汉字、外文单词、外文字母和/或数字进行缩放,避免了对标点符号等不该缩放的非文字进行缩放,使得手写体文字的尺寸归一化更有针对性。
附图说明
图1为本发明一个实施例中手写体文字编辑方法的流程示意图;
图2为本发明另一个实施例中手写体文字编辑方法的流程示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
其次,本发明利用示意图进行详细描述,在详述本发明实施例时,为便于说明,所述示意图只是实例,其在此不应限制本发明保护的范围。
下面结合附图对本发明的具体实施方式做详细的说明。
如图1所示,在本发明的一个实施例中,提供一种手写体文字编辑方法,该方法包括步骤:
S101,接收单个手写体文字的预设尺寸数据;
S102,采集手写体输入设备每个输入周期的笔画数据;
S103,将采集的多个周期的笔画数据组合成手写体文字组;
S104,将所述手写体文字组拆分为单个手写体文字;
S105,将拆分出的单个手写体文字根据所述预设尺寸进行等比例缩放;
S106,将缩放后的单个手写体文字按原有顺序显示在指定区域。
如图2所示,在本发明的另一个实施例中,提供一种手写体文字编辑方法,包括步骤:
S201,接收单个手写体文字的预设尺寸数据;
S202,采集手写体输入设备每个输入周期的笔画数据;
S203,将采集的多个周期的笔画数据组合成手写体文字组;
S204,将所述手写体文字组拆分为单个手写体文字;
S205,识别单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字;
S206,将拆分出的单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字根据所述预设尺寸进行等比例缩放;
S207,对单个手写体文字进行平滑处理;
S208,将单个手写体文字按原有顺序显示在指定区域;
S209,对单个手写体文字进行压缩;
S210,储存单个手写体文字。
在图2所示的具体实施方式中,首先执行步骤S201,接收单个手写体文字的预设尺寸数据。这里单个手写体文字的预设尺寸可以是一个正方形或长方形限制框的尺寸,用于限定单个手写体文字的大小。因此步骤S201中所接收的单个手写体文字的预设尺寸数据可以是正方形限制框的边长或者长方形限制框的长和宽。接收限制框的尺寸数据可以是通过直接接收尺寸数字形式尺寸数据的方式,也可以是通过对图形化的限制框进行数字化后获得限制框的尺寸数据。也就是说,用户可以直接输入限制框的尺寸数据,也可以通过拖拉图形化的限制框的边界来确定限制框的大小。步骤S201类似于在文字编辑软件中设定文字的字号。
然后执行步骤S202,采集手写体输入设备每个输入周期的笔画数据。这里,手写体输入设备的输入周期为手写体输入设备连续产生书写信号的一段时间。例如当采用手写笔、触摸屏或者鼠标作为手写体输入设备时,一个输入周期即为一个状态切换周期,即按压、移动和释放这三个动作所形成的一个周期。一个输入周期所形成的数据可以记录为一个笔画数据。一个笔画数据包括笔画轨迹和起止时间。例如,一个笔画数据可以是手写体输入设备按照相等时间间隔采样所获得的在某个时刻下的笔迹记录点所处的坐标位置的集合。
再执行步骤S203,将采集的多个周期的笔画数据组合成手写体文字组。该手写体文字组包括多个手写体汉字、外文单词、外文字母和/或数字。由于用户的书写习惯一般是一次性写完一句话或者至少一个分句。因此,在一句话或一个分句中至少包括有两个以上的汉字,有的还包括外文字母、外文单词以及阿拉伯数字。因此步骤S203是等用户按照平常的书写习惯写完一句话或者一个分句以后,将这句话或者这个分句的所有笔画组合成一个包含有多个手写体汉字、外文单词、外文字母和/或数字的手写体文字组。避免了现有技术中需要用户一个字一个字地输入所带来的不便。
然后执行步骤S204,将手写体文字组拆分为单个手写体文字。判断笔画归属于同一个手写体文字的标准有多个,其一是用笔画间的间隔时间来判断。在步骤S202中所采集的笔画数据包括有笔画的起止时间,因此可以方便地获得相邻笔画间的间隔时间。一般来说,用户在书写在同一个字内的不同笔画间的间隔时间较短,而在两个字之间的笔画间隔时间较长,因此可以用笔画间的间隔时间长短来判断哪些笔画组成了同一个字。根据本发明的发明人通过创造性的劳动发现,当相邻的两笔笔画之间的间隔时间小于笔画间平均间隔时间的135%时,有约87%的正确率确定相邻的两笔笔画是属于同一个手写体文字。单独使用笔画间隔时间来判断的正确率可能不足以满足手写体文字分割判断的需要,但结合以下两个标准中的一个或两个,便可以得到比较高的判断准确率。
判断笔画归属于同一个手写体文字的第二个标准是看笔画之间是否存在交叠。一般来说,存在交叠的笔画是属于同一个手写体文字,因此笔画的交叠可以作为第二个判断依据。
判断笔画归属于同一个手写体文字的第三个标准是看笔画在书写方向上的投影是否有重合。有时候,用户在书写时可能会漏写某一笔,而在写完后面的文字后再补写该笔。例如在书写“我是谁”三个字时,有可能会漏泄右上角的一点,而在写完“谁”字时才发现,然后再补上这一点。这时,如果采用上述的笔画间隔时间来判断或者笔画交叠来判断,都不会将这一点归入“我”字中。但是,这一点在书写“我是谁”这三个字的书写方向上(一般为横向)的投影,与“我”字的其他笔画的投影是有重合,因此可以用来判断该点是属于“我”字的笔画范围。
进行上述判断的计算方法例如可以是闭包算法、动态平滑或者空间平滑算法等,这些算法本身已为本领域技术人员所熟知,在此不再赘述。
接着执行步骤S205,识别单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字。由于用户在手写一句话中,可能会输入标点符号或者其他规则或不规则的非文字符号,这些标点或者符号一般不需要和其他手写体文字进行相同的尺寸归一化,因此,可以在对手写体文字进行归一化缩放之前,将非文字内容排除在缩放范围以外。进行文字识别的方法可以例如是背景技术中所提及的方法,或者现有技术中的其他方法。这些方法已经为本领域技术人员所熟知,在此不再赘述。
在对手写体文字组中的手写体汉字、外文单词、外文字母和/或数字进行识别后,即可执行步骤S206,将拆分出的单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字根据所述预设尺寸进行等比例缩放。
接着执行步骤S207,对单个手写体文字进行平滑处理。因为手写体输入设备的采样精度有限,因此所获得的手写体文字的边界可能比较粗糙;或者用户在书写时可能会因手部抖动而出现一些抖动点。在这里,可以采用Bessle平滑的方法来去除抖动点或者平滑边界。
再执行步骤S208,将单个手写体文字按原有顺序显示在指定区域。这是为了符合用户阅读的习惯,将手写输入的结果进行一个还原展示。
然后执行步骤S209,对单个手写体文字进行压缩。为了方便后续存储工作,减小存储空间,可以对分解出的单个手写体文字进行数据压缩。一个优选的方式是进行矢量压缩。手写体文字进行矢量压缩后,再次进行放大缩小都不会损失清晰度。
最后执行步骤S210,储存单个手写体文字。进而完成了整个手写体文字的编辑。
虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人体员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (8)

1.手写体文字编辑方法,其特征在于,包括步骤:
接收单个手写体文字的预设尺寸数据;
采集手写体输入设备每个输入周期的笔画数据,所述笔画数据包括笔画轨迹和起止时间;
将采集的多个周期的笔画数据组合成手写体文字组,所述手写体文字组包括多个手写体汉字、外文单词、外文字母和/或数字;
将所述手写体文字组拆分为单个手写体文字;
将拆分出的单个手写体文字根据所述预设尺寸进行等比例缩放;
将缩放后的单个手写体文字按原有顺序显示在指定区域。
2.如权利要求1所述的手写体文字编辑方法,其特征在于:所述将手写体文字组拆分为单个手写体文字的步骤中,判断笔画归属于同一个手写体文字的依据选自以下三个标准中的一个或多个:
所述笔画之间的间隔时间小于笔画间平均间隔时间的135%;
笔画存在交叠;
笔画在书写方向上的投影有重合。
3.如权利要求1所述的手写体文字编辑方法,其特征在于,还包括步骤:
识别单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字;
所述将拆分出的单个手写体文字根据所述预设尺寸进行等比例缩放的步骤具体为将拆分出的单个手写体文字中的手写体汉字、外文单词、外文字母和/或数字根据所述预设尺寸进行等比例缩放。
4.如权利要求1所述的手写体文字编辑方法,其特征在于,还包括步骤:对单个手写体文字进行平滑处理。
5.如权利要求1所述的手写体文字编辑方法,其特征在于,还包括步骤:对单个手写体文字进行压缩。
6.如权利要求5所述的手写体文字编辑方法,其特征在于:所述的压缩为矢量压缩。
7.如权利要求1所述的手写体文字编辑方法,其特征在于,还包括步骤:储存缩放后的单个手写体文字。
8.如权利要求1所述的手写体文字编辑方法,其特征在于:所述手写体输入设备的输入周期为手写体输入设备连续产生书写信号的一段时间。
CN2010105875425A 2010-12-09 2010-12-09 手写体文字编辑方法 Pending CN102541393A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105875425A CN102541393A (zh) 2010-12-09 2010-12-09 手写体文字编辑方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105875425A CN102541393A (zh) 2010-12-09 2010-12-09 手写体文字编辑方法

Publications (1)

Publication Number Publication Date
CN102541393A true CN102541393A (zh) 2012-07-04

Family

ID=46348402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105875425A Pending CN102541393A (zh) 2010-12-09 2010-12-09 手写体文字编辑方法

Country Status (1)

Country Link
CN (1) CN102541393A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731390A (zh) * 2013-12-18 2015-06-24 深圳富泰宏精密工业有限公司 保存原笔迹手写字的系统及方法
CN108492349A (zh) * 2018-03-19 2018-09-04 广州视源电子科技股份有限公司 书写笔画的处理方法、装置、设备和存储介质
CN111078073A (zh) * 2019-12-17 2020-04-28 科大讯飞股份有限公司 一种笔迹放大的方法和相关装置
CN111488104A (zh) * 2020-04-16 2020-08-04 维沃移动通信有限公司 一种字形编辑方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0597379A2 (en) * 1992-11-05 1994-05-18 Sharp Kabushiki Kaisha Pen input processing apparatus
CN101226441A (zh) * 2007-01-17 2008-07-23 北京书生国际信息技术有限公司 一种实现笔锋效果的手写输入方法
CN101290659A (zh) * 2008-05-29 2008-10-22 宁波新然电子信息科技发展有限公司 基于组合分类器的手写识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0597379A2 (en) * 1992-11-05 1994-05-18 Sharp Kabushiki Kaisha Pen input processing apparatus
CN101226441A (zh) * 2007-01-17 2008-07-23 北京书生国际信息技术有限公司 一种实现笔锋效果的手写输入方法
CN101290659A (zh) * 2008-05-29 2008-10-22 宁波新然电子信息科技发展有限公司 基于组合分类器的手写识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高彦宇 杨扬: "脱机手写汉字识别研究综述", 《计算机工程与应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731390A (zh) * 2013-12-18 2015-06-24 深圳富泰宏精密工业有限公司 保存原笔迹手写字的系统及方法
CN108492349A (zh) * 2018-03-19 2018-09-04 广州视源电子科技股份有限公司 书写笔画的处理方法、装置、设备和存储介质
CN111078073A (zh) * 2019-12-17 2020-04-28 科大讯飞股份有限公司 一种笔迹放大的方法和相关装置
CN111488104A (zh) * 2020-04-16 2020-08-04 维沃移动通信有限公司 一种字形编辑方法及电子设备

Similar Documents

Publication Publication Date Title
TW513656B (en) Handwriting information processing system comprising a character segmentation user interface
US9141134B2 (en) Utilization of temporal and spatial parameters to enhance the writing capability of an electronic device
US5751851A (en) Method of splitting handwritten input
JP4244614B2 (ja) 手書き入力装置、プログラムおよび手書き入力方法システム
EP3535689A1 (en) Method and system for transforming handwritten text to digital ink
KR100234922B1 (ko) 수기된 입력의 연결 방법
CN105511792A (zh) 一种表单在位手写输入方法及系统
EP1330109B1 (en) Index and retrieval system and method for scanned notes from whiteboard
Lin et al. Complete font generation of Chinese characters in personal handwriting style
CN103268166A (zh) 手写输入设备的原笔迹信息采集和显示方法
CN101685497B (zh) 手写信息处理方法和装置
CN112711362B (zh) 手绘流程图标准化生成方法及其装置
CN103389873A (zh) 电子装置和手写文档显示方法
CN102541393A (zh) 手写体文字编辑方法
US9367237B2 (en) Shaping device
Gohel et al. On-line handwritten Gujarati character recognition using low level stroke
JP2017090998A (ja) 文字認識プログラム、文字認識装置
US20200242346A1 (en) Preserving styles and ink effects in ink-to-text
CN102682265A (zh) 显示终端的手写输入方法、装置及手写输入系统
JP4148867B2 (ja) 筆跡処理装置
WO2024065345A1 (zh) 隔空手势编辑方法、装置、显示系统及介质
CN104463086A (zh) 一种信息处理方法及设备
KR20160111146A (ko) 디지털 텍스트 형태의 문자를 디지털 잉크 형태의 문자 이미지로 랜더링하는 방법 및 이를 수행하는 문자 이미지 생성 프로세서
CN117631880A (zh) 一种准确计算擦除效果的方法
CN116071767A (zh) 表格识别重建方法、装置、存储介质以及交互平板

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120704