CN101452444A - 手写体信息快速编辑排版方法和编辑符的识别方法 - Google Patents

手写体信息快速编辑排版方法和编辑符的识别方法 Download PDF

Info

Publication number
CN101452444A
CN101452444A CNA2008100090746A CN200810009074A CN101452444A CN 101452444 A CN101452444 A CN 101452444A CN A2008100090746 A CNA2008100090746 A CN A2008100090746A CN 200810009074 A CN200810009074 A CN 200810009074A CN 101452444 A CN101452444 A CN 101452444A
Authority
CN
China
Prior art keywords
information
editing
cutting
symbol
editor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100090746A
Other languages
English (en)
Other versions
CN101452444B (zh
Inventor
陈清财
梁乃臣
王晓龙
尤凤凯
冯交交
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN2008100090746A priority Critical patent/CN101452444B/zh
Publication of CN101452444A publication Critical patent/CN101452444A/zh
Application granted granted Critical
Publication of CN101452444B publication Critical patent/CN101452444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及信息编辑处理技术,具体涉及一种对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息根据编辑指令进行快速编辑排版的方法和对编辑过程中输入的编辑符的识别方法。通过将手写体信息进行切分或合并处理成独立信息单元,并将处理后的手写体信息进行编码,建立支持编辑操作的索引,并通过执行编辑指令实现在编辑后对受编辑影响的信息单元进行自动排版。本发明有效的解决了对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑完成后,不能实现再排版,影响文档整体性的技术问题;系统对编辑过程中输入的编辑符识别准确、高效、识别错误率低。

Description

手写体信息快速编辑排版方法和编辑符的识别方法
技术领域
本发明涉及信息编辑处理技术,具体涉及一种对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的数字化信息根据编辑指令进行快速编辑排版的方法和对编辑过程中输入的编辑符的识别方法。
背景技术
现有技术中对于联机状态下输入的信息进行编辑的技术已经非常成熟,但对于在联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑的技术很少。经过大量检索发现微软公司有关于手写体信息的编辑技术,该编辑技术将待编辑文档的作为一个整体单元,通过选择系统提供的编辑指令完成对待编辑文档的编辑操作。但微软公司的手写体文字编辑技术存在一定技术缺陷,例如在执行删除操作时,当删除掉整篇文档中的几个文字或一段文字时,被删除部分为空白,受删除操作影响的后面信息不能自动跟进,将空白间隙填补,也就是在编辑操作后,不能实现再排版,这样将对文档的整体性产生影响。
在文档的书写过程中如果需要对生成文档进行编辑,现有技术是采用通过鼠标作为辅助工具,通过鼠标勾选需要编辑的信息,当选中该信息后,在通过执行相应编辑命令完成对文档内信息的编辑,虽然这种文档编辑方法相比在纸件上直接进行编辑修改能有效的提高编辑效率和使整体文档在编辑后的清洁性和整体性更好,但是这种编辑方法还需要增加辅助构件鼠标等工具,而且编辑过程仍然稍许复杂,为了使对文档信息的编辑更高效,申请号为94108177.X,名称为以笔势符号为编辑指令的系统的发明专利公开了一种直接对文档信息进行编辑的方法,该方法可以在书写信息的同时,不需要借助鼠标等工具直接进行文档信息的编辑,操作过程中通过书写信息的手写笔等输入构件直接对文档中的信息进行编辑,并通过手写笔等输入构件直接在文档中划入编辑符号就可以实现文档信息输入和编辑的同步高效进行,但这种编辑方法存在一定的技术问题,因为该专利中所公开的文档编辑命令符号在文档中写入时,系统要根据这些编辑符号的线段长短、或符号中线条的倾斜角度与系统内设的符号点值参数进行比对,当操作者写入的这些符号如果不规范,超出了系统内设符号点值参数可以识别的有效范围时,系统对这些符号便不能识别。这也相应提高了操作者编辑文档时的难度,给编辑操作带来了不便,所以该技术仍然存在技术缺陷。
发明内容
为了解决现有技术中存在的在对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的数字化信息进行编辑完成后,不能实现再排版,影响文档整体性的技术问题,本发明提供了一种对手写体信息进行快速编辑排版的方法。
为了解决现有技术中存在的对手写体编辑符的识别准确率低的技术问题,本发明提供了一种编辑符的识别方法。
本发明解决现有技术中存在的第一个技术问题所采用的技术方案为:提供一种对手写体信息进行快速编辑排版的方法,所述对手写体信息进行快速编辑排版的方法包括步骤:第一、将手写体信息进行切分或合并处理成个体单位的独立信息单元;第二、对切分或合并处理后的所述手写体信息进行编码,建立支持编辑操作的索引,进行索引计算,得出各独立信息单元在整体信息单元中的物理位置,并计算所述信息相对于显示页面的动态索引;第三、输入编辑指令,执行所述编辑指令完成对所述手写体信息的编辑;第四、对每次执行编辑指令后受到影响的信息单元进行自动排版。
根据本发明的一优选实施例:所述第一步中对所述手写体信息的切分包括操作者在联机输入状态下手写写入信息的切分和在脱机状态下获取的已有手写文档的扫描信息的切分。
根据本发明的一优选实施例:所述操作者在联机输入状态下手写写入信息的切分方法包括步骤:一、获取操作者联机写入的单行手写体信息;二、对所述单行手写体信息进行投影;三、根据投影像素进行计算,判断,切分或合并得到单个手写体信息;
根据本发明的一优选实施例:所述脱机状态下获取的已有手写文档的扫描信息的切分方法包括步骤:一、读入整篇在所述脱机状态下获取的已有手写体信息或图片信息;二、将上述已有手写体信息或图片信息进行格式转化成系统可以识别的格式;三、分离出非文字信息;四、将转化格式后的所述手写体信息进行投影并根据投影像素进行判断,实施行切分;五、对所述行切分信息根据投影像素进行计算,判断,切分或合并得到单个手写体信息。
根据本发明的一优选实施例:所述单个手写体信息的切分包括粗切分、重叠汉字的切分、粘连汉字的切分。
根据本发明的一优选实施例:所述对输入手写体信息的粗切分方法具体包括:计算字符左右边界、字宽wi、平均字宽
Figure A200810009074C00021
、高宽比ri、平均高宽比
Figure A200810009074C00022
、字间距di、平均字间距
Figure A200810009074C00023
,引入判断系数α和β,当ri>α*
Figure A200810009074C00022
时,作为合并的候选,当ri<β*
Figure A200810009074C00022
时,作为切分的候选。
根据本发明的一优选实施例:所述重叠汉字的切分包括步骤:一、获取待切分手写体信息;二、对所述待切分手写体信息进行像素的垂直投影;三、在相连的两投影信息上确定投影最低点,并以该点为界进行重叠汉字的切分。
根据本发明的一优选实施例:所述粘连汉字的切分包括步骤:一、通过傅立叶变换方法确定粘连汉字;二、对所述粘连汉字进行细化处理;三、确定切分点进行粘连汉字的切分。
根据本发明的一优选实施例:所述第三步中所述编辑指令为手写体编辑符或系统提供的编辑选择指令。
根据本发明的一优选实施例:所述第四步中对每次执行编辑指令后受到影响的信息单元进行自动排版包括步骤:一、执行编辑指令完成编辑操作;二、调整受编辑影响各独立信息单元在整体信息单元中的物理位置;三、生成新的整体信息单元接受下次编辑操作。
本发明解决现有技术中存在的第二个技术问题所采用的技术方案为:提供一种手写体编辑符的识别方法,所述手写体编辑符的识别方法包括步骤:第一、将平面坐标系划分为8个方位,通过系统采集到编辑符号的轨迹信息,计算出所述编辑符号轨迹在前后两个坐标之间的变化向量;第二、按方位对所述编码符号进行编码,将编辑符号信息转换成编码信息,所述编码信息描述了所述编辑符号的结构信息;第三、通过语法模式识别出所述编辑符号的编码信息。
根据本发明的一优选实施例:所述第三步中所述语法模式为:每个语法模式为一个数字串,该数字串中的每个数字代表了与笔迹中该数字对应的当前点的位置与前一点的位置之间的差向量最接近的方位。
本发明一种对手写体信息进行快速编辑排版的方法有效的解决了现有技术中存在的技术问题,能灵活、快捷的对在联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑,对于每次完成编辑操作后能马上完成对文档的再排版,使文档内其余信息不受编辑操作的影响,经过编辑后的文档整体性不受影响。
本发明一种手写体编辑符的识别方法有效的解决了现有技术中存在的系统要根据编辑符号的线段长短或符号中线条的倾斜角度与系统内设的符号点值参数进行比对,当操作者写入的编辑符号如果不规范,超出了系统内设符号点值参数可以识别的有效范围时,系统对这些符号变不能识别导致对编辑符的识别准确率低的问题。本发明中通过系统按方位对编码符号进行编码,并将编辑符号信息转换成编码信息,该编码信息描述了编辑符号的结构信息,再通过系统语法模式识别出编辑符号的编码信息由系统执行编辑操作。所以只要操作者输入的编辑符号结构是大体正确的,系统都能正确识别并做出准确判断,这样就提高了操作的准确性和易用性,系统对编辑符的识别错误率非常低。
附图说明
图1.本发明一种对手写体信息进行快速编辑排版的方法流程图;
图2.单行手写体字符切分方法流程图;
图3.脱机手写体整篇汉字切分方法流程图;
图4.二次线性插值算法压缩图像举例示意图;
图5.二次线性插值算法原理图;
图6.位图无损压缩缩小处理流程图;
图7.位图无级放大处理流程图;
图8.初始索引的计算流程图;
图9.未编辑状态下图像的显示流程图;
图10.编辑状态下图像的刷新显示流程图;
图11.识别左选择符时状态机理图;
图12.识别右选择符时状态机理图;
图13.识别复制符时状态机理图;
图14.识别粘贴符时状态机理图;
图15.识别插入符时状态机理图;
图16.识别删除符时状态机理图;
图17.识别剪切符时状态机理图;
图18.识别缩进(或空格)符时状态机理图;
图19.识别回格符时状态机理图;
图20.识别换行符时状态机理图;
图21.语法模式识别法状态机理图;
图22.重叠汉字的切分示意图;
图23.粘连汉字的切分示意图;
图24.多行文档切分方法举例示意图;
图25.在当前手写文档中插入扫描的图片化脱机文档举例示意图;
图26.根据密度比合并中原始单字图像与对应垂直投影对应关系举例示意图;
图27.编辑符结构示意图;
图28.坐标方位编码表示意图;
图29.编辑文档中的删除操作演示示意图;
图30.编辑文档中的插入操作演示示意图;
图31.其它相关编辑操作演示示意图。
具体实施方式:
下面结合附图和实施例对本发明作进一步说明:
请参阅图1本发明一种对手写体信息进行快速编辑排版的方法流程图,如图1所示对手写体信息进行快速编辑排版的方法包括步骤:第一、获取手写体信息;第二、将手写体信息进行切分或合并处理成个体单位的独立信息单元;第三、对切分或合并处理后的所述手写体信息进行编码,并根据需要对所述编码进行存储;第四、建立支持编辑操作的索引,进行索引计算,得出各独立信息单元在整体信息单元中的物理位置,并计算所述信息相对于显示页面的动态索引;第五、输入编辑指令,执行所述编辑指令完成对所述手写体信息的编辑;第六、对每次执行编辑指令后受到影响的信息单元进行自动排版。
其中,第一步中获取手写体信息包括获取联机输入状态下手写写入信息或在脱机状态下获取的已有手写文档的扫描信息。本发明中所述的编辑方法也可以适用于对非手写信息的编辑。
第二步完成对在联机输入状态下手写写入信息的切分或在脱机状态下获取的已有手写文档的扫描信息的切分。具体包括:所述操作者在联机输入状态下手写写入信息的切分方法包括步骤:一、获取操作者联机写入的单行手写体信息;二、对所述单行手写体信息进行投影;三、根据投影像素进行计算,判断,切分或合并得到单个手写体信息。所述脱机状态下获取的已有手写文档的扫描信息的切分方法包括步骤:一、读入整篇在所述脱机状态下获取的已有手写体信息或图片信息;二、将上述已有手写体信息或图片信息进行格式转化成系统可以识别的格式;三、分离出无需进一步切分的非文字信息;四、将转化格式后的所述手写体信息进行投影并根据投影像素进行判断,实施行切分;五、对所述行切分信息根据投影像素进行计算,判断,切分或合并得到单个手写体信息。所述单个手写体信息的切分包括粗切分、重叠汉字的切分、粘连汉字的切分。
第五步中所述编辑指令为手写体编辑符或系统提供的编辑选择指令。
第六步中对每次执行编辑指令后受到影响的信息单元进行自动排版包括步骤:一、执行编辑指令完成编辑操作;二、调整受编辑影响各独立信息单元在整体信息单元中的物理位置;三、生成新的整体信息单元接受下次编辑操作。
具体展开说明:切分处理或合并处理的实现方法及算法。
本发明一种对手写体信息进行快速编辑排版的方法是针对文字信息进行编辑。对于输入构件写入的字符,必须进行准确快速的切分以获得正确的单信息集合,而对于图画和完整地公式等,并不需要进行切分,直接进行缩放处理,对于借助扫描仪等设备读入的整篇手写文字图像中如果有图画和完整地公式等,也不需要进行切分。
切分部分采用了两阶段切分方法:粗切分和细切分,细切分包括重叠字切分和粘连字的切分。
联机输入的汉字切分:
第一、粗切分。对于从输入区获取的单行手写体字符图像,首先对单行图像进行垂直投影。根据像素空白处进行粗切分,获得粗切分字段集,并计算字符左右边界、字宽wi、平均字宽
Figure A200810009074C00021
、高宽比ri、平均高宽比
Figure A200810009074C00022
、字间距di、平均字间距
Figure A200810009074C00023
。通过对不同人的大量手写体汉字训练发现,同一个笔记者完整汉字的高宽比在一定范围内β*
Figure A200810009074C00022
和α*
Figure A200810009074C00022
即变化。当ri>α*
Figure A200810009074C00022
时,作为合并的候选,而ri<β*
Figure A200810009074C00022
,将其作为再切分的候选。
第二、重叠汉字的切分
重叠字,是指两个汉字垂直投影重叠,但是没有共享的像素。举例如附图22所示。
本方法中中我们提出一种基于连通域和垂直投影的重叠字切分算法。首先对于w>
Figure A200810009074C00021
*θ或者高宽比r>β*
Figure A200810009074C00022
的部分,将其作为候选。对候选图像,求背景(图中为白色)求连通域,如果连通域的高度等于候选图像的高度,则证明该候选为重叠汉字,进行重叠字的切分。
首先对候选图像,进行像素垂直投影,在中间位置一定范围内(经验值)找到投影最低点c,作为候选切分位置。如附图22中竖线标注,即为候选位置处粗切分线。以位置c为中心,对图像作加窗处理,窗口宽度为w,如附图22中点线标注所示。从上到下按行ri处理,如果粗分线经过背景,则该位置加入到切分位置数组,slice[ri]=c。否则的话,粗分线在该行经过前景点。判断笔画的归属。方法:填充窗口内该行c列往右的像素为前景,然后通过前述的计算背景连通域高度的方法,判断连通性。如果不连通了,说明笔画属于左边,我们求出该点开始粗分线右边的前景连通域,把该连通域的每行最右点对应的列cj加入到切分位置数组,即slice[ri]=cj。然后继续处理连通域最后一行的下一行,直至处理完所有行。判断笔画属于右边汉字的处理过程相似。如果左右填充后,均连通,则应用高宽比、字宽等知识判断其归属,然后采用求slice数组的方法。根据slice数组中的值,将原来重叠的汉字,分成独立的汉字,如附图22所示结果。红色像素左边和右边分别为一个完整的汉字。
第三、粘连汉字的切分
粘连汉字的切分举例如附图23所示。
粘连汉字,指的是两个汉字不仅垂直投影重叠,而且有笔画连接在一起,共享一定像素区域。用傅立叶变换方法判断其是否为粘连字段。若为粘连字段,近一步切分成几个单字符。切分方法为:首先对原图像进行细化操作,得到细化图像,原图像垂直投影,得到粗切分列的位置c(图中竖直线对应的位置)。对于粘连汉字中的三种点:叉点、端点和角点,其中叉点、角点可作为候选点。细化图像中从粗切分位置向两边扫描寻找候选分割点,对应细化图像中所示A、B两点为找到的叉点候选点。结合汉字高宽比、字宽、方差等信息,选择一个合适的候选,本例中为B点。因为B在粗切分右边,所以在原图像中,把从B点开始的向左和向下方向的连续前景(黑色)变为背景(白色)。若为左侧,则向右向下改变连续前景为背景。改变后的图像如前景变背景效果图所示。至此,我们可采用重叠字的切分方法进行切分,得到切分结果显示。
上述单行手写体字符切分方法流程图可以参阅图2。
脱机文字图像切分
读入整篇手写体字符图像,用户首先标示出该文字图像中不需要切分的信息单元,如字图像、公式等。对余下部分,系统判断其是否为多行图像。对多行图像的切分方法为:对多行文本图像进行水平投影发现,不同行的像素投影重叠现象严重,这是由于文本行书写时切斜所造成的。而书写倾斜是无限制自由手写体汉字书写中的常见问题,因此多行切分需重点解决这一问题。解决的思想是:对于总体趋势倾斜的行,我们可以将其分为若干个切斜角度很小的行拼接成的。这样,将一整篇文档(高为h,宽为w)划分为6(经验值)篇高为h,宽度1/6*w的子文档。对每篇子文档根据水平投影切分,切分过程与单行粗切分思想相同。然后按对应行号将子行重新合并成行。然后我们对每一行文字,采取与联机输入汉字图像切分相同的策略进行切分,该切分方法流程图可以参阅图3。具体多行文档切分方法举例可参阅附图24。
在当前手写文档中插入扫描的图片化脱机文档的例子可以参阅附图25:
过分部分合并。许多汉字都是左右结构的,这样当书写比较分散时,粗切分会将该汉字的左右部分切分成两个以上部分。必须采取算法将它们合并。本方法中我们结合3种方法进行合并,保证合并的准确。实验证明,取得了很好的效果。这三种方法分别是基于汉字高宽比合并,基于字间距合并和基于密度比合并。以下分别介绍:
一、根据高宽比合并:
用pi表示第i部分,其高宽比对应为ri
Do{//合并候选表List
   计算合并前方差S1
   Pi=List.get(0);//读List表头元素
   List.Delete(0);//读取后删除头元素
   Float Lr=Rate(pi,pi-1);//Rate()计算pi左合并的高宽比并附值Lr
   Float Rr=Rate(pi,pi+1);//pi右合并后高宽比并附值Rr
   If(Lr>α*
Figure A200810009074C00022
){//左合并后仍是候选
      P=Merge(pi,pi-1);//合并pi和pi-1为p;
      List.Add(0,p);//p添加到表头以便继续处理
   }
   else If(Rr>α*
Figure A200810009074C00022
){//右合并后仍是候选
      P=Merge(pi,pi+1);//合并pi和pi+1为p;
      List.Add(0,p);//p添加到表头以便继续处理
   }
   else{
      r=Lr和RR中更接近
Figure A200810009074C00022
的一个;
      if(Lr比RR接近
Figure A200810009074C00022
)P=Merge(pi,pi+1);
      else P=Merge(pi,pi+1);
      重新计算高宽比方差S;
      If(r<β*
Figure A200810009074C00022
||w>w*θ||S>γ*S1){
         Cancel();//取消不合理的合并
      }
   }
}while(List不为空);
二、根据密度比合并:
同时训练发现,相邻的两个部分,例如pi,pi+1。如果,pi的像素数量与pi+1的像素数量比值大于一定阈值,则在直方图投影上,显示出明显的密度大小差距,即相邻两个部分投影面积的差距很明显。具体举例可以参阅附图26。
我们通过计算某个部分的密度值,结合考虑汉字高宽比,字间距、密度比等信息,从左右邻居中选择最合适的一个与其合并。合并后也必须保证高宽比方差减小并且r>β*
Figure A200810009074C00022
,并且合并后字宽小于
Figure A200810009074C00021
*θ,否则取消合并。
三、根据间距合并:
根据人们的书写习惯,以及训练结果显示,人们书写汉字时,往往字间的距离要大于汉字部首间的距离。如果相邻两个部分的间距小于平均字间距
Figure A200810009074C00023
,则考虑合并这两个部分。当然,结合考虑汉字高宽比,字间距等信息,从左右邻居中选择最合适的一个与其合并。对于不合适的合并要予以取消。
压缩部分的实现方法及算法:
压缩部分的主要功能:是完成对切分后的文字图像进行无损压缩存储,将输入的文字的手写特征尽可能多的保存下来,提供给索引作存储要占用尽可能少的存储空间;同时,对编辑显示状态下的候选文字作放大的操作,要保证文字的无限放大不失真,无锯齿,保留原有书法特征。
传统的图像放大算法是将每一象素在水平和垂直的方向上重复显示若干次,而缩小算法是将源文件每隔若干个象素取出一个象素。这种简单的放大方法对于灰度图像,伪彩和真彩色图像来说,还勉强可以接受,量化后相邻象素间的差值不是很大。但对于二值图像来说,放大后会形成色块,图像反差强烈,效果不佳,特别是曲线或存在噪声的情况下,这一现象尤为明显。
本方法中的图像的预处理采用基于双线性插值的缩放算法,缩小采用基于像素交迭的等权值矩阵缩小算法;放大采用边缘检测算法,位图形状转化为矢量图形,再进行像素填充的方法进行缩放处理。
第一、切分图像的归一化压缩处理:二次线性插值算法压缩图像举例示意图如图4所示。缩放映射原理:
(Sx-0)/(Swidth-0)=(Dx-0)/(Dwidth-0)
              Sx=Dx*Swidth/Dwidth
(Sy-0)/(Shight-0)=(Dy-0)/(Dhight-0)
              Sy=Dy*Shight/Dheight
聚焦看看(Sx,Sy)坐标点(Sx,Sy为浮点数)附近的情况,如图5所示。
二次线性插值需要考虑(Sx,Sy)坐标点周围的4个颜色值Color0\Color1\Color2\Color3,把(Sx,Sy)到A\B\C\D坐标点的距离作为系数来把4个颜色混合出缩放后点的颜色;(u=Sx-floor(Sx);v=Sy-floor(Sy);说明:floor函数的返回值为小于等于参数的最大整数)
二次线性插值公式为:
tmpColor0=Color0*(1-u)+Color2*u
tmpColor1=Color1*(1-u)+Color3*u
DstColor=tmpColor0*(1-v)+tmpColor2*v
展开公式为:
pm0=(1-u)*(1-v)
pm1=v*(1-u)
pm2=u*(1-v)
pm3=u*v
则颜色混合公式为:
DstColor=Color0*pm0+Color1*pm1+Color2*pm2+Color3*pm3
等权值缩小算法(图象的缩小灰度级显示算法):
若位图图像是二值的,缩小显示的时候由于n个点转化成一个点会导致图像局部细节信息丢失,比如一条宽度一个象素的细线由于缩小可能就会没有显示,而使用灰度级显示能解决这个缩小显示的问题。
基本约定:
一、灰度级缩小显示只针对黑白或者灰度影像
二、只有在显示<100%的时候灰度级显示才生效
三、灰度级缩小算法是基于原始图像来运算
具体算法:
一、缩小算法
按照与原图比例1:n来对原图n*n个点生成1个点(n可以是浮点数),考虑到效率可以使用灰度级变换,从0-255取中间点127大于该值显示白小于改值显示黑色。
二、灰度级显示算法
结合缩小算法n*n个点生成一个点的原则,在原图上按照每个点的权值和颜色相乘再除以n来得到生成点的颜色值。这是一维坐标,扩展到二维空间算法相同。
位图压缩缩小处理流程图可以参阅图6。
具体展开说明:索引图像的无级放大
位图无级放大处理流程图可以参阅图7。
一、Perwitt算子边缘检测:
经典的插值方法,插值后的图像会出现边缘模糊或边缘锯齿等现象,这是因为这些传统的图像缩放方法实质上是对源图像建立了连续的数学模型,没有考虑边缘部分的高频信息损失的问题。人眼对图像的边缘部分特别敏感,插值后图像的边缘性质对一幅图像的质量有十分重要的影响。为使插值后的图像边缘保持良好的特性,采用基于Perwitt算子边沿检测方法的图像缩放算法,先检测边沿,对确认为处于边缘区域的像素,插值沿边沿方向进行;对平坦区域的像素,进行插值。该算法能在很大程度上消除插值后图像边缘的模糊和锯齿现象,提高插值后图像的视觉质量。
基于Perwitt算子的边缘检测算法基本步骤包括:
第一、滤波。边缘检测主要基于导数计算,但受噪声影响。但滤波器在降低噪声的同时也导致边缘强度的损失。
第二、增强。增强算法将邻域中灰度有显著变化的点突出显示。一般通过计算梯度幅值完成。
第三、检测。但在有些图象中梯度幅值较大的并不是边缘点。最简单的边缘检测是梯度幅值阈值判定。
第四、定位。精确确定边缘的位置。
边缘检测算法流程:
第一步:用高斯滤波器平滑图象;
第二步:用一阶偏导的有限差分来计算梯度的幅值和方向;
第三步:对梯度幅值进行非极大值抑制;
第四部:用双阈值算法检测和连接边缘。
二、位图形状转矢量图形缩放:
当字号特别大时,用字做的图边缘部分不平滑,采用将提取出的字体边缘转换为矢量图形,采用矢量缩放算法进行平滑缩放,然后绘出笔画轮廓填充之。在有些情况下,即使用平滑的曲线绘画仍然不可避免的会有锯齿,这是人的视觉特征决定的,所以仍然需要优化。
一般的矢量缩放应用很好的处理软件之所以会感觉平滑,是因为它在字体边缘部分增加了过渡区,在前景色和背景色做了一个平滑的色彩过渡。之所以感觉没有锯齿,是利用了人的视觉心理特征。所以在处理的后期,还需要在绘制好的文字边缘增加过渡色彩,这样就会感觉相当平滑。
另外由于设备分辨率有限,在屏幕上绘各种几何曲线都会有“锯齿”形,锯齿大小为一个像元。字体能无级缩放,不论放大多少“锯齿”总是一像元大,而字体的“锯齿”会随字形放大而增大。为了使感觉没有锯齿,可采用特殊算法,如反走样法进行优化。
显示平台的处理流程:
显示主要完成对初始输入文本的压缩存储与初始显示,以及编辑状态下文本的快速定位,刷新显示,主要流程包括:如图8所示的初始索引的计算流程图;图9所示的未编辑状态下图像的显示和图10所示的编辑状态下图像的刷新显示流程图.为了确定每个信息单元在当前显示页面上的物理位置,采用了如下方法计算当前单元的坐标(xcur,ycur):设前一个单元的坐标为(xpre,ypre),宽度为wpre’wcur为当前单元的宽度;WIDTH为页面的显示宽度,X_Margin、Y_Margin分别表示页面的上下边距,Unit_Interv表示显示单元之间的横向间隔,Row_Interv表示行距。
判断前一个单元是否为空,如果为空,则:
xcur=X_Margin
ycur=Y_Margin
否则,判断前一个单元的类型,如果为换行符或换页符:
xcur=X_Margin
ycur=ypre+Row_Interv
否则,如果前一个单元是其他类型:
计算出判断因子λ,
Figure A200810009074D00121
(λ=0,1),那么当前单元的坐标为:
xcur=(1-λ)*(xpre+wpre+Unit_Interv+λ*X_Margin
ycur=ypre+λ*Row_Interv
坐标修正:
设imageCollection记录了当前页面中已经出现的图像单元信息,则判断当前单元的坐标是否“落”到任一图像单元内,更新(xcur,ycur)直到当前单元不“落”在任一图像内。
存储及索引
一、存储及索引的结构:
将每幅压缩完毕的图像按像素展开成为一维数组,将每个字的宽度和总长度放在数组的最前端,设一位的添加删除位。这样文档的内容便存储在一系列的数组中。全局索引的结构分两个部分,第一个字节存储的内容为对应字的图像在全文中的位置,第二个字节存放的为图像数据在文件中存储的位置。动态索引记录下了每个显示在操作页面上的字图像开始显示时左上角的坐标值,动态索引的作用在于能够根据光标的位置快速准确地定位光标所选定的图像。动态索引在打开文件时创建,关闭文件时删除,并不保存在文件中。
文档的结构均由特殊字符控制,特殊字符和文字图像一同存储在文档内容中,特殊字符包括:换行符,段落符,分栏符,首字缩进符,空行符。每遇到特殊字符时,在如三所述的显示过程中采取特殊操作,从而控制文档显示的格式。
二、索引支持的添加删除编辑操作
经过如五所述的方法识别出添加或者删除的动作,选定将要添加或者删除的文字图像,根据动态索引所存储的坐标,定位将要添加或者删除的位置,先在索引中进行编辑操作。添加时将索引添加在正确的位置上,文字图像内容直接加在文件的末端,删除时先只在索引中将对应文字图像的索引删除,并将文字图像的删除位置1,直到用户保存文档时才真正将文字图像内容从文件中删除。
三、缓冲区保存操作
每当打开一个文字图像文档时在内存中设置缓冲区,用来保存近20步的操作,用来在特殊情况下的文档修复工作。
编辑部分的实现方法及算法
一、编辑符的确定
确定编辑符时,我们应该以简单、方便、符合我们的手写习惯为根本原则,确定了左选择符、右选择符、复制符、粘贴符、插入符、删除符、剪切符、缩进(或空格)符、回格符和换行符,各编辑符的结构示意图可以参阅附图27。
虽然每个编辑操作的具体功能在显示设备上具体显示是不一样的,但他们的执行过程是一样的,即:
第一,确定编辑操作的当前位置;
第二,确定用户发出的编辑指令;
第三,根据对应的编辑指令执行相应的操作,具体来说,所定义的操作指令执行的所执行的操作不同的系统可以定义不同行为,以下给出其中一种常用的行为模式,但本方法并不限定于以下模式:
插入操作:确定当前位置,等待新的信息单元从输入构建输入,在索引中插入新的信息单元信息,刷新显示页面;
左选择操作:系统记录当前位置所对应的信息单元,并等待右选择操作,如果下一个操作不是右选择,则该操作撤销;
右选择操作:如果上一个操作是左选择,记录当前信息单元,如果当前信息单元的位置在左选择记录的信息单元之前,则撤销左右选择操作,否则,将系统记录的左选择操作的信息单元到当前信息单元之间的所有信息进行标记为已选择,等待下一步操作;
删除操作:确定被选择的信息单元为非空,从索引中删除被选定的信息单元,刷新显示;
复制操作:清空复制缓冲区,将标记为已选择的信息单元拷贝到缓冲区;
粘贴操作:确定操作的当前位置,将复制缓冲区中的信息单元在当前位置插入,刷新显示;
剪切操作:先对所选定的信息单元执行复制操作,再对所选定的信息单元执行删除操作;
缩进操作:先执行插入操作,并自动插入一个空格后结束插入操作;
回格操作:自动执行左右选择操作选定当前位置的前一个信息单元,并执行删除操作;
换行操作:确定当前位置,在当前位置插入一个换行符,刷新显示。
二、编辑符的识别
编辑符的识别可以用语法模式识别法(构造自动机识别):
将平面坐标系划分为8个方位,8个坐标方位分别编码为:0,1,2,3,4,5,6,7。通过系统采集到编辑符的轨迹信息,并进行平滑和采样,计算出编辑符轨迹在前后两个采样点坐标之间的变化向量,根据向量的方向在对应的方位对其分别进行编码,组成一个码串,此串描述了该编辑符的结构信息,也称为该编辑符的语法模式;通过语法模式识别方法设计识别器(自动机)识别出该编辑符。
坐标方位编码表可以参阅附图28,如附图28(一)所示:
识别算法如下:
屏幕中的坐标系如附图28(二)所示。
首先,根据由系统得到的轨迹信息求出该轨迹的特征码串,假设,该轨迹的点序列如下:
(X1,Y1),(X2,Y2),.....(Xi,Yi),(Xi+1,Yi+1),....(Xn-1,Yn-1),(Xn,Yn)
计算任何两个相邻点的变化向量,见附图28中的(三)。得到n-1个变化向量:
(X2-X1,Y2-Y1),.......(Xi+1-Xi,Yi+1-Yi)..........(Xn-Xn-1,Yn-Yn-1)
计算每个变化向量所对应的特征码:
假设,(a,b)为上面n-1个变化向量中的一个元素,它与X轴的角度为θ,参见附图28中的(四)。计算θ的余弦: cos &theta; = a / a 2 + b 2 ;
计算其反余弦得到角度 &alpha; = arccos ( a / a 2 + b 2 ) , 如果b≥0,则θ=α;否则,θ=2π-α。
根据θ在坐标方位图中对应的位置判断该变化向量与表一中哪一个方位最接近,该变化向量对应的特征码即为该方位的编号(0-7).
同理,可得到该轨迹的所有变化向量的特征码。假设,整个特征码串为:
λ1,λ2,.......λi.......λn-1,λn.(其中,λn=-1,表示串的结束)
其次,设计自动机依次识别各个编辑符
手写编辑符的时候,存在颤抖,也就不可避免的有噪音,因此我们得到的特征码串也包含噪音,所以在设计自动机识别的时候一定要能够容忍这些噪音。为此,我们采取了如下措施:
只要所识别的码串中的码元对某一编辑符特征码串的符合率达到一定的阈值,如80%,我们就认为当前所识别的码串就是该编辑符。为此,我们记录下特征码串中的符合某一编辑符特征的每一个分量的个数,以及它们的总数,只有每个分量个数和总数达到一定的阈值,我们才认为识别出了该编辑符。以下对各所述编辑符的识别进行详述:
左选择符的识别:
手写的左选择符对应的码串:2322210010。它的特征码就是2和0,里面存在着噪音码3,1,但该码串中2和0以及二者在整个码串中所占的比例达到一定的阈值,我们就认为,该轨迹就是左选择符。附图请参阅图11识别左选择符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
右选择符的识别:
手写的右选择符对应的码串:2322234454。它的特征码就是2和4,里面存在着噪音码3,5,但该码串中2和4以及二者在整个码串中所占的比例达到一定的阈值,我们就认为,该轨迹就是右选择符。附图请参阅图12识别右选择符时状态机理图,图中,C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
复制符的识别
手写的复制符对应的码串:6,5,4,3,3,3,2,2,0,0。标准的复制符的特征码是5,4,3,2,1,0,7;由于手写的复制符的随意性,并不是每个特征码都会出现在我们得到的码串中,如果严格的要求每一个特征码的先后关系,那么对于不同人有不同手写习惯的复制符来说识别率将会非常低,因此,我们必须设计一比较灵活、对特征码限制较为宽松的状态机,同时排除一些由于状态机限制宽松而有可能混淆的类似的编辑符。附图请参阅图13识别复制符时状态机理图,图中:C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别;C_2_0:当前码串中出现特征码2和0的总数;C_3_1:当前码串中出现特征码3和1的总数;C_4_2:当前码串中出现特征码4和2的总数;C_1_7:当前码串中出现特征码1和7的总数;C_3_0:当前码串中出现特征码3和0的总数;C_4_1:当前码串中出现特征码4和1的总数。
粘贴符的识别
手写的复制符对应的码串:6,0,0,2,2,3,3,3,4,5。标准的粘贴符的特征码是7,0,1,2,3,4,5;同复制符的识别类似。附图请参阅图14识别粘贴符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别;C_2_4:当前码串中出现特征码2和4的总数;C_1_3:当前码串中出现特征码1和3的总数;C_0_2:当前码串中出现特征码0和2的总数;C_7_1:当前码串中出现特征码7和1的总数;C_0_3:当前码串中出现特征码0和3的总数;C_1_4:当前码串中出现特征码1和4的总数。
插入符的识别
手写的右选择符对应的码串:67776012112。它的特征码就是7和1,但在手写插入符的时候,特征码6和7,1和2很难区分,所以,在识别插入符的时候,我们将之等同,这可以大大地提高其识别率。附图请参阅图15识别插入符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
删除符的识别
删除符是由两条横线组成,我们一次识别它的一半,即一次识别一条横线。手写的左选择符对应的码串:1000770001。它的特征码就是0,里面存在着噪音码7,1,但该码串中0在整个码串中所占的比例达到一定的阈值,我们就认为,该轨迹就是一条横线。附图请参阅图16识别删除符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
剪切符的识别
剪切符是由两条斜线组成,我们一次识别它的一半,即一次识别一条斜线。我们称从左边开始的斜线为左剪切符,从右边开始的叫右剪切符。手写的左剪切符对应的码串:211111011。它的特征码就是1,里面存在着噪音码2,1。手写的右剪切符对应的可能的码串:2333332334。它的特征码就是3,里面存在着噪音码2,4。附图请参阅图17识别剪切符时状态机理图,图中λ:剪切符的特征码,其中,λ=1时,是左剪切符:λ=3时,是右剪切符;C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
空格(缩进)符的识别
手写的空格符对应的码串:01110233434。它的特征码就是1和3,但在手写空格符的时候,特征码0和1,4和3很难区分,所以,在识别空格符的时候,我们将之等同,这可以大大地提高其识别率。附图请参阅图18识别空格(缩进)符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
回格符的识别
手写的回格符对应的码串:33434201110。它的特征码就是3和1,但在手写回格符的时候,特征码4和3,0和1很难区分,所以,在识别回格符的时候,我们将之等同,这可以大大地提高其识别率。附图请参阅图19识别空格(缩进)符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
换行符的识别
手写的换行符对应的码串:1001023222。它的特征码就是0和2,里面存在着噪音码1,3,但该码串中2和0以及二者在整个码串中所占的比例达到一定的阈值,我们就认为,该轨迹就是换行符。附图请参阅图20识别空格(缩进)符时状态机理图,图中C1:符合某编辑符的单个特征码的个数;C2:所有符合某编辑符的单个特征码的个数;Cerr:已经出错的编辑码的个数;T1:单个特征码必须达到的阀值;T2:符合编辑符的所有特征码的个数须达到的阀值;Terr:如果Cerr超过该值就认为该轨迹不能被识别。
编辑操作序列要有一定的限制,比如,要复制一段图像文字,先要选定该段图像文字;采用状态机来实现不同编辑操作之间的先后制约关系。该语法模式识别法整体状态机理图,可以参阅图21。
以下对操作过程进行举例说明:
编辑文档中的删除操作,如附图29所示:
编辑文档中的插入操作,如附图30所示:
其它相关操作演示示意图如附图31所示:
以上实施例中作为举例说明采用了手写体编辑符作为编辑指令,本发明的编辑操作也可以采用系统提供的编辑选择指令完成编辑操作,具体原理和上述原理相同,也应视为本发明的保护范围。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干推演或替换,都应当视为属于本发明的保护范围。

Claims (12)

1.一种手写体信息快速编辑排版的方法,其特征在于:所述手写体信息快速编辑排版的方法包括步骤:
A:将手写体信息进行切分或合并处理成个体单位的独立信息单元;
B:对切分或合并处理后的所述手写体信息进行编码,建立支持编辑操作的索引,进行索引计算,得出各独立信息单元在整体信息单元中的物理位置,并计算所述信息相对于显示页面的动态索引;
C:输入编辑指令,执行所述编辑指令完成对所述手写体信息的编辑;
D:对每次执行编辑指令后受到影响的信息单元进行自动排版。
2.根据权利要求1所述编辑排版的方法,其特征在于:所述步骤A中对所述手写体信息的切分包括操作者在联机输入状态下手写写入信息的切分和在脱机状态下获取的已有手写文档的数字化信息的切分。
3.根据权利要求2所述编辑排版的方法,其特征在于:所述操作者在联机输入状态下手写写入信息的切分方法包括步骤:
A1:获取操作者联机写入的单行手写体信息;
A2:对所述单行手写体信息进行投影;
A3:根据投影像素进行计算,判断,切分或合并得到单个手写体信息;
4.根据权利要求2所述编辑排版的方法,其特征在于:所述脱机状态下获取的已有手写文档的扫描信息的切分方法包括步骤:
a1:读入整篇在所述脱机状态下获取的已有手写体信息或图片信息;
a2:将上述已有手写体信息或图片信息进行格式转化成系统可以识别的格式;
a3:分离出图片信息;
a4:将转化格式后的所述手写体信息进行投影并根据投影像素进行判断,实施行切分;
a5:对所述行切分信息根据投影像素进行计算,判断,切分或合并得到单个手写体信息。
5.根据权利要求3或4所述编辑排版的方法,其特征在于:所述单个手写体信息的切分包括粗切分、重叠汉字的切分、粘连汉字的切分。
6.根据权利要求5所述编辑排版的方法,其特征在于:所述对输入手写体信息的粗切分方法具体包括:计算字符左右边界、字宽wi、平均字宽
Figure A200810009074C00021
、高宽比ri、平均高宽比
Figure A200810009074C00022
、字间距di、平均字间距
Figure A200810009074C00023
,引入判断系数α和β,
当ri>α*
Figure A200810009074C00022
时,作为合并的候选,
科吉华烽
当ri<β*
Figure A200810009074C00022
时,作为切分的候选。
7.根据权利要求5所述编辑排版的方法,其特征在于:所述重叠汉字的切分包括步骤:
E:获取待切分手写体信息;
F:对所述待切分手写体信息进行像素的垂直投影;
G:在相连的两投影信息上确定投影最低点,并以该点为界进行重叠汉字的切分。
8.根据权利要求5所述编辑排版的方法,其特征在于:所述粘连汉字的切分包括步骤:
H:通过傅立叶变换方法确定粘连汉字;
I:对所述粘连汉字进行细化处理;
J:确定切分点进行粘连汉字的切分。
9.根据权利要求1所述编辑排版的方法,其特征在于:所述步骤C中所述编辑指令为手写体编辑符或系统提供的编辑选择指令。
10.根据权利要求1所述编辑排版的方法,其特征在于:所述步骤D中对每次执行编辑指令后受到影响的信息单元进行自动排版包括步骤:
K:执行编辑指令完成编辑操作;
L:调整受编辑影响各独立信息单元在整体信息单元中的物理位置;
M:生成新的整体信息单元接受下次编辑操作。
11.一种手写体编辑符的识别方法,其特征在于:所述手写体编辑符的识别方法包括步骤:
N、将平面坐标系划分为8个方位,通过系统采集到编辑符号的轨迹信息,计算出所述编辑符号轨迹在前后两个坐标之间的变化向量;
0、按方位对所述编码符号进行编码,将编辑符号信息转换成编码信息,所述编码信息描述了所述编辑符号的结构信息;
P、通过语法模式识别出所述编辑符号的编码信息。
12.根据权利要求11所述手写体编辑符的识别方法,其特征在于:所述步骤P中所述语法模式为:每个语法模式为一个数字串,该数字串中的每个数字代表了与笔迹中该数字对应的当前点的位置与前一点的位置之间的差向量最接近的方位。
CN2008100090746A 2007-12-04 2008-01-26 手写体信息快速编辑排版方法 Active CN101452444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100090746A CN101452444B (zh) 2007-12-04 2008-01-26 手写体信息快速编辑排版方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNA2007100775787A CN101183283A (zh) 2007-12-04 2007-12-04 一种直接写入手写体信息的方法
CN200710077578.7 2007-12-04
CN2008100090746A CN101452444B (zh) 2007-12-04 2008-01-26 手写体信息快速编辑排版方法

Publications (2)

Publication Number Publication Date
CN101452444A true CN101452444A (zh) 2009-06-10
CN101452444B CN101452444B (zh) 2010-12-08

Family

ID=39448583

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA2007100775787A Pending CN101183283A (zh) 2007-12-04 2007-12-04 一种直接写入手写体信息的方法
CN2008100090746A Active CN101452444B (zh) 2007-12-04 2008-01-26 手写体信息快速编辑排版方法
CN200810144531A Active CN100578432C (zh) 2007-12-04 2008-07-22 一种直接写入手写体信息的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2007100775787A Pending CN101183283A (zh) 2007-12-04 2007-12-04 一种直接写入手写体信息的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200810144531A Active CN100578432C (zh) 2007-12-04 2008-07-22 一种直接写入手写体信息的方法

Country Status (1)

Country Link
CN (3) CN101183283A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034449A (zh) * 2012-12-17 2013-04-10 上海海知信息技术有限公司 在笔迹图像上触屏移动光标的方法、输入法以及输入系统
CN103049204A (zh) * 2012-12-17 2013-04-17 上海海知信息技术有限公司 在笔迹图像上移动光标的方法、输入法以及输入系统
CN103049201A (zh) * 2012-12-17 2013-04-17 上海海知信息技术有限公司 手写输入法的保存方法及输入法及操作系统及数据终端
CN103049202A (zh) * 2012-12-17 2013-04-17 上海海知信息技术有限公司 一种在笔迹上图像进行触屏换行操作的方法
CN103064616A (zh) * 2012-12-17 2013-04-24 上海海知信息技术有限公司 一种手写输入法笔迹图像的分享方法及输入法
CN103218152A (zh) * 2012-12-17 2013-07-24 上海海知信息技术有限公司 一种在笔迹图像上进行触屏编辑的方法
CN103218153A (zh) * 2012-12-17 2013-07-24 上海海知信息技术有限公司 一种在笔迹上图像进行换行操作的方法
CN103324396A (zh) * 2012-12-17 2013-09-25 上海海知信息技术有限公司 在笔迹图像上进行编辑的方法
CN107608612A (zh) * 2017-08-21 2018-01-19 广州视源电子科技股份有限公司 书写笔迹的对齐显示方法、电子装置及可读存储介质
CN108733300A (zh) * 2018-05-18 2018-11-02 三星电子(中国)研发中心 用于交互式电子白板的编辑方法和编辑装置
CN111738771A (zh) * 2014-01-03 2020-10-02 电子湾有限公司 可折叠广告和跟随广告
CN112613512A (zh) * 2020-12-29 2021-04-06 西北民族大学 基于结构属性的乌金体藏文古籍字符切分方法及系统
CN112651323A (zh) * 2020-12-22 2021-04-13 山东山大鸥玛软件股份有限公司 一种基于文本行检测的中文手写体识别方法及系统
CN113255652A (zh) * 2021-07-09 2021-08-13 北京世纪好未来教育科技有限公司 文本修正方法、装置、设备及介质

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833411B (zh) * 2009-03-09 2015-09-16 诺基亚公司 用于笔迹输入的方法和设备
CN101996029B (zh) * 2009-08-24 2013-04-03 北京三星通信技术研究有限公司 手写数学表达式识别编辑装置及其方法
CN101667102B (zh) * 2009-09-21 2012-06-13 宇龙计算机通信科技(深圳)有限公司 个性化字体的实现方法及其相应的电子终端
CN102012748B (zh) * 2010-11-30 2012-06-27 哈尔滨工业大学 语句级中英文混合输入方法
CN102915530B (zh) * 2011-08-01 2015-11-25 佳能株式会社 用于分割输入图像的方法和装置
CN102279709B (zh) * 2011-08-26 2013-01-02 中国科学院合肥物质科学研究院 一种手写笔迹信息获取方法
CN102306388B (zh) * 2011-08-29 2013-09-18 北京捷通华声语音技术有限公司 一种反笔形走样的方法和装置
CN103136769B (zh) * 2011-12-02 2016-02-03 北京三星通信技术研究有限公司 用户书写风格字体生成的方法和装置
CN103186235B (zh) * 2011-12-31 2015-11-25 北大方正集团有限公司 一种手写输入的处理方法及装置
CN102981902A (zh) * 2012-12-10 2013-03-20 广东欧珀移动通信有限公司 基于智能移动终端的屏保方法及其智能移动终端
CN103049097B (zh) * 2012-12-17 2018-06-19 上海海知信息技术有限公司 一种手写输入法的突出显示方法及手写输入法
CN104111914B (zh) * 2013-04-16 2017-09-12 北大方正集团有限公司 一种文档审校方法及装置
CN103268363B (zh) * 2013-06-06 2016-06-22 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法
CN103640341B (zh) * 2013-11-25 2015-12-09 新昌县镜岭镇柳良轴承厂 纸质书法作品的复制装置
CN104731390A (zh) * 2013-12-18 2015-06-24 深圳富泰宏精密工业有限公司 保存原笔迹手写字的系统及方法
CN104731359A (zh) * 2013-12-19 2015-06-24 鸿合科技有限公司 一种手写字符的处理方法和装置
CN104243929A (zh) * 2014-09-26 2014-12-24 武汉烽火众智数字技术有限责任公司 一种电子地图上摄像机可视范围的展示方法
CN106780412B (zh) * 2016-11-28 2020-04-14 西安精雕软件科技有限公司 一种利用手写体骨架线生成加工路径的方法
CN107422969B (zh) * 2017-04-13 2020-07-03 北京乐步教育科技有限公司 红外线触摸屏、红外线触摸屏的缩放方法和装置
CN107330957A (zh) * 2017-05-24 2017-11-07 浙江大学 一种具有图层之间映射联动关系的图像处理方法
CN107392973B (zh) * 2017-06-06 2020-01-10 中国科学院自动化研究所 像素级手写体汉字自动生成方法、存储设备、处理装置
CN112513800B (zh) * 2018-08-22 2024-03-12 深圳市欢太科技有限公司 一种速记方法及装置、终端、存储介质
CN109670069A (zh) * 2018-11-13 2019-04-23 厦门分类信息技术有限公司 一种书法文字图像的排版方法及排版系统
CN109635718B (zh) * 2018-12-10 2021-02-02 科大讯飞股份有限公司 一种文本区域划分方法、装置、设备及存储介质
CN111078073B (zh) * 2019-12-17 2021-03-23 科大讯飞股份有限公司 一种笔迹放大的方法和相关装置
US11823474B2 (en) 2020-10-27 2023-11-21 Boe Technology Group Co., Ltd. Handwritten text recognition method, apparatus and system, handwritten text search method and system, and computer-readable storage medium
CN112861471A (zh) * 2021-02-10 2021-05-28 上海臣星软件技术有限公司 对象显示方法、装置、设备及存储介质
CN115562543B (zh) * 2022-01-10 2023-08-11 荣耀终端有限公司 一种电子设备的控制方法及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1156741C (zh) * 1998-04-16 2004-07-07 国际商业机器公司 手写汉字识别方法及装置
CN1267015A (zh) * 1999-03-13 2000-09-20 练新 通用多功能汉字编码方法及处理系统
CN1288183A (zh) * 1999-09-14 2001-03-21 王德伟 显示和识别手写多字符书面语言输入装置
CN1378153A (zh) * 2001-04-04 2002-11-06 掌握趋势有限公司 手写输入信息处理装置
CN100485711C (zh) * 2003-05-16 2009-05-06 中国地质大学(武汉) 手写字体的计算机识别与自动输入方法
CN1758194A (zh) * 2004-10-08 2006-04-12 华为技术有限公司 一种实现手写输入非字母文字的方法
JP4733415B2 (ja) * 2005-04-05 2011-07-27 シャープ株式会社 電子文書の表示装置及び方法、並びにコンピュータプログラム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218153A (zh) * 2012-12-17 2013-07-24 上海海知信息技术有限公司 一种在笔迹上图像进行换行操作的方法
CN103034449A (zh) * 2012-12-17 2013-04-10 上海海知信息技术有限公司 在笔迹图像上触屏移动光标的方法、输入法以及输入系统
CN103049201A (zh) * 2012-12-17 2013-04-17 上海海知信息技术有限公司 手写输入法的保存方法及输入法及操作系统及数据终端
CN103049202A (zh) * 2012-12-17 2013-04-17 上海海知信息技术有限公司 一种在笔迹上图像进行触屏换行操作的方法
CN103064616A (zh) * 2012-12-17 2013-04-24 上海海知信息技术有限公司 一种手写输入法笔迹图像的分享方法及输入法
CN103218152A (zh) * 2012-12-17 2013-07-24 上海海知信息技术有限公司 一种在笔迹图像上进行触屏编辑的方法
CN103049204A (zh) * 2012-12-17 2013-04-17 上海海知信息技术有限公司 在笔迹图像上移动光标的方法、输入法以及输入系统
CN103324396A (zh) * 2012-12-17 2013-09-25 上海海知信息技术有限公司 在笔迹图像上进行编辑的方法
CN111738771A (zh) * 2014-01-03 2020-10-02 电子湾有限公司 可折叠广告和跟随广告
CN107608612A (zh) * 2017-08-21 2018-01-19 广州视源电子科技股份有限公司 书写笔迹的对齐显示方法、电子装置及可读存储介质
CN108733300A (zh) * 2018-05-18 2018-11-02 三星电子(中国)研发中心 用于交互式电子白板的编辑方法和编辑装置
CN112651323A (zh) * 2020-12-22 2021-04-13 山东山大鸥玛软件股份有限公司 一种基于文本行检测的中文手写体识别方法及系统
CN112613512A (zh) * 2020-12-29 2021-04-06 西北民族大学 基于结构属性的乌金体藏文古籍字符切分方法及系统
CN113255652A (zh) * 2021-07-09 2021-08-13 北京世纪好未来教育科技有限公司 文本修正方法、装置、设备及介质
CN113255652B (zh) * 2021-07-09 2021-10-29 北京世纪好未来教育科技有限公司 文本修正方法、装置、设备及介质

Also Published As

Publication number Publication date
CN100578432C (zh) 2010-01-06
CN101334701A (zh) 2008-12-31
CN101452444B (zh) 2010-12-08
CN101183283A (zh) 2008-05-21

Similar Documents

Publication Publication Date Title
CN101452444B (zh) 手写体信息快速编辑排版方法
US8718364B2 (en) Apparatus and method for digitizing documents with extracted region data
KR0124961B1 (ko) 문자 생성 방법 및 그 장치
US5613019A (en) System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US5517578A (en) Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
US7203903B1 (en) System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
US20090245654A1 (en) Method And Tool For Recognizing A Hand-Drawn Table
EP0546343B1 (en) Diagram recognizing system
JPH07114618A (ja) 手書き及びマシン印字テキストの区分化方法
JPH07160827A (ja) 手書きストローク編集装置及び方法
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
CN115841671A (zh) 一种书法字骨架矫正方法、系统及存储介质
JP3034140B2 (ja) 文字生成方法及びその装置
JP2669539B2 (ja) 文字出力方法および文字出力装置
CN117275026A (zh) 基于卷积神经网络的对投资金额类表格识别方法
CN105550363B (zh) 基于xgml的图像半结构化表示方法
JP2755299B2 (ja) 画像処理方法
JPH117493A (ja) 文字認識処理装置
JP4230478B2 (ja) 文書処理装置、方法およびプログラム
CN116542226A (zh) 非编辑文档的表格抽取方法、电子设备及可读存储介质
JPH0789361B2 (ja) 帳票登録装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant