CN101452444A

CN101452444A - 手写体信息快速编辑排版方法和编辑符的识别方法

Info

Publication number: CN101452444A
Application number: CNA2008100090746A
Authority: CN
Inventors: 陈清财; 梁乃臣; 王晓龙; 尤凤凯; 冯交交
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2007-12-04
Filing date: 2008-01-26
Publication date: 2009-06-10
Anticipated expiration: 2028-01-26
Also published as: CN100578432C; CN101334701A; CN101452444B; CN101183283A

Abstract

本发明涉及信息编辑处理技术，具体涉及一种对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息根据编辑指令进行快速编辑排版的方法和对编辑过程中输入的编辑符的识别方法。通过将手写体信息进行切分或合并处理成独立信息单元，并将处理后的手写体信息进行编码，建立支持编辑操作的索引，并通过执行编辑指令实现在编辑后对受编辑影响的信息单元进行自动排版。本发明有效的解决了对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑完成后，不能实现再排版，影响文档整体性的技术问题；系统对编辑过程中输入的编辑符识别准确、高效、识别错误率低。

Description

手写体信息快速编辑排版方法和编辑符的识别方法

技术领域

本发明涉及信息编辑处理技术，具体涉及一种对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的数字化信息根据编辑指令进行快速编辑排版的方法和对编辑过程中输入的编辑符的识别方法。

背景技术

现有技术中对于联机状态下输入的信息进行编辑的技术已经非常成熟，但对于在联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑的技术很少。经过大量检索发现微软公司有关于手写体信息的编辑技术，该编辑技术将待编辑文档的作为一个整体单元，通过选择系统提供的编辑指令完成对待编辑文档的编辑操作。但微软公司的手写体文字编辑技术存在一定技术缺陷，例如在执行删除操作时，当删除掉整篇文档中的几个文字或一段文字时，被删除部分为空白，受删除操作影响的后面信息不能自动跟进，将空白间隙填补，也就是在编辑操作后，不能实现再排版，这样将对文档的整体性产生影响。

在文档的书写过程中如果需要对生成文档进行编辑，现有技术是采用通过鼠标作为辅助工具，通过鼠标勾选需要编辑的信息，当选中该信息后，在通过执行相应编辑命令完成对文档内信息的编辑，虽然这种文档编辑方法相比在纸件上直接进行编辑修改能有效的提高编辑效率和使整体文档在编辑后的清洁性和整体性更好，但是这种编辑方法还需要增加辅助构件鼠标等工具，而且编辑过程仍然稍许复杂，为了使对文档信息的编辑更高效，申请号为94108177.X，名称为以笔势符号为编辑指令的系统的发明专利公开了一种直接对文档信息进行编辑的方法，该方法可以在书写信息的同时，不需要借助鼠标等工具直接进行文档信息的编辑，操作过程中通过书写信息的手写笔等输入构件直接对文档中的信息进行编辑，并通过手写笔等输入构件直接在文档中划入编辑符号就可以实现文档信息输入和编辑的同步高效进行，但这种编辑方法存在一定的技术问题，因为该专利中所公开的文档编辑命令符号在文档中写入时，系统要根据这些编辑符号的线段长短、或符号中线条的倾斜角度与系统内设的符号点值参数进行比对，当操作者写入的这些符号如果不规范，超出了系统内设符号点值参数可以识别的有效范围时，系统对这些符号便不能识别。这也相应提高了操作者编辑文档时的难度，给编辑操作带来了不便，所以该技术仍然存在技术缺陷。

发明内容

为了解决现有技术中存在的在对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的数字化信息进行编辑完成后，不能实现再排版，影响文档整体性的技术问题，本发明提供了一种对手写体信息进行快速编辑排版的方法。

为了解决现有技术中存在的对手写体编辑符的识别准确率低的技术问题，本发明提供了一种编辑符的识别方法。

本发明解决现有技术中存在的第一个技术问题所采用的技术方案为：提供一种对手写体信息进行快速编辑排版的方法，所述对手写体信息进行快速编辑排版的方法包括步骤：第一、将手写体信息进行切分或合并处理成个体单位的独立信息单元；第二、对切分或合并处理后的所述手写体信息进行编码，建立支持编辑操作的索引，进行索引计算，得出各独立信息单元在整体信息单元中的物理位置，并计算所述信息相对于显示页面的动态索引；第三、输入编辑指令，执行所述编辑指令完成对所述手写体信息的编辑；第四、对每次执行编辑指令后受到影响的信息单元进行自动排版。

根据本发明的一优选实施例：所述第一步中对所述手写体信息的切分包括操作者在联机输入状态下手写写入信息的切分和在脱机状态下获取的已有手写文档的扫描信息的切分。

根据本发明的一优选实施例：所述操作者在联机输入状态下手写写入信息的切分方法包括步骤：一、获取操作者联机写入的单行手写体信息；二、对所述单行手写体信息进行投影；三、根据投影像素进行计算，判断，切分或合并得到单个手写体信息；

根据本发明的一优选实施例：所述脱机状态下获取的已有手写文档的扫描信息的切分方法包括步骤：一、读入整篇在所述脱机状态下获取的已有手写体信息或图片信息；二、将上述已有手写体信息或图片信息进行格式转化成系统可以识别的格式；三、分离出非文字信息；四、将转化格式后的所述手写体信息进行投影并根据投影像素进行判断，实施行切分；五、对所述行切分信息根据投影像素进行计算，判断，切分或合并得到单个手写体信息。

根据本发明的一优选实施例：所述单个手写体信息的切分包括粗切分、重叠汉字的切分、粘连汉字的切分。

根据本发明的一优选实施例：所述对输入手写体信息的粗切分方法具体包括：计算字符左右边界、字宽w_i、平均字宽

、高宽比r_i、平均高宽比

、字间距d_i、平均字间距

，引入判断系数α和β，当r_i>α*

时，作为合并的候选，当r_i<β*

时，作为切分的候选。

根据本发明的一优选实施例：所述重叠汉字的切分包括步骤：一、获取待切分手写体信息；二、对所述待切分手写体信息进行像素的垂直投影；三、在相连的两投影信息上确定投影最低点，并以该点为界进行重叠汉字的切分。

根据本发明的一优选实施例：所述粘连汉字的切分包括步骤：一、通过傅立叶变换方法确定粘连汉字；二、对所述粘连汉字进行细化处理；三、确定切分点进行粘连汉字的切分。

根据本发明的一优选实施例：所述第三步中所述编辑指令为手写体编辑符或系统提供的编辑选择指令。

根据本发明的一优选实施例：所述第四步中对每次执行编辑指令后受到影响的信息单元进行自动排版包括步骤：一、执行编辑指令完成编辑操作；二、调整受编辑影响各独立信息单元在整体信息单元中的物理位置；三、生成新的整体信息单元接受下次编辑操作。

本发明解决现有技术中存在的第二个技术问题所采用的技术方案为：提供一种手写体编辑符的识别方法，所述手写体编辑符的识别方法包括步骤：第一、将平面坐标系划分为8个方位，通过系统采集到编辑符号的轨迹信息，计算出所述编辑符号轨迹在前后两个坐标之间的变化向量；第二、按方位对所述编码符号进行编码，将编辑符号信息转换成编码信息，所述编码信息描述了所述编辑符号的结构信息；第三、通过语法模式识别出所述编辑符号的编码信息。

根据本发明的一优选实施例：所述第三步中所述语法模式为：每个语法模式为一个数字串，该数字串中的每个数字代表了与笔迹中该数字对应的当前点的位置与前一点的位置之间的差向量最接近的方位。

本发明一种对手写体信息进行快速编辑排版的方法有效的解决了现有技术中存在的技术问题，能灵活、快捷的对在联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑，对于每次完成编辑操作后能马上完成对文档的再排版，使文档内其余信息不受编辑操作的影响，经过编辑后的文档整体性不受影响。

本发明一种手写体编辑符的识别方法有效的解决了现有技术中存在的系统要根据编辑符号的线段长短或符号中线条的倾斜角度与系统内设的符号点值参数进行比对，当操作者写入的编辑符号如果不规范，超出了系统内设符号点值参数可以识别的有效范围时，系统对这些符号变不能识别导致对编辑符的识别准确率低的问题。本发明中通过系统按方位对编码符号进行编码，并将编辑符号信息转换成编码信息，该编码信息描述了编辑符号的结构信息，再通过系统语法模式识别出编辑符号的编码信息由系统执行编辑操作。所以只要操作者输入的编辑符号结构是大体正确的，系统都能正确识别并做出准确判断，这样就提高了操作的准确性和易用性，系统对编辑符的识别错误率非常低。

附图说明

图1.本发明一种对手写体信息进行快速编辑排版的方法流程图；

图2.单行手写体字符切分方法流程图；

图3.脱机手写体整篇汉字切分方法流程图；

图4.二次线性插值算法压缩图像举例示意图；

图5.二次线性插值算法原理图；

图6.位图无损压缩缩小处理流程图；

图7.位图无级放大处理流程图；

图8.初始索引的计算流程图；

图9.未编辑状态下图像的显示流程图；

图10.编辑状态下图像的刷新显示流程图；

图11.识别左选择符时状态机理图；

图12.识别右选择符时状态机理图；

图13.识别复制符时状态机理图；

图14.识别粘贴符时状态机理图；

图15.识别插入符时状态机理图；

图16.识别删除符时状态机理图；

图17.识别剪切符时状态机理图；

图18.识别缩进(或空格)符时状态机理图；

图19.识别回格符时状态机理图；

图20.识别换行符时状态机理图；

图21.语法模式识别法状态机理图；

图22.重叠汉字的切分示意图；

图23.粘连汉字的切分示意图；

图24.多行文档切分方法举例示意图；

图25.在当前手写文档中插入扫描的图片化脱机文档举例示意图；

图26.根据密度比合并中原始单字图像与对应垂直投影对应关系举例示意图；

图27.编辑符结构示意图；

图28.坐标方位编码表示意图；

图29.编辑文档中的删除操作演示示意图；

图30.编辑文档中的插入操作演示示意图；

图31.其它相关编辑操作演示示意图。

具体实施方式：

下面结合附图和实施例对本发明作进一步说明：

请参阅图1本发明一种对手写体信息进行快速编辑排版的方法流程图，如图1所示对手写体信息进行快速编辑排版的方法包括步骤：第一、获取手写体信息；第二、将手写体信息进行切分或合并处理成个体单位的独立信息单元；第三、对切分或合并处理后的所述手写体信息进行编码，并根据需要对所述编码进行存储；第四、建立支持编辑操作的索引，进行索引计算，得出各独立信息单元在整体信息单元中的物理位置，并计算所述信息相对于显示页面的动态索引；第五、输入编辑指令，执行所述编辑指令完成对所述手写体信息的编辑；第六、对每次执行编辑指令后受到影响的信息单元进行自动排版。

其中，第一步中获取手写体信息包括获取联机输入状态下手写写入信息或在脱机状态下获取的已有手写文档的扫描信息。本发明中所述的编辑方法也可以适用于对非手写信息的编辑。

第二步完成对在联机输入状态下手写写入信息的切分或在脱机状态下获取的已有手写文档的扫描信息的切分。具体包括：所述操作者在联机输入状态下手写写入信息的切分方法包括步骤：一、获取操作者联机写入的单行手写体信息；二、对所述单行手写体信息进行投影；三、根据投影像素进行计算，判断，切分或合并得到单个手写体信息。所述脱机状态下获取的已有手写文档的扫描信息的切分方法包括步骤：一、读入整篇在所述脱机状态下获取的已有手写体信息或图片信息；二、将上述已有手写体信息或图片信息进行格式转化成系统可以识别的格式；三、分离出无需进一步切分的非文字信息；四、将转化格式后的所述手写体信息进行投影并根据投影像素进行判断，实施行切分；五、对所述行切分信息根据投影像素进行计算，判断，切分或合并得到单个手写体信息。所述单个手写体信息的切分包括粗切分、重叠汉字的切分、粘连汉字的切分。

第五步中所述编辑指令为手写体编辑符或系统提供的编辑选择指令。

第六步中对每次执行编辑指令后受到影响的信息单元进行自动排版包括步骤：一、执行编辑指令完成编辑操作；二、调整受编辑影响各独立信息单元在整体信息单元中的物理位置；三、生成新的整体信息单元接受下次编辑操作。

具体展开说明：切分处理或合并处理的实现方法及算法。

本发明一种对手写体信息进行快速编辑排版的方法是针对文字信息进行编辑。对于输入构件写入的字符，必须进行准确快速的切分以获得正确的单信息集合，而对于图画和完整地公式等，并不需要进行切分，直接进行缩放处理，对于借助扫描仪等设备读入的整篇手写文字图像中如果有图画和完整地公式等，也不需要进行切分。

切分部分采用了两阶段切分方法：粗切分和细切分，细切分包括重叠字切分和粘连字的切分。

联机输入的汉字切分：

第一、粗切分。对于从输入区获取的单行手写体字符图像，首先对单行图像进行垂直投影。根据像素空白处进行粗切分，获得粗切分字段集，并计算字符左右边界、字宽w_i、平均字宽

、高宽比r_i、平均高宽比

、字间距d_i、平均字间距

。通过对不同人的大量手写体汉字训练发现，同一个笔记者完整汉字的高宽比在一定范围内β*

和α*

即变化。当r_i>α*

时，作为合并的候选，而r_i<β*

，将其作为再切分的候选。

第二、重叠汉字的切分

重叠字，是指两个汉字垂直投影重叠，但是没有共享的像素。举例如附图22所示。

本方法中中我们提出一种基于连通域和垂直投影的重叠字切分算法。首先对于w>

*θ或者高宽比r>β*

的部分，将其作为候选。对候选图像，求背景(图中为白色)求连通域，如果连通域的高度等于候选图像的高度，则证明该候选为重叠汉字，进行重叠字的切分。

首先对候选图像，进行像素垂直投影，在中间位置一定范围内(经验值)找到投影最低点c，作为候选切分位置。如附图22中竖线标注，即为候选位置处粗切分线。以位置c为中心，对图像作加窗处理，窗口宽度为w，如附图22中点线标注所示。从上到下按行r_i处理，如果粗分线经过背景，则该位置加入到切分位置数组，slice[r_i]＝c。否则的话，粗分线在该行经过前景点。判断笔画的归属。方法：填充窗口内该行c列往右的像素为前景，然后通过前述的计算背景连通域高度的方法，判断连通性。如果不连通了，说明笔画属于左边，我们求出该点开始粗分线右边的前景连通域，把该连通域的每行最右点对应的列c_j加入到切分位置数组，即slice[r_i]＝c_j。然后继续处理连通域最后一行的下一行，直至处理完所有行。判断笔画属于右边汉字的处理过程相似。如果左右填充后，均连通，则应用高宽比、字宽等知识判断其归属，然后采用求slice数组的方法。根据slice数组中的值，将原来重叠的汉字，分成独立的汉字，如附图22所示结果。红色像素左边和右边分别为一个完整的汉字。

第三、粘连汉字的切分

粘连汉字的切分举例如附图23所示。

粘连汉字，指的是两个汉字不仅垂直投影重叠，而且有笔画连接在一起，共享一定像素区域。用傅立叶变换方法判断其是否为粘连字段。若为粘连字段，近一步切分成几个单字符。切分方法为：首先对原图像进行细化操作，得到细化图像，原图像垂直投影，得到粗切分列的位置c(图中竖直线对应的位置)。对于粘连汉字中的三种点：叉点、端点和角点，其中叉点、角点可作为候选点。细化图像中从粗切分位置向两边扫描寻找候选分割点，对应细化图像中所示A、B两点为找到的叉点候选点。结合汉字高宽比、字宽、方差等信息，选择一个合适的候选，本例中为B点。因为B在粗切分右边，所以在原图像中，把从B点开始的向左和向下方向的连续前景(黑色)变为背景(白色)。若为左侧，则向右向下改变连续前景为背景。改变后的图像如前景变背景效果图所示。至此，我们可采用重叠字的切分方法进行切分，得到切分结果显示。

上述单行手写体字符切分方法流程图可以参阅图2。

脱机文字图像切分

读入整篇手写体字符图像，用户首先标示出该文字图像中不需要切分的信息单元，如字图像、公式等。对余下部分，系统判断其是否为多行图像。对多行图像的切分方法为：对多行文本图像进行水平投影发现，不同行的像素投影重叠现象严重，这是由于文本行书写时切斜所造成的。而书写倾斜是无限制自由手写体汉字书写中的常见问题，因此多行切分需重点解决这一问题。解决的思想是：对于总体趋势倾斜的行，我们可以将其分为若干个切斜角度很小的行拼接成的。这样，将一整篇文档(高为h，宽为w)划分为6(经验值)篇高为h，宽度1/6*w的子文档。对每篇子文档根据水平投影切分，切分过程与单行粗切分思想相同。然后按对应行号将子行重新合并成行。然后我们对每一行文字，采取与联机输入汉字图像切分相同的策略进行切分，该切分方法流程图可以参阅图3。具体多行文档切分方法举例可参阅附图24。

在当前手写文档中插入扫描的图片化脱机文档的例子可以参阅附图25：

过分部分合并。许多汉字都是左右结构的，这样当书写比较分散时，粗切分会将该汉字的左右部分切分成两个以上部分。必须采取算法将它们合并。本方法中我们结合3种方法进行合并，保证合并的准确。实验证明，取得了很好的效果。这三种方法分别是基于汉字高宽比合并，基于字间距合并和基于密度比合并。以下分别介绍：

一、根据高宽比合并：

用p_i表示第i部分，其高宽比对应为r_i

Do{//合并候选表List

计算合并前方差S₁；

Pi＝List.get(0)；//读List表头元素

List.Delete(0)；//读取后删除头元素

Float Lr＝Rate(p_i，p_i-1)；//Rate()计算p_i左合并的高宽比并附值Lr

Float Rr＝Rate(p_i，p_i+1)；//p_i右合并后高宽比并附值Rr

If(Lr>α*

){//左合并后仍是候选

P＝Merge(p_i，p_i-1)；//合并p_i和p_i-1为p；

List.Add(0，p)；//p添加到表头以便继续处理

}

else If(Rr>α*

){//右合并后仍是候选

P＝Merge(p_i，p_i+1)；//合并p_i和p_i+1为p；

List.Add(0，p)；//p添加到表头以便继续处理

}

else{

r＝Lr和RR中更接近

的一个；

if(Lr比RR接近

)P＝Merge(p_i，p_i+1)；

else P＝Merge(p_i，p_i+1)；

重新计算高宽比方差S；

If(r<β*

||w>w*θ||S>γ*S₁){

Cancel()；//取消不合理的合并

}

}while(List不为空)；

二、根据密度比合并：

同时训练发现，相邻的两个部分，例如p_i，p_i+1。如果，p_i的像素数量与p_i+1的像素数量比值大于一定阈值，则在直方图投影上，显示出明显的密度大小差距，即相邻两个部分投影面积的差距很明显。具体举例可以参阅附图26。

我们通过计算某个部分的密度值，结合考虑汉字高宽比，字间距、密度比等信息，从左右邻居中选择最合适的一个与其合并。合并后也必须保证高宽比方差减小并且r>β*

，并且合并后字宽小于

*θ，否则取消合并。

三、根据间距合并：

根据人们的书写习惯，以及训练结果显示，人们书写汉字时，往往字间的距离要大于汉字部首间的距离。如果相邻两个部分的间距小于平均字间距

，则考虑合并这两个部分。当然，结合考虑汉字高宽比，字间距等信息，从左右邻居中选择最合适的一个与其合并。对于不合适的合并要予以取消。

压缩部分的实现方法及算法：

压缩部分的主要功能：是完成对切分后的文字图像进行无损压缩存储，将输入的文字的手写特征尽可能多的保存下来，提供给索引作存储要占用尽可能少的存储空间；同时，对编辑显示状态下的候选文字作放大的操作，要保证文字的无限放大不失真，无锯齿，保留原有书法特征。

传统的图像放大算法是将每一象素在水平和垂直的方向上重复显示若干次，而缩小算法是将源文件每隔若干个象素取出一个象素。这种简单的放大方法对于灰度图像，伪彩和真彩色图像来说，还勉强可以接受，量化后相邻象素间的差值不是很大。但对于二值图像来说，放大后会形成色块，图像反差强烈，效果不佳，特别是曲线或存在噪声的情况下，这一现象尤为明显。

本方法中的图像的预处理采用基于双线性插值的缩放算法，缩小采用基于像素交迭的等权值矩阵缩小算法；放大采用边缘检测算法，位图形状转化为矢量图形，再进行像素填充的方法进行缩放处理。

第一、切分图像的归一化压缩处理：二次线性插值算法压缩图像举例示意图如图4所示。缩放映射原理：

(S_x-0)/(Swidth-0)＝(D_x-0)/(Dwidth-0)

S_x＝D_x*Swidth/Dwidth

(S_y-0)/(Shight-0)＝(D_y-0)/(Dhight-0)

S_y＝D_y*Shight/Dheight

聚焦看看(Sx，Sy)坐标点(Sx，Sy为浮点数)附近的情况，如图5所示。

二次线性插值需要考虑(Sx，Sy)坐标点周围的4个颜色值Color0\Color1\Color2\Color3，把(Sx，Sy)到A\B\C\D坐标点的距离作为系数来把4个颜色混合出缩放后点的颜色；(u＝Sx-floor(Sx)；v＝Sy-floor(Sy)；说明：floor函数的返回值为小于等于参数的最大整数)

二次线性插值公式为：

tmpColor0＝Color0*(1-u)+Color2*u

tmpColor1＝Color1*(1-u)+Color3*u

DstColor＝tmpColor0*(1-v)+tmpColor2*v

展开公式为：

pm0＝(1-u)*(1-v)

pm1＝v*(1-u)

pm2＝u*(1-v)

pm3＝u*v

则颜色混合公式为：

DstColor＝Color0*pm0+Color1*pm1+Color2*pm2+Color3*pm3

等权值缩小算法(图象的缩小灰度级显示算法)：

若位图图像是二值的，缩小显示的时候由于n个点转化成一个点会导致图像局部细节信息丢失，比如一条宽度一个象素的细线由于缩小可能就会没有显示，而使用灰度级显示能解决这个缩小显示的问题。

基本约定：

一、灰度级缩小显示只针对黑白或者灰度影像

二、只有在显示<100％的时候灰度级显示才生效

三、灰度级缩小算法是基于原始图像来运算

具体算法：

一、缩小算法

按照与原图比例1:n来对原图n*n个点生成1个点(n可以是浮点数)，考虑到效率可以使用灰度级变换，从0-255取中间点127大于该值显示白小于改值显示黑色。

二、灰度级显示算法

结合缩小算法n*n个点生成一个点的原则，在原图上按照每个点的权值和颜色相乘再除以n来得到生成点的颜色值。这是一维坐标，扩展到二维空间算法相同。

位图压缩缩小处理流程图可以参阅图6。

具体展开说明：索引图像的无级放大

位图无级放大处理流程图可以参阅图7。

一、Perwitt算子边缘检测：

经典的插值方法，插值后的图像会出现边缘模糊或边缘锯齿等现象，这是因为这些传统的图像缩放方法实质上是对源图像建立了连续的数学模型，没有考虑边缘部分的高频信息损失的问题。人眼对图像的边缘部分特别敏感，插值后图像的边缘性质对一幅图像的质量有十分重要的影响。为使插值后的图像边缘保持良好的特性，采用基于Perwitt算子边沿检测方法的图像缩放算法，先检测边沿，对确认为处于边缘区域的像素，插值沿边沿方向进行；对平坦区域的像素，进行插值。该算法能在很大程度上消除插值后图像边缘的模糊和锯齿现象，提高插值后图像的视觉质量。

基于Perwitt算子的边缘检测算法基本步骤包括：

第一、滤波。边缘检测主要基于导数计算，但受噪声影响。但滤波器在降低噪声的同时也导致边缘强度的损失。

第二、增强。增强算法将邻域中灰度有显著变化的点突出显示。一般通过计算梯度幅值完成。

第三、检测。但在有些图象中梯度幅值较大的并不是边缘点。最简单的边缘检测是梯度幅值阈值判定。

第四、定位。精确确定边缘的位置。

边缘检测算法流程：

第一步：用高斯滤波器平滑图象；

第二步：用一阶偏导的有限差分来计算梯度的幅值和方向；

第三步：对梯度幅值进行非极大值抑制；

第四部：用双阈值算法检测和连接边缘。

二、位图形状转矢量图形缩放：

当字号特别大时，用字做的图边缘部分不平滑，采用将提取出的字体边缘转换为矢量图形，采用矢量缩放算法进行平滑缩放，然后绘出笔画轮廓填充之。在有些情况下，即使用平滑的曲线绘画仍然不可避免的会有锯齿，这是人的视觉特征决定的，所以仍然需要优化。

一般的矢量缩放应用很好的处理软件之所以会感觉平滑，是因为它在字体边缘部分增加了过渡区，在前景色和背景色做了一个平滑的色彩过渡。之所以感觉没有锯齿，是利用了人的视觉心理特征。所以在处理的后期，还需要在绘制好的文字边缘增加过渡色彩，这样就会感觉相当平滑。

另外由于设备分辨率有限，在屏幕上绘各种几何曲线都会有“锯齿”形，锯齿大小为一个像元。字体能无级缩放，不论放大多少“锯齿”总是一像元大，而字体的“锯齿”会随字形放大而增大。为了使感觉没有锯齿，可采用特殊算法，如反走样法进行优化。

显示平台的处理流程：

显示主要完成对初始输入文本的压缩存储与初始显示，以及编辑状态下文本的快速定位，刷新显示，主要流程包括：如图8所示的初始索引的计算流程图；图9所示的未编辑状态下图像的显示和图10所示的编辑状态下图像的刷新显示流程图.为了确定每个信息单元在当前显示页面上的物理位置，采用了如下方法计算当前单元的坐标(x_cur，y_cur)：设前一个单元的坐标为(x_pre，y_pre)，宽度为w_pre’w_cur为当前单元的宽度；WIDTH为页面的显示宽度，X_Margin、Y_Margin分别表示页面的上下边距，Unit_Interv表示显示单元之间的横向间隔，Row_Interv表示行距。

判断前一个单元是否为空，如果为空，则：

x_cur＝X_Margin

y_cur＝Y_Margin

否则，判断前一个单元的类型，如果为换行符或换页符：

x_cur＝X_Margin

y_cur＝y_pre+Row_Interv

否则，如果前一个单元是其他类型：

计算出判断因子λ，

(λ＝0，1)，那么当前单元的坐标为：

x_cur＝(1-λ)*(x_pre+w_pre+Unit_Interv+λ*X_Margin

y_cur＝y_pre+λ*Row_Interv

坐标修正：

设imageCollection记录了当前页面中已经出现的图像单元信息，则判断当前单元的坐标是否“落”到任一图像单元内，更新(x_cur，y_cur)直到当前单元不“落”在任一图像内。

存储及索引

一、存储及索引的结构：

将每幅压缩完毕的图像按像素展开成为一维数组，将每个字的宽度和总长度放在数组的最前端，设一位的添加删除位。这样文档的内容便存储在一系列的数组中。全局索引的结构分两个部分，第一个字节存储的内容为对应字的图像在全文中的位置，第二个字节存放的为图像数据在文件中存储的位置。动态索引记录下了每个显示在操作页面上的字图像开始显示时左上角的坐标值，动态索引的作用在于能够根据光标的位置快速准确地定位光标所选定的图像。动态索引在打开文件时创建，关闭文件时删除，并不保存在文件中。

文档的结构均由特殊字符控制，特殊字符和文字图像一同存储在文档内容中，特殊字符包括：换行符，段落符，分栏符，首字缩进符，空行符。每遇到特殊字符时，在如三所述的显示过程中采取特殊操作，从而控制文档显示的格式。

二、索引支持的添加删除编辑操作

经过如五所述的方法识别出添加或者删除的动作，选定将要添加或者删除的文字图像，根据动态索引所存储的坐标，定位将要添加或者删除的位置，先在索引中进行编辑操作。添加时将索引添加在正确的位置上，文字图像内容直接加在文件的末端，删除时先只在索引中将对应文字图像的索引删除，并将文字图像的删除位置1，直到用户保存文档时才真正将文字图像内容从文件中删除。

三、缓冲区保存操作

每当打开一个文字图像文档时在内存中设置缓冲区，用来保存近20步的操作，用来在特殊情况下的文档修复工作。

编辑部分的实现方法及算法

一、编辑符的确定

确定编辑符时，我们应该以简单、方便、符合我们的手写习惯为根本原则，确定了左选择符、右选择符、复制符、粘贴符、插入符、删除符、剪切符、缩进(或空格)符、回格符和换行符，各编辑符的结构示意图可以参阅附图27。

虽然每个编辑操作的具体功能在显示设备上具体显示是不一样的，但他们的执行过程是一样的，即：

第一，确定编辑操作的当前位置；

第二，确定用户发出的编辑指令；

第三，根据对应的编辑指令执行相应的操作，具体来说，所定义的操作指令执行的所执行的操作不同的系统可以定义不同行为，以下给出其中一种常用的行为模式，但本方法并不限定于以下模式：

插入操作：确定当前位置，等待新的信息单元从输入构建输入，在索引中插入新的信息单元信息，刷新显示页面；

左选择操作：系统记录当前位置所对应的信息单元，并等待右选择操作，如果下一个操作不是右选择，则该操作撤销；

右选择操作：如果上一个操作是左选择，记录当前信息单元，如果当前信息单元的位置在左选择记录的信息单元之前，则撤销左右选择操作，否则，将系统记录的左选择操作的信息单元到当前信息单元之间的所有信息进行标记为已选择，等待下一步操作；

删除操作：确定被选择的信息单元为非空，从索引中删除被选定的信息单元，刷新显示；

复制操作：清空复制缓冲区，将标记为已选择的信息单元拷贝到缓冲区；

粘贴操作：确定操作的当前位置，将复制缓冲区中的信息单元在当前位置插入，刷新显示；

剪切操作：先对所选定的信息单元执行复制操作，再对所选定的信息单元执行删除操作；

缩进操作：先执行插入操作，并自动插入一个空格后结束插入操作；

回格操作：自动执行左右选择操作选定当前位置的前一个信息单元，并执行删除操作；

换行操作：确定当前位置，在当前位置插入一个换行符，刷新显示。

二、编辑符的识别

编辑符的识别可以用语法模式识别法(构造自动机识别)：

将平面坐标系划分为8个方位，8个坐标方位分别编码为：0，1，2，3，4，5，6，7。通过系统采集到编辑符的轨迹信息，并进行平滑和采样，计算出编辑符轨迹在前后两个采样点坐标之间的变化向量，根据向量的方向在对应的方位对其分别进行编码，组成一个码串，此串描述了该编辑符的结构信息，也称为该编辑符的语法模式；通过语法模式识别方法设计识别器(自动机)识别出该编辑符。

坐标方位编码表可以参阅附图28，如附图28(一)所示：

识别算法如下：

屏幕中的坐标系如附图28(二)所示。

首先，根据由系统得到的轨迹信息求出该轨迹的特征码串，假设，该轨迹的点序列如下：

(X₁，Y₁)，(X₂，Y₂)，.....(X_i，Y_i)，(X_i+1，Y_i+1)，....(X_n-1，Y_n-1)，(X_n，Y_n)

计算任何两个相邻点的变化向量，见附图28中的(三)。得到n-1个变化向量：

(X₂-X₁，Y₂-Y₁)，.......(X_i+1-X_i，Y_i+1-Y_i)..........(X_n-X_n-1，Y_n-Y_n-1)

计算每个变化向量所对应的特征码：

假设，(a，b)为上面n-1个变化向量中的一个元素，它与X轴的角度为θ，参见附图28中的(四)。计算θ的余弦：

\cos θ = a / \sqrt{a^{2} + b^{2}};

计算其反余弦得到角度

α = \arccos (a / \sqrt{a^{2} + b^{2}}),

如果b≥0，则θ＝α；否则，θ＝2π-α。

根据θ在坐标方位图中对应的位置判断该变化向量与表一中哪一个方位最接近，该变化向量对应的特征码即为该方位的编号(0-7).

同理，可得到该轨迹的所有变化向量的特征码。假设，整个特征码串为：

λ₁，λ₂，.......λ_i.......λ_n-1，λ_n.(其中，λ_n＝-1，表示串的结束)

其次，设计自动机依次识别各个编辑符

手写编辑符的时候，存在颤抖，也就不可避免的有噪音，因此我们得到的特征码串也包含噪音，所以在设计自动机识别的时候一定要能够容忍这些噪音。为此，我们采取了如下措施：

只要所识别的码串中的码元对某一编辑符特征码串的符合率达到一定的阈值，如80％，我们就认为当前所识别的码串就是该编辑符。为此，我们记录下特征码串中的符合某一编辑符特征的每一个分量的个数，以及它们的总数，只有每个分量个数和总数达到一定的阈值，我们才认为识别出了该编辑符。以下对各所述编辑符的识别进行详述：

左选择符的识别：

手写的左选择符对应的码串：2322210010。它的特征码就是2和0，里面存在着噪音码3，1，但该码串中2和0以及二者在整个码串中所占的比例达到一定的阈值，我们就认为，该轨迹就是左选择符。附图请参阅图11识别左选择符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

右选择符的识别：

手写的右选择符对应的码串：2322234454。它的特征码就是2和4，里面存在着噪音码3，5，但该码串中2和4以及二者在整个码串中所占的比例达到一定的阈值，我们就认为，该轨迹就是右选择符。附图请参阅图12识别右选择符时状态机理图，图中，C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

复制符的识别

手写的复制符对应的码串：6，5，4，3，3，3，2，2，0，0。标准的复制符的特征码是5，4，3，2，1，0，7；由于手写的复制符的随意性，并不是每个特征码都会出现在我们得到的码串中，如果严格的要求每一个特征码的先后关系，那么对于不同人有不同手写习惯的复制符来说识别率将会非常低，因此，我们必须设计一比较灵活、对特征码限制较为宽松的状态机，同时排除一些由于状态机限制宽松而有可能混淆的类似的编辑符。附图请参阅图13识别复制符时状态机理图，图中：C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别；C_2_0：当前码串中出现特征码2和0的总数；C_3_1：当前码串中出现特征码3和1的总数；C_4_2：当前码串中出现特征码4和2的总数；C_1_7：当前码串中出现特征码1和7的总数；C_3_0：当前码串中出现特征码3和0的总数；C_4_1：当前码串中出现特征码4和1的总数。

粘贴符的识别

手写的复制符对应的码串：6，0，0，2，2，3，3，3，4，5。标准的粘贴符的特征码是7，0，1，2，3，4，5；同复制符的识别类似。附图请参阅图14识别粘贴符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别；C_2_4：当前码串中出现特征码2和4的总数；C_1_3：当前码串中出现特征码1和3的总数；C_0_2：当前码串中出现特征码0和2的总数；C_7_1：当前码串中出现特征码7和1的总数；C_0_3：当前码串中出现特征码0和3的总数；C_1_4：当前码串中出现特征码1和4的总数。

插入符的识别

手写的右选择符对应的码串：67776012112。它的特征码就是7和1，但在手写插入符的时候，特征码6和7，1和2很难区分，所以，在识别插入符的时候，我们将之等同，这可以大大地提高其识别率。附图请参阅图15识别插入符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

删除符的识别

删除符是由两条横线组成，我们一次识别它的一半，即一次识别一条横线。手写的左选择符对应的码串：1000770001。它的特征码就是0，里面存在着噪音码7，1，但该码串中0在整个码串中所占的比例达到一定的阈值，我们就认为，该轨迹就是一条横线。附图请参阅图16识别删除符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

剪切符的识别

剪切符是由两条斜线组成，我们一次识别它的一半，即一次识别一条斜线。我们称从左边开始的斜线为左剪切符，从右边开始的叫右剪切符。手写的左剪切符对应的码串：211111011。它的特征码就是1，里面存在着噪音码2，1。手写的右剪切符对应的可能的码串：2333332334。它的特征码就是3，里面存在着噪音码2，4。附图请参阅图17识别剪切符时状态机理图，图中λ：剪切符的特征码，其中，λ＝1时，是左剪切符：λ＝3时，是右剪切符；C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

空格(缩进)符的识别

手写的空格符对应的码串：01110233434。它的特征码就是1和3，但在手写空格符的时候，特征码0和1，4和3很难区分，所以，在识别空格符的时候，我们将之等同，这可以大大地提高其识别率。附图请参阅图18识别空格(缩进)符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

回格符的识别

手写的回格符对应的码串：33434201110。它的特征码就是3和1，但在手写回格符的时候，特征码4和3，0和1很难区分，所以，在识别回格符的时候，我们将之等同，这可以大大地提高其识别率。附图请参阅图19识别空格(缩进)符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

换行符的识别

手写的换行符对应的码串：1001023222。它的特征码就是0和2，里面存在着噪音码1，3，但该码串中2和0以及二者在整个码串中所占的比例达到一定的阈值，我们就认为，该轨迹就是换行符。附图请参阅图20识别空格(缩进)符时状态机理图，图中C1：符合某编辑符的单个特征码的个数；C2：所有符合某编辑符的单个特征码的个数；Cerr：已经出错的编辑码的个数；T1：单个特征码必须达到的阀值；T2：符合编辑符的所有特征码的个数须达到的阀值；Terr：如果Cerr超过该值就认为该轨迹不能被识别。

编辑操作序列要有一定的限制，比如，要复制一段图像文字，先要选定该段图像文字；采用状态机来实现不同编辑操作之间的先后制约关系。该语法模式识别法整体状态机理图，可以参阅图21。

以下对操作过程进行举例说明：

编辑文档中的删除操作，如附图29所示：

编辑文档中的插入操作，如附图30所示：

其它相关操作演示示意图如附图31所示：

以上实施例中作为举例说明采用了手写体编辑符作为编辑指令，本发明的编辑操作也可以采用系统提供的编辑选择指令完成编辑操作，具体原理和上述原理相同，也应视为本发明的保护范围。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种手写体信息快速编辑排版的方法，其特征在于：所述手写体信息快速编辑排版的方法包括步骤：

A：将手写体信息进行切分或合并处理成个体单位的独立信息单元；

B：对切分或合并处理后的所述手写体信息进行编码，建立支持编辑操作的索引，进行索引计算，得出各独立信息单元在整体信息单元中的物理位置，并计算所述信息相对于显示页面的动态索引；

C：输入编辑指令，执行所述编辑指令完成对所述手写体信息的编辑；

D：对每次执行编辑指令后受到影响的信息单元进行自动排版。

2.根据权利要求1所述编辑排版的方法，其特征在于：所述步骤A中对所述手写体信息的切分包括操作者在联机输入状态下手写写入信息的切分和在脱机状态下获取的已有手写文档的数字化信息的切分。

3.根据权利要求2所述编辑排版的方法，其特征在于：所述操作者在联机输入状态下手写写入信息的切分方法包括步骤：

A1：获取操作者联机写入的单行手写体信息；

A2：对所述单行手写体信息进行投影；

A3：根据投影像素进行计算，判断，切分或合并得到单个手写体信息；

4.根据权利要求2所述编辑排版的方法，其特征在于：所述脱机状态下获取的已有手写文档的扫描信息的切分方法包括步骤：

a1：读入整篇在所述脱机状态下获取的已有手写体信息或图片信息；

a2：将上述已有手写体信息或图片信息进行格式转化成系统可以识别的格式；

a3：分离出图片信息；

a4：将转化格式后的所述手写体信息进行投影并根据投影像素进行判断，实施行切分；

a5：对所述行切分信息根据投影像素进行计算，判断，切分或合并得到单个手写体信息。

5.根据权利要求3或4所述编辑排版的方法，其特征在于：所述单个手写体信息的切分包括粗切分、重叠汉字的切分、粘连汉字的切分。

6.根据权利要求5所述编辑排版的方法，其特征在于：所述对输入手写体信息的粗切分方法具体包括：计算字符左右边界、字宽w_i、平均字宽

、高宽比r_i、平均高宽比

、字间距d_i、平均字间距

，引入判断系数α和β，

当r_i>α*

时，作为合并的候选，

科吉华烽

当r_i<β*

时，作为切分的候选。

7.根据权利要求5所述编辑排版的方法，其特征在于：所述重叠汉字的切分包括步骤：

E：获取待切分手写体信息；

F：对所述待切分手写体信息进行像素的垂直投影；

G：在相连的两投影信息上确定投影最低点，并以该点为界进行重叠汉字的切分。

8.根据权利要求5所述编辑排版的方法，其特征在于：所述粘连汉字的切分包括步骤：

H：通过傅立叶变换方法确定粘连汉字；

I：对所述粘连汉字进行细化处理；

J：确定切分点进行粘连汉字的切分。

9.根据权利要求1所述编辑排版的方法，其特征在于：所述步骤C中所述编辑指令为手写体编辑符或系统提供的编辑选择指令。

10.根据权利要求1所述编辑排版的方法，其特征在于：所述步骤D中对每次执行编辑指令后受到影响的信息单元进行自动排版包括步骤：

K：执行编辑指令完成编辑操作；

L：调整受编辑影响各独立信息单元在整体信息单元中的物理位置；

M：生成新的整体信息单元接受下次编辑操作。

11.一种手写体编辑符的识别方法，其特征在于：所述手写体编辑符的识别方法包括步骤：

N、将平面坐标系划分为8个方位，通过系统采集到编辑符号的轨迹信息，计算出所述编辑符号轨迹在前后两个坐标之间的变化向量；

0、按方位对所述编码符号进行编码，将编辑符号信息转换成编码信息，所述编码信息描述了所述编辑符号的结构信息；

P、通过语法模式识别出所述编辑符号的编码信息。

12.根据权利要求11所述手写体编辑符的识别方法，其特征在于：所述步骤P中所述语法模式为：每个语法模式为一个数字串，该数字串中的每个数字代表了与笔迹中该数字对应的当前点的位置与前一点的位置之间的差向量最接近的方位。