CN101334701A

CN101334701A - 一种直接写入手写体信息的方法

Info

Publication number: CN101334701A
Application number: CNA2008101445312A
Authority: CN
Inventors: 陈清财; 尤凤凯; 王晓龙; 梁乃臣; 冯交交; 王威
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2007-12-04
Filing date: 2008-07-22
Publication date: 2008-12-31
Anticipated expiration: 2028-07-22
Also published as: CN101452444A; CN101183283A; CN100578432C; CN101452444B

Abstract

本发明涉及信息输入技术，具体涉及一种不经过信息识别、选取过程，将所述信息进行切分或合并成独立信息单元后直接在显示构件上进行原手写体笔迹显示的一种直接写入手写体信息的方法。该方法由操作者通过输入构件写入手写体信息；通过系统对用户写入的所述手写体信息进行捕捉并将该手写体信息进行切分或合并成独立信息单元，然后在显示构件上进行原笔迹显示，通过该方法输入的手写体更便于编辑操作。本发明中所述直接写入手写体信息的方法更适合汉字和特殊字符和公式的输入，大大提高了信息输入的效率，并且保留了书写者的原字体，使常用非正式文档更具有个性化特点。

Description

一种直接写入手写体信息的方法

技术领域

本发明涉及信息输入技术，具体涉及一种不经过信息识别、选取过程，将所述信息进行切分或合并成独立信息单元后直接在显示构件上进行原手写体笔迹显示的一种直接写入手写体信息，并可对输入的信息以信息单元为基础进行编辑与排版的方法。

背景技术

信息输入是利用计算机进行文本编辑和处理的前提。现阶段信息输入方法主要有人工编码键盘输入法和文字识别输入法。现代社会对工作效率的要求越来越高，无纸化办公越来越普遍。例如：每日每时都有大量文章出现在报刊、书籍和广播电视等等各种信息载体上。这些文章的形成基本上都经过了构思、起草和修改三个步骤。而目前现有技术中的文档处理方法最适合的服务对象仅仅是文章基本定稿之后的信息输入等处理工作。这些信息输入和编辑方法虽然为原始文稿变成精美的印刷品提供了便利条件，却不能为这些文稿的起草和修改工作提供更有力的支持。长期以来，文学家、学者、记者、文秘等经常进行写作的人们，通常都使用笔在纸上进行文章的起草和修改工作的。在纸上直接写作的缺点是不易规整、自由地修改，一篇好文章的草稿往往被修改得混乱不堪，而且效率非常低。

而现有技术中利用键盘输入文字信息或者借助手写体文字识别输入技术，在电脑上进行文章的起草和修改时，对于西文语种来说，是一种比较有效的手段，而对于中文、日文、韩文等许多非西文的表意文种或对一些特殊符号的编辑来说，现有技术不能很好的满足需要。这是因为，由于通过键盘输入信息时，不管采用什么输入法进行信息输入都必须要求写作人经常性地同时进行撰写时的语句构思，还要同时将自己的构思中的文字等信息转化成正确的键盘输入码并通过敲击键盘进行输入，对这些输入信息还要进行有意识地确定输入是否有误，这样就增加了书写者沉重的脑力负担。而人们在纸上以行书、草书甚至速记符号直接起草文章时，只需要连续地构思语言并将其转化为纸上的手写文字，而且一般人在起草时写的文字是下意识地书写出来的，无需在脑中逐一浮现并确定文字的正确形状，所以，与直接在纸上起草的手段相比，键盘编码输入方法虽然提供了无痕迹自由修改的方便和规整的印刷体文本显示，却又同时使人们在构思、写作时承担了如上所述的过多的无助于提高写作质量的无效劳动，反而降低了写作效率。更有一些年岁比较大的操作者，由于对键盘不构熟悉，对于利用键盘输入方法进行编辑存在一定的困难

针对上述技术问题，近期开发了许多借助手写体文字识别输入技术进行信息输入的方法，这种信息输入方法利用手写笔等输入构件在书写板上进行书写，并通过计算机进行识别后进行显示。与键盘编码输入方法相比，联机手写体文字识别技术不仅具有易掌握、不需要背诵键盘编码的代码键位，采用这种书写方法可以有效的解决一些操作者由于对键盘不够熟悉，对于利用键盘输入方法进行编辑存在一定的困难这一技术问题，但对于书写时的工作效率并不能有效的解决，因为在采用这写输入编辑方法进行文字编辑时，写作者每写入一个文字，计算机都会在屏幕相应的位置显示出若干与作者输入的文字字形相近的文字，供作者从中正确选取，这样就降低了连续、快速输入信息的效率，也会影响写作者在撰写时的整体构思。

发明内容

为了解决现有技术中存在的对信息利用键盘进行输入时需要背诵键盘编码，这些编码不便于记忆而且在操作者思考撰写的同时还需要思考将文字转化成编码进行输入，从而影响工作效率。借助手写体文字识别输入技术进行信息输入的过程中，需要在每次输入完信息后还要操作者对相似文字信息进行判断选取等操作，影响文字输入的连续性和高效性等技术问题，本发明提供了一种直接写入手写体信息的方法。

本发明解决现有技术中存在的问题所采用的技术方案为：提供一种直接写入手写体信息的方法，其特征在于：所述直接写入手写体信息的方法包括步骤：第一、操作者通过输入构件写入手写体信息；第二、系统捕捉到用户写入的所述手写体信息并将该手写体信息切分或合并成独立信息单元后在显示构件上进行原笔迹显示。

根据本发明的一优选实施例，所述第二步包括子步骤：一、系统对所述手写体信息进行预处理；二、系统对预处理后的所述手写体信息进行编码；三、建立支持编辑操作的索引；四、基于所述索引对所述手写体信息进行显示和编辑。

根据本发明的一优选实施例，所述步骤一又进一步包括子步骤：首先、系统根据操作者写入信息时书写笔速确定写入信息笔画的粗细；其次、系统对捕捉到的长串所述手写体信息进行判断，并根据判断结果对所述手写体信息进行切分或合并处理，得到个体单位的独立信息单元；最后、系统将切分或合并处理后的所述独立信息单元进行无损压缩或放大处理，得到设定的标准高度的信息。

根据本发明的一优选实施例，所述其次步骤中所述切分处理为：系统对操作者输入的所述手写体信息进行垂直投影，根据投影像素中空白处的间隔进行判定，所述切分包括粗切分、重叠汉字的切分、粘连汉字的切分。

根据本发明的一优选实施例，所述对输入手写体信息的粗切分方法具体包括：计算字符左右边界、字宽w_i、平均字宽w、高宽比r_i、平均高宽比r、字间距d_i、平均字间距d，引入判断系数α和β，当r_i＞α*r时，作为合并的候选，当r_i＜β*r时，作为切分的候选。

根据本发明的一优选实施例，所述重叠汉字的切分包括步骤：一、获取待切分手写体信息；二、对所述待切分手写体信息进行像素的垂直投影；三、在相连的两投影信息上确定投影最低点，并以该点为界进行重叠汉字的切分。

根据本发明的一优选实施例，所述粘连汉字的切分包括步骤：一、通过傅立叶变换方法确定粘连汉字；二、对所述粘连汉字进行细化处理；三、确定切分点进行粘连汉字的切分。

根据本发明的一优选实施例，所述合并处理包括：基于输入信息高宽比的合并、基于输入信息间距比的合并和基于输入信息像素密度比的合并。

根据本发明的一优选实施例，对所述手写体信息进行压缩的方法包括步骤：一、系统对操作者输入的所述手写体信息采用双线性差值算法提取像素分量；二、采用等权值矩阵缩小算法进行压缩；对所述手写体信息进行放大的方法包括步骤：一、系统对操作者输入的所述手写体信息采用Perwitt边缘检测算法提取信息图像的边缘；二、采用batik SVG方法把信息图像的边缘转换为矢量图形；三、通过像素填充进行放大处理。

根据本发明的一优选实施例，所述编辑进一步包括子步骤：一、对信息进行索引计算，得出各所述独立信息单元在通篇文档中的物理位置，并计算所述独立信息单元相对于显示页面的动态索引；二、输入编辑指令，执行所述编辑指令完成对所述信息的编辑；三、对每次执行编辑指令后受到影响的信息单元进行自动重新排版。

本发明中直接写入手写体信息的方法有效的克服了现有输入方法的不足，提供了一种不经过信息识别、选取过程，将所述信息进行切分或合并成独立信息单元后直接在显示构件上进行原手写体笔迹显示的一种直接写入手写体信息的方法。该方法更适合汉字和特殊字符和公式的输入，大大提高了信息输入的效率，并且保留了书写者的原字体，使常用非正式文档更具有个性化特点，经过切分或合并处理的独立信息单元更便于执行编辑操作和执行编辑指令后受到影响的信息单元进行自动重新排版。

附图说明

图1.本发明一种直接写入手写体信息的方法流程图；

图2.单行手写体字符切分方法流程图；

图3.脱机手写体整篇汉字切分方法流程图；

图4.二次线性插值算法压缩图像举例示意图；

图5.二次线性插值算法原理图；

图6.位图无损压缩缩小处理流程图；

图7.位图无级放大处理流程图；

图8.初始索引的计算流程图；

图9.未编辑状态下图像的显示流程图；

图10.编辑状态下图像的刷新显示流程图。

具体实施方式：

下面结合附图和实施例对本发明作进一步说明：

本发明中直接写入手写体信息的方法是一种直接以图像为处理对象、以每个信息，如文字信息、数字信息、字母信息、公式信息、字图像信息等所对应的图像为基本单元，对用户输入的笔迹进行自由编辑、排版及存储的方法。

请参阅图1本发明一种直接写入手写体信息的方法流程图，如图1所示该方法的具体操作步骤为第一、操作者通过输入构件，如手写笔写入手写体信息；第二、系统根据操作者写入信息时书写笔速确定写入信息笔画的粗细；第三、系统对捕捉到的长串所述手写体信息进行判断，并根据判断结果对所述手写体信息进行切分或合并处理，得到个体单位的独立信息；第四、系统将捕捉到的所述手写体信息进行压缩或放大处理，得到设定的标准高度的信息；第五、系统对处理后的所述手写体信息进行编码，并根据需要进行存储；第六、建立支持编辑操作的索引；第七、基于所述索引对所述手写体信息在显示页面进行原笔迹显示；第八、输入编辑指令，执行所述编辑指令完成对所述信息的编辑；和第九、对每次执行编辑指令后受到影响的信息单元进行自动重新排版。

该方法中第一步、第三步、第五步、第六步和第七步为必要步骤；第八步和第九步为应用步骤；第二步和第四步为本发明的优化步骤。

其中，第三步中所述切分处理为系统对操作者输入的所述手写体信息进行垂直投影，根据投影像素中空白处的间隔进行判定，所述切分包括粗切分、重叠汉字的切分、粘连汉字的切分。

所述对输入手写体信息的粗切分方法具体包括：计算字符左右边界、字宽w_i、平均字宽w、高宽比r_i、平均高宽比r、字间距d_i、平均字间距d，引入判断系数α和β，当r_i＞α*r时，作为合并的候选，当r_i＜β*r时，作为切分的候选。

所述重叠汉字的切分包括步骤：一、获取待切分手写体信息；二、对所述待切分手写体信息进行像素的垂直投影；三、在相连的两投影信息上确定投影最低点，并以该点为界进行重叠汉字的切分。

所述粘连汉字的切分包括步骤：一、通过傅立叶变换方法确定粘连汉字；二、对所述粘连汉字进行细化处理；三、确定切分点进行粘连汉字的切分。

第三步中所述合并处理包括：基于输入信息高宽比的合并、基于输入信息间距比的合并和基于输入信息像素密度比的合并。

上述第四步骤中对所述手写体信息进行压缩或放大处理进一步包括：对所述手写体信息进行压缩的方法包括步骤：一、系统对操作者输入的所述手写体信息采用双线性差值算法提取像素分量；二、采用等权值矩阵缩小算法进行压缩；三、采用MipMap链进行优化处理；对所述手写体信息进行放大的方法包括步骤：一、系统对操作者输入的所述手写体信息采用Perwitt边缘检测算法提取信息图像的边缘；二、采用batik SVG方法把信息图像的边缘转换为矢量图形；三、通过像素填充进行放大处理。

所述第七步中的所述编辑进一步包括子步骤：一、对信息进行索引计算，得出各所述独立信息单元在通篇文档中的物理位置，并计算所述独立信息单元相对于显示页面的动态索引；二、输入编辑指令，执行所述编辑指令完成对所述信息的编辑；三、对每次执行编辑指令后受到影响的信息单元进行自动重新排版。

具体展开说明：切分处理或合并处理的实现方法及算法。

本发明直接写入手写体信息方法，既可以通过输入构件录入一般的文字，也可以输入公式、图画等来进行编辑。同时可以借助扫描仪等设备读入整篇手写文字图像，将整篇手写文字图像进行切分成独立信息单元的图像后为后期编辑操作做准备。对于输入构件写入的字符，必须进行准确快速的切分以获得正确的单信息集合。而对于图画和完整的公式等，并不需要进行切分，直接进行缩放处理，对于借助扫描仪、数码相机等设备读入的整篇手写文字图像中的图画和完整的公式等，也不需要进行切分。

切分部分采用了两阶段切分方法：粗切分和细切分，细切分包括重叠字切分和粘连字的切分。

联机输入的汉字切分：

第一、粗切分。对于从输入区获取的单行手写体字符图像，首先对单行图像进行垂直投影。根据像素空白处进行粗切分，获得粗切分字段集，并计算字符左右边界、字宽w_i、平均字宽w、高宽比r_i、平均高宽比r、字间距d_i、平均字间距d。通过对不同人的大量手写体汉字训练发现，同一个笔记者完整汉字的高宽比在一定范围内β*r和α*r即变化。当r_i＞α*r时，作为合并的候选，而r_i＜β*r，将其作为再切分的候选。

第二、重叠汉字的切分

重叠字，是指两个汉字垂直投影重叠，但是没有共享的像素。举例如下表所示。

本方法中中我们提出一种基于连通域和垂直投影的重叠字切分算法。首先对于w＞w*θ或者高宽比r＞β*r的部分，将其作为候选。对候选图像，求背景(图中为白色)求连通域，如果连通域的高度等于候选图像的高度，则证明该候选为重叠汉字，进行重叠字的切分。

首先对候选图像，进行像素垂直投影，在中间位置一定范围内(经验值)找到投影最低点c，作为候选切分位置。如上表中竖线标注，即为候选位置处粗切分线。以位置c为中心，对图像作加窗处理，窗口宽度为w，如上表中点线标注所示。从上到下按行r_i处理，如果粗分线经过背景，则该位置加入到切分位置数组，slice[r_i]＝c。否则的话，粗分线在该行经过前景点。判断笔画的归属。方法：填充窗口内该行c列往右的像素为前景，然后通过前述的计算背景连通域高度的方法，判断连通性。如果不连通了，说明笔画属于左边，我们求出该点开始粗分线右边的前景连通域，把该连通域的每行最右点对应的列c_j加入到切分位置数组，即slice[r_i]＝c_j。然后继续处理连通域最后一行的下一行，直至处理完所有行。判断笔画属于右边汉字的处理过程相似。如果左右填充后，均连通，则应用高宽比、字宽等知识判断其归属，然后采用求slice数组的方法。根据slice数组中的值，将原来重叠的汉字，分成独立的汉字，如上表所示结果。红色像素左边和右边分别为一个完整的汉字。

第三、粘连汉字的切分

粘连汉字的切分举例如下表所示。

粘连汉字，指的是两个汉字不仅垂直投影重叠，而且有笔画连接在一起，共享一定像素区域。用傅立叶变换方法判断其是否为粘连字段。若为粘连字段，近一步切分成几个单字符。切分方法为：首先对原图像进行细化操作，得到细化图像，原图像垂直投影，得到粗切分列的位置c(图中竖直线对应的位置)。对于粘连汉字中的三种点：叉点、端点和角点，其中叉点、角点可作为候选点。细化图像中从粗切分位置向两边扫描寻找候选分割点，对应细化图像中所示A、B两点为找到的叉点候选点。结合汉字高宽比、字宽、方差等信息，选择一个合适的候选，本例中为B点。因为B在粗切分右边，所以在原图像中，把从B点开始的向左和向下方向的连续前景(黑色)变为背景(白色)。若为左侧，则向右向下改变连续前景为背景。改变后的图像如前景变背景效果图所示。至此，我们可采用重叠字的切分方法进行切分，得到切分结果显示。

上述单行手写体字符切分方法流程图可以参阅图2。

脱机文字图像切分：

读入整篇手写体字符图像，用户首先标示出该文字图像中不需要切分的信息单元，如字图像、公式等。对余下部分，系统判断其是否为多行图像。对多行图像的切分方法为：对多行文本图像进行水平投影发现，不同行的像素投影重叠现象严重，这是由于文本行书写时切斜所造成的。而书写倾斜是无限制自由手写体汉字书写中的常见问题，因此多行切分需重点解决这一问题。解决的思想是：对于总体趋势倾斜的行，我们可以将其分为若干个切斜角度很小的行拼接成的。这样，将一整篇文档(高为h，宽为w)划分为6(经验值)篇高为h，宽度1/6*w的子文档。对每篇子文档根据水平投影切分，切分过程与单行粗切分思想相同。然后按对应行号将子行重新合并成行。然后我们对每一行文字，采取与联机输入汉字图像切分相同的策略进行切分，该切分方法流程图可以参阅图3。具体多行文档切分方法举例可参阅下表。

过分部分合并：

许多汉字都是左右结构的，这样当书写比较分散时，粗切分会将该汉字的左右部分切分成两个以上部分。必须采取算法将它们合并。本方法中我们结合3种方法进行合并，保证合并的准确。实验证明，取得了很好的效果。这三种方法分别是基于汉字高宽比合并，基于字间距合并和基于密度比合并。以下分别介绍：

一、根据高宽比合并：

用p_i表示第i部分，其高宽比对应为r_i

Do{//合并候选表List

计算合并前方差S₁；

Pi＝List.get(0)；//读List表头元素

List.Delete(0)；//读取后删除头元素

Float Lr＝Rate(p_i，p_i-1)；//Rate()计算p_i左合并的高宽比并附

值Lr

Float Rr＝Rate(p_i，p_i+1)；//p_i右合并后高宽比并附值Rr

If(Lr＞α*r){//左合并后仍是候选

P＝Merge(p_i，p_i-1)；//合并p_i和p_i-1为p；

List.Add(0，p)；∥p添加到表头以便继续处理

}

else If(Rr＞α*r){∥右合并后仍是候选

P＝Merge(p_i，p_i+1)；//合并p_i和p_i+1为p；

List.Add(0，p)；∥p添加到表头以便继续处理

}

else{

r＝Lr和RR中更接近r的一个；

if(Lr比RR接近r)P＝Merge(p_i，p_i-1)；

else P＝Merge(p_i，p_i+1)；

重新计算高宽比方差S；

If(r＜β*r||w＞w*θ||S＞γ*S₁){

Cancel()；//取消不合理的合并

}

}while(List不为空)；

二、根据密度比合并：

同时训练发现，相邻的两个部分，例如p_i，p_i+1。如果，p_i的像素数量与p_i+1的像素数量比值大于一定阈值，则在直方图投影上，显示出明显的密度大小差距，即相邻两个部分投影面积的差距很明显。具体举例可以参阅下表.

我们通过计算某个部分的密度值，结合考虑汉字高宽比，字间距、密度比等信息，从左右邻居中选择最合适的一个与其合并。合并后也必须保证高宽比方差减小并且r＞β*r，并且合并后字宽小于w*θ，否则取消合并。

三、根据间距合并：

根据人们的书写习惯，以及训练结果显示，人们书写汉字时，往往字间的距离要大于汉字部首间的距离。如果相邻两个部分的间距小于平均字间距d，则考虑合并这两个部分。当然，结合考虑汉字高宽比，字间距等信息，从左右邻居中选择最合适的一个与其合并。对于不合适的合并要予以取消。

压缩部分的实现方法及算法

压缩部分的主要功能：是完成对切分后的文字图像进行无损压缩存储，将输入的文字的手写特征尽可能多的保存下来，提供给索引作存储要占用尽可能少的存储空间；同时，对编辑显示状态下的候选文字作放大的操作，要保证文字的无限放大不失真，无锯齿，保留原有书法特征。

通常图像放大算法是将每一象素在水平和垂直的方向上重复显示若干次，而缩小算法是将源文件每隔若干个象素取出一个象素。这种简单的放大方法对于灰度图像，伪彩和真彩色图像来说，还勉强可以接受，量化后相邻象素间的差值不是很大。但对于二值图像来说，放大后会形成色块，图像反差强烈，效果不佳，特别是曲线或存在噪声的情况下，这一现象尤为明显。

本方法中的图像的预处理采用基于双线性插值的缩放算法，缩小采用基于像素交迭的等权值矩阵缩小算法；放大采用边缘检测算法，位图形状转化为矢量图形，再进行像素填充的方法进行缩放处理。

第一、切分图像的归一化压缩处理：二次线性插值算法压缩图像举例示意图如图4所示。缩放映射原理：

(S_x-0)/(Swidth-0)＝(D_x-0)/(Dwidth-0)

S_x＝D_x*Swidth/Dwidth

(S_y-0)/(Shight-0)＝(D_y-0)/(Dhight-0)

S_y＝D_y*Shight/Dheight

聚焦看看(Sx，Sy)坐标点(Sx，Sy为浮点数)附近的情况，如图5所示。二次线性插值需要考虑(Sx，Sy)坐标点周围的4个颜色值Color0\Color1\Color2\Color3，把(Sx，Sy)到A\B\C\D坐标点的距离作为系数来把4个颜色混合出缩放后点的颜色；(u＝Sx-floor(Sx)；v＝Sy-floor(Sy)；说明：floor函数的返回值为小于等于参数的最大整数)

二次线性插值公式为：

tmpColor0＝Color0*(1-u)+Color2*u

tmpColor1＝Color1*(1-u)+Color3*u

DstColor＝tmpColor0*(1-v)+tmpColor2*v

展开公式为：

pm0＝(1-u)*(1-v)

pm1＝v*(1-u)

pm2＝u*(1-v)

pm3＝u*v

则颜色混合公式为：

DstColor＝Color0*pm0+Color1*pm1+Color2*pm2+Color3*pm3

等权值缩小算法(图象的缩小灰度级显示算法)：

若位图图像是二值的，缩小显示的时候由于n个点转化成一个点会导致图像局部细节信息丢失，比如一条宽度一个象素的细线由于缩小可能就会没有显示，而使用灰度级显示能解决这个缩小显示的问题。

基本约定：

一、灰度级缩小显示只针对黑白或者灰度影像

二、只有在显示＜100％的时候灰度级显示才生效

三、灰度级缩小算法是基于原始图像来运算

具体算法：

一、缩小算法

按照与原图比例1∶n来对原图n*n个点生成1个点(n可以是浮点数)，考虑到效率可以使用灰度级变换，从0-255取中间点127大于该值显示白小于改值显示黑色。

二、灰度级显示算法

结合缩小算法n*n个点生成一个点的原则，在原图上按照每个点的权值和颜色相乘再除以n来得到生成点的颜色值。这是一维坐标，扩展到二维空间算法相同。

位图压缩缩小处理流程图可以参阅图6。

具体展开说明：索引图像的无级放大

位图无级放大处理流程图可以参阅图7。

一、Perwitt算子边缘检测：

经典的插值方法，插值后的图像会出现边缘模糊或边缘锯齿等现象，这是因为这些传统的图像缩放方法实质上是对源图像建立了连续的数学模型，没有考虑边缘部分的高频信息损失的问题。人眼对图像的边缘部分特别敏感，插值后图像的边缘性质对一幅图像的质量有十分重要的影响。为使插值后的图像边缘保持良好的特性，采用基于Perwitt算子边沿检测方法的图像缩放算法，先检测边沿，对确认为处于边缘区域的像素，插值沿边沿方向进行；对平坦区域的像素，进行插值。该算法能在很大程度上消除插值后图像边缘的模糊和锯齿现象，提高插值后图像的视觉质量。

基于Perwitt算子的边缘检测算法基本步骤包括：

第一、滤波。边缘检测主要基于导数计算，但受噪声影响。但滤波器在降低噪声的同时也导致边缘强度的损失。

第二、增强。增强算法将邻域中灰度有显著变化的点突出显示。一般通过计算梯度幅值完成。

第三、检测。但在有些图象中梯度幅值较大的并不是边缘点。最简单的边缘检测是梯度幅值阈值判定。

第四、定位。精确确定边缘的位置。

边缘检测算法流程：

第一步：用高斯滤波器平滑图象；

第二步：用一阶偏导的有限差分来计算梯度的幅值和方向；

第三步：对梯度幅值进行非极大值抑制；

第四部：用双阈值算法检测和连接边缘。

二、位图形状转矢量图形缩放：

当字号特别大时，用字做的图边缘部分不平滑，采用将提取出的字体边缘转换为矢量图形，采用矢量缩放算法进行平滑缩放，然后绘出笔画轮廓填充之。在有些情况下，即使用平滑的曲线绘画仍然不可避免的会有锯齿，这是人的视觉特征决定的，所以仍然需要优化。

一般的矢量缩放应用很好的处理软件之所以会感觉平滑，是因为它在字体边缘部分增加了过渡区，在前景色和背景色做了一个平滑的色彩过渡。之所以感觉没有锯齿，是利用了人的视觉心理特征。所以在处理的后期，还需要在绘制好的文字边缘增加过渡色彩，这样就会感觉相当平滑。

另外由于设备分辨率有限，在屏幕上绘各种几何曲线都会有“锯齿”形，锯齿大小为一个像元。字体能无级缩放，不论放大多少“锯齿”总是一像元大，而字体的“锯齿”会随字形放大而增大。为了使感觉没有锯齿，可采用特殊算法，如反走样法进行优化。

三、显示平台的处理流程：

显示主要完成对初始输入文本的压缩存储与初始显示，以及编辑状态下文本的快速定位，刷新显示，主要流程包括：如图8所示的初始索引的计算流程图；图9所示的未编辑状态下图像的显示和图10所示的编辑状态下图像的刷新显示流程图.为了确定每个信息单元在当前显示页面上的物理位置，采用了如下方法计算当前单元的坐标(x_cur，y_cur)：设前一个单元的坐标为(x_pre，y_pre)，宽度为w_pre，w_cur为当前单元的宽度；WIDTH为页面的显示宽度，X_Margin、Y_Margin分别表示页面的上下边距，Unit_Interv表示显示单元之间的横向间隔，Row_Interv表示行距。

判断前一个单元是否为空，如果为空，则：

x_cur＝X_Margin

y_cur＝Y_Margin

否则，判断前一个单元的类型，如果为换行符或换页符：

x_cur＝X_Margin

y_cur＝y_pre+Row_Interv

否则，如果前一个单元是其他类型：

计算出判断因子λ，(λ＝0，1)，那么当前单元的坐标为：

x_cur＝(1-λ)*(x_pre+w_pre+Unit_Interv)+λ*X_Margin

y_cur＝y_pre+λ*Row_Interv

坐标修正：

设imageCollection记录了当前页面中已经出现的图像单元信息，则判断当前单元的坐标是否“落”到任一图像单元内，更新(x_cur，y_cur)直到当前单元不“落”在任一图像内。

存储及索引

一、存储及索引的结构：

将每幅压缩完毕的图像按像素展开成为一维数组，将每个字的宽度和总长度放在数组的最前端，设一位的添加删除位。这样文档的内容便存储在一系列的数组中。全局索引的结构分两个部分，第一个字节存储的内容为对应字的图像在全文中的位置，第二个字节存放的为图像数据在文件中存储的位置。动态索引记录下了每个显示在操作页面上的字图像开始显示时左上角的坐标值，动态索引的作用在于能够根据光标的位置快速准确地定位光标所选定的图像。动态索引在打开文件时创建，关闭文件时删除，并不保存在文件中。

文档的结构均由特殊字符控制，特殊字符和文字图像一同存储在文档内容中，特殊字符包括：换行符，段落符，分栏符，首字缩进符，空行符。每遇到特殊字符时，在如三所述的显示过程中采取特殊操作，从而控制文档显示的格式。

二、索引支持的添加删除编辑操作

经过如五所述的方法识别出添加或者删除的动作，选定将要添加或者删除的文字图像，根据动态索引所存储的坐标，定位将要添加或者删除的位置，先在索引中进行编辑操作。添加时将索引添加在正确的位置上，文字图像内容直接加在文件的末端，删除时先只在索引中将对应文字图像的索引删除，并将文字图像的删除位置1，直到用户保存文档时才真正将文字图像内容从文件中删除。

三、缓冲区保存操作

每当打开一个文字图像文档时在内存中设置缓冲区，用来保存近20步的操作，用来在特殊情况下的文档修复工作。

编辑部分的实现方法及算法

一、编辑指令的确定

确定编辑指令时，我们确定了左右选择操作、复制操作、粘贴操作、插入操作、删除操作、剪切操作、缩进(或空格)操作、回格操作和换行操作等常用的操作，但在索引的支持下，可以很容易的扩充其它需要的操作指令。虽然每个编辑操作的具体功能在显示设备上具体显示是不一样的，但他们的执行过程是一样的，即：

第一，确定编辑操作的当前位置；

第二，确定用户发出的编辑指令；

第三，根据对应的编辑指令执行相应的操作，具体来说，所定义的操作指令执行的所执行的操作不同的系统可以定义不同行为，以下给出其中一种常用的行为模式，但本方法并不限定于以下模式：

插入操作：确定当前位置，等待新的信息单元从输入构建输入，在索引中插入新的信息单元信息，刷新显示页面；

左选择操作：系统记录当前位置所对应的信息单元，并等待右选择操作，如果下一个操作不是右选择，则该操作撤销；

右选择操作：如果上一个操作是左选择，记录当前信息单元，如果当前信息单元的位置在左选择记录的信息单元之前，则撤销左右选择操作，否则，将系统记录的左选择操作的信息单元到当前信息单元之间的所有信息进行标记为已选择，等待下一步操作；

删除操作：确定被选择的信息单元为非空，从索引中删除被选定的信息单元，刷新显示；

复制操作：清空复制缓冲区，将标记为已选择的信息单元拷贝到缓冲区；

粘贴操作：确定操作的当前位置，将复制缓冲区中的信息单元在当前位置插入，刷新显示；

剪切操作：先对所选定的信息单元执行复制操作，再对所选定的信息单元执行删除操作；

缩进操作：先执行插入操作，并自动插入一个空格后结束插入操作；

回格操作：自动执行左右选择操作选定当前位置的前一个信息单元，并执行删除操作；

换行操作：确定当前位置，在当前位置插入一个换行符，刷新显示。

以下对各个编辑操作过程及操作后的文档重新排版结果进行举例说明：

1.编辑文档中的删除操作，如下表：

3.其它相应操作演示如下表：

以上实施例中作为举例说明采用了系统提供的编辑指令完成编辑操作及重新排版后的结果。以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种直接写入手写体信息的方法，其特征在于：所述直接写入手写体信息的方法包括步骤：

A：操作者通过输入构件写入手写体信息；

B：系统捕捉到用户写入的所述手写体信息并将该手写体信息切分或合并成独立信息单元后在显示构件上进行原笔迹显示。

2.根据权利要求1所述直接写入手写体信息的方法，其特征在于：所述步骤B包括子步骤：

B1、系统对所述手写体信息进行处理；

B2、系统对处理后的所述手写体信息进行编码；

B3、建立支持编辑操作的索引；

B4、基于所述索引对所述手写体信息进行显示和编辑。

3.根据权利要求2所述直接写入手写体信息的方法，其特征在于：所述步骤B1进一步包括子步骤：

B11、系统根据操作者写入信息时书写笔速和落笔轻重确定写入信息笔画的粗细；

B12、系统对捕捉到的长串所述手写体信息进行判断，并根据判断结果对所述手写体信息进行切分或合并处理，得到个体单位的独立信息单元；

B13、系统将切分或合并处理后的所述独立信息单元进行无损压缩或放大处理，得到设定的标准高度的信息。

4.根据权利要求3所述直接写入手写体信息的方法，其特征在于：所述步骤B12中所述切分处理为：系统对操作者输入的所述手写体信息进行垂直投影，根据投影像素中空白处的间隔进行判定，所述切分包括粗切分、重叠汉字的切分、粘连汉字的切分。

5.根据权利要求4所述直接写入手写体信息的方法，其特征在于：所述对输入手写体信息的粗切分方法具体包括：计算字符左右边界、字宽w_i、平均字宽w、高宽比r_i、平均高宽比r、字间距d_i、平均字间距d，引入判断系数α和β，

当r_i＞α*r时，作为合并的候选，

当r_i＜β*r时，作为切分的候选。

6.根据权利要求4所述直接写入手写体信息的方法，其特征在于：所述重叠汉字的切分包括步骤：

C：获取待切分手写体信息；

D：对所述待切分手写体信息进行像素的垂直投影；

E：在相连的两投影信息上确定投影最低点，并以该点为界进行重叠汉字的切分。

7.根据权利要求4所述直接写入手写体信息的方法，其特征在于：所述粘连汉字的切分包括步骤：

F：通过傅立叶变换方法确定粘连汉字；

G：对所述粘连汉字进行细化处理；

H：确定切分点进行粘连汉字的切分。

8.根据权利要求3所述直接写入手写体信息的方法，其特征在于：所述步骤B12中所述合并处理包括：基于输入信息高宽比的合并、基于输入信息间距比的合并和基于输入信息像素密度比的合并。

9.根据权利要求3所述直接写入手写体信息的方法，其特征在于：所述步骤B13中对所述手写体信息进行压缩的方法包括步骤：

J：系统对操作者输入的所述手写体信息采用双线性差值算法提取像素分量；

K：采用等权值矩阵缩小算法进行压缩；

对所述手写体信息进行放大的方法包括步骤：

j：系统对操作者输入的所述手写体信息采用Perwitt边缘检测算法提取信息图像的边缘；

k：采用batik SVG方法把信息图像的边缘转换为矢量图形；

l：通过像素填充进行放大处理。

10.根据权利要求2所述直接写入手写体信息的方法，其特征在于：所述步骤B4中所述编辑进一步包括子步骤：

a.对信息进行索引计算，得出各所述独立信息单元在通篇文档中的物理位置，并计算所述独立信息单元相对于显示页面的动态索引；

b.输入编辑指令，执行所述编辑指令完成对所述信息的编辑；

c：对每次执行编辑指令后受到影响的信息单元进行自动重新排版。