CN109522862A

CN109522862A - 一种文档修正方法、装置、设备及可读存储介质

Info

Publication number: CN109522862A
Application number: CN201811435746.XA
Authority: CN
Inventors: 张玮玮; 黄梓峰; 严亚路; 林欢欢; 余昳超; 秦冬生
Original assignee: iFlytek Co Ltd
Current assignee: Xi'an Xunfei Super Brain Information Technology Co., Ltd.
Priority date: 2018-11-28
Filing date: 2018-11-28
Publication date: 2019-03-26

Abstract

本申请公开了一种文档修正方法、装置、设备及可读存储介质，本申请获取修正版纸质文档的第一图像，所述修正版纸质文档为对原始纸质文档按照预设的修正规则添加修正标记后得到，识别所述第一图像中所述修正标记对应的图像区域，进一步参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。本申请方案支持在原始纸质文档上添加修正标记，得到修正版纸质文档，进一步可以处理修正版纸质文档得到修正后的第一图像。从而对于有错误的原始纸质文档，可以直接对其进行修正，无需先扫描成电子版，节省了用户大量的时间，且不需要依赖具备文本编辑处理能力的外部设备，操作更简单。

Description

一种文档修正方法、装置、设备及可读存储介质

技术领域

本申请涉及信息识别技术领域，更具体地说，涉及一种文档修正方法、装置、设备及可读存储介质。

背景技术

OCR(OpticalCharacter Recognition，光学字符识别)是指电子设备(如扫描仪、数码相机等)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将该形状翻译成计算机文字的过程。由于可以将纸质文档中的文字转换为文本格式，供文字处理软件进一步编辑加工，OCR受到了越来越多人的青睐。

在现有技术中，当发现纸质文档中存在错误，且没有对应的电子文档，比如对应的电子文档丢失或者纸质文档为传真文件时，往往需要先将纸质文档通过OCR识别，得到与纸质文档对应的电子文档，然后使用具备文本编辑处理能力的设备对电子文档进行修正。显然这种先识别为电子文档，后进行修正的方式会消耗用户大量时间，且需要具备文本编辑处理能力的外部设备的支持。

发明内容

有鉴于此，本申请提供了一种文档修正方法、装置、设备及可读存储介质，用于解决现有技术中，纸质文档的错误必须通过对应的电子文档修正而带来的耗时，依赖特定功能外部设备的问题。

为了实现上述目的，现提出的方案如下：

一种文档修正方法，包括：

获取修正版纸质文档的第一图像，所述修正版纸质文档为对原始纸质文档按照预设的修正规则添加修正标记后得到；

识别所述第一图像中所述修正标记对应的图像区域；

参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

优选地，所述识别所述第一图像中所述修正标记对应的图像区域，包括：

获取所述原始纸质文档的第二图像；

将所述第一图像和所述第二图像做差值处理，得到所述第一图像中的差值像素区域；

根据所述差值像素区域，在所述第一图像中确定所述修正标记对应的图像区域。

优选地，所述根据所述差值像素区域，在所述第一图像中确定所述修正标记对应的图像区域，包括：

将所述差值像素区域，及所述第一图像中与所述差值像素区域相交面积满足设定面积条件的内容区域，共同确定为所述修正标记对应的图像区域。

根据修正标记的图像标记特征，在所述第一图像中识别具备所述图像标记特征的图像区域，作为所述修正标记对应的图像区域。

优选地，所述参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像，包括：

根据所述修正标记对应的图像区域，识别所述修正标记的修正类型；

参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

优选地，所述根据所述修正标记对应的图像区域，识别所述修正标记的修正类型，包括：

提取所述修正标记对应的图像区域的图像特征；

将所述图像特征输入预置的分类模型，得到分类模型输出的所述修正标记的修正类型，所述分类模型为，利用标注有修正类型的修正标记的图像标记特征训练得到。

优选地，所述参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像，包括：

在所述修正标记对应的图像区域中确定待修正区域及与所述待修正区域对应的修正内容区域；

参考所述修正规则中与所述修正类型对应的修正方式，基于所述修正内容区域对所述待修正区域进行修正，并去除所述修正标记，得到修正后的第一图像。

优选地，所述参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像，还包括：

根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域；

若是，执行所述在所述修正标记对应的图像区域中确定待修正区域及与所述待修正区域对应的修正内容区域的步骤；

若否，在所述修正标记对应的图像区域中确定待修正区域；以及，

参考所述修正规则中与所述修正类型对应的修正方式，对所述待修正区域进行修正，并去除所述修正标记，得到修正后的第一图像。

优选地，

若所述修正标记的修正类型为多余字删除，则确定所述修正标记对应的图像区域中不存在修正内容区域；所述对所述待修正区域进行修正，包括：

将所述待修正区域中的内容删除；

若所述修正标记的修正类型为语序不当调整，则确定所述修正标记对应的图像区域中不存在修正内容区域；所述待修正区域包括第一待修正区域和第二待修正区域，所述对所述待修正区域进行修正，包括：

将所述第一待修正区域和所述第二待修正区域中的内容进行交换；

若所述修正标记的修正类型为错别字改正，则确定所述修正标记对应的图像区域中存在修正内容区域；所述基于所述修正内容区域对所述待修正区域进行修正，包括：

将所述待修正区域中的内容删除，并替换为所述修正内容区域中的内容；

若所述修正标记的修正类型为成分残缺补充，则确定所述修正标记对应的图像区域中存在修正内容区域；所述基于所述修正内容区域对所述待修正区域进行修正，包括：

将所述修正内容区域中的内容，插入所述待修正区域中。

优选地，

若所述修正标记的修正类型为格式调整，则确定所述修正标记对应的图像区域中存在修正内容区域；所述基于所述修正内容区域对所述待修正区域进行修正，包括：

将所述修正内容区域中的内容识别为格式编辑指令；

按照所述格式编辑指令，对所述待修正区域中的内容进行格式编辑。

优选地，还包括：

将所述修正后的第一图像打印输出。

一种文档修正装置，包括：

第一图像获取单元，用于获取修正版纸质文档的第一图像，所述修正版纸质文档为对原始纸质文档按照预设的修正规则添加修正标记后得到；

图像区域识别单元，用于识别所述第一图像中所述修正标记对应的图像区域；

图像区域修正单元，用于参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

优选地，所述图像区域识别单元包括：

第二图像获取单元，用于获取所述原始纸质文档的第二图像；

差值像素区域确定单元，用于将所述第一图像和所述第二图像做差值处理，得到所述第一图像中的差值像素区域；

第一图像区域确定单元，用于根据所述差值像素区域，在所述第一图像中确定所述修正标记对应的图像区域。

优选地，所述第一图像区域确定单元包括：

相交面积确定单元，用于将所述差值像素区域，及所述第一图像中与所述差值像素区域相交面积满足设定面积条件的内容区域，共同确定为所述修正标记对应的图像区域。

优选地，所述图像区域识别单元包括：

第二图像区域确定单元，用于根据修正标记的图像标记特征，在所述第一图像中识别具备所述图像标记特征的图像区域，作为所述修正标记对应的图像区域。

优选地，所述图像区域修正单元包括：

修正类型识别单元，用于根据所述修正标记对应的图像区域，识别所述修正标记的修正类型；

修正单元，用于参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

优选地，所述修正类型识别单元包括：

图像特征提取单元，用于提取所述修正标记对应的图像区域的图像特征；

模型预测单元，用于将所述图像特征输入预置的分类模型，得到分类模型输出的所述修正标记的修正类型，所述分类模型为，利用标注有修正类型的修正标记的图像标记特征训练得到。

优选地，所述修正单元包括：

第一修正子单元，用于在所述修正标记对应的图像区域中确定待修正区域及与所述待修正区域对应的修正内容区域；

第二修正子单元，用于参考所述修正规则中与所述修正类型对应的修正方式，基于所述修正内容区域对所述待修正区域进行修正，并去除所述修正标记，得到修正后的第一图像。

优选地，所述修正单元还包括：

第三修正子单元，用于根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域；若是，执行所述第一修正子单元，若否，执行第四修正子单元；

第四修正子单元，用于在所述修正标记对应的图像区域中确定待修正区域；

第五修正子单元，用于参考所述修正规则中与所述修正类型对应的修正方式，对所述待修正区域进行修正，并去除所述修正标记，得到修正后的第一图像。

优选地，

所述第三修正子单元根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域的过程，具体包括：

若所述修正标记的修正类型为多余字删除，则确定所述修正标记对应的图像区域中不存在修正内容区域；

若所述修正标记的修正类型为语序不当调整，则确定所述修正标记对应的图像区域中不存在修正内容区域；

若所述修正标记的修正类型为错别字改正，则确定所述修正标记对应的图像区域中存在修正内容区域；

若所述修正标记的修正类型为成分残缺补充，则确定所述修正标记对应的图像区域中存在修正内容区域；

所述第五修正子单元包括：

多余字修正单元，用于将所述待修正区域中的内容删除；

语序不当修正单元，用于将所述待修正区域包含的第一待修正区域和第二待修正区域中的内容进行交换；

所述第二修正子单元包括：

错别字修正单元，用于将所述待修正区域中的内容删除，并替换为所述修正内容区域中的内容；

成分残缺修正单元，用于将所述修正内容区域中的内容，插入所述待修正区域中。

优选地，

所述第三修正子单元根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域的过程，还包括：

若所述修正标记的修正类型为格式调整，则确定所述修正标记对应的图像区域中存在修正内容区域；

所述第五修正子单元还包括：

格式修正单元，用于将所述修正内容区域中的内容识别为格式编辑指令；

优选地，还包括：

第一图像输出单元，用于将所述修正后的第一图像打印输出。

一种文档修正设备，包括存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如上所述的文档修正方法的各个步骤。

一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如上所述的文档修正方法的各个步骤。

从上述的技术方案可以看出，本申请实施例提供的文档修正方法，当发现原始纸质文档中存在错误时，可以由用户按照预设的修正规则，对原始纸质文档中的错误之处添加修正标记，得到修正版纸质文档。在此基础上，可以获取修正版纸质文档的第一图像，进一步可以识别该第一图像中修正标记对应的图像区域，可以理解的是，该图像区域中包括原始纸质文档中的错误及对应的修正标记，考虑到修正标记是按照修正规则添加的，本申请实施例可以进一步参考修正规则，对第一图像中修正标记对应的图像区域进行修正，得到修正后的第一图像。相比于现有技术中仅能对原始纸质文档识别得到的图像修正错误，本申请方案支持在原始纸质文档上添加修正标记，得到修正版纸质文档，进一步可以处理修正版纸质文档得到修正后的第一图像。对于修正后的第一图像可根据需要进行处理，比如保存或打印。从而对于有错误的原始纸质文档，可以直接对其进行修正，无需先扫描成电子版，节省了用户大量的时间，且不需要依赖具备文本编辑处理能力的外部设备，操作更简单。

进一步，本申请方案由于支持用户在原始纸质文档上修正错误，更符合用户使用习惯。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例公开的一种文档修正方法流程图；

图2a-2c示例了确定差值像素区域的过程示意图；

图3示例了确定相交面积满足设定面积条件的内容区域示意图；

图4示例了修正标记识别错误示意图；

图5示例了修正标记与修正类型对应关系示意图；

图6示例了语序不当调整类型的修正方式示意图；

图7示例了多余字删除类型的修正方式示意图；

图8示例了错别字改正类型的修正方式示意图；

图9示例了成分残缺补充类型的修正方式示意图；

图10示例了格式调整类型的修正方式示意图；

图11为本申请实施例公开的一种文档修正装置结构示意图；

图12为本申请实施例公开的一种文档修正设备的硬件结构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的文档修正方法，适用于需要对纸质文档中的错误进行修正的场景，用户可以通过预设的修正规则，直接对有错误的纸质文档添加修正标记，并通过具有扫描功能的终端设备对该添加修正标记的纸质文档进行识别、处理，进而得到修正后的电子文档，节省了用户大量的时间，且不需要依赖具备文本编辑处理能力的外部设备，操作更简单。接下来，结合附图1对本申请文档修正方法进行介绍，如图1示例了一种文档修正方法流程图，该方法详细包括：

步骤S100、获取修正版纸质文档的第一图像。

具体地，当用户发现原始纸质文档中存在错误时，可以对该原始纸质文档按照预设的修正规则添加修正标记，得到修正版纸质文档。这里，修正标记是指用来修正原始纸质文档的标记，该修正标记可以是图形、线条、数字、汉字及中英文字母中的任意一种或多种的组合。

通过对修正版纸质文档进行扫描或者拍照，可以得到第一图像。这里，第一图像是为了与第二图像进行区分而定义，其中，第二图像是指扫描或拍照原始纸质文档得到的图像。

本步骤中，可以获取修正版纸质文档的第一图像，这里的获取过程可以包括：连通域分析、投影切分、特征提取与模型训练。其中，连通域分析是指，使用连通域分析法，根据连通域的大小或像素点分布等特征，标记连通域中各部分的属性，如文本、图像、表格等；投影切分是指，采用投影法对第一图像进行切分，得到独立的每个文字图像；特征提取与模型训练是指，利用边缘特征、变换特征、穿透特征、网格特征、特征点特征、方向线素特征等特征方法中的一种或多种，提取独立的每个文字图像的特征，并通过卷积神经网络等模型进行模型训练，得到识别后的文字，该卷积神经网络模型是以每个文字图像的特征为训练样本，以标注的识别文字为训练标签训练得到。

步骤S110、识别所述第一图像中所述修正标记对应的图像区域。

可以理解的是，上述步骤S100得到的第一图像包括用户添加的修正标记，则本步骤可以在第一图像中识别用户添加的修正标记，以及修正标记所期望修正的错误内容，进一步可以将修正标记和所期望修正的错误内容组成的图像区域，作为修正标记对应的图像区域。

步骤S120、参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

具体地，用户在对原始纸质文档进行修正时是按照预设的修正规则实施的，因此本步骤可以参考预设的修正规则，对第一图像中修正标记对应的图像区域进行修正，得到修正后的第一图像。

需要说明的是，本步骤可以是直接得到修正后的第一图像，也可以是得到修正后的电子文档，由于步骤S100已经识别出每个文字，因此可以得到修正后正确内容的电子文档。

本申请实施例提供的文档修正方法，当发现原始纸质文档中存在错误时，可以由用户按照预设的修正规则，对原始纸质文档中的错误之处添加修正标记，得到修正版纸质文档。在此基础上，可以获取修正版纸质文档的第一图像，进一步可以识别该第一图像中修正标记对应的图像区域，可以理解的是，该图像区域中包括原始纸质文档中的错误及对应的修正标记，考虑到修正标记是按照修正规则添加的，本申请实施例可以进一步参考修正规则，对第一图像中修正标记对应的图像区域进行修正，得到修正后的第一图像。相比于现有技术中仅能对原始纸质文档识别得到的图像修正错误，本申请方案支持在原始纸质文档上添加修正标记，得到修正版纸质文档，进一步可以处理修正版纸质文档得到修正后的第一图像。对于修正后的第一图像可根据需要进行处理，比如保存或打印。从而对于有错误的原始纸质文档，可以直接对其进行修正，无需先扫描成电子版，节省了用户大量的时间，且不需要依赖具备文本编辑处理能力的外部设备，操作更简单。

本申请实施例介绍了上述步骤S110，识别所述第一图像中所述修正标记对应的图像区域的几种可选实施方式，接下来分别进行介绍。

第一种可选方式：

用户在原始纸质文档中添加修正标记，可以得到修正版纸质文档，对该修正版纸质文档进行扫描，可以得到第一图像，而对原始纸质文档进行扫描，可以得到第二图像。可以理解的是，相比于第二图像，第一图像中增加了修正标记。因此，本实施例可以对第二图像与第一图像做差值，识别第一图像中修正标记对应的图像区域。具体实现过程可以包括：

S1、获取所述原始纸质文档的第二图像。

具体地，对没有添加修正标记的原始纸质文档进行扫描，可以得到第二图像。这里，原始纸质文档是指含有错误的纸质文档。

本步骤中获取原始纸质文档的第二图像的过程可以和上述步骤S100相同，这里不再重复赘述。

S2、将所述第一图像和所述第二图像做差值处理，得到所述第一图像中的差值像素区域。

可以理解的是，相比于第二图像，第一图像中增加了按照修正规则添加的修正标记，因此将第一图像和第二图像对应位置的像素做差值后，可以得到添加的修正标记，则可以将该修正标记所在的像素区域定义为第一图像中的差值像素区域。

参见图2a-2c所示，其示例了确定差值像素区域的过程示意图。其中，图2a为第一图像示意图，图2b为第二图像示意图，显然，将该两幅图对应位置的像素做差值后，可以得到如图2c所示的修正标记，则该修正标记所在的区域即为第一图像中的差值像素区域。

S3、根据所述差值像素区域，在所述第一图像中确定所述修正标记对应的图像区域。

具体地，前述已经说明了，第一图像中的差值像素区域即为修正标记所在的像素区域，则本步骤可以根据差值像素区域，确定第一图像中，修正标记所期望修正的错误内容，进而可以根据差值像素区域，及期望修正的错误内容，确定第一图像中的修正标记对应的图像区域。

需要说明的是，本步骤中可以包含多种可选的确定第一图像中的修正标记对应的图像区域的实施方式，这里给出了其中一种可选实施方式，具体可以包括：

具体地，第一图像中的内容区域是指第一图像中除修正标记外的所有内容所在的区域。以第一图像为一份文稿为例，则内容区域可以是文稿中文本所在的区域。从另一个角度分析，第一图像由内容区域和空白区域组成，内容区域即为印刷体或手写体所在的区域。显然，该内容区域包括修正标记所期望修正的错误内容。可以理解的是，差值像素区域与第一图像中的内容区域存在相交面积，则当该相交面积满足设定面积条件时，可以将差值像素区域，及相交面积满足设定面积条件的内容区域，共同确定为修正标记对应的图像区域。

一种可选的确定相交面积满足设定面积条件的内容区域的方式可以包括：将第一图像中除修正标记外的内容进行区域划分，得到若干内容区域。在对内容进行区域划分时，可以采用连通域分析、聚类等算法实现。针对每一内容区域，当差值像素区域及该内容区域的相交面积，与该内容区域的比值大于设定比值阈值时(设定比值阈值可以是90％或其它可选数值)，将该内容区域，及差值像素区域，共同确定为修正标记对应的图像区域。

参见图3所示，图3示例了确定相交面积满足设定面积条件的内容区域示意图。假设图3表示修正版纸质文档经扫描后得到的第一图像，其中“我是一位科学家”中的每个汉字所在的区域为第一图像中的一个内容区域，图3中圆圈表示修正标记，其所在的区域为差值像素区域。

显然，针对汉字“我”、“是”、“一”、“学”、“家”所在的内容区域，差值像素区域与上述每一内容区域均没有相交面积。而针对汉字“位”所在的内容区域，差值像素区域及该内容区域的相交面积，与该内容区域的比值小于90％，则该内容区域不是所要确定的内容区域，同理，针对汉字“科”所在的内容区域，差值像素区域及该内容区域的相交面积，与该内容区域的比值大于90％，则该内容区域即为所要确定的内容区域，则可以将汉字“科”所在的内容区域及差值像素区域，共同确定为修正标记对应的图像区域。

第二种可选方式：

可以理解的是，第一图像中包含修正标记，则可以根据该修正标记的图像标记特征，识别第一图像中修正标记对应的图像区域。具体实现过程可以包括：

具体地，对原始纸质文档按照预设的修正规则添加修正标记后可以得到修正版纸质文档，而第一图像是由修正版纸质文档扫描后得到。可以理解的是，在第一图像中存在修正标记。本申请实施例可以预先确定修正标记的图像标记特征，进而在第一图像中通过特征对比等方式，搜索具备修正标记的图像标记特征的图像区域。

需要说明的是，前述两种识别第一图像中修正标记对应的图像区域的可选实施方式中，相比第二种可选方式，第一种可选方式中将第一图像与第二图像做差值的方式可以避免出现识别错误的情况。

以图4为例来说明，原始纸质文档中的内容为“元旦快乐！”，在“元”上添加的修正标记为方框，则在第二种可选方式中，可能会将该方框与“元”识别为汉字“园”，导致在第一图像中识别不到修正标记，显然，这样会识别错误；而第一种可选方式中，通过第一图像与第二图像做差值的方式，“元”在做差过程中可以与修正标记“方框”区分开，从而可以正确识别该修正标记。

本申请的另一个实施例，对上述步骤S120，参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像的过程进行介绍。

具体地，修正规则可以包括修正标记的修正类型和修正方式，则本实施例可以参考修正规则中的修正类型和修正方式，修正第一图像中修正标记对应的图像区域，进而得到修正后的第一图像，具体修正的实施过程可以包括：

A1、根据所述修正标记对应的图像区域，识别所述修正标记的修正类型。

具体地，原始纸质文档中的错误可以包含多种类型，如多余字、语序不当、错别字、成分残缺等，对每种类型的错误进行修正时，分别对应一种修正类型，如对多余字类型的错误进行修正时，修正类型可以是多余字删除；对语序不当类型的错误进行修正时，修正类型可以是语序不当调整；对错别字类型的错误进行修正时，修正类型可以是错别字改正；对成分残缺类型的错误进行修正时，修正类型可以是成分残缺补充等。本步骤中可以根据第一图像包含的修正标记对应的图像区域，确定修正标记，进一步根据修正标记与修正类型的对应关系，确定修正标记的修正类型。

需要说明的是，修正标记与修正类型为一一对应的关系。本步骤中可以预先设定修正标记与修正类型的对应关系，这里，给出了几种可选的修正标记与修正类型的对应关系，具体可以包括：

1)当原始纸质文档中存在多余字，需要将其删除时，修正标记可以包括：一个圆圈，及圆圈外的一个螺旋线。其中，圆圈用于圈住多余字，螺旋线的一端与圆圈相连。则当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型为多余字删除。

需要说明的是，上述圆圈可以是正圆，也可以是椭圆。

参见图5所示，显然，图5中“别的”为多余字，需要将其删除，则可以用一个圆圈及一个螺旋线表示修正标记。当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型为多余字删除。

2)当原始纸质文档中出现前后颠倒的语句，需要调整语序时，修正标记可以包括：至少两个方框，及一条非竖直的连接线。可以将前后颠倒的语句中，需要向后调整的语句定义为在前语句，需要向前调整的语句定义为在后语句。则修正标记中，方框用于框住每一需要进行调整的语句，非竖直的连接线用于连接方框，且非竖直的连接线左侧的方框中的内容为在前语句；连接线右侧的方框中的内容为在后语句。

一种较为简单的形式下，对语序不当类型的错误进行修正时，修正标记可以包括两个方框及一条非竖直的连接线，则当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型为语序不当调整。

仍参见图5所示，其中，“它能随着天气的自动变化调节温度”中出现了语序不当类型的错误，需要调整在前语句“自动”及在后语句“变化”的位置，则可以用两个方框及一条连接线表示修正标记。当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型即为语序不当调整。

需要说明的是，语序不当类型的错误中可能出现在前语句和/或在后语句换行的情况，则当在前语句换行时，可以用至少两个方框分别框住每行的在前语句，同理，当在后语句换行时，可以用至少两个方框分别框住每行的在后语句。为了与上述简单形式下的修正标记区分开，可以在出现在前语句和/或在后语句换行时，将每一方框分别用阿拉伯数字1、2、…、n(n≥3)标注，则该形式下的修正标记可以包括至少三个方框、一条非竖直的连接线及在每一方框上标注的阿拉伯数字，其中，方框用于框住每行中的在前语句或每行中的在后语句。则当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型为语序不当调整。

参见图6所示，需要调整在前语句“科学家”和在后语句“位”的位置，及调整在前语句“它能随着天气的变化自动调节温度”和在后语句“我要发明一种万能空调”的位置。则可以用两个方框及一条非竖直的连接线组成修正标记，该修正标记表示要调整“科学家”和“位”的位置。显然，这种修正标记的形式较为简单。

对于另一处语序不当类型的错误，在前语句“它能随着天气的变化自动调节温度”及在后语句“我要发明一种万能空调”均有换行。为了与上述简单形式下的修正标记进行区分，可以用每个方框分别框住每行中的在前语句或在后语句，且在每个方框上分别用阿拉伯数字标注。显然，这种形式下的修正标记相对较为复杂。

则当修正标记对应的图像区域中出现该两种形式下的修正标记时，可以确定该两种形式下的修正标记的修正类型为语序不当调整。

3)当原始纸质文档中存在错别字，需要将其改正时，修正标记可以包括：两个圆圈，一条连接线，及与错别字对应的正确字。其中，一个圆圈用于圈住错别字，另一个圆圈中用于添加与错别字对应的正确字，连接线用于连接两个圆圈。则当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型为错别字改正。

需要说明的是，上述圆圈可以是正圆，也可以是椭圆。

仍以图5为例进行说明，其中“方面”为错别字，需要将其改正为“发明”，则可以用两个圆圈、一条连接线及与错别字对应的正确字“发明”表示修正标记，当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型即为错别字改正。

4)当原始纸质文档中存在语句不通顺，需要添加内容时，修正标记可以包括：一个“V”角，及补充内容。其中，该“V”角可以是小于180度的“V”角，且可以是正的“V”角或负的“V”角，也可以是倾斜的“V”角；补充内容位于“V”角小于180度的一侧内部。则当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型为成分残缺补充。

需要说明的是，由于用户在手写修正标记时，无法保证修正标记的大小完全相同，因此，本申请中，修正标记的大小、位置等均可以不做严格限定。

仍参见图5所示，图5中“假如我是一科学家”缺少成分，需要将“位”补充到该语句中，则可以用“V”角及补充内容“位”表示修正标记，当修正标记对应的图像区域中出现该修正标记时，可以确定该修正标记的修正类型即为成分残缺补充。

A2、参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

具体地，针对修正规则中的每一修正类型，对应有一种修正方式。其中，修正方式表示针对其对应的修正类型，对第一图像中修正标记对应的图像区域进行修正的具体方式。

针对上述A1介绍的几种修正类型，这里给出了其对应的可选修正方式，具体可以包括：

1)当原始纸质文档中的错误为多余字类型时，可以确定修正规则中的修正类型为多余字删除，则对应的修正方式可以是，将原始纸质文档中的多余字删除。

2)当原始纸质文档中的错误为语序不当类型时，可以确定修正规则中的修正类型为语序不当调整，则对应的修正方式可以是，将原始纸质文档中前后颠倒的语句中的在前语句和在后语句进行位置交换。

3)当原始纸质文档中的错误为错别字类型时，可以确定修正规则中的修正类型为错别字改正，则对应的修正方式可以是，将原始纸质文档中的错别字用对应的正确字替换。

4)当原始纸质文档中的错误为成分残缺类型时，可以确定修正规则中的修正类型为成分残缺补充，则对应的修正方式可以是，将原始纸质文档中缺少的补充内容补充到对应的语句中。

则本步骤中可以首先确定修正标记对应的图像区域中每处错误的修正类型，进而参考对应的修正方式，对错误进行修正，得到修正后的第一图像。

本申请实施例介绍了上述A1，根据所述修正标记对应的图像区域，识别所述修正标记的修正类型的几种可选实施方式，具体可以包括：

第一种：前述已经说明了，修正标记与修正类型存在对应关系，则本申请实施例可以针对每一修正类型，预设对应修正标记的图像特征的规则。在提取修正标记对应的图像区域的图像特征后，针对每一图像特征，可以根据预设规则，判断具备该图像特征的修正标记对应哪种修正类型。

示例如，预设的规则可以是：具备“V”角特征的修正标记，对应的修正类型为成分残缺补充；具备螺旋线特征的修正标记，对应的修正类型为多余字删除。则当提取的修正标记对应的图像区域的图像特征为“V”角时，可以确定该修正标记对应的修正类型为成分残缺，而当提取的修正标记对应的图像区域的图像特征为螺旋线时，可以确定该修正标记对应的修正类型为多余字删除。

第二种：

本申请还可以根据分类模型，确定修正标记的修正类型，具体可以包括：

B1、提取所述修正标记对应的图像区域的图像特征。

具体地，修正标记不同，提取的修正标记对应的图像区域的图像特征也不同。本步骤中可以提取修正标记对应的图像区域的图像特征，进而可以在后续步骤中利用该图像特征，识别修正标记的修正类型。

B2、将所述图像特征输入预置的分类模型，得到分类模型输出的所述修正标记的修正类型。

具体地，可以将修正标记对应的图像区域的图像特征，输入预置的分类模型，则该分类模型可以根据图像区域的图像特征，对修正标记进行分类，并输出修正标记的修正类型。这里，分类模型为，利用标注有修正类型的修正标记的图像标记特征训练得到。

本申请的又一个实施例，对上述A2，参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像的过程进行介绍，具体可以包括：

C1、在所述修正标记对应的图像区域中确定待修正区域及与所述待修正区域对应的修正内容区域。

具体地，待修正区域是指原始纸质文档中错误所在的区域，修正内容区域是指与待修正区域对应的，用于修正错误的内容区域。本步骤可以在与修正标记对应的图像区域中，确定存在错误的待修正区域，及与待修正区域对应的修正内容区域。

其中，修正内容区域可以是数字、中英文字母、汉字等，也可以是空值。

仍以图5为例进行说明。图5中想要将“方面”替换为“发明”，则“方面”为原始纸质文档中的错误区域，也即待修正区域，而“发明”则为与待修正区域对应的修正内容区域。进一步，对于图5中多余字“别的”，其待修正区域即为圆圈圈住的区域，而修正内容区域可以是空值。

C2、参考所述修正规则中与所述修正类型对应的修正方式，基于所述修正内容区域对所述待修正区域进行修正，并去除所述修正标记，得到修正后的第一图像。

具体地，可以参考修正规则中与修正类型对应的修正方式，利用修正内容区域，对待修正区域中的错误进行修正，并去除修正标记，得到修正后的第一图像。这里，修正标记可以包括修正内容区域及修正符号，其中的修正符号为用来说明修正类型的符号，如多余字删除类型中的圆圈及螺旋线等。

前述实施例给出了确定修正内容区域存在的情况下，步骤S120，参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像的一种可选实施方式。实际情况中，可能会有修正内容区域不存在的情况，因而需要提前判断修正标记对应的图像区域中是否存在修正内容区域。基于此，本申请实施例介绍了步骤S120，参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像的另一种可选实施方式，具体实施过程可以包括：

D1、根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域；若是，执行前述C1和C2步骤，若否，执行下述D2。

本实施例中针对每种修正类型的修正标记，可以预先记录其是否存在修正内容区域，也即预先建立修正类型与是否存在修正内容区域的对应关系。进而，在确定了修正标记的修正类型之后，可以查询对应关系，确定修正标记对应的图像区域是否存在修正内容区域。

D2、在所述修正标记对应的图像区域中确定待修正区域；以及参考所述修正规则中与所述修正类型对应的修正方式，对所述待修正区域进行修正，并去除所述修正标记，得到修正后的第一图像。

具体地，确定修正标记对应的图像区域中不存在修正内容区域后，可以在修正标记对应的图像区域中确定待修正区域，进而参考修正类型对应的修正方式，修正该待修正区域，并去除修正标记，得到修正后的第一图像。

在此基础上，本申请实施例介绍了几种修正类型对应的可选修正方式，接下来分别进行介绍。

第一种：

若所述修正标记的修正类型为多余字删除，则可以确定所述修正标记对应的图像区域中不存在修正内容区域。对应的，上述D2中对所述待修正区域进行修正的过程可以包括：将所述待修正区域中的内容删除。

具体地，当修正标记的修正类型为多余字删除时，可以确定修正标记对应的图像区域中不存在修正内容区域，进而可以确定对图像区域中的待修正区域进行修正的过程可以为将待修正区域中的内容删除。这里，待修正区域的内容为多余字，也即多余字删除类型对应的修正方式可以为，将多余字删除。

需要说明的是，可以依次删除每个多余字，也可以一次删除多个连续多余字。

参见图7所示，其示例了多余字删除类型的修正方式示意图。显然图7所示的第一图像中存在几处错误，则可以首先根据修正标记确定该错误的修正类型为多余字删除，进一步可以确定修正标记对应的图像区域中不存在修正内容区域，在此基础上，可以根据修正类型对应的修正方式，将多余字“个”、“天气”、“别的”删除。

第二种：

若所述修正标记的修正类型为语序不当调整，则可以确定所述修正标记对应的图像区域中不存在修正内容区域。对应的，上述D2中待修正区域可以包括第一待修正区域和第二待修正区域，则对所述待修正区域进行修正的过程可以包括：将所述第一待修正区域和所述第二待修正区域中的内容进行交换。

具体地，原始纸质文档中前后颠倒类型的语句错误所对应的修正类型为语序不当调整。前述已经说明了，可以将前后颠倒的语句中，需要向后调整的语句定义为在前语句，需要向前调整的语句定义为在后语句，则为了更好地描述该语序不当调整类型的修正方式，可以将在前语句所在的区域定义为第一待修正区域，在后语句所在的区域定义为第二待修正区域。

则当修正标记的修正类型为语序不当调整时，可以确定修正标记对应的图像区域中不存在修正内容区域，进而可以确定对图像区域中的待修正区域进行修正的过程可以为将第一待修正区域和第二待修正区域中的内容进行交换，也即语序不当调整类型对应的修正方式可以为，将前后颠倒的语句中的在前语句和在后语句进行位置交换。

仍参见图6所示，显然图6所示的第一图像中存在几处错误，则可以首先根据修正标记确定该错误的修正类型为语序不当调整，进一步可以确定修正标记对应的图像区域中不存在修正内容区域，在此基础上，可以根据修正类型对应的修正方式，将第一待修正区域中的内容“科学家”，及第二待修正区域中的内容“位”进行交换，同理，将第一待修正区域中的内容“它能随着天气的变化自动调节温度”，及第二待修正区域中的内容“我要发明一种万能空调”进行交换。

第三种：

若所述修正标记的修正类型为错别字改正，则可以确定所述修正标记对应的图像区域中存在修正内容区域。对应的，上述C2中基于所述修正内容区域对所述待修正区域进行修正的过程可以包括：将所述待修正区域中的内容删除，并替换为所述修正内容区域中的内容。

具体地，当修正标记的修正类型为错别字改正时，可以确定修正标记对应的图像区域中存在修正内容区域，进而可以基于修正内容区域对待修正区域进行修正，且该过程可以为将待修正区域中的内容删除，并替换为修正内容区域中的内容。这里，待修正区域的内容为错别字，修正内容区域的内容为与错别字对应的正确字，也即错别字改正类型对应的修正方式可以为，将错别字删除，并替换为对应的正确字。

需要说明的是，可以依次改正每个错别字，也可以一次改正多个连续错别字。

参见图8所示，图8示例了错别字改正类型的修正方式示意图。显然图8所示的第一图像中存在几处错误，则可以首先根据修正标记确定该错误的修正类型为错别字改正，进一步可以确定修正标记对应的图像区域中存在修正内容区域，在此基础上，可以根据修正类型对应的修正方式，基于修正内容区域中的内容“位”，将错别字“个”删除，并替换为“位”；同理，基于修正内容区域中的内容“自动”，将错别字“字段”删除，并替换为“自动”；基于修正内容区域中的内容“调”，将错别字“条”删除，并替换为“调”。

第四种：

若所述修正标记的修正类型为成分残缺补充，则可以确定所述修正标记对应的图像区域中存在修正内容区域。对应的，上述C2中基于所述修正内容区域对所述待修正区域进行修正的过程可以包括：将所述修正内容区域中的内容，插入所述待修正区域中。

具体地，则当修正标记的修正类型为成分残缺补充时，可以确定修正标记对应的图像区域中存在修正内容区域，进而可以基于修正内容区域对待修正区域进行修正，且该过程可以为将修正内容区域中的内容，插入待修正区域中。这里，待修正区域为待补充区域，修正内容区域的内容为缺少的补充内容，也即成分残缺补充类型对应的修正方式可以为，将缺少的补充内容插入待补充区域。

需要说明的是，当待补充区域位于某行的行尾时，可以将缺少的补充内容插入该行行尾，也可以将其插入该行的下一行的行首。

参见图9所示，图9示例了成分残缺补充类型的修正方式示意图。显然图9所示的第一图像中存在几处错误，则可以首先根据修正标记确定该错误的修正类型为成分残缺补充，进一步可以确定修正标记对应的图像区域中存在修正内容区域，在此基础上，可以根据修正类型对应的修正方式，将修正内容区域中的内容“位”，插入待补充区域“一”和“科”之间；同理，将修正内容区域中的内容“温暖”，插入待补充区域“得”和“，”之间；将修正内容区域中的内容“节”，插入待补充区域“调”和“温”之间。需要注意的是，由于修正内容区域中的内容“节”所要插入的待补充区域位于行尾，因此可以将其插入“调”之后，也可以将其插入“温”之前。

前述介绍的修正方法是对原始纸质文档中的内容进行修正，除此之外，本申请还可以对原始纸质文档中的格式进行修正。本实施例介绍了对原始纸质文档中的格式进行修正的一种可选实施方式，具体实施过程可以包括：

若所述修正标记的修正类型为格式调整，则可以确定所述修正标记对应的图像区域中存在修正内容区域。对应的，上述C2中基于所述修正内容区域对所述待修正区域进行修正的过程可以包括：

1)将所述修正内容区域中的内容识别为格式编辑指令；

2)按照所述格式编辑指令，对所述待修正区域中的内容进行格式编辑。

具体地，原始纸质文档中可能存在格式错误问题，需要调整格式。则当修正标记的修正类型为格式调整时，可以确定修正标记对应的图像区域中存在修正内容区域，进而可以基于修正内容区域对待修正区域进行修正，且该过程可以为将修正内容区域中的内容识别为格式编辑指令，并按照该格式编辑指令，对待修正区域中的内容进行格式编辑。这里，待修正区域的内容为原始纸质文档中需要进行格式调整的内容，修正内容区域的内容为格式编辑指令，也即格式调整类型的修正方式为，将需要进行格式调整的内容按照给定的格式编辑指令进行调整。

其中，格式调整类型的修正标记可以有多种不同的形式，这里介绍了其中一种可选的形式，即格式调整类型的修正标记可以包括：两个方框及两条平行的连接线。其中，一个方框用于框住原始纸质文档中需要进行格式调整的内容，另一个方框用于添加格式编辑指令，两条平行的连接线用于连接该两个方框。

格式调整类型的修正方式可以参见图10所示，若要将第一图像待修正区域中的内容“假如”两字加粗，则可以首先根据修正标记确定修正类型为格式调整类型，进一步可以确定修正标记对应的图像区域中存在修正内容区域，在此基础上，可以根据修正类型对应的修正方式，将修正内容区域中的内容“加粗”识别为格式编辑指令，并按照该格式编辑指令，对“假如”进行加粗处理。

进一步，本申请实施例在参考修正规则，对第一图像中修正标记对应的图像区域进行修正，得到修正后的第一图像后，还可以根据用户需要进行处理，如将该修正后的第一图像打印输出，或者，还可以保存为电子格式，上传、发送给其他终端。

下面对本申请实施例提供的文档修正装置进行描述，下文描述的文档修正装置与上文描述的文档修正方法可相互对应参照。

参见图11，图11为本申请实施例公开的一种文档修正装置结构示意图。如图11所示，该装置可以包括：

第一图像获取单元11，用于获取修正版纸质文档的第一图像，所述修正版纸质文档为对原始纸质文档按照预设的修正规则添加修正标记后得到；

图像区域识别单元12，用于识别所述第一图像中所述修正标记对应的图像区域；

图像区域修正单元13，用于参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像。

可选的，上述图像区域识别单元可以包括：

可选的，上述第一图像区域确定单元可以包括：

可选的，上述图像区域识别单元可以包括：

可选的，上述图像区域修正单元可以包括：

可选的，上述修正类型识别单元可以包括：

可选的，上述修正单元可以包括：

可选的，上述修正单元还可以包括：

可选的，上述第三修正子单元根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域的过程，具体可以包括：

若所述修正标记的修正类型为成分残缺补充，则确定所述修正标记对应的图像区域中存在修正内容区域。

可选的，上述第五修正子单元可以包括：

多余字修正单元，用于将所述待修正区域中的内容删除；

语序不当修正单元，用于将所述待修正区域包含的第一待修正区域和第二待修正区域中的内容进行交换。

可选的，上述第二修正子单元可以包括：

可选的，上述第三修正子单元根据所述修正标记的修正类型，确定所述修正标记对应的图像区域中是否存在修正内容区域的过程，还可以包括：

若所述修正标记的修正类型为格式调整，则确定所述修正标记对应的图像区域中存在修正内容区域。

可选的，上述第五修正子单元还可以包括：

可选的，本申请的文档修正装置还可以包括：

本申请实施例提供的文档修正装置可应用于文档修正设备，如PC终端、云平台、服务器及服务器集群等。可选的，图12示出了文档修正设备的硬件结构框图，参照图12，文档修正设备的硬件结构可以包括：至少一个处理器1，至少一个通信接口2，至少一个存储器3和至少一个通信总线4；

在本申请实施例中，处理器1、通信接口2、存储器3、通信总线4的数量为至少一个，且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信；

处理器1可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路等；

存储器3可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatilememory)等，例如至少一个磁盘存储器；

其中，存储器存储有程序，处理器可调用存储器存储的程序，所述程序用于：

识别所述第一图像中所述修正标记对应的图像区域；

可选的，所述程序的细化功能和扩展功能可参照上文描述。

本申请实施例还提供一种可读存储介质，该可读存储介质可存储有适于处理器执行的程序，所述程序用于：

识别所述第一图像中所述修正标记对应的图像区域；

可选的，所述程序的细化功能和扩展功能可参照上文描述。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种文档修正方法，其特征在于，包括：

识别所述第一图像中所述修正标记对应的图像区域；

2.根据权利要求1所述的方法，其特征在于，所述识别所述第一图像中所述修正标记对应的图像区域，包括：

获取所述原始纸质文档的第二图像；

3.根据权利要求2所述的方法，其特征在于，所述根据所述差值像素区域，在所述第一图像中确定所述修正标记对应的图像区域，包括：

4.根据权利要求1所述的方法，其特征在于，所述识别所述第一图像中所述修正标记对应的图像区域，包括：

5.根据权利要求1所述的方法，其特征在于，所述参考所述修正规则，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述修正标记对应的图像区域，识别所述修正标记的修正类型，包括：

提取所述修正标记对应的图像区域的图像特征；

7.根据权利要求5所述的方法，其特征在于，所述参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像，包括：

8.根据权利要求7所述的方法，其特征在于，所述参考所述修正规则中与所述修正类型对应的修正方式，对所述第一图像中所述修正标记对应的图像区域进行修正，得到修正后的第一图像，还包括：

9.根据权利要求8所述的方法，其特征在于，

将所述待修正区域中的内容删除；

将所述修正内容区域中的内容，插入所述待修正区域中。

10.根据权利要求9所述的方法，其特征在于，

将所述修正内容区域中的内容识别为格式编辑指令；

11.一种文档修正装置，其特征在于，包括：

12.一种文档修正设备，其特征在于，包括存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如权利要求1-10中任一项所述的文档修正方法的各个步骤。

13.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-10中任一项所述的文档修正方法的各个步骤。