CN111062317A

CN111062317A - 一种扫描文档的裁边方法与系统

Info

Publication number: CN111062317A
Application number: CN201911290750.6A
Authority: CN
Inventors: 李子印; 王启真; 孔繁圣; 邹细勇; 杨凯; 陈亮
Original assignee: China Jiliang University; China Jiliang University Shangyu Advanced Research Institute Co Ltd
Current assignee: China Jiliang University; China Jiliang University Shangyu Advanced Research Institute Co Ltd
Priority date: 2019-12-16
Filing date: 2019-12-16
Publication date: 2020-04-24

Abstract

本发明公开了一种扫描文档的裁边方法与系统，以解决扫描文档的裁边效率低的问题。方法包括：把扫描得文件转换为图片格式，对图片进行灰度化，并使用改进的Canny算子提取边缘，找到边缘的最小面积包围矩形，并且计算矩形的中心，以及旋转的角度。对原始图片以矩形的中心旋转相应的角度，得到无倾斜的图片。对无倾斜图片二值化，得到矩形的边缘点，找到最小包围矩形，以最小包围矩形裁剪图片，得到裁边之后的图片文档。同时计算矩形的面积，用于判断是否裁剪失败，如果矩形面积与标准纸张的面积差别大于2％，判定为裁剪失败，进行人工手动裁剪。本发明提高了扫描文件切边的效率，并且能够尽可能多地鉴别出切边失败的文件，提高扫描切边文件的准确性。

Description

一种扫描文档的裁边方法与系统

技术领域

本发明涉及图像处理领域，具体涉及一种扫描文档的裁边技术。

背景技术

在当今社会，纸质资料的弊端逐渐显现。纸质材料的存储需要占用大量的空间，纸质材料在储存过程中容易受到环境因素的影响,造成不同程度的损坏。这些问题都给纸质材料的完整性带来巨大的威胁。并且在查阅的时候是非常费时费力的。

传统方法为了更完整的保存纸质材料需要投入巨大的财力、物力去建造专门的存放场所，并且要配备专业的人员对场所进行维护与管理。

与纸质材料的存储与管理相比，电子材料在存储空间上表现出相当大的优越性。电子材料一般存储在硬盘与云端。这样也就免去了建造专门的场所、雇佣专业的管理人员的麻烦。

为了将一些纸质资料转化为电子资料，一般先使用扫描仪对纸质材料进行扫描，然后对生成的电子文件进行保存。扫描仪在对被扫描文件自动生成电子文件的同时会在电子文件外围添加一周的外框(白边)，大部分时间我们只得到扫描文件而不需要添加外框。这个时候人们就会手动去裁剪电子文件的尺寸大小。这样做不仅费时费力并且效率和准确率都很难让人满意。

发明内容

鉴于上面提及的问题，提出了一种扫描文档的裁边方法为了克服或者部分的解决上述问题。

根据本发明的一个方面，提出了一种扫描文档的裁边方法，包括：

针对扫描得到的电子文件，将其转换为图片格式的文件；

利用灰度变换把彩色图像变为灰度图像；

对灰度图进行轮廓检测，由于扫描得到的图像整体偏亮，对比度不高。因此图像中存在弱边缘，虽然人眼能够观察到弱边缘的存在，但对图像作边缘检测时，会导致将弱边缘划分成非边缘，得到的边缘图像可能有间断，甚至会漏检一些倾斜的边缘。因此，在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。

改进的Canny算法流程图如图1所示。

每一幅图像在拍摄的时候，都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息，增强边缘，使用双边滤波去噪。

g(i,j)代表输出点的灰度值，f(k,l)代表输入点的灰度值,S(i,j)是指以(i，j)为中心的(2N+1)*(2N+1)的大小的范围，N代表(i,j)的邻域半径。

加权系数ω(i,j,k,l)是空域核与值域核的乘积，

ω_d为空间距离高斯函数：

ω_r为像素值相似度高斯函数：

其中(i,j)为输出点位置，(k,l)为输入点的位置,

为空间域标准差，

为值域标准差。

由上式可知，当图像在灰度变化平缓的区域时，邻域中的像素值相差不大。此时ω_r无限接近于1。此时的双边滤波就是普通的高斯滤波，达到对图像平滑的效果。

当图像在变化程度剧烈的区域，比如在边缘区域时，邻域中的像素值相差很大。此时ω_r趋近0，颜色差值越大，wr越逼近0，最终整个式子的值逼近于0。最终的结果是权值为0。因此在最终计算时，该处将不影响输出值。通过此种方式，既能平滑图像，又保持了图像的边缘。

由于扫描文件会存在一定的倾斜，因此边缘也会倾斜。因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进。改进的滤波器如图4所示。

G₁(x,y)＝max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)

G₁(x,y)是通过计算滤波器对应位置的像素灰度值的加权和，然后取较大的值为正27度的梯度值。

G₂(x,y)＝max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)

G₂(x,y)是通过计算滤波器对应位置的像素灰度值的加权和，然后取较大的值为153度的梯度值。

为了快速的计算总的梯度，取总梯度大小大小为：

G＝|G₁|+|G₂|

分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值，取两种算法的最大值为该像素点的梯度值。设传统Canny算子的梯度值为G_old，改进算子的梯度值为G_new，最后的的梯度值为G_max。

G_max＝max(G_old,G_new)

传统的滤波器只考虑2个方向，即水平、垂直方向。改进后的滤波器细化了边缘检测方向，可扩展到4个边缘方向，即水平、27度、垂直和153度方向。

对得到的梯度图使用OTSU方法进行阈值分割。选择一个初始阈值T，将图像分割成前景和背景。计算前景和背景的灰度值方差，通过迭代的方法得到最大的方差值，最大的方差值对应的阈值T_m可以使前景和背景分割的误差率最小。

将T_m设置为Canny算法的高阈值,令低阈值T_d＝0.9T_m。凡是大于高阈值的归为强边缘，小于低阈值的不是边缘，大于低阈值小于高阈值的归为弱边缘，如果弱边缘像素的邻接像素有大于高阈值，则把弱边缘归为强边缘。

经过Canny算子对输入图像进行运算后就得到了，输入图像的边缘图像。

寻找边缘图像的的最小面积外接矩形，把它作为感兴趣区域，即为带有旋转角度的矩形。

由于感兴趣区域存在一定角度的旋转，因此需要先寻找感兴趣区域的中心，以及感兴趣区域旋转的角度，通过构造旋转矩阵，进而把图像以感兴趣区域中心旋转一定的角度适合人们观察，假设此时适合人们观察的图像名为dst。

接下来就是对dst图像进行切边。

对dst图像，使用最大类间方差阈值分割法进行二值化分割，得到二值化图像。

找到二值化图像的边缘点，把边缘点组成一个序列，然后循环序列中的每一个边缘点找到二值化图像边缘的最小外接矩形，此时外接矩形是没有旋转角度的。

最后以外接矩形的大小去裁剪dst，输出的图像out即为切边后的图像。

根据本发明的另一方面，提供了一种文档裁边的系统，即客户端。

客户端包括：

文件批量读取模块，能够将一个文件夹内的多个扫描文件读取到客户端中。

错误切边标记模块，能够识别切边错误的文档，并且标记出来，可以使用人工手动修改。

文件保存模块，可以将处理后的图像保存到本地。

根据本发明可以批量的处理扫描文件,解决了人工裁剪大量扫描文件效率低的问题。并且,由于本发明可以自动识别出裁切错误的文件,因此能够尽可能多地提高裁切扫描文件的准确性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下特举本发明的具体实施方式。

附图说明

图1示出了本发明改进的Canny边缘检测方法的流程图；

图2示出了本发明实施例的一种扫描文档的裁边方法的流程图；

图3示出了本发明实施例的一种扫描文档的裁边方法与系统的结构框图。

图4示出了根据本发明所设计的滤波器的图。

具体实施方式

下面将参照附图更详细地描述本发明的示例的具体实施方式。虽然附图中显示了本发明的示例实施，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这个实施例是为了能够更透彻地理解本公开。

本实例应用于计算机系统。包括但不限于:个人计算机系统、基于微型处理器的系统。

参照图2，示出了本发明实施例的一种扫描文档的裁边方法的流程图；

参照图3，示出了本发明实施例的一种扫描文档的裁边方法与系统的结构框图。

具体的实施例的方法步骤如下：

步骤1：使用扫描仪扫描多份纸质文件，将其保存为PDF文件。

步骤2：安装本实例的客户端。

步骤3：客户端包括：文件批量读取模块，能够将一个文件夹内的多个扫描文件读取到客户端中。

步骤4：将PDF文件转换为图片格式。

步骤5:利用灰度变换把彩色图像变为灰度图像；

步骤6:对灰度图进行轮廓检测，由于扫描得到的图像整体偏亮，对比度不高。因此图像中存在弱边缘，虽然人眼能够观察到弱边缘的存在，但对图像作边缘检测时，会导致将弱边缘划分成非边缘，得到的边缘图像可能有间断，甚至会漏检一些倾斜的边缘。因此，在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。

改进的Canny算法流程图如图1所示。

步骤7：每一幅图像在拍摄的时候，都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息，增强边缘，使用双边滤波去噪。

加权系数ω(i,j,k,l)是空域核与值域核的乘积，

步骤8：由于扫描文件会存在一定的倾斜，因此边缘也会倾斜。因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进。

步骤9：为了快速的计算总的梯度，取总梯度大小大小为：

G＝|G₁|+|G₂|

步骤10：分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值，取两种算法的最大值为该像素点的梯度值。设传统Canny算子的梯度值为G_old，改进算子的梯度值为G_new，最后的的梯度值为G_max。

步骤11：对得到的梯度图使用OTSU方法进行阈值分割。选择一个初始阈值T，将图像分割成前景和背景。计算前景和背景的灰度值方差，通过迭代的方法得到最大的方差值，最大的方差值对应的阈值T_m可以使前景和背景分割的误差率最小。

步骤12：将T_m设置为Canny算法的高阈值,令低阈值T_d＝0.9T_m。凡是大于高阈值的归为强边缘，小于低阈值的不是边缘，大于低阈值小于高阈值的归为弱边缘，如果弱边缘像素的邻接像素有大于高阈值，则把弱边缘归为强边缘。

步骤14：经过Canny算子对输入图像进行运算后就得到了，输入图像的边缘图像。

步骤15：寻找边缘图像的的最小面积外接矩形，把它作为感兴趣区域，即为带有旋转角度的矩形。

步骤16：由于感兴趣区域存在一定角度的旋转，因此需要先寻找感兴趣区域的中心，以及感兴趣区域旋转的角度，通过构造旋转矩阵，进而把图像以感兴趣区域中心旋转一定的角度适合人们观察，假设此时适合人们观察的图像名为dst。

步骤17：接下来就是对dst图像进行切边。

步骤18：最后以外接矩形的大小去裁剪dst，输出的图像out即为切边后的图像。

步骤19：为了更准确的裁切边框，用户在进行裁剪前可以选择扫描文件的规格。包括常用的A4，A3，A2，A1，B5，如果所使用的纸张比较特殊可以选择默认。

步骤20：选择好纸张规格以后，点击进行裁边，就可以自动对导入的文件进行裁边。

如果此时选择的纸张规格是默认的将不会对裁剪的图片进行裁剪识别识别。

步骤21：裁剪失败识别的原理是根据裁剪后图片的面积与标准A4，A3，A2，A1，B5纸张的面积差来进行识别的。当两者面积差大于所选纸张规格面积的百分之二就会被判定为裁边失败。如果选择纸张规格为默认，此时没有标准纸张面积，因此不会进行裁剪失败识别非功能。

步骤22：错误切边标记模块，能够识别切边错误的文档，并且标记出来。

步骤23：裁剪失败的图片的名称都会显示在裁边失败的列表框里面。

步骤24：点击每一张裁剪失败的图片，就会在图片显示区域进行显示。

步骤25：点击手动裁剪，可以使用人工手动修改。

步骤26：对修改后的图片进行保存。文件保存模块，可以将处理后的图像保存到本地。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，均同理包括在本发明的专利保护范围内。

Claims

1.根据本发明的一个方面，提出了一种扫描文档的裁边方法，包括：针对扫描得到的电子文件，将其转换为图片格式的文件；利用灰度变换把彩色图像变为灰度图像；对灰度图运用改进的Canny边缘检测算法进行轮廓检测；对得到的轮廓图像进行旋转，改善图像的观察角度；改善后的图像再次获取，边缘轮廓，并以轮廓图的大小裁剪图像。

2.据权利要求1所述的方法，由于扫描得到的图像整体偏亮，对比度不高，因此图像中存在弱边缘，虽然人眼能够观察到弱边缘的存在，但对图像作边缘检测时，会导致将弱边缘划分成非边缘，得到的边缘图像可能有间断，甚至会漏检一些倾斜的边缘，因此，在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。

3.据权利要求2所述的方法，改进的Canny算法原理如下，每一幅图像在拍摄的时候，都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息，增强边缘，使用双边滤波去噪：

g(i,j)代表输出点的灰度值，f(k,l)代表输入点的灰度值,S(i,j)是指以(i，j)为中心的(2N+1)*(2N+1)的大小的范围，N代表(i,j)的邻域半径，加权系数ω(i,k,j,l)是空域核与值域核的乘积，ω_d为空间距离高斯函数：

ω_r为像素值相似度高斯函数：

其中(i,j)为输出点位置，(k,l)为输入点的位置,δ_d为空间域标准差，δ_r为值域标准差，

由上式可知，当图像在灰度变化平缓的区域时，邻域中的像素值相差不大，此时ω_r无限接近于1，此时的双边滤波就是普通的高斯滤波，达到对图像平滑的效果，当图像在变化程度剧烈的区域，比如在边缘区域时，邻域中的像素值相差很大，此时ω_r趋近0，颜色差值越大，wr越逼近0，最终整个式子的值逼近于0，最终的结果是权值为0，因此在最终计算时，该处将不影响输出值，通过此种方式，既能平滑图像，又保持了图像的边缘。

4.据权利要求2所述的方法，由于扫描文件会存在一定的倾斜，因此边缘也会倾斜，因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进：

G₁(x,y)是通过计算滤波器对应位置的像素灰度值的加权和，然后取较大的值为正27度左右的梯度值：

G₂(x,y)是通过计算滤波器对应位置的像素灰度值的加权和，然后取较大的值为153度左右的梯度值，为了快速的计算总的梯度，取总梯度大小大小为：

G＝|G₁|+|G₂|。

5.据权利要求4所述的方法，分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值，取两种算法的最大值为该像素点的梯度值，设传统Canny算子的梯度值为G_old，改进算子的梯度值为G_new，最后的的梯度值为G_max，

G_max＝max(G_old,G_new)

传统的滤波器只考虑2个方向，即水平、垂直方向，改进后的滤波器细化了边缘检测方向，可扩展到4个边缘方向，即水平、27度左右、垂直和153度左右方向。

6.据权利要求5所述的方法，对得到的梯度图使用OTSU方法进行阈值分割，选择一个初始阈值T，将图像分割成前景和背景，计算前景和背景的灰度值方差，通过迭代的方法得到最大的方差值，最大的方差值对应的阈值T_m可以使前景和背景分割的误差率最小，将T_m设置为Canny算法的高阈值,令低阈值T_d＝0.9T_m，凡是大于高阈值的归为强边缘，小于低阈值的不是边缘，大于低阈值小于高阈值的归为弱边缘，如果弱边缘像素的邻接像素有大于高阈值，则把弱边缘归为强边缘，经过Canny算子对输入图像进行运算后就得到了，输入图像的边缘图像。

7.据权利要求6所述的方法，寻找边缘图像的的最小面积外接矩形，把它作为感兴趣区域，即为带有旋转角度的矩形，由于感兴趣区域存在一定角度的旋转，因此需要先寻找感兴趣区域的中心，以及感兴趣区域旋转的角度，通过构造旋转矩阵，运用仿射变换进而把图像以感兴趣区域中心旋转一定的角度适合人们观察，假设此时适合人们观察的图像名为dst，接下来就是对dst图像进行切边，对dst图像，使用最大类间方差阈值分割法进行二值化分割，得到二值化图像，找到二值化图像的边缘点，把边缘点组成一个序列，然后循环序列中的每一个边缘点找到二值化图像边缘的最小外接矩形，此时外接矩形是没有旋转角度的，最后以外接矩形的大小去裁剪dst，输出的图像out即为切边后的图像。

8.根据本发明的另一方面，提供了一种文档裁边的系统，即客户端，客户端包括：

文件批量读取模块，能够将一个文件夹内的多个扫描文件读取到客户端中，将文件转换为图片格式，为了更准确的裁切边框，用户在进行裁剪前可以选择扫描文件的规格，包括常用的A4，A3，A2，A1，B5，如果所使用的纸张比较特殊可以选择默认：选择好纸张规格以后，点击进行裁边，就可以自动对导入的文件进行裁边，如果此时选择的纸张规格是默认的将不会对裁剪的图片进行裁剪识别识别，裁剪失败识别的原理是根据裁剪后图片的面积与标准A4，A3，A2，A1，B5纸张的面积差来进行识别的，当两者面积差大于所选纸张规格面积的百分之二就会被判定为裁边失败，如果选择纸张规格为默认，此时没有标准纸张面积，因此不会执行裁剪失败识别功能，裁剪失败标记模块，能够识别切边错误的文档，并且标记出来，裁剪失败的图片的名称都会显示在裁边失败的列表框里面，点击每一张裁剪失败的图片，就会在图片显示区域进行显示，点击手动裁剪，可以使用人工手动修改，对修改后的图片进行保存：文件保存模块，可以将处理后的图像保存到本地。