CN111062317A - 一种扫描文档的裁边方法与系统 - Google Patents
一种扫描文档的裁边方法与系统 Download PDFInfo
- Publication number
- CN111062317A CN111062317A CN201911290750.6A CN201911290750A CN111062317A CN 111062317 A CN111062317 A CN 111062317A CN 201911290750 A CN201911290750 A CN 201911290750A CN 111062317 A CN111062317 A CN 111062317A
- Authority
- CN
- China
- Prior art keywords
- image
- edge
- value
- picture
- cutting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000009966 trimming Methods 0.000 claims description 22
- 238000003708 edge detection Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 8
- 230000002146 bilateral effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 239000010931 gold Substances 0.000 claims description 3
- 229910052737 gold Inorganic materials 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 2
- 238000009499 grossing Methods 0.000 claims description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
- 239000000463 material Substances 0.000 description 20
- 239000012776 electronic material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种扫描文档的裁边方法与系统,以解决扫描文档的裁边效率低的问题。方法包括:把扫描得文件转换为图片格式,对图片进行灰度化,并使用改进的Canny算子提取边缘,找到边缘的最小面积包围矩形,并且计算矩形的中心,以及旋转的角度。对原始图片以矩形的中心旋转相应的角度,得到无倾斜的图片。对无倾斜图片二值化,得到矩形的边缘点,找到最小包围矩形,以最小包围矩形裁剪图片,得到裁边之后的图片文档。同时计算矩形的面积,用于判断是否裁剪失败,如果矩形面积与标准纸张的面积差别大于2%,判定为裁剪失败,进行人工手动裁剪。本发明提高了扫描文件切边的效率,并且能够尽可能多地鉴别出切边失败的文件,提高扫描切边文件的准确性。
Description
技术领域
本发明涉及图像处理领域,具体涉及一种扫描文档的裁边技术。
背景技术
在当今社会,纸质资料的弊端逐渐显现。纸质材料的存储需要占用大量的空间,纸质材料在储存过程中容易受到环境因素的影响,造成不同程度的损坏。这些问题都给纸质材料的完整性带来巨大的威胁。并且在查阅的时候是非常费时费力的。
传统方法为了更完整的保存纸质材料需要投入巨大的财力、物力去建造专门的存放场所,并且要配备专业的人员对场所进行维护与管理。
与纸质材料的存储与管理相比,电子材料在存储空间上表现出相当大的优越性。电子材料一般存储在硬盘与云端。这样也就免去了建造专门的场所、雇佣专业的管理人员的麻烦。
为了将一些纸质资料转化为电子资料,一般先使用扫描仪对纸质材料进行扫描,然后对生成的电子文件进行保存。扫描仪在对被扫描文件自动生成电子文件的同时会在电子文件外围添加一周的外框(白边),大部分时间我们只得到扫描文件而不需要添加外框。这个时候人们就会手动去裁剪电子文件的尺寸大小。这样做不仅费时费力并且效率和准确率都很难让人满意。
发明内容
鉴于上面提及的问题,提出了一种扫描文档的裁边方法为了克服或者部分的解决上述问题。
根据本发明的一个方面,提出了一种扫描文档的裁边方法,包括:
针对扫描得到的电子文件,将其转换为图片格式的文件;
利用灰度变换把彩色图像变为灰度图像;
对灰度图进行轮廓检测,由于扫描得到的图像整体偏亮,对比度不高。因此图像中存在弱边缘,虽然人眼能够观察到弱边缘的存在,但对图像作边缘检测时,会导致将弱边缘划分成非边缘,得到的边缘图像可能有间断,甚至会漏检一些倾斜的边缘。因此,在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。
改进的Canny算法流程图如图1所示。
每一幅图像在拍摄的时候,都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息,增强边缘,使用双边滤波去噪。
g(i,j)代表输出点的灰度值,f(k,l)代表输入点的灰度值,S(i,j)是指以(i,j)为中心的(2N+1)*(2N+1)的大小的范围,N代表(i,j)的邻域半径。
加权系数ω(i,j,k,l)是空域核与值域核的乘积,
ωd为空间距离高斯函数:
ωr为像素值相似度高斯函数:
由上式可知,当图像在灰度变化平缓的区域时,邻域中的像素值相差不大。此时ωr无限接近于1。此时的双边滤波就是普通的高斯滤波,达到对图像平滑的效果。
当图像在变化程度剧烈的区域,比如在边缘区域时,邻域中的像素值相差很大。此时ωr趋近0,颜色差值越大,wr越逼近0,最终整个式子的值逼近于0。最终的结果是权值为0。因此在最终计算时,该处将不影响输出值。通过此种方式,既能平滑图像,又保持了图像的边缘。
由于扫描文件会存在一定的倾斜,因此边缘也会倾斜。因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进。改进的滤波器如图4所示。
G1(x,y)=max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)
G1(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为正27度的梯度值。
G2(x,y)=max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)
G2(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为153度的梯度值。
为了快速的计算总的梯度,取总梯度大小大小为:
G=|G1|+|G2|
分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值,取两种算法的最大值为该像素点的梯度值。设传统Canny算子的梯度值为Gold,改进算子的梯度值为Gnew,最后的的梯度值为Gmax。
Gmax=max(Gold,Gnew)
传统的滤波器只考虑2个方向,即水平、垂直方向。改进后的滤波器细化了边缘检测方向,可扩展到4个边缘方向,即水平、27度、垂直和153度方向。
对得到的梯度图使用OTSU方法进行阈值分割。选择一个初始阈值T,将图像分割成前景和背景。计算前景和背景的灰度值方差,通过迭代的方法得到最大的方差值,最大的方差值对应的阈值Tm可以使前景和背景分割的误差率最小。
将Tm设置为Canny算法的高阈值,令低阈值Td=0.9Tm。凡是大于高阈值的归为强边缘,小于低阈值的不是边缘,大于低阈值小于高阈值的归为弱边缘,如果弱边缘像素的邻接像素有大于高阈值,则把弱边缘归为强边缘。
经过Canny算子对输入图像进行运算后就得到了,输入图像的边缘图像。
寻找边缘图像的的最小面积外接矩形,把它作为感兴趣区域,即为带有旋转角度的矩形。
由于感兴趣区域存在一定角度的旋转,因此需要先寻找感兴趣区域的中心,以及感兴趣区域旋转的角度,通过构造旋转矩阵,进而把图像以感兴趣区域中心旋转一定的角度适合人们观察,假设此时适合人们观察的图像名为dst。
接下来就是对dst图像进行切边。
对dst图像,使用最大类间方差阈值分割法进行二值化分割,得到二值化图像。
找到二值化图像的边缘点,把边缘点组成一个序列,然后循环序列中的每一个边缘点找到二值化图像边缘的最小外接矩形,此时外接矩形是没有旋转角度的。
最后以外接矩形的大小去裁剪dst,输出的图像out即为切边后的图像。
根据本发明的另一方面,提供了一种文档裁边的系统,即客户端。
客户端包括:
文件批量读取模块,能够将一个文件夹内的多个扫描文件读取到客户端中。
错误切边标记模块,能够识别切边错误的文档,并且标记出来,可以使用人工手动修改。
文件保存模块,可以将处理后的图像保存到本地。
根据本发明可以批量的处理扫描文件,解决了人工裁剪大量扫描文件效率低的问题。并且,由于本发明可以自动识别出裁切错误的文件,因此能够尽可能多地提高裁切扫描文件的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下特举本发明的具体实施方式。
附图说明
图1示出了本发明改进的Canny边缘检测方法的流程图;
图2示出了本发明实施例的一种扫描文档的裁边方法的流程图;
图3示出了本发明实施例的一种扫描文档的裁边方法与系统的结构框图。
图4示出了根据本发明所设计的滤波器的图。
具体实施方式
下面将参照附图更详细地描述本发明的示例的具体实施方式。虽然附图中显示了本发明的示例实施,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这个实施例是为了能够更透彻地理解本公开。
本实例应用于计算机系统。包括但不限于:个人计算机系统、基于微型处理器的系统。
参照图2,示出了本发明实施例的一种扫描文档的裁边方法的流程图;
参照图3,示出了本发明实施例的一种扫描文档的裁边方法与系统的结构框图。
在当今社会,纸质资料的弊端逐渐显现。纸质材料的存储需要占用大量的空间,纸质材料在储存过程中容易受到环境因素的影响,造成不同程度的损坏。这些问题都给纸质材料的完整性带来巨大的威胁。并且在查阅的时候是非常费时费力的。
传统方法为了更完整的保存纸质材料需要投入巨大的财力、物力去建造专门的存放场所,并且要配备专业的人员对场所进行维护与管理。
与纸质材料的存储与管理相比,电子材料在存储空间上表现出相当大的优越性。电子材料一般存储在硬盘与云端。这样也就免去了建造专门的场所、雇佣专业的管理人员的麻烦。
为了将一些纸质资料转化为电子资料,一般先使用扫描仪对纸质材料进行扫描,然后对生成的电子文件进行保存。扫描仪在对被扫描文件自动生成电子文件的同时会在电子文件外围添加一周的外框(白边),大部分时间我们只得到扫描文件而不需要添加外框。这个时候人们就会手动去裁剪电子文件的尺寸大小。这样做不仅费时费力并且效率和准确率都很难让人满意。
具体的实施例的方法步骤如下:
步骤1:使用扫描仪扫描多份纸质文件,将其保存为PDF文件。
步骤2:安装本实例的客户端。
步骤3:客户端包括:文件批量读取模块,能够将一个文件夹内的多个扫描文件读取到客户端中。
步骤4:将PDF文件转换为图片格式。
步骤5:利用灰度变换把彩色图像变为灰度图像;
步骤6:对灰度图进行轮廓检测,由于扫描得到的图像整体偏亮,对比度不高。因此图像中存在弱边缘,虽然人眼能够观察到弱边缘的存在,但对图像作边缘检测时,会导致将弱边缘划分成非边缘,得到的边缘图像可能有间断,甚至会漏检一些倾斜的边缘。因此,在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。
改进的Canny算法流程图如图1所示。
步骤7:每一幅图像在拍摄的时候,都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息,增强边缘,使用双边滤波去噪。
加权系数ω(i,j,k,l)是空域核与值域核的乘积,
步骤8:由于扫描文件会存在一定的倾斜,因此边缘也会倾斜。因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进。
G1(x,y)=max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)
G2(x,y)=max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)
步骤9:为了快速的计算总的梯度,取总梯度大小大小为:
G=|G1|+|G2|
步骤10:分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值,取两种算法的最大值为该像素点的梯度值。设传统Canny算子的梯度值为Gold,改进算子的梯度值为Gnew,最后的的梯度值为Gmax。
传统的滤波器只考虑2个方向,即水平、垂直方向。改进后的滤波器细化了边缘检测方向,可扩展到4个边缘方向,即水平、27度、垂直和153度方向。
步骤11:对得到的梯度图使用OTSU方法进行阈值分割。选择一个初始阈值T,将图像分割成前景和背景。计算前景和背景的灰度值方差,通过迭代的方法得到最大的方差值,最大的方差值对应的阈值Tm可以使前景和背景分割的误差率最小。
步骤12:将Tm设置为Canny算法的高阈值,令低阈值Td=0.9Tm。凡是大于高阈值的归为强边缘,小于低阈值的不是边缘,大于低阈值小于高阈值的归为弱边缘,如果弱边缘像素的邻接像素有大于高阈值,则把弱边缘归为强边缘。
步骤14:经过Canny算子对输入图像进行运算后就得到了,输入图像的边缘图像。
步骤15:寻找边缘图像的的最小面积外接矩形,把它作为感兴趣区域,即为带有旋转角度的矩形。
步骤16:由于感兴趣区域存在一定角度的旋转,因此需要先寻找感兴趣区域的中心,以及感兴趣区域旋转的角度,通过构造旋转矩阵,进而把图像以感兴趣区域中心旋转一定的角度适合人们观察,假设此时适合人们观察的图像名为dst。
步骤17:接下来就是对dst图像进行切边。
对dst图像,使用最大类间方差阈值分割法进行二值化分割,得到二值化图像。
找到二值化图像的边缘点,把边缘点组成一个序列,然后循环序列中的每一个边缘点找到二值化图像边缘的最小外接矩形,此时外接矩形是没有旋转角度的。
步骤18:最后以外接矩形的大小去裁剪dst,输出的图像out即为切边后的图像。
步骤19:为了更准确的裁切边框,用户在进行裁剪前可以选择扫描文件的规格。包括常用的A4,A3,A2,A1,B5,如果所使用的纸张比较特殊可以选择默认。
步骤20:选择好纸张规格以后,点击进行裁边,就可以自动对导入的文件进行裁边。
如果此时选择的纸张规格是默认的将不会对裁剪的图片进行裁剪识别识别。
步骤21:裁剪失败识别的原理是根据裁剪后图片的面积与标准A4,A3,A2,A1,B5纸张的面积差来进行识别的。当两者面积差大于所选纸张规格面积的百分之二就会被判定为裁边失败。如果选择纸张规格为默认,此时没有标准纸张面积,因此不会进行裁剪失败识别非功能。
步骤22:错误切边标记模块,能够识别切边错误的文档,并且标记出来。
步骤23:裁剪失败的图片的名称都会显示在裁边失败的列表框里面。
步骤24:点击每一张裁剪失败的图片,就会在图片显示区域进行显示。
步骤25:点击手动裁剪,可以使用人工手动修改。
步骤26:对修改后的图片进行保存。文件保存模块,可以将处理后的图像保存到本地。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,均同理包括在本发明的专利保护范围内。
Claims (8)
1.根据本发明的一个方面,提出了一种扫描文档的裁边方法,包括:针对扫描得到的电子文件,将其转换为图片格式的文件;利用灰度变换把彩色图像变为灰度图像;对灰度图运用改进的Canny边缘检测算法进行轮廓检测;对得到的轮廓图像进行旋转,改善图像的观察角度;改善后的图像再次获取,边缘轮廓,并以轮廓图的大小裁剪图像。
2.据权利要求1所述的方法,由于扫描得到的图像整体偏亮,对比度不高,因此图像中存在弱边缘,虽然人眼能够观察到弱边缘的存在,但对图像作边缘检测时,会导致将弱边缘划分成非边缘,得到的边缘图像可能有间断,甚至会漏检一些倾斜的边缘,因此,在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。
3.据权利要求2所述的方法,改进的Canny算法原理如下,每一幅图像在拍摄的时候,都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息,增强边缘,使用双边滤波去噪:
g(i,j)代表输出点的灰度值,f(k,l)代表输入点的灰度值,S(i,j)是指以(i,j)为中心的(2N+1)*(2N+1)的大小的范围,N代表(i,j)的邻域半径,加权系数ω(i,k,j,l)是空域核与值域核的乘积,ωd为空间距离高斯函数:
ωr为像素值相似度高斯函数:
其中(i,j)为输出点位置,(k,l)为输入点的位置,δd为空间域标准差,δr为值域标准差,
由上式可知,当图像在灰度变化平缓的区域时,邻域中的像素值相差不大,此时ωr无限接近于1,此时的双边滤波就是普通的高斯滤波,达到对图像平滑的效果,当图像在变化程度剧烈的区域,比如在边缘区域时,邻域中的像素值相差很大,此时ωr趋近0,颜色差值越大,wr越逼近0,最终整个式子的值逼近于0,最终的结果是权值为0,因此在最终计算时,该处将不影响输出值,通过此种方式,既能平滑图像,又保持了图像的边缘。
4.据权利要求2所述的方法,由于扫描文件会存在一定的倾斜,因此边缘也会倾斜,因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进:
G1(x,y)=max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)
G1(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为正27度左右的梯度值:
G2(x,y)=max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)
G2(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为153度左右的梯度值,为了快速的计算总的梯度,取总梯度大小大小为:
G=|G1|+|G2|。
5.据权利要求4所述的方法,分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值,取两种算法的最大值为该像素点的梯度值,设传统Canny算子的梯度值为Gold,改进算子的梯度值为Gnew,最后的的梯度值为Gmax,
Gmax=max(Gold,Gnew)
传统的滤波器只考虑2个方向,即水平、垂直方向,改进后的滤波器细化了边缘检测方向,可扩展到4个边缘方向,即水平、27度左右、垂直和153度左右方向。
6.据权利要求5所述的方法,对得到的梯度图使用OTSU方法进行阈值分割,选择一个初始阈值T,将图像分割成前景和背景,计算前景和背景的灰度值方差,通过迭代的方法得到最大的方差值,最大的方差值对应的阈值Tm可以使前景和背景分割的误差率最小,将Tm设置为Canny算法的高阈值,令低阈值Td=0.9Tm,凡是大于高阈值的归为强边缘,小于低阈值的不是边缘,大于低阈值小于高阈值的归为弱边缘,如果弱边缘像素的邻接像素有大于高阈值,则把弱边缘归为强边缘,经过Canny算子对输入图像进行运算后就得到了,输入图像的边缘图像。
7.据权利要求6所述的方法,寻找边缘图像的的最小面积外接矩形,把它作为感兴趣区域,即为带有旋转角度的矩形,由于感兴趣区域存在一定角度的旋转,因此需要先寻找感兴趣区域的中心,以及感兴趣区域旋转的角度,通过构造旋转矩阵,运用仿射变换进而把图像以感兴趣区域中心旋转一定的角度适合人们观察,假设此时适合人们观察的图像名为dst,接下来就是对dst图像进行切边,对dst图像,使用最大类间方差阈值分割法进行二值化分割,得到二值化图像,找到二值化图像的边缘点,把边缘点组成一个序列,然后循环序列中的每一个边缘点找到二值化图像边缘的最小外接矩形,此时外接矩形是没有旋转角度的,最后以外接矩形的大小去裁剪dst,输出的图像out即为切边后的图像。
8.根据本发明的另一方面,提供了一种文档裁边的系统,即客户端,客户端包括:
文件批量读取模块,能够将一个文件夹内的多个扫描文件读取到客户端中,将文件转换为图片格式,为了更准确的裁切边框,用户在进行裁剪前可以选择扫描文件的规格,包括常用的A4,A3,A2,A1,B5,如果所使用的纸张比较特殊可以选择默认:选择好纸张规格以后,点击进行裁边,就可以自动对导入的文件进行裁边,如果此时选择的纸张规格是默认的将不会对裁剪的图片进行裁剪识别识别,裁剪失败识别的原理是根据裁剪后图片的面积与标准A4,A3,A2,A1,B5纸张的面积差来进行识别的,当两者面积差大于所选纸张规格面积的百分之二就会被判定为裁边失败,如果选择纸张规格为默认,此时没有标准纸张面积,因此不会执行裁剪失败识别功能,裁剪失败标记模块,能够识别切边错误的文档,并且标记出来,裁剪失败的图片的名称都会显示在裁边失败的列表框里面,点击每一张裁剪失败的图片,就会在图片显示区域进行显示,点击手动裁剪,可以使用人工手动修改,对修改后的图片进行保存:文件保存模块,可以将处理后的图像保存到本地。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911290750.6A CN111062317A (zh) | 2019-12-16 | 2019-12-16 | 一种扫描文档的裁边方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911290750.6A CN111062317A (zh) | 2019-12-16 | 2019-12-16 | 一种扫描文档的裁边方法与系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111062317A true CN111062317A (zh) | 2020-04-24 |
Family
ID=70301795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911290750.6A Pending CN111062317A (zh) | 2019-12-16 | 2019-12-16 | 一种扫描文档的裁边方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062317A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754487A (zh) * | 2020-06-24 | 2020-10-09 | 北京奇艺世纪科技有限公司 | 一种黑框区域裁剪方法、装置及电子设备 |
CN112945198A (zh) * | 2021-02-02 | 2021-06-11 | 贵州电网有限责任公司 | 一种基于激光lidar点云的输电线路铁塔倾斜自动检测方法 |
CN113568588A (zh) * | 2021-07-30 | 2021-10-29 | 珠海奔图电子有限公司 | 打印方法及图像形成装置、打印驱动装置、打印系统 |
WO2022236875A1 (zh) * | 2021-05-14 | 2022-11-17 | 广州广电运通金融电子股份有限公司 | 一种文件扫描方法、设备、介质及产品 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001076094A (ja) * | 1999-09-08 | 2001-03-23 | Nippon Telegr & Teleph Corp <Ntt> | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 |
CN102043950A (zh) * | 2010-12-30 | 2011-05-04 | 南京信息工程大学 | 基于canny算子和边缘点统计的车辆轮廓识别方法 |
CN103268591A (zh) * | 2013-04-20 | 2013-08-28 | 江苏新瑞峰信息科技有限公司 | 一种高速扫描自动纠偏系统 |
CN104200442A (zh) * | 2014-09-19 | 2014-12-10 | 西安电子科技大学 | 基于改进的canny边缘检测的非局部均值MRI图像去噪方法 |
CN104700421A (zh) * | 2015-03-27 | 2015-06-10 | 中国科学院光电技术研究所 | 一种基于canny的自适应阈值的边缘检测算法 |
CN104990926A (zh) * | 2015-06-25 | 2015-10-21 | 哈尔滨工业大学 | 一种基于视觉的tr元件定位和缺陷检测方法 |
CN105930844A (zh) * | 2016-04-20 | 2016-09-07 | 西北工业大学 | 提高纸质医疗化验单手机扫描识别率的方法 |
CN107220988A (zh) * | 2017-04-30 | 2017-09-29 | 南京理工大学 | 基于改进canny算子的零部件图像边缘提取方法 |
CN107945194A (zh) * | 2017-10-31 | 2018-04-20 | 四川长虹电器股份有限公司 | 基于OpenCV技术的票据分割方法 |
CN108022233A (zh) * | 2016-10-28 | 2018-05-11 | 沈阳高精数控智能技术股份有限公司 | 一种基于改进型Canny算子的工件边缘提取方法 |
CN109325498A (zh) * | 2018-07-26 | 2019-02-12 | 河北师范大学 | 基于窗口动态阈值改进Canny算子的叶脉提取算法 |
CN109671092A (zh) * | 2018-11-10 | 2019-04-23 | 江苏网进科技股份有限公司 | 一种改进的Canny图像分割方法和系统 |
US20190137388A1 (en) * | 2017-11-09 | 2019-05-09 | Rebellion Photonics, Inc. | Window obscuration sensors for mobile gas and chemical imaging cameras |
-
2019
- 2019-12-16 CN CN201911290750.6A patent/CN111062317A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001076094A (ja) * | 1999-09-08 | 2001-03-23 | Nippon Telegr & Teleph Corp <Ntt> | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 |
CN102043950A (zh) * | 2010-12-30 | 2011-05-04 | 南京信息工程大学 | 基于canny算子和边缘点统计的车辆轮廓识别方法 |
CN103268591A (zh) * | 2013-04-20 | 2013-08-28 | 江苏新瑞峰信息科技有限公司 | 一种高速扫描自动纠偏系统 |
CN104200442A (zh) * | 2014-09-19 | 2014-12-10 | 西安电子科技大学 | 基于改进的canny边缘检测的非局部均值MRI图像去噪方法 |
CN104700421A (zh) * | 2015-03-27 | 2015-06-10 | 中国科学院光电技术研究所 | 一种基于canny的自适应阈值的边缘检测算法 |
CN104990926A (zh) * | 2015-06-25 | 2015-10-21 | 哈尔滨工业大学 | 一种基于视觉的tr元件定位和缺陷检测方法 |
CN105930844A (zh) * | 2016-04-20 | 2016-09-07 | 西北工业大学 | 提高纸质医疗化验单手机扫描识别率的方法 |
CN108022233A (zh) * | 2016-10-28 | 2018-05-11 | 沈阳高精数控智能技术股份有限公司 | 一种基于改进型Canny算子的工件边缘提取方法 |
CN107220988A (zh) * | 2017-04-30 | 2017-09-29 | 南京理工大学 | 基于改进canny算子的零部件图像边缘提取方法 |
CN107945194A (zh) * | 2017-10-31 | 2018-04-20 | 四川长虹电器股份有限公司 | 基于OpenCV技术的票据分割方法 |
US20190137388A1 (en) * | 2017-11-09 | 2019-05-09 | Rebellion Photonics, Inc. | Window obscuration sensors for mobile gas and chemical imaging cameras |
CN109325498A (zh) * | 2018-07-26 | 2019-02-12 | 河北师范大学 | 基于窗口动态阈值改进Canny算子的叶脉提取算法 |
CN109671092A (zh) * | 2018-11-10 | 2019-04-23 | 江苏网进科技股份有限公司 | 一种改进的Canny图像分割方法和系统 |
Non-Patent Citations (1)
Title |
---|
李子印等: "结合 Hough变换与 Kalman滤波的 车道线检测方法" * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754487A (zh) * | 2020-06-24 | 2020-10-09 | 北京奇艺世纪科技有限公司 | 一种黑框区域裁剪方法、装置及电子设备 |
CN112945198A (zh) * | 2021-02-02 | 2021-06-11 | 贵州电网有限责任公司 | 一种基于激光lidar点云的输电线路铁塔倾斜自动检测方法 |
CN112945198B (zh) * | 2021-02-02 | 2023-01-31 | 贵州电网有限责任公司 | 一种基于激光lidar点云的输电线路铁塔倾斜自动检测方法 |
WO2022236875A1 (zh) * | 2021-05-14 | 2022-11-17 | 广州广电运通金融电子股份有限公司 | 一种文件扫描方法、设备、介质及产品 |
CN113568588A (zh) * | 2021-07-30 | 2021-10-29 | 珠海奔图电子有限公司 | 打印方法及图像形成装置、打印驱动装置、打印系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086714B (zh) | 表格识别方法、识别系统及计算机装置 | |
US11967164B2 (en) | Object detection and image cropping using a multi-detector approach | |
JP5844783B2 (ja) | テキスト領域を含むグレースケール文書画像を処理する方法、グレースケール文書画像の少なくともテキスト領域を二値化する方法、グレースケール文書画像においてグリッドを形成するテーブルの抽出方法及びプログラム | |
CN111062317A (zh) | 一种扫描文档的裁边方法与系统 | |
JP4847592B2 (ja) | 歪み文書画像を補正する方法及びシステム | |
EP2974261A2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
US8457403B2 (en) | Method of detecting and correcting digital images of books in the book spine area | |
WO2014160426A1 (en) | Classifying objects in digital images captured using mobile devices | |
US8811751B1 (en) | Method and system for correcting projective distortions with elimination steps on multiple levels | |
CN114529459B (zh) | 一种对图像边缘进行增强处理的方法和系统及介质 | |
CN104182722B (zh) | 文本检测方法和装置以及文本信息提取方法和系统 | |
JP6102417B2 (ja) | 画像処理装置、画像処理方法及び画像処理デバイス | |
EP2536123B1 (en) | Image processing method and image processing apparatus | |
US20120250105A1 (en) | Method Of Analyzing Digital Document Images | |
Liu et al. | Texture filtering based physically plausible image dehazing | |
WO2015092059A1 (en) | Method and system for correcting projective distortions. | |
CN112818983B (zh) | 一种利用图片相识度判断字符倒置的方法 | |
CN111340040B (zh) | 一种纸张字符识别方法、装置、电子设备及存储介质 | |
CN117218672A (zh) | 一种基于深度学习的病案文字识别方法及系统 | |
Roullet et al. | An automated technique to recognize and extract images from scanned archaeological documents | |
US9225876B2 (en) | Method and apparatus for using an enlargement operation to reduce visually detected defects in an image | |
US8098945B2 (en) | Method and system for binarizing an image | |
Soumya et al. | Enhancement and segmentation of historical records | |
JP2006107018A (ja) | 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム | |
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200424 |