CN103268591A - 一种高速扫描自动纠偏系统 - Google Patents
一种高速扫描自动纠偏系统 Download PDFInfo
- Publication number
- CN103268591A CN103268591A CN201310137692XA CN201310137692A CN103268591A CN 103268591 A CN103268591 A CN 103268591A CN 201310137692X A CN201310137692X A CN 201310137692XA CN 201310137692 A CN201310137692 A CN 201310137692A CN 103268591 A CN103268591 A CN 103268591A
- Authority
- CN
- China
- Prior art keywords
- computing machine
- image
- document
- computer
- scanning system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
技术领域
本发明涉及电子信息领域,尤其涉及计算机系统领域。
背景技术
在当今的电子信息时代中,需要对大量的纸质文档进行数字化处理,扫描处理系统一般包括扫描仪和计算机,通过计算机控制扫描仪进行扫描,并将扫描后的影像文件传输至计算机进行存储,可以高效地把纸质文档数字化。但是,在进行扫描的数字化过程中经常会遇到的问题是:因为文档摆放不正,而需要对文档进行纠偏,解决该问题的关键在于找到相应的纠偏角。目前关于找文本纠偏角的算法很多,但大多数都是基于hough变换。就纠偏的效果来说,这些算法是令人满意的,但是因为采用了hough变换,而使得在速度上难有提高的余地。特别是当文本带有底纹,或者表格与文字相粘连时,基于hough变换的算法的纠偏效果就差强人意了。虽然有一些适应性强的算法可以给出不错的纠偏效果,但都是以牺牲速度为代价的,如果应用到高速扫描系统中,势必大大降低扫描的效率。
发明内容
本发明提供一种高速扫描自动纠偏系统,包括高速扫描仪和与之相连的计算机,每次对文档进行扫描和纠偏的步骤如下:
(1)高速扫描仪接受计算机的控制信号,对纸质文档进行扫描后将形成的原始灰度影像传输至计算机内存;
(2)计算机对原始灰度影像去噪并得到它的二值影像;
(3)计算机在上述二值影像的下边缘上取两个点,分别位于影像中轴线的左右两边;
(4)计算机从这两个点开始竖直向上探测,直到遇上不是背景象素的点,就停下并记下该位置的坐标。这样就得到在倾斜文档的下边线上两个点的坐标P1(x1,y1)和P2( x2,y2);
(7)计算机将纠偏后的文档影像进行存储,实现数字化,并向高速扫描仪发出控制信号,继续对下一张纸质文档进行扫描。
附图说明
图1是本发明一种高速扫描自动纠偏系统中纠偏角计算的示意图。
具体实施方式
下面以Kodak高速扫描仪和与之相连的计算机为例,说明高速扫描自动纠偏系统,每次对文档进行扫描和纠偏的步骤:
(1)Kodak高速扫描仪接受计算机的控制信号,对纸质文档进行扫描后将形成的原始灰度影像传输至计算机内存;
(2)计算机对原始灰度影像去噪并得到它的二值影像;
(3)计算机在上述二值影像的下边缘上取两个点,分别位于影像中轴线的左右两边;
(4)计算机从这两个点开始竖直向上探测,直到遇上不是背景象素的点,就停下并记下该位置的坐标。这样就得到在倾斜文档的下边线上两个点的坐标P1(x1,y1)和P2( x2,y2);
(7)计算机将纠偏后的文档影像进行存储,实现数字化,并向Kodak高速扫描仪发出控制信号,继续对下一张纸质文档进行扫描。
在步骤(2)中,我们使用了中值滤波法实现原始灰度影像去噪。中值滤波法是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。方法是用二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。二维中值滤波输出为g(x,y)=med{f(x-k,y-l),(k,l∈W)} ,其中f(x,y)、g(x,y)分别为原始图像和处理后图像。W为二维模板,通常为2*2,3*3区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等。
一般地,针对图像像素的阈值选取方法可分为全局阈值算法和局部阈值算法两类。全局阈值算法是根据整幅图像选取一个固定的阈值将图像二值化。常用的全局阈值算法有大律法(最大类间方差法或Otsu法)等。全局阈值算法比较简单,实现比较容易,适用于图像的灰度直方图有明显的双峰,此时可选灰度直方图的谷底对应的灰度值作为最佳阈值。但当图像有噪声或光照不均匀时,图像的灰度直方图往往没有明显的双峰或有多个峰,此时该方法受到极大的限制,可采用局部阈值算法。局部阈值算法是将图像划分为若干子图像,结合当前考察的像素点和其邻域像素点的灰度值,确定考察点的阈值。常用的局部阈值法有Bernsen算法等。使用局部算法可以图像的二值化效果更好,抗噪声能力更强。
我们选择Otsu法作为从灰度影像获得二值影像的二值化方法。它是在最小二乘法原理基础上推导出来的,这种方法的基本思想是将直方图在某一阈值处分割成两组,一组对应于背景部分,一组对应于前景文字部分,当被分成的两组的组内方差最小,组间方差最大时,决定阈值。这种基于两组间最佳分类而决定阈值的方法也称为最大类间方差阈值分割法。
在具体实施过程中,我们用Kodak高速扫描仪对票据类文档进行了试验。其中纠偏角的探测与计算如图1所示。
纠偏后得到的文档影像如果使用位图格式来存储,会占用大量的空间,从而降低文档数字化存储方案的经济效益。在步骤(6)中采用了JPEG压缩算法后,平均每张文档影像所占用的空间可以减少为未压缩的位图格式的五分之一。试验使用的JPEG压缩算法的实现是由IJG(Independent JEPGGroup)提供的。
该高速扫描自动纠偏系统提供了一种简单有效、耗时少的纠偏方法,经试验,系统所提供的运行性能使得每台Kodak高速扫描仪每天可以处理一万张左右的文档。
应理解上述实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等同形式的修改均落于本申请所附权利要求所限定的范围。例如,在步骤(2)中,还可以用邻域平均法实现原始灰度影像去噪。邻域平均法是以图像模糊为代价来减小噪声的,且模板尺寸越大,噪声减小的效果越显著。如果f(i,j)是噪声点,其邻近像素灰度与之相差很大,采用邻域平均法就是用邻近像素的平均值来代替它,这样能明显消弱噪声点,使邻域中灰度接近均匀,起到平滑灰度的作用。
Claims (10)
1.一种高速扫描自动纠偏系统,包括高速扫描仪和与之相连的计算机,其特征在于,每次对文档进行扫描和纠偏的步骤如下:
(1)高速扫描仪接受计算机的控制信号,对纸质文档进行扫描后将形成的原始灰度影像传输至计算机内存;
(2)计算机对原始灰度影像去噪并得到它的二值影像;
(3)计算机在上述二值影像的下边缘上取两个点,分别位于影像中轴线的左右两边;
(4)计算机从这两个点开始竖直向上探测,直到遇上不是背景象素的点,就停下并记下该位置的坐标,这样就得到在倾斜文档的下边线上两个点的坐标P1(x1,y1)和P2(x2,y2);
(6)计算机将二值影像按照顺时针方向旋转角实现纠偏;
(7)计算机将纠偏后的文档影像进行存储,实现数字化,并向高速扫描仪发出控制信号,继续对下一张纸质文档进行扫描。
2.如权利要求1所述的一种高速扫描自动纠偏系统,其特征是,在步骤(2)中,计算机对原始灰度影像去噪的方法是中值滤波法或邻域平均法。
3.如权利要求1所述的一种高速扫描自动纠偏系统,其特征是,在步骤(2)中,计算机得到二值影像的方法是全局阈值算法,或大律法。
4.如权利要求5所述的一种高速扫描自动纠偏系统,其特征是,在步骤(2)中,计算机得到二值影像的方法是Otsu法。
5.如权利要求5所述的一种高速扫描自动纠偏系统,其特征是,在步骤(2)中,计算机得到二值影像的方法是最大类间方差法。
6.如权利要求1所述的一种高速扫描自动纠偏系统,其特征是,在步骤(2)中,计算机得到二值影像的方法是局部阈值算法。
7.如权利要求8所述的一种高速扫描自动纠偏系统,其特征是,在步骤(2)中,计算机得到二值影像的方法是Bernsen算法。
8.如权利要求1所述的一种高速扫描自动纠偏系统,其特征是,在步骤(7)中,计算机将纠偏后的文档影像进行存储时使用位图格式。
9.如权利要求1所述的一种高速扫描自动纠偏系统,其特征是,在步骤(7)中,计算机将纠偏后的文档影像进行存储时使用压缩格式。
10.如权利要求1所述的一种高速扫描自动纠偏系统,其特征是,在步骤(7)中,计算机将纠偏后的文档影像进行存储时使用的压缩格式为JPEG压缩格式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310137692XA CN103268591A (zh) | 2013-04-20 | 2013-04-20 | 一种高速扫描自动纠偏系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310137692XA CN103268591A (zh) | 2013-04-20 | 2013-04-20 | 一种高速扫描自动纠偏系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103268591A true CN103268591A (zh) | 2013-08-28 |
Family
ID=49012218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310137692XA Pending CN103268591A (zh) | 2013-04-20 | 2013-04-20 | 一种高速扫描自动纠偏系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103268591A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932516A (zh) * | 2018-07-11 | 2018-12-04 | 凌云光技术集团有限责任公司 | 一种旋转文本图像的校正方法及装置 |
CN111062317A (zh) * | 2019-12-16 | 2020-04-24 | 中国计量大学上虞高等研究院有限公司 | 一种扫描文档的裁边方法与系统 |
CN114739315A (zh) * | 2022-03-09 | 2022-07-12 | 上海颢汉数字技术有限公司 | 彩塑扫描速率控制方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1330111A2 (en) * | 2002-01-16 | 2003-07-23 | Eastman Kodak Company | Automatic image quality evaluation and correction technique |
CN101887521A (zh) * | 2010-06-22 | 2010-11-17 | 中兴通讯股份有限公司 | 一种实现文件纠偏的方法及终端 |
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
-
2013
- 2013-04-20 CN CN201310137692XA patent/CN103268591A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1330111A2 (en) * | 2002-01-16 | 2003-07-23 | Eastman Kodak Company | Automatic image quality evaluation and correction technique |
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
CN101887521A (zh) * | 2010-06-22 | 2010-11-17 | 中兴通讯股份有限公司 | 一种实现文件纠偏的方法及终端 |
Non-Patent Citations (1)
Title |
---|
谭雅莉: "高速票据扫描处理系统的设计与实现", 《山西电子技术》, no. 2, 28 February 2005 (2005-02-28) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932516A (zh) * | 2018-07-11 | 2018-12-04 | 凌云光技术集团有限责任公司 | 一种旋转文本图像的校正方法及装置 |
CN111062317A (zh) * | 2019-12-16 | 2020-04-24 | 中国计量大学上虞高等研究院有限公司 | 一种扫描文档的裁边方法与系统 |
CN114739315A (zh) * | 2022-03-09 | 2022-07-12 | 上海颢汉数字技术有限公司 | 彩塑扫描速率控制方法、装置、电子设备及存储介质 |
CN114739315B (zh) * | 2022-03-09 | 2024-05-31 | 上海颢汉数字技术有限公司 | 彩塑扫描速率控制方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9509884B2 (en) | Skew detection | |
JP4847592B2 (ja) | 歪み文書画像を補正する方法及びシステム | |
Su et al. | Binarization of historical document images using the local maximum and minimum | |
US8213687B2 (en) | Image processing methods, image processing systems, and articles of manufacture | |
CN108416355B (zh) | 一种基于机器视觉的工业现场生产数据的采集方法 | |
US8849042B2 (en) | Image processing apparatus, rectangle detection method, and computer-readable, non-transitory medium | |
Gatos et al. | Segmentation based recovery of arbitrarily warped document images | |
US7844118B1 (en) | Image segmentation system and method with improved thin line detection | |
JP4784500B2 (ja) | 画像傾き補正装置及び画像傾き補正方法 | |
EP2605186B1 (en) | Method and apparatus for recognizing a character based on a photographed image | |
US8254694B2 (en) | Thin line detection in scanned image data | |
US20130120806A1 (en) | Image processing apparatus, line detection method, and computer-readable, non-transitory medium | |
CN103268591A (zh) | 一种高速扫描自动纠偏系统 | |
WO2015092059A1 (en) | Method and system for correcting projective distortions. | |
US8224112B2 (en) | Fuzzy method to detect thin lines in scanned image | |
CN106412377B (zh) | 图像处理装置 | |
Altamura et al. | WISDOM++: An interactive and adaptive document analysis system | |
Chethan et al. | Graphics separation and skew correction for mobile captured documents and comparative analysis with existing methods | |
CN110097065A (zh) | 一种基于FreeMan链码的直线检测方法及终端 | |
Vinod et al. | Camera captured document de-warping and de-skewing | |
Oliveira et al. | A new method for text-line segmentation for warped documents | |
JP6573124B2 (ja) | 画像処理装置 | |
CN107680046A (zh) | 影像矫正方法、装置、存储介质和计算机设备 | |
Banumathi et al. | An approach to estimate skew angle in printed document images | |
Manomathi et al. | Skew angle estimation and correction for noisy document images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130828 |