一种倾斜图像自动校正方法
技术领域
本发明涉及一种数字图像处理方法,特别是涉及一种自动校正倾斜图像的方法。
背景技术
文件扫描过程中,扫描文件经常会出现倾斜的情况,这样会给文件的查阅及处理带来很大的不便。因此对输入图像倾斜角度的检测与校正是必不可少的。对图像的倾斜校正首先需要对图像的倾斜角度进行检测,再根据检测到的倾斜角度进行调整,将图像调整到整齐的位置。
所谓倾斜校正技术就是指通过检测扫描仪输入的文本、图像等的倾斜角度来进行自动校正。通过文书中的网格线和文字的排列方向来推算文书图像的正确角度。这项技术既可以被单独使用也可以作为OCR(光学文字识别)的预处理来使用。
图像的倾斜校正主要分手动校正与自动校正两种。手动校正主要是通过肉眼的观察等进行校正。自动校正可以对图像进行分析,判断出图像的倾斜角度,然后将图像自动校正过来。有些传统的纠偏软件的缺点是会造成锯齿状的图像边缘。
现有的自动对倾斜图像进行校正的处理方法包括:剖面投影法、霍夫变换法、交叉相关性法、相邻特征点聚类法等,下面对其一一介绍:
剖面投影法是在文本中沿文本倾斜方向的剖面的某种特征的投影值最大。这种处理方法是通过适当的结构能量函数,可以取得比较好的效果,但是该方法很大程度上依赖文字区域,对于文字区域较少的图像,无法得到满意的效果。
霍夫变换(Hough transform)是对图像中的边缘检测和几何形状识别的基本方法,它利用了霍夫变换的特性,将图像中的前景像素映像到极坐标空间,通过统计极坐标空间各点的累加值得到图像的倾斜角度。但是霍夫变换也只是对纯文本的图像比较有效。
交叉相关性法是采用交叉计算的思想进行倾斜角度检测。该算法解决了文字行的主方向变化,和文档中包含图和表的问题,是一种准确度较高的算法,但算法精度较低。
相邻特征点聚类法是一种基于统计的倾斜角检测方法。通过改进,可以解决图表带来的干扰,获得比较好的效果,但由于该方法基于统计得到结果,所以需要图像中有较多的文字区域,否则会由于参与计算的特征点较少,无法获得足够多的统计数据而影响最终的结果。
以上四种是倾斜角度检测中比较普通的方法。而实际上,很多处理方法都是其中几种思路的组合。从四种处理方法的处理过程可以看出,对于纯文本文档,这些方法都能得到比较好的处理效果。但对于图表,以及文字区域较少的数字图像,效果就相对较差。所以绝大部分处理方法都依赖文字区域,而没有兼顾到图像的有用信息。此外,大部分处理方法都是从文件图像的内容细节和关系出发,而没有从图像的整体结构出发,而图像中的某些信息,对于判断图像的倾斜角度是很有帮助的。
因此如何处理同时包含有文字、图、表等内容复杂的倾斜图像,成为研究的焦点,也是提高检测精度以及准确性的关键所在。
发明内容
本发明所要解决的技术问题在于提供一种倾斜图像自动校正方法,其可自动识别并校正倾斜图像,在保证低成本的同时,提高图像处理的准确性。
为了实现上述目的,本发明提供了一种倾斜图像自动校正方法,其可自动捕获原始图像的倾斜角度,并将其调整,其特点在于,该方法包括如下步骤:扫描该原始图像,获得该原始图像的像素值;对原始图像进行预处理,消除图像中的噪音;对该原始图像进行边缘增强;将该原始图像二值化;在该原始图像中拟合一条基准线;根据该基准线确定图像的倾斜角度;及根据该倾斜角度对图像进行调整;其中,该拟合一条基准线的步骤包括:确定选定像素;在该原始图像中依序设定待定线;计算各选定像素到该待定线的平均距离;将该平均值与一距离阈值进行比较;及若该平均距离小于该距离阈值,则将该当前待定线标记为基准线。
上述倾斜图像自动校正方法,其特点在于,该距离阈值为该待定线长度的三分之一。
上述倾斜图像自动校正方法,其特点在于,该选定像素为总体个数大于个数阈值的非孤立的像素集。
上述倾斜图像自动校正方法,其特点在于,该个数阈值为3。
上述倾斜图像自动校正方法,其特点在于,依序设定待定线的步骤,为从该原始图像的一端至另一端,按照一预定距离按顺序设定待定线。
上述倾斜图像自动校正方法,其特点在于,还包括消除选定像素中噪音像素的步骤。
上述倾斜图像自动校正方法,其特点在于,该噪音像素为到该待定线的距离与该平均距离相比大于一预定倍数的像素点。
本发明的功效,在于自动捕获倾斜的文件,并将其旋转,从图像的整体结构出发,通过拟合最佳基准线得到倾斜的角度,具有准确性高、鲁棒性强、运算速度快等特点,同时对于大多数ORC系统也是适用的。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明所提的倾斜图像自动校正方法的总体流程图;
图2为本发明拟合基准线的流程图;
图3为本发明实施例的运作流程图;
图4为本发明实施例的选定像素的示意图;及
图5为本发明实施例选定像素中的噪音像素的示意图。
其中,附图标记:
步骤110-获得原始图像的像素值
步骤120-将该原始图像二值化
步骤130-在该原始图像中拟合一条基准线
步骤140-根据该基准线确定图像的倾斜角度
步骤150-根据该倾斜角度对图像进行调整
步骤1301-确定选定像素
步骤1302-在该原始图像中依序设定待定线
步骤1303-计算各选定像素到该待定线的平均距离
步骤1304-将该平均值与一距离阈值进行比较
步骤1305-若该平均距离小于该距离阈值,则将该当前待定线标记为基准线
步骤310-获得位图图像
步骤320-将图像复制到临时缓冲区
步骤330-边缘增强
步骤340-对图像进行二值化
步骤350-确定选定像素
步骤360-拟合基准线
步骤370-倾斜角度的绝对值在0.1~30之间?
步骤380-退出
步骤390-将图像旋转
410-孤立像素,420-像素集
510-选定像素中的噪音点,520-待定线
具体实施方式
很多情况下,我们获得的原始图像都是复杂的图像,其可能不仅有纯文本,还可能包括各种图和表,文本中的内容可能是纵向也可能是横向。同时字体也可能各种各样。扫描过程中不可避免地出现各种噪音。本发明的理想目标输出是一幅没有任何倾斜的图像。
本发明为一种倾斜图像自动校正方法,首先由图1说明本发明的系统,该图为本发明所提的倾斜图像自动校正方法的总体流程图,说明如下:
步骤110,首先扫描该原始图像,获得该原始图像的像素值,步骤120,然后将该原始图像二值化,步骤130,在该原始图像中拟合一条基准线,步骤140,根据该基准线确定图像的倾斜角度,步骤150,最后根据该倾斜角度对图像进行调整。
在上述过程中,拟合基准线的过程,请参见图2,该图是本发明拟合基准线的流程图。
步骤1301,首先确定选定像素,步骤1302,然后在该原始图像中依序设定待定线,步骤1303,计算各选定像素到该待定线的平均距离,步骤1304,将该平均值与一距离阈值进行比较,步骤1305,若该平均距离小于该距离阈值,则将该当前待定线标记为基准线,所述距离阈值为该待定线长度的三分之一。
具体处理过程,请参见图3,该图是本发明实施例的运作流程图。
步骤310,首先获得原始位图图像,原始图像是通过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机内而得到的。步骤320,然后将图像复制到临时缓冲区,对图像进行预处理,消除图像中的噪音。步骤330,再对图像进行边缘增强处理,强化图像中的边缘,以便于后续处理操作。步骤340,接着对灰度和彩色的图像进行二值化,步骤350,然后确定选定像素,选定像素为总体个数大于一个数阈值的非孤立的像素集。请参见图4,为本发明实施例的选定像素的示意图。本实施例中个数阈值为3,也就是说,个数大于3的非孤立的像素点的集合即为选定像素。如图所示,像素点410为孤立像素,像素集420即为选定像素。再将选定像素中的噪音点消除,选定像素中的噪音点是指对拟合基准线没有参考价值的点。更具体地说噪音像素为到该待定线的距离与该平均距离相比大于一预定倍数的像素点。如图5所示,该图为本发明实施例选定像素中的噪音像素的示意图。像素点的集合510即为选定像素中的噪音点,其到待定线520的距离D,比所有选定像素到该待定线520的平均距离大,并且该距离D与该平均距离之差为一预定值,该预定值是该平均距离与一预定参数的乘积。按照此方法在图像中依序设定待定线的步骤,从该原始图像的一端至另一端(例如从顶端到底端),按照一预定距离按顺序设定待定线,步骤360,按照图2所示的流程拟合基准线,直至拟合出符合要求的基准线。步骤370,然后判断该基准线倾斜角度的绝对值是否在0.1~30之间,若不在该角度范围之间,则说明原始图像不存在倾斜角度,则无需旋转;若该基准线倾斜角度的绝对值是否在0.1~30之间,则将图像旋转,从而将原始图像的位置调整。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明权利要求的保护范围。