CN110516667B

CN110516667B - 一种基于安卓的文字水平矫正方法

Info

Publication number: CN110516667B
Application number: CN201910753651.0A
Authority: CN
Inventors: 张明
Original assignee: Zhejiang Wanpeng Education Science And Technology Stock Co ltd
Current assignee: Zhejiang Wanpeng Digital Intelligence Technology Co.,Ltd.
Priority date: 2019-08-15
Filing date: 2019-08-15
Publication date: 2021-10-22
Anticipated expiration: 2039-08-15
Also published as: CN110516667A

Abstract

本发明公开了一种基于安卓的文字水平矫正方法。本发明针对包含大量文字的图片，图像处理极少是针对彩色图处理，所以首先我们先对图片灰度处理转换成灰度图，图片去噪处理，图片边缘提取，二值化处理，霍夫变换处理，建立xy坐标系计算夹角的平均值，最后通过二维旋转，仿射变换矩阵生成最终文字水平的图片。本发明对清晰的，文字占图片比高的图片矫正很准确。本发明对图片进行处理后，使图片中的文字看起来是在一个平面上，并且要使原来倾斜的文字变为水平，便于浏览与阅读。同时本发明解决了手机拍摄的图片有变形或倾斜时，能够直接对其处理为较为正常的图片。

Description

一种基于安卓的文字水平矫正方法

技术领域

本发明属于计算机图像处理领域，提供一种基于安卓的文字水平矫正方法。通过该方法任意角度的一张文字图片，经过一系列处理，获取文字方向和水平的角度，然后旋转图片或者仿射变换等处理使文字水平。

背景技术

手机的普及和移动4G信号的诸多优点，使手机端实时传送大文件已不再是问题。人类已经全新步入移动互联网时代，在生产和生活的方方面面都已经离不开手机和网络。在手机上浏览新闻、视频娱乐、即时通信、随时随地阅读和学习等等已经逐渐成为人们不可或少的一部分。甚至手机大有取代笔记本，取代笔与纸的趋势，遇到需要记录的东西随手一拍，在手机里保存一张图片，需要时拿出来翻看，即便捷又环保。但是拍摄的照片受到拍摄角度，抖动，光照，纸张等因素的影响，导致图片上文字倾斜或者凹凸、褶皱变形，这时我们就需要对图片进行优化，使图片中的文字看起来是在一个平面上，并且要使原来倾斜的文字变为水平，便于浏览与阅读。本发明就是解决手机拍摄的图片有变形或倾斜时，对其处理为较为正常的图片。

发明内容

本发明的目的是主要针对包含大量文字的图片，图像处理极少是针对彩色图处理，所以首先我们先对图片灰度处理转换成灰度图，图片去噪处理，图片边缘提取，二值化处理，霍夫变换处理，建立xy坐标系计算夹角的平均值(当然在获得角度后，你可以结合实际需求自行处理)，最后通过二维旋转，仿射变换矩阵生成最终文字水平的图片。

本发明解决其技术问题所采用的技术方案包括如下步骤：

步骤1、初始化计算，根据传入的图片获取属性宽高记为width和height,单位是像素px，为提高准确度先把图片平均划分成四部分，分别为P1，P2，P3，P4。

步骤2、取出步骤1中的P1做灰度化处理,遍历求出每个像素点的R、G、B三个分量的平均值，然后将这个平均值赋予给这个像素的三个分量，生成新的灰度图A1。

步骤3、图片去噪处理，遍历灰度图A1的像素点，统计以每个像素点为中心，4x4区域内像素点的灰度平均值，把平均值设置给中心点,最终生成去噪的图片A2。

步骤4、图片边缘提取，因为图像的边缘区域会存在明显的像素值阶跃，因此边缘检测主要是通过获得图像灰度梯度，进而通过梯度大小和变化来判断图像边缘的，其中一阶差分可以判断边缘是否存在，通过寻找图像一阶导数中的最大和最小值来检测边界，通常是将边界定位在梯度最大的方向,对图片A2差分计算生成新的图片A3。

步骤5、二值化处理，遍历图片A3的像素，计算灰度的平均值，将每个像素的灰度值与平均值进行比较，将小于平均值就把灰度值置为0(黑色)，否则置为255(白色)，生成二值化后图片A4。

步骤6、对二值化后图片A4做霍夫变换，用来检测直线，得到一个直线集合List；霍夫变换过程中设置不同的阈值，阈值越大，检测精度越高。由于图像不同，阈值不好设定，因为阈值设定过高导致无法检测直线，阈值过低直线太多，速度很慢。所以可以根据阈值由大到小设置了三个阈值，经过大量试验后，可以固定三个适合的阈值，最终得到一个直线集合List。

步骤7、遍历直线集合List,定义一个矢量结构Lines用于存放得到的直线矢量集合。获取每条直线的角度Line[i][1]，叠加计算角度之和Sum,获取平均角度Degree1＝Sum/Lines.size()，最后转换成文字倾斜角度Angle1＝Degree1/π*180-90，

其中i≥0，Lines.size()表示集合长度；

步骤8、对步骤1中的P2、P3和P4分别进行步骤2到步骤7处理，依次得到Angle2,Angle3,Angle4，计算四部分的平均值Angle＝(Angle1+Angle2+Angle3+Angle4)/4。

步骤9、文字倾斜的图片校正后，图片部分区域可能会留白，角度D＝Math.abs(Angle),旋转后图片的height会相应变大到屏幕的宽度即newHeight＝w,图片的宽度为原图片的宽高(width和height)在水平面的投影即newWidth＝width*cos(D)+height*cos(90-D)，按照宽高为newWidth和newHeight裁剪图片，生成矫正后的图片。

本发明有益效果如下：

本发明对清晰的，文字占图片比高的图片矫正很准确。

本发明对图片进行处理后，使图片中的文字看起来是在一个平面上，并且要使原来倾斜的文字变为水平，便于浏览与阅读。

同时本发明解决了手机拍摄的图片有变形或倾斜时，能够直接对其处理为较为正常的图片。

具体实施方式

下面结合实施例对本发明作进一步说明。

本发明解决其技术问题所采用的技术方案包括如下步骤：

其中i≥0，Lines.size()表示集合长度；

Claims

1.一种基于安卓的文字水平矫正方法，其特征在于包括如下步骤：

步骤1、初始化计算，根据传入的图片获取属性宽高记为width和height,单位是像素px；先把图片平均划分成四部分，分别为P1，P2，P3，P4；

步骤2、取出步骤1中的P1做灰度化处理,遍历求出每个像素点的R、G、B三个分量的平均值，然后将这个平均值赋予给这个像素的三个分量，生成新的灰度图A1；

步骤3、图片去噪处理，遍历灰度图A1的像素点，统计以每个像素点为中心，4×4区域内像素点的灰度平均值，把平均值设置给中心点,最终生成去噪的图片A2；

步骤4、图片边缘提取，因为图像的边缘区域会存在明显的像素值阶跃，因此边缘检测是通过获得图像灰度梯度，进而通过梯度大小和变化来判断图像边缘的，其中一阶差分判断边缘是否存在，通过寻找图像一阶导数中的最大和最小值来检测边界，是将边界定位在梯度最大的方向,对图片A2差分计算生成新的图片A3；

步骤5、二值化处理，遍历图片A3的像素，计算灰度的平均值，将每个像素的灰度值与平均值进行比较，将小于平均值就把灰度值置为0，否则置为255，生成二值化后图片A4；

步骤6、对二值化后图片A4做霍夫变换，用来检测直线，得到一个直线集合List；霍夫变换过程中设置不同的阈值，阈值越大，检测精度越高；经过大量试验后，固定三个由大到小的阈值，最终得到一个直线集合List；

步骤7、遍历直线集合List,定义一个矢量结构Lines用于存放得到的直线矢量集合；获取每条直线的角度Line[i][1]，叠加计算角度之和Sum,获取平均角度Degree1＝Sum/Lines.size()，最后转换成文字倾斜角度Angle1＝Degree1/π*180-90，

其中i≥0，Lines.size()表示集合长度；

步骤8、对步骤1中的P2、P3和P4分别进行步骤2到步骤7处理，依次得到Angle2,Angle3,Angle4，计算四部分的平均值Angle＝(Angle1+Angle2+Angle3+Angle4)/4；

步骤9、文字倾斜的图片校正后，图片部分区域会留白，角度D＝Math.abs(Angle),旋转后图片的height会相应变大到屏幕的宽度即newHeight＝w,图片的宽度为原图片的宽高width和height在水平面的投影即newWidth＝width*cos(D)+height*cos(90-D)，按照宽高为newWidth和newHeight裁剪图片，生成矫正后的图片。