CN110516667B - 一种基于安卓的文字水平矫正方法 - Google Patents

一种基于安卓的文字水平矫正方法 Download PDF

Info

Publication number
CN110516667B
CN110516667B CN201910753651.0A CN201910753651A CN110516667B CN 110516667 B CN110516667 B CN 110516667B CN 201910753651 A CN201910753651 A CN 201910753651A CN 110516667 B CN110516667 B CN 110516667B
Authority
CN
China
Prior art keywords
picture
average value
height
width
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910753651.0A
Other languages
English (en)
Other versions
CN110516667A (zh
Inventor
张明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Wanpeng Digital Intelligence Technology Co.,Ltd.
Original Assignee
Zhejiang Wanpeng Education Science And Technology Stock Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Wanpeng Education Science And Technology Stock Co ltd filed Critical Zhejiang Wanpeng Education Science And Technology Stock Co ltd
Priority to CN201910753651.0A priority Critical patent/CN110516667B/zh
Publication of CN110516667A publication Critical patent/CN110516667A/zh
Application granted granted Critical
Publication of CN110516667B publication Critical patent/CN110516667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于安卓的文字水平矫正方法。本发明针对包含大量文字的图片,图像处理极少是针对彩色图处理,所以首先我们先对图片灰度处理转换成灰度图,图片去噪处理,图片边缘提取,二值化处理,霍夫变换处理,建立xy坐标系计算夹角的平均值,最后通过二维旋转,仿射变换矩阵生成最终文字水平的图片。本发明对清晰的,文字占图片比高的图片矫正很准确。本发明对图片进行处理后,使图片中的文字看起来是在一个平面上,并且要使原来倾斜的文字变为水平,便于浏览与阅读。同时本发明解决了手机拍摄的图片有变形或倾斜时,能够直接对其处理为较为正常的图片。

Description

一种基于安卓的文字水平矫正方法
技术领域
本发明属于计算机图像处理领域,提供一种基于安卓的文字水平矫正方法。通过该方法任意角度的一张文字图片,经过一系列处理,获取文字方向和水平的角度,然后旋转图片或者仿射变换等处理使文字水平。
背景技术
手机的普及和移动4G信号的诸多优点,使手机端实时传送大文件已不再是问题。人类已经全新步入移动互联网时代,在生产和生活的方方面面都已经离不开手机和网络。在手机上浏览新闻、视频娱乐、即时通信、随时随地阅读和学习等等已经逐渐成为人们不可或少的一部分。甚至手机大有取代笔记本,取代笔与纸的趋势,遇到需要记录的东西随手一拍,在手机里保存一张图片,需要时拿出来翻看,即便捷又环保。但是拍摄的照片受到拍摄角度,抖动,光照,纸张等因素的影响,导致图片上文字倾斜或者凹凸、褶皱变形,这时我们就需要对图片进行优化,使图片中的文字看起来是在一个平面上,并且要使原来倾斜的文字变为水平,便于浏览与阅读。本发明就是解决手机拍摄的图片有变形或倾斜时,对其处理为较为正常的图片。
发明内容
本发明的目的是主要针对包含大量文字的图片,图像处理极少是针对彩色图处理,所以首先我们先对图片灰度处理转换成灰度图,图片去噪处理,图片边缘提取,二值化处理,霍夫变换处理,建立xy坐标系计算夹角的平均值(当然在获得角度后,你可以结合实际需求自行处理),最后通过二维旋转,仿射变换矩阵生成最终文字水平的图片。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1、初始化计算,根据传入的图片获取属性宽高记为width和height,单位是像素px,为提高准确度先把图片平均划分成四部分,分别为P1,P2,P3,P4。
步骤2、取出步骤1中的P1做灰度化处理,遍历求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量,生成新的灰度图A1。
步骤3、图片去噪处理,遍历灰度图A1的像素点,统计以每个像素点为中心,4x4区域内像素点的灰度平均值,把平均值设置给中心点,最终生成去噪的图片A2。
步骤4、图片边缘提取,因为图像的边缘区域会存在明显的像素值阶跃,因此边缘检测主要是通过获得图像灰度梯度,进而通过梯度大小和变化来判断图像边缘的,其中一阶差分可以判断边缘是否存在,通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向,对图片A2差分计算生成新的图片A3。
步骤5、二值化处理,遍历图片A3的像素,计算灰度的平均值,将每个像素的灰度值与平均值进行比较,将小于平均值就把灰度值置为0(黑色),否则置为255(白色),生成二值化后图片A4。
步骤6、对二值化后图片A4做霍夫变换,用来检测直线,得到一个直线集合List;霍夫变换过程中设置不同的阈值,阈值越大,检测精度越高。由于图像不同,阈值不好设定,因为阈值设定过高导致无法检测直线,阈值过低直线太多,速度很慢。所以可以根据阈值由大到小设置了三个阈值,经过大量试验后,可以固定三个适合的阈值,最终得到一个直线集合List。
步骤7、遍历直线集合List,定义一个矢量结构Lines用于存放得到的直线矢量集合。获取每条直线的角度Line[i][1],叠加计算角度之和Sum,获取平均角度Degree1=Sum/Lines.size(),最后转换成文字倾斜角度Angle1=Degree1/π*180-90,
其中i≥0,Lines.size()表示集合长度;
步骤8、对步骤1中的P2、P3和P4分别进行步骤2到步骤7处理,依次得到Angle2,Angle3,Angle4,计算四部分的平均值Angle=(Angle1+Angle2+Angle3+Angle4)/4。
步骤9、文字倾斜的图片校正后,图片部分区域可能会留白,角度D=Math.abs(Angle),旋转后图片的height会相应变大到屏幕的宽度即newHeight=w,图片的宽度为原图片的宽高(width和height)在水平面的投影即newWidth=width*cos(D)+height*cos(90-D),按照宽高为newWidth和newHeight裁剪图片,生成矫正后的图片。
本发明有益效果如下:
本发明对清晰的,文字占图片比高的图片矫正很准确。
本发明对图片进行处理后,使图片中的文字看起来是在一个平面上,并且要使原来倾斜的文字变为水平,便于浏览与阅读。
同时本发明解决了手机拍摄的图片有变形或倾斜时,能够直接对其处理为较为正常的图片。
具体实施方式
下面结合实施例对本发明作进一步说明。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1、初始化计算,根据传入的图片获取属性宽高记为width和height,单位是像素px,为提高准确度先把图片平均划分成四部分,分别为P1,P2,P3,P4。
步骤2、取出步骤1中的P1做灰度化处理,遍历求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量,生成新的灰度图A1。
步骤3、图片去噪处理,遍历灰度图A1的像素点,统计以每个像素点为中心,4x4区域内像素点的灰度平均值,把平均值设置给中心点,最终生成去噪的图片A2。
步骤4、图片边缘提取,因为图像的边缘区域会存在明显的像素值阶跃,因此边缘检测主要是通过获得图像灰度梯度,进而通过梯度大小和变化来判断图像边缘的,其中一阶差分可以判断边缘是否存在,通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向,对图片A2差分计算生成新的图片A3。
步骤5、二值化处理,遍历图片A3的像素,计算灰度的平均值,将每个像素的灰度值与平均值进行比较,将小于平均值就把灰度值置为0(黑色),否则置为255(白色),生成二值化后图片A4。
步骤6、对二值化后图片A4做霍夫变换,用来检测直线,得到一个直线集合List;霍夫变换过程中设置不同的阈值,阈值越大,检测精度越高。由于图像不同,阈值不好设定,因为阈值设定过高导致无法检测直线,阈值过低直线太多,速度很慢。所以可以根据阈值由大到小设置了三个阈值,经过大量试验后,可以固定三个适合的阈值,最终得到一个直线集合List。
步骤7、遍历直线集合List,定义一个矢量结构Lines用于存放得到的直线矢量集合。获取每条直线的角度Line[i][1],叠加计算角度之和Sum,获取平均角度Degree1=Sum/Lines.size(),最后转换成文字倾斜角度Angle1=Degree1/π*180-90,
其中i≥0,Lines.size()表示集合长度;
步骤8、对步骤1中的P2、P3和P4分别进行步骤2到步骤7处理,依次得到Angle2,Angle3,Angle4,计算四部分的平均值Angle=(Angle1+Angle2+Angle3+Angle4)/4。
步骤9、文字倾斜的图片校正后,图片部分区域可能会留白,角度D=Math.abs(Angle),旋转后图片的height会相应变大到屏幕的宽度即newHeight=w,图片的宽度为原图片的宽高(width和height)在水平面的投影即newWidth=width*cos(D)+height*cos(90-D),按照宽高为newWidth和newHeight裁剪图片,生成矫正后的图片。

Claims (1)

1.一种基于安卓的文字水平矫正方法,其特征在于包括如下步骤:
步骤1、初始化计算,根据传入的图片获取属性宽高记为width和height,单位是像素px;先把图片平均划分成四部分,分别为P1,P2,P3,P4;
步骤2、取出步骤1中的P1做灰度化处理,遍历求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量,生成新的灰度图A1;
步骤3、图片去噪处理,遍历灰度图A1的像素点,统计以每个像素点为中心,4×4区域内像素点的灰度平均值,把平均值设置给中心点,最终生成去噪的图片A2;
步骤4、图片边缘提取,因为图像的边缘区域会存在明显的像素值阶跃,因此边缘检测是通过获得图像灰度梯度,进而通过梯度大小和变化来判断图像边缘的,其中一阶差分判断边缘是否存在,通过寻找图像一阶导数中的最大和最小值来检测边界,是将边界定位在梯度最大的方向,对图片A2差分计算生成新的图片A3;
步骤5、二值化处理,遍历图片A3的像素,计算灰度的平均值,将每个像素的灰度值与平均值进行比较,将小于平均值就把灰度值置为0,否则置为255,生成二值化后图片A4;
步骤6、对二值化后图片A4做霍夫变换,用来检测直线,得到一个直线集合List;霍夫变换过程中设置不同的阈值,阈值越大,检测精度越高;经过大量试验后,固定三个由大到小的阈值,最终得到一个直线集合List;
步骤7、遍历直线集合List,定义一个矢量结构Lines用于存放得到的直线矢量集合;获取每条直线的角度Line[i][1],叠加计算角度之和Sum,获取平均角度Degree1=Sum/Lines.size(),最后转换成文字倾斜角度Angle1=Degree1/π*180-90,
其中i≥0,Lines.size()表示集合长度;
步骤8、对步骤1中的P2、P3和P4分别进行步骤2到步骤7处理,依次得到Angle2,Angle3,Angle4,计算四部分的平均值Angle=(Angle1+Angle2+Angle3+Angle4)/4;
步骤9、文字倾斜的图片校正后,图片部分区域会留白,角度D=Math.abs(Angle),旋转后图片的height会相应变大到屏幕的宽度即newHeight=w,图片的宽度为原图片的宽高width和height在水平面的投影即newWidth=width*cos(D)+height*cos(90-D),按照宽高为newWidth和newHeight裁剪图片,生成矫正后的图片。
CN201910753651.0A 2019-08-15 2019-08-15 一种基于安卓的文字水平矫正方法 Active CN110516667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910753651.0A CN110516667B (zh) 2019-08-15 2019-08-15 一种基于安卓的文字水平矫正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910753651.0A CN110516667B (zh) 2019-08-15 2019-08-15 一种基于安卓的文字水平矫正方法

Publications (2)

Publication Number Publication Date
CN110516667A CN110516667A (zh) 2019-11-29
CN110516667B true CN110516667B (zh) 2021-10-22

Family

ID=68625234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910753651.0A Active CN110516667B (zh) 2019-08-15 2019-08-15 一种基于安卓的文字水平矫正方法

Country Status (1)

Country Link
CN (1) CN110516667B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760432A (zh) * 2021-08-30 2021-12-07 浙江万朋教育科技股份有限公司 一种基于H5 Canvas实现还原手写笔迹的涂鸦方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200209A (zh) * 2014-08-29 2014-12-10 南京烽火星空通信发展有限公司 一种图像文字检测方法
CN105761219A (zh) * 2016-02-03 2016-07-13 北京云江科技有限公司 文本图像倾斜矫正方法和系统
CN107622490A (zh) * 2017-10-12 2018-01-23 哈尔滨工业大学(威海) 基于机器视觉的嵌入式塑料织物质量检测装置及检测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3698136B2 (ja) * 2002-11-13 2005-09-21 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理プログラム
US8949287B2 (en) * 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US9288362B2 (en) * 2014-02-03 2016-03-15 King Fahd University Of Petroleum And Minerals Technique for skew detection of printed arabic documents
CN106570500B (zh) * 2016-11-11 2018-01-23 北京三快在线科技有限公司 文本行的识别方法及装置、计算设备
CN108288061A (zh) * 2018-03-02 2018-07-17 哈尔滨理工大学 一种基于mser快速在自然场景中定位倾斜文本的方法
CN109409363B (zh) * 2018-10-13 2021-11-12 长沙芯希电子科技有限公司 基于内容的文本图像颠倒判断及校正方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200209A (zh) * 2014-08-29 2014-12-10 南京烽火星空通信发展有限公司 一种图像文字检测方法
CN105761219A (zh) * 2016-02-03 2016-07-13 北京云江科技有限公司 文本图像倾斜矫正方法和系统
CN107622490A (zh) * 2017-10-12 2018-01-23 哈尔滨工业大学(威海) 基于机器视觉的嵌入式塑料织物质量检测装置及检测方法

Also Published As

Publication number Publication date
CN110516667A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
Chen et al. Robust video content alignment and compensation for rain removal in a cnn framework
CN109785291B (zh) 一种车道线自适应检测方法
CN109409366B (zh) 基于角点检测的畸变图像校正方法及装置
CN112308095A (zh) 图片预处理及模型训练方法、装置、服务器及存储介质
US20210287381A1 (en) Object tracking method, tracking processing method, corresponding apparatus, and electronic device
CN109753971B (zh) 扭曲文字行的矫正方法及装置、字符识别方法及装置
CN106875437B (zh) 一种面向rgbd三维重建的关键帧提取方法
EP3798975A1 (en) Method and apparatus for detecting subject, electronic device, and computer readable storage medium
CN106934806B (zh) 一种基于结构清晰度的无参考图失焦模糊区域分割方法
WO2020207203A1 (zh) 一种前景数据生成及其应用方法、相关装置和系统
CN109803172B (zh) 一种直播视频的处理方法、装置及电子设备
CN110956661A (zh) 基于双向单应矩阵的可见光与红外相机动态位姿计算方法
CN108447060B (zh) 基于rgb-d图像的前后景分离方法及其前后景分离装置
CN103841298A (zh) 一种基于颜色恒量和几何不变特征的视频稳像方法
CN105427333A (zh) 视频序列图像的实时配准方法、系统及拍摄终端
CN101315664A (zh) 用于文字识别的文本图像预处理方法
CN112734914A (zh) 一种增强现实视觉的图像立体重建方法及装置
CN116468640B (zh) 一种用于互联网教学的视频图像增强方法
CN111985314B (zh) 一种基于ViBe与改进LBP的烟雾检测方法
CN111784587B (zh) 一种基于深度学习网络的发票照片位置矫正方法
JP5640622B2 (ja) 赤目オブジェクト候補を分類する方法、コンピューター読み取り可能な媒体および画像処理装置
Liu et al. Texture filtering based physically plausible image dehazing
CN110909772B (zh) 一种高精度实时多尺度表盘指针检测方法和系统
CN110516667B (zh) 一种基于安卓的文字水平矫正方法
CN107194886B (zh) 一种用于相机传感器的灰尘检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 12 / F, building 8, No. 19, Jugong Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee after: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK CO.,LTD.

Address before: Room 1406, Hangzhou e-commerce building, 118 Wensan West Road, Xihu District, Hangzhou City, Zhejiang Province, 310013

Patentee before: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK CO.,LTD.

CP02 Change in the address of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 12 / F, building 8, No. 19, Jugong Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee after: Zhejiang Wanpeng Digital Intelligence Technology Co.,Ltd.

Address before: 12 / F, building 8, No. 19, Jugong Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee before: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK CO.,LTD.

CP01 Change in the name or title of a patent holder