CN104835120B - 一种基于基准线的弯曲书面展平方法 - Google Patents

一种基于基准线的弯曲书面展平方法 Download PDF

Info

Publication number
CN104835120B
CN104835120B CN201510200460.3A CN201510200460A CN104835120B CN 104835120 B CN104835120 B CN 104835120B CN 201510200460 A CN201510200460 A CN 201510200460A CN 104835120 B CN104835120 B CN 104835120B
Authority
CN
China
Prior art keywords
datum line
line
value
written
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510200460.3A
Other languages
English (en)
Other versions
CN104835120A (zh
Inventor
肖夏
田健飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201510200460.3A priority Critical patent/CN104835120B/zh
Publication of CN104835120A publication Critical patent/CN104835120A/zh
Application granted granted Critical
Publication of CN104835120B publication Critical patent/CN104835120B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种基于基准线的弯曲书面展平方法,包括:采集弯曲书面的曲面图像;对曲面图像进行预处理,获取各个文本行连通区域;求取各个文本行的基准线及基准线方程;检测弯曲书面所有基准线中,最长的直线部分;将图像顺时针旋转相应的角度,使图像展平的方向变为水平方向,并得到全新的基准线方程;图像展平。本发明具有速度快,效果好的优点。

Description

一种基于基准线的弯曲书面展平方法
所属技术领域
本发明属于数字图像处理技术领域,涉及一种弯曲书面展平方法。
背景技术
随着现代科技的不断进步和发展,电子产品的大量普及,越来越多的人们选择在电子平台进行阅读和学习。但是大量的文档只有纸质版,这就需要将大量的纸质文档进行电子化。由于数码相机的便携性、方便性,越来越多的人采用数码相机对文档进行图像采集。一些文档由于厚度较大,不能完全的展平,因此采集的图像大多会出现类似于柱面中间凸、两边凹的现象。为了便于阅读和识别,后期处理需要将弯曲书面图像展平。现如今存在的曲面展平技术大多需要曲面多个角度的图像组合一起,求出图像的3D信息,然后进行展平,这种技术图像采集比较麻烦,因此如何更方便、更准确、更简单的进行弯曲书面矫正成为人们追求的目标。
发明内容
本发明的目的是提供一种精度高速度快弯曲书面基准线定位方法,并在此基准线基础上对弯曲书面图像进行展平。本发明的技术方案如下:
一种基于基准线的弯曲书面展平方法,包括下列步骤:
1)采集弯曲书面的曲面图像;
2)对曲面图像进行灰度变换,并进行二值化;
3)根据图像的像素大小和经验值,删除二值图像中面积小于一个标点符号面积的对象,去除噪声的影响,得到经过预处理后的二值图像;
4)设定一个矩形,其长度根据两个字体中心之间的水平距离确定,宽度根据字体高度的1/2确定,利用此矩形对二值图像进行形态学的开闭运算,将每行文本连成同一连通区域。
5)根据文本行的高度预设一个高度阈值,根据文本行的长度预设一个长度阈值;
6)计算出每个连通区域的高度值和宽度值,将高度值大于高度阈值的连通区域去除,消除书面中高度较高的插图的影响;将长度值短于长度阈值的连通区域去除,消除书面中长度较短的文本行的影响;然后删除面积小于一个字体面积的对象,最终得到各个文本行连通区域;
7)分别求6)中得到的各个文本行连通区域的上边界和下边界,然后求出每组上边界和下边界对应 横坐标的中值,对中值采用三阶函数进行曲线拟合,得到弯曲书面的各个文本行的基准线及其对应的方程基准线方程fn(x),x∈(0,len),n∈[1,N],N为基准线数量,len曲面图像的宽度,fn(x)表示基准线的纵坐标值,x表示基准线的横坐标值,下标n表示不同的基准线。
8)采用Hough变换检测一张弯曲书面所有基准线中,最长的直线部分,直线所在方向即为弯曲书面图像展平的方向。
求出Hough变换所得最长直线部分的角度,并将图像顺时针旋转相应的角度,使图像展平的方向变为水平方向,并且7)中得到的基准线方程也要进行相应的变换,得到全新的基准线方程Fn(x);
9)求出每条基准线方程Fn(x)斜率为0时,其横坐标的值x0,并求得其对应纵坐标的值Fn(x0),斜率为0时纵坐标的值,决定着其所在基准线展开后纵坐标的值。
10)曲面中最顶部一条基准线F1(x)上面的区域只有一边存在基准线,对此区域每列像素竖直向下移动F1(x)-Fn(x0)像素距离,将此区域下边的基准线变为水平的;
11)曲面中最顶部一条基准线F1(x)和最底部一条基准线FN(x)中间区域两边都存在基准线,图像展平后两边基准线之间的距离Fn+1(x0)-Fn(x0)与图像展平前两边基准线之间的差值Fn+1(x)-Fn(x 不一定相等,所以对此区域每列像素进行竖直移动加缩放处理,采用双线性内插值算法进行缩放;
12)曲面中最底部一条基准线FN(x)下面的区域只有一边存在基准线,对此区域每列像素竖直向下移动FN(x)-Fn(x0)像素距离,将此区域上边的基准线变为水平的。
本发明采用矩形结构对图像进行形态学的开闭运算,求出的文本行连通区域上下边界能够跟文本行的上下边界紧密贴合,使其连通区域不受字体内部比重的影响,求出的中线具有更高的精度。本方法只采用几种形态学的开闭运算和三阶曲线拟合运算来定位基准线,运算简单,具有更高的速度,用此类基准线进行曲面书面展开后的图像具有更平的效果。基于基准线的弯曲书面展平只需单幅图像,不需要弯曲书面进行多次图像采集,展开过程简单、方便。
附图说明
图1初始图像
图2形态学开闭运算后的模糊图像
图3只含有较长文本行部分的模糊图像
图4中线定位结果的局部放大图像(文本行中白色线条表示中线)
图5基准线定位结果(文本行中黑色线条表示基准线)
图6基准线定位结果的局部放大图像(文本行中黑色线条表示基准线)
图7基准线图(粗白线部分为检测出的最长直线)
图8每条基准线斜率为0时的位置(基准线中o点的位置)
图9顶部区域展平
图10中部区域展平
图11底部区域展平
图12前后部分区域对比图,(a)、(c)、(e)为展平前的部分区域,(b)、(d)、(f)为对应的展平后区域。
图13基于基准线的弯曲书面展平流程图
具体实施方式
下面结合附图和实施例对本发明进行说明。
本发明将弯曲书面上每个字体的边界框都看作平行四边形,上边框和下边框是平行的,不论书面发生放大、缩小或者弯曲,上下边框的中线都可以看作是文本行的中线,因此采用文本行中线来定位基准线。定位出的基准线将弯曲书面分成几部分区域,然后对弯曲书面进行分区域展平,最终实现基于单个图像的弯曲书面展平,并且具有较好的展平效果。具体包括下列步骤:
1)采集弯曲书面的曲面图像,如图1所示。
2)对曲面图像进行灰度变换,并进行二值化。然后根据图像的像素大小和经验值,删除二值图像中面积小于一个标点符号面积的对象,去除噪声的影响,得到经过预处理后的二值图像。
3)设定一个矩形,其长度根据两个字体中心之间的水平距离确定,宽度根据字体高度的1/2确定,利用此矩形对图像进行形态学的开闭运算,将每行文本连成同一连通区域,如图2所示。
4)根据文本行的高度预设一个高度阈值,大小约为文本行高度的三倍;根据文本行的长度预设一个长度阈值,大小约为文本行最大长度的3/4;
5)计算出每个连通区域的高度值和宽度值,将高度值大于高度阈值的连通区域去除,消除书面中高度较高的插图的影响;将长度值短于长度阈值的连通区域去除,消除书面中长度较短的文本行的影响;然后删除面积小于一个字体面积的对象,最终得到剩下的文本行连通区域。如图3所示。
6)分别求5)中得到的各个文本行连通区域的上边界和下边界,然后求出每组上边界和下边界对应横坐标的中值,如图4所示。对中值采用三阶函数进行曲线拟合,得到弯曲书面的各个文本行的基准线及其对应的方程基准线方程fn(x)=anx3+bnx2+cnx+dn,x∈*(0,len),n∈[1,N],N为基准线数量,len曲面图像的宽度,fn(x)表示基准线的纵坐标值,x表示基准线的横坐标值,an,bn,cn,dx为常数,下标n表示不同的基准线。基准线如图5所示。
7)采用Hough变换检测一张弯曲书面所有基准线中,最长的直线部分,直线所在方向即为弯曲书面图像展平的方向。如图7所示。
8)求出Hough变换所得最长直线部分的角度,并将图像顺时针旋转相应的角度,使图像展平的方向变为水平方向,并且6)中得到的基准线方程也要进行相应的变换,得到全新的基准线方程
Fn(x)=Anx3+Bnx2+cnx。
9)求出每条基准线方程Fn(x)斜率为0时,其横坐标(列数)的值x0,然后代入8)中得到的基准线方程Fn(x)中,求出其对应纵坐标(行数)的值Fn(x0)。斜率为0时纵坐标的值,决定着其所在基准线展开后纵坐标(列数)的值。如图8所示。
10)曲面中最顶部一条基准线F1(x)上面的区域只有一边存在基准线,对此区域每列像素竖直向下移动F1(x)-Fn(x0)像素距离,将此区域下边的基准线变为水平的。如图9所示。
11)曲面中最顶部一条基准线F1(x)和最底部一条基准线FN(x)中间区域两边都存在基准线,图像展平后两边基准线之间的距离Fn+1(x0)-Fn(x0)与图像展平前两边基准线之间的差值Fn+1(x)-Fn(x)不一定相等,所以对此区域每列像素进行竖直移动加缩放处理,采用双线性内插值算法进行缩放。如图10。
12)曲面中最底部一条基准线FN(x)下面的区域只有一边存在基准线,对此区域每列像素竖直向下移动FN(x)-FN(x0)像素距离,将此区域上边的基准线变为水平的。如图11所示。图12为展平后的效果图。
本发明中线的定位只需要求出每个文本行连通区域的上下边界,再求出上下边界的中线即可,计算量小,同时利于硬件实现,具有实际应用的价值。
本发明采用的文本行基准线定位算法,不仅定位精度高,而且计算量小,速度快。通过限制连通区域的高度值和宽度值来提取文本行区域,只保留高度小于3倍文本行高度值的连通区域和宽度值大于文本行最大长度3/4的连通区域,消除插图以及较短文本行的影响,实验结果如图3所示,具有较好的提取结果。
本发明基于文本行中线确定的N条基准线,把弯曲书面图像由上到下分为N+1个区域,顶部区域和底部区域只有一边存在基准线,所以根据顶部和底部基准线方程分别求基准线变为直线后基准线上每点需要移动的距离(即为顶部和底部区域展平每列需要移动的距离)。中间区域展平时,两边都有基准线,需要求两边基准线方程横坐标相同时纵坐标的差值和展平后两边基准线纵坐标的差值,然后根据展平前后基准线差值的比值确定图像展平过程中的缩放比例,最终采用双线性内插值算法确定展平后每个像素点的值。

Claims (1)

1.一种基于基准线的弯曲书面展平方法,包括下列步骤:
1)采集弯曲书面的曲面图像;
2)对曲面图像进行灰度变换,并进行二值化;
3)根据图像的像素大小和经验值,删除二值图像中面积小于一个标点符号面积的对象,去除噪声的影响,得到经过预处理后的二值图像;
4)设定一个矩形,其长度根据两个字体中心之间的水平距离确定,宽度根据字体高度的1/2确定,利用此矩形对二值图像进行形态学的开闭运算,将每行文本连成同一连通区域;
5)根据文本行的高度预设一个高度阈值,根据文本行的长度预设一个长度阈值;
6)计算出每个连通区域的高度值和宽度值,将高度值大于高度阈值的连通区域去除,消除书面中高度较高的插图的影响;将长度值短于长度阈值的连通区域去除,消除书面中长度较短的文本行的影响;然后删除面积小于一个字体面积的对象,最终得到各个文本行连通区域;
7)分别求6)中得到的各个文本行连通区域的上边界和下边界,然后求出每组上边界和下边界对应横坐标的中值,对中值采用三阶函数进行曲线拟合,得到弯曲书面的各个文本行的基准线及其对应的方程基准线方程fn(x),x∈(0,len),n∈[1,N],N为基准线数量,len曲面图像的宽度,fn(x)表示基准线的纵坐标值,x表示基准线的横坐标值,下标n表示不同的基准线;
8)采用Hough变换检测一张弯曲书面所有基准线中,最长的直线部分,直线所在方向即为弯曲书面图像展平的方向;
9)求出Hough变换所得最长直线部分的角度,并将图像顺时针旋转相应的角度,使图像展平的方向变为水平方向,并且7)中得到的基准线方程也要进行相应的变换,得到全新的基准线方程Fn(x);
10)求出每条基准线方程Fn(x)斜率为0时,其横坐标的值x0,并求得其对应纵坐标的值Fn(x0),斜率为0时纵坐标的值,决定着其所在基准线展开后纵坐标的值;
11)曲面中最顶部一条基准线F1(x)上面的区域只有一边存在基准线,对此区域每列像素竖直向下移动F1(x)-Fn(x0)像素距离,将此区域下边的基准线变为水平的;
12)曲面中最顶部一条基准线F1(x)和最底部一条基准线FN(x)中间区域两边都存在基准线,图像展平后两边基准线之间的距离Fn+1(x0)-Fn(x0)与图像展平前两边基准线之间的差值Fn+1(x)-Fn(x)不一定相等,所以对此区域每列像素进行竖直移动加缩放处理,采用双线性内插值算法进行缩放;
13)曲面中最底部一条基准线FN(x)下面的区域只有一边存在基准线,对此区域每列像素竖直向下移动FN(x)-FN(x0)像素距离,将此区域上边的基准线变为水平的。
CN201510200460.3A 2015-04-23 2015-04-23 一种基于基准线的弯曲书面展平方法 Expired - Fee Related CN104835120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510200460.3A CN104835120B (zh) 2015-04-23 2015-04-23 一种基于基准线的弯曲书面展平方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510200460.3A CN104835120B (zh) 2015-04-23 2015-04-23 一种基于基准线的弯曲书面展平方法

Publications (2)

Publication Number Publication Date
CN104835120A CN104835120A (zh) 2015-08-12
CN104835120B true CN104835120B (zh) 2017-07-28

Family

ID=53812990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510200460.3A Expired - Fee Related CN104835120B (zh) 2015-04-23 2015-04-23 一种基于基准线的弯曲书面展平方法

Country Status (1)

Country Link
CN (1) CN104835120B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096490B (zh) * 2016-02-02 2021-05-14 天津大学 一种带有文本行的柱面图像的定位方法
CN106951855B (zh) * 2017-03-16 2020-04-10 深圳市六六六国际旅行社有限公司 一种图片中文档定位和裁切方法
CN108573473A (zh) * 2018-04-27 2018-09-25 平安科技(深圳)有限公司 图片旋转方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和系统
CN102084378A (zh) * 2008-05-06 2011-06-01 计算机连接管理中心公司 基于照相机的文档成像

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4219542B2 (ja) * 2000-09-07 2009-02-04 富士ゼロックス株式会社 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
CN102084378A (zh) * 2008-05-06 2011-06-01 计算机连接管理中心公司 基于照相机的文档成像
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"文档图像几何畸变快速校正的新方法";宋丽丽等;《计算机应用》;20101231;第30卷(第12期);第3318-3324页 *

Also Published As

Publication number Publication date
CN104835120A (zh) 2015-08-12

Similar Documents

Publication Publication Date Title
CN104809436B (zh) 一种弯曲书面文字识别方法
CN105450900B (zh) 用于文档图像的畸变校正方法和设备
CN102790841B (zh) 书籍的书脊区域中数字图像的检测和校正方法
CN103500435B (zh) 一种边缘导向的自适应图像插值方法及其vlsi实现装置
JP4955096B2 (ja) 検出装置、検出方法、検出プログラム、および記録媒体
CN104835120B (zh) 一种基于基准线的弯曲书面展平方法
US8509536B2 (en) Character recognition device and method and computer-readable medium controlling the same
US20170076169A1 (en) System and Method for Scanned Document Correction
CN101697228A (zh) 一种文本图像处理方法
CN106485182B (zh) 一种基于仿射变换的模糊qr码复原方法
JP5055449B2 (ja) ページ境界を検出する方法及び装置
CN105225218B (zh) 用于文档图像的畸变校正方法和设备
CN103413271B (zh) 基于局部信息的文档图像校正方法
JP2012521708A (ja) 色周波数に基づく顕著性マップを用いて画像を修正する方法及び装置
CN105488512B (zh) 基于Sift特征匹配和形状上下文的试卷阅卷方法
He et al. A book dewarping system by boundary-based 3D surface reconstruction
CN101976336A (zh) 一种基于模糊增强和曲面拟合的图像边缘特征提取方法
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
CN102231203A (zh) 基于边缘检测的图像自回归插值方法
US8855419B2 (en) Image rectification using an orientation vector field
US20140140627A1 (en) Image rectification using sparsely-distributed local features
CN108335266A (zh) 一种文档图像畸变的矫正方法
CN111241862B (zh) 基于边缘特性的条形码定位方法
CN104835119A (zh) 一种定位弯曲书面基准线的方法
JP2018010359A (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170728

CF01 Termination of patent right due to non-payment of annual fee