CN102073997B - 小型文档图像透视复原方法 - Google Patents

小型文档图像透视复原方法 Download PDF

Info

Publication number
CN102073997B
CN102073997B CN2011100058757A CN201110005875A CN102073997B CN 102073997 B CN102073997 B CN 102073997B CN 2011100058757 A CN2011100058757 A CN 2011100058757A CN 201110005875 A CN201110005875 A CN 201110005875A CN 102073997 B CN102073997 B CN 102073997B
Authority
CN
China
Prior art keywords
image
correcting
perspective
small
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011100058757A
Other languages
English (en)
Other versions
CN102073997A (zh
Inventor
陆玲
蒋年德
李丽华
王蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Institute of Technology
Original Assignee
East China Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Institute of Technology filed Critical East China Institute of Technology
Priority to CN2011100058757A priority Critical patent/CN102073997B/zh
Publication of CN102073997A publication Critical patent/CN102073997A/zh
Application granted granted Critical
Publication of CN102073997B publication Critical patent/CN102073997B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

本发明公开了一种小型文档图像透视复原方法,给定文档透视图像的四个角点坐标,对所述四个角点坐标进行纠正;计算纠正后文档图像中的各像素的颜色值;对于纠正后的图像中存在的空穴,采用邻近取值法进行填充颜色。本发明技术方案特别适用于小型文档或文档离相机有一定距离的透视变形的纠正。

Description

小型文档图像透视复原方法
技术领域
本发明涉及一种图像处理技术,具体说,涉及一种小型文档图像透视复原方法。
背景技术
数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。
一般来讲,对图像进行处理(或加工、分析)的主要目的有三个方面:
(1)提高图像的视感质量。如进行图像的亮度、彩色变换,增强、抑制某些成分,对图像进行几何变换等,以改善图像的质量。
(2)提取图像中所包含的某些特征或特殊信息,这些被提取的特征或信息往往为计算机分析图像提供便利。提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面,如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征和关系结构等。
(3)图像数据的变换、编码和压缩,以便于图像的存储和传输。
不管是何种目的图像处理,都需要由计算机和图像专用设备组成的图像处理系统对图像数据进行输入、加工和输出。
图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或重建原来的图像。
数字图像在获取过程中,由于成像面与文挡面不平行,成像后的图像与原小型文档表面图像相比,会产生透视变形,远一些的文字会变得较小,而且直线的平行关系也发生变化,原本平行的文字行出现一定的夹角这些现象,会对后续的版面分析、字符分割、文字识别等工作产生很大的困难,甚至会导致错分、错识的现象发生。
发明内容
本发明所解决的技术问题是提供一种小型文档图像透视复原方法,特别适用于小型文档或文档离相机有一定距离的透视变形纠正。
技术方案如下:
一种小型文档图像透视复原方法,包括:
给定文档透视图像的四个角点坐标,对所述四个角点坐标进行纠正;
计算纠正后文档图像中的各像素的颜色值;
对于纠正后的图像中存在的空穴,采用邻近取值法进行填充颜色;
角点坐标的关系中X与Y呈线性关系,且X=Y,利用公式C’F=X*1.2AG*S1/6/(AD-X)+60X2/(AD*(AD-X))对所述角点坐标进行纠正,其中,X是纠正后图像垂直高度减去纠正前图像垂直高度;C’F是纠正后图像水平宽度减去纠正前图像水平宽度;AG是纠正前图像水平宽度;AD是纠正后图像的高度;S=atan(X/AG);Y=(C’F-60X2/(AD*(AD-X)))*(AD-X)/(1.2AG*S1/6)。
进一步:纠正四个角点时,设定纠正前的矩形四个角点坐标为左下(x’A,y’A)、右下(x’B,y’B)、右上(x’C,y’C)、左上(x’D,y’D),则纠正后的四个角为左下(xA,yA)、右下(xB,yB)、右上(xC,yC)、左上(xD,yD),其中,xA=x’A,、yA=y’A、yC=y’D、xA=xD,、yA=yB、yC=yD;则纠正后的四个角点坐标为左下(x’A,y’A)、右下(xB,y’A)、右上(xB,y’D)、左上(x’A,y’D),其中,xB=x’B+1.2|atan((y’C-y’D-y’A+y’B)/(x’B-x’A))|1/6(x’B-x’A)(y’C-y’D-y’A+y’B)/(2y’A-y’C-y’B)+60(y’C-y’D-y’A+y’B)2/((y’A-y’D)(2y’A-y’C-y’B))。
进一步:填充颜色时,将所述空穴采用其相邻域的颜色进行填充。
技术效果包括:
1、本发明适用于文档的一条边垂直或水平。
2、本发明的特别适用于小型文档或文档离相机有一定距离的透视变形纠正。
3、本发明的特别适用于旋转角度小于45度的透视变形纠正。
附图说明
图1是本发明中单位立方体的一点透视和二点透视示意图;
图2是本发明中小型文挡边框一点透视图;
图3是本发明中不同相机位置、文档绕y轴旋转从0到60度的不同透视图;
图4是本发明中透视图与原图的几何关系示意图;
图5是本发明中透视图与原图的几何关系示意图;
图6是本发明中绕Y旋转10度、不同宽度矩形透视还原误差示意图;
图7是本发明中绕Y旋转20度、不同宽度矩形透视还原误差示意图;
图8是本发明中绕Y旋转30度、不同宽度矩形透视还原误差示意图;
图9是本发明中绕Y旋转40度、不同宽度矩形透视还原误差示意图;
图10是本发明中绕Y旋转20度、不同高度矩形透视还原误差示意图。
具体实施方式
常规的小型文档图像处理前,利用本发明能够实现对透视变形的纠正。下面参考附图和优选实施例对本发明技术方案作详细描述。
1、将计算机图形学中的透视公式应用于图像处理。
透视投影按照主灭点的个数分为一点透视、二点透视和三点透视。
如图1所示,是本发明中单位立方体的一点透视和二点透视示意图。任何一束不平行于投影平面的平行线的透视投影将汇聚成一点,称之为灭点,在坐标轴上的灭点称为主灭点。主灭点数是和投影平面切割坐标轴的数量相对应的。如投影平面仅切割z轴,则z轴是投影平面的法线,因而只在z轴上有一个主灭点,而平行于x轴或y轴的直线也平行于投影平面,因而没有灭点。
设投影平面为z=0平面,透视投影的视点(投影中心)为V(0,0,h)其中h为投影中心到投影面的距离,形体上点P(x,y,z)的投影为(x′,y′),当投影面不变,物体绕y轴旋转
Figure GDA00001961140900041
角,再绕x轴旋转θ度,进行平移变换(dx,dy),最后对三维形体作透视投影变换。以上变换用齐次坐标及变换矩阵表示如下:
1 0 0 0 0 1 0 0 0 0 0 0 d x d y d z 1 1 0 0 0 0 1 0 0 0 0 0 - 1 / h 0 0 0 1
所以三点透视投影的变换式为:
Figure GDA00001961140900045
Figure GDA00001961140900046
上式中(各参数前面已说明),当θ=0或
Figure GDA00001961140900047
为两点透视图,当θ=0和
Figure GDA00001961140900048
为一点透视图。
对于两点透视的文挡图像,因不考虑厚度方向(也即Z方向),则两点透视投影中有一个主灭点。可将θ=0或代入式(1)。
式(1)说明对于有一定旋转角度的文档,经像机拍摄后(透视投影)原平面坐标(x,y)会变形为(x’,y’)。如果对于一幅文档图像中某一点(x’,y’),已知像机的焦距(h)、文档离像机的距离(-z),文档的旋转角度θ或则可通过式(1)反算出原文档的坐标(x,y),但一般情况旋转角度是未知的,z也较难求准确,因此,必须采用其它方法进行纠正。
2、分析小型文挡图像透视变形的几何特征。
分析透视变形不难发现当小型文挡图像的一条边(如垂直边)与数码相机成像平面平行时,会产生一个主灭点。
如图2所示,是本发明中小型文挡边框一点透视图。图中显示文挡平面不平行相机平面的几种情况,这几种情况从左到右分别是:原始图像、视点在左下角的垂直于投影面的轴上、视点在左下角的下方垂直于投影面的轴上、视点在左边界中心的垂直于投影面的轴上。
从图2中可以看出,同一个原始图像因不同的视点位置(相机位置)可产生不同的透视图。要将透视图复原为原图,需分析透视图的几何特征。
如图3所示,是本发明中不同相机位置、文档绕y轴旋转从0到60度的不同透视图。根据小型文挡绕y轴旋转不同角度的透视图(通过式(1)计算)分析,可以看出:
(1)文档绕y轴转的角度越大,文档变形越大。
(2)文档在水平与垂直方向远离视点的位置,其变形也大。
(3)文档在z方向上离相机较远时,文档变形较小。
如图4所示,是本发明中透视图与原图的几何关系示意图。设文档原始四个角编号为A、B、C、D,透视后的四个角为A’、B’、C’、D’。当将透视后的图还原到原图时,需将B’还原到B,C’还原到C,同时将文档内的每一个像素都还原到相应位置。
一般已知是透视后的文档图像,而原文档图是未知的。只要找出C’E、BG与C’F之间的关系,就可求出C’F,得到原图的宽度(或高度),另一个高度(或宽度)因与相机平面平行,可直接从图像中获取。
3、通过大量试验求出透视变形的纠正公式。
如图5所示,是本发明中透视图与原图的几何关系示意图。图中显示了不同相机位置、不同大小文档、不同旋转角度的C’E、B’G与C’F之间的关系(通过多次实验获取得到)。
图5中的横坐标是X=C’E-B’G,对于图3中的第四种情况X=C’E+B’G。当B’G在矩形外时取负,当B’G在矩形之内时取正。
纵坐标是Y=(C’F-60X2/(AD*(AD-X)))*(AD-X)/(1.2AG*S1/6)
式中:S=atan(X/AG)
可见X与Y近似一个线性关系,且X=Y,
则C’F=X*1.2AG*S1/6/(AD-X)+60X2/(AD*(AD-X))(2)
其中,X是纠正后图像垂直高度减去纠正前图像垂直高度;C’F是纠正后图像水平宽度减去纠正前图像水平宽度;AG是纠正前图像水平宽度;AD是纠正后图像的高度。
这是本发明的一个纠正公式。
4、纠正公式的误差分析。
下面参考图6至图10,利用纠正公式对式(1)理论计算出的透视图进行还原,并对误差作详细分析。
如图6所示,是本发明中绕Y旋转10度、不同宽度矩形透视还原误差示意图。其中,横坐标代表矩形宽度,一个单位为100像素;纵坐标代表绝对误差,一个单位是50像素。曲线从上到下分别是同一个矩形离视点(或相机)从近到远。
如图7至10所示,从图中可以看出,当文档小时纠正误差小(横坐标值小的区域);当文档离相机远时纠正误差小(离横坐标近的曲线);当旋转角度小(图7、8、10)时纠正误差小。
根据技术方案分析的结果,可以用原始图像坐标与透视图像坐标之间的关系进行纠正。因此消除变形恢复原图像的问题就转化为从变形图像和原始图像两坐标之间关系求得无失真的图像问题。下面对具体实施方式作详细描述。
步骤1:给定文档透视图像的四个角点坐标。
进行图像校正前,先给定图像中小型文档的四个角点坐标:左下(x’A,y’A)、右下(x’B,y’B)、右上(x’C,y’C)、左上(x’D,y’D),设坐标原点在图像的左上角,文档的左右边界是垂直的:x’A=x’D、x’B=x’C。则四个角点的坐标为:左下(x’A,y’A)、右下(x’B,y’B)、右上(x’B,y’C)、左上(x’A,y’D)。
步骤2:纠正四个角点。
设纠正前的矩形四个角点坐标为左下(xA,yA)、右下(xB,yB)、右上(xC,yC)、左上(xD,yD),
这里:xA=x’A,、yA=y’A、yC=y’D、xA=xD,、yA=yB、yC=yD
则纠正后的矩形四个角点坐标为左下(x’A,y’A)、右下(xB,y’A)、右上(xB,y’D)、左上(x’A,y’D),只有一个未知量xB.。
根据式(2),得:
xB=x’B+1.2|atan((y’C-y’D-y’A+y’B)/(x’B-x’A))|1/6(x’B-x’A)(y’C-y’D-y’A+y’B)/(2y’A-y’C-y’B)+60(y’C-y’D-y’A+y’B)2/((y’A-y’D)(2y’A-y’C-y’B))。
步骤3:计算纠正后文档图像中的各像素的颜色值。
设纠正前文档图像中文档中坐标为(x’,y’)时,纠正后该坐标变换到(x,y)处。具体过程如下:
(1)循环水平坐标x’从x’A到x’B变化;
(2)对于给定的x’值以及四个纠正前角点坐标,利用线性插值求出对应变形后的y1(相当于图5中的B’的y值)与y2(相当于图5中的C’的y值);
y1=(x-x’A)/(x’A-x’B)(y’A-y’B)+y’A
y2=(x-xD)/(x’D-x’C)(y’D-y’C)+y’D
(3)计算x’的复原值x;
x=x’+1.2|atan((y2-y’D-y’A+y1)/(x’B-x’A))|1/6(x’B-x’A)(y2-y’D-y’A+y1)/(2y’A-y2-y1)+60(y2-y’D-y’A+y1)2/((y’A-y’D)(2y’A-y2-y1))
(4)循环垂直坐标y’从y2到y1变化;
(5)根据y’值,线性插值求出纠正后的y,
y=y’(y’A-y’D)/(y1-y2)+y’D-y2(y’A-y’D)/(y1-y2);
(6)将(x,y)处颜色设置为(x’,y’)处的颜色,直到图像中全部像素纠正完毕为止。
步骤4:填充空穴。
对于纠正后的图像还存在空穴(未置任何颜色),采用邻近取值法进行填充。具体方法为当计算出(x,y)处颜色后,按八邻域方式将其周围相邻的8个坐标点全部置与(x,y)处相同的颜色。

Claims (3)

1.一种小型文档图像透视复原方法,包括:
给定文档透视图像的四个角点坐标,对所述四个角点坐标进行纠正;
计算纠正后文档图像中的各像素的颜色值;
对于纠正后的图像中存在的空穴,采用邻近取值法进行填充颜色;
角点坐标的关系中X与Y呈线性关系,且X=Y,利用公式C’F=X*1.2AG*S1/6/(AD-X)+60X2/(AD*(AD-X))对所述角点坐标进行纠正,其中,X是纠正后图像垂直高度减去纠正前图像垂直高度;C’F是纠正后图像水平宽度减去纠正前图像水平宽度;AG是纠正前图像水平宽度;AD是纠正后图像的高度;S=atan(X/AG);Y=(C’F-60X2/(AD*(AD-X)))*(AD-X)/(1.2AG*S1/6)。
2.如权利要求1所述的小型文档图像透视复原方法,其特征在于:纠正四个角点时,设定纠正前的矩形四个角点坐标为左下(x’A,y’A)、右下(x’B,y’B)、右上(x’C,y’C)、左上(x’D,y’D),则纠正后的四个角为左下(xA,yA)、右下(xB,yB)、右上(xC,yC)、左上(xD,yD),其中,xA=x’A,、yA=y’A、yC=y’D、xA=xD,、yA=yB、yC=yD;则纠正后的四个角点坐标为左下(x’A,y’A)、右下(xB,y’A)、右上(xB,y’D)、左上(x’A,y’D),其中,xB=x’B+1.2|atan((y’C-y’D-y’A+y’B)/(x’B-x’A))|1/6(x’B-x’A)(y’C-y’D-y’A+y’B)/(2y’A-y’C-y’B)+60(y’C-y’D-y’A+y’B)2/((y’A-y’D)(2y’A-y’C-y’B))。
3.如权利要求1所述的小型文档图像透视复原方法,其特征在于:填充颜色时,将所述空穴采用其相邻域的颜色进行填充。
CN2011100058757A 2011-01-12 2011-01-12 小型文档图像透视复原方法 Expired - Fee Related CN102073997B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100058757A CN102073997B (zh) 2011-01-12 2011-01-12 小型文档图像透视复原方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100058757A CN102073997B (zh) 2011-01-12 2011-01-12 小型文档图像透视复原方法

Publications (2)

Publication Number Publication Date
CN102073997A CN102073997A (zh) 2011-05-25
CN102073997B true CN102073997B (zh) 2012-11-07

Family

ID=44032527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100058757A Expired - Fee Related CN102073997B (zh) 2011-01-12 2011-01-12 小型文档图像透视复原方法

Country Status (1)

Country Link
CN (1) CN102073997B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103208119B (zh) * 2013-03-27 2015-07-22 广东欧珀移动通信有限公司 一种校正手持设备拍摄的透视图像的方法
CN106372382B (zh) * 2016-08-19 2019-03-29 中国石油集团东方地球物理勘探有限责任公司 一种基于膨胀算法的岩性插值方法
CN108320270B (zh) * 2018-01-26 2023-12-29 腾讯科技(深圳)有限公司 一种图像校正方法、装置和存储介质
CN110070771A (zh) * 2019-04-22 2019-07-30 安徽人民出版社 一种作文批阅的方法
CN114359114B (zh) * 2022-03-16 2022-08-23 宁波杜比医疗科技有限公司 一种单核病灶色相还原方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1607824A (zh) * 2003-10-14 2005-04-20 卡西欧计算机株式会社 图像处理系统及图像处理方法和电子相机及图像处理装置
CN1937698A (zh) * 2006-10-19 2007-03-28 上海交通大学 图像畸变自动校正的图像处理方法
CN101267493A (zh) * 2007-03-16 2008-09-17 富士通株式会社 透视变形文档图像的校正装置和校正方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4363151B2 (ja) * 2003-10-14 2009-11-11 カシオ計算機株式会社 撮影装置、その画像処理方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1607824A (zh) * 2003-10-14 2005-04-20 卡西欧计算机株式会社 图像处理系统及图像处理方法和电子相机及图像处理装置
CN1937698A (zh) * 2006-10-19 2007-03-28 上海交通大学 图像畸变自动校正的图像处理方法
CN101267493A (zh) * 2007-03-16 2008-09-17 富士通株式会社 透视变形文档图像的校正装置和校正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马懿超等.一种集成的小型文档图像透视变形校正方法.《模式识别与人工智能》.2006,第19卷(第4期),P503-P508. *

Also Published As

Publication number Publication date
CN102073997A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102790841B (zh) 书籍的书脊区域中数字图像的检测和校正方法
CN104376548B (zh) 一种基于改进型surf算法的图像快速拼接方法
US8401333B2 (en) Image processing method and apparatus for multi-resolution feature based image registration
CN102006425B (zh) 一种基于多摄像机的视频实时拼接方法
US8774558B2 (en) Rectification of characters and text as transform invariant low-rank textures
US9652849B2 (en) Techniques for rapid stereo reconstruction from images
EP2536122B1 (en) Image processing method, image processing device and scanner
CN102073997B (zh) 小型文档图像透视复原方法
CN109583365B (zh) 基于成像模型约束非均匀b样条曲线拟合车道线检测方法
CN103700082B (zh) 基于对偶四元数相对定向的图像拼接方法
CN109859137B (zh) 一种广角相机非规则畸变全域校正方法
CN110415304B (zh) 一种视觉标定方法及系统
CN112991420A (zh) 一种视差图的立体匹配特征提取及后处理方法
Ma et al. Learning from documents in the wild to improve document unwarping
CN103761765A (zh) 基于映射边界优化的三维物体模型纹理映射算法
CN106407973B (zh) 标在柱面上的ar码的鲁棒识别方法
CN101901472A (zh) 一种基于矩阵秩最小化的非刚性鲁棒批量图像对齐方法
CN111242855A (zh) 基于rgb-d的ssim结构相似度的迭代深度图结构修复方法
CN105761236A (zh) 一种用于图像配准的图像预处理方法及装置
CN111899295A (zh) 一种基于深度学习的单目场景深度预测方法
CN103514587B (zh) 基于海天分界线检测的舰载稳像方法
CN104822030A (zh) 一种基于图像变形的不规则视频矩形化矫正方法
CN108648205A (zh) 一种亚像素边缘检测方法
CN110223356A (zh) 一种基于能量生长的单目相机全自动标定方法
CN111126418A (zh) 一种基于平面透视投影的倾斜影像匹配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121107

Termination date: 20170112

CF01 Termination of patent right due to non-payment of annual fee