CN102254171A - 一种基于文本边界的中文文档图像畸变校正方法 - Google Patents

一种基于文本边界的中文文档图像畸变校正方法 Download PDF

Info

Publication number
CN102254171A
CN102254171A CN2011101963991A CN201110196399A CN102254171A CN 102254171 A CN102254171 A CN 102254171A CN 2011101963991 A CN2011101963991 A CN 2011101963991A CN 201110196399 A CN201110196399 A CN 201110196399A CN 102254171 A CN102254171 A CN 102254171A
Authority
CN
China
Prior art keywords
text
boundary line
file
picture
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101963991A
Other languages
English (en)
Inventor
刘宏
丁润伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN2011101963991A priority Critical patent/CN102254171A/zh
Publication of CN102254171A publication Critical patent/CN102254171A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种基于文本边界的中文文档图像畸变校正方法,包括1)对扫描获取的文档图像进行预处理,去除页面边界及边界以外区域的干扰;2)判断文档图像的畸变方向,确定畸变区域;3)对文档图像进行二值化;4)提取经二值化的文档图像的上下文本边界线;5)根据上下文本边界线,采用线性插值方法对文档图像中畸变区域进行变换,得到校正的图像;本发明解决了扫描获取的中文文档图像的畸变校正问题,根据中文特征提取文本边界线进行校正的方法,降低了计算复杂度的同时,有效解决了复杂结构文档图像的校正。同时本方法与采集设备无关,不依赖于设备参数,具有广泛的应用价值。

Description

一种基于文本边界的中文文档图像畸变校正方法
技术领域
本发明属于文档图像处理技术,尤其涉及基于文本边界的文档图像畸变校正方法,具体涉及到了经扫描获取的中文文档图像的线性畸变和非线性畸变的校正方法。
背景技术
随着信息技术的发展和办公自动化的普及,越来越多的文档需要转成电子形式,扫描是一种基本的方式。在这个过程中,由于装订的影响,难以避免地会造成图像存在一定程度上的畸变,这种畸变往往是线性畸变和非线性畸变的叠加。加之,现在的文档经常是包含大量表格、图像等非文本内容的复杂结构文档,使得文档图像的畸变校正变得十分困难。
现有的文档图像畸变校正方法主要分为两类,一类是依赖于3D的扫描设备,通过三维扫描仪获取的图像带有深度信息,可以建立原始文本的畸变模型,通过几何变换来校正图像。由于三维扫描仪价格昂贵,目前还没有被广泛使用,限制了此类方法的应用。另外一类是基于文本的方法,单纯从扫描获取的2D图像获取信息进行畸变校正。这类方法通常是针对特定文字设计的,如英文等。校正过程大致分为两步,首先得到各个字母的重心,然后同一单词的各个字母的重心相连得到中心线。然后,校正的过程就是改变各个字母的位置使得同一单词的字母重心处于同一水平线上。由于中文是由字而非单词组成,每个字由交错的笔画组成而非孤立的字母组成;另外,由于很多中文字由左右或上下两个不相连的部分组成,不同于英文字母,主体部分都是连通的,可以找到每个字母的重心,并且根据字母之间的距离可以准确划分出单词。对于中文来讲,并不能通过连通性来获得单个字的重心。因此,这类方法对中文文档图像的校正得不到较好的效果,甚至失效。在这种背景下,为适应现代化文档图像处理系统的需要,研究和开发适合中文复杂结构文档图像特点的畸变校正方法就成了一项意义重大并富有挑战性的工作。
发明内容
针对现有技术存在的缺点以及中文文档的特点,我们提出了一种基于文本边界线的中文文档图像畸变校正方法,克服了现有技术中的缺点,不依赖于三维的扫描设备且能处理复杂结构文档图像,并取得了良好的效果。
我们首先对文档图像进行预处理,然后提取文档图像的上下两条文本边界线,最后根据提取的文本边界线进行畸变的校正。具体步骤包括:
1.对扫描获取的文档图像进行预处理,去除页面边界及边界以外区域(即当被扫描文档小于扫描仪器平面时,获取的非文档之外的信息)的干扰,即删除非文档之外的信息。
2.判断图像的畸变方向,确定畸变区域。
3.对文档图像进行二值化。
4.提取二值化后的文档图像的上下文本边界线。
5.根据上下文本边界线,采用线性插值方法对文档图像中畸变区域进行变换,得到校正的图像。
所述判断图像畸变方向的方法为:
A、对文档图像中灰度值小于阈值T1的像素点p(i,j)进行垂直方向的统计:
V ( i ) = Σ j = 0 j = Length v ( i , j ) , 其中,
Figure BDA0000075560780000022
v(i,j)为像素点p(i,j)的灰度值,i,j分别为横纵坐标,Length为图像的高度,V(i)为第i列像素的灰度值之和。
B、根据V(i)判断畸变方向,V(i)最大值所在的一侧即为发生畸变的一侧。
所述对文档图像进行二值化的方法为:
A、计算出每个像素点p(i,j)的N*N邻域窗口的局部阈值T(i,j):
T ( i , j ) = m ( i , j ) · [ 1 + k ( 1 - s ( i , j ) R ) ]
其中,m(i,j)和s(i,j)分别是像素点p(i,j)的N*N邻域窗口的灰度均值和方差,i,j分别为横纵坐标,N,K,R是常数,根据具体的应用环境来调整取值。
B、设定每个像素点p(i,j),其灰度值 v ( i , j ) = 1 v ( i , j ) &GreaterEqual; T ( i , j ) 0 v ( i , j ) < T ( i , j ) , 从而得到二值化后的文本图像。
所述文本边界线的提取方法为:
A、对二值化后的文档图像进行水平方向的膨胀,使得同一行中的内容产生粘连,形成一个连通区域,所述连通区域为文档图像的主文本区域;
B、对主文本区域中首行的上边界线和最后一行的下边界线采用线段拟合方法,获得文本上下边界线;
C、对文本上下边界线进行平滑修正,得到修正后的文本上下边界线。
所述线段拟合方法为:
A、采用长度为L=K*h的水平线段初始描述边界线,其中,h为文本行的高度,K为系数,
B、连接各线段中点,连接线构成文本上下边界线:
当线段li与其左右线段li-1和li+1的高度存在如下关系:H(li-1)≤H(li)≤H(li+1)或者H(li-1)≥H(li)≥H(li+1)时,连接li、li-1和li+1的中点;
当li与其左右线段li-1和li+1的高度不符合所述关系时,采用下述公式调整线段li的高度,获得调整后的线段li
H(li)=H(li-1)+D/2,其中,D=|H(li+1)-H(li)|,连接调整后的li、li-1和li+1的中点。
所述对文本上下边界线进行平滑修正的方法为:
a)对边界线局部修正:
在线段拟合获得的文本上下边界线中,若上边界线的两条连接线间顺时针夹角小于180度,或者下边界线两条连接线间顺时针夹角大于180度,分别在两条连接线中点处各加入一标记点,连接标记点。
b)对局部修正后的上下边界线进行基于曲率的全局约束,获得修正后的文本上下边界线。
所述文本区域的首行或最后一行不是文字时,首先提取相邻页N±2的文本区域的上下边界线,N为当前文本区域所在的页面的页码;
然后根据书籍同侧相邻页的上下边界线和畸变相似性确定当前文本区域的上下边界线。边界线分别为前后相邻页文本边界线的平均线。
所述文档图像是书脊方向垂直于扫描仪的扫描线方向获得的文档图像。
所述对畸变区域进行变换的方法为:
a)计算每一列像素的成像畸变系数:
ki=disi/base
其中,disi为上下文边界线的距离,base是文档图像中未畸变区域上下文本边界线的距离;
b)根据成像畸变系数ki,将上下文本边界线畸变区域上的点p(i,j)进行变换得p′(i′,j′):
j &prime; = j - downline [ i ] k i + downline i &prime; = &Sigma; x = t x = i 1 + ( dis x - dis x - 1 2 ) 2
其中,p和p′点所在的坐标系表示为:以边界线所在文档图像远离书脊的一角的顶点为原点,以边界线上升的方向为i轴和j轴的正方向;downline为文本边界线水平部分的纵坐标,downline[i]为横坐标为i时边界线上点的纵坐标,t为边界线起点的横坐标。
c)根据上述变换公式,采用线性插值方法进行变换,获得校正的图像。
本发明的技术效果:
本发明解决了扫描获取的中文文档图像的畸变校正问题,根据中文特征提取文本边界线进行校正的方法,降低了计算的复杂度的同时,有效解决了复杂结构文档图像的校正。同时本方法与采集设备无关,不依赖于设备参数,具有广泛的应用价值。
附图说明
图1是采用本发明的方法获得的文本边界线线段拟合图;
图2是文本边界线局部修正图;
图3是畸变区域的文本边界线投影图;
图4文本边界线的变换;
图5是本发明的基于文本边界的中文文档图像畸变校正方法流程图。
具体实施方法
下面结合附图和实施例对本发明的方法进行进一步的说明。
1.对扫描获取的文档图像进行预处理,去除页面边界及边界以外区域的噪声干扰,即删除非文本区域,如页边、页眉等位置的内容。
并判断图像的畸变方向。
对图像进行垂直方向的像素点统计即设置阈值T1,仅对灰度值小于阈值T1的像素点进行统计,即V(xi)最大值所在的一侧即为发生畸变的一侧。i,j分别为横纵坐标,Length为图像的高度,V(xi)为第i列像素的灰度值之和,T1为文档图像中灰度最大值的1/3。
然后,采用改进的Niblack算法对文档图像进行二值化。计算每个像素点p(x,y)的N*N邻域窗口内像素的灰度均值m(x,y)和方差s(x,y)。从而计算出针对与每个像素点的局部阈值T(x,y),
Figure BDA0000075560780000051
其中,R、N和k根据文本图像的获取设备不同而进行适当调整。在本实施例中,R=100,N=15,k为负值。
2.对上述处理的文档图像提取上下文本边界线
对于文档图像来讲,文本的首行和尾行畸变最明显也最能体现整体的畸变程度。进一步地,考虑含有非文字区域的文档图像。人们会首先观测文字区域的边界行的畸变程度,从中反映整个图像的畸变程度,除规则的图表等,大多数非文字区域很难寻找体现畸变程度的特征。因此,我们用文字区域的上下两条边界线来描述整个页面的畸变程度。对于少数文字区域仅占小部分页面且无法描述页面畸变特征的图像,我们采用相邻页间的畸变相似性来进行畸变参数的估计和修正,也能达到很好的校正效果。文本边界线的提取过程如下:
(1)确定主文本区域
对二值化后的文档图像进行水平方向的膨胀,使得同一行中的文字产生粘连,形成一个连通区域。通过垂直投影分析获取文本区域的宽度。为使文档图像更易处理,可先对文档图像的上下两端进行连通区域的分析,去掉短行的连通区域,如页码、页眉、页脚以及标题或者文本段落最后一行等水平方向较短的连通区域。短行去除后得到的图像我们称为主文本区域。
(2)上下文本边界线的提取
对主文本区域中首行文字的上边界线和最后一行文字的下边界线进行拟合。我们采用线段拟合方法,即用固定长度的线段来初始描述边界线,通过对线段的连接得到边界线。线段长度LWidth=K*LineWidth,由文本行的高度乘以系数K得到,K可取值为0.5。文本行高度可以通过在未畸变区域选取适当宽度的图像进行水平投影分析得到。进行线段连接时,首先判断线段的可连接性,线段li为可连接的,当且仅当其高度H(li)与其左右线段li-1和li+1的高度存在如下关系式:H(li-1)≤H(li)≤H(li+1)或者H(li-1)≥H(li)≥H(li+1)。对于不可连接的线段进行调整,调整函数为H(li)=H(li-1)+D/2,其中D=|H(li+1)-H(li)|。调整后将所有线段的中点与邻近线段的中点相连得到边界线。参见图1,图中的线段l1、l2、l3、l4、l5和l6的中点连接线即为文本边界线。l1和l2之间的线段就为中点连接线。
(3)对边界线进行修正
在获取的文本上边界线中,如果两条边界段(即上述的中点连接线)的顺时针夹角小于180度,或者下边界线中两条边界段的顺时针夹角大于180度时,两条边界段的连接点称为拐点。对边界线中拐点,我们进行局部的修正,使最终得到的边界线更为光顺。修正的方法是:在两条边界段中各加一个新的标记点,连接标记点以达到对拐点的光顺处理,标记点可以为边界段的中点。经过拐点修正之后的边界线,局部基本达到了光顺。参见图2,S1、S2、S3、S4和S5为边界段,当出现所述的拐点时,如S3和S2之间具有拐点,则分别在S1、S2、S3、S4中点上标记A、B、C、D,连接AB、BC、CD,就形成局部修正的边界线。
为了使得边界线全局走向更贴近文本的实际弯曲边界线,我们加入了全局约束。由于越靠近书脊的地方,文本弯曲越厉害,扫描得到的图像相应的文本行,越靠近畸变一侧弯曲程度越大。通过曲率的整体约束,对边界线的平滑处理后,即得到了最终的文本边界线。
(4)文本边界估计
当非文字区域占据图像的顶端和低端绝大部分区域的时候,我们的文本边界线可能会无法获取,为了解决这类问题,我们引入了相邻页的概念。这里我们所说的相邻页是指同一本书籍中目标页面在书脊同一侧页面,如果目标页的页码为N,那么其同侧页面的页码可表示为:N+2*i(i=±1,±2,±3…),则其同侧最相连页面的页码为N±2,次相邻页面页码为N±4,依次类推。由于目标页面与其同侧页面具有畸变的局部的相似性,和整体的渐变性。我们可以根据其局部的相似性来对不能准确获取文本边界的页面进行文本边界的估计,根据整体的渐变性来对估计并修正文本边界线。即未畸变区域边界线与相邻页未畸变区域边界线相同,畸变区域边界线分别为左右相邻页(即N±2页码的页面)畸变区域边界线的平均值,即取两条边界线上各点坐标的平均值形成该页的边界线。
3.基于上下文本边界线的畸变校正
首先,根据获取的文本边界线对畸变进行描述。通常对装订的书本或者文档材料进行扫描时,书脊通常不能紧贴扫描平面,从而产生了畸变。这种畸变通常与页面距离扫描仪平面的距离相关。具体表现为由向扫描平面投影带来的线性畸变和由透镜成像距离不同带来的非线性畸变。这里我们处理的畸变图像是书脊方向垂直于扫描仪的扫描线方向获得的畸变图像,相对于平行于扫描线方向的情况这种畸变更为复杂。
对于未畸变的区域,上下文本边界线为两条平行的直线,它们之间的距离为未畸变的上下边界线距离,我们用base来表示。由于投影的畸变使得为畸变区域的上下边界线之间的距离缩小,我们用disi来描述每一列上上下文本边界线的距离,我们可以得到每一列的成像畸变系数ki=disi/base。如果不存在畸变,每个disi应该等于base。因此对于成像的畸变我们可以用ki来描述,ki反映了成像畸变的程度和这一列像素对应的物体距离扫描仪平面的远近,畸变系数ki越小,则该物体距离扫描仪平面越远。相应的,ki越大距离扫描仪平面越近。
然后,以扫描获得的文档图像的左侧文本下边界线为例,阐述如何根据获取的文本边界线对图像进行校正。为了计算方便,根据边界线所在文档图像的位置不同,采用不同的坐标系,即以边界线所在文档图像的顶点为原点,以边界线上升的方向为坐标系的正方向,即下述的i轴和j轴的正方向,且边界线的坐标为正值。以1为像素单位进行文本边界线实际长度的估计,参见图3:
&Delta;l = 1 + &Delta; y 2 = 1 + ( dis i - dis i - 1 2 ) 2
根据图3的原理,可以得到下述公式,参见图4
l &prime; i = &Sigma; x = t x = i &Delta; l &prime; = &Sigma; x = t x = i 1 + ( dis x - dis x - 1 2 ) 2 .
由于扫描仪采用的是透镜头像原理成像,因此,被扫描页面离扫描平面的距离不同成像大小也不相同。对应到图像上表现为,畸变部分图像行间距和行高变小,文本从两端向中间扭曲。对畸变部分以列为单位计算垂直方向畸变系数ki,即文本边界线距离与未畸变区域边界线的距离之间的比,以及计算图像畸变区域对应的扫描页面区域的长度l′就可得到畸变的描述。
成像畸变的校正我们通过提取的本文边界线来获得畸变的参数。畸变图像中文本边界线从两边向中间扭曲,未畸变的图像的文本边界线应该是水平的,因此,我们可以通过未畸变的区域的文本边界线获取图像未畸变时的文本边界线信息,依此来校正畸变区域中的点。投影成像畸变中,扫描获取的原始图像中的点p(i,j)对应于校正后图像中点的坐标为p′(i′,j′),则:
i &prime; = l i &prime; = &Sigma; x = t x = i 1 + ( dis x - dis x - 1 2 ) 2
其中,t为边界线起点的横坐标,在图4中即为left点的横坐标。
由于成像畸变带来的图像畸变区域在j轴方向被压缩,无畸变时j轴方向图像高度应为base,根据每列像素成像畸变系数ki,可得到j轴方向变换公式:
k i = dis i base = j - downline [ i ] j &prime; - downline
则:
j &prime; = j - downline [ i ] k i + downline
downline为文本下边界线水平部分的纵坐标,downline[i]为横坐标i时的下边界线上点的纵坐标。
最后,根据两种畸变的描述,通过对投影畸变和成像畸变的综合分析,可得到图像中点的坐标转换公式为:
j &prime; = j - downline [ i ] k i + downline i &prime; = &Sigma; x = t x = i 1 + ( dis x - dis x - 1 2 ) 2
其中,downline为文本边界线水平部分的纵坐标,downline[i]为横坐标i时的边界线上点的纵坐标,t为边界线起点的横坐标,在图4中即为left点的横坐标。
由于文档图像的文本边界线可以分为上下左右四条,上述说明是以左下边界线为例说明本发明的方法,但其余三条边界线在采用相应的坐标系后使用上述公式可达到相同的目的。
然后根据上述点的转换公式我们采用线性插值方法对图像中畸变区域进行变换,得到校正的图像。
畸变图像的校正过程可参见图5,图5(a)中扫描页面的书脊垂直于扫描仪透镜平面的扫描线,在距离书脊的位置扫描页面离透镜平面距离较远。
图5(b)显示了扫描获得的文本图像,文本图像文本区域的上下边界线出现畸变。
采用本发明的方法进行校正,获得校正后的文本区域,上下边界线平行。

Claims (10)

1.一种基于文本边界的中文文档图像畸变校正方法,包括如下步骤:
1)对扫描获取的文档图像进行预处理,去除页面边界及边界以外区域的干扰;
2)判断文档图像的畸变方向,确定畸变区域;
3)对文档图像进行二值化;
4)提取经二值化处理的文档图像的上下文本边界线;
5)根据上下文本边界线,采用线性插值方法对文档图像中畸变区域进行变换,得到校正的图像。
2.根据权利要求1所述的中文文档图像畸变校正方法,其特征在于,所述判断图像畸变方向的方法为:
A、对文档图像中灰度值小于阈值T1的像素点p(i,j)进行垂直方向的统计:
V ( i ) = &Sigma; j = 0 j = Length v ( i , j ) , 其中,
Figure FDA0000075560770000012
v(i,j)为像素点p(i,j)的灰度值,i,j分别为横纵坐标,Length为图像的高度,V(i)为第i列像素的灰度值之和;
B、根据V(i)判断畸变方向,V(i)最大值所在的一侧即为发生畸变的一侧。
3.根据权利要求1所述的中文文档图像畸变校正方法,其特征在于,所述对文档图像进行二值化的方法为:
A、计算出每个像素点p(i,j)的N*N邻域窗口的局部阈值T(i,j):
T ( i , j ) = m ( i , j ) &CenterDot; [ 1 + k ( 1 - s ( i , j ) R ) ]
其中,m(i,j)和s(i,j)分别是像素点p(i,j)的N*N邻域窗口的灰度均值和方差,i,j分别为横纵坐标,N,K,R是常数;
为B、设定每个像素点p(i,j),其灰度值 v ( i , j ) = 1 v ( i , j ) &GreaterEqual; T ( i , j ) 0 v ( i , j ) < T ( i , j ) , 得到二值化后的文本图像。
4.根据权利要求3所述的中文文档图像畸变校正方法,其特征在于,T1为文档图像中灰度最大值的1/3。
5.根据权利要求1所述的中文文档图像畸变校正方法,其特征在于,所述文本边界线的提取方法为:
A、对二值化后的文档图像进行水平方向的膨胀,使得同一行中的内容产生粘连,形成一个连通区域,所述连通区域为文档图像的主文本区域;
B、对主文本区域中首行的上线和最后一行的下线采用线段拟合方法,获得文本上下边界线;
C、对文本上下边界线进行平滑修正,得到修正后的文本上下边界线。
6.根据权利要求5所述的中文文档图像畸变校正方法,其特征在于,线段拟合方法为:
a、采用长度为L=K*h的水平线段初始描述上下线,其中,h为文本行的高度,K为系数;
b、连接各线段中点,连接线构成文本上下边界线:
当线段li与其左右线段li-1和li+1的高度存在如下关系:H(li-1)≤H(li)≤H(li+1)或者H(li-1)≥H(li)≥H(li+1)时,连接li、li-1和li+1的中点;
当li与其左右线段li-1和li+1的高度不符合所述关系时,采用下述公式调整线段li的高度:
H(li)=H(li-1)+D/2,其中,D=|H(li+1)-H(li)|,连接调整后的li、li-1和li+1的中点。
7.根据权利要求6所述的中文文档图像畸变校正方法,其特征在于,所述对文本上下边界线进行平滑修正的方法为:
a)对边界线局部修正:
在线段拟合获得的文本上下边界线中,若上边界线的两条边界段顺时针夹角小于180度;或者下边界线两条边界段间顺时针夹角大于180度,分别在两条边界段加入一标记点,连接标记点,标记点连接线为局部修正后的文本边界线;
b)对局部修正后的文本上下边界线进行基于曲率的全局约束,获得修正后的文本上下边界线。
8.根据权利要求5所述的中文文档图像畸变校正方法,其特征在于,所述当前主文本区域的首行或最后一行不是文字时,首先提取相邻页N±2的文本区域的文本上下边界线,N为当前文本区域所在的页面的页码;然后根据相邻页的文本上下边界线和畸变相似性确定当前主文本区域的文本上下边界线。
9.根据权利要求1所述的中文文档图像畸变校正方法,其特征在于,所述文档图像是书脊方向垂直于扫描仪的扫描线方向获得的文档图像。
10.根据权利要求1所述的中文文档图像畸变校正方法,其特征在于,所述对畸变区域进行变换的方法为:
a)计算每一列像素的成像畸变系数:
ki=disi/base
其中,disi为上下文本边界线的距离,base是文档图像中未畸变区域上下文本边界线的距离;
b)根据成像畸变系数ki,将上下文本边界线畸变区域上的点p(i,j)进行变换得p′(i′,j′):
j &prime; = j - downline [ i ] k i + downline i &prime; = &Sigma; x = t x = i 1 + ( dis x - dis x - 1 2 ) 2
其中,p和p′点所在的坐标系表示为:以边界线所在文档图像远离书脊的一角的顶点为原点,以边界线上升的方向为i轴和j轴的正方向;downline为文本边界线水平部分的纵坐标,downline[i]为横坐标为i时边界线上点的纵坐标,t为边界线起点的横坐标;
c)根据上述变换公式,采用线性插值方法进行变换,获得校正的图像。
CN2011101963991A 2011-07-13 2011-07-13 一种基于文本边界的中文文档图像畸变校正方法 Pending CN102254171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101963991A CN102254171A (zh) 2011-07-13 2011-07-13 一种基于文本边界的中文文档图像畸变校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101963991A CN102254171A (zh) 2011-07-13 2011-07-13 一种基于文本边界的中文文档图像畸变校正方法

Publications (1)

Publication Number Publication Date
CN102254171A true CN102254171A (zh) 2011-11-23

Family

ID=44981425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101963991A Pending CN102254171A (zh) 2011-07-13 2011-07-13 一种基于文本边界的中文文档图像畸变校正方法

Country Status (1)

Country Link
CN (1) CN102254171A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413271A (zh) * 2013-07-18 2013-11-27 西安交通大学 基于局部信息的文档图像校正方法
CN104933068A (zh) * 2014-03-19 2015-09-23 阿里巴巴集团控股有限公司 一种信息搜索的方法和装置
CN105450900A (zh) * 2014-06-24 2016-03-30 佳能株式会社 用于文档图像的畸变校正方法和设备
CN106127751A (zh) * 2016-06-20 2016-11-16 北京小米移动软件有限公司 图像检测方法、装置以及系统
CN106295484A (zh) * 2015-06-12 2017-01-04 富士通株式会社 提取文档边界的方法和装置
CN106991649A (zh) * 2016-01-20 2017-07-28 富士通株式会社 对摄像装置所捕获的文档图像进行校正的方法和装置
CN107194389A (zh) * 2017-05-03 2017-09-22 湖南大学 基于形态学与网格构造的二值图像校正方法
CN108335266A (zh) * 2017-04-14 2018-07-27 陈思远 一种文档图像畸变的矫正方法
WO2018152710A1 (zh) * 2017-02-22 2018-08-30 华为技术有限公司 图像校正的方法及装置
CN109801227A (zh) * 2018-12-18 2019-05-24 镇江教泽信息技术有限公司 基于字体图像的书籍插图纠正方法
CN110027342A (zh) * 2017-12-20 2019-07-19 卡西欧计算机株式会社 对纸面进行拍摄而电子化的装置、图像校正方法、翻页装置以及拍摄方法
CN111027560A (zh) * 2019-11-07 2020-04-17 浙江大华技术股份有限公司 文本检测方法以及相关装置
CN111127339A (zh) * 2019-12-04 2020-05-08 北京华宇信息技术有限公司 一种文档图像的梯形畸变矫正方法及装置
CN111753832A (zh) * 2020-07-02 2020-10-09 杭州睿琪软件有限公司 图像处理方法、图像处理装置、电子设备和存储介质
CN111914764A (zh) * 2020-08-05 2020-11-10 杭州睿琪软件有限公司 图像处理方法、图像处理装置、电子设备和存储介质
CN111932483A (zh) * 2020-09-28 2020-11-13 江西汉辰信息技术股份有限公司 图片处理方法、装置、存储介质及计算机设备
CN112270656A (zh) * 2020-09-10 2021-01-26 成都市精卫鸟科技有限责任公司 一种图像校正方法、装置、设备和介质
CN112584054A (zh) * 2019-09-29 2021-03-30 深圳市光鉴科技有限公司 基于图像编码的亮度自适应调节方法、系统、设备及介质
CN115063279A (zh) * 2022-03-25 2022-09-16 北京国隐科技有限公司 一种文本水印图像的预处理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070206877A1 (en) * 2006-03-02 2007-09-06 Minghui Wu Model-based dewarping method and apparatus
CN101789122A (zh) * 2009-01-22 2010-07-28 佳能株式会社 用于校正畸变文档图像的方法和系统
CN102084378A (zh) * 2008-05-06 2011-06-01 计算机连接管理中心公司 基于照相机的文档成像

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070206877A1 (en) * 2006-03-02 2007-09-06 Minghui Wu Model-based dewarping method and apparatus
CN102084378A (zh) * 2008-05-06 2011-06-01 计算机连接管理中心公司 基于照相机的文档成像
CN101789122A (zh) * 2009-01-22 2010-07-28 佳能株式会社 用于校正畸变文档图像的方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HONG LIU ET AL.: "《Skew detection for complex document images using robust borderlines in both text and non-text regions》", 《PATTERN RECOGNITION LETTERS 29》 *
HONG LIU,RUNWEI DING: "《Restoring Chinese documents images based on text boundary lines》", 《SYSTEMS, MAN AND CYBERNETICS, 2009. SMC 2009. IEEE INTERNATIONAL CONFERENCE ON》 *
严家明,刘诗斌,李辉: "《线性插值的误差计算方法研究》", 《弹箭与制导学报》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413271B (zh) * 2013-07-18 2016-03-02 西安交通大学 基于局部信息的文档图像校正方法
CN103413271A (zh) * 2013-07-18 2013-11-27 西安交通大学 基于局部信息的文档图像校正方法
CN104933068A (zh) * 2014-03-19 2015-09-23 阿里巴巴集团控股有限公司 一种信息搜索的方法和装置
CN105450900A (zh) * 2014-06-24 2016-03-30 佳能株式会社 用于文档图像的畸变校正方法和设备
CN105450900B (zh) * 2014-06-24 2019-01-18 佳能株式会社 用于文档图像的畸变校正方法和设备
CN106295484B (zh) * 2015-06-12 2019-11-22 富士通株式会社 提取文档边界的方法和装置
CN106295484A (zh) * 2015-06-12 2017-01-04 富士通株式会社 提取文档边界的方法和装置
CN106991649A (zh) * 2016-01-20 2017-07-28 富士通株式会社 对摄像装置所捕获的文档图像进行校正的方法和装置
CN106127751A (zh) * 2016-06-20 2016-11-16 北京小米移动软件有限公司 图像检测方法、装置以及系统
CN106127751B (zh) * 2016-06-20 2020-04-14 北京小米移动软件有限公司 图像检测方法、装置以及系统
WO2018152710A1 (zh) * 2017-02-22 2018-08-30 华为技术有限公司 图像校正的方法及装置
CN108335266A (zh) * 2017-04-14 2018-07-27 陈思远 一种文档图像畸变的矫正方法
CN107194389A (zh) * 2017-05-03 2017-09-22 湖南大学 基于形态学与网格构造的二值图像校正方法
CN107194389B (zh) * 2017-05-03 2020-07-24 湖南大学 基于形态学与网格构造的二值图像校正方法
CN110027342A (zh) * 2017-12-20 2019-07-19 卡西欧计算机株式会社 对纸面进行拍摄而电子化的装置、图像校正方法、翻页装置以及拍摄方法
CN109801227A (zh) * 2018-12-18 2019-05-24 镇江教泽信息技术有限公司 基于字体图像的书籍插图纠正方法
CN112584054A (zh) * 2019-09-29 2021-03-30 深圳市光鉴科技有限公司 基于图像编码的亮度自适应调节方法、系统、设备及介质
CN111027560A (zh) * 2019-11-07 2020-04-17 浙江大华技术股份有限公司 文本检测方法以及相关装置
CN111127339B (zh) * 2019-12-04 2020-10-30 北京华宇信息技术有限公司 一种文档图像的梯形畸变矫正方法及装置
CN111127339A (zh) * 2019-12-04 2020-05-08 北京华宇信息技术有限公司 一种文档图像的梯形畸变矫正方法及装置
CN111753832A (zh) * 2020-07-02 2020-10-09 杭州睿琪软件有限公司 图像处理方法、图像处理装置、电子设备和存储介质
CN111753832B (zh) * 2020-07-02 2023-12-08 杭州睿琪软件有限公司 图像处理方法、图像处理装置、电子设备和存储介质
CN111914764A (zh) * 2020-08-05 2020-11-10 杭州睿琪软件有限公司 图像处理方法、图像处理装置、电子设备和存储介质
CN111914764B (zh) * 2020-08-05 2023-09-15 杭州睿琪软件有限公司 图像处理方法、图像处理装置、电子设备和存储介质
CN112270656A (zh) * 2020-09-10 2021-01-26 成都市精卫鸟科技有限责任公司 一种图像校正方法、装置、设备和介质
CN111932483A (zh) * 2020-09-28 2020-11-13 江西汉辰信息技术股份有限公司 图片处理方法、装置、存储介质及计算机设备
CN115063279A (zh) * 2022-03-25 2022-09-16 北京国隐科技有限公司 一种文本水印图像的预处理方法和装置
CN115063279B (zh) * 2022-03-25 2023-03-14 北京国隐科技有限公司 一种文本水印图像的预处理方法和装置

Similar Documents

Publication Publication Date Title
CN102254171A (zh) 一种基于文本边界的中文文档图像畸变校正方法
CN102790841B (zh) 书籍的书脊区域中数字图像的检测和校正方法
CN101901343B (zh) 基于立体约束的遥感影像道路提取方法
CN102096795B (zh) 磨损二维条码图像识别方法
CN101267493B (zh) 透视变形文档图像的校正装置和校正方法
CN103455991B (zh) 一种多聚焦图像融合方法
CN102629322B (zh) 一种基于边界点笔画形状的字符特征提取方法及应用
CN103413271B (zh) 基于局部信息的文档图像校正方法
JP5082637B2 (ja) 画像処理プログラム、画像処理方法及び画像処理装置
CN101697228A (zh) 一种文本图像处理方法
CN102938062B (zh) 一种基于内容的文档图像倾斜角估计方法
CN104424457A (zh) 一种非线性扭曲情况下的二维码识别方法
WO1991018366A1 (en) A method of detecting skew in form images
CN101896920A (zh) 基于移动扫描的图像处理方法及装置
CN111145124A (zh) 一种图像倾斜的校正方法及装置
CN114494306B (zh) 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法
CN110458167B (zh) 一种金属件表面弯曲文本行矫正方法
CN106709952A (zh) 一种显示屏幕的自动标定方法
CN100363940C (zh) 一种文稿图像几何畸变的校正方法
CN103700071A (zh) 一种深度图上采样边缘增强方法
CN103914829A (zh) 一种含噪图像边缘检测方法
CN106778766A (zh) 一种基于定位点的旋转数字识别方法及系统
CN104463126A (zh) 一种扫描文档图像的倾斜角自动检测方法
CN102073997B (zh) 小型文档图像透视复原方法
CN102073862B (zh) 一种快速的文档图像版面结构计算方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111123