CN101609283B - 图像处理装置及图像处理方法 - Google Patents
图像处理装置及图像处理方法 Download PDFInfo
- Publication number
- CN101609283B CN101609283B CN2009101506236A CN200910150623A CN101609283B CN 101609283 B CN101609283 B CN 101609283B CN 2009101506236 A CN2009101506236 A CN 2009101506236A CN 200910150623 A CN200910150623 A CN 200910150623A CN 101609283 B CN101609283 B CN 101609283B
- Authority
- CN
- China
- Prior art keywords
- inclination
- file
- picture
- image
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20061—Hough transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Abstract
本发明提供一种图像处理装置及图像处理方法。本发明使得能够通过基于文档区域的特征检测文档图像的倾度来进行倾度检测。为了实现该目的,对包含所述文档区域的文档图像数据进行缩小处理,以便生成与提取出的所述文档区域相对应的缩小文档图像。之后,对所述缩小文档图像进行滤波处理,以便通过提取所述文档区域的至少一个边缘来生成边缘图像。然后,使用哈夫变换检测与所述边缘图像的边缘邻接的直线,从而基于所述直线的倾度来确定所述文档图像的倾度。因此,能够基于所述文档图像的所述特征以高精度进行倾度检测。
Description
技术领域
本发明涉及一种检测文档的倾度的图像处理装置及图像处理方法。
背景技术
当进行字符识别或检测嵌入文档的信息时,有必要进行检测文档图像的倾度的处理。以往,有一种如图12所示的的方法,用作检测图像的倾度的方法。根据该方法,从文档的字符串中提取字符矩形,并计算各字符矩形的特征点(形心、字符矩形的左下点或右下点)。之后,对各特征点进行哈夫变换(Hough Transformation),从而计算出直线,并根据该直线检测倾斜角度(例如,如日本特开03-213053号公报所描述)。
然而,使用检测倾度的上述传统方法,基于各字符的特征来检测倾斜角度,由此会发生下列失败。
例如,如图13所示,如果字符串由具有不同大小(或不同形心)的字符构成,则由于各字符矩形具有不同的大小或位于不同的位置,因此特征点的位置不同并由此产生直线的倾度的误差,可能导致倾度检测精度的降低。
此外,如图14所示,如果由于复印、扫描等导致在字符上出现噪声,则检测到的字符矩形的大小与原始大小不同,结果,倾度检测精度可能降低。
当使用哈夫变换时,计数一条虚拟直线上的点,如果所述点的数量超过指定的阈值,则检测包括那些点的直线;由此,如果点是随意排布的,则检测到多条直线。例如,在图15所示的文档的情况下,由于在对角线上也有许多点,因此,可能存在错误检测(例如,将该文档的对角线检测为认为表示该文档的倾度的直线的情况)。
发明内容
人们期望解决上述问题,还期望提供能够通过基于文档区域的特征来检测文档图像的倾度、从而以高精度检测倾度的图像处理装置及图像处理方法。
在本发明的第一方面中,本发明提供一种图像处理装置,所述图像处理装置包括:图像输入单元,用于输入文档图像;缩小单元,用于通过缩小所述文档图像来生成缩小文档图像;边缘图像生成单元,用于通过提取所述缩小文档图像的至少一个边缘来生成边缘图像;以及倾度检测单元,用于基于表示所述边缘图像的边缘的直线的倾度来检测所述文档图像的倾度。
在本发明的第二方面中,本发明提供一种图像处理方法,所述图像处理方法包括:图像输入步骤,输入文档图像;缩小步骤,通过缩小所述文档图像来生成缩小文档图像;边缘图像生成步骤,通过提取所述缩小文档图像的至少一个边缘来生成边缘图像;以及倾度检测步骤,基于表示所述边缘图像的边缘的直线的倾度来检测所述文档图像的倾度。
在本发明的实施例中,基于文档区域的特征来检测文档图像的倾度,由此能够以高精度进行检测。
通过下面参照附图对示例性实施例的描述,本发明的其他特征将变得清楚。
附图说明
图1是示出根据本发明的第一示例性实施例中的倾度检测处理的概念的图。
图2是示出第一示例性实施例中的图像处理装置的功能配置的框图。
图3是示出第一示例性实施例中的倾度检测处理的流程图。
图4是例示第一示例性实施例中的缩小处理的图。
图5是示出要在第一示例性实施例中处理的倾斜30度的示例性文档图像的图。
图6是示出第一示例性实施例中的示例性缩小文档图像的图。
图7是示出第一示例性实施例中的示例性边缘图像的图。
图8是例示第一示例性实施例中的哈夫变换的图。
图9是示出与在第一示例性实施例中检测到的文档区域的边缘邻接的示例性直线的图。
图10是示出在第一示例性实施例中确定倾斜角度的方法的图。
图11是示出第二示例性实施例中的计算机系统配置的框图。
图12是例示检测倾度的传统方法的图。
图13是示出在使用检测倾度的传统方法时发生的示例性失败的图。
图14是示出在使用检测倾度的传统方法时发生的示例性失败的图。
图15是示出在使用检测倾度的传统方法时发生的示例性失败的图。
具体实施方式
下文将参照附图对本发明的优选示例性实施例进行详细描述。应当注意,下列实施例中描述的配置仅仅是示例性的,本发明并不局限于所例示的配置。
第一示例性实施例
概要
首先,将参照图1对在第一示例性实施例中检测文档图像的倾度的处理的概念进行简要描述。
首先,缩小已经输入的文档图像数据I,以便生成缩小文档图像Is。进行该缩小处理,以使得通过缩小字符使字符相互连接,并且根据文档区域的边缘最终检测倾度。此处,所述文档区域表示写入字符的区域,即,由多个字符构成的区域,可以是章节、段落或一个文本行。请注意,在此步骤中,文档区域优选是一个对象,并且在进行缩小时填补该文档区域的内部。
接下来,从被填补的缩小文档图像Is中提取所述文档区域的边缘,以便生成边缘图像Ie。拉普拉斯滤波器(Laplacian filter)、索贝尔滤波器(Sobelfilter)等可以应用于该边缘提取处理。
之后,对所述边缘图像Ie进行哈夫变换,以便检测与所述文档区域的边缘邻接的直线。也就是说,此处检测到的直线的倾度表示所述文档图像的倾度。
以上对在第一示例性实施例中检测文档图像的倾度的处理进行了简要描述;然而,下面将给出其详细描述。
装置配置
图2是示出本示例性实施例中的图像处理装置的功能配置的框图。如图2所示,本示例性实施例中的图像处理装置61是能够检测文档图像的倾度的装置,其由图像输入单元601、图像缩小单元602、边缘图像生成单元603以及倾度检测单元604构成。
图像输入单元601通过读取或生成通过文档图像的数字化获得的图像数据,来输入要在本示例性实施例中处理的图像数据(文档图像600)。图像缩小单元602具有缩小已输入的文档图像的功能,边缘图像生成单元603具有根据缩小文档图像来生成文本区域的边缘部分的图像的功能,倾度检测单元604具有根据所述文本区域中的边缘图像来检测倾度的功能。
倾度检测处理
下面将参照图3所示的流程图对本示例性实施例中的倾度检测处理进行详细描述。
首先,当在步骤S701中将文档图像600输入图像处理装置61时,图像输入单元601读取该图像并将该图像作为文档图像数据I提供给图像缩小单元602。此处,文档图像数据I是能够以像素为单位来处理的图像。例如,如果该文档图像在纸张原稿上,则假设具有电荷耦合器件(CCD)或光学传感器的图像输入单元601通过根据图像输入指令进行文档图像摄取、电信号处理以及数字信号处理等来生成文档图像数据I。另外,如果该文档图像是以页面描述语言来描述的数据,或是使用处理特定数据格式的应用程序生成的数据,则将该数据格式转换为通用图像格式(例如,位图格式等)以便生成文档图像数据I。
接下来,在步骤S702中,图像缩小单元602缩小由图像输入单元601提供的文档图像数据I,以便生成缩小文档图像Is。在缩小处理(由图像缩小单元602执行)中有两个步骤:此处被称作简单缩小处理的第一缩小步骤,用来生成简单缩小图像Isp;以及被称作填补的第二缩小步骤,该第二缩小步骤根据简单缩小图像Isp来生成缩小文档图像Is。
此处,参照图4对本示例性实施例中的缩小处理进行描述。缩小比是第一(或简单)缩小图像Isp中的像素数(通常为1)与文档图像数据I中的被缩小为第一缩小图像Isp中的更少像素数量的像素数的比。例如,如果从文档图像数据I中的5×5像素缩小为简单缩小图像Isp中的一个像素,则可以假设缩小比是R=1/(5×5)。此外,在这种情况下,在文档图像数据I中,根据以上的缩小比R,即使在用作缩小单位区域的5×5像素区域中存在一个黑色像素,也要进行缩小处理,使得所述缩小单位区域变成简单缩小图像Isp中的一个黑色像素。因此,基于原始图像数据I的预定缩小单位区域中的多个像素的值来确定缩小单位区域对应的一个像素的值。通过基于文档图像数据I的全部范围对该缩小单位区域进行缩小处理,来生成简单缩小图像Isp。
然后,在步骤S703中,图像缩小单元602还对简单缩小图像Isp进行用于连接字符或文本行的填补处理(即,第二缩小处理),以便生成缩小文档图像Is。也就是说,在简单缩小图像Isp中,基于预定范围L中的多个像素的值,用相同的像素值来填补该范围。具体地说,如果在预定范围L中存在黑色像素,则将该预定范围中的所有像素变为黑色。图4示出了在预定范围L=3个像素的情况下进行的填补的示例。也就是说,进行本示例性实施例的填补,使得3×3像素块中的所有像素被黑色像素替换,即使在该块中仅仅存在一个黑色像素。
此处,对本示例性实施例中的缩小比R和预定范围L的数值的选择进行描述。
进行本示例性实施例中的填补处理,以便通过连接字符或文本行来提取文档区域的边缘。因此,假设字符之间的间隔为cs个像素,而文本行之间的间隔为ls个像素,则以下述方式选择缩小比R和预定范围L是足够的:使得它们的组合既大于cs又大于ls。换句话说,选择R和L以满足下面的表达式(1)和(2)。请注意,在下文中,表达式表示R的平方根。
表达式(1)
表达式(2)
例如,假设包含要由图像输入单元601输入的图像的原稿的大小为A4。由于一般的字符大小是从8磅至28磅,因此如果以600dpi的分辨率读取原稿,则字符之间的间隔大约是20个像素至60个像素,而文本行之间的间隔大约是90个像素至250个像素。因此,在这种情况下,上述表达式(1)和(2)变成了表达式(3)和(4),由此,以下述方式确定缩小比R和预定范围L是足够的:使得它们的组合既大于字符之间的像素的最大值(即,60个像素)又大于文本行之间的像素的最大值(即,250个像素)。换句话说,执行R和L的选择以满足表达式(3)和(4)。
表达式(3)
表达式(4)
现在将描述一个具体示例。图6示出了通过将图5所示的文档图像(A4,600dpi,10.5磅)缩小为1/(40×40)(即,R=1/(40×40)),并使用5个像素的预定范围(即,L=5)进行填补而获得的缩小文档图像Is。由于图5所示的文档图像的字符大小是10.5磅,因此字符之间的间隔大约是20个像素(即,cs=20),而文本行之间的间隔大约是80个像素(即,ls=80)。因此,由于满足如下面的表达式(5)和(6)所示的条件,由此可见,通过由图6所示的填补来连接字符和文本行,使缩小图像变成了一个对象。
表达式(5) 大于cs(20)。
表达式(6) 大于ls(80)。
如上所述,将已被图像缩小单元602缩小并填补的缩小文档图像Is提供给边缘图像生成单元603。
返回参照图3,接下来,在步骤S704中,边缘图像生成单元603通过从由图像缩小单元602提供的缩小文档图像Is中提取文档区域的边缘来生成边缘图像Ie,并将边缘图像Ie发送给倾度检测单元604。图7示出了基于图6所示的缩小文档图像Is生成的边缘图像Ie。通过对缩小文档图像Is应用拉普拉斯滤波器来生成本示例性实施例中的边缘图像Ie。拉普拉斯滤波器是在进行边缘增强或锐化时通常使用的滤波器,其滤波器系数可以表达如下。
请注意,并不局限于拉普拉斯滤波器,还可以使用例如,高通滤波器、索贝尔滤波器以及普鲁伊特滤波器(Prewitt filter)等用于边缘提取处理,只要该滤波器增强边缘。
接下来,在步骤S705中,倾度检测单元604通过对由边缘图像生成单元603提供的边缘图像Ie进行哈夫变换,来检测与文档区域的边缘邻接的直线。然后,在步骤S706中,倾度检测单元604基于检测到的直线来确定文档区域的倾斜角度Ang。
此处,参照图8对哈夫变换进行简要描述。哈夫变换是用于从图像中检测直线或圆弧的众所周知的技术。
例如,如图8所示,通过点P1(x1,y1)的任意直线能够由下面的使用从原点O到该直线的垂直线的长度ρ和由该垂直线与通过原点O的x轴形成的角度θ的表达式(7)来表达。
表达式(7)ρ=x·cosθ+y·sinθ
此处,如果诸如点P2(x2,y2)的另一点在同一直线上,则对于点P2的角度θ和长度ρ与对于点P1的角度θ和长度ρ相同。因此,在文档图像的平面上,计数对于角度θ和长度ρ相同的点,并且如果这种点的数量大于或等于预定阈值,则可以得出那里存在直线。图9示出了与通过使用哈夫变换对图7所示的边缘图像Ie进行计算而获得的文档区域的边缘邻接的直线的示例性描绘。
如上所述,对于使用哈夫变换检测到的与文档图像的边缘邻接的直线,其倾斜角度(下文中称作A)就是文档区域的倾斜角度Ang。
从多个倾度中进行选择的处理
请注意,对于与文档区域的边缘邻接的直线的倾斜角度A,可能计算出多个值,并且可能存在例如计算出两个倾斜角度A1和A2的情况。这是因为检测到分别与文档区域的顶部和侧部邻接的直线。在本示例性实施例中,如果检测到具有不同倾度的多条直线,则按照下述方式最终选择倾斜角度Ang。
例如,假设检测到以下两个值作为计算出的直线的倾斜角度。请注意,倾斜角度的正/负值分别表示顺时针/逆时针。
A1=30°
A2=-60°
在本示例性实施例中,如果检测到以上两个倾斜角度A1和A2,则将其绝对值较小的倾斜角度(即,A1=30°)确定为倾斜角度Ang。
此外,存在由于噪声的影响除了与文档区域的边缘邻接的直线以外还检测到多条直线的情况。例如,假设通过哈夫变换计算出下面多个倾斜角度候选。
A1=30°
A2=-15°
A3=30°
A4=-60°
A5=30°
图10示出了这些直线的示例。在本示例性实施例中,进行下述两个处理(处理(a)和处理(b))中的任一个或进行这两个处理的组合以提高在这种情况下检测倾斜角度的精度。
处理(a):选择多个检测到的直线
如图10中的标号101所示,可以针对各文本行检测与文档区域的边缘邻接的直线。在这种情况下,将最频繁出现的直线角度(即,均为30°的角度A1、A3和A5)确定为倾斜角度。
处理(b):选择正交直线
利用与文档区域的顶部邻接的直线和与文档区域的侧部邻接的直线通常以直角交叉的特性,从检测到的直线中选择两个正交直线,以确定倾斜角度。在这种情况下,如图10中的标号102所示,角度为A1(或A3或A5)的直线和角度为A4的直线以直角交叉,由此,可以认为倾斜角度不是30°就是-60°。因此,将较小的倾斜角度(即,A1=30°)确定为倾斜角度Ang。
请注意,如果没有最频繁出现的直线角度并且没有正交直线,则可以应用选择包含最多点数的直线的方法。
如上所述,在本示例性实施例中,将文档图像缩小并基于缩小的文档区域的特征检测倾度,由此无需考虑字符大小,或者即使在字符上出现噪声,也能够以高精度检测所述文档图像的倾度。
请注意,尽管在本示例性实施例中,将黑白二值图像作为要被输入的文档图像的示例进行描述,但是,本发明并不局限于此,并还可以应用于彩色图像。例如,在彩色图像的情况下,通过进行基于预定阈值的高/低判断来生成缩小的二值图像,之后,可以进行与本示例性实施例中的处理相同的处理。
第二示例性实施例
下文中,将对根据本发明的第二示例性实施例进行描述。第二示例性实施例的典型特征在于:由计算机执行的计算机程序来实现根据上述第一示例性实施例的处理,以使与该计算机连接的图像处理设备(如果该计算机用作图像处理设备,也可以是该计算机本身)更有效地确定文档中图像的倾度(并输出其结果)。
图11是示出第二示例性实施例中的计算机的基本配置的框图。例如,当计算机执行上述第一示例性实施例的所有功能时,由程序函数或子程序代表各功能配置,并且使计算机读取并执行该函数或子程序就足够了。
在图11中,标号1501表示使用在RAM 1502或ROM 1503中存储的程序或数据来进行计算机的总体控制,并还进行上述第一示例性实施例中描述的各处理的CPU。
标号1502表示包括用于临时存储从例如外部存储装置1508加载的程序或数据的区域、还包括CPU 1501用来进行各种处理的必要区域的RAM。请注意,还可以临时存储经由I/F(接口)1515从另一计算机系统1514下载的程序或数据。
标号1503表示存储计算机的功能程序和设定数据等的ROM。标号1504表示进行在显示器1505上显示图像和字符等的控制处理的显示器控制装置。标号1505表示显示图像和字符等的显示器。请注意,CRT和液晶显示器等适合于显示器1505。
标号1506表示由诸如键盘和鼠标的设备构成的操作输入设备,使用该操作输入设备能够将各种指令输入CPU 1501。标号1507表示用于将已经经由操作输入设备1506输入的各种指令等通知给CPU 1501的I/O。
标号1508表示诸如硬盘的外部存储装置,该外部存储装置用作大容量信息存储装置并存储OS(操作系统)、使CPU 1501执行根据上述第一示例性实施例的处理的程序以及输入/输出原始图像等。经由I/O 1509进行对外部存储装置1508的信息读写。
标号1510表示用于输出文档或图像的打印机,该打印机经由I/O 1511接收从RAM 1502或外部存储装置1508发送的输出数据。请注意,用于输出文档或图像的打印机的示例包括:喷墨打印机、激光打印机、热转印打印机以及点阵撞击式打印机等。
标号1512表示用于读取文档或图像的扫描器,该扫描器经由I/O 1513向RAM 1502或外部存储装置1508发送输入数据。
标号1516表示用于连接CPU 1501、ROM 1503、RAM 1502、I/O 1511、I/O 1509、显示器控制装置1504、I/F 1515、I/O 1507以及I/O 1513的总线。
请注意,尽管在第二示例性实施例中描述了使计算机进行除扫描或打印之外的处理的示例,但是扫描器1512或打印机1510中的专用硬件电路可以代替进行由计算机进行的处理。
如上所述,在第二示例性实施例中,计算机能够实现上述第一示例性实施例的功能。
示例性实施例的其他特征
上述第一和第二示例性实施例仅仅例示了在实施本发明时的具体示例,因此不能将本发明的技术范围解释为限制于此。根据实施例,缩小图像的所有边缘都用来生成边缘图像,然而可以通过提取缩小图像的至少一个边缘来生成所述边缘图像。此外,在不脱离本发明的技术思想或必要特征的情况下,可以以各种其他形式体现本发明。例如,尽管在上述第二示例性实施例中描述了使计算机实现本发明的示例,但是下面将更加详细地描述被视为本发明的范围的技术范围。
本发明的实施方式包括:例如,使用系统、装置、方法、程序以及存储介质(记录介质)。具体地说,本发明可以应用于由多个设备(例如,主机、接口设备、摄取设备以及网络应用等)构成的系统,或者也可以应用于由一个设备构成的装置。
本发明还可以通过向系统或装置直接地或远程地提供实现上述示例性实施例的功能的软件程序,并通过所述系统或装置中的计算机读取并执行所提供的程序代码来实现。应该注意,该情况中的所述程序是与示例性实施例中的附图所示的流程图相对应的计算机可读程序。
因此,本发明还可以由安装在计算机上的、用于在计算机上实现本发明的功能处理的程序代码本身来实现。也就是说,本发明还包括用于实现本发明的功能处理的计算机程序本身。
在这种情况下,所述程序可以采用诸如目标代码、由解释器执行的程序以及提供给OS的脚本数据等的形式,只要其具有该程序的功能即可。
用于提供所述程序的记录介质的示例包括下述介质。例如,可以使用诸如软(注册商标)盘、硬盘、光盘、磁光盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失性存储卡、ROM以及DVD(DVD-ROM和DVD-R)的记录介质。
可以应用下述方法作为提供所述程序的方法。即,使用客户端计算机的浏览器连接到互联网的网站,并将本发明的计算机程序本身(或包含自动安装功能的压缩文件)下载到诸如硬盘的存储介质中。此外,通过将构成本发明的所述程序的程序代码分割成多个文件并从不同网站下载各文件,能够实现该方法。换句话说,在本发明的范围内还包括允许多个用户下载用于通过计算机实现本发明的功能处理的程序文件的万维网(WWW)服务器。
还可以将本发明的程序加密并存储在诸如CD-ROM的存储介质中,然后将其分配给用户,其中满足一定条件的用户被允许经由互联网从网站下载用于解密所述程序的密钥信息。也就是说,用户可以通过使用所述密钥信息来执行所加密的程序,并将所述程序安装在计算机中。
通过计算机执行所读出的程序能够实现上述示例性实施例的功能。此外,在计算机上运行的OS等可以基于所述程序中的指令执行部分或全部实际处理,并且通过这种处理能够实现上述示例性实施例的功能。
此外,可以将从存储介质中读出的程序写入设置在插入计算机中的功能扩展板或连接到计算机的功能扩展单元中的存储器并执行,由此实现上述示例性实施例的功能。也就是说,包含在功能扩展板或功能扩展单元中的CPU等能够基于包含在所述程序中的指令进行全部或部分实际处理。
虽然参照示例性实施例对本发明进行了描述,但是应当理解,本发明并不局限于所公开的示例性实施例。应当对以下权利要求的范围给予最宽泛的解释,以使其涵盖所有这些变型例、等同结构和功能。
Claims (8)
1.一种图像处理装置,所述图像处理装置包括:
图像输入单元,用于输入文档图像;
缩小单元,用于通过根据预定的缩小比R缩小所述文档图像来生成缩小文档图像;
边缘图像生成单元,用于通过提取所述缩小文档图像的至少一个边缘来生成边缘图像;以及
倾度检测单元,用于基于表示所述边缘图像的边缘的直线的倾度来检测所述文档图像的倾度,
其中,所述缩小单元通过根据所述缩小比R即使在缩小单位区域中存在一个黑色像素也将简单缩小图像中的相应像素确定为黑色像素、以及对该简单缩小图像通过即使在范围L中存在一个黑色像素也用黑色像素填补范围L中的像素以进行用于连接字符或文本行的填补处理,来生成所述缩小文档图像,
其中,选择R和L以满足下面的表述式(1)和(2),
表达式(1):
表达式(2):
其中,cs表示字符之间的间隔像素数,ls表示文本行之间的间隔像素数。
2.根据权利要求1所述的图像处理装置,其中所述边缘图像生成单元使用拉普拉斯滤波器进行边缘提取。
3.根据权利要求1所述的图像处理装置,其中所述边缘图像生成单元使用高通滤波器进行边缘提取。
4.根据权利要求1所述的图像处理装置,其中所述倾度检测单元通过进行哈夫变换来检测表示所述边缘图像的所述边缘的直线,并基于所述直线的倾度来检测所述文档图像的倾度。
5.根据权利要求4所述的图像处理装置,其中,所述倾度检测单元可操作以在检测到具有不同倾度的多条直线的情况下,将所述多条直线的所述倾度中的最小的倾度确定为所述文档图像的倾度。
6.根据权利要求4所述的图像处理装置,其中,所述倾度检测单元可操作以在检测到具有不同倾度的多条直线的情况下,将出现最频繁的倾度确定为所述文档图像的倾度。
7.根据权利要求4所述的图像处理装置,其中,所述倾度检测单元可操作以在检测到具有不同倾度的多条直线的情况下,选择两条正交直线,并将所述两条直线的倾度中较小的倾度确定为所述文档图像的倾度。
8.一种图像处理方法,所述图像处理方法包括:
图像输入步骤,输入文档图像;
缩小步骤,通过根据预定的缩小比R缩小所述文档图像来生成缩小文档图像;
边缘图像生成步骤,通过提取所述缩小文档图像的至少一个边缘来生成边缘图像;以及
倾度检测步骤,基于表示所述边缘图像的边缘的直线的倾度来检测所述文档图像的倾度,
其中,所述缩小步骤通过根据所述缩小比R即使在缩小单位区域中存在一个黑色像素也将简单缩小图像中的相应像素确定为黑色像素、以及对该简单缩小图像通过即使在范围L中存在一个黑色像素也用黑色像素填补范围L中的像素以进行用于连接字符或文本行的填补处理,来生成所述缩小文档图像,
其中,选择R和L以满足下面的表述式(1)和(2),
表达式(1):
表达式(2):
其中,cs表示字符之间的间隔像素数,ls表示文本行之间的间隔像素数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008-160949 | 2008-06-19 | ||
JP2008160949 | 2008-06-19 | ||
JP2008160949A JP5132438B2 (ja) | 2008-06-19 | 2008-06-19 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101609283A CN101609283A (zh) | 2009-12-23 |
CN101609283B true CN101609283B (zh) | 2012-12-26 |
Family
ID=41090279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101506236A Expired - Fee Related CN101609283B (zh) | 2008-06-19 | 2009-06-19 | 图像处理装置及图像处理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8326085B2 (zh) |
EP (1) | EP2136318A3 (zh) |
JP (1) | JP5132438B2 (zh) |
CN (1) | CN101609283B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112010001320T5 (de) * | 2009-04-07 | 2012-06-21 | Murata Machinery, Ltd. | Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren, Bilderverarbeitungsprogramm und Speichermedium |
US8571313B2 (en) * | 2010-03-22 | 2013-10-29 | Sharp Laboratories Of America, Inc. | Methods and systems for estimation of document skew in an image |
JP5280425B2 (ja) * | 2010-11-12 | 2013-09-04 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 |
US9111239B2 (en) * | 2011-07-13 | 2015-08-18 | Incontact, Inc. | Activity recording of contact handling system agents |
US9171203B2 (en) * | 2013-09-10 | 2015-10-27 | Dropbox, Inc. | Scanbox |
JP6210013B2 (ja) * | 2014-03-31 | 2017-10-11 | ブラザー工業株式会社 | 画像処理装置 |
ES2874578T3 (es) | 2014-11-27 | 2021-11-05 | 3Shape As | Método de diseño digital de una instalación dental modificada |
CN105989366A (zh) * | 2015-01-30 | 2016-10-05 | 深圳市思路飞扬信息技术有限责任公司 | 文本图像的倾斜角矫正、版面分析方法和助视装置、系统 |
CN104766078B (zh) * | 2015-04-02 | 2018-06-22 | 四川九洲电器集团有限责任公司 | 目标图像的倾斜角检测方法及倾斜角检测设备 |
JP6520853B2 (ja) * | 2016-07-21 | 2019-05-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理方法 |
JP6810892B2 (ja) * | 2017-06-05 | 2021-01-13 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN109190617B (zh) * | 2018-08-09 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种图像的矩形检测方法、装置及存储介质 |
CN112633275B (zh) * | 2020-12-22 | 2023-07-18 | 航天信息股份有限公司 | 一种基于深度学习的多票据混拍图像校正方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5818976A (en) * | 1993-10-25 | 1998-10-06 | Visioneer, Inc. | Method and apparatus for document skew and size/shape detection |
CN1882033A (zh) * | 2005-06-13 | 2006-12-20 | 佳能株式会社 | 图像处理设备和图像处理方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03213053A (ja) | 1990-01-18 | 1991-09-18 | Fuji Xerox Co Ltd | 原稿傾き検出装置 |
US5054098A (en) | 1990-05-21 | 1991-10-01 | Eastman Kodak Company | Method of detecting the skew angle of a printed business form |
JPH05135174A (ja) * | 1991-11-11 | 1993-06-01 | Matsushita Electric Ind Co Ltd | 画像特徴抽出装置、画像照合装置および画像検索装置 |
JP3213053B2 (ja) | 1992-04-27 | 2001-09-25 | 住友金属工業株式会社 | 水素分離膜の製造方法 |
JPH1097625A (ja) * | 1996-09-20 | 1998-04-14 | Fujitsu General Ltd | 駐車車両検出システム |
JP2000341501A (ja) | 1999-03-23 | 2000-12-08 | Minolta Co Ltd | 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体 |
JP4219542B2 (ja) * | 2000-09-07 | 2009-02-04 | 富士ゼロックス株式会社 | 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体 |
US7020352B2 (en) * | 2001-05-25 | 2006-03-28 | Seiko Epson Corporation | Photo extraction techniques |
US6873732B2 (en) * | 2001-07-09 | 2005-03-29 | Xerox Corporation | Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images |
US7738730B2 (en) * | 2006-01-25 | 2010-06-15 | Atalasoft, Inc. | Method of image analysis using sparse hough transform |
US20080028027A1 (en) * | 2006-07-25 | 2008-01-31 | Jack Jachner | Multi-threaded instant messaging |
-
2008
- 2008-06-19 JP JP2008160949A patent/JP5132438B2/ja not_active Expired - Fee Related
-
2009
- 2009-06-08 US US12/480,610 patent/US8326085B2/en not_active Expired - Fee Related
- 2009-06-19 CN CN2009101506236A patent/CN101609283B/zh not_active Expired - Fee Related
- 2009-06-19 EP EP09163311A patent/EP2136318A3/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5818976A (en) * | 1993-10-25 | 1998-10-06 | Visioneer, Inc. | Method and apparatus for document skew and size/shape detection |
CN1882033A (zh) * | 2005-06-13 | 2006-12-20 | 佳能株式会社 | 图像处理设备和图像处理方法 |
Non-Patent Citations (1)
Title |
---|
JP特开2000-244729A 2000.09.08 |
Also Published As
Publication number | Publication date |
---|---|
EP2136318A2 (en) | 2009-12-23 |
US20090316996A1 (en) | 2009-12-24 |
JP5132438B2 (ja) | 2013-01-30 |
EP2136318A3 (en) | 2010-03-03 |
JP2010003087A (ja) | 2010-01-07 |
CN101609283A (zh) | 2009-12-23 |
US8326085B2 (en) | 2012-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101609283B (zh) | 图像处理装置及图像处理方法 | |
US6115508A (en) | Clock free two-dimensional barcode and method for printing and reading the same | |
US8520006B2 (en) | Image processing apparatus and method, and program | |
US8391607B2 (en) | Image processor and computer readable medium | |
US20060171587A1 (en) | Image processing apparatus, control method thereof, and program | |
CN102176230A (zh) | 将包含文字的数字图像转换为用于再现的基于记号的文件 | |
JP5669957B2 (ja) | 西洋語の透かし処理をするための透かし画像の分割方法と装置 | |
US8059895B2 (en) | Image processing apparatus | |
US8373895B2 (en) | Prevention of unauthorized copying or scanning | |
CN105320933A (zh) | 电子文档生成系统以及电子文档生成装置 | |
US8848984B2 (en) | Dynamic thresholds for document tamper detection | |
AU2008202785A1 (en) | Information processing device, printing device, information processing system, method, and program | |
CN105556942A (zh) | 数字水印 | |
AU2008221525B2 (en) | Information processor, information processing method, and information processing program | |
US9665770B2 (en) | Image processing apparatus with an improved table image detecting unit | |
JP6197840B2 (ja) | 画像処理装置、電子ファイル生成方法及びプログラム | |
US7969618B2 (en) | Image forming apparatus, image forming system, computer readable recording medium, and image forming method | |
JP4866184B2 (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP6025803B2 (ja) | 画像処理装置 | |
JP2007279813A (ja) | 画像処理装置及びプログラム | |
Safonov et al. | Embedding digital hidden data into hardcopy | |
JP5434273B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2017510132A (ja) | 印刷文書の簡単な符号化、認証およびコピー検出システム | |
JP5434272B2 (ja) | 情報処理装置及び情報処理プログラム | |
KITAZAWA et al. | An improvement of a single-dot method for an information-hiding method by applying an error-correcting code |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121226 Termination date: 20200619 |