CN102915530A - 用于分割输入图像的方法和装置 - Google Patents

用于分割输入图像的方法和装置 Download PDF

Info

Publication number
CN102915530A
CN102915530A CN2011102176531A CN201110217653A CN102915530A CN 102915530 A CN102915530 A CN 102915530A CN 2011102176531 A CN2011102176531 A CN 2011102176531A CN 201110217653 A CN201110217653 A CN 201110217653A CN 102915530 A CN102915530 A CN 102915530A
Authority
CN
China
Prior art keywords
boundary edge
edge
axle
boundary
detect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102176531A
Other languages
English (en)
Other versions
CN102915530B (zh
Inventor
李建杰
李献
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CN201110217653.1A priority Critical patent/CN102915530B/zh
Publication of CN102915530A publication Critical patent/CN102915530A/zh
Application granted granted Critical
Publication of CN102915530B publication Critical patent/CN102915530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

公开了用于分割输入图像的方法和装置。输入图像包括一个或更多个文档域。该方法包括:检测输入图像中的边缘,作为检测的边界边缘;将检测的边界边缘投影到至少一个轴上;以及基于投影结果将输入图像分割成至少一个分割区域。

Description

用于分割输入图像的方法和装置
技术领域
本发明涉及图像处理,特别涉及用于分割输入图像的方法和装置。
背景技术
在图像处理领域中,矩形或正方形对象的图像(例如,信用卡、身份证或名片的图像)被称为文档域。文档域通常具有特定的长宽比或者具有特定范围内的长宽比。文档域的最外面的边缘被称为边界边缘。
在图像处理中,用户常常需要应对包含于单个图像中的多个文档域。对所述多个文档域的精确划分可增加用于处理各个对象(各个文档域)的精度。因此,如何在单个图像中划分多个文档域一直是本领域技术人员关心的技术问题。
在2006年6月6日授权的美国专利No.7,058,224公开了基于前景和背景之间的颜色差异检测数字图像数据中的多个图像的装置和方法,该专利在此引入作为参考。
美国专利No.7,058,224的缺点在于,在通过数字照相机拍摄的自然景物图像中,背景和前景中的颜色会是复杂的,这使得难以基于颜色差异区分对象和背景。并且,由于透视畸变,因此,不同的对象之间的尺寸的关系会变得不精确。
在2005年6月6日提交并且在2007年1月4日以公开号US2007-0002375A1公开的美国专利申请11/170,949公开了一种划分和对准多卡图像中的多个卡的方法,该专利申请在此引入作为参考。
在2005年3月22日授权的美国专利No.6,870,549公开了一种产生相关对象的聚类以用于随后的分析的图像处理系统,该专利在此引入作为参考。
美国专利申请11/17,949和美国专利No.6,870,549不能应对包含具有很少的文本信息或不包含文本信息的对象的图像。
在2005年9月27日提交并且在2007年3月29日以公开号US2007-0071324A1公开的美国专利申请11/236,031公开了一种用于确定由图像数据表示的对象的角部的方法,该专利申请在此引入作为参考。
美国专利申请11/236,031的缺点在于,当对象具有透视畸变并且对象之间的距离非常接近但不重叠时,难以找到准确的角部。并且,美国专利申请11/236,031不能应对其中一个对象的角部被其它对象包围的图像。
发明内容
本发明的发明人针对现有技术中的技术问题中的至少一个技术问题提出了一种新技术。
本发明的一个目的是提供一种用于分割包含文档域的输入图像的技术方案。
根据本发明的第一方面,提供了一种用于分割输入图像的方法,其中,输入图像包含一个或更多个文档域,该方法包括:检测输入图像中的边缘,作为检测的边界边缘;将检测的边界边缘投影到至少一个轴上;以及基于投影结果将输入图像分割成至少一个分割区域。
优选地,所述至少一个轴包含第一轴,其中,所述投影步骤包括:将检测的边界边缘投影到第一轴上,以及其中,所述分割步骤包括:基于检测的边界边缘在第一轴上的投影结果沿第一轴分割输入图像。
优选地,所述至少一个轴包含相互垂直的第二轴和第三轴,其中,所述投影步骤包括:分别将检测的边界边缘投影到第二轴和第三轴上,以及其中,所述分割步骤包括:基于检测的边界边缘在第二轴和第三轴上的投影结果分别沿第二轴和第三轴分割输入图像。
优选地,第二轴的方向与检测的边界边缘中的一个边界边缘的方向一致。
优选地,所述方法还包括:选择所述至少一个分割区域中的作为单文档域区域的一个或更多个分割区域,其中,每个单文档域区域包含一个单文档域;以及将所述至少一个分割区域中的被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个分割完成区域,并且将所述至少一个分割区域中的未被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个用于进一步分割的输入图像。
优选地,所述方法还包括:从所述至少一个分割区域中的一个分割区域提取两组检测的边界边缘,其中,所述两组检测的边界边缘中的每一组包含平行的或者在一定程度上平行的两个检测的边界边缘,并且,所述两组检测的边界边缘中的一个组中的检测的边界边缘与所述两组检测的边界边缘中的另一组中的检测的边界边缘垂直或者在一定程度上垂直;检查所述两组检测的边界边缘是否可形成一个单文档域;将能够形成单文档域的两组检测的边界边缘的区域与所述一个分割区域的其它部分分割开;以及将所述两组检测的边界边缘的区域确定为分割完成区域。
优选地,通过以下的步骤来确定一个单文档域:确定分割区域中的检测的边界边缘的计数大于等于4;确定所述分割区域中的最外面的、水平的、检测的边界边缘平行或者在一定程度上平行;确定所述分割区域中的最外面的、垂直的、检测的边界边缘平行或者在一定程度上平行;确定所述最外面的、水平的、检测的边界边缘与所述最外面的、垂直的、检测的边界边缘垂直或者在一定程度上垂直;确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘的外部四边形的长宽比处于预设的长宽比范围内;以及确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘形成一个单文档域。
优选地,所述方法还包括:从两个相邻分割区域选择两个检测的边界边缘,其中,所述两个检测的边界边缘平行或在一定程度上平行,并且,所述两个检测的边界边缘的中心距离小于等于第一预设距离阈值;从所述两个相邻分割区域选择另外两个检测的边界边缘,其中,所述另外两个检测的边界边缘平行或在一定程度上平行,并且所述另外两个检测的边界边缘的中心距离小于等于第二预设距离阈值,所述另外两个检测的边界边缘与所述两个检测的边界边缘垂直或在一定程度上垂直,所述另外两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围内,并且,所述两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述另外两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围内;以及将具有所述两个检测的边界边缘和所述另外两个检测的边界边缘的两个相邻分割区域合并成一个分割区域。
优选地,所述方法还包括:从输入图像去除连通像素的数量小于第一阈值的连通域。
优选地,所述检测步骤还包括:检测输入图像中的边缘;获得分别处于所述边缘的两侧并且分别以预设的偏移距离与所述边缘分离的像素的颜色值;将分别处于所述边缘的两侧的所述像素的颜色值的差值的绝对值与预设的颜色阈值相比较;基于比较结果确定所述边缘是否为非边界边缘;和从输入图像去除非边界边缘。
优选地,在所述分割步骤中,如果两个检测的边界边缘在至少一个轴中的一个轴上的投影不重叠或者在预设的重叠程度内重叠,那么所述两个检测的边界边缘沿所述一个轴被分割。
根据本发明的第二方面,提供了一种用于分割输入图像的分割装置,其中,输入图像包含一个或更多个文档域,该装置包括:检测单元,被配置为用于检测输入图像中的边缘,作为检测的边界边缘;投影单元,被配置为用于将检测的边界边缘投影到至少一个轴上;以及第一分割单元,被配置为基于投影结果将输入图像分割成至少一个分割区域。
优选地,所述至少一个轴包含第一轴,其中,所述投影单元被配置为用于将检测的边界边缘投影到第一轴上,以及其中,所述第一分割单元被配置为基于检测的边界边缘在第一轴上的投影结果沿第一轴分割输入图像。
优选地,所述至少一个轴包含相互垂直的第二轴和第三轴,其中,所述投影单元被配置为用于分别将检测的边界边缘投影到第二轴和第三轴上,以及其中,所述第一分割单元被配置为基于检测的边界边缘在第二轴和第三轴上的投影结果分别沿二轴和第三轴分割输入图像。
优选地,第二轴的方向与检测的边界边缘中的一个的方向一致。
优选地,所述分割装置还包括:单文档域区域选择单元,被配置为用于选择所述至少一个分割区域中的作为单文档域区域的一个或更多个分割区域,其中,每个单文档域区域包含一个单文档域;和第一分割区域确定单元,被配置为用于将所述至少一个分割区域中的被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个分割完成区域,并且将所述至少一个分割区域中的未被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个用于进一步分割的输入图像。
优选地,所述分割装置还包括:提取单元,被配置为用于从所述至少一个分割区域中的一个分割区域提取两组检测的边界边缘,其中,所述两组检测的边界边缘中的每一组包含平行的或者在一定程度上平行的两个检测的边界边缘,并且,所述两组检测的边界边缘中的一个组中的检测的边界边缘与所述两组检测的边界边缘中的另一组中的检测的边界边缘垂直或者在一定程度上垂直;检查单元,被配置为用于检查所述两组检测的边界边缘是否可形成一个单文档域;第二分割单元,被配置为用于将能够形成单文档域的两组检测的边界边缘的区域与所述一个分割区域的其它部分分割开;以及第二分割区域确定单元,被配置为用于将所述两组检测的边界边缘的区域确定为分割完成区域。
优选地,通过单文档域确定单元确定一个单文档域,并且,所述单文档域确定单元包含:第一确定子单元,被配置为用于确定分割区域中的检测的边界边缘的计数大于等于4;第二确定子单元,被配置为用于确定所述分割区域中的最外面的、水平的、检测的边界边缘平行或者在一定程度上平行;第三确定子单元,被配置为用于确定所述分割区域中的最外面的、垂直的、检测的边界边缘平行或者在一定程度上平行;第四确定子单元,被配置为用于确定所述最外面的、水平的、检测的边界边缘与所述最外面的、垂直的、检测的边界边缘垂直或者在一定程度上垂直;第五确定子单元,被配置为用于确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘的外部四边形的长宽比处于预设的长宽比范围内;以及第六确定子单元,被配置为用于确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘形成一个单文档域。
优选地,所述分割装置还包括:第一选择单元,被配置为用于从两个相邻分割区域选择两个检测的边界边缘,其中,所述两个检测的边界边缘平行或在一定程度上平行,并且,所述两个检测的边界边缘的中心距离小于等于第一预设距离阈值;第二选择单元,被配置为用于从所述两个相邻分割区域选择另外两个检测的边界边缘,其中,所述另外两个检测的边界边缘平行或在一定程度上平行,并且所述另外两个检测的边界边缘的中心距离小于等于第二预设距离阈值,所述另外两个检测的边界边缘与所述两个检测的边界边缘垂直或在一定程度上垂直,所述另外两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围内,并且,所述两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述另外两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围内;以及合并单元,被配置为用于将具有所述两个检测的边界边缘和所述另外两个检测的边界边缘的两个相邻分割区域合并成一个分割区域。
优选地,所述分割装置还包括:第一去除单元,被配置为用于从输入图像去除连通像素的数量小于第一阈值的连通域。
优选地,所述检测单元还包括:边缘检测子单元,被配置为用于检测输入图像中的边缘;颜色获得子单元,被配置为用于获得分别处于所述边缘的两侧并且分别以预设的偏移距离与所述边缘分离的像素的颜色值;比较子单元,被配置为用于将分别处于所述边缘的两侧的所述像素的颜色值的差值的绝对值与预设的颜色阈值相比较;非边界边缘确定子单元,被配置为基于比较结果确定所述边缘是否为非边界边缘;和第二去除子单元,被配置为用于从输入图像去除非边界边缘。
优选地,所述第一分割单元进一步被配置为用于:如果两个检测的边界边缘在至少一个轴中的一个轴上的投影不重叠或者在预设的重叠程度内重叠,那么所述两个检测的边界边缘沿所述一个轴被分割。
本发明的发明人发现,在现有技术中,还没有人构想或想到基于投影来分割包含文档域的输入图像的方案。因此,本发明是一种用于分割包含文档域的输入图像的新方法。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分并被结合在说明书中的附图描述了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是表示可用于实现本发明的实施例的计算系统的硬件配置的例子的框图。
图2表示根据本发明的第一实施例的用于分割输入图像的方法的流程图。
图3表示根据本发明的第一实施例的用于分割输入图像的分割装置的框图。
图4表示根据本发明的第二实施例的用于分割输入图像的方法的流程图。
图5表示根据本发明的第二实施例的用于分割输入图像的分割装置的框图。
图6表示根据本发明的第三实施例的用于分割输入图像的方法的流程图。
图7表示根据本发明的第三实施例的用于分割输入图像的分割装置的框图。
图8表示根据本发明的用于确定一个单文档域的方法的流程图。
图9表示根据本发明的用于确定一个单文档域的单文档域确定单元的框图。
图10表示根据本发明的第四实施例的用于分割输入图像的方法的流程图。
图11表示根据本发明的第四实施例的用于分割输入图像的分割装置的框图。
图12表示根据本发明的第五实施例的用于分割输入图像的方法的流程图。
图13表示根据本发明的第五实施例的用于分割输入图像的分割装置的框图。
图14表示根据本发明的用于检测边缘的子步骤的流程图。
图15表示根据本发明的检测单元的框图。
图16表示根据本发明的去除连通域的例子。
图17表示根据本发明的分割输入图像的例子。
图18表示根据本发明的合并分割区域的例子。
图19表示根据本发明的分割输入图像的另一例子。
图20表示根据本发明的分割输入图像的又一例子。
图21表示根据本发明的分割输入图像的又一例子。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是表示可用于实现本发明的实施例的计算系统1000的硬件配置的例子的框图。
如图1所示,计算系统包括计算装置1110。计算装置1110包含通过系统总线1121连接的处理单元1120、系统存储器1130、不可拆卸非易失性存储器接口1140、可拆卸非易失性存储器接口1150、用户输入接口1160、网络接口1170、视频接口1190和输出外设接口1195。
系统存储器1130包含ROM(只读存储器)1131和RAM(随机存取存储器)1132。BIOS(基本输入输出系统)1133驻留于ROM 1131中。操作系统1134、应用程序1135、其它的程序模块1136和一些程序数据1137驻留于RAM 1132中。
诸如硬盘的不可拆卸非易失性存储器1141与不可拆卸非易失性存储器接口1140连接。例如,不可拆卸非易失性存储器1141可存储操作系统1144、应用程序1145、其它的程序模块1146和一些程序数据1147。
诸如软盘驱动器1151和CD-ROM驱动器1155的可拆卸非易失性存储器与可拆卸非易失性存储器接口1150连接。例如,软盘可被插入软盘驱动器1151中,并且,CD(光盘)可被插入CD-ROM驱动器1155中。
诸如鼠标1161和键盘1162的输入设备与用户输入接口1160连接。
计算装置1110可通过网络接口1170与远程计算装置1180连接。例如,网络接口1170可通过局域网络1171与远程计算装置1180连接。作为替代方案,网络接口1170可与调制解调器(调制器-解调器)1172连接,并且调制解调器1172通过广域网络1173与远程计算装置1180连接。
远程计算装置1180可包含存储远程应用程序1185的诸如硬盘的存储器1181。
视频接口1190与监视器1191连接。
输出外设接口1195与打印机1196和扬声器1197连接。
图1所示的计算系统仅是解释性的,并且决不是为了要限制本发明、其应用或用途。
<第一实施例>
本发明的发明人发现,可基于图像中的边缘的投影来分割图像,并且,在现有技术中,没有人将图像分割与图像中的边缘的投影相关联,并且,没有人构想或期望这种关联。因此,本发明的发明人提出本发明。
参照图2和图3详细描述本发明的第一实施例。
图2表示根据本发明的第一实施例的用于分割输入图像的方法2000的流程图。
在本发明中,输入图像包含一个或更多个文档域。文档域在现有技术中是公知的,它是矩形或正方形对象的图像,诸如信用卡、身份证或名片的图像。文档域通常具有特定的长宽比或具有特定的范围内的长宽比。
在方法2000的步骤S2100中,在输入图像中,检测边缘,以作为检测的边界边缘。
可根据现有技术检测输入图像中的边缘。例如,可根据连通域方法检测输入图像中的边缘。检测的边缘中的一些可被视为检测的边界边缘,并且,作为替代方案,所有的检测的边缘可被视为检测的边界边缘。检测的边界边缘可包含文档域的实际边界边缘和/或一些干扰线。检测的边界边缘是可用于分割输入图像的边缘。
在步骤S2200中,检测的边界边缘被投影到至少一个轴上。
在步骤S2300中,输入图像基于投影结果被分割成至少一个分割区域。
例如,在步骤S2300中,如果两个检测的边界边缘在至少一个轴中的一个轴上的投影不重叠或者在预设的重叠程度内重叠,那么沿所述一个轴分割所述两个检测的边界边缘。
例如,在一个例子中,所述至少一个轴可包含第一轴。在步骤S2200中,检测的边界边缘被投影到第一轴上。在步骤S2300中,输入图像基于检测的边界边缘在第一轴上的投影结果而沿第一轴被分割。
例如,在另一例子中,所述至少一个轴可包含相互垂直的第二轴和第三轴。在步骤S2200中,检测的边界边缘分别被投影到第二和第三轴上。在步骤S2300中,分别基于检测的边界边缘在第二和第三轴上的投影结果沿第二和第三轴分割输入图像。
例如,在另一例子中,上述的第二轴的方向可与检测的边界边缘中的一个边界边缘的方向一致。
例如,第一轴和第二轴可以是同一轴。
图3表示根据本发明的第一实施例的用于分割输入图像的分割装置3000的框图。
分割装置3000包含检测单元3100、投影单元3200和第一分割单元3300。
检测单元3100可接收输入图像。检测单元3100被配置为用于检测输入图像中的边缘,以作为检测的边界边缘。
投影单元3200被配置为用于将检测的边界边缘投影到至少一个轴上。
第一分割单元3300被配置为基于投影结果将输入图像分割成至少一个分割区域。
例如,第一分割单元3300可被配置为用于,如果两个检测的边界边缘在至少一个轴中的一个轴上的投影不重叠或者在预设的重叠程度内重叠,那么沿所述一个轴分割所述两个检测的边界边缘。
例如,在一个例子中,所述至少一个轴可包含第一轴。投影单元3200被配置为用于将检测的边界边缘投影到第一轴上。第一分割单元3300被配置为基于检测的边界边缘在第一轴上的投影结果沿第一轴分割输入图像。
例如,在另一例子中,所述至少一个轴可包含相互垂直的第二轴和第三轴。投影单元3200被配置为分别将检测的边界边缘投影到第二轴和第三轴上。第一分割单元3300被配置为用于分别基于检测的边界边缘在第二轴和第三轴上的投影结果沿第二轴和第三轴分割输入图像。
例如,在另一例子中,上述的第二轴的方向可与检测的边界边缘中的一个边界边缘的方向一致。
<第二实施例>
参照图4和图5详细描述本发明的第二实施例。出于简明的原因,第二实施例的与第一实施例相比重复的部分被省略。
图4表示根据本发明的第二实施例的用于分割输入图像的方法4000的流程图。
方法4000中的步骤S2100、S2200和S2300可与方法2000中的那些步骤相同,并由此省略它们的描述。
在步骤S4400中,选择所述至少一个分割区域中的作为单文档域区域的一个或更多个分割区域。
在本发明中,单文档域区域指的是仅包含一个单文档域的区域。因此,在本发明中,每个单文档域区域将包含一个单文档域。
用于确定单文档域区域的许多方法在现有技术中是已知的,因此在这里不被详细描述。将在后面参照图8和图9描述由本发明的发明人提出的一种用于确定单文档域区域的新方法。
在步骤S4500中,所述至少一个分割区域中的被选择为单文档域区域的一个或更多个分割区域被确定为一个或更多个分割完成区域,并且,所述至少一个分割区域中的未被选择为单文档域区域的一个或更多个分割区域被确定为一个或更多个用于进一步分割的输入图像。
例如,可根据其它的方法和/或根据本发明的其它的实施例进一步分割所述一个或更多个用于进一步分割的输入图像。
图5表示根据本发明第二实施例的用于分割输入图像的分割装置5000的框图。
分割装置5000包含检测单元3100、投影单元3200、第一分割单元3300、单文档域区域选择单元5400和第一分割区域确定单元5500。
检测单元3100、投影单元3200和第一分割单元3300可与第一实施例中描述的那些单元相同,并因此省略它们的描述。
单文档域区域选择单元5400可被配置为用于选择所述至少一个分割区域中的作为单文档域区域的一个或更多个分割区域。在本发明中,每个单文档域区域可包含一个单文档域。
例如,分割装置5000可替代性地包含由本发明的发明人提出的单文档域确定单元9000。单文档域确定单元9000与单文档域区域选择单元5400耦合并且可被用于确定单文档域。将在后面参照图8和图9描述单文档域确定单元9000。
第一分割区域确定单元5500可被配置为用于将所述至少一个分割区域中的被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个分割完成区域,并且将所述至少一个分割区域中的未被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个用于进一步分割的输入图像。
<第三实施例>
参照图6和图7详细描述本发明的第三实施例。出于简明的原因,第三实施例的与第一实施例相比重复的部分被省略。
图6表示根据本发明的第三实施例的用于分割输入图像的方法6000的流程图。
方法6000中的步骤S2100、S2200和S2300可与方法2000中描述的那些步骤相同,并由此省略它们的描述。
在步骤S6400中,从所述至少一个分割区域中的一个分割区域提取两组检测的边界边缘。所述两组检测的边界边缘中的每个组包含平行或者在一定程度上平行的两个检测的边界边缘。所述两组检测的边界边缘中的一个组中的检测的边界边缘与所述两组检测的边界边缘中的另一组中的检测的边界边缘垂直或者在一定程度上垂直。
本领域技术人员可以理解,由于透视畸变等原因,在输入图像中,文档域的边缘可能不精确地平行或垂直。因此,技术人员会根据实际的设计,将在一定程度上平行或垂直的边缘视为平行或垂直的边缘。例如,如果两个边缘之间的角度小于等于15度,那么这两个边缘被视为在一定程度上平行。例如,如果两个边界边缘之间的角度小于等于105度且大于等于75度,那么这两个边缘被视为在一定程度上垂直。在整个说明书和权利要求中在这种意义上使用措词“平行”和“垂直”。
本领域技术人员可以理解,以上的角度程度(例如从0到15度的角度范围和从75到105度的角度范围)仅被用作例子,并且决不限制本发明的范围。因此,本领域技术人员可以理解,在各步骤或单元(或子单元)中使用的术语“在一定程度上”根据实际的设计可意味着不同的程度或相同的程度。
在步骤S6500中,检查这两组检测的边界边缘是否可形成一个单文档域。
用于确定单文档域区域的许多方法在现有技术中是已知的,并因此在这里不被详细描述。将在后面参照图8和图9描述由本发明的发明人提出的一种用于确定单文档域区域的新方法。
在步骤S6600中,将可形成单文档域的两组检测的边界边缘的区域与所述一个分割区域中的其它部分分割开。
在步骤S6700中,所述两组检测的边界边缘的区域被确定为分割完成区域。
例如,根据本实施例或其它的实施例,所述一个分割区域的所述其它部分可被用作用于进一步分割的输入图像。
图7表示根据本发明的第三实施例的用于分割输入图像的分割装置7000的框图。
分割装置7000包括检测单元3100、投影单元3200、第一分割单元3300、提取单元7400、检查单元7500、第二分割单元7600和第二分割区域确定单元7700。
检测单元3100、投影单元3200和第一分割单元3300可与第一实施例中描述那些单元相同,并因此省略它们的描述。
提取单元7400被配置为用于从所述至少一个分割区域中的一个分割区域提取两组检测的边界边缘。所述两组检测的边界边缘中的每个组包含平行或者在一定程度上平行的两个检测的边界边缘。所述两组检测的边界边缘中的一个组中的检测的边界边缘与所述两组检测的边界边缘中的另一组中的检测的边界边缘垂直或者在一定程度上垂直。
检查单元7500被配置为用于检查这两组检测的边界边缘是否可形成一个单文档域。
例如,分割装置7000可替代性地包含由本发明的发明人提出的单文档域确定单元9000。单文档域确定单元9000与检查单元7500耦合并且可被用于确定单文档域。将在后面参照图8和图9描述单文档域确定单元9000。
第二分割单元7600被配置为用于将可形成单文档域的两组检测的边界边缘的区域与所述一个分割区域中的其它部分分割开。
第二分割区域确定单元7700被配置为用于将所述两组检测的边界边缘的区域确定为分割完成区域。
例如,根据本实施例或其它的实施例,所述一个分割区域中的所述其它部分可被用作用于进一步分割的输入图像。
应当理解,第三实施例可与第二实施例组合。
例如,可以在图4中的步骤S4400和S4500之后、或者之前、或者与其同时地执行图6中的步骤S6400、S6500、S6600和S6700。
例如,图7中的提取单元7400、检查单元7500、第二分割单元7600和第二分割区域确定单元7700可与第一分割区域确定单元5500的输出耦合,以接收由第一分割区域确定单元5500输出的用于进一步分割的输入图像。
本发明的发明人发现,通过第三实施例与第一和/或第二实施例的组合,将实现分割的速度和有效性的良好平衡。
<单文档域>
将在后面参照图8和图9描述由本发明的发明人提出的用于确定单文档域区域的新方法。
图8表示根据本发明的用于确定一个单文档域的方法8000的流程图。
在步骤S8100中,确定分割区域中的检测的边界边缘的计数大于等于4。
分割区域为例如图4中的步骤S4400中的所选择的一个或更多个分割区域或图6中的步骤S6500中的两组检测的边界边缘的区域。
在步骤8200中,确定分割区域中的最外面的、水平的、检测的边界边缘平行或者在一定程度上平行。
在步骤8300中,确定分割区域中的最外面的、垂直的、检测的边界边缘平行或者在一定程度上平行。
本领域技术人员可以理解,可根据实际设计限定水平的、检测的边界边缘和垂直的、检测的边界边缘。例如,关于轴(例如,输入图像的X轴)具有小于等于45度并且大于等于0度的角度的检测的边界边缘可被定义为水平的、检测的边界边缘。例如,关于轴(例如,输入图像的X轴)具有小于等于90度并且大于等于45度的角度的检测的边界边缘可被定义为垂直的、检测的边界边缘。在整个说明书和权利要求中在这种意义上使用措词“水平”和“垂直”。
在步骤8400中,确定最外面的、水平的、检测的边界边缘与最外面的、垂直的、检测的边界边缘垂直或者在一定程度上垂直。
在步骤8500中,确定最外面的、水平的、检测的边界边缘和最外面的、垂直的、检测的边界边缘的外部四边形的长宽比处于预设的长宽比范围内。
例如,预设的长宽比范围以文档域的实际长宽比为中心。例如,文档域的长宽比为0.5,因此,一个预设的长宽比范围可以为[0.4,0.6]。
在步骤S8600中,确定最外面的、水平的、检测的边界边缘和最外面的、垂直的、检测的边界边缘形成一个单文档域。
图9表示根据本发明的用于确定一个单文档域的单文档域确定单元9000的框图。
单文档域确定单元9000包含第一确定子单元9100、第二确定子单元9200、第三确定子单元9300、第四确定子单元9400、第五确定子单元9500和第六确定子单元9600。
第一确定子单元9100被配置为用于确定分割区域中的检测的边界边缘的计数大于等于4。
分割区域为例如由图5中的单文档域区域选择单元5400选择的一个或更多个分割区域或由图7中的检查单元7500检查的两组检测的边界边缘的区域。
第二确定子单元9200被配置为用于确定分割区域中的最外面的、水平的、检测的边界边缘平行或者在一定程度上平行。
第三确定子单元9300被配置为用于确定分割区域中的最外面的、垂直的、检测的边界边缘平行或在一定程度上平行。
第四确定子单元9400被配置为用于确定最外面的、水平的、检测的边界边缘与最外面的、垂直的、检测的边界边缘垂直或者在一定程度上垂直。
第五确定子单元被配置为用于确定最外面的、水平的、检测的边界边缘和垂直的、检测的边界边缘的外部四边形的长宽比处于预设的长宽比范围内。
例如,一个预设的长宽比范围以文档域的实际长宽比为中心。例如,文档域的长宽比为0.5,因此,一个预设的长宽比范围可以为[0.4,0.6]。
第六确定子单元9600被配置为用于确定最外面的、水平的、检测的边界边缘和最外面的、垂直的、检测的边界边缘形成一个单文档域。
该单文档域确定技术可与前面的第一实施例、第二实施例和第三实施例组合,并且可与后面描述的第四实施例和第五实施例组合。
<第四实施例>
参照图10和图11详细描述本发明的第四实施例。出于简明的原因,第四实施例的与第一实施例相比重复的部分被省略。
图10表示根据本发明的第四实施例的用于分割输入图像的方法10000的流程图。
方法10000中的步骤S2100、S2200和S2300可与方法2000中所描述的那些步骤相同,并由此省略它们的描述。
在步骤S10400中,选择来自两个相邻分割区域的两个检测的边界边缘。所述两个检测的边界边缘平行或在一定程度上平行。所述两个检测的边界边缘的中心距离小于等于第一预设距离阈值。
一般地,在图像处理中,事先获知一个单文档域的两个相对的检测的边界边缘的中心距离。由于透视畸变,因此,两个相对的检测的边界边缘的中心距离将改变,但将会小于等于第一预设距离阈值。可以在机器或分割装置中固定第一预设距离阈值或者可手动设定第一预设距离阈值。
在步骤S10500中,选择来自两个相邻的检测区域的另外两个检测的边界边缘。所述另外两个检测的边界边缘平行或在一定程度上平行,并且所述另外两个检测的边界边缘的中心距离小于等于第二预设距离阈值。
第二预设距离阈值与第一预设距离阈值类似,并且可以在机器或分割装置中被固定或者可被手动设定。
所述另外两个检测的边界边缘与所述两个检测的边界边缘垂直或在一定程度上垂直。
所述另外两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围内,并且,所述两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述另外两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围内。
边缘的方向轴意味着沿着边缘的方向的轴。例如,所述两个检测的边界边缘中的任一个的方向轴是所述两个检测的边界边缘中的任一个的边缘线的方向上的轴,并且,所述另外两个检测的边界边缘中的任一个的方向轴是所述另外两个检测的边界边缘中的任一个的边缘线的方向上的轴。
例如,如图18所示,在B4-2或B4-4的方向轴上,B4-2和B4-4的投影的范围落入B4-1和B4-3的投影的范围内。
在步骤S10600中,具有这样的两个检测的边界边缘和这样的另外两个检测的边界边缘的两个相邻分割区域被合并成一个分割区域。
图11表示根据本发明的第四实施例的用于分割输入图像的分割装置11000的框图。
分割装置11000包括检测单元3100、投影单元3200、第一分割单元3300、第一选择单元11400、第二选择单元11500和合并单元11600。
检测单元3100、投影单元3200和第一分割单元3300可与第一实施例描述的那些单元相同,并因此省略它们的描述。
第一选择单元11400被配置为用于从两个相邻分割区域选择两个检测的边界边缘。所述两个检测的边界边缘平行或在一定程度上平行。所述两个检测的边界边缘的中心距离小于等于第一预设距离阈值。
在上面已经参照图10解释了第一预设距离阈值。
第二选择单元11500被配置为用于从两个相邻分割区域选择另外两个检测的边界边缘。所述另外两个检测的边界边缘平行或在一定程度上平行,并且,所述另外两个检测的边界边缘的中心距离小于等于第二预设距离阈值。
在上面已经参照图10解释了第二预设距离阈值。
所述另外两个检测的边界边缘与所述两个检测的边界边缘垂直或在一定程度上垂直。
所述另外两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围内,并且,所述两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述另外两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围内。
合并单元11600被配置为用于将具有所述两个检测的边界边缘和所述另外两个检测的边界边缘的两个相邻分割区域合并成一个分割区域。
应当理解,第四实施例可与第二实施例和第三实施例组合。
例如,可以在图4中的步骤S4400和S4500的步骤和/或图6中的步骤S6400、S6500、S6600和S6700之后、或者之前、或者与其同时地执行步骤S10400、S10500和S10600。
例如,可在图5的单文档域区域选择单元5400和/或图7的提取单元7400之前插入第一选择单元11400、第二选择单元11500和合并单元11600。
<第五实施例>
参照图12和图13详细描述本发明的第五实施例。出于简明的原因,第五实施例的与第一实施例相比重复的部分被省略。
图12表示根据本发明的第五实施例的用于分割输入图像的方法12000的流程图。
在步骤S12001中,从输入图像去除连通像素的数量小于第一阈值的连通域。
连通像素的数量小于第一阈值的连通域不能被视为边缘,并因此可从输入图像被去除。
可通过实验获得第一阈值。例如,第一阈值可以为图像宽度的十分之一(0.1×Image Width,Image Width是输入图像的宽度)。
方法12000中的步骤S2100、S2200和S2300可与方法2000中描述的那些步骤相同,并由此省略它们的描述。
图13表示根据本发明的第五实施例的用于分割输入图像的分割装置13000的框图。
分割装置13000包括第一去除单元13001、检测单元3100、投影单元3200和第一分割单元3300。
第一去除单元13001被配置为用于从输入图像去除连通像素的数量小于第一阈值的连通域。
如上面所述的那样获得第一阈值。
检测单元3100、投影单元3200和第一分割单元3300可与第一实施例中所描述的那些单元相同,并因此省略它们的描述。
应当理解,第五实施例可与第二实施例和/或第三实施例和/或第四实施例组合。
例如,可以在图4、图6或图10中的步骤S2100之前执行S12001的步骤。
例如,可在图5、图7或图11的检测单元3100之前配置第一去除单元13001。
<边界边缘检测>
参照图14和图15描述一种新的边界边缘检测技术。
本发明的发明人发现可在分割之前从输入图像去除干扰线。
因此,本发明的发明人提出了一种用于去除干扰线的技术。该技术可改善输入图像的分割。
图14表示前面所述的步骤S2100的子步骤的流程图。
在步骤S2110中,检测输入图像中的边缘。可根据现有技术的方法执行检测。例如,可根据在现有技术中公知的连通域方法执行检测。
在步骤S2120中,获得分别处于所述边缘的两侧并且分别以预设的偏移距离与所述边缘分离的像素的颜色值。
可通过实验获得所述预设的偏移距离。例如,所述预设的偏移距离可以为8个像素。
在步骤S2130中,将分别处于所述边缘的两侧的像素的颜色值的差值的绝对值与预设的颜色阈值相比较。
可通过实验获得所述预设的颜色阈值。
例如,像素的颜色值可以为,但不限于,灰度级或RGB值等。在灰度级的情况下,所述预设的颜色阈值可以为8个灰度级。
在步骤S2140中,基于比较结果确定所述边缘是否为非边界边缘。
例如,如果分别处于所述边缘的两侧的像素的颜色值的差值的绝对值中的至少一个差值的绝对值小于所述预设的颜色阈值,那么所述边缘是非边界边缘。
在一个例子中,获得分别处于所述边缘内的所考虑的像素的两侧的像素的颜色值的差值的绝对值,并且将其与预设的颜色阈值相比较。如果绝对值小于预设的颜色阈值,那么所述边缘中的所考虑的所述像素被视为非边界像素。
如果所述边缘中的非边界像素的数量与所述边缘中的总像素的数量的比大于等于特定比值(例如0.5),那么所述边缘被视为非边界边缘。
在步骤S2150中,从输入图像去除非边界边缘。
图15表示前面描述的检测单元3100的子单元的框图。
检测单元3100可包括边缘检测子单元3110、颜色获得子单元3120、比较子单元3130、非边界边缘确定子单元3140和第二去除子单元3150。
边缘检测子单元3110被配置为用于检测输入图像中的边缘。可根据现有技术的方法执行检测。例如,可根据在现有技术中公知的连通域方法执行检测。
颜色获得子单元3120被配置为用于获得分别处于所述边缘的两侧并且分别以预设的偏移距离与所述边缘分离的像素的颜色值。
可通过实验获得预设的偏移距离。例如,预设的偏移距离可以为8个像素。
比较子单元3130被配置为用于将分别处于所述边缘的两侧的像素的颜色值的差值的绝对值与预设的颜色阈值相比较。
可通过实验获得预设的颜色阈值。
例如,像素的颜色值可以为灰度级。预设的颜色阈值可以为8个灰度级。
非边界边缘确定子单元3140被配置为基于比较结果确定所述边缘是否为非边界边缘。
例如,如果分别处于所述边缘的两侧的像素的颜色值的差值的绝对值中的至少一个小于预设的颜色阈值,那么所述边缘为非边界边缘。
在一个例子中,获得分别处于所述边缘中的所考虑的像素的两侧的像素的颜色值的差值的绝对值,并且将其与预设的颜色阈值相比较。如果绝对值小于预设的颜色阈值,那么所述边缘中的该像素被视为非边界边缘。
如果所述边缘中的非边界像素的数量与所述边缘中的总像素的数量的比大于等于特定比值(例如0.5),那么所述边缘被视为非边界边缘。
第二去除子单元3150被配置为用于从输入图像去除非边界边缘。
该边界边缘检测技术可与前面的实施例中的任一个组合。
<例子>
参照图16~21描述本发明的一些例子。
图16表示根据本发明的去除连通域的例子。例如可通过使用第五实施例的方法和参照图14和15描述的根据本发明的边界边缘检测技术来去除连通域。
在图16中,输入图像为A-1。例如根据连通域方法检测输入图像中的边缘。
例如,去除连通像素的数量小于0.1×Image Width的连通域,其中,Image Width是输入图像的宽度。然后,获得输入图像A-2。
对于输入图像A-2中的一个边缘,获得处于所述一个边缘中的各边缘像素的两侧并且与所述一个边缘分隔开8个像素的像素的灰度级值。对于各边缘像素,获得处于两侧的像素的灰度级值的差值的绝对值。
例如,在图16中,边缘e1包含边缘像素ep1。像素pp1和pp2处于边缘像素ep1的两侧并且与边缘e1分开8个像素。获得像素pp1和pp2的灰度级值。然后,获得像素pp1和pp2的灰度级值的差值的绝对值。
如果差值的绝对值小于8个灰度级,那么该边缘像素被视为非边界像素。
例如,如果像素pp1和pp2的灰度级值的差值的绝对值小于8个灰度级,那么该边缘像素ep1被视为非边界像素。
如果所述一个边缘中的非边界像素的数量与所述一个边缘中的总像素的数量的比大于等于0.5,那么所述一个边缘为非边界边缘。
通过去除非边界边缘获得输入图像A-3。
图17表示根据本发明的沿第一轴分割输入图像的例子。
可以看出,文档域B1具有在第一轴上投影为S1的边缘B1-1~B1-5。因此,B1的区域可被虚线D1分割。
可以看出,可仅通过B1-1和B1-3确定S1。
文档域B2具有在第一轴上投影为S2的边缘B2-1~B2-5。文档域B3具有在第一轴上投影为S3的边缘B3-1~B3-5。
S2和S3以p1重叠。根据本发明,如果两个检测的边界边缘在一个轴上的投影在预设的重叠程度内重叠(例如,0.3×(两个检测的边界边缘中的任一个在一个轴上的投影)),那么可沿所述一个轴分割所述两个检测的边界边缘。在本实施例中,由于p1小于0.3×(B2-3在第一轴上的投影),或者,由于p1小于0.3×(B3-2在第一轴上的投影),因此,可通过虚线D2将B2的区域与B3的区域分割开。
可通过虚线D3将B3与B4分割开。
文档域B4具有边缘B4-1~B4-5。由于B4的边界边缘中的一些像素是缺失的,因此,B4在第一轴上被投影为S4-1和S4-2并且通过虚线D4被分割。
如图18所示,边缘B4-1和B4-3(例如,与第四实施例中的所述两个检测的边界边缘对应)在一定程度上平行(例如,它们之间的角度小于等于15度)。边缘B4-1和B4-3的中心距离小于等于1.2×MaxLenB4-1,B4-3。MaxLenB4-1,B4-3是B4-1和B4-3中的最大长度。
边缘B4-1和B4-3在边缘B4-1和B4-3中的一个(例如,边缘B4-1)的方向轴上的投影以边缘B4-1和B4-3的投影中的任一个的70%重叠。
边缘B4-2和B4-4(例如,与第四实施例中的所述另外两个检测的边界边缘对应)在一定程度上平行。边缘B4-2和B4-4的中心距离小于等于3×MaxLenB4-2,B4-4。MaxLenB4-2,B4-4是边缘B4-2和B4-4中的最大长度。
另外,可进一步确定边缘B4-2和B4-4的中心距离大于1.2×MaxLenB4-2,B4-4
边缘B4-2和B4-4在边缘B4-2和B4-4中的一个(例如,边缘B4-2)的方向轴上的投影以边缘B4-2和B4-4的投影(即,图18所示的B4-2和B4-4的范围)中的任一个的70%重叠。
边缘B4-1和B4-3在一定程度上与边缘B4-2和B4-4垂直。
如图18所示,B4-2和B4-4在B4-2或B4-4的方向轴上的投影范围落B4-1和B4-3在边缘B4-2或B4-4的方向轴上的投影范围内。B4-1和B4-3在B4-1或B4-3的方向轴上的投影范围落入B4-2和B4-4在B4-1或B4-3的方向轴上的投影范围(未示出)内。
因此,通过虚线D4分割的区域被合并成一个分割区域。例如,根据本发明的第四实施例,被虚线D4分割的区域合并成一个分割区域。
在图19中,文档域B5具有在第二轴上投影为S5并且在第三轴上投影为S5′的边缘B5-1~B5-5,文档域B6具有在第二轴上投影为S6并且在第三轴上投影为S6′的边缘B6-1~B6-5,并且,文档域B7具有在第二轴上投影为S7并且在第三轴上投影为S7′的边缘B7-1~B7-5。
因此,可通过虚线D5和D6分割B5、B6和B7的区域。
在图20中,文档域B8具有边缘B8-1~B8-5,文档域B9具有边缘B9-1~B9-5,并且,第二轴沿文档域B8的边界边缘B8-1或B8-3的方向被设定。文档域B8的边缘B8-1~B8-5在第二轴上被投影为S8,并且,文档域B9的边缘B9-1~B9-5在第二轴上被投影为S9。
通过虚线D7分割B8和B9的区域。
根据本发明,文档域B1~B9可被确定为单文档域区域,并由此可被确定为分割完成区域。
图21表示第三实施例的例子。
在图21中,存在三个文档区域G1、G2和G3。文档域G1包含4个边缘,G1-1~G1-4。
边缘G1-1和G1-3是平行的,并且,边缘G1-2和G1-4是平行的。边缘G1-1和G1-3与边缘G1-2和G1-4垂直。
例如,文档域G1的实际长宽比为0.5。最外面的边缘G1-1~G1-4的外部四边形的长宽比处于0.4~0.6的范围中。
因此,G1中的边缘G1-1、G1-2、G1-3和G1-4可形成一个单文档域。然后,将G1与G2和G3分割开。
可以以相同的方式分割或者可根据本发明的第一实施例分割G2和G3。
应用
可能以许多方式来实现本发明的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式具体说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

Claims (22)

1.一种用于分割输入图像的方法,其中,输入图像包含一个或更多个文档域,该方法包括:
检测输入图像中的边缘,作为检测的边界边缘;
将检测的边界边缘投影到至少一个轴上;以及
基于投影结果将输入图像分割成至少一个分割区域。
2.根据权利要求1的方法,其中,所述至少一个轴包含第一轴,
其中,所述投影步骤包括:将检测的边界边缘投影到第一轴上,以及
其中,所述分割步骤包括:基于检测的边界边缘在第一轴上的投影结果沿第一轴分割输入图像。
3.根据权利要求1的方法,其中,所述至少一个轴包含相互垂直的第二轴和第三轴,
其中,所述投影步骤包括:分别将检测的边界边缘投影到第二轴和第三轴上,以及
其中,所述分割步骤包括:基于检测的边界边缘在第二轴和第三轴上的投影结果分别沿第二轴和第三轴分割输入图像。
4.根据权利要求3的方法,其中,第二轴的方向与检测的边界边缘中的一个边界边缘的方向一致。
5.根据权利要求1的方法,还包括:
选择所述至少一个分割区域中的作为单文档域区域的一个或更多个分割区域,其中,每个单文档域区域包含一个单文档域;和
将所述至少一个分割区域中的被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个分割完成区域,并且将所述至少一个分割区域中的未被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个用于进一步分割的输入图像。
6.根据权利要求1的方法,还包括:
从所述至少一个分割区域中的一个分割区域提取两组检测的边界边缘,其中,所述两组检测的边界边缘中的每一组包含平行的或者在一定程度上平行的两个检测的边界边缘,并且,所述两组检测的边界边缘中的一个组中的检测的边界边缘与所述两组检测的边界边缘中的另一组中的检测的边界边缘垂直或者在一定程度上垂直;
检查所述两组检测的边界边缘是否可形成一个单文档域;
将能够形成单文档域的两组检测的边界边缘的区域与所述一个分割区域的其它部分分割开;以及
将所述两组检测的边界边缘的区域确定为分割完成区域。
7.根据权利要求5或6的方法,其中,通过以下的步骤来确定一个单文档域:
确定分割区域中的检测的边界边缘的计数大于等于4;
确定所述分割区域中的最外面的、水平的、检测的边界边缘平行或者在一定程度上平行;
确定所述分割区域中的最外面的、垂直的、检测的边界边缘平行或者在一定程度上平行;
确定所述最外面的、水平的、检测的边界边缘与所述最外面的、垂直的、检测的边界边缘垂直或者在一定程度上垂直;
确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘的外部四边形的长宽比处于预设的长宽比范围内;以及
确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘形成一个单文档域。
8.根据权利要求1的方法,还包括:
从两个相邻分割区域选择两个检测的边界边缘,其中,所述两个检测的边界边缘平行或在一定程度上平行,并且,所述两个检测的边界边缘的中心距离小于等于第一预设距离阈值;
从所述两个相邻分割区域选择另外两个检测的边界边缘,其中,所述另外两个检测的边界边缘平行或在一定程度上平行,并且所述另外两个检测的边界边缘的中心距离小于等于第二预设距离阈值,所述另外两个检测的边界边缘与所述两个检测的边界边缘垂直或在一定程度上垂直,所述另外两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围内,并且,所述两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述另外两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围内;以及
将具有所述两个检测的边界边缘和所述另外两个检测的边界边缘的两个相邻分割区域合并成一个分割区域。
9.根据权利要求1的方法,还包括:
从输入图像去除连通像素的数量小于第一阈值的连通域。
10.根据权利要求1的方法,其中,所述检测步骤还包括:
检测输入图像中的边缘;
获得分别处于所述边缘的两侧并且分别以预设的偏移距离与所述边缘分离的像素的颜色值;
将分别处于所述边缘的两侧的所述像素的颜色值的差值的绝对值与预设的颜色阈值相比较;
基于比较结果确定所述边缘是否为非边界边缘;和
从输入图像去除非边界边缘。
11.根据权利要求1的方法,其中,在所述分割步骤中,如果两个检测的边界边缘在所述至少一个轴中的一个轴上的投影不重叠或者在预设的重叠程度内重叠,那么所述两个检测的边界边缘沿所述一个轴被分割。
12.一种用于分割输入图像的分割装置,其中,输入图像包含一个或更多个文档域,该装置包括:
检测单元,被配置为用于检测输入图像中的边缘,作为检测的边界边缘;
投影单元,被配置为用于将检测的边界边缘投影到至少一个轴上;以及
第一分割单元,被配置为基于投影结果将输入图像分割成至少一个分割区域。
13.根据权利要求12的分割装置,其中,所述至少一个轴包含第一轴,
其中,所述投影单元被配置为用于将检测的边界边缘投影到第一轴上,以及
其中,所述第一分割单元被配置为基于检测的边界边缘在第一轴上的投影结果沿第一轴分割输入图像。
14.根据权利要求12的分割装置,其中,所述至少一个轴包含相互垂直的第二轴和第三轴,
其中,所述投影单元被配置为用于分别将检测的边界边缘投影到第二轴和第三轴上,以及
其中,所述第一分割单元被配置为基于检测的边界边缘在第二轴和第三轴上的投影结果分别沿二轴和第三轴分割输入图像。
15.根据权利要求14的分割装置,其中,第二轴的方向与检测的边界边缘中的一个边界边缘的方向一致。
16.根据权利要求12的分割装置,还包括:
单文档域区域选择单元,被配置为用于选择所述至少一个分割区域中的作为单文档域区域的一个或更多个分割区域,其中,每个单文档域区域包含一个单文档域;和
第一分割区域确定单元,被配置为用于将所述至少一个分割区域中的被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个分割完成区域,并且将所述至少一个分割区域中的未被选择为单文档域区域的一个或更多个分割区域确定为一个或更多个用于进一步分割的输入图像。
17.根据权利要求12的分割装置,还包括:
提取单元,被配置为用于从所述至少一个分割区域中的一个分割区域提取两组检测的边界边缘,其中,所述两组检测的边界边缘中的每一组包含平行的或者在一定程度上平行的两个检测的边界边缘,并且,所述两组检测的边界边缘中的一个组中的检测的边界边缘与所述两组检测的边界边缘中的另一组中的检测的边界边缘垂直或者在一定程度上垂直;
检查单元,被配置为用于检查所述两组检测的边界边缘是否可形成一个单文档域;
第二分割单元,被配置为用于将能够形成单文档域的两组检测的边界边缘的区域与所述一个分割区域的其它部分分割开;以及
第二分割区域确定单元,被配置为用于将所述两组检测的边界边缘的区域确定为分割完成区域。
18.根据权利要求16或17的分割装置,其中,通过单文档域确定单元确定一个单文档域,并且,所述单文档域确定单元包含:
第一确定子单元,被配置为用于确定分割区域中的检测的边界边缘的计数大于等于4;
第二确定子单元,被配置为用于确定所述分割区域中的最外面的、水平的、检测的边界边缘平行或者在一定程度上平行;
第三确定子单元,被配置为用于确定所述分割区域中的最外面的、垂直的、检测的边界边缘平行或者在一定程度上平行;
第四确定子单元,被配置为用于确定所述最外面的、水平的、检测的边界边缘与所述最外面的、垂直的、检测的边界边缘垂直或者在一定程度上垂直;
第五确定子单元,被配置为用于确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘的外部四边形的长宽比处于预设的长宽比范围内;以及
第六确定子单元,被配置为用于确定所述最外面的、水平的、检测的边界边缘和所述最外面的、垂直的、检测的边界边缘形成一个单文档域。
19.根据权利要求12的分割装置,还包括:
第一选择单元,被配置为用于从两个相邻分割区域选择两个检测的边界边缘,其中,所述两个检测的边界边缘平行或在一定程度上平行,并且,所述两个检测的边界边缘的中心距离小于等于第一预设距离阈值;
第二选择单元,被配置为用于从所述两个相邻分割区域选择另外两个检测的边界边缘,其中,所述另外两个检测的边界边缘平行或在一定程度上平行,并且所述另外两个检测的边界边缘的中心距离小于等于第二预设距离阈值,所述另外两个检测的边界边缘与所述两个检测的边界边缘垂直或在一定程度上垂直,所述另外两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述两个检测的边界边缘在所述另外两个检测的边界边缘中的任一个的方向轴上的投影的范围内,并且,所述两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围落入所述另外两个检测的边界边缘在所述两个检测的边界边缘中的任一个的方向轴上的投影的范围内;以及
合并单元,被配置为用于将具有所述两个检测的边界边缘和所述另外两个检测的边界边缘的两个相邻分割区域合并成一个分割区域。
20.根据权利要求12的分割装置,还包括:
第一去除单元,被配置为用于从输入图像去除连通像素的数量小于第一阈值的连通域。
21.根据权利要求12的分割装置,其中,所述检测单元还包括:
边缘检测子单元,被配置为用于检测输入图像中的边缘;
颜色获得子单元,被配置为用于获得分别处于所述边缘的两侧并且分别以预设的偏移距离与所述边缘分离的像素的颜色值;
比较子单元,被配置为用于将分别处于所述边缘的两侧的所述像素的颜色值的差值的绝对值与预设的颜色阈值相比较;
非边界边缘确定子单元,被配置为基于比较结果确定所述边缘是否为非边界边缘;和
第二去除子单元,被配置为用于从输入图像去除非边界边缘。
22.根据权利要求12的分割装置,其中,所述第一分割单元进一步被配置为用于:如果两个检测的边界边缘在所述至少一个轴中的一个轴上的投影不重叠或者在预设的重叠程度内重叠,那么所述两个检测的边界边缘沿所述一个轴被分割。
CN201110217653.1A 2011-08-01 2011-08-01 用于分割输入图像的方法和装置 Active CN102915530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110217653.1A CN102915530B (zh) 2011-08-01 2011-08-01 用于分割输入图像的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110217653.1A CN102915530B (zh) 2011-08-01 2011-08-01 用于分割输入图像的方法和装置

Publications (2)

Publication Number Publication Date
CN102915530A true CN102915530A (zh) 2013-02-06
CN102915530B CN102915530B (zh) 2015-11-25

Family

ID=47613885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110217653.1A Active CN102915530B (zh) 2011-08-01 2011-08-01 用于分割输入图像的方法和装置

Country Status (1)

Country Link
CN (1) CN102915530B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402284A (zh) * 2020-03-17 2020-07-10 中国人民解放军国防科学技术大学 一种基于三维连通性的图像阈值测定方法及装置
CN113298768A (zh) * 2021-05-20 2021-08-24 山东大学 棉花检测分割计数方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070002375A1 (en) * 2005-06-30 2007-01-04 Lexmark International, Inc. Segmenting and aligning a plurality of cards in a multi-card image
CN101137011A (zh) * 2006-08-29 2008-03-05 索尼株式会社 图像处理装置、图像处理方法和计算机程序
CN101183283A (zh) * 2007-12-04 2008-05-21 哈尔滨工业大学深圳研究生院 一种直接写入手写体信息的方法
CN101625760A (zh) * 2009-07-28 2010-01-13 谭洪舟 一种证件图像倾斜校正的办法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070002375A1 (en) * 2005-06-30 2007-01-04 Lexmark International, Inc. Segmenting and aligning a plurality of cards in a multi-card image
CN101137011A (zh) * 2006-08-29 2008-03-05 索尼株式会社 图像处理装置、图像处理方法和计算机程序
CN101183283A (zh) * 2007-12-04 2008-05-21 哈尔滨工业大学深圳研究生院 一种直接写入手写体信息的方法
CN101625760A (zh) * 2009-07-28 2010-01-13 谭洪舟 一种证件图像倾斜校正的办法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402284A (zh) * 2020-03-17 2020-07-10 中国人民解放军国防科学技术大学 一种基于三维连通性的图像阈值测定方法及装置
CN113298768A (zh) * 2021-05-20 2021-08-24 山东大学 棉花检测分割计数方法及系统

Also Published As

Publication number Publication date
CN102915530B (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
US9189842B2 (en) Paper identifying method and related device
US11423633B2 (en) Image processing to detect a rectangular object
EP2461290B1 (en) Image processing device, image processing method, and program
EP2811423A1 (en) Method and apparatus for detecting target
CN104867225A (zh) 一种纸币的面向识别方法及装置
KR101599786B1 (ko) 참조 영역 분할을 이용한 인페인팅 장치 및 방법
JP7006702B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN110097059B (zh) 基于生成对抗网络的文档图像二值化方法、系统、装置
EP2328127B1 (en) Foreground area extracting program, foreground area extracting apparatus and foreground area extracting method
WO2011014229A1 (en) Adjusting perspective and disparity in stereoscopic image pairs
CN108492342B (zh) 合并碎图的方法、装置、处理器、存储介质和终端
US11500364B2 (en) Index selection device and method
CN106558143B (zh) 一种100元人民币拼接纸币的识别方法及装置
CN105608699A (zh) 一种图像处理方法及电子设备
CN101286230A (zh) 图像处理设备和图像处理方法
CN102915530A (zh) 用于分割输入图像的方法和装置
CN104408403A (zh) 一种二次录入不一致的仲裁方法及装置
CN105654082B (zh) 字符识别后处理方法、设备及包括该设备的图像拾取设备
CN103366165B (zh) 图像处理装置、图像处理方法以及设备
JP2013080389A (ja) 消失点推定方法、消失点推定装置及びコンピュータプログラム
CN103106405B (zh) 用于文档图像的行分割方法及系统
CN116579968A (zh) 用于食材图像的识别方法及装置、蒸烤设备、存储介质
CN105160333B (zh) 一种车型识别方法及识别装置
US20210089886A1 (en) Method for processing data based on neural networks trained by different methods and device applying method
CN104486524B (zh) 检测图像是否经历两次压缩质量相同的jpeg压缩的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant