CN109308465B - 表格线检测方法、装置、设备及计算机可读介质 - Google Patents
表格线检测方法、装置、设备及计算机可读介质 Download PDFInfo
- Publication number
- CN109308465B CN109308465B CN201811076344.5A CN201811076344A CN109308465B CN 109308465 B CN109308465 B CN 109308465B CN 201811076344 A CN201811076344 A CN 201811076344A CN 109308465 B CN109308465 B CN 109308465B
- Authority
- CN
- China
- Prior art keywords
- line
- peak height
- projection curve
- curve
- straight line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例一种表格线检测方法、装置、设备及计算机可读介质,所述表格线检测方法包括:获取具有表格线的图像;从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;将所述直线图中的最大连通域确定为直线区域;根据所述直线区域的投影曲线确定所述表格线的位置。本发明实施例的技术方案可以提高表格线检测速度,提升检测效果。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种表格线检测方法、装置、设备及计算机可读介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
表格是一种重要的信息载体,能够简洁直观地保存并呈现复杂数据,便于人们分析问题。考虑到保密性和稳定性,当前大部分表格为纸质文档。但为了方便海量数据的管理,很多情况下需要将纸质文档通过光学字符识别(OCR,Optical CharacterRecognition)技术结构化输出为Excel等电子文档。常见的M×N型表格具有齐全的表格线,因此表格线检测定位是整个M×N型表格识别的前提条件和关键技术之一。
常用的表格线检测方法包括:采用霍夫(Hough)变换提取二值图像中的所有直线,再将检测到的直线分为水平线和竖直线,然后通过一系列的线段修整算法例如剔除小线段、合并连接相邻线、剔除表格外部线等,得到最终表格线检测结果。通过Hough变换检测直线耗时较长,同时密集文字堆积到一起时容易在各个方向上都产生直线响应,使得最后检测结果中存在大量噪声线段干扰,影响最终检测结果。另外,在后续线段修整环节中采用了较多算法,算法执行中一个环节出错都会导致最终结果产生较大偏差,整体鲁棒性很差。
发明内容
本发明实施例提供一种表格线检测方法、装置、设备及计算机可读介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种表格线检测方法,包括:
获取具有表格线的图像;
从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;
将所述直线图中的最大连通域确定为直线区域;
根据所述直线区域的投影曲线确定所述表格线的位置。
结合第一方面,本发明实施例在第一方面的第一种实施方式中,将所述直线图中的最大连通域确定为直线区域,包括:
对于所述直线图中的每一个连通域,如果所述连通域的面积小于面积设定值并且所述连通域的长宽比不符合设定区间,则删除所述连通域。
结合第一方面,本发明实施例在第一方面的第二种实施方式中,根据所述直线区域的投影曲线确定所述表格线的位置,包括:
将所述直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线;
基于所述水平投影曲线的波峰位置确定所述表格线的竖直线的位置,以及基于所述竖直投影曲线的波峰位置确定所述表格线的水平线的位置。
结合第一方面的第二种实施方式,本发明实施例在第一方面的第三种实施方式中,基于所述水平投影曲线的波峰位置确定所述表格线的竖直线的位置,包括:
设置若干个等间隔的第一波峰高度阈值;
使用多个第一波峰高度阈值分割所述水平投影曲线;
分别记录所述水平投影曲线中高于每个第一波峰高度阈值的像素的数量,以得到第一波峰高度变化曲线;
基于所述第一波峰高度变化曲线获取第一波峰高度梯度曲线;
根据所述第一波峰高度梯度曲线获得第一自适应波峰高度阈值;
使用所述第一自适应波峰高度阈值分割所述水平投影曲线,以获得所述水平投影曲线的波峰位置。
结合第一方面的第二种实施方式,本发明实施例在第一方面的第四种实施方式中,包括:
设置若干个等间隔的第二波峰高度阈值;
使用多个第二波峰高度阈值分割所述垂直投影曲线;
分别记录所述垂直投影曲线中高于每个第二波峰高度阈值的像素的数量,以得到第二波峰高度变化曲线;
基于所述第二波峰高度变化曲线获取第二波峰高度梯度曲线;
根据所述第二波峰高度梯度曲线获得第二自适应波峰高度阈值;
使用所述第二自适应波峰高度阈值分割所述垂直投影曲线,以获得所述垂直投影曲线的波峰位置。
结合第一方面、第一方面的第一种实施方式、第一方面的第二种实施方式、第一方面的第三种实施方式或第一方面的第四种实施方式,本发明实施例在第一方面的第五种实施方式中,所述表格线检测方法还包括:
对于所述直线区域中的每个像素,如果所述像素所在行以及所述像素所在行的第一相邻行具有的非直线像素的数量超过第一设定值,且所述像素所在行的第二相邻行具有的直线像素的数量超过第二设定值,则从所述直线区域中删除所述像素。
结合第一方面、第一方面的第一种实施方式、第一方面的第二种实施方式、第一方面的第三种实施方式或第一方面的第四种实施方式,本发明实施例在第一方面的第六种实施方式中,从所述图像中提取多个直线段,包括以下方式中的至少一种:
基于直线段检测器算法提取所述直线段;
基于整体嵌套边缘检测网络深度学习算法提取所述直线段。
第二方面,本发明实施例提供了一种表格线检测装置,包括:
获取模块,用于获取具有表格线的图像;
提取模块,用于从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;
第一确定模块,用于将所述直线图中的最大连通域确定为直线区域;
第二确定模块,用于根据所述直线区域的投影曲线确定所述表格线的位置。
结合第二方面,本发明实施例在第二方面的第一种实施方式中,所述第一确定模块包括:
删除子模块,用于对于所述直线图中的每一个连通域,如果所述连通域的面积小于面积设定值并且所述连通域的长宽比不符合设定区间,则删除所述连通域。
结合第二方面,本发明实施例在第二方面的第二种实施方式中,所述第二确定模块包括:
投影子模块,用于将所述直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线;
确定子模块,用于基于所述水平投影曲线的波峰位置确定所述表格线的竖直线的位置,以及基于所述竖直投影曲线的波峰位置确定所述表格线的水平线的位置。
结合第二方面、第二方面的第一种实施方式或第二方面的第二种实施方式,本发明实施例在第二方面的第三种实施方式中,所述表格线检测装置还包括:
删除模块,用于对于所述直线区域中的每个像素,如果所述像素所在行以及所述像素所在行的第一相邻行具有的非直线像素的数量超过第一设定值,且所述像素所在行的第二相邻行具有的直线像素的数量超过第二设定值,则从所述直线区域中删除所述像素。
结合第二方面、第二方面的第一种实施方式或第二方面的第二种实施方式,本发明实施例在第二方面的第四种实施方式中,所述提取模块用于实现以下方式中的至少一种:
基于直线段检测器算法提取所述直线段;
基于整体嵌套边缘检测网络深度学习算法提取所述直线段。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
第三方面,本发明实施例提供一种表格线检测设备,包括处理器和存储器,所述存储器用于存储支持表格线检测设备执行上述第一方面中表格线检测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述表格线检测设备还可以包括通信接口,用于表格线检测设备与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储表格线检测装置所用的计算机软件指令,其包括用于执行上述第一方面中表格线检测方法所涉及的程序。
本发明实施例的技术方案通过将表格线检测问题转换为确定最大连通域和投影曲线分割问题,可以简化表格线检测过程,提高检测速度,提升检测效果。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施例的一种实施方式的表格线检测方法的流程图。
图2为本发明实施例中具有M×N型表格线的图像的示例图。
图3为本发明实施例中所获得的直线图的示例图。
图4为本发明实施例中获得的水平投影曲线和竖直投影曲线的示例图。
图5-1为本发明实施例中使用第一自适应波峰高度阈值分割水平投影曲线得到的分割结果的示意图。
图5-2为本发明实施例中使用第二自适应波峰高度阈值分割竖直投影曲线得到的分割结果的示意图。
图6为本发明实施例中重构出的表格线的示意图。
图7为本发明实施例的另一种实施方式的表格线检测方法的流程图。
图8-1为本发明实施例中删除噪声像素后获得的直线区域的示意图。
图8-2为本发明实施例中删除噪声像素后获得的水平投影曲线和竖直投影曲线的示意图。
图9为本发明实施例的一种实施方式的表格线检测装置的结构示意图。
图10为本发明实施例的另一种实施方式的表格线检测装置的结构示意图。
图11为本发明实施例的表格线检测设备的结构示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例旨在提供一种表格线检测方法和装置,通过在图像中提取表格线,并将包括多个直线段的直线图中的最大连通域确定为直线区域,进而根据直线区域的投影曲线确定表格线的位置,从而可以重构出表格线。本发明实施例的技术方案可以提高表格线检测速度,提升检测效果,并兼具鲁棒性。
下面具体介绍本发明实施例的各种非限制性实施方式。
图1示出了本发明实施例的表格线检测方法的流程图。如图1所示,本发明实施例的表格线检测方法可以包括:
S110、获取具有表格线的图像。
本实施例中,具有表格线的图像可以是具有M×N型表格线的图像。如图2所示是本实施例中具有M×N型表格线的图像的一种示例。
在一种可能的实施方式中,在步骤S110中,可以包括:对获取的图像进行预处理。具体地,对图像进行预处理的方式可以包括以下至少一种:对图像旋转校正;将图像灰度化,以得到单通道的图像。其中,对图像旋转校正的方式可以采用Hough变换检测水平直线,得到图像的倾斜角度,然后进行旋转校正。
S120、从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图。
本实施例中,可以基于直线段检测器(LSD,Line Segment Detector)算法或基于整体嵌套边缘检测(HED,Holistically-nested Edge Detection)网络等深度学习算法提取直线段。然后,将获取到的直线段画在诸如Mat(一种数据类型)的图像容器中,进而获得直线图。如图3所示是本实施例中所获得的直线图的一种示例。
S130、将所述直线图中的最大连通域确定为直线区域。
在得到直线图后,可以对该直线图进行连通域(Connected Component)分析。其中,连通域可以包括图像中具有相同像素值且位置相邻的前景像素组成的图像区域;连通域分析可以将图像中的各个连通域找出并标记。本一种示例中,对直线图进行连通域分析,以得到直线图中的所有连通域。从所有连通域中挑选出拥有最多像素数量的连通域作为最大连通域,并将该最大连通域确定为直线区域。
在一种可能的实施方式中,在挑选拥有最多像素数量的连通域之前,还可以包括:对所有的连通域进行形态学闭运算。
在一种可能的实施方式中,在挑选拥有最多像素数量的连通域之前,还可以包括:对于直线图中的每一个连通域,如果某一个连通域的面积小于面积设定值并且该连通域的长宽比不符合设定区间,则删除该连通域。其中,设定区间包括长宽比的最大值和最小值,连通域的长宽比应介于最大值和最小值之间,或者等于最大值或最小值。
S140、根据所述直线区域的投影曲线确定所述表格线的位置。
本实施例中,根据所述直线区域的投影曲线确定所述表格线的位置,可以包括:将直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线。如图4所示是本实施例中获得的水平投影曲线和竖直投影曲线的示例。
其中,在表格线存在的位置由于累计了大量的像素会有明显的波峰。进一步地,基于水平投影曲线的波峰位置确定表格线的竖直线的位置,以及基于竖直投影曲线的波峰位置确定表格线的水平线的位置。
本实施例中,可以将水平投影曲线记为P,基于水平投影曲线的波峰位置确定表格线的竖直线的位置。具体过程可以包括:
(11)设置若干个等间隔的第一波峰高度阈值Ti(i=1,2,3……,N)。其中,N是第一波峰高度阈值Ti的预设数量。具体地,可以在水平投影曲线P的纵轴上设置若干个等间隔的第一波峰高度阈值。
(12)使用多个第一波峰高度阈值分割水平投影曲线P。具体地,以第一波峰高度阈值Ti所在的水平线分割水平投影曲线P。
(13)对于每一次分割,分别记录水平投影曲线P中高于每个第一波峰高度阈值Ti的像素的数量,以得到第一波峰高度变化曲线C。
(14)基于第一波峰高度变化曲线C获取第一波峰高度梯度曲线G。其中,第一波峰高度梯度曲线G表征了第一波峰高度变化曲线C中的拐点。
(15)根据第一波峰高度梯度曲线G获得第一自适应波峰高度阈值T。其中,第一波峰高度阈值Ti与第一自适应波峰高度阈值T有如下关系:
其中,max(P)是水平投影曲线P中的最高点。进一步地,第一自适应波峰高度阈值T可以基于如下公式计算:
T=Tl+a(Th-Tl)+b
其中,a与b是预设的比例参数,Th=TN,Tl中的l=max(n),s.t.Gn>k·mean(G)。具体地,max(n)是n的所有取值中的最大值,而n的取值满足Gn>k·mean(G)。其中,k为预设参数,mean(G)表征第一波峰高度梯度曲线G中的平均值,s.t.是受限于(subject to)的意思。也就是说,第一自适应波峰高度阈值T实际上是设定的第一波峰高度阈值Ti的上下限之间的一个平衡点。
(16)使用第一自适应波峰高度阈值T分割水平投影曲线P,以获得水平投影曲线P的波峰位置。具体地,在得到第一自适应波峰高度阈值T后,用第一自适应波峰高度阈值T所在的水平线分割水平投影曲线P,将得到水平投影曲线P的波峰位置。请参阅图5-1,图5-1示出了本实施例中使用第一自适应波峰高度阈值T分割水平投影曲线P得到的分割结果。
本实施例中,基于竖直投影曲线的波峰位置确定表格线的水平线的位置,可以包括:
(21)设置若干个等间隔的第二波峰高度阈值;
(22)使用多个第二波峰高度阈值分割所述垂直投影曲线;
(23)分别记录所述垂直投影曲线中高于每个第二波峰高度阈值的像素的数量,以得到第二波峰高度变化曲线;
(24)基于所述第二波峰高度变化曲线获取第二波峰高度梯度曲线;
(25)根据所述第二波峰高度梯度曲线获得第二自适应波峰高度阈值;
(26)使用所述第二自适应波峰高度阈值分割所述垂直投影曲线,以获得所述垂直投影曲线的波峰位置。
具体方式可参见上述基于水平投影曲线的波峰位置确定表格线的竖直线的位置的方法,此处不再赘述。请参阅图5-2,图5-2示出了本实施例中使用第二自适应波峰高度阈值分割竖直投影曲线得到的分割结果。
进一步地,假设竖直方向投影曲线的波峰坐标为xi(i=1,2,…),水平方向投影曲线的波峰坐标为yj(j=1,2,…)。以此重构出的表格线起始与终止坐标点分别为:水平线端点1(min(xi),yj),水平线端点2(max(xi),yj);竖直线端点1(xi,min(yj)),竖直线端点2(xi,max(yj))。请参阅图6,图6示出了本实施例中重构出的表格线的示意图。
表格图像中往往存在着各种噪声,例如影印痕迹、红章、单元格内的密集文字等,容易对表格线检测产生干扰,造成行、列解析偏差。图7示出了本发明另一实施例的表格线检测方法,与上述实施例的区别在于,本实施例的表格线检测方法还包括:
S210、对于所述直线区域中的每个像素,如果所述像素所在行以及所述像素所在行的第一相邻行具有的非直线像素的数量超过第一设定值,且所述像素所在行的第二相邻行具有的直线像素的数量超过第二设定值,则从所述直线区域中删除所述像素。
本实施例中,可以分别对直线区域的像素(直线像素)和背景区域的像素(非直线像素)分别设定像素值。例如,将直线像素的像素值设为255,将非直线像素的像素值设为0。通过遍历直线区域中的每一个像素,考察其上行、下行和本行的像素值分布,从直线区域中删除非直线像素,达到切断文字等噪声与表格线的目的。
例如,直线像素M的所在行具有相邻的上行和下行。如果所在行具有的非直线像素的数量超过第一设定值,并且上行具有的非直线像素的数量也超过第一设定值,而且下行具有的直线像素的数量超过第二设定值,则说明直线像素M应该是与上行的表格线相粘连,可以将直线像素M的像素值设置为非直线像素的像素值,以从直线区域中删除直线像素M。
请参阅图8-1和图8-2,其中,图8-1示出了本实施例中删除噪声像素后,在步骤S130中获得的直线区域的示意图;图8-2示出了本实施例中删除噪声像素后,在步骤S140中获得的水平投影曲线和竖直投影曲线的示意图。
需要说明的是,本实施例中对于噪声像素的识别与删除是以像素所在行及其相邻行为示例。应当理解的是,也可以基于像素所在列及其相邻列识别与删除噪声像素。
综上所述,本实施例的表格线检测方法,通过在图像中提取表格线,并将包括多个直线段的直线图中的最大连通域确定为直线区域,进而根据直线区域的投影曲线确定表格线的位置,从而可以重构出表格线。本实施例的表格线检测方法,避免了过多使用耗时的Hough检测和后续复杂线修整策略,提高了表格线检测速度;以及将线检测问题转换为投影曲线峰值分割问题,策略简洁可靠,在提升检测效果的同时还兼具鲁棒性。
如图9所示,本发明实施还提供一种表格线检测装置,可以包括:
获取模块110,用于获取具有表格线的图像;
提取模块120,用于从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;
第一确定模块130,用于将所述直线图中的最大连通域确定为直线区域;
第二确定模块140,用于根据所述直线区域的投影曲线确定所述表格线的位置。
在一种可能的实施方式中,第一确定模块130可以包括:
删除子模块,用于对于所述直线图中的每一个连通域,如果所述连通域的面积小于面积设定值并且所述连通域的长宽比不符合设定区间,则删除所述连通域。
在一种可能的实施方式中,第二确定模块140可以包括:
投影子模块,用于将所述直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线;
确定子模块,用于基于所述水平投影曲线的波峰位置确定所述表格线的竖直线的位置,以及基于所述竖直投影曲线的波峰位置确定所述表格线的水平线的位置。
在一种可能的实施方式中,第二确定模块140还可以用于:
设置若干个等间隔的第一波峰高度阈值;
使用多个第一波峰高度阈值分割所述水平投影曲线;
分别记录所述水平投影曲线中高于每个第一波峰高度阈值的像素的数量,以得到第一波峰高度变化曲线;
基于所述第一波峰高度变化曲线获取第一波峰高度梯度曲线;
根据所述第一波峰高度梯度曲线获得第一自适应波峰高度阈值;
使用所述第一自适应波峰高度阈值分割所述水平投影曲线,以获得所述水平投影曲线的波峰位置。
在一种可能的实施方式中,第二确定模块140还可以用于:
设置若干个等间隔的第二波峰高度阈值;
使用多个第二波峰高度阈值分割所述垂直投影曲线;
分别记录所述垂直投影曲线中高于每个第二波峰高度阈值的像素的数量,以得到第二波峰高度变化曲线;
基于所述第二波峰高度变化曲线获取第二波峰高度梯度曲线;
根据所述第二波峰高度梯度曲线获得第二自适应波峰高度阈值;
使用所述第二自适应波峰高度阈值分割所述垂直投影曲线,以获得所述垂直投影曲线的波峰位置。
如图10所示,在一种可能的实施方式中,本实施例的表格线检测装置还可以包括:
删除模块210,用于对于所述直线区域中的每个像素,如果所述像素所在行以及所述像素所在行的第一相邻行具有的非直线像素的数量超过第一设定值,且所述像素所在行的第二相邻行具有的直线像素的数量超过第二设定值,则从所述直线区域中删除所述像素。
在一种可能的实施方式中,提取模块120还可以用于实现以下方式中的至少一种:
基于直线段检测器算法提取所述直线段;
基于整体嵌套边缘检测网络深度学习算法提取所述直线段。
本实施例还提供一种表格线检测设备,如图11所示,该设备包括:存储器21和处理器22,存储器21内存储有可在处理器22上运行的计算机程序。处理器22执行所述计算机程序时实现上述实施例中的表格线检测方法。所述存储器21和处理器22的数量可以为一个或多个。
该设备还包括:
通信接口23,用于与外界设备进行通信,进行数据交互传输。
存储器21可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
如果存储器21、处理器22和通信接口23独立实现,则存储器21、处理器22和通信接口23可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器21、处理器22及通信接口23集成在一块芯片上,则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种表格线检测方法,其特征在于,包括:
获取具有表格线的图像;
从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;
将所述直线图中的最大连通域确定为直线区域;
根据所述直线区域的投影曲线确定所述表格线的位置;
其中,根据所述直线区域的投影曲线确定所述表格线的位置,包括:
将所述直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线;
采用第一自适应波峰高度阈值分割所述水平投影曲线,以确定所述表格线的竖直线的位置,所述第一自适应波峰高度阈值为根据多个预设的第一波峰高度阈值分割所述水平投影曲线得到的;
采用第二自适应波峰高度阈值分割所述竖直投影曲线,以确定所述表格线的水平线的位置,所述第二自适应波峰高度阈值为根据多个预设的第二波峰高度阈值分割所述竖直投影曲线得到的。
2.根据权利要求1所述的方法,其特征在于,将所述直线图中的最大连通域确定为直线区域,包括:
对于所述直线图中的每一个连通域,如果所述连通域的面积小于面积设定值并且所述连通域的长宽比不符合设定区间,则删除所述连通域。
3.根据权利要求1所述的方法,其特征在于,采用第一自适应波峰高度阈值分割所述水平投影曲线,以确定所述表格线的竖直线的位置,包括:
设置若干个等间隔的所述第一波峰高度阈值;
使用多个所述第一波峰高度阈值分割所述水平投影曲线;
分别记录所述水平投影曲线中高于每个所述第一波峰高度阈值的像素的数量,以得到第一波峰高度变化曲线;
基于所述第一波峰高度变化曲线获取第一波峰高度梯度曲线;
根据所述第一波峰高度梯度曲线获得所述第一自适应波峰高度阈值;
使用所述第一自适应波峰高度阈值分割所述水平投影曲线,以获得所述水平投影曲线的波峰位置;
根据所述水平投影曲线的波峰位置,确定所述表格线的竖直线的位置。
4.根据权利要求1所述的方法,其特征在于,采用第二自适应波峰高度阈值分割所述竖直投影曲线,以确定所述表格线的水平线的位置,包括:
设置若干个等间隔的所述第二波峰高度阈值;
使用多个所述第二波峰高度阈值分割所述竖直投影曲线;
分别记录所述竖直投影曲线中高于每个所述第二波峰高度阈值的像素的数量,以得到第二波峰高度变化曲线;
基于所述第二波峰高度变化曲线获取第二波峰高度梯度曲线;
根据所述第二波峰高度梯度曲线获得所述第二自适应波峰高度阈值;
使用所述第二自适应波峰高度阈值分割所述竖直投影曲线,以获得所述竖直投影曲线的波峰位置;
根据所述竖直投影曲线的波峰位置,确定所述表格线的水平线的位置。
5.根据权利要求1至4任一项所述的方法,其特征在于,还包括:
对于所述直线区域中的每个像素,如果所述像素所在行以及所述像素所在行的第一相邻行具有的非直线像素的数量超过第一设定值,且所述像素所在行的第二相邻行具有的直线像素的数量超过第二设定值,则从所述直线区域中删除所述像素。
6.根据权利要求1至4任一项所述的方法,其特征在于,从所述图像中提取多个直线段,包括以下方式中的至少一种:
基于直线段检测器算法提取所述直线段;
基于整体嵌套边缘检测网络深度学习算法提取所述直线段。
7.一种表格线检测装置,其特征在于,包括:
获取模块,用于获取具有表格线的图像;
提取模块,用于从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;
第一确定模块,用于将所述直线图中的最大连通域确定为直线区域;
第二确定模块,用于根据所述直线区域的投影曲线确定所述表格线的位置;
其中,所述第二确定模块包括:
投影子模块,用于将所述直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线;
第一确定子模块,用于采用第一自适应波峰高度阈值分割所述水平投影曲线,以确定所述表格线的竖直线的位置,所述第一自适应波峰高度阈值为根据多个预设的第一波峰高度阈值分割所述水平投影曲线得到的;
第二确定子模块,用于采用第二自适应波峰高度阈值分割所述竖直投影曲线,以确定所述表格线的水平线的位置,所述第二自适应波峰高度阈值为根据多个预设的第二波峰高度阈值分割所述竖直投影曲线得到的。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
删除子模块,用于对于所述直线图中的每一个连通域,如果所述连通域的面积小于面积设定值并且所述连通域的长宽比不符合设定区间,则删除所述连通域。
9.根据权利要求7或8所述的装置,其特征在于,还包括:
删除模块,用于对于所述直线区域中的每个像素,如果所述像素所在行以及所述像素所在行的第一相邻行具有的非直线像素的数量超过第一设定值,且所述像素所在行的第二相邻行具有的直线像素的数量超过第二设定值,则从所述直线区域中删除所述像素。
10.根据权利要求7或8所述的装置,其特征在于,所述提取模块用于实现以下方式中的至少一种:
基于直线段检测器算法提取所述直线段;
基于整体嵌套边缘检测网络深度学习算法提取所述直线段。
11.一种表格线检测设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至6中任一所述的方法。
12.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811076344.5A CN109308465B (zh) | 2018-09-14 | 2018-09-14 | 表格线检测方法、装置、设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811076344.5A CN109308465B (zh) | 2018-09-14 | 2018-09-14 | 表格线检测方法、装置、设备及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109308465A CN109308465A (zh) | 2019-02-05 |
CN109308465B true CN109308465B (zh) | 2020-01-17 |
Family
ID=65224604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811076344.5A Active CN109308465B (zh) | 2018-09-14 | 2018-09-14 | 表格线检测方法、装置、设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109308465B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858468B (zh) * | 2019-03-04 | 2021-04-23 | 汉王科技股份有限公司 | 一种表格线识别方法及装置 |
CN110084117B (zh) * | 2019-03-22 | 2021-07-20 | 中国科学院自动化研究所 | 基于二值图分段投影的文档表格线检测方法、系统 |
CN110399875A (zh) * | 2019-07-31 | 2019-11-01 | 山东浪潮人工智能研究院有限公司 | 一种基于深度学习与像素投影的通用表格信息提取方法 |
CN110458070A (zh) * | 2019-08-01 | 2019-11-15 | 上海眼控科技股份有限公司 | 基于机动车年检检验表图片识别检验次数的方法与系统 |
CN110807404A (zh) * | 2019-10-29 | 2020-02-18 | 上海眼控科技股份有限公司 | 基于深度学习的表格线检测方法、装置、终端、存储介质 |
CN113808155B (zh) * | 2020-06-12 | 2023-04-11 | 广州极飞科技股份有限公司 | 一种航线规划、作物作业方法、装置、设备及存储介质 |
CN112330659B (zh) * | 2020-11-24 | 2023-04-07 | 成都信息工程大学 | 结合lsd直线检测和连通域标记法的几何公差符号分割方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101840514A (zh) * | 2009-03-19 | 2010-09-22 | 株式会社理光 | 图像对象分类装置及方法 |
CN105426834A (zh) * | 2015-11-17 | 2016-03-23 | 中国传媒大学 | 一种基于投影特征与结构特征进行表格图像检测的方法 |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN106897690A (zh) * | 2017-02-22 | 2017-06-27 | 南京述酷信息技术有限公司 | Pdf表格提取方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470094B1 (en) * | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
CN103377177B (zh) * | 2012-04-27 | 2016-03-30 | 北大方正集团有限公司 | 一种数字版式文件中识别表格的方法及装置 |
US9740928B2 (en) * | 2014-08-29 | 2017-08-22 | Ancestry.Com Operations Inc. | System and method for transcribing handwritten records using word groupings based on feature vectors |
US9430703B2 (en) * | 2014-12-19 | 2016-08-30 | Konica Minolta Laboratory U.S.A., Inc. | Method for segmenting text words in document images using vertical projections of center zones of characters |
CN106156715A (zh) * | 2015-04-24 | 2016-11-23 | 富士通株式会社 | 分析表格图像的布局的方法和设备 |
CN106203397B (zh) * | 2016-07-26 | 2017-11-10 | 江苏鸿信系统集成有限公司 | 基于图像中表格分析技术的表格鉴别和定位方法 |
-
2018
- 2018-09-14 CN CN201811076344.5A patent/CN109308465B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101840514A (zh) * | 2009-03-19 | 2010-09-22 | 株式会社理光 | 图像对象分类装置及方法 |
CN105426834A (zh) * | 2015-11-17 | 2016-03-23 | 中国传媒大学 | 一种基于投影特征与结构特征进行表格图像检测的方法 |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN106897690A (zh) * | 2017-02-22 | 2017-06-27 | 南京述酷信息技术有限公司 | Pdf表格提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109308465A (zh) | 2019-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308465B (zh) | 表格线检测方法、装置、设备及计算机可读介质 | |
US10896349B2 (en) | Text detection method and apparatus, and storage medium | |
CN107122806B (zh) | 一种敏感图像识别方法及装置 | |
US7062099B2 (en) | Image processing method and apparatus using self-adaptive binarization | |
KR101939936B1 (ko) | 지문 융기부 지점 인식 방법 및 장치 | |
US7715628B2 (en) | Precise grayscale character segmentation apparatus and method | |
JP2014057306A (ja) | 画像位相一致を用いた文書画像の二値化及び分割 | |
CN107871319B (zh) | 限束器区域的检测方法、装置、x射线系统和存储介质 | |
CN109214334B (zh) | 车道线处理方法和装置 | |
CN112183511A (zh) | 一种图像导出表格的方法、系统、存储介质及设备 | |
CN110708568B (zh) | 一种视频内容突变检测方法及装置 | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
CN108960247B (zh) | 图像显著性检测方法、装置以及电子设备 | |
KR101676000B1 (ko) | 은행, 통신사 또는 보험사와 개인 사이에서 생성된 디지털 문서 내의 지문 감지 및 보안처리 방법 | |
CN110321887B (zh) | 文档图像处理方法、文档图像处理装置及存储介质 | |
US8891822B2 (en) | System and method for script and orientation detection of images using artificial neural networks | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 | |
JP2007189577A (ja) | コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 | |
US8401325B2 (en) | Image processing method, image processing apparatus, and computer program for core line modification of a thinning figure in an image process | |
CN113033562A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN114140620A (zh) | 一种物体直线轮廓检测方法 | |
JP2021082264A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP6580201B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
Soumya et al. | Enhancement and segmentation of historical records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |