CN109858325A - 一种表格检测方法和装置 - Google Patents

一种表格检测方法和装置 Download PDF

Info

Publication number
CN109858325A
CN109858325A CN201811513646.4A CN201811513646A CN109858325A CN 109858325 A CN109858325 A CN 109858325A CN 201811513646 A CN201811513646 A CN 201811513646A CN 109858325 A CN109858325 A CN 109858325A
Authority
CN
China
Prior art keywords
crosspoint
image
lines
table lines
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811513646.4A
Other languages
English (en)
Other versions
CN109858325B (zh
Inventor
吴爱红
胡雨隆
殷兵
胡金水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201811513646.4A priority Critical patent/CN109858325B/zh
Publication of CN109858325A publication Critical patent/CN109858325A/zh
Application granted granted Critical
Publication of CN109858325B publication Critical patent/CN109858325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种表格检测方法和装置,所述方法包括:获取待测图像;提取所述待测图像中的表格线条元素,得到预处理表格线条图像;基于预设的检测核,提取所述预处理表格线条图像中的交叉点;基于所述交叉点,重构表格线条,得到目标表格线条图像。所述装置包括:待测图像获取模块、预处理表格线条图像提取模块、交叉点提取模块、目标表格线条图像获取模块。本发明实施例通过检测表格中的交叉点,并基于所述交叉点对表格线条进行重构,从而实现了表格的检测以及提取。基于交叉点检测表格,可以有效避免表格中非表格线段的干扰,并通过交叉点区分了表格中的短线段和手写字符中的笔画,避免了表格中文字的干扰,表格检测的准确性高。

Description

一种表格检测方法和装置
技术领域
本发明涉及图像处理领域,特别是涉及一种表格检测方法和装置。
背景技术
随着近年来AI技术的不断升温,图像理解是机器视觉的核心技术之一,其中,文档图像中的表格不仅是文档图像中核心要素,更是一种可视化的交流模式。表格结构简单,分隔明确,可保证信息可读性,易于用户快速扫描浏览并获取所需;数据经过归纳整理和合理布局后,更易于用户感知分辨其中的差异与变化、关联与区别,并进行对比分析;交互层面,用户可以对数据信息进行排序、搜索、筛选、以及相关业务处理等复杂操作。在科学研究、数据分析、信息登记等方面表格发挥着重要作用。因此,表格的检测是图像理解中不可缺乏的技术之一。
现有技术中,在具有多个元素的图像中提取表格的主要方法为:先检测表格中的直线,然后利用直线计算交叉点,最后利用直线和交叉点绘制出表格。对于复杂表格而言,直线是否正确检测并提取直接影响着最终表格的回复质量。现有较成熟的直线检测方案包括以下几种:一种为基于霍夫变换的直线检测,该方法对线段的连通性没有要求,有利于检测虚线和断裂的直线,但由于难以确定直线的起点和重点,运算量过大,导致它在具体的工程实践中的应用受到了限制;一种为应用较广的矢量化算法,该方法直接对光栅图像的各个像素进行处理,导致存储量大,而且因为不能利用像素间的位置关系,很不方便;一种为基于矢量化方法的改进,例如选择一些容易提取,大小合适,反映待检目标的最本质特性的矢量单元,然后采用合并和滤除的方式,得到最终的直线,如单连通链的表格检测技术。
然而,现有技术都是从直线检测出发,对检测的直线进行修补,使其重新构成网格,得到最终的表格信息,其仍然会受到手写字、非表格直线等影响,导致对短小直线的提取稳定性地,从而出现漏检、多检的问题,使表格无法正确识别。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种表格检测方法和装置。
一种表格检测方法,包括:
获取待测图像;
提取所述待测图像中的表格线条元素,得到预处理表格线条图像;
基于预设的检测核,提取所述预处理表格线条图像中的交叉点;
基于所述交叉点,重构表格线条,得到目标表格线条图像。
优选地,所述基于预设的检测核,提取所述预处理表格线条图像中的交叉点的步骤具体包括:
将预设的检测核对所述预处理表格线条图像进行卷积,得到卷积响应图;
对所述卷积响应图进行自适应二值化,得到交叉点响应图像;
在所述交叉点响应图像中定位出交叉点。
优选地,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
对每一个所述交叉点,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点;
当在预设方向上存在其他交叉点时,确定所述预设方向为所述交叉点的连通方向;
连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
优选地,所述预设的检测核为矩阵,所述矩阵中包括有权元素以及无权元素;所述有权元素为所述矩阵中具有权重的元素,所述无权元素为所述矩阵中不具有权重的元素。
优选地,所述有权元素中包括中心元素以及至少一个第一有权元素;所述中心元素与第一有权元素连接,构成左上、左下、右上、右下中任意一个或多个方向的直角形状,所述直角形状中两条直线的交点为所述中心元素。
优选地,所述第一有权元素以及所述中心元素的权重服从高斯分布;所述中心元素的权重在所述有权元素中最高;所述第一有权元素的权重基于与所述中心元素之间的距离,由近至远依次降低。
优选地,所述有权元素还包括至少一个第二有权元素,所述至少一个第二有权元素位于所述直角形状中任意一条或两条直线顺时针,和/或,逆时针旋转预设角度覆盖的区域中。
优选地,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
基于所述预设的检测核,确定每一个所述交叉点的类型;
基于所述交叉点的类型,确定所述交叉点的连通方向;
连接每一个所述交叉点在连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
优选地,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
基于所述预设的检测核,确定每一个所述交叉点的类型;
基于所述交叉点的类型,确定每一个所述交叉点的预判连通方向;
对每一个所述交叉点,确定以所述交叉点为基准的预设方向上是否存在其他交叉点;
当在预设方向上存在其他交叉点时,对比所述预设方向与所述预判连通方向是否相同;
当所述预设方向与所述预判连通方向相同时,确定所述预设方向为所述交叉点的连通方向;
连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
优选地,在所述基于所述交叉点,重构表格线条,得到目标表格线条图像之后,还包括:
当所述表格线条之间存在相互交叉时,将所述表格线条之间相互交叉的位置确定为交叉点;
继续执行所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤。
一种表格检测装置,包括:
待测图像获取模块,用于获取待测图像;
预处理表格线条图像提取模块,用于提取所述待测图像中的表格线条元素,得到预处理表格线条图像;
交叉点提取模块,用于基于预设的检测核,提取所述预处理表格线条图像中的交叉点;
目标表格线条图像获取模块,用于基于所述交叉点,重构表格线条,得到目标表格线条图像。
优选地,所述交叉点提取模块具体包括:
卷积响应图获取子模块,用于将预设的检测核对所述预处理表格线条图像进行卷积,得到卷积响应图;
交叉点响应图像获取子模块,用于对所述卷积响应图进行自适应二值化,得到交叉点响应图像;
交叉点定位子模块,用于在所述交叉点响应图像中定位出交叉点。
优选地,所述目标表格线条图像获取模块具体包括:
第一交叉点确定子模块,用于对每一个所述交叉点,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点;
第一连通方向确定子模块,用于当在预设方向上存在其他交叉点时,确定所述预设方向为所述交叉点的连通方向
第一目标表格线条图像获取子模块,用于连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
优选地,所述预设的检测核为矩阵,所述矩阵中包括有权元素以及无权元素;所述有权元素为所述矩阵中具有权重的元素,所述无权元素为所述矩阵中不具有权重的元素。
优选地,所述有权元素中包括中心元素以及至少一个第一有权元素;所述中心元素与第一有权元素连接,构成左上、左下、右上、右下中任意一个或多个方向的直角形状,所述直角形状中两条直线的交点为所述中心元素。
本发明实施例包括以下优点:
本发明实施例通过检测表格中的交叉点,并基于所述交叉点对表格线条进行重构,从而实现了表格的检测以及提取。基于交叉点检测表格,可以有效避免表格中非表格线段的干扰,并通过交叉点区分了表格中的短线段和手写字符中的笔画,避免了表格中文字的干扰,表格检测的准确性高。
附图说明
图1是本发明实施例的一种表格检测方法实施例的步骤流程图;
图2是本发明实施例的待测图像的示意图;
图3是本发明实施例的二值图像的示意图
图4是本发明实施例的预处理表格线条图像的示意图;
图5是本发明实施例的检测核A的示意图;
图6为本发明实施例的检测核A的直线形状的示意图;
图7为本发明实施例的检测核B的示意图;
图8为本发明实施例的检测核B的直线形状的示意图;
图9为本发明实施例的检测核B的扩展区域的示意图;
图10为本发明实施例的检测核C的示意图;
图11为本发明实施例的检测核C的直线X与垂线Y的示意图;
图12是本发明实施例一种表格检测装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例的一种表格检测方法实施例的步骤流程图。
本发明实施例具体可以包括如下方法:
步骤101,获取待测图像。
在本发明实施例中,所述待测图像可以通过扫描仪、高拍仪、数码相机、带摄像头的移动终端等设备来获取,本发明对此不做限制。
在本发明实施例中,所述待测图像中可以包含表格、文字、图画等内容,所述待测图像中的底色、表格、文字颜色可以为白色、黑色、红色、黄色、蓝色等颜色,本发明对此不做限制。
步骤102,提取所述待测图像中的表格线条元素,得到预处理表格线条图像。
在本发明实施例中,为了便于后续精确地提取待测图像中的表格,本申请对待测图像先进行预处理,初步提取出所述待测图像中的表格线条元素,得到预处理的表格线条图像。
步骤103,基于预设的检测核,提取所述预处理表格线条图像中的交叉点。
在本发明实施例中,表格是由若干的行与列所构成的一种有序的组织形式,若干行与列的交汇区域形成表格中的若干单元格,若干行与列的交叉点形成表格中单元格的边角点。基于预设的检测核检测所述交叉点,可以得知表格中单元格的边角位置,从而得知表格线条的组织形式。
在本发明优选实施例中,所述预设的检测核可以具有至少一种类型,用于检测所述交叉点在表格中的位置。通过所述预设的检测核,可以确定所述交叉点位于表格中的位置,从而可以确定更好地基于所述交叉点,确定表格线条的组织形式。例如,通过所述预设的检测核,确定所述交叉点位于表格中单元格的左下角,从而在重构表格线条时,可以根据所述交叉点的位置,向上方以及右方重构表格线条,进一步提高重构线条的准确度。
步骤104,基于所述交叉点,重构表格线条,得到目标表格线条图像。
在本发明实施例中,所述交叉点为表格中行与列的交叉点,通过将交叉点重新连接,即可确定原本表格线条的组织形式,从而重构表格线条,得到目标表格线条。
在本发明的优选实施例中,所述表格检测方法还包括:
基于所述交叉点,确定所述目标表格线条图像中的单元格,和/或,表格的数目。
在本发明实施例中,在基于所述交叉点确定目标表格线条图像之后,也可以基于所述交叉点确定目标表格线条图像中的单元格的数目,便于后续对表格进行进一步地分析处理。
通过本发明实施例的表格检测方法,通过检测表格中的交叉点,并基于所述交叉点对表格线条进行重构,从而实现了表格的检测以及提取。基于交叉点检测表格,可以有效避免表格中非表格线段的干扰,并通过交叉点区分了表格中的短线段和手写字符中的笔画,避免了表格中文字的干扰。
在本发明的一种实施例中,所述提取所述待测图像中的表格线条元素,得到预处理表格线条图像的步骤具体包括:
S11,将所述待测图像转换为二值图像;
在本发明实施例中,所述二值图像是指将图像上的每一个像素只有两种可能的取值或灰度等级状态,例如黑白图像、单色图像等。在本发明的一种优选实施例中,所述二值图像可以为黑白图像。
在具体实现中,如图2所示,图2为待测图像,其背景颜色为白色,包括黑色若干文字以及黑色表格线条。
在本发明实施例中,将所述待测图像转换为二值图像的方式可以包括全局阈值法以及局部阈值法。
在本发明的一种优选实施例中,采用局部阈值法将所述待测图像转换为二值图像,具体步骤包括:
将待测图像分成若干不重叠的相等大小的图像块;
计算所述图像块的灰度分布;
基于所述灰度分布,确定所述图像块中中心像素点的中心阈值;
获取所述待测图像中像素点与相邻中心像素点之间的像素距离;
基于所述像素距离以及所述相邻中心像素点的中心阈值,以线性插值法确定所述像素点的局部阈值。
基于所述局部阈值以及所述中心阈值,对所述待测图像进行二值化处理,得到二值图像。
在本发明实施例中,传统局部阈值法通常采用计算每个像素点,相邻像素点的灰度分布,以确定该像素点的局部阈值。该种局部阈值法计算量较大,导致处理速度较慢。本发明所采用的局部阈值法,仅计算图像块中中心像素点的中心阈值,而对于待测图像中除中心像素点之外的其余像素点,通过计算像素点与相邻的至少一个中心像素点之间的距离,采用线性插值的方法确定其局部阈值,从而减少了局部阈值法二值化图像的计算量,提高了处理效率。
在具体实现中,可以采用局部阈值法将图2所示的待测图像转换为如图3所示的黑白的二值图像。
S12,清除所述二值图像中的文字,保留所述二值图像中的表格线条元素,得到所述预处理表格线条图像。
在本发明的一种优选实施例中,所述清除所述二值图像中的文字,保留所述二值图像中的表格线条元素,得到所述预处理表格线条图像的步骤包括:
提取所述二值图像中的连通体,得到连通体集合;
在所述连通体集合中,确定面积大于预设阈值的第一连通体集合;
计算所述第一连通体集合的均值面积;
在本发明实施例中,所述均值面积可以设定为小于图像宽度和高度最小值的四分之一,如果计算得到的第一连通体的均值面积大于图像宽度和高度最小值的四分之一时,则将所述均值面积设定为图像宽度和高度最小值的四分之一,确保连通体的清除效果。
滤除所述连通体中面积小于所述第一连通体集合的均值面积的连通体,得到预处理表格线条图像。
在本发明实施例中,所述预设阈值可以根据实际图像内容进行设置,本发明不做限制。
在具体实现中,清除如图3所示二值图像中的文字,保留如图3所示二值图像中的表格线条元素,得到如图4所示的预处理表格线条图像。其中,所述预设阈值为20。
通过本发明实施例的表格检测方法,对所述待测图像进行预处理,将所述待测图像转换为二值图像,清除所述二值图像中的文字,保留所述二值图像中的表格线条元素,可以有效避免表格中非表格线段以及字符的干扰,提高表格检测的准确性。
在本发明的一种实施例中,所述基于预设的检测核,提取所述预处理表格线条图像中的交叉点的步骤具体包括:
S21,将预设的检测核对所述预处理表格线条图像进行卷积,得到卷积响应图;
在本发明实施例中,本发明通过确定所述预处理表格线条图像中的交叉点,确定表格的组织形式。为确定交叉点,本发明设置预设的检测核,对所述预处理表格线条图像进行卷积,得到卷积响应图。
在本发明一种优选实施例中,所述预设的检测核为矩阵,所述矩阵中包括有权元素以及无权元素;所述有权元素为所述矩阵中具有权重的元素,所述无权元素为所述矩阵中不具有权重的元素。
在本发明实施例中,所述预设的检测核为矩阵,该矩阵可以为m×n的矩阵。其中,m和n可以取任意自然数值,m可以大于n,m可以等于n,m可以小于n,本发明对此不做限制。例如,所述预设的检测核可以为5×5的矩阵,可以为7×10的矩阵,可以为10×7的矩阵。
在本发明实施例中,所述有权元素的数值可以为非0的任意数值,所述无权元素的数值可以为0。
在本发明实施例中,所述预设的检测核,可以作为滑动窗口,对所述预处理表格线条图像进行卷积,遍历所述预处理表格线条图像,最终输出卷积响应图。所述卷积响应图可以为灰度图像,其中,只有响应所述有权元素的像素部分,其颜色为灰色或者白色,其余地方皆为黑色。并且在所述卷积响应图,像素部分响应所述有权元素的数值越大,其亮度越高,颜色越接近白色。
在本发明的一种优选实施例中,所述有权元素中包括中心元素以及至少一个第一有权元素;所述中心元素与第一有权元素连接,构成左上、左下、右上、右下中任意一个或多个方向的直角形状,所述直角形状中两条直线的交点为所述中心元素。
在本发明实施例中,所述检测核中的中心元素连接第一有权元素,可以构成两条直线,所述两条直线一端端点可以为所述中心元素,且两条直线的夹角为直角,从而可以构成左上、左下、右上、右下中任意一个或多个方向的直角形状。
在本发明实施例中,所述中心元素以及所述第一有权元素可以位于矩阵中任意位置上,例如,所述中心元素以及所述第一有权元素可以位于矩阵中的正中心,所述中心元素以及所述第一有权元素可以位于矩阵中的左侧,所述中心元素以及所述第一有权元素可以位于矩阵中的右侧等,本发明对此不做限制。
在本发明实施例中,所述直角形状可以两条直线的交点,即中心元素,作为原点,并平行于矩阵的行建立X轴,平行于矩阵的列建立Y轴,得到坐标系。
当所述直角形状的角平分线位于第一象限时,则所述直角形状为左下方向的直角形状,所述检测核为左下检测核,可以用于检测表格中的左下边角。
当所述直角形状的角平分线位于第二象限时,则所述直角形状为右下方向的直角形状,所述检测核为右下检测核,可以用于检测表格中的右下边角。
当所述直角形状的角平分线位于第三象限时,则所述直角形状为右上方向的直角形状,所述检测核为右上检测核,可以用于检测表格中的右上边角。
当所述直角形状的角平分线位于第四象限时,则所述直角形状为左上方向的直角形状,所述检测核为左上检测核,可以用于检测表格中的左上边角。
作为本发明的一种示例,如图5所示,图5为检测核A的示意图,检测核A为10×10的矩阵,其中,数值为0的元素为无权元素,数值为a的元素为中心元素,数值为b1~b8的元素为第一有权有权元素。可见,中心元素和第一有权元素相连接,可以构成如图6所示的直角形状,该直角形状的角平分线位于坐标系中的第一象限,则该检测核为左下检测核。
作为本发明的一种示例,如图7所示,图7为检测核B的示意图,检测核B为11×11的矩阵,其中,数值为0的元素为无权元素,数值为a的元素的为中心元素,数值为b1~b10的元素为第一有权有权元素。可见,中心元素和第一有权元素相连接,可以构成如图8所示的直角形状,该直角形状的角平分线位于坐标系中的第三象限,则该检测核为左上检测核。
在本发明实施例中,所述预设的检测核可以包括左上检测核、右上检测核、左下检测核、右下检测核,每一预设的检测核都可以对所述预处理表格线条图像进行卷积,从而得到四张卷积响应图。
在本发明的一种优选实施例中,所述第一有权元素以及所述中心元素的权重服从高斯分布;所述中心元素的权重在所述有权元素中最高;所述第一有权元素的权重基于与所述中心元素之间的距离,由近至远依次降低。
在本发明实施例中,所述中心元素在所述直角形状中,处于两条直线的交点位置,也就是说,在所述卷积响应图中,响应所述中心元素的像素部分,即为所述交叉点所在的位置。由于所述中心元素的权重在所述有权元素中最高,则在所述卷积响应图中,所述交叉点的亮度最高,颜色最接近白色,从而可以通过所述检测核,确定所述交叉点的位置。
在本发明实施例中,所述第一有权元素以及所述中心元素的权重服从高斯分布,其中,所述中心元素的权重最高,位于所述高斯分布的顶点,所述第一有权元素的权重基于与所述中心元素之间在所述矩阵中的距离,由近至远依次降低。
在本发明实施例中,为便于后续的计算处理,所述第一有权元素以及所述中心元素的权重总和可以为1。
作为本发明的一种示例,如图5所示的检测核A中,所述中心元素a以及所述第一有权元素b1~b8的权重服从高斯分布,且第一有权元素b1~b8的权重基于与所述中心元素a之间的距离,由近至远依次降低。如有权元素的权重数值为:中心元素a=e,第一有权元素b1=f1,第一有权元素b2=f2,第一有权元素b3=f3,第一有权元素b4=f4,第一有权元素b5=f5,第一有权元素b5=f5,第一有权元素b6=f6,第一有权元素b7=f7,第一有权元素b8=f8,则有权元素权重数值的大小为e>f1=f5>f2=f6>f3=f7>f4=f8
在本发明的一种优选实施例中,所述有权元素还包括至少一个第二有权元素,所述至少一个第二有权元素位于所述直角形状中任意一条或两条直线顺时针,和/或,逆时针旋转预设角度覆盖的区域中。
在本发明实施例中,可以将所述中心元素以及所述第一有权元素构成的任意一条或两条直线顺时针,和/或,逆时针旋转预设角度,得到扩展区域,该扩展区域中可以包括至少一个第二有权元素。所述第二有权元素还可以位于所述直线的垂线上,每一条所述垂线还经过一所述第一有权元素。通过所述第二有权元素,可以扩展检测核的检测区域,为表格中的边角检测提供一定的容差空间。例如表格线条存在倾斜,使表格的边角并非是直角的情况,或表格线条中部分线段轻微错开,使表格的线条并非是齐整的一条直线的情况。通过设置第二有权元素,可以更好地确定表格中边角的位置,从而确定交叉点的位置。
在本发明实施例中,所述预设角度可以为10°、15°、30°等,本发明对此不做限制。
作为本发明的一种示例,可以将图8中指向矩阵下方的直线顺时针以及逆时针旋转22.5°,从而得到如图9所示的扩展区域,并为被覆盖的区域中的无权元素分配权重,而从得到第二有权元素,最后可以从图8所示的检测核得到如图10所示的检测核C,图10所示的检测核C中,包括中心元素a,第一有权元素b1~b10、以及第二有权元素c1~c14
在本发明的一种优选实施例中,所述第二有权元素还可以位于由所述中心元素与所述第一有权元素连接形成的直线的垂线上,每一条所述垂线还经过一所述第一有权元素。每一个所述第一有权元素以及位于同一所述垂线上的所述第二有权元素服从高斯分布;所述第一有权元素的权重大于位于同一所述垂线上的所述第二有权元素的权重;所述第二有权元素的权重基于与同一所述垂线上的所述第一有权元素之间的距离,由近至远依次降低。
在本发明实施例中,当存在第二有权元素时,可以将前述的第一有权元素的权重,基于高斯分布再次进行分配,分配给第二有权元素。此时,新的第一有权元素的权重与第二有权元素的权重的总和,等于原本第一有权元素的权重的总和。由此,所有所述有权元素的权重总和不会产生变化,便于后续进行计算处理。
在本发明实施例中,可以经过垂直于所述中心元素与所述第一有权元素连接形成的直线作至少一条垂线,每一所述垂线还经过一所述第一有权元素,该垂线还可以经过至少一个第二有权元素。在基于高斯分布再次进行权重分配时,可以第一有权元素的权重,基于高斯分布分配给位于同一垂线上的第二有权元素。且所述第一有权元素的权重大于位于同一所述垂线上的所述第二有权元素的权重,所述第二有权元素的权重基于与同一所述垂线上的所述第一有权元素之间的距离,由近至远依次降低。
作为本发明的一种示例,如图11所示,将图10的检测核C中的中心元素a与第一有权元素b6~b10相连接,得到直线X,经过第一有权元素b9,作垂直于所述直线X的垂线Y,可见垂线Y经过了第二有权元素c3、c5、c10、c12。先基于高斯分布,为中心元素a以及第一有权元素b6~b10分配权重,此时第一有权元素b9分配得到的权重数值为g。其后,再将第一有权元素b9的权重,基于高斯分布,再次分配给位于同一垂线上的第二有权元素c3、c5、c10、c12。此时,第一有权元素b9的权重数值为h,第二有权元素c3的权重数值为i3,第二有权元素c5的权重数值为i5,第二有权元素c10的权重数值为i10,第二有权元素c12的权重数值为i12,且所述第一有权元素b9的权重大于位于同一所述垂线上的所述第二有权元素的权重,所述第二有权元素c3、c5、c10、c12的权重基于与同一所述垂线上的所述第一有权元素b9之间的距离,由近至远依次降低。则权重数值的大小为g=h+i3+i5+i10+i12,且h>i3=i10>i5=i12
S22,对所述卷积响应图进行自适应二值化,得到交叉点响应图像。
在本发明实施例中,可以对所述卷积响应图再次进行自适应二值化,得到交叉点响应图像,可以进一步排除其他干扰,突出交叉点,从而更准确地确定交叉点的位置。
S23,在所述交叉点响应图像中定位出交叉点。
在本发明实施例中,由于在所述交叉点响应图像中,所述交叉点的亮度最高,从而可以在所述交叉点响应图像中定位出交叉点。
通过本发明实施例的表格检测方法,将预设的检测核对所述预处理表格线条图像进行卷积,并进行自适应二值化,从而可以实现对所述交叉点的定位,便于采用所述交叉点对所述表格进行重构,从而实现表格的检测以及提取。
在本发明的一种实施例中,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
S31,对每一个所述交叉点,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点;
在本发明实施例中,所述交叉点的预设方向可以包括上、下、左、右四种方向。可以遍历交叉点的四种预设方向,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点。
S32,当在预设方向上存在其他交叉点时,确定所述预设方向为所述交叉点的连通方向;
在本发明实施例中,当所述交叉点在某一预设方向上存在另一所述交叉点时,即可认为所述交叉点在该方向上是连通的。当所述交叉点在某一方向上无法找到另一所述交叉点时,即可认为所述交叉点在该方向上不连通。由此,即可确定每一所述交叉点的连通方向。
S33,连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
在本发明实施例中,在确定所述交叉点的连通方向之后,连接所述交叉点在连通方向上最近的另一所述交叉点,即可将所述交叉点相互连接,实现表格线条的重构,得到目标表格线条图像。
通过本发明实施例的表格检测方法,查找交叉点在预设方向上是否存在其他交叉点,从而确定交叉点的连通方向,并基于交叉点的连通方向,重构表格线条,得到目标表格线条图像,从而实现了表格的检测以及提取,并有效避免了非表格线段的干扰。
在本发明的一种实施例中,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
S41,基于所述预设的检测核,确定每一个所述交叉点的类型;
在本发明实施例中,由于每一所述预设的检测核可以检测到的边角并不相同,由此,可以根据所述交叉点被何种检测核检测到,将所述交叉点分为以下九种类型:
左上L型交叉点:只被所述左上检测核检测到;
右上L型交叉点:只被所述右上检测核检测到;
左下L型交叉点:只被所述左下检测核检测到;
右下L型交叉点:只被所述右下检测核检测到;
左T型交叉点:被所述右下检测核以及所述右上检测核同时检测到;
右T型交叉点:被所述左下检测核以及所述左上检测核同时检测到;
上T型交叉点:被所述右下检测核以及所述左下检测核同时检测到;
下T型交叉点:被所述右上检测核以及所述左上检测核同时检测到;
十字型交叉点:被左上检测核、右上检测核、左下检测核、以及右下检测核中的任意三种检测图像对应的检测核同时检测到,或,被全部四种检测核同时检测到,或,可以被左下检测核以及右上检测核检测到,或,被左上检测核以及右下检测核同时检测到。
S42,基于所述交叉点的类型,确定所述交叉点的连通方向;
在本发明实施例中,所述交叉点的连通方向可以包括上、下、左、右四种方向。
在本发明实施例中,由于所述交叉点的类型示出了其是被何种检测核检测到的,而所述检测核可以检测表格中不同的边角,从而可以根据所述交叉点的类型,对所述交叉点的连通方向进行判断。例如,当所述交叉点为左上L型交叉点时,则所述交叉点的连通方向为右和下。
S43,连接每一个所述交叉点在连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
在本发明实施例中,在确定所述交叉点的连通方向之后,连接所述交叉点在连通方向上最近的另一所述交叉点,即可将所述交叉点相互连接,实现表格线条的重构,得到目标表格线条图像。
通过本发明实施例的表格检测方法,基于检测核的类型,确定交叉点的类型,从而确定交叉点的连通方向,并基于交叉点的连通方向,重构表格线条,得到目标表格线条图像,从而实现了表格的检测以及提取,并有效避免了非表格线段的干扰,还减少计算量,提高重构表格线条的效率。
在本发明的一种实施例中,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
S51,基于所述检测核,确定每一个所述交叉点的类型;
在本发明实施例中,由于每一所述预设的检测核可以到的边角并不相同,由此,可以根据所述交叉点被何种检测核检测到,确定交叉点的类型。
S52,基于所述交叉点的类型,确定每一个所述交叉点的预判连通方向;
在本发明实施例中,可以先基于所述交叉点的类型,对每一个所述交叉点的连通方向进行预判,并在后续进行校验,确定所述交叉点的连通方向是否正确。
S53,对每一个所述交叉点,确定以所述交叉点为基准的预设方向上是否存在其他交叉点;
在本发明实施例中,所述交叉点的预设方向可以包括上、下、左、右四种方向。可以遍历交叉点的四种预设方向,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点。
S54,当在预设方向上存在其他交叉点时,对比所述预设方向与所述预判连通方向是否相同;
在本发明实施例中,当在预设方向上存在其他交叉点时,可以对比所述预设方向与所述预判连通方向是否相同,以对所述交叉点的连通方向进行再次校验。
S55,当所述预设方向与所述预判连通方向相同时,确定所述预设方向为所述交叉点的连通方向;
在本发明实施例中,当所述预设方向与所述预判连通方向相同时,则连通方向校验正确,确定所述预设方向为所述交叉点的连通方向。
S56,连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
在本发明实施例中,在确定所述交叉点的连通方向之后,连接所述交叉点在连通方向上最近的另一所述交叉点,即可将所述交叉点相互连接,实现表格线条的重构,得到目标表格线条图像。
通过本发明实施例的表格检测方法,先基于检测核的类型,确定交叉点的类型,从而确定交叉点的预判连通方向,查找交叉点在预设方向上是否存在其他交叉点,对交叉点的连通方向进行校验,从而确定交叉点的连通方向,并重构表格线条,得到目标表格线条图像,从而实现了表格的检测以及提取,并有效避免了非表格线段的干扰,且准确度高。
在本发明的一种实施例中,所述表格检测方法还包括:
S61,当所述表格线条之间存在相互交叉时,将所述表格线条之间相互交叉的位置确定为交叉点;
在本发明实施例中,由于每个所述交叉点皆连接其在连通方向上最近的另一所述交叉点,因此,所述表格线条的端点应在连通方向上最近的交叉点上,而所述表格线条不可能与其他表格线条相互交叉。由此,当检测到所述表格线条之间相互交叉时,则说明表格线条之间的交叉处存在未被检测到的交叉点,并确定所述表格线条之间相互交叉的位置确定为交叉点。
S62,继续执行所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤。
在本发明实施例中,在发现新的交叉点后,可以继续执行所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤,从而获得正确的目标表格线条图像。
通过本发明实施例的表格检测方法,当所述表格线条之间存在相互交叉时,将所述表格线条之间相互交叉的位置确定为交叉点,从而实现了对交叉点的复验,并基于新的交叉点继续执行所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤,从而实现了表格的检测以及提取,并有效避免了非表格线段的干扰,且准确度高。
参照图12,示出了本发明一个实施例的表格检测装置实施例的结构框图,所述装置包括:
待测图像获取模块1201,用于获取待测图像;
预处理表格线条图像提取模块1202,用于提取所述待测图像中的表格线条元素,得到预处理表格线条图像;
交叉点提取模块1203,用于基于预设的检测核,提取所述预处理表格线条图像中的交叉点;
目标表格线条图像获取模块1204,用于基于所述交叉点,重构表格线条,得到目标表格线条图像。
在本发明的另一实施例中,所述预处理表格线条图像提取模块具体包括:
卷积响应图获取子模块,用于将预设的检测核对所述预处理表格线条图像进行卷积,得到卷积响应图;
交叉点响应图像获取子模块,用于对所述卷积响应图进行自适应二值化,得到交叉点响应图像;
交叉点定位子模块,用于在所述交叉点响应图像中定位出交叉点。
在本发明的另一实施例中,所述目标表格线条图像获取模块具体包括:
第一交叉点确定子模块,用于对每一个所述交叉点,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点;
第一连通方向确定子模块,用于当在预设方向上存在其他交叉点时,确定所述预设方向为所述交叉点的连通方向;
第一目标表格线条图像获取子模块,用于连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
在本发明的另一实施例中,所述预设的检测核为矩阵,所述矩阵中包括有权元素以及无权元素;所述有权元素为所述矩阵中具有权重的元素,所述无权元素为所述矩阵中不具有权重的元素。
在本发明的另一实施例中,所述有权元素中包括中心元素以及至少一个第一有权元素;所述中心元素与第一有权元素连接,构成左上、左下、右上、右下中任意一个或多个方向的直角形状,所述直角形状中两条直线的交点为所述中心元素。
在本发明的另一实施例中,所述第一有权元素以及所述中心元素的权重服从高斯分布;所述中心元素的权重在所述有权元素中最高;所述第一元素的权重基于与所述中心元素之间的距离,由近至远依次降低。
在本发明的另一实施例中,所述有权元素还包括至少一个第二有权元素,所述至少一个第二有权元素位于所述直角形状中任意一条或两条直线顺时针,和/或,逆时针旋转预设角度覆盖的区域中。
在本发明另一实施例中,所述目标表格线条图像获取模块具体包括:
第一交叉点类型确定子模块,用于基于所述检测核,确定每一个所述交叉点的类型;
第二连通方向确定子模块,用于基于所述交叉点的类型,确定所述交叉点的连通方向;
第二目标表格线条图像获取子模块,用于连接每一个所述交叉点在连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
在本发明另一实施例中,所述目标表格线条图像获取模块具体包括:
第二交叉点类型确定子模块,用于基于所述检测核,确定每一个所述交叉点的类型;
预判连通方向确定子模块,用于基于所述交叉点的类型,确定每一个所述交叉点的预判连通方向;
第二交叉点确定子模块,用于对每一个所述交叉点,确定以所述交叉点为基准的预设方向上是否存在其他交叉点;
预设方向对比子模块,用于当在预设方向上存在其他交叉点时,对比所述预设方向与所述预判连通方向是否相同;
第三连通方向确定子模块,用于当所述预设方向与所述预判连通方向相同时,确定所述预设方向为所述交叉点的连通方向;
第三目标表格线条图像获取子模块,用于连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
在本发明另一实施例中,所述表格检测装置还包括:
线条交叉确定模块,用于当所述表格线条之间存在相互交叉时,将所述表格线条之间相互交叉的位置确定为交叉点;
目标表格线条图像返回模块,用于继续执行所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种表格检测方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种表格检测方法,其特征在于,所述方法包括:
获取待测图像;
提取所述待测图像中的表格线条元素,得到预处理表格线条图像;
基于预设的检测核,提取所述预处理表格线条图像中的交叉点;
基于所述交叉点,重构表格线条,得到目标表格线条图像。
2.根据权利要求1所述的表格检测方法,其特征在于,所述基于预设的检测核,提取所述预处理表格线条图像中的交叉点的步骤具体包括:
将预设的检测核对所述预处理表格线条图像进行卷积,得到卷积响应图;
对所述卷积响应图进行自适应二值化,得到交叉点响应图像;
在所述交叉点响应图像中定位出交叉点。
3.如权利要求1所述的表格检测方法,其特征在于,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
对每一个所述交叉点,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点;
当在预设方向上存在其他交叉点时,确定所述预设方向为所述交叉点的连通方向;
连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
4.如权利要求1或2所述的表格检测方法,其特征在于,所述预设的检测核为矩阵,所述矩阵中包括有权元素以及无权元素;所述有权元素为所述矩阵中具有权重的元素,所述无权元素为所述矩阵中不具有权重的元素。
5.如权利要求4所述的表格检测方法,其特征在于,所述有权元素中包括中心元素以及至少一个第一有权元素;所述中心元素与第一有权元素连接,构成左上、左下、右上、右下中任意一个或多个方向的直角形状,所述直角形状中两条直线的交点为所述中心元素。
6.如权利要求5所述的表格检测方法,其特征在于,所述第一有权元素以及所述中心元素的权重服从高斯分布;所述中心元素的权重在所述有权元素中最高;所述第一有权元素的权重基于与所述中心元素之间的距离,由近至远依次降低。
7.如权利要求5或6所述的表格检测方法,其特征在于,所述有权元素还包括至少一个第二有权元素,所述至少一个第二有权元素位于所述直角形状中任意一条或两条直线顺时针,和/或,逆时针旋转预设角度覆盖的区域中。
8.如权利要求1所述的表格检测方法,其特征在于,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
基于所述预设的检测核,确定每一个所述交叉点的类型;
基于所述交叉点的类型,确定所述交叉点的连通方向;
连接每一个所述交叉点在连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
9.如权利要求1所述的表格检测方法,其特征在于,所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤具体包括:
基于所述预设的检测核,确定每一个所述交叉点的类型;
基于所述交叉点的类型,确定每一个所述交叉点的预判连通方向;
对每一个所述交叉点,确定以所述交叉点为基准的预设方向上是否存在其他交叉点;
当在预设方向上存在其他交叉点时,对比所述预设方向与所述预判连通方向是否相同;
当所述预设方向与所述预判连通方向相同时,确定所述预设方向为所述交叉点的连通方向;
连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
10.如权利要求1或3或8或9任一项所述的表格检测方法,其特征在于,在所述基于所述交叉点,重构表格线条,得到目标表格线条图像之后,还包括:
当所述表格线条之间存在相互交叉时,将所述表格线条之间相互交叉的位置确定为交叉点;
继续执行所述基于所述交叉点,重构表格线条,得到目标表格线条图像的步骤。
11.一种表格检测装置,其特征在于,所述装置包括:
待测图像获取模块,用于获取待测图像;
预处理表格线条图像提取模块,用于提取所述待测图像中的表格线条元素,得到预处理表格线条图像;
交叉点提取模块,用于基于预设的检测核,提取所述预处理表格线条图像中的交叉点;
目标表格线条图像获取模块,用于基于所述交叉点,重构表格线条,得到目标表格线条图像。
12.如权利要求11所述的表格检测装置,其特征在于,所述交叉点提取模块具体包括:
卷积响应图获取子模块,用于将预设的检测核对所述预处理表格线条图像进行卷积,得到卷积响应图;
交叉点响应图像获取子模块,用于对所述卷积响应图进行自适应二值化,得到交叉点响应图像;
交叉点定位子模块,用于在所述交叉点响应图像中定位出交叉点。
13.如权利要求11所述的表格检测装置,其特征在于,所述目标表格线条图像获取模块具体包括:
第一交叉点确定子模块,用于对每一个所述交叉点,确定以所述交叉点为基准的至少一个预设方向上是否存在其他交叉点;
第一连通方向确定子模块,用于当在预设方向上存在其他交叉点时,确定所述预设方向为所述交叉点的连通方向
第一目标表格线条图像获取子模块,用于连接每一个所述交叉点在每一个所述连通方向上距离最短的其他交叉点,重构表格线条,得到目标表格线条图像。
14.如权利要求11或12所述的表格检测装置,其特征在于,所述预设的检测核为矩阵,所述矩阵中包括有权元素以及无权元素;所述有权元素为所述矩阵中具有权重的元素,所述无权元素为所述矩阵中不具有权重的元素。
15.如权利要求14所述的表格检测装置,其特征在于,所述有权元素中包括中心元素以及至少一个第一有权元素;所述中心元素与第一有权元素连接,构成左上、左下、右上、右下中任意一个或多个方向的直角形状,所述直角形状中两条直线的交点为所述中心元素。
CN201811513646.4A 2018-12-11 2018-12-11 一种表格检测方法和装置 Active CN109858325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811513646.4A CN109858325B (zh) 2018-12-11 2018-12-11 一种表格检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811513646.4A CN109858325B (zh) 2018-12-11 2018-12-11 一种表格检测方法和装置

Publications (2)

Publication Number Publication Date
CN109858325A true CN109858325A (zh) 2019-06-07
CN109858325B CN109858325B (zh) 2021-07-02

Family

ID=66891066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811513646.4A Active CN109858325B (zh) 2018-12-11 2018-12-11 一种表格检测方法和装置

Country Status (1)

Country Link
CN (1) CN109858325B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348397A (zh) * 2019-07-15 2019-10-18 山东旗帜信息有限公司 一种电子表格的分割方法及利用该分割方法的ocr识别方法
CN110516674A (zh) * 2019-09-04 2019-11-29 中国地质调查局西安地质调查中心 一种文本图像的手写汉字分割方法及系统
CN110544263A (zh) * 2019-08-19 2019-12-06 温州大学 一种简化的检测表图像中表格的方法
CN110633660A (zh) * 2019-08-30 2019-12-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质
CN111582153A (zh) * 2020-05-07 2020-08-25 北京百度网讯科技有限公司 确定文档朝向的方法和装置
CN113688684A (zh) * 2021-07-26 2021-11-23 国网电商科技有限公司 一种基于聚类的表格重构方法及系统
WO2022134771A1 (zh) * 2020-12-23 2022-06-30 深圳壹账通智能科技有限公司 表格处理方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100111438A1 (en) * 2008-11-04 2010-05-06 Electronics And Telecommunications Research Institute Anisotropic diffusion method and apparatus based on direction of edge
CN101833546A (zh) * 2009-03-10 2010-09-15 株式会社理光 从可移植电子文档中提取表格的方法和装置
CN104732511A (zh) * 2013-12-24 2015-06-24 华为技术有限公司 一种凸多边形图像块的检测方法、装置及设备
CN105069452A (zh) * 2015-08-07 2015-11-18 武汉理工大学 基于局部结构分析的直线移除方法
CN107180239A (zh) * 2017-06-09 2017-09-19 科大讯飞股份有限公司 文本行识别方法及系统
CN107958201A (zh) * 2017-10-13 2018-04-24 上海眼控科技股份有限公司 一种车辆年检保险单表格的智能检测系统及方法
CN108305261A (zh) * 2017-08-11 2018-07-20 腾讯科技(深圳)有限公司 图片分割方法、装置、存储介质和计算机设备
CN108491788A (zh) * 2018-03-20 2018-09-04 上海眼控科技股份有限公司 一种用于财务报表单元格的智能提取方法及装置
CN108564120A (zh) * 2018-04-04 2018-09-21 中山大学 基于深度神经网络的特征点提取方法
CN108596066A (zh) * 2018-04-13 2018-09-28 武汉大学 一种基于卷积神经网络的字符识别方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100111438A1 (en) * 2008-11-04 2010-05-06 Electronics And Telecommunications Research Institute Anisotropic diffusion method and apparatus based on direction of edge
CN101833546A (zh) * 2009-03-10 2010-09-15 株式会社理光 从可移植电子文档中提取表格的方法和装置
CN104732511A (zh) * 2013-12-24 2015-06-24 华为技术有限公司 一种凸多边形图像块的检测方法、装置及设备
CN105069452A (zh) * 2015-08-07 2015-11-18 武汉理工大学 基于局部结构分析的直线移除方法
CN107180239A (zh) * 2017-06-09 2017-09-19 科大讯飞股份有限公司 文本行识别方法及系统
CN108305261A (zh) * 2017-08-11 2018-07-20 腾讯科技(深圳)有限公司 图片分割方法、装置、存储介质和计算机设备
CN107958201A (zh) * 2017-10-13 2018-04-24 上海眼控科技股份有限公司 一种车辆年检保险单表格的智能检测系统及方法
CN108491788A (zh) * 2018-03-20 2018-09-04 上海眼控科技股份有限公司 一种用于财务报表单元格的智能提取方法及装置
CN108564120A (zh) * 2018-04-04 2018-09-21 中山大学 基于深度神经网络的特征点提取方法
CN108596066A (zh) * 2018-04-13 2018-09-28 武汉大学 一种基于卷积神经网络的字符识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卞静潇: "复杂版面文档图像表格与图的提取及分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348397A (zh) * 2019-07-15 2019-10-18 山东旗帜信息有限公司 一种电子表格的分割方法及利用该分割方法的ocr识别方法
CN110544263A (zh) * 2019-08-19 2019-12-06 温州大学 一种简化的检测表图像中表格的方法
CN110633660A (zh) * 2019-08-30 2019-12-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质
CN110516674A (zh) * 2019-09-04 2019-11-29 中国地质调查局西安地质调查中心 一种文本图像的手写汉字分割方法及系统
CN110516674B (zh) * 2019-09-04 2023-04-18 中国地质调查局西安地质调查中心 一种文本图像的手写汉字分割方法及系统
CN111582153A (zh) * 2020-05-07 2020-08-25 北京百度网讯科技有限公司 确定文档朝向的方法和装置
CN111582153B (zh) * 2020-05-07 2023-06-30 北京百度网讯科技有限公司 确定文档朝向的方法和装置
WO2022134771A1 (zh) * 2020-12-23 2022-06-30 深圳壹账通智能科技有限公司 表格处理方法、装置、电子设备及存储介质
CN113688684A (zh) * 2021-07-26 2021-11-23 国网电商科技有限公司 一种基于聚类的表格重构方法及系统
CN113688684B (zh) * 2021-07-26 2022-04-05 国网电商科技有限公司 一种基于聚类的表格重构方法及系统

Also Published As

Publication number Publication date
CN109858325B (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN109858325A (zh) 一种表格检测方法和装置
CN109427066A (zh) 任意角度的边缘检测方法
CN105913093B (zh) 一种用于文字识别处理的模板匹配方法
Shao et al. Application of a fast linear feature detector to road extraction from remotely sensed imagery
US8879839B2 (en) Image processing apparatus, image processing method, and storage medium
CN102236789B (zh) 对表格图像进行校正的方法以及装置
CN108960229A (zh) 一种面向多方向的文字检测方法和装置
CN110349207A (zh) 一种复杂环境下的视觉定位方法
CN104537376B (zh) 一种识别台标的方法及相关设备、系统
CN104217459B (zh) 一种球面特征提取方法
CN104462526B (zh) 面向高分辨率遥感影像的多人在线协同快速矢量化方法
CN102446356A (zh) 一种获取均匀分布匹配点的遥感影像并行自适应匹配方法
CN103235947A (zh) 一种手写体数字识别方法及装置
CN106022337B (zh) 一种基于连续边缘特征的平面目标检测方法
CN108763996A (zh) 一种基于二维码的平面定位坐标与方向角测量方法
CN105005781B (zh) 一种鲁棒扩展局部二值模式纹理特征提取方法
CN109543525B (zh) 一种通用表格图像的表格提取方法
Kumar et al. Comparative analysis for edge detection techniques
CN109636911A (zh) 一种基于体感设备的扫描方法及系统
CN103235951A (zh) 一种矩阵式二维条码的初步定位方法
CN115187995B (zh) 文档矫正方法、装置、电子设备和存储介质
CN106228553A (zh) 高分辨率遥感图像阴影检测装置与方法
CN116263984A (zh) 三维地图可视化方法、装置、电子设备及存储介质
CN105930813B (zh) 一种在任意自然场景下检测行文本的方法
JP2024501444A (ja) メディアコンテンツのオーバーレイに適した画像スペースの検出

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant