CN115082944A - 表格的智能识别切分方法、系统和终端 - Google Patents
表格的智能识别切分方法、系统和终端 Download PDFInfo
- Publication number
- CN115082944A CN115082944A CN202210163563.7A CN202210163563A CN115082944A CN 115082944 A CN115082944 A CN 115082944A CN 202210163563 A CN202210163563 A CN 202210163563A CN 115082944 A CN115082944 A CN 115082944A
- Authority
- CN
- China
- Prior art keywords
- image
- coordinates
- corner
- straight line
- area range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Abstract
本发明提供一种表格的智能识别切分方法、系统和终端,所述智能识别切分方法包括:对读取的表格图像进行预处理,得到处理后的表格图像;对所述处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像;根据所述水平直线图像和竖直直线图像,确定角点坐标;根据所述角点坐标,确定表格区域范围;根据所述表格区域范围,对表格进行切分。本发明通过将对复杂表格识别转化为简单的文本块识别,极大减少文字识别环境干扰。同时,通过矩形搜索算法,实现对表格角点的循环迭代,能够实现不同排版样式、表格与表格嵌套情况下对图像表格进行高精度切分。从而实现了对任意样式的表格的高精度切分,提高了切分效率和精度。
Description
技术领域
本发明涉及图像处理技术领域,具体地,涉及一种表格的智能识别切分方法、系统和终端。
背景技术
表格作为一种组织整理数据的手段,是文字数据记录汇总最精简的表达方式,在通讯交流、科学研究和数据分析中被广泛采用。目前,大部分表格资料一般以图片的形式提供,比如各种扫描文件、PDF文件等,而自动识别、获取这些图像表格资料中的信息并转换为数字资料,是对表格信息进行快速处理和分析的基础。而目前一般的做法是直接对图像表格文字数据进行识别,然后再借助聚类手段进行结构化的数据提取,但由于表格的上下文环境的不同,用来确切描述表格的惯例有所不同,造成表格资料的表格结构特征迥然各异,复杂多变的轮廓框线使得对聚类时需要引入很多聚类阈值,对不同表格通用性不强。
目前,对图像表格进行切分常用的方法是,将待处理图像表格进行二值化处理,使用opencv图像处理工具检测出图像表格单元格轮廓;将检测出的单元格轮廓的点集提取出来放置在对应的点类中,构建出包含单元格轮廓点集的面积最小的旋转矩形区域,并提取出该旋转矩形区域的四角顶点坐标点,根据四角顶点坐标值将对应单元格中的文字信息作为整体切分出来。这种表格切分方法能对一定格式的图像表格进行切分,但对于任意排版、表格结构样式多样复杂、表格与表格相互嵌套、存在水印等情况,用opencv进行处理通用性差,切分准确度不高,抗噪能力弱。
在中国专利CN104636117A提出了一种表格图像的自动切分方法。该方法步骤如下:1)对已知表格中需要切分、识别或人工录入的区域进行事先标定,通过模版定制,将表格及其区域信息都存入表格模板库,获取知识驱动信息;2)对扫描或拍摄的表格图像进行自动分析、检测与定位文本区域,获取数据驱动信息;3)综合知识驱动信息和数据驱动信息,比较两者吻合程度,对最终切分区域的定位。该方法中虽然能够实现对表格的自动切分,但知识驱动信息局限于已知的表格,对未知表格的切分依赖于模板库中的样板,对于实现任意样式的表格的高精度切分仍有一定的距离。
现有的对图像表格进行切分的方法,主要存在以下三大问题:
1、切分方法通用性不强,仅能解决结构较为简单规则的表格切分问题。
2、为了对结构复杂的表格进行切分,往往需要制定多个模板,效率不高且有一定局限性。
3、对于表格与表格之间相互嵌套、存在水印等问题,现有方法下切分准确度不高,抗噪能力弱。
因此,亟待一种实现对任意样式的表格进行高精度切分的方法。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种表格的智能识别切分方法、系统和终端。
第一方面,本发明实施例提供一种表格的智能识别切分方法,包括:
对读取的表格图像进行预处理,得到处理后的表格图像;
对所述处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像;
根据所述水平直线图像和竖直直线图像,确定角点坐标;
根据所述角点坐标,确定表格区域范围;
根据所述表格区域范围,对表格进行切分。
可选地,对读取的表格图像进行预处理,得到处理后的表格图像,包括:
将读取的表格图像转化为灰度图;
调整所述灰度图的灰度特征,并对调整后的所述灰度图进行倾斜矫正,得到处理后的表格图像。
可选地,对所述处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像,包括:
运用形态学开运算,对所述处理后的表格图像分别进行水平直线检测和竖直直线检测,得到水平直线图像和竖直直线图像。
可选地,根据所述水平直线图像和竖直直线图像,确定角点坐标,包括:
根据所述水平直线图像和竖直直线图像,确定角点图像;
根据所述角点图像,确定角点图像坐标;
对所述角点图像坐标进行平均值处理,得到角点坐标。
可选地,根据所述角点坐标,确定表格区域范围,包括:
将所述角点坐标按照预设规则排列,得到排序后的角点坐标;
运用矩阵搜索算法识别所述排序后的角点坐标,得到矩形区域范围;其中,所述矩形区域范围即为表格区域范围。
可选地,所述预设规则是指:将所述角点坐标按照从上至下、从左至右的规则进行排列。
可选地,在根据所述角点坐标,确定表格区域范围之后,还包括:
识别表格区域范围内的文本信息。
第二方面,本发明实施例提供一种表格的智能识别切分系统,包括:
预处理模块,用于对读取的表格图像进行预处理,得到处理后的表格图像;
图像检测识别模块,用于对所述预处理模块处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像;
表格切分模块,该模块根据所述水平直线图像和竖直直线图像确定角点坐标,然后根据所述角点坐标确定表格区域范围,再根据所述表格区域范围,对表格进行切分。
可选地,所述表格切分模块,包括角点坐标处理单元和表格区域范围计算单元:
所述角点坐标单元根据所述水平直线图像和竖直直线图像确定角点图像,根据所述角点图像确定角点图像坐标;对所角点图像坐标进行平均值处理得到角点坐标;
所述表格区域范围计算单元将所述角点坐标按照预设规则排列,得到排序后的角点坐标;运用矩阵搜索算法识别所述排序后的角点坐标,得到矩形区域范围;其中,所述矩形区域范围即为表格区域范围。
第三方面,本发明提供一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时可用于执行上述的表格的智能识别切分方法。
与现有技术相比,本发明具有如下的有益效果:
本发明通过将对复杂表格识别转化为简单的文本块识别,极大减少文字识别环境干扰。
进一步的,本发明通过矩形搜索算法,实现对表格角点的循环迭代,能够实现不同排版样式、表格与表格嵌套情况下对图像表格进行高精度切分。
进一步的,本发明能实现了对任意样式的表格的高精度切分,提高了切分效率和精度。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一实施例中的表格的智能识别切分的流程图;
图2为本发明一实施例中供的原始表格图像;
图3为本发明一实施例中的调整灰度特征后的灰度图;
图4为本发明一实施例中的处理后的表格图像;
图5为本发明一实施例中的水平直线图像和竖直直线图像;
图6为本发明一实施例中的角点图像;
图7为本发明一实施例中的矩阵搜索算法识别角点坐标的示意图;
图8为本发明一实施例中的矩形区域范围的示意图;
图9为本发明一实施例中的表格切分的效果示意图;
图10为本发明一实施例的表格的切分系统模块框图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
图1为本发明一实施例提供的表格的智能识别切分方法的流程图,如图1所示,本实施例中的方法可以包括:
S101、对读取的表格图像进行预处理,得到处理后的表格图像。
本实施例中,首先,将读取的表格图像转化为灰度图。然后,调整灰度图的灰度特征,并对调整后的灰度图进行倾斜矫正,得到处理后的表格图像。
具体地,以某公司的公司登记(备案)申请书为例进行说明。图2为本发明一实施例提供的原始表格图像,图3为本发明一实施例提供的调整灰度特征后的灰度图,图4为本发明一实施例提供的处理后的表格图像。结合图2、图3、图4所示,将读取图片转化为灰度图,并按图像的灰度特性进行自适应阈值图像处理。本实施例中的公司登记(备案)申请书,经过自适应阈值图像处理后的图像如图3所示。从图2、图3可以看到,该图像表格存在一定的倾斜,会影响后续表格切分,故对其进行倾斜矫正处理,处理后的表格图像如图4所示。
S102、对处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像。
本实施例中,运用形态学开运算,对处理后的表格图像分别进行水平直线检测和竖直直线检测,得到如图5所示水平直线图像和竖直直线图像。图5为本发明一实施例提供的水平直线图像和竖直直线图像。
S103、根据水平直线图像和竖直直线图像,确定角点坐标。
本实施例中,根据水平直线图像和竖直直线图像,确定角点图像;根据角点图像,确定角点图像坐标;对所角点图像坐标进行平均值处理,得到角点坐标。
具体地,对检测到的水平直线图像和竖直直线图像进行交集运算,获取角点图像。图6为本发明一实施例提供的角点图像,如图6所示,获取角点图像的坐标,得到角点坐标,对角点坐标进行平均值处理,避免重复提取同一处的角点。
S104、根据角点坐标,确定表格区域范围。
本实施例中,将角点坐标按照预设规则排列,得到排序后的角点坐标;运用矩阵搜索算法识别排序后的角点坐标,得到矩形区域范围;其中,矩形区域范围即为表格区域范围。可选地,预设规则是指:将角点坐标按照从上至下、从左至右的规则进行排列。
具体地,将角点坐标按从上到下、从左到右的顺序进行排序。在完成排序后,运用矩阵搜索算法对表格矩形和相应角点进行搜索,得到矩形区域范围。通过矩阵搜索算法,对所有角点进行迭代,最终正确切分出表格中所有矩形区域。其中,矩阵搜索算法通过图7中的示意图进行详细说明。图7为本发明一实施例提供的矩阵搜索算法识别角点坐标的示意图,图8为本发明一实施例提供的矩形区域范围的示意图,如图7、图8所示,假设获取的有可能成为角点的角点个数为7个,分别用数字1-7予以标识。显然,角点1、4、5、7是组成矩形的有用角点,下面通过以下步骤提取1、4、5、7这四个角点:
步骤S1:将要进行提取的矩形四个角点变量用tl、tr、bl、br进行表示,如图8所示;
步骤S2:将图7中的7个角点按从上至下、从左至右的原则进行排序;
步骤S3:假设tl=1,遍历搜索所有角点,判断是否存在tl-bl边,如果不存在,则无矩形,程序结束;如果存在,则进行下一步骤;
步骤S4:遍历所有角点,判断是否存在tl-tr边,不存在,则无矩形,程序结束;如果存在,执行下一步骤;
步骤S5:判断是否存在tr-br以及br-bl边,不存在,则返回上一步骤,存在,则找到矩形,返回对应角点,否则无矩形,程序结束。
S105、根据表格区域范围,对表格进行切分。
本实施例中,根据表格区域,对表格图像进行切分,得到如图9所示的表格切分的效果示意图。如图9所示,本发明可以对任意样式的表格的高精度切分,提高了切分效率和精度。可选地,本发明还可以识别表格区域范围内的文本信息,从而提升表格图像的识别能力,提升自动化水平。
如图10所示,对应于上述方法,本发明实施例还提供一种表格的切分系统,包括:预处理模块,用于对读取的表格图像进行预处理,得到处理后的表格图像;图像检测识别模块,用于对预处理模块处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像;表格切分模块,该模块根据水平直线图像和竖直直线图像确定角点坐标,然后根据角点坐标确定表格区域范围,再根据表格区域范围,对表格进行切分。该实施例中各模块具体实现可以采用上述表格的切分方法实施例中各步骤对应的技术,在此不再赘述。
另外,本发明实施例还提供一种用于实现任意样式表格切分的终端,该终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时可用于执行上述实施例中的表格的切分方法。
需要说明的是,本发明提供的所述方法中的步骤,可以利用所述系统中对应的模块、装置、单元等予以实现,本领域技术人员可以参照所述系统的技术方案实现所述方法的步骤流程,即,所述系统中的实施例可理解为实现所述方法的优选例,在此不予赘述。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个模块、装置、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种表格的智能识别切分方法,其特征在于,包括:
步骤S101、对读取的表格图像进行预处理,得到处理后的表格图像;
步骤S102、对所述处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像;
步骤S103、根据所述水平直线图像和竖直直线图像,确定角点坐标;
步骤S104、根据所述角点坐标,确定表格区域范围;
步骤S105、根据所述表格区域范围,对表格进行切分。
2.根据权利要求1所述的表格的智能识别切分方法,其特征在于,所述步骤S101包括:
将读取的表格图像转化为灰度图;
调整所述灰度图的灰度特征,并对调整后的所述灰度图进行倾斜矫正,得到处理后的表格图像。
3.根据权利要求1所述的表格的智能识别切分方法,其特征在于,所述步骤S102包括:
运用形态学开运算,对所述处理后的表格图像分别进行水平直线检测和竖直直线检测,得到水平直线图像和竖直直线图像。
4.根据权利要求1所述的表格的智能识别切分方法,其特征在于,所述步骤S103包括:
根据所述水平直线图像和竖直直线图像,确定角点图像;
根据所述角点图像,确定角点图像坐标;
对所述角点图像坐标进行平均值处理,得到角点坐标。
5.根据权利要求1所述的表格的智能识别切分方法,其特征在于,所述步骤S104包括:
将所述角点坐标按照预设规则排列,得到排序后的角点坐标;
运用矩阵搜索算法识别所述排序后的角点坐标,得到矩形区域范围;其中,所述矩形区域范围即为表格区域范围。
6.根据权利要求5所述的表格的智能识别切分方法,其特征在于,所述预设规则是指:将所述角点坐标按照从上至下、从左至右的规则进行排列。
7.根据权利要求1-6中任一项所述表格的智能识别切分方法,其特征在于,所述步骤S104之后,还包括:
识别表格区域范围内的文本信息。
8.一种表格的智能识别切分系统,其特征在于,包括:
预处理模块,用于对读取的表格图像进行预处理,得到处理后的表格图像;
图像检测识别模块,用于对所述预处理模块处理后的表格图像进行图像检测,识别出水平直线图像和竖直直线图像;
表格切分模块,该模块根据所述水平直线图像和竖直直线图像确定角点坐标,然后根据所述角点坐标确定表格区域范围,再根据所述表格区域范围,对表格进行切分。
9.根据权利要求8所述的表格的智能识别切分系统,其特征在于,所述表格切分模块,包括角点坐标处理单元和表格区域范围计算单元:
所述角点坐标单元根据所述水平直线图像和竖直直线图像确定角点图像,根据所述角点图像确定角点图像坐标;对所角点图像坐标进行平均值处理得到角点坐标;
所述表格区域范围计算单元将所述角点坐标按照预设规则排列,得到排序后的角点坐标;运用矩阵搜索算法识别所述排序后的角点坐标,得到矩形区域范围;其中,所述矩形区域范围即为表格区域范围。
10.一种终端,包括存储器、处理器及存储在存储器上并能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时能够用于执行权利要求1-7任一项所述的表格的智能识别切分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210163563.7A CN115082944A (zh) | 2022-02-22 | 2022-02-22 | 表格的智能识别切分方法、系统和终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210163563.7A CN115082944A (zh) | 2022-02-22 | 2022-02-22 | 表格的智能识别切分方法、系统和终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115082944A true CN115082944A (zh) | 2022-09-20 |
Family
ID=83245623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210163563.7A Pending CN115082944A (zh) | 2022-02-22 | 2022-02-22 | 表格的智能识别切分方法、系统和终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115082944A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115620321A (zh) * | 2022-10-20 | 2023-01-17 | 北京百度网讯科技有限公司 | 表格识别方法及装置、电子设备和存储介质 |
-
2022
- 2022-02-22 CN CN202210163563.7A patent/CN115082944A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115620321A (zh) * | 2022-10-20 | 2023-01-17 | 北京百度网讯科技有限公司 | 表格识别方法及装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689010B (zh) | 一种证件识别方法及装置 | |
CN111860502B (zh) | 图片表格的识别方法、装置、电子设备及存储介质 | |
CN110502985B (zh) | 表格识别方法、装置及表格识别设备 | |
CN110008809A (zh) | 表格数据的获取方法、装置和服务器 | |
WO2018233055A1 (zh) | 保单信息录入的方法、装置、计算机设备及存储介质 | |
US20210049357A1 (en) | Electronic document segmentation using deep learning | |
CN113343740B (zh) | 表格检测方法、装置、设备和存储介质 | |
Rakhmadi et al. | Connected component labeling using components neighbors-scan labeling approach | |
CN102750530B (zh) | 一种字符识别方法及装置 | |
CN114004204B (zh) | 基于计算机视觉的表格结构重建与文字提取方法和系统 | |
CN112348836A (zh) | 一种自动提取建筑物轮廓的方法及装置 | |
CN112085022A (zh) | 一种用于识别文字的方法、系统及设备 | |
CN110780276A (zh) | 一种基于激光雷达的托盘识别方法、系统和电子设备 | |
CN110737785A (zh) | 一种图片标注的方法及装置 | |
CN110807404A (zh) | 基于深度学习的表格线检测方法、装置、终端、存储介质 | |
CN115761773A (zh) | 基于深度学习的图像内表格识别方法及系统 | |
CN113807293B (zh) | 减速带的检测方法、系统、设备及计算机可读存储介质 | |
CN113297870A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN114120345A (zh) | 信息提取方法、装置、设备及存储介质 | |
CN116311299A (zh) | 表格的结构化数据识别方法、装置及系统 | |
US11978197B2 (en) | Inspection method for inspecting an object and machine vision system | |
CN115082944A (zh) | 表格的智能识别切分方法、系统和终端 | |
CN113469302A (zh) | 一种视频图像的多圆形目标识别方法和系统 | |
CN113392455A (zh) | 基于深度学习的户型图比例尺检测方法、装置及电子设备 | |
CN117095207A (zh) | 芯片图像标注方法、装置、计算设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |