CN110502985A - 表格识别方法、装置及表格识别设备 - Google Patents
表格识别方法、装置及表格识别设备 Download PDFInfo
- Publication number
- CN110502985A CN110502985A CN201910627106.7A CN201910627106A CN110502985A CN 110502985 A CN110502985 A CN 110502985A CN 201910627106 A CN201910627106 A CN 201910627106A CN 110502985 A CN110502985 A CN 110502985A
- Authority
- CN
- China
- Prior art keywords
- line segment
- intersection point
- point
- direction line
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本公开公开了一种表格识别方法、装置及电子设备,其中,方法包括:提取待识别表格中的第一方向线段和第二方向线段,第一方向与第二方向相交;将第一方向线段和第二方向线段位置回归,提取交点和交点的类型,交点的类型包括线段交叉点、线段终点和线段起点;由第一方向线段和第二方向线段生成虚拟表格;根据交点的类型对虚拟表格的单元格进行合并得到识别后的表格。由于交点与待识别表格中的线条与线条的交点一一映射,待识别表格中的交点可以包括线段交叉点、线段终点和线段起点,相邻的两个线段交叉点之间必然存在表格线条,线段起点与相邻的其他线段终点之间必然不存在表格线条,因此,可以在待识别表格的框架上较为准确绘制出待识别表格。
Description
技术领域
本公开涉及图像识别技术领域,具体涉及一种表格识别方法、装置及表格识别设备。
背景技术
随着时代的发展,对环保和资源节约等方面的重视,无纸化办公成为当前数字化办公方面的发展热点。采用图文识别可以将图片文字映射入一个可编辑的文档中,以代替繁杂的人工导入,节约人力成本。在图文识别的过程中,需要力求识别的准确性,图文识别又叫光学字符识别(Optical Character Recognition,OCR)是指:电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字信息的过程。
发明内容
有鉴于此,本公开实施例提供了一种表格识别方法、装置及电子设备以以进行较为准确的图文识别。
根据第一方面,本公开实施例提供了一种表格识别方法,提取待识别表格中的第一方向线段和第二方向线段,第一方向与第二方向相交;将第一方向线段和第二方向线段进行位置回归,并提取由第一方向线段和第二方向线段的交点和交点的类型,交点的类型包括线段交叉点、线段终点和线段起点;根据第一方向线段和第二方向线段生成虚拟表格,虚拟表格包括n-1行、m-1列,其中n为第一方向线段的数量,m为第二方向线段的数量;根据交点的类型对虚拟表格的单元格进行合并得到识别后的表格。
可选地,根据交点的类型对虚拟表格的单元格进行合并得到识别后的表格包括:选择任意交点作为目标点,分别在目标点所在的x轴方向线段上和y轴方向线段上检测虚拟表格的单元格的顶点是否为交点;当当前顶点不为交点时,沿检测方向分别合并当前顶点所在的单元格。
可选地,当当前顶点为交点时;判断当前顶点是否为线段交叉点;当当前顶点为线段交叉点时,确认当前顶点所在的单元格为分立单元格。
可选地,当当前顶点为交点时;判断当前顶点是否为其他线段的线段起点或线段终点;当当前顶点为其他线段的线段起点或线段终点时,在检测方向上合并当前顶点与目标点之间连线背离其他线段的一侧的当前顶点所在的单元格。
可选地,第一方向包括x周方向,第二方向包括y轴方向;提取由第一方向线段和第二方向线段的交点和交点的类型包括:基于图像形态学提取待识别表格中的x轴方向线段和y轴方向线段以及x轴方向线段和y轴方向线段的交点;在预设坐标系下对交点坐标赋值,得到各个交点的坐标值;基于坐标值确认交点的类型。
可选地,识别方法,还包括:基于交点的坐标值依次对待识别表格的单元格切割;按照切割顺序识别切割后的单元格中内的文字;按照切割顺序依次将识别后的文字填入识别后的表格的单元格内。
可选地,按照切割顺序识别切割后的单元格中内的文字包括:判断切割后的单元格内是否包含文字,当切割后的单元格内不包含文字时,输出预设字符。
可选地,预设坐标系的原点为待识别表格的任意之一的顶角所在的交点,方法还包括:选取切割待识别表格的单元格的切割起点,切割起点的坐标值中的x轴坐标值的绝对值为非最大值且y轴坐标值的绝对值为非最大值;保持切割起点的y轴坐标不变沿x轴的坐标值的绝对值增加的方向遍历交点的坐标值,选取第一切割终点,第一切割终点为其所在y轴方向线段的线段交叉点或线段起点;保持第一切割终点的x轴坐标不变,沿y轴坐标值的绝对值变大的方向遍历交点的坐标值,选取第二切割终点,第二切割终点为其所在x轴方向线段的线段交叉点或线段终点;根据切割起点和第二切割终点的坐标值对待识别表格的单元格切割。
根据第二方面,本公开实施例提供了一种表格识别装置,包括:第一提取模块,用于提取待识别表格中的第一方向线段和第二方向线段,第一方向与第二方向相交;第二提取模块,用于将第一方向线段和第二方向线段进行位置回归,并提取由第一方向线段和第二方向线段的交点和交点的类型,交点的类型包括线段交叉点、线段终点和线段起点;虚拟表格生成模块,用于根据第一方向线段和第二方向线段生成虚拟表格,虚拟表格包括n-1行、m-1列,其中n为第一方向线段的数量,m为第二方向线段的数量;识别模块,用于根据交点的类型对虚拟表格的单元格进行合并得到识别后的表格。
根据第三方面,本公开实施例提供了一种表格识别设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面任意一项描述的表格识别方法。
根据第四方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的表格识别方法。
本公开具有如下有益效果:
1.在表格识别过程中,提取表格中的表格中的线条以及线条的交点和交点的类型,并根据提取的线条生成一个虚拟表格,可以得到待识别表格的框架,再利用交点的类型对虚拟表格中的单元格进行合并,由于交点与待识别表格中的线条与线条的交点一一映射,并且,待识别表格中的交点可以包括线段交叉点、线段终点和线段起点,相邻的两个线段交叉点之间必然存在表格线条,而线段起点与相邻的其他线段终点之间必然不存在表格线条,因此,可以在待识别表格的框架上较为准确绘制出待识别表格。
2.基于图像形态学提取待识别表格中的x轴方向线段和y轴方向线段以及所述x轴方向线段和所述y轴方向线段的交点,由于图像形态学对线条提取精准,计算过程简单,可以利用较少的计算资源完成对图片中表格的提取与识别,节省了大量的用于将纸质表格录入电脑文档中的人力成本和时间成本。
3.在文字识别之前,先对待识别表格按照待识别表格的单元格进行切割,分别对切割后的单元格内的文字进行识别,可以避免在识别表格文字时由于表格线条的影响,将表格线条误识别为文字,提高文字识别精度。
4.由于待识别表格中可能存在某些单元格内不包含文字的情况,在文字识别过程中,将不包含文字的单元输出预设字符以标注该单元格中不存在文字,避免了在文字填入单元格的过程中的单元格与字符不匹配的问题。
5.在对待识别表格的单元格进行切割时,只需确定切割起点之后沿某一方向检测临近交点的类型,确定第一个切割终点,再以第一个切割终点沿另一方向检测临近交点类型,确定第二切割终点,根据切割起点周围的交点的类型检测独立的单元格,无需读取单元格的所有顶点(交点)组成闭合路径后再得到单元格,可以以较小的计算量和较快的计算速度识别单元格进而对单元格实现快速准确的切割。
附图说明
为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开实施例的表格识别方法的流程示意图;
图2示出了本公开实施例的虚拟表格单元格合并方法示意图;
图3示出了本公开实施例的另一表格识别方法的流程图;
图4示出了本公开实施例的表格识别装置示意图
图5示出了本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
目前,OCR在对表格中的文字识别时通常只能识别文字,难以识别表格,为实现表格识别,现有技术中通常在霍夫变换对文档图像校正后,应用基于连通域的自底而上的版面分析方法,将文档的版面分为文字和表格。利用单连通链的合并提取表格线,利用最小二乘法将有向连通链抽象为表格线段,在提取的表格线段基础上,根据水平和竖直方向线段之间的关系得到的特征点集合,将表格结构信息表设为LaTeX字符串。对文本膨胀后使用连通域分析的方法进行文本分割,进而完成文字识别。然而,发明人发现现有技术中的上述方法经常会出现识别不准的情况,经发明人研究发现,采用自底而上的策略,在底层的误差会层层传递,最终很大可能会以错误的形式在结果中体现;利用基于连通域的版面分析方法,将版面分为图片、文字、表格,在分类的过程中可能产生误差,影响表格的识别。面对文字与表格框线个别重叠的部分,也会影响其识别的准确性。因此,本公开实施例提供了一种表格识别方法,适用于表格识别设备,该表格识别设备可以为计算机、可以为服务器,还可以为其他具有表格识别功能的电子设备,如图1所示,该方法可以包括如下步骤:
S1.提取待识别表格中的第一方向线段和第二方向线段。其中,第一方向与第二方向相交,具体的,第一方向与第二方向具有一定夹角,该夹角可以大于0°小于或等于90°。在本实施例中,待识别表格中的线段的提取可以采用神经网络进行识别,还可以采用图像形态学的处理方式提取线段和交点,在本实施例中可以以图像形态学的处理方式提取线段和交点,具体的,待识别表格可以为图片形式的待识别表格,首先对图片进行二值化处理,得到二值化图像,以预设的形态学因子对二值化图像进行腐蚀和膨胀处理,过滤掉表格内的文字,提取出表格框架。具体的,以第一方向和第二方向夹角为90°为例进行说明,为方便说明,在本实施例中,可以以第一方向为x轴方向,第二方向为y轴方向进行说明。本领域技术人员应当理解,在表格中出来沿x轴方向和y轴方向的线段外,还可以存在其他方向的线段,本实施例列举x轴方向和y轴方向的线段只是为了方便说明,其他方向的线段同样在本实施例的保护范围内。形态学因子可以采用高度为1像素,宽度为图片宽度1/12像素和宽度为1像素,高度为图片高度1/12像素的膨胀核与腐蚀核提取待识别表格中的x轴方向线段和y轴方向线段。
S2.将第一方向线段和第二方向线段进行位置回归,并提取由第一方向线段和第二方向线段的交点和交点的类型。以第一方向为x轴方向,第二方向为y轴方向进行说明:将x轴方向线段和y轴方向线段按照原位置合并,得到x轴方向线段和y轴方向线段的交点,在本实施例中,提取的交点在二值化图像中亮点(灰度值为255),在预设坐标系下分别对各个交点进行赋值得到各个交点在预设坐标系下的坐标值。在本实施例中,预设坐标系的原点可以为待识别表格的任意之一的顶角所在的交点,在本实施例中可以以预设坐标系的原点为待识别表格的左上角的交点为例进行说明:根据各个交点的坐标值确定各个交点的类型,交点的类型可以包括线段交叉点、线段终点和线段起点,其中,例如,x轴方向线段的线段起点为当前线段上的所有交点中x轴坐标值最小的点,x轴方向线段的线段终点为当前线段上的所有交点中x轴坐标值最大的点。y轴方向线段的线段起点为当前线段上的所有交点中y轴坐标值最小的点,x轴方向线段的线段终点为当前线段上的所有交点中y轴坐标值最大的点。除线段起点和线段终点之外的所有交点均为线段交叉点,在本实施例中,先对线段进行提取,在进行位置回归,在已知线段的情况下,依据上述规则对线段交点类型进行分类。
S3.根据第一方向线段和第二方向线段生成虚拟表格。以第一方向为x轴方向,第二方向为y轴方向进行说明:虚拟表格包括n-1行、m-1列,其中n为x轴方向线段的数量,m为y轴方向线段的数量,在本实施例中,可以根据x轴方向线段和y轴方向线段数量可以得到虚拟表格,例如,提取十条x轴方向线段和六条y轴方向线段,则生成九行五列的表格。在本实施例中,该虚拟表格中的线段的交点可以包括线段交叉点、线段终点和线段起点以及虚拟交点即实际不存在的交点。
S4.根据交点的类型对虚拟表格的单元格进行合并得到识别后的表格。在本实施例中,待识别表格中的交点可以包括线段交叉点、线段终点和线段起点,相邻的两个线段交叉点之间必然存在表格线条,而线段起点与相邻的其他线段终点之间必然不存在表格线条,因此,在得到交点的类型之后,可以根据交点的类型确定该交点周围是否存在实际的线段,如果不能存在实际线段,例如,线段起点的一侧不存在线段,可以将对应的单元格合并,从而可以在待识别表格的框架上较为准确绘制出待识别表格。
下面将对根据交点的类型对虚拟表格的单元格进行合并得到识别后的表格的原理进行详细介绍,并且以第一方向为x轴方向,第二方向为y轴方向进行说明:
选择任意交点作为目标点。分别在目标点所在的x轴方向线段上和y轴方向线段上检测虚拟表格的单元格的顶点是否为交点;当当前顶点不为交点时,可以确认该顶点为虚拟交点,即在该位置不存在交点,图2中以空心点示意虚拟交点,沿检测方向分别合并当前顶点所在的单元格,即沿检测方向合并目标点与当前顶点所在线段的两侧的单元格,其中,参见图2中区域A示出了x轴方向检测时单元格合并方法,在本实施例中,y轴方向检测时可以参照x轴方向检测时单元格合并方法,在本实施例中不再赘述。
当当前顶点为交点时;判断当前顶点是否为线段交叉点;当当前顶点为线段交叉点时,可以确认该顶点为两条线段的交叉点,可以确认当前顶点所在的单元格为分立单元格,无需合并单元格,图2中以实心点示意线段交叉点,其中,参见图2中区域B示出了x轴方向检测时单元格合并方法,在本实施例中,y轴方向检测时可以参照x轴方向检测时单元格合并方法,在本实施例中不再赘述。
为了更为全面的合并单元格,在本实施例中,当当前顶点为交点时;可以进一步判断当前顶点是否为其他线段的线段起点或线段终点;当当前顶点为其他线段的线段起点或线段终点时,在检测方向上合并当前顶点与目标点之间连线背离其他线段的一侧的当前顶点所在的单元格,图2中以半实心点示意线段起点或终点,其中,参见图2中区域C示出了x轴方向检测时单元格合并方法,在本实施例中,y轴方向检测时可以参照x轴方向检测时单元格合并方法,在本实施例中不再赘述。
在对表格进行识别时,还需要对表格中的文字进行识别,作为可选的实施例,如图3所示,表格识别方法还可以包括如下步骤:
S5.基于交点的坐标值依次对待识别表格的单元格切割。在文字识别之前,先对待识别表格按照待识别表格的单元格进行切割,分别对切割后的单元格内的文字进行识别,可以避免在识别表格文字时由于表格线条的影响,将表格线条误识别为文字,提高文字识别精度。
在本实施例中,预设坐标系的原点为待识别表格的任意之一的顶角所在的交点,在本实施例中可以以预设坐标系的原点为待识别表格的左上角的交点为例进行说明,可以先确定切割起点。选取切割待识别表格的单元格的切割起点,切割起点的坐标值中的x轴坐标值的绝对值为非最大值且y轴坐标值的绝对值为非最大值。保持切割起点的y轴坐标不变沿x轴的坐标值的绝对值增加的方向遍历交点的坐标值,选取第一切割终点,第一切割终点为其所在y轴方向线段的线段交叉点或线段起点;保持第一切割终点的x轴坐标不变,沿y轴坐标值的绝对值变大的方向遍历交点的坐标值,选取第二切割终点,第二切割终点为其所在x轴方向线段的线段交叉点或线段终点;根据切割起点和第二切割终点的坐标值对待识别表格的单元格切割。
在对待识别表格的单元格进行切割时,只需确定切割起点之后沿某一方向检测临近交点的类型,确定第一个切割终点,再以第一个切割终点沿另一方向检测临近交点类型,确定第二切割终点,根据切割起点周围的交点的类型检测独立的单元格,无需读取单元格的所有顶点(交点)组成闭合路径后再得到单元格,可以以较小的计算量和较快的计算速度识别单元格进而对单元格实现快速准确的切割。
S6.按照切割顺序识别切割后的单元格中内的文字。在本实施例中,可以采用文字识别模型对文字进行识别,具体的,可以按照切割顺序分别将切割后的单元格依次输入文字识别模型,识别各个单元格中的文字。在本实施例中,由于待识别表格中可能存在某些单元格内不包含文字的情况,在文字识别过程中,将不包含文字的单元输出预设字符以标注该单元格中不存在文字,例如,可以输出空格或者其他标识字符,避免了在文字填入单元格的过程中的单元格与字符不匹配的问题。
S7.按照切割顺序依次将识别后的文字填入识别后的表格的单元格内。在本实施例中,可以基于预设坐标系依次分别对识别后的表格的单元格进行赋值,在本实施例中,可以按照切割顺序对单元格赋值,当单元格为合并单元格时,对合并的单元格进行一次赋值,使参数合并的单元格的值相等,在填入文字时,可以按照顺序单元格的赋值,将文字顺次填入表格中。
本公开实施例提供了一种表格识别装置,如图4所示,该装置可以包括:第一提取模块10,用于提取待识别表格中的第一方向线段和第二方向线段,所述第一方向与所述第二方向相交;第二提取模块20,用于将所述第一方向线段和所述第二方向线段进行位置回归,并提取由所述第一方向线段和所述第二方向线段的交点和所述交点的类型,所述交点的类型包括线段交叉点、线段终点和线段起点;虚拟表格生成模块30,用于根据所述第一方向线段和所述第二方向线段生成虚拟表格,所述虚拟表格包括n-1行、m-1列,其中n为第一方向线段的数量,m为第二方向线段的数量;识别模块40,用于根据所述交点的类型对所述虚拟表格的单元格进行合并得到识别后的表格。
本公开实施例提供了一种表格识别设备,具体的可以参见图5,该电子设备可以包括处理器11和存储器12,其中处理器11和存储器12可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器11可以为中央处理器(Central Processing Unit,CPU)。处理器11还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器12作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的容器镜像的管理、使用或构建方法所对应的程序指令/模块。处理器11通过运行存储在存储器12中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的表格识别方法。
存储器12可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器11所创建的数据等。此外,存储器12可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器12可选包括相对于处理器11远程设置的存储器,这些远程存储器可以通过网络连接至处理器11。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器12中,当被处理器11执行时,执行上述方法实施例中的表格识别方法。
本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
虽然结合附图描述了本公开的实施例,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (11)
1.一种表格识别方法,其特征在于,适用于表格识别设备,所述方法包括:
提取待识别表格中的第一方向线段和第二方向线段,所述第一方向与所述第二方向相交;
将所述第一方向线段和所述第二方向线段进行位置回归,并提取所述第一方向线段和所述第二方向线段的交点和所述交点的类型,所述交点的类型包括线段交叉点、线段终点和线段起点;
根据所述第一方向线段和所述第二方向线段生成虚拟表格,所述虚拟表格包括n-1行、m-1列,其中n为第一方向线段的数量,m为第二方向线段的数量;
根据所述交点的类型对所述虚拟表格的单元格进行合并得到识别后的表格。
2.如权利要求1所述的识别方法,其特征在于,
所述根据所述交点的类型对所述虚拟表格的单元格进行合并得到识别后的表格包括:
选择任意交点作为目标点,
分别在所述目标点所在的x轴方向线段上和y轴方向线段上检测所述虚拟表格的单元格的顶点是否为所述交点;
当当前顶点不为所述交点时,沿检测方向分别合并所述当前顶点所在的单元格。
3.如权利要求2所述的识别方法,其特征在于,
当所述当前顶点为所述交点时;
判断所述当前顶点是否为所述线段交叉点;
当所述当前顶点为所述线段交叉点时,确认所述当前顶点所在的单元格为分立单元格。
4.如权利要求2或3所述的识别方法,其特征在于,
当当前顶点为所述交点时;
判断所述当前顶点是否为其他线段的线段起点或线段终点;
当所述当前顶点为其他线段的线段起点或线段终点时,在检测方向上合并所述当前顶点与所述目标点之间连线背离所述其他线段的一侧的当前顶点所在的单元格。
5.如权利要求1所述的识别方法,其特征在于:所述第一方向包括x周方向,第二方向包括y轴方向;
所述提取由所述第一方向线段和所述第二方向线段的交点和所述交点的类型包括:
基于图像形态学提取待识别表格中的x轴方向线段和y轴方向线段以及所述x轴方向线段和所述y轴方向线段的交点;
在预设坐标系下对所述交点坐标赋值,得到各个所述交点的坐标值;
基于所述坐标值确认所述交点的类型。
6.如权利要求5所述的识别方法,其特征在于,还包括:
基于所述交点的坐标值依次对所述待识别表格的单元格切割;
按照切割顺序识别切割后的单元格中内的文字;
按照所述按照切割顺序依次将识别后的文字填入识别后的表格的单元格内。
7.如权利要求6所述的识别方法,其特征在于,所述按照切割顺序识别切割后的单元格中内的文字包括:
判断所述切割后的单元格内是否包含文字,
当所述切割后的单元格内不包含文字时,输出预设字符。
8.如权利要求6或7所述的识别方法,其特征在于,所述预设坐标系的原点为所述待识别表格的任意之一的顶角所在的交点,所述方法还包括:
选取切割所述待识别表格的单元格的切割起点,所述切割起点的坐标值中的x轴坐标值的绝对值为非最大值且y轴坐标值的绝对值为非最大值;
保持所述切割起点的y轴坐标不变沿x轴的坐标值的绝对值增加的方向遍历所述交点的坐标值,选取第一切割终点,所述第一切割终点为其所在y轴方向线段的所述线段交叉点或所述线段起点;
保持所述第一切割终点的x轴坐标不变,沿y轴坐标值的绝对值变大的方向遍历所述交点的坐标值,选取第二切割终点,所述第二切割终点为其所在x轴方向线段的所述线段交叉点或所述线段终点;
根据所述切割起点和所述第二切割终点的坐标值对所述待识别表格的单元格切割。
9.一种表格识别装置,其特征在于,包括:
第一提取模块,用于提取待识别表格中的第一方向线段和第二方向线段,所述第一方向与所述第二方向相交;
第二提取模块,用于将所述第一方向线段和所述第二方向线段进行位置回归,并提取由所述第一方向线段和所述第二方向线段的交点和所述交点的类型,所述交点的类型包括线段交叉点、线段终点和线段起点;
虚拟表格生成模块,用于根据所述第一方向线段和所述第二方向线段生成虚拟表格,所述虚拟表格包括n-1行、m-1列,其中n为第一方向线段的数量,m为第二方向线段的数量;
识别模块,用于根据所述交点的类型对所述虚拟表格的单元格进行合并得到识别后的表格。
10.一种表格识别设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-8任意一项所述的表格识别方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8任一所述的表格识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910627106.7A CN110502985B (zh) | 2019-07-11 | 2019-07-11 | 表格识别方法、装置及表格识别设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910627106.7A CN110502985B (zh) | 2019-07-11 | 2019-07-11 | 表格识别方法、装置及表格识别设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110502985A true CN110502985A (zh) | 2019-11-26 |
CN110502985B CN110502985B (zh) | 2022-06-07 |
Family
ID=68585293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910627106.7A Active CN110502985B (zh) | 2019-07-11 | 2019-07-11 | 表格识别方法、装置及表格识别设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110502985B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079697A (zh) * | 2019-12-27 | 2020-04-28 | 湖南特能博世科技有限公司 | 表格提取方法、装置和电子设备 |
CN111259854A (zh) * | 2020-02-04 | 2020-06-09 | 北京爱医生智慧医疗科技有限公司 | 一种文本图像中表格的结构化信息的识别方法及装置 |
CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
CN111797685A (zh) * | 2020-05-27 | 2020-10-20 | 贝壳技术有限公司 | 表格结构的识别方法及装置 |
CN111881659A (zh) * | 2020-09-28 | 2020-11-03 | 江西汉辰信息技术股份有限公司 | 表格图片的处理方法、系统、可读存储介质及计算机设备 |
CN111985506A (zh) * | 2020-08-21 | 2020-11-24 | 广东电网有限责任公司清远供电局 | 一种图表信息提取方法、装置和存储介质 |
CN112036294A (zh) * | 2020-08-28 | 2020-12-04 | 山谷网安科技股份有限公司 | 一种纸质表格结构自动识别的方法及装置 |
CN112149397A (zh) * | 2020-09-30 | 2020-12-29 | 杭州拼便宜网络科技有限公司 | 一种电子表单的解析方法、系统及相关装置 |
WO2021143629A1 (zh) * | 2020-01-16 | 2021-07-22 | 京东方科技集团股份有限公司 | 一种表格提取方法、装置及触控显示装置 |
CN115601774A (zh) * | 2022-12-12 | 2023-01-13 | 深圳前海环融联易信息科技服务有限公司(Cn) | 表格识别方法、装置、设备、存储介质和程序产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101127081A (zh) * | 2006-08-14 | 2008-02-20 | 富士通株式会社 | 表格数据处理方法和装置 |
CN101676930A (zh) * | 2008-09-17 | 2010-03-24 | 北大方正集团有限公司 | 一种识别扫描图像中表格单元的方法及装置 |
US20110222776A1 (en) * | 2010-03-11 | 2011-09-15 | Yan Jiang | Form template definition method and form template definition apparatus |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN109784236A (zh) * | 2018-12-29 | 2019-05-21 | 河南辉煌科技股份有限公司 | 一种识别铁路图纸中表格内容的方法 |
-
2019
- 2019-07-11 CN CN201910627106.7A patent/CN110502985B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101127081A (zh) * | 2006-08-14 | 2008-02-20 | 富士通株式会社 | 表格数据处理方法和装置 |
CN101676930A (zh) * | 2008-09-17 | 2010-03-24 | 北大方正集团有限公司 | 一种识别扫描图像中表格单元的方法及装置 |
US20110222776A1 (en) * | 2010-03-11 | 2011-09-15 | Yan Jiang | Form template definition method and form template definition apparatus |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN109784236A (zh) * | 2018-12-29 | 2019-05-21 | 河南辉煌科技股份有限公司 | 一种识别铁路图纸中表格内容的方法 |
Non-Patent Citations (2)
Title |
---|
HIROSHI TANAKA ETAL.: "Robust Cell Extraction Method for Form Documents based on Intersection Searching and Global Optimization", 《2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 * |
王泉等: "表格图像的MAZ分割方法", 《西安电子科技大学学报(自然科学版)》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079697A (zh) * | 2019-12-27 | 2020-04-28 | 湖南特能博世科技有限公司 | 表格提取方法、装置和电子设备 |
US12051228B2 (en) | 2020-01-16 | 2024-07-30 | Boe Technology Group Co., Ltd. | Method and device for table extraction, and touch control display device |
WO2021143629A1 (zh) * | 2020-01-16 | 2021-07-22 | 京东方科技集团股份有限公司 | 一种表格提取方法、装置及触控显示装置 |
CN111259854B (zh) * | 2020-02-04 | 2023-04-18 | 北京爱医生智慧医疗科技有限公司 | 一种文本图像中表格的结构化信息的识别方法及装置 |
CN111259854A (zh) * | 2020-02-04 | 2020-06-09 | 北京爱医生智慧医疗科技有限公司 | 一种文本图像中表格的结构化信息的识别方法及装置 |
CN111797685A (zh) * | 2020-05-27 | 2020-10-20 | 贝壳技术有限公司 | 表格结构的识别方法及装置 |
CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
CN111695553B (zh) * | 2020-06-05 | 2023-09-08 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
CN111985506A (zh) * | 2020-08-21 | 2020-11-24 | 广东电网有限责任公司清远供电局 | 一种图表信息提取方法、装置和存储介质 |
WO2022036997A1 (zh) * | 2020-08-21 | 2022-02-24 | 广东电网有限责任公司清远供电局 | 图表信息提取方法、装置和存储介质 |
CN112036294A (zh) * | 2020-08-28 | 2020-12-04 | 山谷网安科技股份有限公司 | 一种纸质表格结构自动识别的方法及装置 |
CN112036294B (zh) * | 2020-08-28 | 2023-08-25 | 山谷网安科技股份有限公司 | 一种纸质表格结构自动识别的方法及装置 |
CN111881659A (zh) * | 2020-09-28 | 2020-11-03 | 江西汉辰信息技术股份有限公司 | 表格图片的处理方法、系统、可读存储介质及计算机设备 |
CN111881659B (zh) * | 2020-09-28 | 2021-02-26 | 江西汉辰信息技术股份有限公司 | 表格图片的处理方法、系统、可读存储介质及计算机设备 |
CN112149397A (zh) * | 2020-09-30 | 2020-12-29 | 杭州拼便宜网络科技有限公司 | 一种电子表单的解析方法、系统及相关装置 |
CN115601774A (zh) * | 2022-12-12 | 2023-01-13 | 深圳前海环融联易信息科技服务有限公司(Cn) | 表格识别方法、装置、设备、存储介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN110502985B (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110502985A (zh) | 表格识别方法、装置及表格识别设备 | |
CN110796031B (zh) | 基于人工智能的表格识别方法、装置及电子设备 | |
KR102609341B1 (ko) | 테이블 식별 방법, 장치, 기기, 매체 및 컴퓨터 프로그램 | |
CN109284280B (zh) | 仿真数据优化方法、装置及存储介质 | |
CN110008809A (zh) | 表格数据的获取方法、装置和服务器 | |
EP3869385A1 (en) | Method for extracting structural data from image, apparatus and device | |
US20230401828A1 (en) | Method for training image recognition model, electronic device and storage medium | |
WO2021012382A1 (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
US11861919B2 (en) | Text recognition method and device, and electronic device | |
CN115880536B (zh) | 数据处理方法、训练方法、目标对象检测方法及装置 | |
CN113657274B (zh) | 表格生成方法、装置、电子设备及存储介质 | |
CN114359932B (zh) | 文本检测方法、文本识别方法及装置 | |
CN108182457B (zh) | 用于生成信息的方法和装置 | |
KR20210086980A (ko) | 혼합 조판 문자를 인식하는 방법, 기기, 칩 회로 및 컴퓨터 프로그램 제품 | |
US20210390299A1 (en) | Techniques to determine document recognition errors | |
CN105160343A (zh) | 应用于胶片按需打印系统的信息识别方法和装置 | |
CN115620321B (zh) | 表格识别方法及装置、电子设备和存储介质 | |
CN114429637A (zh) | 一种文档分类方法、装置、设备及存储介质 | |
CN115546809A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
CN109271607A (zh) | 用户页面布局检测方法和装置、电子设备 | |
CN115578486A (zh) | 图像生成方法、装置、电子设备和存储介质 | |
CN113658195B (zh) | 图像分割方法、装置及电子设备 | |
CN107783953A (zh) | 信息录入方法及终端设备 | |
CN111383207A (zh) | 一种肌骨超声图像处理方法、系统、装置及可读存储介质 | |
CN117496521A (zh) | 一种表格关键信息抽取方法、系统、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |