CN116071771A - 表格重构方法、装置、非易失性存储介质及电子设备 - Google Patents
表格重构方法、装置、非易失性存储介质及电子设备 Download PDFInfo
- Publication number
- CN116071771A CN116071771A CN202310297656.3A CN202310297656A CN116071771A CN 116071771 A CN116071771 A CN 116071771A CN 202310297656 A CN202310297656 A CN 202310297656A CN 116071771 A CN116071771 A CN 116071771A
- Authority
- CN
- China
- Prior art keywords
- image
- column
- table image
- identification result
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种表格重构方法、装置、非易失性存储介质及电子设备。其中,该方法包括:获取表格图像;对表格图像进行识别,得到表格图像中的格对应的行范围识别结果、列范围识别结果;基于表格图像中的格对应的行范围识别结果、列范围识别结果,得到表格图像对应的重构表格。本发明解决了相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
Description
技术领域
本发明涉及表格识别技术领域,具体而言,涉及一种表格重构方法、装置、非易失性存储介质及电子设备。
背景技术
表格数据在很多领域都提供了十分重要的信息,表格经常出现在文献或专利中,起到汇总分析的作用。为了获取表格内容相关技术中需要对表格进行解析,常常采用对表格线进行识别的方式,以边界线作为表格中每一个格子的分界,导致对于文献中常出现的半无线表格的识别能力不足。并且表格中还存在着合并格的情况,常常出现于表格的表头中,相关技术中对于一个格子跨行(跨列)的处理能力不足,容易导致重构出的表格错位,造成获取到的表格信息对应错误。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种表格重构方法、装置、非易失性存储介质及电子设备,以至少解决相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
根据本发明实施例的一个方面,提供了一种表格重构方法,包括:获取表格图像;对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。
根据本发明实施例的另一方面,提供了一种表格重构装置,包括:获取模块,用于获取表格图像;识别模块,用于对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;重构模块,用于基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。
根据本发明实施例的另一方面,提供了一种非易失性存储介质,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行任意一项所述的表格重构方法。
根据本发明实施例的另一方面,提供了一种电子设备,包括:一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现任意一项所述的表格重构方法。
在本发明实施例中,通过获取表格图像;对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。达到了提高对跨行跨列表格,以及无线表(或是半无线表)的识别能力和重构效果的目的,实现了提高表格重构准确性,减少表格识别局限性的技术效果,进而解决了相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例提供的一种可选的表格重构方法的流程图;
图2是根据本发明实施例提供的一种可选的表格重构方法的表格示意图;
图3是根据本发明实施例提供的另一种可选的表格重构方法的表格示意图;
图4是根据本发明实施例提供的一种可选的表格重构装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种表格重构的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的表格重构方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取表格图像。
可以理解,对表格的识别是基于表格图像进行的。
可选地,采用目标检测算法获取表格图像,上述目标检测算法可以为多种,例如:DETR算法(Detection Transformer算法)是一种由大到小,由整体到局部的目标检测算法。还可以采用YOLO算法(You Only Look Once算法),是一种应用广泛的单阶段目标检测算法。
在一种可选的实施例中,上述获取表格图像,包括:对页面图像进行识别,确定表格位置信息;基于上述表格位置信息,在上述页面图像中选取上述表格图像。
可以理解,在获取表格图像时,需要对整体页面图像进行识别,在页面图像中对表格进行定位,得到表格位置信息。根据表格位置信息在页面图像中进行选取,得到表格图像。
可选地,采用目标检测算法对页面进行识别,选取得到表格图像,上述目标检测算法可以为多种,例如:DETR算法,YOLO算法等等。
步骤S104,对上述表格图像进行识别,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果。
可以理解,为了获取表格内容,对表格图像进行识别,为了提高对跨行跨列类型格的处理能力,得到表格图像中的格对应的行范围识别结果、列范围识别结果。通过上述处理,可以减少表格识别与重建对表格线的依赖性,提高了表格处理的灵活性。
在一种可选的实施例中,上述对上述表格图像进行识别,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果,包括:对上述表格图像进行识别,确定上述表格图像中的格识别结果;根据上述格识别结果,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果。
可以理解,对于表格图像中的内容,在得到格识别结果之前,并不能确定哪些表格内容属于同一个格子中的,尤其对于无线表(或是半无线表),没有表格线这类明显的界限,需要进行识别得到格识别结果。根据格识别结果,可以确定表格图像中的格对应的行范围识别结果、列范围识别结果,换言之,除了得到表格图像中的格的定位,还可以得到格占据的区域范围。
需要说明的是,一般格常常只占据一行一列,而对于合并操作后的格子会占据多行多列,相关技术中只定位格的位置会导致对跨行(跨列)格子的处理能力不佳,造成重构表格的篡位错误。
在一种可选的实施例中,上述对上述表格图像进行识别,确定上述表格图像中的格识别结果,包括:对上述表格图像进行识别,得到上述表格图像中包括的多个表格内容,上述多个表格内容中的任意相邻两个表格内容之间的边距值,以及上述多个表格内容分别对应的字体信息;基于上述任意相邻两个表格内容之间的边距值,以及上述多个表格内容分别对应的字体信息,确定上述表格图像中的上述格识别结果。
可以理解,对表格图像进行识别,得到表格图像中包括的多个表格内容,多个表格内容中的任意相邻两个表格内容之间的边距值,通过识别任意相邻两个表格内容之间的边距值判定相邻两个表格内容是否处于同一个格子中。还得到多个表格内容分别对应的字体信息,由于表格中在一般情况下,表头和其他表格内容的字体信息会存在区别,有助于辅助进行格识别。基于任意相邻两个表格内容之间的边距值,以及多个表格内容分别对应的字体信息,可以确定表格图像中的格识别结果。通过上述处理,解除了对表格识别对表格线的依赖,减少了表格重构的局限性。
可选地,上述表格内容可以为多种,例如:文本,图像,嵌套表。
可选地,采用目标检测算法对表格图像进行识别,上述目标检测算法可以为多种,例如:DETR算法,YOLO算法等等。
可选地,基于表格图像进行识别,在识别到任意相邻两个表格内容之间存在表格线的情况下,基于上述表格线,确定上述格识别结果;在识别到任意相邻两个表格内容之间未存在表格线的情况下,基于任意相邻两个表格内容之间的边距值,以及多个表格内容分别对应的字体信息,可以确定表格图像中的格识别结果。可以理解,本实施例提供的方法,对表格是否存在表格线没有需求,在识别到表格线的情况下,可以作为分界的明确标识确定格识别结果。而识别到不存在表格线的情况下,通过任意相邻两个表格内容之间的边距值,以及多个表格内容分别对应的字体信息,进行判定得到表格图像中的格识别结果。
在一种可选的实施例中,上述基于上述任意相邻两个表格内容之间的边距值,以及上述多个表格内容分别对应的字体信息,确定上述表格图像中的上述格识别结果,包括:在字体信息包括字体类型,字体大小,字体粗细的情况下,基于上述多个表格内容分别对应的上述字体类型,上述字体大小,上述字体粗细,确定上述任意相邻两个表格内容之间的字体差异识别结果;基于上述任意相邻两个表格内容之间的边距值、字体差异识别结果,确定上述格识别结果。
可以理解,表格中的表格内容按照具体内容区别常常存在着字体的区别,因此,综合考量字体信息包括,字体类型,字体大小,字体粗细,得到任意相邻两个表格内容之间的字体差异识别结果。基于任意相邻两个表格内容之间的边距值、字体差异识别结果,确定格识别结果。通过上述处理,可以提高格识别结果的准确性。
在一种可选的实施例中,上述根据上述格识别结果,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果,包括:根据上述格识别结果,确定上述表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号,其中,上述表格图像中的格对应的起始行序号为上述表格图像中对应格包括的第一行的序号,上述表格图像中的格对应的终止行序号为上述表格图像中对应格包括的最后一行的序号,上述表格图像中的格对应的起始列序号为上述表格图像中对应格包括的第一列的序号,上述表格图像中的格对应的终止列序号为上述表格图像中对应格包括的最后一列的序号;基于上述表格图像中的格对应的起始行序号、终止行序号,确定上述表格图像中的格对应的行范围识别结果;基于上述表格图像中的格对应的起始列序号、终止列序号,确定上述表格图像中的格对应的列范围识别结果。
可以理解,为了得到表格图像中的格对应的行范围识别结果、列范围识别结果,需要根据格识别结果,确定表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号。需要说明的是,对于未进行合并操作的格而言,只占据一行一列,即起始行序号与终止行序号相同,起始列序号与终止列序号相同。对于进行合并操作的格而言,是跨行(跨列)的,即占据有多行(多列)的,在既跨行又跨列的情况下,起始行序号与终止行序号不相同,起始列序号与终止列序号不相同。基于表格图像中的格对应的起始行序号、终止行序号,确定表格图像中的格对应的行范围识别结果,基于表格图像中的格对应的起始列序号、终止列序号,确定表格图像中的格对应的列范围识别结果。通过上述处理,得到表格图像中的格对应的行范围识别结果,和列范围识别结果,换言之,既对表格图像中的格进行定位,又显示了格在行方向和列方向上所占据的范围,有利于提高重构表格的准确性。
在一种可选的实施例中,上述根据上述格识别结果,确定上述表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号,包括:对上述格识别结果进行并行起始行识别,得到上述表格图像中的格对应的上述起始行序号;对上述格识别结果进行并行终止行识别,得到上述表格图像中的格对应的上述终止行序号;对上述格识别结果进行并行起始列识别,得到上述表格图像中的格对应的上述起始列序号;对上述格识别结果进行并行终止列识别,得到上述表格图像中的格对应的上述终止列序号。
可以理解,得到起始行序号、终止行序号、起始列序号、终止列序号的识别处理可以为一个并行过程,提高表格重构效率。同时对格识别结果进行并行起始行识别,得到表格图像中的格对应的起始行序号。对格识别结果进行并行终止行识别,得到表格图像中的格对应的终止行序号。对格识别结果进行并行起始列识别,得到表格图像中的格对应的起始列序号。对格识别结果进行并行终止列识别,得到表格图像中的格对应的终止列序号。
需要说明的是,识别得到起始行序号、终止行序号、起始列序号、终止列序号,可以视为四个分类任务,进行并行处理是本实施例相比相关技术存在的优势,可以大大提高处理能力和处理效率。
步骤S106,基于上述表格图像中的格对应的行范围识别结果、列范围识别结果,得到上述表格图像对应的重构表格。
可以理解,确定了表格图像中的格对应的行范围识别结果、列范围识别结果,即得到了表格图像中格的定位,以及格占据的区域,进而可以对表格图像进行重构,得到表格图像对应的重构表格。
通过上述步骤,可以实现提高对跨行(跨列)表格,以及无线表(或是半无线表)的识别能力和重构效果的目的,实现了提高表格重构准确性,减少表格识别局限性的技术效果,进而解决了相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
基于上述实施例和可选实施例,本发明提出一种可选实施方式,具体为以下步骤:
图2是根据本发明实施例提供的一种可选的表格重构方法的表格示意图,如图2所示,显示了一个页面图像,包括文本和表格,其中,x为对文本的示意,A、B、C以及为对表格中具体表格内容的示意。图2中的表格为一个半无线的表格,其中表头部分包括了跨行的合并格和跨列的合并格,其中,“编号”格为跨行的合并格,占据第一行,第二行,第一列组成的范围,“A”格为跨列的合并格,占据第一行,第一列,第二列组成的范围。采用目标检测算法进行识别,得到上述表格的表格图像。上述目标检测算法可以为DETR算法,或是YOLO算法。
对表格图像进行识别,确定哪些表格内容属于同一格子,尤其对于无线表(或是半无线表),没有表格线这类明显的界限,需要进行识别得到格识别结果。根据格识别结果,可以确定表格图像中的格对应的行范围识别结果、列范围识别结果,换言之,除了得到表格图像中的格的定位,还可以得到格占据的区域范围。
识别得到多个表格内容中的任意相邻两个表格内容之间的边距值,通过识别任意相邻两个表格内容之间的边距值判定相邻两个表格内容是否处于同一个格子中。
还得到多个表格内容分别对应的字体信息,由于表格中在一般情况下表头和其他表格内容的字体信息会存在区别,有助于辅助进行格识别。上述字体信息包括,字体类型,字体大小,字体粗细,得到任意相邻两个表格内容之间的字体差异识别结果。
此外,还可以识别是否存在表格线,在识别到表格线的情况下,可以作为分界的明确标识确定格识别结果。而识别到不存在表格线的情况下,基于任意相邻两个表格内容之间的边距值、字体差异识别结果,进行判定得到表格图像中的格识别结果。
根据格识别结果,可以确定表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号。识别得到起始行序号、终止行序号、起始列序号、终止列序号,可以视为四个分类任务,进行并行处理提高表格重构效率。
对格识别结果进行并行起始行识别,得到表格图像中的格对应的起始行序号。对格识别结果进行并行终止行识别,得到表格图像中的格对应的终止行序号。对格识别结果进行并行起始列识别,得到表格图像中的格对应的起始列序号。对格识别结果进行并行终止列识别,得到表格图像中的格对应的终止列序号。
基于表格图像中的格对应的起始行序号、终止行序号,确定表格图像中的格对应的行范围识别结果。基于表格图像中的格对应的起始列序号、终止列序号,确定表格图像中的格对应的列范围识别结果。既对表格图像中的格进行定位,又显示了格在行方向和列方向上所占据的范围,有利于提高重构表格的准确性。
确定了表格图像中的格对应的行范围识别结果、列范围识别结果,即得到了表格图像中格的定位,以及格占据的区域,进而可以对表格图像进行重构,得到表格图像对应的重构表格。
图3是根据本发明实施例提供的另一种可选的表格重构方法的表格示意图,如图3所示,图3左侧为得到的图2中的表格图像,通过本实施方式提供的方式,对左侧表格图像中半无线表类型的表格进行识别和重构,得到图3右侧的重构表格,便于进行表格信息的提取。
由上述可选实施方式至少实现以下效果,提高对跨行(跨列)表格,以及无线表(或是半无线表)的识别能力和重构效果。实现了提高表格重构准确性,避免重构表格中得到表格内容对应错位,造成后续表格信息提取错误,减少表格识别局限性的技术效果。解决了相关技术中存在对跨行跨列表格的识别率低,导致重构表格的准确性不理想,局限性高的技术问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中还提供了一种表格重构装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”“装置”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
根据本发明实施例,还提供了一种用于实施表格重构方法的装置实施例,图4是根据本发明实施例的一种表格重构装置的示意图,如图4所示,上述表格重构装置,包括:获取模块402,识别模块404,重构模块406,下面对该装置进行说明。
获取模块402,用于获取表格图像;
识别模块404,与获取模块402连接,用于对上述表格图像进行识别,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果;
重构模块406,与识别模块404连接,用于基于上述表格图像中的格对应的行范围识别结果、列范围识别结果,得到上述表格图像对应的重构表格。
本发明实施例提供的一种表格重构装置中,通过设置获取模块402,用于获取表格图像;识别模块404,与获取模块402连接,用于对上述表格图像进行识别,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果;重构模块406,与识别模块404连接,用于基于上述表格图像中的格对应的行范围识别结果、列范围识别结果,得到上述表格图像对应的重构表格。达到了提高对跨行跨列表格,以及无线表(或是半无线表)的识别能力和重构效果的目的,实现了提高表格重构准确性,减少表格识别局限性的技术效果,进而解决了相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;或者,上述各个模块以任意组合的方式位于不同的处理器中。
此处需要说明的是,上述获取模块402,识别模块404,重构模块406对应于实施例中的步骤S102至步骤S106,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在计算机终端中。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例中的相关描述,此处不再赘述。
上述表格重构装置还可以包括处理器和存储器,获取模块402,识别模块404,重构模块406等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种非易失性存储介质,其上存储有程序,该程序被处理器执行时实现表格重构方法。
本发明实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取表格图像;对上述表格图像进行识别,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果;基于上述表格图像中的格对应的行范围识别结果、列范围识别结果,得到上述表格图像对应的重构表格。本文中的设备可以是服务器、PC等。
本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取表格图像;对上述表格图像进行识别,得到上述表格图像中的格对应的行范围识别结果、列范围识别结果;基于上述表格图像中的格对应的行范围识别结果、列范围识别结果,得到上述表格图像对应的重构表格。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种表格重构方法,其特征在于,包括:
获取表格图像;
对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;
基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。
2.根据权利要求1所述的方法,其特征在于,所述对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果,包括:
对所述表格图像进行识别,确定所述表格图像中的格识别结果;
根据所述格识别结果,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述表格图像进行识别,确定所述表格图像中的格识别结果,包括:
对所述表格图像进行识别,得到所述表格图像中包括的多个表格内容,所述多个表格内容中的任意相邻两个表格内容之间的边距值,以及所述多个表格内容分别对应的字体信息;
基于所述任意相邻两个表格内容之间的边距值,以及所述多个表格内容分别对应的字体信息,确定所述表格图像中的所述格识别结果。
4.根据权利要求3所述的方法,其特征在于,所述基于所述任意相邻两个表格内容之间的边距值,以及所述多个表格内容分别对应的字体信息,确定所述表格图像中的所述格识别结果,包括:
在所述字体信息包括字体类型,字体大小,字体粗细的情况下,基于所述多个表格内容分别对应的所述字体类型,所述字体大小,所述字体粗细,确定所述任意相邻两个表格内容之间的字体差异识别结果;
基于所述任意相邻两个表格内容之间的边距值、字体差异识别结果,确定所述格识别结果。
5.根据权利要求2所述的方法,其特征在于,所述根据所述格识别结果,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果,包括:
根据所述格识别结果,确定所述表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号,其中,所述表格图像中的格对应的起始行序号为所述表格图像中对应格包括的第一行的序号,所述表格图像中的格对应的终止行序号为所述表格图像中对应格包括的最后一行的序号,所述表格图像中的格对应的起始列序号为所述表格图像中对应格包括的第一列的序号,所述表格图像中的格对应的终止列序号为所述表格图像中对应格包括的最后一列的序号;
基于所述表格图像中的格对应的起始行序号、终止行序号,确定所述表格图像中的格对应的行范围识别结果;
基于所述表格图像中的格对应的起始列序号、终止列序号,确定所述表格图像中的格对应的列范围识别结果。
6.根据权利要求5述的方法,其特征在于,所述根据所述格识别结果,确定所述表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号,包括:
对所述格识别结果进行并行起始行识别,得到所述表格图像中的格对应的所述起始行序号;
对所述格识别结果进行并行终止行识别,得到所述表格图像中的格对应的所述终止行序号;
对所述格识别结果进行并行起始列识别,得到所述表格图像中的格对应的所述起始列序号;
对所述格识别结果进行并行终止列识别,得到所述表格图像中的格对应的所述终止列序号。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述获取表格图像,包括:
对页面图像进行识别,确定表格位置信息;
基于所述表格位置信息,在所述页面图像中选取所述表格图像。
8.一种表格重构装置,其特征在于,包括:
获取模块,用于获取表格图像;
识别模块,用于对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;
重构模块,用于基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行权利要求1至7中任意一项所述的表格重构方法。
10.一种电子设备,其特征在于,包括:一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的表格重构方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310297656.3A CN116071771A (zh) | 2023-03-24 | 2023-03-24 | 表格重构方法、装置、非易失性存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310297656.3A CN116071771A (zh) | 2023-03-24 | 2023-03-24 | 表格重构方法、装置、非易失性存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116071771A true CN116071771A (zh) | 2023-05-05 |
Family
ID=86182240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310297656.3A Pending CN116071771A (zh) | 2023-03-24 | 2023-03-24 | 表格重构方法、装置、非易失性存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116071771A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030123727A1 (en) * | 1998-09-11 | 2003-07-03 | Tomotoshi Kanatsu | Table recognition method and apparatus, and storage medium |
WO2018003153A1 (ja) * | 2016-06-30 | 2018-01-04 | 株式会社日立ソリューションズ | 認識装置及び認識方法 |
US20180336404A1 (en) * | 2017-05-18 | 2018-11-22 | Wipro Limited | Methods and devices for extracting text from documents |
CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
CN111860257A (zh) * | 2020-07-10 | 2020-10-30 | 上海交通大学 | 融合多种文本特征及几何信息的表格识别方法及系统 |
CN113557520A (zh) * | 2020-02-26 | 2021-10-26 | 京东方科技集团股份有限公司 | 字符处理及字符识别方法、存储介质和终端设备 |
CN113705286A (zh) * | 2020-05-22 | 2021-11-26 | 上海深杳智能科技有限公司 | 一种表格检测与识别方法和介质 |
CN114005126A (zh) * | 2021-11-26 | 2022-02-01 | 成都数联云算科技有限公司 | 表格重构方法、装置、计算机设备及可读存储介质 |
US20220138460A1 (en) * | 2020-11-05 | 2022-05-05 | Jpmorgan Chase Bank, N.A. | Method and system for tabular information extraction |
CN115546809A (zh) * | 2022-11-29 | 2022-12-30 | 城云科技(中国)有限公司 | 基于单元格约束的表格结构识别方法及其应用 |
WO2023279847A1 (zh) * | 2021-07-08 | 2023-01-12 | 京东科技信息技术有限公司 | 单元格位置的检测方法、装置和电子设备 |
-
2023
- 2023-03-24 CN CN202310297656.3A patent/CN116071771A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030123727A1 (en) * | 1998-09-11 | 2003-07-03 | Tomotoshi Kanatsu | Table recognition method and apparatus, and storage medium |
WO2018003153A1 (ja) * | 2016-06-30 | 2018-01-04 | 株式会社日立ソリューションズ | 認識装置及び認識方法 |
US20180336404A1 (en) * | 2017-05-18 | 2018-11-22 | Wipro Limited | Methods and devices for extracting text from documents |
CN113557520A (zh) * | 2020-02-26 | 2021-10-26 | 京东方科技集团股份有限公司 | 字符处理及字符识别方法、存储介质和终端设备 |
CN113705286A (zh) * | 2020-05-22 | 2021-11-26 | 上海深杳智能科技有限公司 | 一种表格检测与识别方法和介质 |
CN111695553A (zh) * | 2020-06-05 | 2020-09-22 | 北京百度网讯科技有限公司 | 表格识别方法、装置、设备和介质 |
CN111860257A (zh) * | 2020-07-10 | 2020-10-30 | 上海交通大学 | 融合多种文本特征及几何信息的表格识别方法及系统 |
US20220138460A1 (en) * | 2020-11-05 | 2022-05-05 | Jpmorgan Chase Bank, N.A. | Method and system for tabular information extraction |
WO2023279847A1 (zh) * | 2021-07-08 | 2023-01-12 | 京东科技信息技术有限公司 | 单元格位置的检测方法、装置和电子设备 |
CN114005126A (zh) * | 2021-11-26 | 2022-02-01 | 成都数联云算科技有限公司 | 表格重构方法、装置、计算机设备及可读存储介质 |
CN115546809A (zh) * | 2022-11-29 | 2022-12-30 | 城云科技(中国)有限公司 | 基于单元格约束的表格结构识别方法及其应用 |
Non-Patent Citations (2)
Title |
---|
MRINAL HALOI 等: "Table Detection in the Wild: A Novel Diverse Table Detection Dataset and Method", 《ARXIV:2209.09207》, pages 1 - 7 * |
姚鹏威: "基于数字图像处理的表格识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 7, pages 138 - 1277 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569489B (zh) | 基于pdf文件的表格数据解析方法及装置 | |
CN110019298B (zh) | 数据处理方法和装置 | |
CN108664458B (zh) | 一种pdf文件表格解析方法及系统 | |
CN108228443B (zh) | 一种web应用的测试方法及装置 | |
CN114359533B (zh) | 一种基于页面文本的页码识别方法和计算机设备 | |
CN111125088B (zh) | 多层级数据处理方法和装置 | |
CN111291752A (zh) | 一种发票识别方法及设备、介质 | |
CN116071771A (zh) | 表格重构方法、装置、非易失性存储介质及电子设备 | |
CN111695330B (zh) | 生成表格的方法、装置、电子设备及计算机可读存储介质 | |
CN112528832A (zh) | 对pdf格式的继电保护定值单进行处理的方法和系统 | |
CN114820729A (zh) | 一种元素一键布局方法及装置 | |
CN110059563B (zh) | 一种文本处理方法和装置 | |
CN110968555A (zh) | 维度数据处理方法和装置 | |
CN110908587A (zh) | 一种用于存储时序数据的方法及其装置 | |
CN109710833B (zh) | 用于确定内容节点的方法与设备 | |
CN108346126B (zh) | 基于内存拷贝方式绘制手机图片的方法及装置 | |
CN110780016A (zh) | 一种针对三维图谱保留时间漂移校正方法、装置 | |
US10277912B2 (en) | Methods and apparatus for storing data related to video decoding | |
CN113792237B (zh) | 卡片式布局的优化方法、装置、存储介质及处理器 | |
CN109558221B (zh) | 一种任务处理方法及装置 | |
CN115932532B (zh) | 故障存储单元的物理地址的存储方法、装置、设备及介质 | |
CN116092105B (zh) | 表格结构的解析方法和装置 | |
US11237938B2 (en) | Click heatmap abnormality detection method and apparatus | |
CN110717131A (zh) | 页面改版的监控方法及相关系统 | |
CN117173725B (zh) | 表格信息处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230918 Address after: 102425 Building 60, No. 69 Yanfu Road, Fangshan District, Beijing Applicant after: Beijing Qianyan Intelligent Biotechnology Co.,Ltd. Address before: Room 321, 3rd Floor, F7 Building, No. 9 Weidi Road, Qixia District, Nanjing City, Jiangsu Province, 210033 Applicant before: Nanjing Suikun Intelligent Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right |