CN111160234B - 表格识别方法、电子设备及计算机存储介质 - Google Patents

表格识别方法、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN111160234B
CN111160234B CN201911375389.7A CN201911375389A CN111160234B CN 111160234 B CN111160234 B CN 111160234B CN 201911375389 A CN201911375389 A CN 201911375389A CN 111160234 B CN111160234 B CN 111160234B
Authority
CN
China
Prior art keywords
separation line
projection
line
original
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911375389.7A
Other languages
English (en)
Other versions
CN111160234A (zh
Inventor
张恒
李铭瀚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhangyue Animation Technology Co ltd
Original Assignee
Ireader Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ireader Technology Co Ltd filed Critical Ireader Technology Co Ltd
Priority to CN201911375389.7A priority Critical patent/CN111160234B/zh
Publication of CN111160234A publication Critical patent/CN111160234A/zh
Application granted granted Critical
Publication of CN111160234B publication Critical patent/CN111160234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种表格识别方法、电子设备及计算机存储介质,该方法包括:检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据连续像素集合识别原始表格图片中包含的原始分隔线;根据原始分隔线确定投影方向,沿投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域;根据识别结果向与间隔区域相匹配的位置插入自定义分隔线,得到与原始表格图片相对应的自定义表格图片,根据自定义表格图片中包含的自定义分隔线识别表格内容。该方式能够自动补齐缺少的分隔线,进而根据补齐分隔线之后的表格进行内容识别。

Description

表格识别方法、电子设备及计算机存储介质
技术领域
本发明涉及计算机领域,具体涉及一种表格识别方法、电子设备及计算机存储介质。
背景技术
表格能够清晰展示多个关联数据项之间的相互关系,因此,广泛应用于各类应用场景。相应的,电子书中通常会包含表格、图表等数据信息。由于表格内容不利于在终端设备中展示,因此,在制作电子书的过程中,通常会将表格直接处理为图片形式,图片以其便于调整位置、大小等优势而在电子书制作过程中得到了广泛应用。
但是,在一些电子书的制作过程中,需要针对表格内容进行编辑,此时,需要针对图片形式的表格内容进行识别,以转换为可编辑的表格形式。通常情况下,通过识别表格中的分隔线的方式能够快速识别由分隔线分隔的表格内容。
但是,在实现本发明的过程中,发明人发现现有技术中的上述方案至少存在下述缺陷:通过识别表格分隔线来识别表格内容的方式局限性较大,只能适用于表格分隔线完备的表格图片的识别过程。但是,实际情况中,很多表格只有外部框线,而内部的分隔线则处于缺省状态,对于该类缺少分隔线的表格则无法通过上述方式准确识别。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的表格识别方法、电子设备及计算机存储介质。
根据本发明的一个方面,提供了一种表格识别方法,包括:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据连续像素集合识别原始表格图片中包含的原始分隔线;根据原始分隔线确定投影方向,沿投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域;根据识别结果向与间隔区域相匹配的位置插入自定义分隔线,得到与原始表格图片相对应的自定义表格图片,根据自定义表格图片中包含的自定义分隔线识别表格内容。
根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据连续像素集合识别原始表格图片中包含的原始分隔线;根据原始分隔线确定投影方向,沿投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域;根据识别结果向与间隔区域相匹配的位置插入自定义分隔线,得到与原始表格图片相对应的自定义表格图片,根据自定义表格图片中包含的自定义分隔线识别表格内容。
根据本发明的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据连续像素集合识别原始表格图片中包含的原始分隔线;根据原始分隔线确定投影方向,沿投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域;根据识别结果向与间隔区域相匹配的位置插入自定义分隔线,得到与原始表格图片相对应的自定义表格图片,根据自定义表格图片中包含的自定义分隔线识别表格内容。
在本发明提供的表格识别方法、电子设备及计算机存储介质中,能够检测原始表格图片中像素值属于预设数值范围的连续像素集合,从而识别原始表格图片中包含的原始分隔线,相应的,沿由原始分隔线确定的投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域,进而向间隔区域匹配的位置插入自定义分隔线,从而将表格中缺省的分隔线补齐,从而能够根据补齐分隔线之后的表格图片进行内容识别。该方式能够针对各类缺少分隔线的表格进行处理,从而自动补齐其中缺少的分隔线,进而根据补齐分隔线之后的表格进行内容识别,提升了表格识别效率和准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明一个实施例提供的表格识别方法的流程图;
图2示出了本发明另一个实施例提供的表格识别方法的流程图;
图3示出了根据本发明另一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了本发明一个实施例提供的表格识别方法的流程图。如图1所示,该方法包括以下步骤:
步骤S110:检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据连续像素集合识别原始表格图片中包含的原始分隔线。
具体地,连续像素集合是指:像素值属于预设数值范围且连续排列的多个像素所构成的集合。连续像素集合既可以是连续像素行,也可以是连续像素列,本发明对此不作限定。具体实施时,可根据原始表格图片的图片尺寸确定预设连续阈值,将沿同一方向排列且超出预设连续阈值的多个属于预设数值范围的像素确定为一个连续像素集合。
另外,预设数值范围既可以是一个具体数值,也可以是由区间上限以及区间下限构成的数值区间。具体地,当预先针对原始表格图片执行了灰度处理以及二值化处理时,预设数值范围可以为对应于黑色像素值的具体数值;当未预先针对原始表格图片执行灰度处理以及二值化处理时,预设数值范围可以为与黑色像素值接近的数值区间。
其中,由于原始表格图片必然包含表格边框等原始分隔线,且原始分隔线必然为连续的线条,因此,连续像素集合所在的区域即为原始表格图片中包含的原始分隔线。
步骤S120:根据原始分隔线确定投影方向,沿该投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域。
具体地,将与原始分隔线平行的方向确定为投影方向,沿该投影方向进行投影。例如,对于横向的原始分隔线而言,投影方向为横向方向,也叫水平方向。相应的,分别确定原始表格图片中沿纵向排列的各个像素所对应的投影像素集合。该投影像素集合也可以称作投影像素行,多个投影像素行沿纵向方向依次排列。相应的,统计各个投影像素行中像素值属于预设数值范围的像素的数量,该预设数值范围的像素对应于表格图片中的非空白区域(即有内容区域)。因此,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,即可识别原始表格图片中的文本区域(即有内容区域)以及间隔区域(即无内容区域,也叫空白区域)。又如,对于纵向的原始分隔线而言,投影方向为纵向方向,也叫竖直方向,其对应的投影像素集合为沿横向排列的多个投影像素列,具体处理方式与投影像素行类似,此处不再赘述。
步骤S130:根据识别结果向与间隔区域相匹配的位置插入自定义分隔线,得到与原始表格图片相对应的自定义表格图片,根据自定义表格图片中包含的自定义分隔线识别表格内容。
具体地,当识别出间隔区域后,说明该间隔区域对应于缺省的表格分隔线,因此,向与间隔区域相匹配的位置插入自定义分隔线,从而将缺失的表格分隔线补齐,得到与原始表格图片相对应的自定义表格图片。由于自定义表格图片中包含完备的表格分隔线,因此,能够准确且快速地识别表格内容。
由此可见,在本发明提供的表格识别方法中,能够针对各类缺少分隔线的表格进行处理,从而自动补齐其中缺少的分隔线,进而根据补齐分隔线之后的表格进行内容识别,提升了表格识别效率和准确性。
实施例二
图2示出了本发明另一个实施例提供的表格识别方法的流程图。如图2所示,该方法包括以下步骤:
步骤S200:针对原始表格图片执行灰度处理以及二值化处理。
具体地,原始表格图片通常为缺少内部分隔线的表格所对应的图片。为了便于识别表格图片中的文本区域以及空白区域,在本实施例中,预先针对原始表格图片执行灰度处理以及二值化处理。经灰度处理,能够改变图片的颜色,使其呈现灰白黑等色彩。经二值化处理后,使图片中每个像素的像素值转换为非黑即白的数值,即,每个像素点的灰度值为0(黑色)或255(白色)。通过二值化处理,有利于识别图片中的空白区域以及非空白区域。
步骤S210:检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据连续像素集合识别原始表格图片中包含的原始分隔线。
在本实施例中,预设数值范围是指与黑色像素值相匹配的数值范围,如灰度值为0。具体地,连续像素集合是指:像素值为预设值(例如0)且连续排列的多个像素所构成的集合,具体通过连续性检测实现,比如,沿水平方向进行连续性检测能够确定连续像素行,沿竖直方向进行连续性检测能够确定连续像素列。相应地,连续像素集合通常为连续像素行或连续像素列。具体实施时,可根据原始表格图片的图片尺寸确定预设连续阈值,将沿同一方向排列且数量超过预设连续阈值的多个属于预设数值范围的像素确定为一个连续像素集合。
当然,为了避免因表格线条印刷不清晰导致的识别错误,对于多个连续排列的黑色像素而言,若中间有少量的白色像素掺杂,也可以认为是连续像素集合。相应地,设置的预设连续阈值为同一行内的黑色像素的总数量阈值,还可以进一步设置预设误差值,当同一行内的白色像素的总数量小于该预设误差值时,则认为该行近似为一个由黑色像素构成的连续像素集合。其中,由于原始表格图片必然包含表格边框等原始分隔线,且原始分隔线必然为连续的线条,因此,连续像素集合所在的区域即为原始表格图片中包含的原始分隔线。由此可见,通过本步骤,能够根据连续像素集合所在的位置,识别原始表格图片中包含的原始分隔线的位置及数量。
在本实施例中,原始分隔线包括:第一分隔线以及第二分隔线;其中,第一分隔线垂直于第二分隔线。其中,第一分隔线可以为横向分隔线,第二分隔线可以为纵向分隔线;或者,第一分隔线可以为纵向分隔线,第二分隔线可以为横向分隔线,本发明对此不做限定。由于表格通常既包含横向分隔线,又包含纵向分隔线,因此,本发明分别沿水平方向以及竖直方向检测连续性,从而根据横向连续像素集合确定表格的横向分隔线,根据纵向连续像素集合确定表格的纵向分隔线。
步骤S220:根据原始分隔线确定投影方向,沿该投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域。
具体地,将与原始分隔线平行的方向确定为投影方向,沿该投影方向进行投影。例如,对于横向的原始分隔线而言,投影方向为横向方向,也叫水平方向。相应的,分别确定原始表格图片中沿纵向排列的各个像素所对应的投影像素集合。其中,投影像素集合是指:沿投影方向确定的一组像素的集合。例如,当投影方向为横向方向时,一组沿横向排列的像素行即为一组投影像素集合;当投影方向为纵向方向时,一组沿纵向排列的像素列即为一组投影像素集合。其中,针对指定投影方向而言,投影像素集合的数量以及每个投影像素集合中包含的像素总量是由投影区域的尺寸决定的。在本实施例中,投影区域的尺寸可以与原始表格图片的尺寸相等。或者,投影区域的尺寸也可以由根据已识别的原始分隔线确定的表格外框来确定,例如,将投影区域确定为与表格外框相匹配的区域。例如,假设由表格外框限定的投影区域的尺寸为480*720,即投影区域沿纵向方向共有480个像素,沿横向方向共有720个像素。相应地,当投影方向为横向方向时,共有480个横向投影像素集合,各个横向投影像素集合依次纵向排布,且每个横向投影像素集合中包含720个像素;当投影方向为纵向方向时,共有720个纵向投影像素集合,各个纵向投影像素集合依次横向排布,且每个纵向投影像素集合中包含480个像素。
以投影方向为横向方向为例,分别统计480个横向投影像素集合中像素值属于预设数值范围的像素的数量,根据统计结果识别原始表格图片中的文本区域以及横向间隔区域。对于每个横向投影像素集合而言,其中像素值属于预设数值范围的像素的数量由该投影行所对应的非空白区域决定:若该投影行所对应的区域包含多个文字,则像素值属于预设数值范围(如0)的像素的数量较多,若该投影行所对应的区域包含少量文字,则像素值属于预设数值范围(如0)的像素的数量较少;若该投影行所对应的区域不包含文字,属于完全空白区域,则像素值属于预设数值范围(如0)的像素的数量为零。依次统计各个横向投影像素集合中像素值属于预设数值范围的像素的数量,能够确定沿纵向方向上各个区域的文字范围以及空白范围(即间隔区域)。
由此可见,沿横向方向进行投影,能够确定各个文字行所处的位置以及各个文字行对应的空白间隔区域,从而便于插入横向自定义分隔线。同理,沿纵向方向进行投影,能够确定各个文字列所处的位置以及各个文字列对应的空白间隔区域,从而便于插入纵向自定义分隔线。
另外,当投影方向与第一分隔线平行时,在根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别原始表格图片中的文本区域以及间隔区域时,进一步根据第二分隔线的数量,确定各个投影像素集合中对应于第二分隔线的像素的数量;根据各个投影像素集合中对应于第二分隔线的像素的数量,识别原始表格图片中的间隔区域。具体地,发明人在实现本发明的过程中发现,空白区域所对应的横向投影像素集合中包含的黑色像素数量与纵向原始分隔线的数量相关;同理,空白区域所对应的纵向投影像素集合中包含的黑色像素数量与横向原始分隔线的数量相关。例如,假设纵向原始分隔线为3条,在横向方向上分别对应于3个黑色像素,相应地,对于各个横向投影像素集合而言,处于空白区域的横向投影像素集合中包含的黑色像素的数量并非0,而为3。由此可见,在沿第一分隔线平行的方向进行投影时,进一步结合第二分隔线的数量有助于准确识别文本区域以及空白区域。该空白区域即为间隔区域。
步骤S230:根据识别结果向与间隔区域相匹配的位置插入自定义分隔线。
具体地,根据识别结果与间隔区域相匹配的位置插入自定义分隔线。例如,针对沿横向方向进行投影后确定的各个文字行对应的空白间隔区域,插入横向自定义分隔线。同理,针对沿纵向方向进行投影后确定的各个文字列对应的空白间隔区域,插入纵向自定义分隔线。由此可见,投影方向包括:根据第一分隔线确定的第一投影方向、以及根据第二分隔线确定的第二投影方向;相应地,自定义分隔线包括:根据第一投影方向确定的第一自定义分隔线、以及根据第二投影方向确定的第二自定义分隔线;其中,第一自定义分隔线垂直于第二自定义分隔线。其中,第一投影方向和第二投影方向可以分别为横向方向和纵向方向,相应地,第一自定义分隔线和第二自定义分隔线可以分别为横向自定义分隔线以及纵向自定义分隔线。或者,第一投影方向和第二投影方向可以分别为纵向方向和横向方向,相应地,第一自定义分隔线和第二自定义分隔线可以分别为纵向自定义分隔线以及横向自定义分隔线。
步骤S240:根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;当校验结果为否时,针对所述自定义分隔线进行调整。
本步骤为一个可选的步骤,为了确保分隔线的添加更加合理,避免误识别,通过预设表格规范进行校验,以调整不合理的自定义分隔线。本步骤具体可以通过多种方式实现:
在一种可选的实现方式中,根据每相邻的两条自定义分隔线之间的间距是否小于预设字节间距阈值判断该相邻的两条自定义分隔线是否符合预设表格规范;其中,预设字节间距阈值根据字节高度、和/或字节宽度确定。通常情况下,两个文字行之间添加的横向分隔线之间的间距应不小于一个字节高度,因此,若相邻的两条横向自定义分隔线之间的间距小于预设字节间距阈值(如小于一个字节的高度),则确定该相邻的两条横向自定义分隔线不符合预设表格规范。同理,两个文字列之间添加的纵向分隔线之间的间距应不小于一个字节宽度,因此,若相邻的两条纵向自定义分隔线之间的间距小于预设字节间距阈值(如小于一个字节的宽度),则确定该相邻的两条纵向自定义分隔线不符合预设表格规范。
在又一种可选的实现方式中,获取各个自定义分隔线与原始分隔线之间的间距,当自定义分隔线与原始分隔线之间的间距小于预设分隔间距阈值时,确定该自定义分隔线不符合预设表格规范。通常情况下,在原始分隔线的两侧通常会有少许空白区域,该处空白区域由于距离原始分隔线较近,因此,不应插入自定义分隔线。相应地,可以设置预设分隔间距阈值,从而剔除与原始分隔线之间的间距小于该预设分隔间距阈值的自定义分隔线。由此可见,原始分隔线两侧的空白区域应避免误插入自定义分隔线。
另外,由于通常情况下,表格中的相邻分隔线之间的间距近似相等,因此,还可以进一步获取每相邻的两条分隔线之间的间距,比较各条分隔线之间的间距是否近似相等,根据比较结果确定是否符合预设表格规范。例如,若各条分隔线之间的间距通常为1厘米,若存在两条分隔线之间的间距为2厘米的情况,则识别为异常。
在上述两种实现方式中,当校验结果为否时,可以直接删除不符合预设表格规范的自定义分隔线。另外,上述的两种实现方式实质上也可以在步骤S230中执行,相应地,每插入一条自定义分隔线时,根据相邻的自定义分隔线和/或原始分隔线校验该待插入的自定义分隔线的可信度,只有当校验结果为可信(符合预设表格规范)时,才插入该自定义分隔线,反之,则不插入该自定义分隔线,从而确保分隔线的准确性。
另外,发明人在实现本发明的过程中发现,对于一些特殊格式的表格而言,自定义分隔线可能无法一次性插入完整,例如,对于存在合并单元格情况的表格而言,在合并单元格对应的区域,往往无法准确插入分隔线。为了解决上述问题,在本实施例中,根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;当校验结果为否时,针对自定义分隔线进行调整的实现方式具体包括:当相邻的两条第一自定义分隔线之间的间距大于预设异常阈值时,根据第二分隔线和/或第二自定义分隔线确定限缩投影区域;在该限缩投影区域内沿第一投影方向进行投影,根据投影结果识别限缩投影区域中的文本区域以及间隔区域,根据识别结果向与限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
具体地,当表格中的局部区域存在合并单元格的情况时,例如,表格中部的某个部位存在合并单元格的情况,因而导致该合并单元格内的一行字占据了两个甚至更多个常规单元格的空间,此时,在以整个表格外框限定的投影区域内进行横向投影或纵向投影时,由于表格的局部区域存在合并单元格,因而导致根据投影识别结果插入的横向自定义分隔线或纵向自定义分隔线不全面。例如,对于存在合并单元格的部分区域而言,由于该部分区域的文字部分占据了多个单元格,从而导致针对整个表格外框限定的投影区域进行投影时,无法检测到合并单元格后的局部空白区域,因而导致该局部空白区域内的分隔线无法有效插入。为了解决该问题,在本实施例中,当检测到相邻的两条自定义分隔线之间的间距大于预设异常阈值时,说明该相邻的两条自定义分隔线之间可能存在合并单元格的异常情况。为了针对合并单元格之后的局部区域插入分隔线,需要根据该相邻的两条自定义分隔线以及已插入的第二分隔线和/或第二自定义分隔线确定限缩投影区域,并在该限缩投影区域内进行投影,得到多个限缩投影像素集合,通过统计各个限缩投影像素集合中的黑色像素数量识别限缩投影区域中的文本区域以及间隔区域,从而向限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
例如,假设表格中部存在合并单元格的情况,且该合并单元格的左侧应插入多个较短的横向分隔线。因此,将该合并单元格左侧应插入多个较短横向分隔线的区域确定为限缩投影区域,从而在该限缩投影区域内进行横向投影,从而得到多个纵向排布的横向限缩投影像素集合,其中,横向限缩投影像素集合的数量以及各个横向限缩投影像素集合中包含的像素数量取决于限缩投影区域的区域大小。例如,当限缩投影区域为40*80时,得到40个纵向排布的横向限缩投影像素集合,每个横向限缩投影像素集合中包含80个像素。相应地,在该限缩投影区域内能够进一步插入横向或纵向的限缩分隔线。由此可见,限缩分隔线的长度通常短于常规的自定义分隔线,属于表格内部的二级分隔线。在具体确定限缩投影区域时,可以按照递归方式,依次缩减区域范围,例如,先将限缩投影区域限定为由间距较大的两条横向自定义分隔线以及右侧的第一条纵向分隔线限定的区域,若投影后无法得到符合预设表格规范的限缩分隔线,则进一步缩减限缩投影区域,将限缩投影区域限定为由间距较大的两条横向自定义分隔线以及右侧的第二条纵向分隔线限定的区域……依此类推,直至投影后得到符合预设表格规范的限缩分隔线为止。其中,限缩分隔线的校验方法以及预设表格规范可参见上文描述,此处不再赘述。
由此可见,当表格中存在多处因合并单元格而导致的分隔线异常情况时,可以通过多次设定限缩投影区域的方式添加限缩分隔线,直至将表格的各个局部区域都添加上符合预设表格规范的分隔线。
步骤S250:根据调整后的自定义分隔线得到与原始表格图片相对应的自定义表格图片,根据自定义表格图片中包含的自定义分隔线识别表格内容。
具体地,当识别出间隔区域后,说明该间隔区域对应于缺省的表格分隔线,因此,向与间隔区域相匹配的位置插入自定义分隔线,从而将缺失的表格分隔线补齐,得到与原始表格图片相对应的自定义表格图片。由于自定义表格图片中包含完备的表格分隔线,因此,能够准确且快速地识别表格内容。
其中,自定义分隔线包括横向分隔线以及纵向分隔线。并且,当表格内存在合并单元格等异常情况时,还进一步包括限缩分隔线。通过分隔线能够准确快速地识别表格内的文字内容。
综上可知,在本发明提供的表格识别方法中,能够针对各类缺少分隔线的表格进行处理,从而自动补齐其中缺少的分隔线,进而根据补齐分隔线之后的表格进行内容识别,提升了表格识别效率和准确性。并且,该方式能够自动校验添加的分隔线是否规范,从而避免加入错误的分隔线。而且,针对存在合并单元格等异常情况的表格,还能够通过逐步限缩投影区域的方式添加限缩分隔线,从而能够广泛适用于各种类型的表格,大幅提升了表格识别结果的准确性。
实施例三
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的表格识别方法。
可执行指令具体可以用于使得处理器执行以下操作:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据所述连续像素集合识别所述原始表格图片中包含的原始分隔线;
根据所述原始分隔线确定投影方向,沿所述投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别所述原始表格图片中的文本区域以及间隔区域;
根据识别结果向与所述间隔区域相匹配的位置插入自定义分隔线,得到与所述原始表格图片相对应的自定义表格图片,根据所述自定义表格图片中包含的自定义分隔线识别表格内容。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;
当校验结果为否时,针对所述自定义分隔线进行调整。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
根据每相邻的两条自定义分隔线之间的间距是否小于预设字节间距阈值判断该相邻的两条自定义分隔线是否符合预设表格规范;
其中,预设字节间距阈值根据字节高度、和/或字节宽度确定。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
获取各个自定义分隔线与所述原始分隔线之间的间距,当自定义分隔线与所述原始分隔线之间的间距小于预设分隔间距阈值时,确定该自定义分隔线不符合预设表格规范。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
当校验结果为否时,删除不符合预设表格规范的自定义分隔线。
在一种可选的实现方式中,所述原始分隔线包括:第一分隔线以及第二分隔线;其中,所述第一分隔线垂直于所述第二分隔线;
其中,当所述投影方向与第一分隔线平行时,所述可执行指令使处理器执行以下操作:
根据所述第二分隔线的数量,确定各个投影像素集合中对应于所述第二分隔线的像素的数量;
根据所述各个投影像素集合中对应于所述第二分隔线的像素的数量,识别所述原始表格图片中的间隔区域。
在一种可选的实现方式中,所述投影方向包括:根据第一分隔线确定的第一投影方向、以及根据第二分隔线确定的第二投影方向;并且,所述自定义分隔线包括:根据第一投影方向确定的第一自定义分隔线、以及根据第二投影方向确定的第二自定义分隔线;其中,所述第一自定义分隔线垂直于所述第二自定义分隔线。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
当相邻的两条第一自定义分隔线之间的间距大于预设异常阈值时,根据第二分隔线和/或第二自定义分隔线确定限缩投影区域;
在所述限缩投影区域内沿第一投影方向进行投影,根据投影结果识别所述限缩投影区域中的文本区域以及间隔区域,根据识别结果向与所述限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
针对所述原始表格图片执行灰度处理以及二值化处理;则所述预设数值范围包括:与黑色像素值相匹配的数值范围。
实施例四
图3示出了根据本发明另一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图3所示,该电子设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述表格识别方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据所述连续像素集合识别所述原始表格图片中包含的原始分隔线;
根据所述原始分隔线确定投影方向,沿所述投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别所述原始表格图片中的文本区域以及间隔区域;
根据识别结果向与所述间隔区域相匹配的位置插入自定义分隔线,得到与所述原始表格图片相对应的自定义表格图片,根据所述自定义表格图片中包含的自定义分隔线识别表格内容。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;
当校验结果为否时,针对所述自定义分隔线进行调整。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
根据每相邻的两条自定义分隔线之间的间距是否小于预设字节间距阈值判断该相邻的两条自定义分隔线是否符合预设表格规范;
其中,预设字节间距阈值根据字节高度、和/或字节宽度确定。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
获取各个自定义分隔线与所述原始分隔线之间的间距,当自定义分隔线与所述原始分隔线之间的间距小于预设分隔间距阈值时,确定该自定义分隔线不符合预设表格规范。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
当校验结果为否时,删除不符合预设表格规范的自定义分隔线。
在一种可选的实现方式中,所述原始分隔线包括:第一分隔线以及第二分隔线;其中,所述第一分隔线垂直于所述第二分隔线;
其中,当所述投影方向与第一分隔线平行时,所述可执行指令使处理器执行以下操作:
根据所述第二分隔线的数量,确定各个投影像素集合中对应于所述第二分隔线的像素的数量;
根据所述各个投影像素集合中对应于所述第二分隔线的像素的数量,识别所述原始表格图片中的间隔区域。
在一种可选的实现方式中,所述投影方向包括:根据第一分隔线确定的第一投影方向、以及根据第二分隔线确定的第二投影方向;并且,所述自定义分隔线包括:根据第一投影方向确定的第一自定义分隔线、以及根据第二投影方向确定的第二自定义分隔线;其中,所述第一自定义分隔线垂直于所述第二自定义分隔线。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
当相邻的两条第一自定义分隔线之间的间距大于预设异常阈值时,根据第二分隔线和/或第二自定义分隔线确定限缩投影区域;
在所述限缩投影区域内沿第一投影方向进行投影,根据投影结果识别所述限缩投影区域中的文本区域以及间隔区域,根据识别结果向与所述限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
在一种可选的实现方式中,所述可执行指令使处理器执行以下操作:
针对所述原始表格图片执行灰度处理以及二值化处理;则所述预设数值范围包括:与黑色像素值相匹配的数值范围。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (18)

1.一种表格识别方法,包括:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据所述连续像素集合识别所述原始表格图片中包含的原始分隔线;
根据所述原始分隔线确定投影方向,沿所述投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别所述原始表格图片中的文本区域以及间隔区域;
根据识别结果向与所述间隔区域相匹配的位置插入自定义分隔线,得到与所述原始表格图片相对应的自定义表格图片,根据所述自定义表格图片中包含的自定义分隔线识别表格内容;
其中,所述原始分隔线包括:第一分隔线以及第二分隔线,所述投影方向包括:根据第一分隔线确定的第一投影方向以及根据第二分隔线确定的第二投影方向;并且,所述自定义分隔线包括:根据第一投影方向确定的第一自定义分隔线以及根据第二投影方向确定的第二自定义分隔线;所述根据识别结果向与所述间隔区域相匹配的位置插入自定义分隔线之后,进一步包括:根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;当校验结果为否时,针对所述自定义分隔线进行调整;其中,当相邻的两条第一自定义分隔线之间的间距大于预设异常阈值时,根据第二分隔线和/或第二自定义分隔线确定限缩投影区域;在所述限缩投影区域内沿第一投影方向进行投影,根据投影结果识别所述限缩投影区域中的文本区域以及间隔区域,根据识别结果向与所述限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
2.根据权利要求1所述的方法,其中,所述根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范包括:
根据每相邻的两条自定义分隔线之间的间距是否小于预设字节间距阈值判断该相邻的两条自定义分隔线是否符合预设表格规范;
其中,预设字节间距阈值根据字节高度和/或字节宽度确定。
3.根据权利要求1所述的方法,其中,所述根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范包括:
获取各个自定义分隔线与所述原始分隔线之间的间距,当自定义分隔线与所述原始分隔线之间的间距小于预设分隔间距阈值时,确定该自定义分隔线不符合预设表格规范。
4.根据权利要求1所述的方法,其中,当校验结果为否时,针对所述自定义分隔线进行调整包括:
当校验结果为否时,删除不符合预设表格规范的自定义分隔线。
5.根据权利要求1所述的方法,其中,所述第一分隔线垂直于所述第二分隔线;
其中,当所述投影方向与第一分隔线平行时,所述根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别所述原始表格图片中的文本区域以及间隔区域包括:
根据所述第二分隔线的数量,确定各个投影像素集合中对应于所述第二分隔线的像素的数量;
根据所述各个投影像素集合中对应于所述第二分隔线的像素的数量,识别所述原始表格图片中的间隔区域;其中,所述第一自定义分隔线垂直于所述第二自定义分隔线。
6.根据权利要求1-5任一所述的方法,其中,所述检测原始表格图片中像素值属于预设数值范围的连续像素集合之前,进一步包括:针对所述原始表格图片执行灰度处理以及二值化处理;则所述预设数值范围包括:与黑色像素值相匹配的数值范围。
7.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据所述连续像素集合识别所述原始表格图片中包含的原始分隔线;
根据所述原始分隔线确定投影方向,沿所述投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别所述原始表格图片中的文本区域以及间隔区域;
根据识别结果向与所述间隔区域相匹配的位置插入自定义分隔线,得到与所述原始表格图片相对应的自定义表格图片,根据所述自定义表格图片中包含的自定义分隔线识别表格内容;
其中,所述原始分隔线包括:第一分隔线以及第二分隔线,所述投影方向包括:根据第一分隔线确定的第一投影方向以及根据第二分隔线确定的第二投影方向;并且,所述自定义分隔线包括:根据第一投影方向确定的第一自定义分隔线以及根据第二投影方向确定的第二自定义分隔线;所述可执行指令使处理器执行以下操作:根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;当校验结果为否时,针对所述自定义分隔线进行调整;其中,当相邻的两条第一自定义分隔线之间的间距大于预设异常阈值时,根据第二分隔线和/或第二自定义分隔线确定限缩投影区域;在所述限缩投影区域内沿第一投影方向进行投影,根据投影结果识别所述限缩投影区域中的文本区域以及间隔区域,根据识别结果向与所述限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
8.根据权利要求7所述的电子设备,其中,所述可执行指令使处理器执行以下操作:
根据每相邻的两条自定义分隔线之间的间距是否小于预设字节间距阈值判断该相邻的两条自定义分隔线是否符合预设表格规范;
其中,预设字节间距阈值根据字节高度和/或字节宽度确定。
9.根据权利要求7所述的电子设备,其中,所述可执行指令使处理器执行以下操作:
获取各个自定义分隔线与所述原始分隔线之间的间距,当自定义分隔线与所述原始分隔线之间的间距小于预设分隔间距阈值时,确定该自定义分隔线不符合预设表格规范。
10.根据权利要求7所述的电子设备,其中,所述可执行指令使处理器执行以下操作:
当校验结果为否时,删除不符合预设表格规范的自定义分隔线。
11.根据权利要求7所述的电子设备,其中,所述第一分隔线垂直于所述第二分隔线;
其中,当所述投影方向与第一分隔线平行时,所述可执行指令使处理器执行以下操作:
根据所述第二分隔线的数量,确定各个投影像素集合中对应于所述第二分隔线的像素的数量;
根据所述各个投影像素集合中对应于所述第二分隔线的像素的数量,识别所述原始表格图片中的间隔区域;其中,所述第一自定义分隔线垂直于所述第二自定义分隔线。
12.根据权利要求7-11任一所述的电子设备,其中,所述可执行指令使处理器执行以下操作:
针对所述原始表格图片执行灰度处理以及二值化处理;则所述预设数值范围包括:与黑色像素值相匹配的数值范围。
13.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行以下操作:
检测原始表格图片中像素值属于预设数值范围的连续像素集合,根据所述连续像素集合识别所述原始表格图片中包含的原始分隔线;
根据所述原始分隔线确定投影方向,沿所述投影方向进行投影,根据各个投影像素集合的排布位置以及各个投影像素集合中像素值属于预设数值范围的像素的数量,识别所述原始表格图片中的文本区域以及间隔区域;
根据识别结果向与所述间隔区域相匹配的位置插入自定义分隔线,得到与所述原始表格图片相对应的自定义表格图片,根据所述自定义表格图片中包含的自定义分隔线识别表格内容;
其中,所述原始分隔线包括:第一分隔线以及第二分隔线,所述投影方向包括:根据第一分隔线确定的第一投影方向以及根据第二分隔线确定的第二投影方向;并且,所述自定义分隔线包括:根据第一投影方向确定的第一自定义分隔线以及根据第二投影方向确定的第二自定义分隔线;所述可执行指令使处理器执行以下操作:根据各个自定义分隔线之间的间距,校验各个自定义分隔线是否符合预设表格规范;当校验结果为否时,针对所述自定义分隔线进行调整;其中,当相邻的两条第一自定义分隔线之间的间距大于预设异常阈值时,根据第二分隔线和/或第二自定义分隔线确定限缩投影区域;在所述限缩投影区域内沿第一投影方向进行投影,根据投影结果识别所述限缩投影区域中的文本区域以及间隔区域,根据识别结果向与所述限缩投影区域中的间隔区域相匹配的位置插入限缩分隔线。
14.根据权利要求13所述的计算机存储介质,其中,所述可执行指令使处理器执行以下操作:
根据每相邻的两条自定义分隔线之间的间距是否小于预设字节间距阈值判断该相邻的两条自定义分隔线是否符合预设表格规范;
其中,预设字节间距阈值根据字节高度和/或字节宽度确定。
15.根据权利要求13所述的计算机存储介质,其中,所述可执行指令使处理器执行以下操作:
获取各个自定义分隔线与所述原始分隔线之间的间距,当自定义分隔线与所述原始分隔线之间的间距小于预设分隔间距阈值时,确定该自定义分隔线不符合预设表格规范。
16.根据权利要求13所述的计算机存储介质,其中,所述可执行指令使处理器执行以下操作:
当校验结果为否时,删除不符合预设表格规范的自定义分隔线。
17.根据权利要求13所述的计算机存储介质,其中,所述第一分隔线垂直于所述第二分隔线;
其中,当所述投影方向与第一分隔线平行时,所述可执行指令使处理器执行以下操作:
根据所述第二分隔线的数量,确定各个投影像素集合中对应于所述第二分隔线的像素的数量;
根据所述各个投影像素集合中对应于所述第二分隔线的像素的数量,识别所述原始表格图片中的间隔区域;其中,所述第一自定义分隔线垂直于所述第二自定义分隔线。
18.根据权利要求13-17任一所述的计算机存储介质,其中,所述可执行指令使处理器执行以下操作:
针对所述原始表格图片执行灰度处理以及二值化处理;则所述预设数值范围包括:与黑色像素值相匹配的数值范围。
CN201911375389.7A 2019-12-27 2019-12-27 表格识别方法、电子设备及计算机存储介质 Active CN111160234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911375389.7A CN111160234B (zh) 2019-12-27 2019-12-27 表格识别方法、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911375389.7A CN111160234B (zh) 2019-12-27 2019-12-27 表格识别方法、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN111160234A CN111160234A (zh) 2020-05-15
CN111160234B true CN111160234B (zh) 2020-12-08

Family

ID=70558460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911375389.7A Active CN111160234B (zh) 2019-12-27 2019-12-27 表格识别方法、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111160234B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639566A (zh) * 2020-05-19 2020-09-08 浙江大华技术股份有限公司 一种提取表单信息的方法及装置
CN111881659B (zh) * 2020-09-28 2021-02-26 江西汉辰信息技术股份有限公司 表格图片的处理方法、系统、可读存储介质及计算机设备
CN112906532B (zh) * 2021-02-07 2024-01-05 杭州睿胜软件有限公司 图像处理方法和装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014086265A1 (zh) * 2012-12-05 2014-06-12 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法
CN106407883A (zh) * 2016-08-10 2017-02-15 北京工业大学 一种复杂表格及其内部手写数字识别方法
CN109858468A (zh) * 2019-03-04 2019-06-07 汉王科技股份有限公司 一种表格线识别方法及装置
CN110163030A (zh) * 2018-02-11 2019-08-23 鼎复数据科技(北京)有限公司 一种基于图像信息的pdf有边框表格抽取方法
CN110210440A (zh) * 2019-06-11 2019-09-06 中国农业银行股份有限公司 一种表格图像版面分析方法及系统
CN110516208A (zh) * 2019-08-12 2019-11-29 深圳智能思创科技有限公司 一种针对pdf文档表格提取的系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8634645B2 (en) * 2008-03-28 2014-01-21 Smart Technologies Ulc Method and tool for recognizing a hand-drawn table
CN101976232B (zh) * 2010-09-19 2012-06-20 深圳市万兴软件有限公司 一种识别文档中数据表格的方法及装置
CN108021900B (zh) * 2017-12-18 2022-05-17 科大讯飞股份有限公司 版面分栏方法及装置
CN108446264B (zh) * 2018-03-26 2022-02-15 阿博茨德(北京)科技有限公司 Pdf文档中的表格矢量解析方法及装置
CN110008809B (zh) * 2019-01-04 2020-08-25 阿里巴巴集团控股有限公司 表格数据的获取方法、装置和服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014086265A1 (zh) * 2012-12-05 2014-06-12 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法
CN106407883A (zh) * 2016-08-10 2017-02-15 北京工业大学 一种复杂表格及其内部手写数字识别方法
CN110163030A (zh) * 2018-02-11 2019-08-23 鼎复数据科技(北京)有限公司 一种基于图像信息的pdf有边框表格抽取方法
CN109858468A (zh) * 2019-03-04 2019-06-07 汉王科技股份有限公司 一种表格线识别方法及装置
CN110210440A (zh) * 2019-06-11 2019-09-06 中国农业银行股份有限公司 一种表格图像版面分析方法及系统
CN110516208A (zh) * 2019-08-12 2019-11-29 深圳智能思创科技有限公司 一种针对pdf文档表格提取的系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
复杂表格文档图像的模板识别与提取;杨靖民;《中国优秀硕士学位论文全文数据库信息科技辑》;20190815(第8期);第I138-884页 *

Also Published As

Publication number Publication date
CN111160234A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN111160234B (zh) 表格识别方法、电子设备及计算机存储介质
CN109522816B (zh) 表格识别方法及装置、计算机存储介质
CN110502985B (zh) 表格识别方法、装置及表格识别设备
CN111177445B (zh) 标准图元的确定方法、图元识别方法、装置和电子设备
CN113361257B (zh) Pdf文档解析方法、系统、电子装置及存储介质
CN112906695B (zh) 适配多类ocr识别接口的表格识别方法及相关设备
CN112861648A (zh) 文字识别方法、装置、电子设备及存储介质
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN112100979A (zh) 基于电子书的排版处理方法、电子设备及存储介质
CN111881659B (zh) 表格图片的处理方法、系统、可读存储介质及计算机设备
CN115240213A (zh) 表格图像识别方法、装置、电子设备及存储介质
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN111144400A (zh) 身份证信息的识别方法、装置、终端设备及存储介质
JPH0721310A (ja) 文書認識装置
CN115546809A (zh) 基于单元格约束的表格结构识别方法及其应用
CN114359932B (zh) 文本检测方法、文本识别方法及装置
CN111814673A (zh) 一种修正文本检测边界框的方法、装置、设备及存储介质
CN113011131B (zh) 基于图片类电子书的排版方法、电子设备及存储介质
CN112699634B (zh) 电子书的排版处理方法、电子设备及存储介质
CN107122778B (zh) 一种单字区域的合并方法和装置
CN113269153B (zh) 一种表格识别方法以及装置
CN112446375A (zh) 车牌识别方法、装置、设备及存储介质
CN116524503A (zh) 多行文本行提取方法、装置、设备及可读存储介质
CN115527023A (zh) 图像检测方法、装置、电子设备及存储介质
CN112100978B (zh) 基于电子书的排版处理方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220907

Address after: 518054-13098, 13th floor, main tower of marine center, No. 59, Linhai Avenue, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong

Patentee after: Shenzhen ZhangYue Animation Technology Co.,Ltd.

Address before: 100124 2029e, Sihui building, Chaoyang District, Beijing

Patentee before: ZHANGYUE TECHNOLOGY Co.,Ltd.