CN109522816A - 表格识别方法及装置、计算机存储介质 - Google Patents

表格识别方法及装置、计算机存储介质 Download PDF

Info

Publication number
CN109522816A
CN109522816A CN201811261560.7A CN201811261560A CN109522816A CN 109522816 A CN109522816 A CN 109522816A CN 201811261560 A CN201811261560 A CN 201811261560A CN 109522816 A CN109522816 A CN 109522816A
Authority
CN
China
Prior art keywords
feature
information
tableau format
obtains
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811261560.7A
Other languages
English (en)
Other versions
CN109522816B (zh
Inventor
陈意浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huiliu Technology Co Ltd
Original Assignee
Beijing Huiliu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huiliu Technology Co Ltd filed Critical Beijing Huiliu Technology Co Ltd
Priority to CN201811261560.7A priority Critical patent/CN109522816B/zh
Publication of CN109522816A publication Critical patent/CN109522816A/zh
Application granted granted Critical
Publication of CN109522816B publication Critical patent/CN109522816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种表格识别方法及装置、计算机存储介质。所述方法包括:检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;根据所述表格结构信息绘制第二表格;将所述文本信息填充到第二表格中。

Description

表格识别方法及装置、计算机存储介质
技术领域
本发明涉及信息技术领域,尤其涉及一种表格识别方法及装置、计算机存储介质。
背景技术
若一张待识别的图像中与表格,则现有技术中的识别技术,例如,光学字符识别(Optical Character Recognition,OCR)仅能识别其中的表格内容;是无法还原出图像中的表格的,故相关技术是无法成功识别和还原表格的。
发明内容
有鉴于此,本发明实施例期望提供一种发明涉及信息技术领域,尤其涉及一种。
本发明的技术方案是这样实现的:
一种表格识别方法,包括:
检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;
根据所述表格结构信息绘制第二表格;
将所述文本信息填充到第二表格中。
基于上述方案,所述检测待处理图像中第一表格的表格结构获得表格结构信息,包括:
检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息;
所述根据所述表格结构信息绘制第二表格,包括:
根据所述单元格信息绘制所述第二表格。
基于上述方案,所述检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息,包括:
检测所述第一表格的表格结构,获得单元格的中心点坐标及单元格的尺寸参数。
基于上述方案,所述检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息,包括:
检测所述第一表格的表格结构,获得单元格的中心点坐标、尺寸参数及置信度。
基于上述方案,所述方法还包括:
校正所述单元格信息;
所述根据所述单元格信息绘制所述第二表格,包括:
利用校正后的所述单元格信息,绘制所述第二表格。
基于上述方案,所述校正所述单元格信息,包括:
根据所述单元格信息,确定是否存在重叠状况达到重叠删除条件的单元格;
若存在重叠状况达到重叠删除条件的单元格,保留从重叠的单元格所对应的单元格信息中选择置信度最高的单元格所对应的单元格信息。
基于上述方案,所述检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息,包括:
将包含有所述第一表格的待处理图像输入到深度学习模型中,由所述深度学习模型的特征提取模块输出第一特征图;
利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构信息;
利用所述深度学习模型的第二分支模块检测所述第一特征图,获得所述文本信息。
基于上述方案,所述利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构,包括:
所述第一分支模块对所述第一特征图进行特征提取,获得突出第一类特征且抑制第二类特征的第二特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;
基于所述第二特征图和待处理图像,确定所述第一表格包括的单元格的中心点坐标及在所述第二特征图上的区域;
基于所述中心点坐标与表征所述第一特征的像素之间的偏移量,获得第一单元格信息,其中,所述第一单元格信息包括:中心点坐标、尺寸参数及置信度;
基于所述置信度,确定出用于绘制所述第二表格的第二单元格信息。
基于上述方案,所述利用所述深度学习模型的第二分支模块检测所述第一特征图,获得所述文本信息,包括:
利用所述第二分支模块对所述第一特征图进行特征提取,获得突出第二类特征且抑制第一类特征的第三特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;
根据所述第三特征图确定待处理图像中所述表格内容所在的内容区域;
识别所述内容区域的表格内容,获得所述表格内容对应的文本信息。
一种表格识别装置,包括:
检测模块,用于检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;
绘制模块,用于根据所述表格结构信息绘制第二表格;
填充模块,用于将所述文本信息填充到第二表格中。
一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够实现前述一个或多个技术方案提供的表格识别方法。
本发明实施例提供的技术方案,在识别表格时,不仅会识别表格的内容,还会检测表格结构,从而获得表格结构信息;根据表格结构信息绘制出于图像中第一表格对应的第二表格,再将识别的表格内容对应的文本信息添加到第二表格中,就实现了待识别图像中表格的还原,如提升了表格的识别成功率和完整性。
附图说明
图1为本发明实施例提供的第一种表格识别方法的流程示意图;
图2为本发明实施例提供的第二种表格识别方法的流程示意图;
图3为本发明实施例提供的第三种表格识别方法的流程示意图;
图4为本发明实施例提供的一种种表格识别装置的结构示意图;
图5为本发明实施例提供的第四种表格识别方法的流程示意图;
图6为本发明实施例提供的一种输入到图5所示深度神经网络的表格示意图;
图7A为本发明实施例提供的文字检测结果的示意图;
图7B为本发明实施例提供的文字识别结果的示意图;
图8为本发明实施例提供的表格识别结果的示意图;
图9为本发明实施例提供的表格的最终识别结果的示意图;
图10为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
如图1所示,本实施例提供一种表格识别方法,包括:
步骤S110:检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;
步骤S120:根据所述表格结构信息绘制第二表格;
步骤S130:将所述文本信息填充到第二表格中。
在本实施例中提供一种表格方法,若待识别的待处理图像中包含有第一表格时,不仅区分表格的表格结构和表格内容分别进行识别。
待识别的待处理图像可包括:各种打印文档的图像、传真的图像等。
在本实施例中,所述第一表格为待识别的待处理图像包含的表格。所述第二表格为根据检测获得表格信息重新绘制的表格。若表格结构信息准确,则第一表格和所述第二表格的结构具有相同的表格属性;此处的表格属性包含但不限于:表格结构和/或表格的尺寸等。所述表格结构可包括:包括的单元格数目、单元格的尺寸、单元格的排列方式。单元格可为组成表格的最小单位。
在本实施例中还会识别表格内容,获得与表格内容相对应的文本信息。该文本信息可为各种语言和/或风格的字符、数字或字符串等信息。
在本实施例中,绘制出第二表格之后,会将识别表格内容获得文本信息,添加到所述第二表格中,从而完整还原出待处理图像中的第一表格;故实现了表格的识别和还原方法。
在一些实施例中,所述步骤S110包括:检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息;所述步骤S120可包括:根据所述单元格信息绘制所述第二表格。
由于第一表格是由一个或多个单元各组成的,则可以通过单元格的单元格信息来表征第一表格的表格结构。所述单元格可为矩形框或倒角矩形框等近似矩形框。
在本实施例中的步骤S120中是根据单元格信息绘制的第二表格。例如,第一表格包含M个单元格,则所述表格结构信息至少包括:M条单元格信息。依据这M条单元格信息可分别绘制出M个单元格,这M个单元格就组成了所述第一表格。
在一些实施例中,所述单元格信息可包括:单元格的角点的坐标;以单元格为矩形框为例,所述角点可为矩形框的四个角;此处仅是对单元格信息的举例说明,具体实现时,所述单元格信息不限于角点的坐标。
在一些实施例中,所述步骤S110可包括:
检测所述第一表格的表格结构,获得单元格的中心点坐标及单元格的尺寸参数。
所述中心点坐标为一个单元格的中心点的坐标;该中心点坐标可用(X,Y)表示。所述单元格的尺寸参数包括但不限于高度(H)和宽度(W)。若一个单元格的中心点的坐标确定了,同时还知道了H和W,则可以基于该(X,Y,W,H)绘制出该单元格。若一个表格的每一个单元格都能够被成功绘制出来,则就能够完整的绘制出于所述第一表格对应的第二表格。
在一些实施例中,所述步骤S110可包括:检测所述第一表格的表格结构,获得单元格的中心点坐标、尺寸参数及置信度。
所述置信度可为0到1之间的数值,可为:指示对应单元格信息正确表征第一表格的某一个单元格的概率值。若所述置信度越高,则该单元格信息的正确率更高,若基于置信度高的单元格信息绘制表格,就会使得第二表格还原第一表格的还原程度越高。
如此,在存在多个单元格信息指示的单元格存在冲突时,就可以根据单元格置信度删除不正确的单元格。
在一些实施例中,所述方法还包括:校正所述单元格信息;所述步骤S120可包括:利用校正后的所述单元格信息,绘制所述第二表格。
在本实施例中,会校正单元格信息,此处的校正单元格信息可以包括:删除置信度低的单元格信息,删除重复单元格的信息。
所述校正单元格信息包括但不限于以下至少之一:
根据校正阈值,将置信度低于校正阈值的单元格信息删除,仅保留置信度高于校正阈值的单元格信息。例如,所述校正阈值可为0.6、0.7、0.8、0.9等取值;如此,基于置信度与校正阈值之间的比较,首先可删除大量的重复或不正确的单元格信息。
去除单元格有重复的单元格信息中的一个或多个,仅保留一个置信度较高的单元格信息。
例如,所述校正所述单元格信息,包括:
根据所述单元格信息,确定是否存在有重叠状况达到重叠删除条件的单元格;
若存在重叠状况达到重叠删除条件的单元格,保留从重叠的单元格所对应的单元格信息中选择置信度最高的单元格所对应的单元格信息。
例如,有3个单元格的重叠状况满足所述重叠删除条件,例如,这3个单元格的重叠面积达到面积阈值,可认为所述重叠状况满足所述重叠删除条件。再例如,3个单元格的重叠面积比值达到比值阈值,可认为重叠状况满足的重叠阈值。例如,有重叠的多个单元格中最小面积的单元格的面积为分母,以重叠面积为分子,计算出所述重叠面积比值。此时,比较这3个单元格所对应单元格信息的置信度,选择置信度最高的单元格信息保留,剩余2个单元格信息就可以删除了。
如此,结合置信度、校正阈值、重叠删除条件中的一个或多个,可以快速的删除单元格信息中不能用于精确还原第一表格的单元格信息,加速第二表格的绘制。
在一些实施例中,如图2所示,所述步骤S110可包括:
步骤S111:将包含有所述第一表格的待处理图像输入到深度学习模型中,由所述深度学习模型的特征提取模块输出第一特征图;
步骤S112:利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构;
步骤S113:利用所述深度学习模型的第二分支模块检测所述第一特征图,获得所述文本信息。
在本实施例中,会将包含有第一表格的待处理图像输入到深度学习模型,该深度学习模型可为:神经网络等等利用样本数据训练得到的学习模型,具体实现时深度学习模型不局限于神经网络。
在步骤S110中,由深度学习模型的特征提取模块对所述待处理图像进行处理,得到第一特征图。若所述深度学习模型为神经网络,则所述特征提取模块可为特征提取网络,例如,卷积网络;所述卷积网络可以通过卷积的方式,从原始图像中提取出所需的特征值,从而生成所述第一特征图。所述卷积网络可为全卷积网络(FCN)等各种网络,能够从原始图像中删除一些背景像素,从而仅保留能够表征表格及表格内容的特征。
在一些实施例中,所述第一特征图的图像尺寸小于所述待处理图像的图像尺寸。例如,所述待处理图像为512*512个像素的图像;所述第一特征图为128*128个像素的图像,如此,第一特征图相对于待处理图像就进行图像尺寸的4倍缩小,当然以上仅是举例,总之,经过所述检测模块处理之后,所述第一特征图的图像尺寸小于所述待处理图像的图像尺寸。
所述第一特征图是同时包含有:表格结构的特征和表格内容的特征。
将所述第一特征图输入到第一分支模块中,由第一分支模块对第一特征图进行进一步处理,得到所述表格结构信息。在一些实施例中,所述表格结构信息除了用前述的单元格信息来描述,还可以其他类型的信息来描述。例如,所述表格信息可包括:表格的行数、列数、行间距及列间距等信息来描述。
总之,将第一特征图输入到第一分支模块中之后,第一分支模块会通过进一步的特征处理得到所述表格结构信息。
在本实施例中,同时还会将第一特征图收入与到第二分支模块,由第二分支模块来提取表格内容获得与表格内容对应的文本信息。
在本实施例中,为了简化深度学习模型的结构、简化深度学习模型的训练,会使得表格内容和表格结构的特征提取,使用同一个检测模块。
在一些实施例中,表格内容和表格结构的特征提取,可以使用不同的特征提取模块,只是这样会增加特征提取模块,使得深度学习模块的模型结构更加复杂,学习训练时可能收敛更难、或者,误差更大。
在一些实施例中,为了进一步确保表格结构信息及文本信息的精确度,所述利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构,包括:
所述第一分支模块对所述第一特征图进行特征提取,获得突出第一类特征且抑制第二类特征的第二特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;
基于所述第二特征图和待处理图像,确定所述第一表格包括的单元格的中心点坐标及在所述第二特征图上的区域;
基于所述中心点坐标与表征所述第一特征的像素之间的偏移量,获得第一单元格信息,其中,所述第一单元格信息包括:中心点坐标、尺寸参数及置信度;
基于所述置信度,确定出用于绘制所述第二表格的第二单元格信息。
例如,第一分支模块会进一步对第一特征图进行特征提取,得到第二特征图,第二特征图相对于第一特征图,会突出第一类特征并抑制第二类特征,此处的抑制第二特征可包括:去除第二特征的特征像素、或者,差异化第一特征和第二特征。由于第一特征图的图像尺寸小于待处理图像的图像尺寸,即便此时,第一分支模块再次进行特征提取,特征提取的计算量小,且对第一分支模块中特征提取组件的结构复杂度要求低,也便于深度学习模型的训练。
在本实施例中,所述第一分支模块还会基于待处理图像和第二特征图得到中心点坐标及第二特征图上的区域。在一些实施例中,所述第二特征图的图像尺寸可等于或小于所述第一特征图。为了实现像素对齐,在本实施例中,对所述待处理图像进行缩小,使得缩小后的待处理图像的图像尺寸和所述第二特征图的图像尺寸一致。然后集合待处理图像,就可以识别出当前第一表格中包括的单元格的数目,基于像素对齐,可以定位出第二特征图上哪些区域可能属于同一个单元格。
若第一表格包括有M个单元格,则共有M个单元格的中心点坐标。基于这些中心点坐标与第二特征图上表征第一特征的像素进行偏移量计算,这些偏移量在X和Y轴方向上都会有,对应了尺寸参数W和H;如此,针对第一表格中实际的一个单元格可能有若干个第一单元格信息。此处的第一单元格信息相当于备选单元格信息,第二单元格信息可为从备选单元格信息中选择的最终用于第二表格绘制的最终单元格信息。本实施例提供的第一单元格信息可能指示同一个单元格的重复信息或者描述单元格的尺寸不正确的不正确的信息,在本实施例中将结合置信度,选择出最终用于绘制第二表格的第二单元格信息。基于所述置信度条件,确定出用于绘制第二表格的第二单元格信息,可以采用前述任意一种方式,在此就不重复了。
图3所示本示例提供的一种表格识别方法,可包括:
深度学习模型的检测模块检测待识别图像,获得第一特征图;
将第一特征图分别输入深度图像的第一分支模块和第二分支模块;
第一分支模块对第一特征图进行处理之后,产生表格结构信息,该表格结构信息包括但不限于上述单元格信息;
第二分支模块对第一特征图进行处理之后,获得文本信息;
深度学习模型的整合模块,将文本信息填充到基于表格结构信息绘制的第二表格中,如此,实现了一个端到端的表格识别方案,如此,用户输入到运行本实施例提供的深度学习模型的设备中,则该设备就会输出一张已填充有文本内容且保留有表格结构的第二表格。
在一些实施例中,所述步骤S113可包括:
利用所述第二分支模块对所述第一特征图进行特征提取,获得突出第二类特征且抑制第一类特征的第三特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;
根据所述第三特征图确定待处理图像中所述表格内容所在的内容区域;
识别所述内容区域的表格内容,获得所述表格内容对应的文本信息。
在本实施例中,第二分支模块将第一特征图转换为第三特征图,在第三特征图主要体现第二类特征,并抑制第一类特征;此处的一致第一类特征可包括但不限于去除第一特征,或者,差异化第一类特征和第二类特征对应的像素。
如此,可以根据第三特征图,区分出待处理图像中的哪些属于表格结构,哪些属于表格内容。在识别表格内容时包括但不限于采用OCR识别。OCR识别可以将图像中的图形形式的表格内容转换为文本信息。
在一些实施例中一个内容区域可对应于一个单元格。如此,方便根据内容区域与单元格的对应关系,将内容区域内的表格内容识别获得文本信息写入第二表格的对应单元格中。
在一些实施例中,在识别所述表格内容时,可能存在一些比较容易出现混淆的内容,例如,字母“o”和数字“0”、再例如,字母“l”和数字“1”,在特定字体或风格的字体中是非常容易混淆的,在本实施例中,所述方法还包括:
根据相邻识别对象的类型,从容易混淆的识别结果中选择一个作为最终的识别结果。例如,表格内容的单一字符、标点、数字或者汉字可以视为一个识别对象。在对于容易混淆的识别对象,可以根据相邻的识别对象的类型来辅助识别。例如,若在一个英文单词中,可以将以更大的概率识别字母“o”,在一个由多个数字组成的数字序列中,可识别为数字“0”等。
将识别的文本信息填充到第二表格中,相当于识别的表格结构信息及文本信息内容进行整合,从而实现图像中第一表格的表格还原。
在一些实施例中,所述方法还包括:
利用预处理模块,识别原图定位所述第一表格,获得所述第一表格的位置信息。例如,利用所述预处理器模块识别出第一表格的四个角点的位置信息,此时,就相当于定位出了原图中的待识别的表格。
进一步地,为了方便第一表格的识别,会根据定位出的所述位置信息,切割所述原图获得切割图像,该切割图像包含有所述第一表格。例如,若切割图像的图像尺寸与检测模块所处理的图像尺寸大小不一致,可以通过上采样或者降采样的方式,获得检测模块所需图像尺寸的待处理图像。
在一些实施例中,如图4所示,本实施例还提供一种表格识别装置,包括:
检测模块110,用于检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;
绘制模块120,用于根据所述表格结构信息绘制第二表格;
填充模块130,用于将所述文本信息填充到第二表格中。
在一些实施例中,所述检测模块110、识别模块及填充模块130,可以为程序模块,这些程序模块被处理器执行后,能够实现表格信息及文本信息的识别,第二表格的绘制及文本信息的填充。
在另一些实施例中,所述检检测模块110、识别模块及填充模块130可以为软硬结合的模块,例如,具体可为各种类型的可编程阵列,例如,现场可编程阵列或复杂可编程阵列。
在还有一些实施例中,所述检测模块110、识别模块及填充模块130,可以为纯硬件模块,例如,可为专用集成电路。
在一些实施例中,所述检测模块110,包括:
表格结构检测子模块,用于检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息;所述绘制模块120,具体用于根据所述单元格信息绘制所述第二表格。
在一些实施例中,所述表格结构检测子模块,具体用于检测所述第一表格的表格结构,获得单元格的中心点坐标及单元格的尺寸参数。
在一些实施例中,所述表格结构检测子模块,具体用于检测所述第一表格的表格结构,获得单元格的中心点坐标、尺寸参数及置信度。
在一些实施例中,所述装置还包括:
校正模块,用于校正所述单元格信息;
所述绘制模块120,具体用于利用校正后的所述单元格信息,绘制所述第二表格。
在一些实施例中,所述校正模块,具体用于根据所述单元格信息,确定是否存在重叠状况达到重叠删除条件的单元格;若存在重叠状况达到重叠删除条件的单元格,保留从重叠的单元格所对应的单元格信息中选择置信度最高的单元格所对应的单元格信息。
在一些实施例中,所述检测模块110,具体用于将包含有所述第一表格的待处理图像输入到深度学习模型中,由所述深度学习模型的特征提取模块输出第一特征图;利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构信息;利用所述深度学习模型的第二分支模块检测所述第一特征图,获得所述文本信息。
在一些实施例中,所述检测模块110,具体用于所述第一分支模块对所述第一特征图进行特征提取,获得突出第一类特征且抑制第二类特征的第二特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;基于所述第二特征图和待处理图像,确定所述第一表格包括的单元格的中心点坐标及在所述第二特征图上的区域;基于所述中心点坐标与表征所述第一特征的像素之间的偏移量,获得第一单元格信息,其中,所述第一单元格信息包括:中心点坐标、尺寸参数及置信度;基于所述置信度,确定出用于绘制所述第二表格的第二单元格信息。
在一些实施例中,所述检测模块110,具体用于利用所述第二分支模块对所述第一特征图进行特征提取,获得突出第二类特征且抑制第一类特征的第三特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;根据所述第三特征图确定待处理图像中所述表格内容所在的内容区域;识别所述内容区域的表格内容,获得所述表格内容对应的文本信息。
以下结合上述任意实施例提供几个具体示例:
示例1:
OCR表格检测技术,在识别表格内容(例如,文字)的同时,也将表格结构检测出来,极大减少OCR识别表格时的后处理成本,实现端到端的一整套的识别加排版,该技术针对表格类的文本识别具有非常多的应用场景,如单据,票据,及各类表单文本数据。
本技术方案是基于深度学习模型的表格识别方法,在目前OCR文字检测加识别的基础上,增加表格结构检测。使用X,Y,W,H表示单元格,其中(X,Y)为单元格中心店坐标,W,H为宽和高,在深度神经网络最后一层特征,由单元格内部的点去预测单元格的X,Y,W,H。后续处理在预测出来的多个单元格框中,进行最大干扰抑制算法NMS处理,去掉预测重复的单元格,得到最终结果。
本示例提供的技术方案,具有降低OCR识别表格类数据的后处理成本,实现端到端一整套识别加排版方案;格式化数据转格式化数据,最大限度保留结构的特点。
示例2:
如图5所示,本示例提供一种表格识别方法,包括:
将带识别的图像输入到深度神经网络;
深度神经网络输出文字检测结果、文字识别结果及表格检测结果;
整合文字检测结果、文字识别结果及表格检测结果,则会输出一张带文本信息的表格。
图6为输入到图5所示的深度神经网络的原始表格;图7A为文字检测结果,显然在图7A中将文字用倒角矩形表示出来了。图7B为文字识别结果,利用OCR技术等将图像中的表格内容转换为了文本信息,结合文字检测结果和文字识别结果,就知道识别的文本信息哪些是属于同一个单元格的,哪些文本信息是属于不同的单元格。图8所示为基于表格检测结果绘制的空表格(对应于前述第一表格)。图9为本示例将图7B识别的文本信息填充到图8所示表格中后的最终识别结果。比对图6和图9可知,图9所示的表格高度还原了图6所示的表格。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够实现前述一个或多个技术方案提供的表格识别方法;例如,如图1、图2、图3及图5所示的方法。
所述计算机存储介质可为非瞬间存储介质。
如图10所示,本实施例还提供一种电子设备,可运行前述任意技术方案提供的表格识别的方法,包括:
存储器,用于存储信息;
处理器,与所述存储器连接,用于通过执行存储在所述存储器上的计算机可执行指令,能够实现前述一个或多个技术方案提供的表格识别方法,例如,例如,如图1、图2、图3及图5所示的方法。
该存储器可为各种类型的存储器,可为随机存储器、只读存储器、闪存等。所述存储器可用于信息存储,例如,存储计算机可执行指令等。所述计算机可执行指令可为各种程序指令,例如,目标程序指令和/或源程序指令等。
所述处理器可为各种类型的处理器,例如,中央处理器、微处理器、数字信号处理器、可编程阵列、数字信号处理器、专用集成电路或图像处理器等。
所述处理器可以通过总线与所述存储器连接。所述总线可为集成电路总线等。
在一些实施例中,所述图像设备还可包括:通信接口,该通信接口可包括:网络接口、例如,局域网接口、收发天线等。所述通信接口同样与所述处理器连接,能够用于信息收发。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种表格识别方法,其特征在于,包括:
检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;
根据所述表格结构信息绘制第二表格;
将所述文本信息填充到第二表格中。
2.根据权利要求1所述的方法,其特征在于,
所述检测待处理图像中第一表格的表格结构获得表格结构信息,包括:
检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息;
所述根据所述表格结构信息绘制第二表格,包括:
根据所述单元格信息绘制所述第二表格。
3.根据权利要求2所述的方法,其特征在于,
所述检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息,包括:
检测所述第一表格的表格结构,获得单元格的中心点坐标及单元格的尺寸参数。
4.根据权利要求2所述的方法,其特征在于,
所述检测所述第一表格的表格结构,获得表征所述表格结构的单元格信息,包括:
检测所述第一表格的表格结构,获得单元格的中心点坐标、尺寸参数及置信度。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
校正所述单元格信息;
所述根据所述单元格信息绘制所述第二表格,包括:
利用校正后的所述单元格信息,绘制所述第二表格。
6.根据权利要求5所述的方法,其特征在于,
所述校正所述单元格信息,包括:
根据所述单元格信息,确定是否存在重叠状况达到重叠删除条件的单元格;
若存在重叠状况达到重叠删除条件的单元格,保留从重叠的单元格所对应的单元格信息中选择置信度最高的单元格所对应的单元格信息。
7.根据权利要求1至5任一项所述的方法,其特征在于,
所述检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息,包括:
将包含有所述第一表格的待处理图像输入到深度学习模型中,由所述深度学习模型的特征提取模块输出第一特征图;
利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构信息;
利用所述深度学习模型的第二分支模块检测所述第一特征图,获得所述文本信息。
8.根据权利要求7所述的方法,其特征在于,
所述利用所述深度学习模型的第一分支模块检测所述第一特征图,获得所述第一表格的表格结构,包括:
所述第一分支模块对所述第一特征图进行特征提取,获得突出第一类特征且抑制第二类特征的第二特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;
基于所述第二特征图和待处理图像,确定所述第一表格包括的单元格的中心点坐标及在所述第二特征图上的区域;
基于所述中心点坐标与表征所述第一特征的像素之间的偏移量,获得第一单元格信息,其中,所述第一单元格信息包括:中心点坐标、尺寸参数及置信度;
基于所述置信度,确定出用于绘制所述第二表格的第二单元格信息。
9.根据权利要求7所述的方法,其特征在于,所述利用所述深度学习模型的第二分支模块检测所述第一特征图,获得所述文本信息,包括:
利用所述第二分支模块对所述第一特征图进行特征提取,获得突出第二类特征且抑制第一类特征的第三特征图,其中,所述第一类特征为表征所述表格结构的特征;所述第二类特征包括表征所述表格内容的特征;
根据所述第三特征图确定待处理图像中所述表格内容所在的内容区域;
识别所述内容区域的表格内容,获得所述表格内容对应的文本信息。
10.一种表格识别装置,其特征在于,包括:
检测模块,用于检测待处理图像中第一表格的表格结构获得表格结构信息,并识别第一表格的表格内容获得与所述表格内容相对应的文本信息;
绘制模块,用于根据所述表格结构信息绘制第二表格;
填充模块,用于将所述文本信息填充到第二表格中。
11.一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够实现权利要求1至9任一项提供的方法。
CN201811261560.7A 2018-10-26 2018-10-26 表格识别方法及装置、计算机存储介质 Active CN109522816B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811261560.7A CN109522816B (zh) 2018-10-26 2018-10-26 表格识别方法及装置、计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811261560.7A CN109522816B (zh) 2018-10-26 2018-10-26 表格识别方法及装置、计算机存储介质

Publications (2)

Publication Number Publication Date
CN109522816A true CN109522816A (zh) 2019-03-26
CN109522816B CN109522816B (zh) 2021-07-02

Family

ID=65774171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811261560.7A Active CN109522816B (zh) 2018-10-26 2018-10-26 表格识别方法及装置、计算机存储介质

Country Status (1)

Country Link
CN (1) CN109522816B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993112A (zh) * 2019-03-29 2019-07-09 杭州睿琪软件有限公司 一种图片中表格的识别方法及装置
CN110008923A (zh) * 2019-04-11 2019-07-12 网易有道信息技术(北京)有限公司 图像处理方法和训练方法、以及装置、介质、计算设备
CN110147774A (zh) * 2019-05-23 2019-08-20 阳光保险集团股份有限公司 表格式图片版面分析方法和计算机存储介质
CN110287854A (zh) * 2019-06-20 2019-09-27 北京百度网讯科技有限公司 表格的提取方法、装置、计算机设备和存储介质
CN110796031A (zh) * 2019-10-11 2020-02-14 腾讯科技(深圳)有限公司 基于人工智能的表格识别方法、装置及电子设备
CN111209800A (zh) * 2019-12-23 2020-05-29 东软集团股份有限公司 表格内容变更识别方法、装置、存储介质及电子设备
CN111444922A (zh) * 2020-03-27 2020-07-24 Oppo广东移动通信有限公司 图片处理方法、装置、存储介质及电子设备
CN111460959A (zh) * 2020-03-27 2020-07-28 北京大学 一种单据管理的方法及相关装置
CN111667556A (zh) * 2020-06-22 2020-09-15 深圳壹账通智能科技有限公司 表格矫正方法及装置
CN111797838A (zh) * 2019-04-08 2020-10-20 上海怀若智能科技有限公司 一种图片类文档盲去噪系统、方法及装置
CN111859874A (zh) * 2019-04-17 2020-10-30 百度在线网络技术(北京)有限公司 表格生成方法及其系统、视频播放设备和计算机可读介质
CN111914805A (zh) * 2020-08-18 2020-11-10 科大讯飞股份有限公司 表格结构化方法、装置、电子设备及存储介质
CN111949184A (zh) * 2019-05-16 2020-11-17 珠海金山办公软件有限公司 一种新建文档的方法及装置
WO2020250164A1 (en) * 2019-06-13 2020-12-17 International Business Machines Corporation Dynamic synchronized image text localization
CN112115884A (zh) * 2020-09-22 2020-12-22 北京一览群智数据科技有限责任公司 一种表格识别方法及其系统
CN112115774A (zh) * 2020-08-07 2020-12-22 北京来也网络科技有限公司 结合rpa和ai的文字识别方法、装置、电子设备和存储介质
CN112200117A (zh) * 2020-10-22 2021-01-08 长城计算机软件与系统有限公司 表格识别方法及装置
CN112528813A (zh) * 2020-12-03 2021-03-19 上海云从企业发展有限公司 表格识别方法、装置以及计算机可读存储介质
CN112581699A (zh) * 2020-12-23 2021-03-30 华言融信科技成都有限公司 信用报告自助解读设备
CN113449559A (zh) * 2020-03-26 2021-09-28 顺丰科技有限公司 一种表格识别方法、装置、计算机设备和存储介质
CN113496117A (zh) * 2020-04-02 2021-10-12 北京庖丁科技有限公司 交叉检查表格中单元格数字内容的方法和电子设备
CN113627350A (zh) * 2021-08-12 2021-11-09 北京百度网讯科技有限公司 一种表格检测方法、装置、设备以及存储介质
CN115249362A (zh) * 2022-09-20 2022-10-28 京华信息科技股份有限公司 基于像素在稳定方向上连通性的ocr表格识别方法及系统
US11651150B2 (en) 2019-09-18 2023-05-16 Tata Consultancy Services Limited Deep learning based table detection and associated data extraction from scanned image documents

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246549A (zh) * 2007-02-16 2008-08-20 富士通株式会社 用于识别图像信息中的边界线的方法和装置
CN101447017A (zh) * 2008-11-27 2009-06-03 浙江工业大学 一种基于版面分析的选票快速识别统计方法及系统
CN101833546A (zh) * 2009-03-10 2010-09-15 株式会社理光 从可移植电子文档中提取表格的方法和装置
CN101908136A (zh) * 2009-06-08 2010-12-08 比亚迪股份有限公司 一种表格识别处理方法及系统
CN101944179A (zh) * 2009-07-01 2011-01-12 佳能株式会社 图像处理装置和图像处理方法
CN104517112A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 一种表格识别方法与系统
CN106156761A (zh) * 2016-08-10 2016-11-23 北京交通大学 面向移动终端拍摄的图像表格检测与识别方法
CN106407883A (zh) * 2016-08-10 2017-02-15 北京工业大学 一种复杂表格及其内部手写数字识别方法
US20170371862A1 (en) * 2016-06-28 2017-12-28 International Business Machines Corporation Hybrid approach for short form detection and expansion to long forms
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别系统及计算机装置
CN108491788A (zh) * 2018-03-20 2018-09-04 上海眼控科技股份有限公司 一种用于财务报表单元格的智能提取方法及装置
CN110163030A (zh) * 2018-02-11 2019-08-23 鼎复数据科技(北京)有限公司 一种基于图像信息的pdf有边框表格抽取方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246549A (zh) * 2007-02-16 2008-08-20 富士通株式会社 用于识别图像信息中的边界线的方法和装置
CN101447017A (zh) * 2008-11-27 2009-06-03 浙江工业大学 一种基于版面分析的选票快速识别统计方法及系统
CN101833546A (zh) * 2009-03-10 2010-09-15 株式会社理光 从可移植电子文档中提取表格的方法和装置
CN101908136A (zh) * 2009-06-08 2010-12-08 比亚迪股份有限公司 一种表格识别处理方法及系统
CN101944179A (zh) * 2009-07-01 2011-01-12 佳能株式会社 图像处理装置和图像处理方法
CN104517112A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 一种表格识别方法与系统
US20170371862A1 (en) * 2016-06-28 2017-12-28 International Business Machines Corporation Hybrid approach for short form detection and expansion to long forms
CN106156761A (zh) * 2016-08-10 2016-11-23 北京交通大学 面向移动终端拍摄的图像表格检测与识别方法
CN106407883A (zh) * 2016-08-10 2017-02-15 北京工业大学 一种复杂表格及其内部手写数字识别方法
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别系统及计算机装置
CN110163030A (zh) * 2018-02-11 2019-08-23 鼎复数据科技(北京)有限公司 一种基于图像信息的pdf有边框表格抽取方法
CN108491788A (zh) * 2018-03-20 2018-09-04 上海眼控科技股份有限公司 一种用于财务报表单元格的智能提取方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PENGSONG DUAN,AND ETC: "An effective recognition method for medical sheet based on deep learning approach", 《2017 12TH INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND EDUCATION (ICCSE)》 *
王行荣等: "手写表格识别系统研究和实现", 《计算机科学》 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993112A (zh) * 2019-03-29 2019-07-09 杭州睿琪软件有限公司 一种图片中表格的识别方法及装置
CN111797838A (zh) * 2019-04-08 2020-10-20 上海怀若智能科技有限公司 一种图片类文档盲去噪系统、方法及装置
CN110008923A (zh) * 2019-04-11 2019-07-12 网易有道信息技术(北京)有限公司 图像处理方法和训练方法、以及装置、介质、计算设备
CN110008923B (zh) * 2019-04-11 2021-07-27 网易有道信息技术(北京)有限公司 图像处理方法和训练方法、以及装置、介质、计算设备
CN111859874A (zh) * 2019-04-17 2020-10-30 百度在线网络技术(北京)有限公司 表格生成方法及其系统、视频播放设备和计算机可读介质
CN111949184B (zh) * 2019-05-16 2023-10-31 珠海金山办公软件有限公司 一种新建文档的方法及装置
CN111949184A (zh) * 2019-05-16 2020-11-17 珠海金山办公软件有限公司 一种新建文档的方法及装置
CN110147774A (zh) * 2019-05-23 2019-08-20 阳光保险集团股份有限公司 表格式图片版面分析方法和计算机存储介质
CN110147774B (zh) * 2019-05-23 2021-06-15 阳光保险集团股份有限公司 表格式图片版面分析方法和计算机存储介质
US11347381B2 (en) 2019-06-13 2022-05-31 International Business Machines Corporation Dynamic synchronized image text localization
WO2020250164A1 (en) * 2019-06-13 2020-12-17 International Business Machines Corporation Dynamic synchronized image text localization
GB2599823A (en) * 2019-06-13 2022-04-13 Ibm Dynamic synchronized image text localization
CN110287854A (zh) * 2019-06-20 2019-09-27 北京百度网讯科技有限公司 表格的提取方法、装置、计算机设备和存储介质
US11651150B2 (en) 2019-09-18 2023-05-16 Tata Consultancy Services Limited Deep learning based table detection and associated data extraction from scanned image documents
CN110796031A (zh) * 2019-10-11 2020-02-14 腾讯科技(深圳)有限公司 基于人工智能的表格识别方法、装置及电子设备
CN110796031B (zh) * 2019-10-11 2024-08-02 腾讯科技(深圳)有限公司 基于人工智能的表格识别方法、装置及电子设备
CN111209800B (zh) * 2019-12-23 2023-04-28 东软集团股份有限公司 表格内容变更识别方法、装置、存储介质及电子设备
CN111209800A (zh) * 2019-12-23 2020-05-29 东软集团股份有限公司 表格内容变更识别方法、装置、存储介质及电子设备
CN113449559A (zh) * 2020-03-26 2021-09-28 顺丰科技有限公司 一种表格识别方法、装置、计算机设备和存储介质
CN111460959A (zh) * 2020-03-27 2020-07-28 北京大学 一种单据管理的方法及相关装置
WO2021190146A1 (zh) * 2020-03-27 2021-09-30 Oppo广东移动通信有限公司 图片处理方法、装置、存储介质及电子设备
CN111444922A (zh) * 2020-03-27 2020-07-24 Oppo广东移动通信有限公司 图片处理方法、装置、存储介质及电子设备
CN113496117B (zh) * 2020-04-02 2024-03-12 北京庖丁科技有限公司 交叉检查表格中单元格数字内容的方法和电子设备
CN113496117A (zh) * 2020-04-02 2021-10-12 北京庖丁科技有限公司 交叉检查表格中单元格数字内容的方法和电子设备
CN111667556A (zh) * 2020-06-22 2020-09-15 深圳壹账通智能科技有限公司 表格矫正方法及装置
CN112115774A (zh) * 2020-08-07 2020-12-22 北京来也网络科技有限公司 结合rpa和ai的文字识别方法、装置、电子设备和存储介质
CN111914805A (zh) * 2020-08-18 2020-11-10 科大讯飞股份有限公司 表格结构化方法、装置、电子设备及存储介质
CN112115884A (zh) * 2020-09-22 2020-12-22 北京一览群智数据科技有限责任公司 一种表格识别方法及其系统
CN112200117A (zh) * 2020-10-22 2021-01-08 长城计算机软件与系统有限公司 表格识别方法及装置
CN112200117B (zh) * 2020-10-22 2023-10-13 长城计算机软件与系统有限公司 表格识别方法及装置
CN112528813B (zh) * 2020-12-03 2021-07-23 上海云从企业发展有限公司 表格识别方法、装置以及计算机可读存储介质
CN112528813A (zh) * 2020-12-03 2021-03-19 上海云从企业发展有限公司 表格识别方法、装置以及计算机可读存储介质
CN112581699A (zh) * 2020-12-23 2021-03-30 华言融信科技成都有限公司 信用报告自助解读设备
CN113627350A (zh) * 2021-08-12 2021-11-09 北京百度网讯科技有限公司 一种表格检测方法、装置、设备以及存储介质
CN115249362B (zh) * 2022-09-20 2022-12-27 京华信息科技股份有限公司 基于像素在稳定方向上连通性的ocr表格识别方法及系统
CN115249362A (zh) * 2022-09-20 2022-10-28 京华信息科技股份有限公司 基于像素在稳定方向上连通性的ocr表格识别方法及系统

Also Published As

Publication number Publication date
CN109522816B (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN109522816A (zh) 表格识别方法及装置、计算机存储介质
CN109993112B (zh) 一种图片中表格的识别方法及装置
CN108710865B (zh) 一种基于神经网络的司机异常行为检测方法
CN108171297B (zh) 一种答题卡识别方法
CN110032998B (zh) 自然场景图片的文字检测方法、系统、装置和存储介质
EP3660733A1 (en) Method and system for information extraction from document images using conversational interface and database querying
US5907631A (en) Document image processing method and system having function of determining body text region reading order
CN112818812A (zh) 图像中表格信息的识别方法、装置、电子设备及存储介质
CN109726628A (zh) 一种表格图像的识别方法及系统
CN109933756A (zh) 基于ocr的图像转档方法、装置、设备及可读存储介质
US20190019055A1 (en) Word segmentation system, method and device
CN112200117B (zh) 表格识别方法及装置
US12056171B2 (en) System and method for automated information extraction from scanned documents
CN108563984B (zh) 一种流程模型图的自动识别与理解方法
CN112733639A (zh) 文本信息结构化提取方法及装置
CN110309843B (zh) 一种电力设备图像中多类部件的自动识别方法
CN112712014A (zh) 表格图片结构解析方法、系统、设备和可读存储介质
CN111652266A (zh) 用户界面组件的识别方法、装置、电子设备和存储介质
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN114120345A (zh) 信息提取方法、装置、设备及存储介质
CN115546809A (zh) 基于单元格约束的表格结构识别方法及其应用
CN114863408A (zh) 文档内容分类方法、系统、装置及计算机可读存储介质
CN112380812A (zh) Pdf不完整框线表格提取方法、装置、设备及存储介质
CN113269153B (zh) 一种表格识别方法以及装置
CN110210467A (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant