CN109635729A - 一种表格识别方法及终端 - Google Patents

一种表格识别方法及终端 Download PDF

Info

Publication number
CN109635729A
CN109635729A CN201811515989.4A CN201811515989A CN109635729A CN 109635729 A CN109635729 A CN 109635729A CN 201811515989 A CN201811515989 A CN 201811515989A CN 109635729 A CN109635729 A CN 109635729A
Authority
CN
China
Prior art keywords
cell
obtains
key
form image
electronics shelves
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811515989.4A
Other languages
English (en)
Other versions
CN109635729B (zh
Inventor
郭国强
周文贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Shang Ji Network Technology Co Ltd
Original Assignee
Xiamen Shang Ji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Shang Ji Network Technology Co Ltd filed Critical Xiamen Shang Ji Network Technology Co Ltd
Priority to CN201811515989.4A priority Critical patent/CN109635729B/zh
Publication of CN109635729A publication Critical patent/CN109635729A/zh
Application granted granted Critical
Publication of CN109635729B publication Critical patent/CN109635729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明涉及一种表格识别方法及终端,属于数据处理领域。本发明通过S1、扫描一纸质表格,转换得到一电子档表格并输出;S2、为所述一电子档表格中的每一单元格设置编号;S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;S5、重复执行S3至S4,直至所有单元格均被遍历。实现了将纸质表格转化为结构化数据。

Description

一种表格识别方法及终端
技术领域
本发明涉及一种表格识别方法及终端,属于数据处理领域。
背景技术
申请号为201710813108.6的专利文献提供一种表格识别方法、识别系统、计算机装置及计算机可读存储介质,表格识别方法包括:建立深度学习模型;获取表格图片,将表格图片横向切割为多个横向图片;通过深度学习模型,识别每个横向图片是否包含直线,获取包含直线的横向图片;纵向切割包含直线的横向图片,得到多个区块;根据多个区块组成表格,定位表格内文字并识别文字内容。通过利用建立好的深度学习模型进行表格的识别,提高了表格识别的效率以及准确率。
但是,上述专利文献提供的表格识别方法得到的识别结果是非结构化数据,具体表现为一个个不知其具体含义的文字,无法将识别结果应用于具体的业务场景中。
发明内容
本发明所要解决的技术问题是:如何将纸质表格转化为结构化数据。
为了解决上述技术问题,本发明采用的技术方案为:
本发明提供一种表格识别方法,包括:
S1、扫描一纸质表格,转换得到一电子档表格并输出;
S2、为所述一电子档表格中的每一单元格设置编号;
S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;
S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;
S5、重复执行S3至S4,直至所有单元格均被遍历。
本发明还提供一种表格识别终端,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
S1、扫描一纸质表格,转换得到一电子档表格并输出;
S2、为所述一电子档表格中的每一单元格设置编号;
S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;
S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;
S5、重复执行S3至S4,直至所有单元格均被遍历。
本发明具有如下有益效果:本发明通过将扫描纸质表格得到的电子档表格中的每一单元格进行编号,并逐一识别每一单元格的内容,从而将单元格编号与单元格内容一一对应,得到结构化数据。区别于现有技术,表格识别结果为不知具体含义的非结构化数据,工作人员难以根据识别结果进行进一步的业务操作,而本发明提供的方法所得到的识别结果为结构化数据,在具体的业务场景中,工作人员可根据单元格编号调用、采集、统计与业务逻辑关联的具体数据,充分利用了表格识别的结果,为工作人员进一步对纸质表格呈现的数据进行分析提供了极大地便利。
附图说明
图1为本发明提供的一种表格识别方法的具体实施方式的流程框图;
图2为本发明提供的一种表格识别终端的具体实施方式的结构框图;
标号说明:
1、处理器;2、存储器。
具体实施方式
下面结合附图和具体实施例来对本发明进行详细的说明。
请参照图1至图2,
如图1所示,本发明提供一种表格识别方法,包括:
S1、扫描一纸质表格,转换得到一电子档表格并输出;
S2、为所述一电子档表格中的每一单元格设置编号;
S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;
S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;
S5、重复执行S3至S4,直至所有单元格均被遍历。
进一步地,还包括:
重复执行S1至S5,直至预设张纸质表格均已被扫描,得到结构化数据集合;
预设一单元格编号,得到特定编号;
从所述结构化数据集合中获取与所述特定编号对应的一个以上结构化数据,得到第一结构化数据集合。
由上述描述可知,由于工作人员根据统一的编号规则可快速地、清晰地获知每一单元格编号所表示的实际业务意义,因此,本发明根据工作人员预设的一单元格编号,获取与该单元格编号对应的所有结构化数据,实现了采集、统计所有纸质表格的同一具体业务数据。工作人员还可根据业务需要对采集到的业务数据进行进一步数据处理,极大地提高了工作人员对纸质表格中呈现的数据进行数据分析、处理等工作操作的效率。
进一步地,所述S2具体为:
获取每一单元格的左上角坐标;
根据所述左上角坐标排列所述一电子档表格中的所有单元格,得到单元格队列;
所述单元格队列中各单元格的编号按顺序依次递增。
由上述描述可知,通过单元格的左上角坐标对表格中的所有单元格进行排序,从而可依次将复杂表格中的各个单元格转化为结构化数据,提高了复杂表格转化为结构化数据的准确度,同时,这种从左到右从上到下的编号方式符合人们的习惯,有利于工作人员快速获知不同单元格编号所代表的具体业务含义。
进一步地,所述S3之前,还包括:
分割所述一电子档表格,得到多个单元格图像;一所述单元格图像与所述一电子档表格中的一单元格对应。
进一步地,还包括:
获取与多个所述单元格对应的结构化数据,得到第二结构化数据集合;
封装所述第二结构化数据集合,得到响应报文。
由上述描述可知,将纸质表格中的内容转换为单元格编号与单元格内容一一对应的结构化数据,便于工作人员根据具体的业务需求调用纸质表格中特定单元格的数据进行进一步的数据分析处理工作。。
进一步地,所述S1具体为:
扫描一纸质表格,得到第一表格图像;
对所述第一表格图像进行RGB图像灰度化处理,得到第二表格图像;
根据Canny算子提取所述第二表格图像的边缘,得到边缘集合;
遍历所述边缘集合,计算得到与所述第二表格图像对应的倾斜角度;
根据所述倾斜角度旋转所述第二表格图像,得到所述一电子档表格。
由上述描述可知,将扫描得到的第一表格图像旋转至正中位置,使得后续分割操作更加精准,有利于提高单元格内容识别的准确度。同时,有利于使后续的编号设置与工作人员使用同一规则对纸质表格进行编号的结果相同,对工作人员进行后续的业务分析的准确度提供重要保障。
如图2所示,本发明还提供一种表格识别终端,包括一个或多个处理器1及存储器2,所述存储器2存储有程序,并且被配置成由所述一个或多个处理器1执行以下步骤:
S1、扫描一纸质表格,转换得到一电子档表格并输出;
S2、为所述一电子档表格中的每一单元格设置编号;
S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;
S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;
S5、重复执行S3至S4,直至所有单元格均被遍历。
进一步地,还包括:
重复执行S1至S5,直至预设张纸质表格均已被扫描,得到结构化数据集合;
预设一单元格编号,得到特定编号;
从所述结构化数据集合中获取与所述特定编号对应的一个以上结构化数据,得到第一结构化数据集合。
进一步地,
所述S2具体为:获取每一单元格的左上角坐标;根据所述左上角坐标排列所述一电子档表格中的所有单元格,得到单元格队列;所述单元格队列中各单元格的编号按顺序依次递增;
所述S3之前,还包括:分割所述一电子档表格,得到多个单元格图像;一所述单元格图像与所述一电子档表格中的一单元格对应;
还包括:获取与多个所述单元格对应的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。。
进一步地,所述S1具体为:
扫描一纸质表格,得到第一表格图像;
对所述第一表格图像进行RGB图像灰度化处理,得到第二表格图像;
根据Canny算子提取所述第二表格图像的边缘,得到边缘集合;
遍历所述边缘集合,计算得到与所述第二表格图像对应的倾斜角度;
根据所述倾斜角度旋转所述第二表格图像,得到所述一电子档表格。
本发明的实施例一为:
本实施例提供一种表格识别方法,包括:
S1、扫描一纸质表格,转换得到一电子档表格并输出。具体为:
S11、扫描一纸质表格,转换得到第一表格图像并输出;
S12、对所述第一表格图像进行RGB图像灰度化处理,得到第二表格图像;
S13、根据Canny算子提取所述第二表格图像的边缘,得到边缘集合;
其中,Canny算子是一个多级边缘检测算法。主要包括以下几个步骤:
(1)降噪。任何边缘检测算法都不可能在未经处理的原始数据上很好地处理,所以第一步是对原始数据与高斯平滑模板作卷积,得到的图像与原始图像相比有些轻微的模糊。这样,单独的一个像素噪声在经过高斯平滑的图像上变得几乎没有影响。
(2)寻找梯度。图像中的边缘可能会指向不同的方向,所以Canny算法使用4个mask检测水平、垂直以及对角线方向的边缘。原始图像与每个mask所作的卷积都存储起来。对于每个点我们都标识在这个点上的最大值以及生成的边缘的方向。这样我们就从原始图像生成了图像中每个点亮度梯度图以及亮度梯度的方向。
(3)跟踪边缘。较高的亮度梯度比较有可能是边缘,但是没有一个确切的值来限定多大的亮度梯度是边缘多大又不是,所以Canny使用了滞后阈值。
滞后阈值需要两个阈值——高阈值与低阈值。假设图像中的重要边缘都是连续的曲线,这样我们就可以跟踪给定曲线中模糊的部分,并且避免将没有组成曲线的噪声像素当成边缘。所以我们从一个较大的阈值开始,这将标识出我们比较确信的真实边缘,使用前面导出的方向信息,我们从这些真正的边缘开始在图像中跟踪整个的边缘。在跟踪的时候,我们使用一个较小的阈值,这样就可以跟踪曲线的模糊部分直到我们回到起点。
一旦这个过程完成,我们就得到了一个二值图像,每点表示是否是一个边缘点。
S14、遍历所述边缘集合,计算得到与所述第二表格图像对应的倾斜角度;
S15、根据所述倾斜角度旋转所述第二表格图像,得到所述一电子档表格。
S2、为所述一电子档表格中的每一单元格设置编号。具体为:
S21、获取每一单元格的左上角坐标;
S22、根据所述左上角坐标排列所述一电子档表格中的所有单元格,得到单元格队列;
可选地,所述左上角坐标为(x,y),x表示单元格的左边线与整个表格图像最左边缘之间的距离,y表示单元格的顶边线与整个表格图像最顶边缘之间的距离。排列时先比较x坐标,再比较y坐标。
S23、所述单元格队列中各单元格的编号按顺序依次递增。
例如,为一电子档表格中的每一单元格设置编号的结果如下表所示。单元格5的左上角坐标为(20,1),单元格6的左上角坐标为(25,1),单元格7的左上角坐标为(25,4)。在排序时,先比较x坐标,因此单元格5排在单元格6和7之前,在单元格的x坐标相同的情况下,以y坐标为排序基准,因此单元格6排列在单元格7之前。
S3、分割所述一电子档表格,得到多个单元格图像;一所述单元格图像与所述一电子档表格中的一单元格对应。
S4、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果。具体为:
获取一单元格图像;
利用OCR识别技术识别所述一单元格图像,得到识别结果。
其中,将电子档表格分割成若干个单元格图像,在OCR识别的过程中,一次识别一个单元格图像,极大程度上减少了待识别单元格之外的干扰因素,有利于提高OCR识别的准确性。
S5、根据所述识别结果和所述一单元格的编号生成一结构化数据。
例如,单元格2的识别结果为张三,则与单元格2对应的结构化数据为:
S6、重复执行S4至S5,直至所有单元格均被遍历。
S7、重复执行S1至S6,直至预设张纸质表格均已被扫描,得到结构化数据集合。
S8、预设一单元格编号,得到特定编号;从所述结构化数据集合中获取与所述特定编号对应的一个以上结构化数据,得到第一结构化数据集合。
例如,纸质表格为工资条凭证,工作人员需统计本月支出的工资总额。工作人员将所有员工的纸质工资条凭证扫描,得到多个电子档表格,通过本实施例提供的识别方法采集到纸质工资条凭证上的所有数据信息。根据编号规则,工作人员清晰可知编号为4的单元格中所填写的内容即某员工的本月工资金额,因此,工作人员只需输入单元格编号4,即可获取各个员工的本月工资金额,通过对应的业务逻辑统计所采集到的数据即可快速得到本月支出的工资总额。
S9、获取与多个所述单元格对应的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
其中,所述结构化数据包括单元格编号、单元格内容和单元格位置信息。
可选地,获取与所述一纸质表格对应的所有单元格的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
例如,一纸质表格对应的响应报文的主体数据如下所示:
其中,该纸质表格包括两个单元格,第一个单元格的编号为1,单元格的文字内容为"检05",单元格的位置信息为:"left":296,"top":363,"width":282,"height":281;第二个单元格的编号为2,单元格的文字内容为"管道焊缝超声波检测报告",单元格的位置信息为:"left":589,"top":363,"width":995,"height":282。工作人员可根据响应报文携带的结构化数据对一张纸质表格对应的数据进行进一步分析、数据处理等工作。工作人员还可根据单元格的位置信息确认人工编号与计算机程序自动编号是否相符,以保证特定数据调用的正确性。
可选地,获取与所述预设张纸质表格对应的所有单元格的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
其中,将本次扫描的所有纸质表格内容封装成响应报文,便于工作人员通过响应报文对纸质表格中同一单元格的数据进行统计。
由上述描述可知,在许多图像应用场景中,使用非结构化识别后结果为一堆没有意义的文字,无法将识别结果应用于实际业务场景中。而结构化数据则是返回文字+文字的属性或类型,如工牌上的文字包括:姓名、工号、公司名称,清楚知道哪些文字代表“姓名”,哪些文字代表“工号”,哪些文字代表“公司名称”,从而能服务于具体的生产应用。本实施例通过把表格图像按单元格方式进行分解和识别,使表格图像的识别最有非常好的适应性,再加上去干扰和倾斜校正技术的应用,使对低质表格图像的OCR格式化识别效果得到了有效的保证。通过单元格分解、切割和编号后,图像变成一个个带编号的碎片图像,然后再提交进行OCR识别,使任意复杂结构的表格图像可以轻意的转换成结构化的识别结果数据。
本发明提供的实施例二为:
本实施例提供一种表格识别终端,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
S1、扫描一纸质表格,转换得到一电子档表格并输出。具体为:
S11、扫描一纸质表格,转换得到第一表格图像并输出;
S12、对所述第一表格图像进行RGB图像灰度化处理,得到第二表格图像;
S13、根据Canny算子提取所述第二表格图像的边缘,得到边缘集合;
S14、遍历所述边缘集合,计算得到与所述第二表格图像对应的倾斜角度;
S15、根据所述倾斜角度旋转所述第二表格图像,得到所述一电子档表格。
S2、为所述一电子档表格中的每一单元格设置编号。具体为:
S21、获取每一单元格的左上角坐标;
S22、根据所述左上角坐标排列所述一电子档表格中的所有单元格,得到单元格队列;
可选地,所述左上角坐标为(x,y),x表示单元格的左边线与整个表格图像最左边缘之间的距离,y表示单元格的顶边线与整个表格图像最顶边缘之间的距离。排列时先比较x坐标,再比较y坐标。
S23、所述单元格队列中各单元格的编号按顺序依次递增。
例如,为一电子档表格中的每一单元格设置编号的结果如下表所示。单元格5的左上角坐标为(20,1),单元格6的左上角坐标为(25,1),单元格7的左上角坐标为(25,4)。在排序时,先比较x坐标,因此单元格5排在单元格6和7之前,在单元格的x坐标相同的情况下,以y坐标为排序基准,因此单元格6排列在单元格7之前。
S3、分割所述一电子档表格,得到多个单元格图像;一所述单元格图像与所述一电子档表格中的一单元格对应。
S4、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果。具体为:
获取一单元格图像;
利用OCR识别技术识别所述一单元格图像,得到识别结果。
其中,将电子档表格分割成若干个单元格图像,在OCR识别的过程中,一次识别一个单元格图像,极大程度上减少了待识别单元格之外的干扰因素,有利于提高OCR识别的准确性。
S5、根据所述识别结果和所述一单元格的编号生成一结构化数据。
例如,单元格2的识别结果为张三,则与单元格2对应的结构化数据为:
S6、重复执行S4至S5,直至所有单元格均被遍历。
S7、重复执行S1至S6,直至预设张纸质表格均已被扫描,得到结构化数据集合。
S8、预设一单元格编号,得到特定编号;从所述结构化数据集合中获取与所述特定编号对应的一个以上结构化数据,得到第一结构化数据集合。
例如,纸质表格为工资条凭证,工作人员需统计本月支出的工资总额。工作人员将所有员工的纸质工资条凭证扫描,得到多个电子档表格,通过本实施例提供的识别方法采集到纸质工资条凭证上的所有数据信息。根据编号规则,工作人员清晰可知编号为4的单元格中所填写的内容即某员工的本月工资金额,因此,工作人员只需输入单元格编号4,即可获取各个员工的本月工资金额,通过对应的业务逻辑统计所采集到的数据即可快速得到本月支出的工资总额。
S9、获取与多个所述单元格对应的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
其中,所述结构化数据包括单元格编号、单元格内容和单元格位置信息。
可选地,获取与所述一纸质表格对应的所有单元格的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
例如,一纸质表格对应的响应报文的主体数据如下所示:
其中,该纸质表格包括两个单元格,第一个单元格的编号为1,单元格的文字内容为"检05",单元格的位置信息为:"left":296,"top":363,"width":282,"height":281;第二个单元格的编号为2,单元格的文字内容为"管道焊缝超声波检测报告",单元格的位置信息为:"left":589,"top":363,"width":995,"height":282。工作人员可根据响应报文携带的结构化数据对一张纸质表格对应的数据进行进一步分析、数据处理等工作。
可选地,获取与所述预设张纸质表格对应的所有单元格的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
其中,将本次扫描的所有纸质表格内容封装成响应报文,便于工作人员通过响应报文对所有纸质表格中同一单元格的数据进行统计。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种表格识别方法,其特征在于,包括:
S1、扫描一纸质表格,转换得到一电子档表格并输出;
S2、为所述一电子档表格中的每一单元格设置编号;
S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;
S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;
S5、重复执行S3至S4,直至所有单元格均被遍历。
2.根据权利要求1所述的表格识别方法,其特征在于,还包括:
重复执行S1至S5,直至预设张纸质表格均已被扫描,得到结构化数据集合;
预设一单元格编号,得到特定编号;
从所述结构化数据集合中获取与所述特定编号对应的一个以上结构化数据,得到第一结构化数据集合。
3.根据权利要求1所述的表格识别方法,其特征在于,所述S2具体为:
获取每一单元格的左上角坐标;
根据所述左上角坐标排列所述一电子档表格中的所有单元格,得到单元格队列;
所述单元格队列中各单元格的编号按顺序依次递增。
4.根据权利要求1所述的表格识别方法,其特征在于,所述S3之前,还包括:
分割所述一电子档表格,得到多个单元格图像;一所述单元格图像与所述一电子档表格中的一单元格对应。
5.根据权利要求4所述的表格识别方法,其特征在于,还包括:
获取与多个所述单元格对应的结构化数据,得到第二结构化数据集合;
封装所述第二结构化数据集合,得到响应报文。
6.根据权利要求1所述的表格识别方法,其特征在,所述S1具体为:
扫描一纸质表格,得到第一表格图像;
对所述第一表格图像进行RGB图像灰度化处理,得到第二表格图像;
根据Canny算子提取所述第二表格图像的边缘,得到边缘集合;
遍历所述边缘集合,计算得到与所述第二表格图像对应的倾斜角度;
根据所述倾斜角度旋转所述第二表格图像,得到所述一电子档表格。
7.一种表格识别终端,其特征在于,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
S1、扫描一纸质表格,转换得到一电子档表格并输出;
S2、为所述一电子档表格中的每一单元格设置编号;
S3、调用OCR识别引擎识别其中一个单元格中的文字,得到识别结果;
S4、根据所述识别结果和所述一个单元格的编号生成一结构化数据;所述结构化数据包含两个键值对,一键值对的key为单元格编号,value为与所述一个单元格对应的编号;另一键值对的key为单元格内容,value为所述识别结果;
S5、重复执行S3至S4,直至所有单元格均被遍历。
8.根据权利要求7所述的表格识别终端,其特征在于,还包括:
重复执行S1至S5,直至预设张纸质表格均已被扫描,得到结构化数据集合;
预设一单元格编号,得到特定编号;
从所述结构化数据集合中获取与所述特定编号对应的一个以上结构化数据,得到第一结构化数据集合。
9.根据权利要求7所述的表格识别终端,其特征在于,
所述S2具体为:获取每一单元格的左上角坐标;根据所述左上角坐标排列所述一电子档表格中的所有单元格,得到单元格队列;所述单元格队列中各单元格的编号按顺序依次递增;
所述S3之前,还包括:分割所述一电子档表格,得到多个单元格图像;一所述单元格图像与所述一电子档表格中的一单元格对应;
还包括:获取与多个所述单元格对应的结构化数据,得到第二结构化数据集合;封装所述第二结构化数据集合,得到响应报文。
10.根据权利要求7所述的表格识别终端,其特征在,所述S1具体为:
扫描一纸质表格,得到第一表格图像;
对所述第一表格图像进行RGB图像灰度化处理,得到第二表格图像;
根据Canny算子提取所述第二表格图像的边缘,得到边缘集合;
遍历所述边缘集合,计算得到与所述第二表格图像对应的倾斜角度;
根据所述倾斜角度旋转所述第二表格图像,得到所述一电子档表格。
CN201811515989.4A 2018-12-12 2018-12-12 一种表格识别方法及终端 Active CN109635729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811515989.4A CN109635729B (zh) 2018-12-12 2018-12-12 一种表格识别方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811515989.4A CN109635729B (zh) 2018-12-12 2018-12-12 一种表格识别方法及终端

Publications (2)

Publication Number Publication Date
CN109635729A true CN109635729A (zh) 2019-04-16
CN109635729B CN109635729B (zh) 2022-02-08

Family

ID=66073160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811515989.4A Active CN109635729B (zh) 2018-12-12 2018-12-12 一种表格识别方法及终端

Country Status (1)

Country Link
CN (1) CN109635729B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062377A (zh) * 2019-12-18 2020-04-24 广东小天才科技有限公司 一种题号检测方法、系统、存储介质及电子设备
CN111967387A (zh) * 2020-08-17 2020-11-20 北京市商汤科技开发有限公司 表单识别方法、装置、设备及计算机可读存储介质
CN113569677A (zh) * 2021-07-16 2021-10-29 国网天津市电力公司 一种基于扫描件的纸质试验报告生成方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007129288A2 (en) * 2006-05-05 2007-11-15 Big River Limited Electronic document reformatting
US20110063653A1 (en) * 2007-11-19 2011-03-17 Kabushiki Kaisha Toshiba Image forming apparatus, image reading apparatus, and control method thereof
CN105184265A (zh) * 2015-09-14 2015-12-23 哈尔滨工业大学 一种基于自学习的手写表格数字字符串快速识别的方法
CN106156761A (zh) * 2016-08-10 2016-11-23 北京交通大学 面向移动终端拍摄的图像表格检测与识别方法
CN108805519A (zh) * 2018-05-18 2018-11-13 赵崇标 纸质日程表电子化生成方法、装置及电子日程表生成方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007129288A2 (en) * 2006-05-05 2007-11-15 Big River Limited Electronic document reformatting
US20110063653A1 (en) * 2007-11-19 2011-03-17 Kabushiki Kaisha Toshiba Image forming apparatus, image reading apparatus, and control method thereof
CN105184265A (zh) * 2015-09-14 2015-12-23 哈尔滨工业大学 一种基于自学习的手写表格数字字符串快速识别的方法
CN106156761A (zh) * 2016-08-10 2016-11-23 北京交通大学 面向移动终端拍摄的图像表格检测与识别方法
CN108805519A (zh) * 2018-05-18 2018-11-13 赵崇标 纸质日程表电子化生成方法、装置及电子日程表生成方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062377A (zh) * 2019-12-18 2020-04-24 广东小天才科技有限公司 一种题号检测方法、系统、存储介质及电子设备
CN111062377B (zh) * 2019-12-18 2024-02-23 广东小天才科技有限公司 一种题号检测方法、系统、存储介质及电子设备
CN111967387A (zh) * 2020-08-17 2020-11-20 北京市商汤科技开发有限公司 表单识别方法、装置、设备及计算机可读存储介质
CN111967387B (zh) * 2020-08-17 2023-05-26 北京市商汤科技开发有限公司 表单识别方法、装置、设备及计算机可读存储介质
CN113569677A (zh) * 2021-07-16 2021-10-29 国网天津市电力公司 一种基于扫描件的纸质试验报告生成方法

Also Published As

Publication number Publication date
CN109635729B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN109948510B (zh) 一种文档图像实例分割方法及装置
CN109657665B (zh) 一种基于深度学习的发票批量自动识别系统
CN110348294B (zh) Pdf文档中图表的定位方法、装置及计算机设备
CN106156761B (zh) 面向移动终端拍摄的图像表格检测与识别方法
CN110008809A (zh) 表格数据的获取方法、装置和服务器
US9235759B2 (en) Detecting text using stroke width based text detection
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN105930159A (zh) 一种基于图像的界面代码生成的方法及系统
CN109800761A (zh) 基于深度学习模型创建纸质文档结构化数据的方法和终端
CN108921166A (zh) 基于深度神经网络的医疗票据类文本检测识别方法及系统
CN108334848A (zh) 一种基于生成对抗网络的微小人脸识别方法
CN107944452A (zh) 一种圆形印章文字识别方法
US11790499B2 (en) Certificate image extraction method and terminal device
CN108334847A (zh) 一种真实场景下的基于深度学习的人脸识别方法
CN109635729A (zh) 一种表格识别方法及终端
CN108090511B (zh) 图像分类方法、装置、电子设备及可读存储介质
CN107133571A (zh) 一种将纸质发票自动生成财务报表的系统及方法
CN110516554A (zh) 一种多场景多字体中文文字检测识别方法
CN108416355A (zh) 一种基于机器视觉的工业现场生产数据的采集方法
CN109255300A (zh) 票据信息提取方法、装置、计算机设备及存储介质
CN104021419A (zh) 一种统计纸张数目的方法和装置
CN104318538B (zh) 一种二维序列帧图片拼接成大图片的方法及其所用的装置
US20230045715A1 (en) Text detection method, text recognition method and apparatus
WO2021168703A1 (zh) 字符处理及字符识别方法、存储介质和终端设备
CN112883926A (zh) 表格类医疗影像的识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant