CN110263682A - 基于轮廓提取的表格识别方法和装置、设备及存储介质 - Google Patents
基于轮廓提取的表格识别方法和装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110263682A CN110263682A CN201910481627.6A CN201910481627A CN110263682A CN 110263682 A CN110263682 A CN 110263682A CN 201910481627 A CN201910481627 A CN 201910481627A CN 110263682 A CN110263682 A CN 110263682A
- Authority
- CN
- China
- Prior art keywords
- described image
- contours extract
- image
- extraction
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于轮廓提取的表格识别方法、装置、设备及存储介质,该基于轮廓提取的表格识别方法包括:对输入的图像进行轮廓提取;根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;从所述图像中提取单元格;合并所提取的所有单元格形成初始表格图;对所述初始表格图进行修复;从所述图像中二次提取单元格;合并二次提取的所有单元格以形成最终表格图。该基于轮廓提取的表格识别方法、装置、设备及存储介质可以适用于各种类型的基于轮廓提取的表格识别,并且速度较快。
Description
技术领域
本发明总体地涉及图像识别技术领域,特别是涉及基于轮廓提取的表格识别方法和装置、设备及存储介质。
背景技术
随着数字化的发展,大量纸质化文档都需要生成数字化存储,而OCR识别是解决这一问题的有效方法,但传统的OCR对于表格内容的识别,得到的文本结果往往无法确定上下文的关系,也无法建立结构化数据。
目前的表格识别方法通常都是首先对图片灰度化再做二值化,然后分别对二值化图片做横向和纵向做腐蚀,以去除多余的文本内容,并分别得到横向和纵向的表格线图,然后把横向和纵向表格线图合并膨胀,即可得到完整的表格图。这种方法对于没有倾斜角度及前背景清晰的文本表格图片,有很好的提取效果。然而实际应用中的扫描图片常常会倾斜,而且图片清晰度前背景跨度等都不好,使用这种方法通常得不到理想的效果,有存在以下问题:一、前背景灰度有交叉时,二值化通常会留下部分背景,并且部分前景也被清除。二、如果图片倾斜则腐蚀处理时会导致表格线被腐蚀掉。三、扫描的图片清晰度及噪点会影响表格线,比如断线等,如果不做修复提取表格时会漏掉部分单元格。
存在对能够更准确的、适用性广的表格提取的技术的需要。
发明内容
鉴于上述情况,提出了本发明,可以适用于各种类型的基于轮廓提取的表格识别方法。
根据本发明的一个方面,提供了一种基于轮廓提取的表格识别方法,其包括:
对输入的图像进行轮廓提取;
根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;
从所述图像中提取单元格;
合并所提取的所有单元格形成初始表格图;
对所述初始表格图进行修复;
从所述图像中二次提取单元格;
合并二次提取的所有单元格以形成最终表格图。
在本发明一个实施例中,该方法还包括:
对所述图像进行预处理。
在本发明一个实施例中,所述预处理包括:
对所述图像进行灰度化;
对灰度化的所述图像进行降噪处理。
在本发明一个实施例中,对图像进行轮廓提取包括:提取所述图像中所有目标的轮廓,同时进行二值化处理。
在本发明一个实施例中,根据提取的轮廓判断所述图像是否倾斜包括:
统计从所述图像中提取的所有矩形轮廓的角度,并根据所有矩形轮廓的角度确定所述图像中表格的角度;
根据所述图像中表格的角度对所述图像进行纠偏。
在本发明一个实施例中,对所述初始表格图进行修复包括:。
判断表格线之间的间断的大小是否小于设定阈值;
如果表格线之间的间断的小于设定阈值,则连接该间断以形成修复的表格线。
在本发明一个实施例中,该方法还包括:
根据从所述图像中提取单元格的数量,判断所述图像中是否存在期望的表格;
如果判定所述图像中存在期望的表格,则继续合并所提取的所有单元格形成初始表格图,反之则输出不存在期望的表格的结果。
根据本发明另一方面,提供了一种基于轮廓提取的表格识别装置,其包括:
轮廓提取模块,其用于对输入的图像进行轮廓提取;
纠偏模块,其用于根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;
单元格提取模块,其用于从所述图像中提取单元格;
单元格合并模块,其用于合并所提取的所有单元格形成初始表格图;
单元格修复模块,其用于对所述初始表格图进行修复;
所述单元格提取模块还用于从所述图像中二次提取单元格;
所述单元格合并模块还用于合并二次提取的所有单元格以形成最终表格图。
在本发明一个实施例中,还包括:
预处理模块,其用于对所述图像进行预处理。
在本发明一个实施例中,所述预处理模块包括:
灰度化子模块,其用于使所述图像灰度化;
降噪子模块,其用于对灰度化的所述图像进行降噪处理。
在本发明一个实施例中,所述轮廓提取模块用于提取所述图像中所有目标的轮廓,同时进行二值化处理。
在本发明一个实施例中,所述纠偏判断模块包括:
角度确定子模块,其用于统计从所述图像中提取的所有矩形轮廓的角度,并根据所有矩形轮廓的角度确定所述图像中表格的角度;
图像纠偏子模块,其用于根据所述图像中表格的角度对所述图像进行纠偏。
在本发明一个实施例中,所述单元格修复模块用于判断表格线之间的间断的大小是否小于设定阈值,以及在所述表格线之间的间断的小于设定阈值时连接该间断以形成修复的表格线。
在本发明一个实施例中,还包括:
判断模块,其用于根据从所述图像中提取单元格的数量,判断所述图像中是否存在期望的表格;
如果所述判断模块判定所述图像中存在期望的表格,则所述单元格合并模块继续合并所提取的所有单元格形成初始表格图,反之则输出不存在期望的表格的结果。
根据本发明再一方面,提供了一种基于轮廓提取的表格识别设备,能够对图像进行纠偏,所述基于轮廓提取的表格识别设备具有存储器和处理器,所述存储器中存储有用于进行基于轮廓提取的表格识别的计算机可执行指令,所述计算机可执行指令被处理器执行时,可操作来执行上述的基于轮廓提取的表格识别方法。
根据本发明再一方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时可操作来执行上述的基于轮廓提取的表格识别方法。
本发明实施例提供的基于轮廓提取的表格识别方法和装置、设备及存储介质,首先通过轮廓提取来获得图像中所有目标的轮廓,然后根据提取的轮廓判断图像是否倾斜,如果倾斜则进行纠偏,随后从图像中提取单元格,并合并单元格形成初始表格,随后对初始表格进行修复、二次提取和合并来得到最终表格,这样对于诸如表格倾斜等倾斜的图像也可以从中得到准确完整的表格,可以适用于各种类型的基于轮廓提取的表格识别,并且速度较快。
附图说明
从下面结合附图对本发明实施例的详细描述中,本发明的这些和/或其它方面和优点将变得更加清楚并更容易理解,其中:
图1是用于实现根据本发明实施例的基于轮廓提取的表格识别方法和装置的示例电子设备的示意性框图;
图2为根据本发明实施例的基于轮廓提取的表格识别方法的示意性流程图;
图3为根据本发明实施例的基于轮廓提取的表格识别装置的示意性结构框图;
图4为根据本发明实施例的基于轮廓提取的表格识别系统的示意性结构框图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明实施例可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明实施例发生混淆,对于本领域公知的一些技术特征未进行描述。
应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例。相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。在附图中,为了清楚,部件、元件等的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
首先,参照图1来描述用于实现根据本发明实施例的基于轮廓提取的表格识别方法和装置的示例电子设备100。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入/输出装置106、通信接口108以及一个或多个图像传感器110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构,也可以不包括前述的部分组件。
所述处理器102一般表示任何类型或形式的能够处理数据或解释和执行指令的处理单元。一般而言,处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。在特定实施例中,处理器102可以接收来自软件应用或模块的指令。这些指令可以导致处理器102完成本文描述和/或示出的一个或多个示例实施例的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入/输出装置106可以是用户用来输入指令和向外部输出各种信息的装置,例如输入装置可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。输出装置可以包括显示器、扬声器等中的一个或多个。
通信接口108广泛地表示任何类型或形式的能够促进示例电子设备100和一个或多个附加设备之间的通信的适配器或通信设备。例如,通信接口108可以促进电子设备100和前端或附件电子设备以及后端服务器或云端的通信。通信接口108的示例包括但不限于有线网络接口(诸如网络接口卡)、无线网络接口(诸如无线网络接口卡)、调制解调器和任何其他合适的接口。在一实施例中,通信接口108通过与诸如因特网的网络的直连提供到远程服务器/远程前端设备的直连。在特定实施例中,通信接口108通过与专用网络,例如视频监控网络、天网系统网络等网络的直连提供到远程服务器/远程前端设备的直连。通信接口108还可以间接提供这种通过任何其它合适连接的连接。
所述图像采集单元110可以采集图像,并且将采集的图像存储在所述存储装置104中以供其它组件使用。图像采集单元110可以为各种摄像装置或扫描装置。
示例性地,用于实现根据本发明实施例的基于轮廓提取的表格识别方法和装置的示例电子设备可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
下面参考图2描述根据本发明实施例的基于轮廓提取的表格识别方法。
本发明实施例公开的基于轮廓提取的表格识别方法,用于对图像进行表格识别和提取,如图2所示该方法包括:
步骤S200,对输入的图像进行预处理,以降低减少后续数据运算量和准确性。
示例性地,所述预处理包括:对图像进行灰度化以及对灰度化的所述图像进行降噪处理。
图像的灰度化可以通过各种方法实现,例如第一种方法是求出图像每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量。第二种方法是根据YUV的颜色空间中,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,以这个亮度值表达图像的灰度值。
图像降噪处理可以采用各种降噪方法实现,例如高斯滤波处理。高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。简言之,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。
通过对图像进行灰度化,可以降低后续数据处理的运算量,通过对降噪处理,可以减少图像的噪点,降低噪点的影响,例如可以减少扫描图片的噪点的影响。
步骤S201,对输入的图像进行轮廓提取。
更具体地,对输入的图像进行轮廓提取,以提取所述图像中所有目标的轮廓,例如表格线、文本轮廓等,同时度提取的轮廓进行二值化处理。
周知的两个具有不同灰度值的相邻区域之间总存在边缘,边缘是灰度值不连续的表现。由于边缘是图像上灰度变化最剧烈的地方,轮廓提取就是利用了这个特点,对图像各个像素点进行微分或求二阶微分来确定边缘像素点。轮廓提取可以通过各种常用的方法实现,例如差分轮廓提取方法,Reborts轮廓提取方法等。
步骤S202,判断所述图像是否倾斜,如果判定所述图像倾斜,则进入步骤S203进行图像纠偏,反之则进行步骤S204。
示例性地,图像是否倾斜可以根据下述步骤确定:首先,统计从所述图像中提取的所有矩形轮廓的角度,并根据所有矩形轮廓的角度确定所述图像中表格的角度;然后根据所确定表格的角度判断图像是否倾斜,例如表格的角度为30或60度则判定图像倾斜,反之如果表格的角度为0度或90度,则判定图像不倾斜。
示例性地,表格的角度可以通过对所有矩形轮廓的角度进行加权平均得到。
步骤S203,对图像进行纠偏。
即根据所述图像中表格的角度对所述图像进行纠偏。
示例性地,例如通过透视变换方法旋转图像进行纠偏,然后纠偏后的图像输出。所述透视变换方法是利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度,破坏原有的投影光线束,仍能保持承影面上投影几何图形不变的变换。
步骤S204,进行单元格提取,并返回单元格数量。
示例性地,可以利用本领域常用的单元格提取方法从图像中或从提取的轮廓中提取单元格,并返回单元格的数量。例如可以采用opencv提供的接口利用开源的单元格提取算法进行单元格的提取。
通过提取单元格可以过滤掉所提取的轮廓中独立的内轮廓矩形,例如“口”字等非单元格的影响。
步骤S205,判断所述图像中是否存在期望的表格。
即根据返回的单元格数量,判断所述图像中是否存在期望的表格。示例性地,例如期望的表格至少包括2行和2列,如果根据单元格数量判断仅在1列或1行,则判定不存在期望的表格。应当理解,期望的表格根据用户需求件设定,而不限于不需要单列或单行的情形。
如果在步骤S205中判定存在期望的表格则进入步骤S206,反之则前进到步骤S210,输出不存在期望的表格的结果。
步骤S206,合并所提取的所有单元格,以形成初始表格。
即将步骤S204中所提取的所有单元格进行合并,以组成一张表格图,作为初始表格。
步骤S207,对初始表格进行修复。
由于例如扫描等存在噪点曝光等的问题,提取的单元格可能并不完整,因而需要对原图进行修复,即对初始表格中的表格线进行修复。
示例性地,对所述初始表格图进行修复通过下述步骤件:首先,判断表格线之间的间断的大小是否小于设定阈值;其次,如果表格线之间的间断的小于设定阈值,则连接该间断以形成修复的表格线。所述设定阈值例如为相邻表格线距离的20%-30%。
步骤S208,对经过修复的初始表格进行二次单元格提取。
二次表格提取的方法与前述类似,在此不再赘述。
步骤S209,合并二次提取的单元格,以得到最终表格。
当得到最终表格后,则接下来在步骤S210输出结果。示例性地,以json行驶输出结果。
示例性地,根据本实施例的基于轮廓提取的表格识别方法可以在具有存储器和处理器的设备、装置或者系统中实现。
根据本实施例的基于轮廓提取的表格识别方法首先通过轮廓提取来获得图像中所有目标的轮廓,然后根据提取的轮廓判断图像是否倾斜,如果倾斜则进行纠偏,随后从图像中提取单元格,并合并单元格形成初始表格,随后对初始表格进行修复、二次提取和合并来得到最终表格,这样对于诸如表格倾斜等倾斜的图像也可以从中得到准确完整的表格,可以适用于各种类型的基于轮廓提取的表格识别,并且速度较快。
图3为根据本发明实施例的基于轮廓提取的表格识别装置的示意性结构框图。下面结合图3对根据本发明实施例的基于轮廓提取的表格识别装置进行说明。
如图3所示,根据本发明实施例的基于轮廓提取的表格识别装置300包括预处理模块310、轮廓提取模块320、纠偏模块330、单元格提取模块340、判断模块350、单元格合并模块360和单元格修复模块370。
预处理模块310用于对所述输入的图像进行预处理。示例性地,预处理模块310包括灰度化子模块311和降噪子模块312,灰度化子模块311用于使输入的图像灰度化,降噪子模块312用于对灰度化的所述图像进行降噪处理。预处理模块310以及灰度化子模块311和降噪子模块312可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S200。
轮廓提取模块320用于对输入的图像进行轮廓提取。示例性地,所述轮廓提取模块320用于提取所述图像中所有目标的轮廓,同时进行二值化处理。轮廓提取模块320可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S201。
纠偏模块330用于根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏。示例性地,纠偏模块330包括角距确定子模块331和图像纠偏子模块332。角度确定子模块331用于统计从所述图像中提取的所有矩形轮廓的角度,并根据所有矩形轮廓的角度确定所述图像中表格的角度。图像纠偏子模块332用于根据所述图像中表格的角度对所述图像进行纠偏。纠偏模块330以及角距确定子模块331和图像纠偏子模块332可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S202-S203。
单元格提取模块340用于从所述图像中提取单元格,并返回单元格数量以及从所述图像中二次提取单元格。单元格提取模块340可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S204和S208。
判断模块350用于根据从所述图像中提取单元格的数量,判断所述图像中是否存在期望的表格。如果所述判断模块350判定所述图像中存在期望的表格,则所述单元格合并模块360继续合并所提取的所有单元格形成初始表格图,反之则输出不存在期望的表格的结果。判断模块350可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S205。
单元格合并模块360用于合并所提取的所有单元格形成初始表格图,以及合并二次提取的所有单元格以形成最终表格图。单元格合并模块360可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S206和S209。
单元格修复模块370用于对所述初始表格图进行修复。示例性地,所述单元格修复模块370用于判断表格线之间的间断的大小是否小于设定阈值,以及在所述表格线之间的间断的小于设定阈值时连接该间断以形成修复的表格线。单元格修复模块370可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的基于轮廓提取的表格识别方法中的步骤S207。
示例性地,根据本实施例的基于轮廓提取的表格识别装置可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
根据本实施例的基于轮廓提取的表格识别装置可以实现图2所示的基于轮廓提取的表格识别方法,并具有类似的优点,在此不再赘述。
图4为根据本发明实施例的基于轮廓提取的表格识别系统的示意性结构框图。下面结合图4对根据本发明实施例的基于轮廓提取的表格识别系统进行描述。
如图4所示,根据本发明实施例的基于轮廓提取的表格识别系统400包括图像获取单元410、存储器420和处理器430。
图像获取单元410用于获取图像/图片,其可以为各种摄像装置或图像扫描装置。
所述存储器420存储用于实现根据本发明实施例的基于轮廓提取的表格识别方法中的相应步骤的程序代码。
所述处理器430用于运行所述存储器420中存储的程序代码,以执行根据本发明实施例的基于轮廓提取的表格识别方法的相应步骤,并且用于实现根据本发明实施例的基于轮廓提取的表格识别装置中的预处理模块310、轮廓提取模块320、纠偏模块330、单元格提取模块340、判断模块350、单元格合并模块360和单元格修复模块370。
在一个实施例中,在所述程序代码被所述处理器430运行时执行以下步骤:
对输入的图像进行轮廓提取;
根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;
从所述图像中提取单元格;
合并所提取的所有单元格形成初始表格图;
对所述初始表格图进行修复;
从所述图像中二次提取单元格;
合并二次提取的所有单元格以形成最终表格图。
示例性地,根据本发明实施例的基于轮廓提取的表格识别系统可以实现为具有图像采集单元、存储器、通信接口/单元和处理器的设备、装置或者系统。
根据本发明实施例的基于轮廓提取的表格识别系统可以部署为一个整体,例如具有图像获取单元、处理器和存储器的电子设备中,例如智能手机、智能眼镜、监控摄像机等。替代地,根据本发明实施例的基于轮廓提取的表格识别系统还可以分布地部署在服务器端(或云端)和图像采集端。
此外,根据本发明实施例,还提供了基于轮廓提取的表格识别设备,其包括:一个或多个存储器,用于存储一个或多个计算机程序;一个或多个处理器,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现根据本发明实施例所述的基于轮廓提取的表格识别方法。
示例性地,根据本发明实施例的基于轮廓提取的表格识别设备可以实现为智能手机、智能眼镜、平板电脑、便携式PC、桌面计算机等设备。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的基于轮廓提取的表格识别方法的相应步骤,并且用于实现根据本发明实施例的基于轮廓提取的表格识别装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合,例如一个计算机可读存储介质包含用于图像采集的计算机可读的程序代码,另一个计算机可读存储介质包含用于基于轮廓提取的表格识别方法的计算机可读的程序代码。
在一个实施例中,所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的基于轮廓提取的表格识别装置的各个功能模块,并且/或者可以执行根据本发明实施例的基于轮廓提取的表格识别方法。
在一个实施例中,所述计算机程序指令在被计算机运行时执行以下步骤:对输入的图像进行轮廓提取;根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;从所述图像中提取单元格;合并所提取的所有单元格形成初始表格图;对所述初始表格图进行修复;从所述图像中二次提取单元格;合并二次提取的所有单元格以形成最终表格图。
根据本发明实施例的基于轮廓提取的表格识别装置中的各模块可以通过根据本发明实施例的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。
根据本发明实施例提供的基于轮廓提取的表格识别方法和装置、设备及存储介质,首先通过轮廓提取来获得图像中所有目标的轮廓,然后根据提取的轮廓判断图像是否倾斜,如果倾斜则进行纠偏,随后从图像中提取单元格,并合并单元格形成初始表格,随后对初始表格进行修复、二次提取和合并来得到最终表格,这样对于诸如表格倾斜等倾斜的图像也可以从中得到准确完整的表格,可以适用于各种类型的基于轮廓提取的表格识别,并且速度较快。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于轮廓提取的表格识别方法,其特征在于,包括:
对输入的图像进行轮廓提取;
根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;
从所述图像中提取单元格;
合并所提取的所有单元格形成初始表格图;
对所述初始表格图进行修复;
从所述图像中二次提取单元格;
合并二次提取的所有单元格以形成最终表格图。
2.根据权利要求1的基于轮廓提取的表格识别方法,其特征在于,还包括:
对所述图像进行预处理。
3.根据权利要求2的基于轮廓提取的表格识别方法,其特征在于,所述预处理包括:
对所述图像进行灰度化;
对灰度化的所述图像进行降噪处理。
4.根据权利要求1的基于轮廓提取的表格识别方法,其特征在于,对图像进行轮廓提取包括:提取所述图像中所有目标的轮廓,同时进行二值化处理。
5.根据权利要求1的基于轮廓提取的表格识别方法,其特征在于,根据提取的轮廓判断所述图像是否倾斜包括:
统计从所述图像中提取的所有矩形轮廓的角度,并根据所有矩形轮廓的角度确定所述图像中表格的角度;
根据所述图像中表格的角度对所述图像进行纠偏。
6.根据权利要求1的基于轮廓提取的表格识别方法,其特征在于,对所述初始表格图进行修复包括:。
判断表格线之间的间断的大小是否小于设定阈值;
如果表格线之间的间断的小于设定阈值,则连接该间断以形成修复的表格线。
7.根据权利要求1的基于轮廓提取的表格识别方法,其特征在于,还包括:
根据从所述图像中提取单元格的数量,判断所述图像中是否存在期望的表格;
如果判定所述图像中存在期望的表格,则继续合并所提取的所有单元格形成初始表格图,反之则输出不存在期望的表格的结果。
8.一种基于轮廓提取的表格识别装置,其特征在于,其特征在于,包括:
轮廓提取模块,其用于对输入的图像进行轮廓提取;
纠偏模块,其用于根据提取的轮廓判断所述图像是否倾斜,如果所述图像倾斜则对所述图像进行纠偏;
单元格提取模块,其用于从所述图像中提取单元格;
单元格合并模块,其用于合并所提取的所有单元格形成初始表格图;
单元格修复模块,其用于对所述初始表格图进行修复;
所述单元格提取模块还用于从所述图像中二次提取单元格;
所述单元格合并模块还用于合并二次提取的所有单元格以形成最终表格图。
9.一种基于轮廓提取的表格识别设备,能够对图像进行表格识别,所述基于轮廓提取的表格识别设备具有存储器和处理器,所述存储器中存储有用于进行基于轮廓提取的表格识别的计算机可执行指令,所述计算机可执行指令被处理器执行时,可操作来执行权利要求1到7中的任一项所述的基于轮廓提取的表格识别方法。
10.一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时可操作来执行权利要求1到7中的任一项所述的基于轮廓提取的表格识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910481627.6A CN110263682A (zh) | 2019-06-04 | 2019-06-04 | 基于轮廓提取的表格识别方法和装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910481627.6A CN110263682A (zh) | 2019-06-04 | 2019-06-04 | 基于轮廓提取的表格识别方法和装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110263682A true CN110263682A (zh) | 2019-09-20 |
Family
ID=67916763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910481627.6A Withdrawn CN110263682A (zh) | 2019-06-04 | 2019-06-04 | 基于轮廓提取的表格识别方法和装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263682A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111127339A (zh) * | 2019-12-04 | 2020-05-08 | 北京华宇信息技术有限公司 | 一种文档图像的梯形畸变矫正方法及装置 |
CN111563453A (zh) * | 2020-05-07 | 2020-08-21 | 北京百度网讯科技有限公司 | 用于确定表格顶点的方法、装置、设备和介质 |
CN112200822A (zh) * | 2020-10-28 | 2021-01-08 | 广东南方数码科技股份有限公司 | 表格重建方法、装置、计算机设备及存储介质 |
CN113139445A (zh) * | 2021-04-08 | 2021-07-20 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
CN113139445B (zh) * | 2021-04-08 | 2024-05-31 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005234845A (ja) * | 2004-02-19 | 2005-09-02 | Ricoh Co Ltd | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN109086714A (zh) * | 2018-07-31 | 2018-12-25 | 国科赛思(北京)科技有限公司 | 表格识别方法、识别系统及计算机装置 |
CN109325221A (zh) * | 2018-09-27 | 2019-02-12 | 郑州云海信息技术有限公司 | 表格文件的合并方法和装置 |
-
2019
- 2019-06-04 CN CN201910481627.6A patent/CN110263682A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005234845A (ja) * | 2004-02-19 | 2005-09-02 | Ricoh Co Ltd | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN109086714A (zh) * | 2018-07-31 | 2018-12-25 | 国科赛思(北京)科技有限公司 | 表格识别方法、识别系统及计算机装置 |
CN109325221A (zh) * | 2018-09-27 | 2019-02-12 | 郑州云海信息技术有限公司 | 表格文件的合并方法和装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111127339A (zh) * | 2019-12-04 | 2020-05-08 | 北京华宇信息技术有限公司 | 一种文档图像的梯形畸变矫正方法及装置 |
CN111127339B (zh) * | 2019-12-04 | 2020-10-30 | 北京华宇信息技术有限公司 | 一种文档图像的梯形畸变矫正方法及装置 |
CN111563453A (zh) * | 2020-05-07 | 2020-08-21 | 北京百度网讯科技有限公司 | 用于确定表格顶点的方法、装置、设备和介质 |
CN111563453B (zh) * | 2020-05-07 | 2023-07-04 | 北京百度网讯科技有限公司 | 用于确定表格顶点的方法、装置、设备和介质 |
CN112200822A (zh) * | 2020-10-28 | 2021-01-08 | 广东南方数码科技股份有限公司 | 表格重建方法、装置、计算机设备及存储介质 |
CN113139445A (zh) * | 2021-04-08 | 2021-07-20 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
CN113139445B (zh) * | 2021-04-08 | 2024-05-31 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108124487B (zh) | 云端抄表方法及装置 | |
CN108230383B (zh) | 手部三维数据确定方法、装置及电子设备 | |
CN105809164B (zh) | 文字识别方法和装置 | |
CN108875731B (zh) | 目标识别方法、装置、系统及存储介质 | |
RU2680765C1 (ru) | Автоматизированное определение и обрезка неоднозначного контура документа на изображении | |
CN110263682A (zh) | 基于轮廓提取的表格识别方法和装置、设备及存储介质 | |
CN106650662B (zh) | 目标对象遮挡检测方法及装置 | |
CN110781885A (zh) | 基于图像处理的文本检测方法、装置、介质及电子设备 | |
CN109948521A (zh) | 图像纠偏方法和装置、设备及存储介质 | |
JP5505410B2 (ja) | データ処理装置、画像照合方法、プログラムおよび画像照合システム | |
CN107424160A (zh) | 通过视觉系统查找图像中线的系统和方法 | |
US20200356800A1 (en) | Polygonal region detection | |
CN111008935B (zh) | 一种人脸图像增强方法、装置、系统及存储介质 | |
CN110288551B (zh) | 视频美化方法、装置及电子设备 | |
CN109712082B (zh) | 协作修图的方法及装置 | |
CN113962306A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN110910445B (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
CN110879131B (zh) | 目视光学系统的成像质量测试方法、成像质量测试装置和电子设备 | |
WO2021081008A1 (en) | Shoe authentication device and authentication process | |
CN111784658B (zh) | 一种用于人脸图像的质量分析方法和系统 | |
CN108875556A (zh) | 用于人证核验的方法、装置、系统及计算机存储介质 | |
CN116343228A (zh) | 一种水表智能读数方法及系统 | |
CN111209856B (zh) | 发票信息的识别方法、装置、电子设备及存储介质 | |
CN111220235A (zh) | 水位监测方法及装置 | |
CN103150717B (zh) | 图像高亮区域的检测方法、内容检测方法及内容检测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190920 |
|
WW01 | Invention patent application withdrawn after publication |