CN110751156A - 用于表格线大块干扰去除方法、系统、设备及介质 - Google Patents
用于表格线大块干扰去除方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN110751156A CN110751156A CN201910988755.XA CN201910988755A CN110751156A CN 110751156 A CN110751156 A CN 110751156A CN 201910988755 A CN201910988755 A CN 201910988755A CN 110751156 A CN110751156 A CN 110751156A
- Authority
- CN
- China
- Prior art keywords
- image
- line
- binary
- form image
- initial form
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000013519 translation Methods 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000007639 printing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本申请提供用于表格线大块干扰去除方法、系统、设备及介质,所述用于表格线大块干扰去除方法包括:获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;对所述二值化图像进行平移获取平移图像;从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。本申请较好解决了表格线中大块干扰的去除,提高获取表格线的精确度,对表格重建的鲁棒性有了显著提升。
Description
技术领域
本申请涉及自动化技术领域,特别是涉及文本处理自动化技术领域,具体为一种用于表格线大块干扰去除方法、系统、设备及介质。
背景技术
随着社会经济的发展和中国城镇化的推进,越来越多的人进入城市就业,越来越多的公司诞生;同时随着互联网技术的发展,电子交易,数字交易已经普及;对于公司、银行、证卷交易产生越来越多的财务表格单据及信息。传统的财务报行;速度慢、效率底,很难满足越来越多的表格单据信息的识别、入库及自动校对。
如何快速准确的对财务等表格单据进行智能识别、核对,同时减少人工成本,是急需解决的问题。特别是在国家智慧金融及人工智能相关政策的指引下,越来越多的金融机构和科技公司开始针对其进行相应的投入和研究。而其中表格线检测的完整性、准确性,对于表格重建及表格的识别有着重要的作用;但是真实表格数据中,通常会存在各种线干扰情况:过淡线干扰、打印干扰线、红章干扰、黑章干扰、长方形章干扰、字符线干扰(表格间隔过小、而且由于排列导致个别字符中的某个笔画集体连接为一条线)、干扰线与真实线合并等情况。这其中的章干扰、手写干扰及部分噪声干扰,可以统一称为大块干扰,其中章干扰引起的居多(因为报表每张都需要有印章),如何正确的去除大块干扰并提取出正确的表格线,对表格线提取及表格重建的鲁棒性有着重要的作用。
申请内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供用于表格线大块干扰去除方法、系统、设备及介质,用于解决现有表格中存在大块干扰从而影响表格识别的技术问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种用于表格线大块干扰去除方法,包括:获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;对所述二值化图像进行平移获取平移图像;从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
于本申请的第一方面的一些实施例中,所述获取所述初始表格图像中的字符高度的一种实现方式包括:对所述初始表格图像进行自适应二值化处理形成第一图像;获取所述第一图像中的字符连通区域,并计算所述字符连通区域中的字符高度;根据所述初始表格图像的缩放比例和所述字符连通区域中的字符高度确定所述初始表格图像中的字符高度。
于本申请的第一方面的一些实施例中,所述用于表格线大块干扰去除方法还包括:根据获取的所述初始表格图像中的字符高度和预设高度阈值判断所述初始表格图像是否可以缩放,若是,则将所述初始表格图像进行缩放,形成缩放图像。
于本申请的第一方面的一些实施例中,所述用于表格线大块干扰去除方法还包括:根据红章特征和表格线灰度图特征识别并去除所述缩放图像中的红章,生成去章图像;对所述去章图像进行灰度变换,生成单通道图像。
于本申请的第一方面的一些实施例中,所述根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像的一种实现方式包括:根据所述字符高度构造匹配的水平结构元素和竖直结构元素;根据构造的所述水平结构元素和所述竖直结构元素对所述单通道图像进行卷积处理以增强所述单通道图像中的表格线;根据所述字符高度设置自适应二值化函数的核尺寸;根据二值化函数和预设的二值化阈值获取所述单通道图像的二值化图像。
于本申请的第一方面的一些实施例中,所述用于表格线大块干扰去除方法还包括:根据预设直线检测方法对所述二值化图像中的水平表格线和竖直表格线进行检测,去除非表格线的干扰线。
于本申请的第一方面的一些实施例中,所述用于表格线大块干扰去除方法还包括:根据所述二值化图像中的水平表格线和竖直表格线重建表格,并根据表格相交特征修正所述重建表格;检测所述重建表格各个交点,并获取所述重建表格中各个单元格的四个坐标点,采用基于字符识别模型对各个单元格中的字符进行识别;根据预设的标准映射表,对所述重构表格并进行校验。
为实现上述目的及其他相关目的,本申请的第二方面提供一种用于表格线大块干扰去除装置,包括:初始化模块,用于获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;二值化图像模块,用于获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;平移模块,用于对所述二值化图像进行平移获取平移图像;干扰切断模块,用于从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
为实现上述目的及其他相关目的,本申请的第三方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述电子终端执行如上所述的用于表格线大块干扰去除方法。
为实现上述目的及其他相关目的,本申请的第四方面一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如上所述的用于表格线大块干扰去除方法。
如上所述,本申请的用于表格线大块干扰去除方法、系统、设备及介质,具有以下有益效果:
本申请针对报表中经常必须加盖印章产生的大块干扰去除具有较好的鲁棒性,而且该方法不受章颜色的限制(红章、黑章、蓝章等均可处理,同色对打印等产生的大块干扰也可较好的进行去除),较好解决了表格线中大块干扰的去除,提高获取表格线的精确度,对表格重建的鲁棒性有了显著提升。
附图说明
图1显示为本申请一实施例中的用于表格线大块干扰去除方法的整体流程示意图。
图2显示为本申请一实施例中的获取字符高度的一种方式的流程示意图。
图3显示为本申请一实施例中的获取二值化图像的另一种方式的流程示意图。
图4显示为本申请一实施例中向右上平移二值化图像的示意图。
图5显示为本申请一实施例中向左上平移二值化图像的示意图。
图6显示为本申请一实施例中向右下平移二值化图像的示意图。
图7显示为本申请一实施例中向左下平移二值化图像的示意图。
图8显示为本申请一实施例中的用于表格线大块干扰去除装置的原理框图。
图9显示为本申请一实施例中的电子终端的的结构示意图。
元件标号说明
100 用于表格线大块干扰去除装置
110 初始化模块
120 二值化图像模块
130 平移模块
140 干扰切断模块
S100~S400 步骤
S210~S270 步骤
1101 处理器
1102 存储器
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
本发明提供用于表格线大块干扰去除方法、系统、设备及介质,用于提高表格线检测的准确性、鲁棒性,并提升表格重建及关键信息提取的适用性,解决现有表格中存在大块干扰从而影响表格识别的技术问题。
以下将详细阐述本实施例的一种用于表格线大块干扰去除方法、系统、设备及介质的原理及实施方式,使本领域技术人员不需要创造性劳动即可理解本实施例的一种用于表格线大块干扰去除方法、系统、设备及介质。
如图1所示展示本发明一实施例中的用于表格线大块干扰去除方法的流程示意图。
需说明的是,所述用于表格线大块干扰去除方法可应用于多种类型的硬件设备。所述硬件设备例如是控制器,具体如ARM(Advanced RISC Machines)控制器、FPGA(FieldProgrammable Gate Array)控制器、SoC(System on Chip)控制器、DSP(Digital SignalProcessing)控制器、或者MCU(Micorcontroller Unit)控制器等等。所述硬件设备例如也可以是包括存储器、存储控制器、一个或多个处理单元(CPU)、外设接口、RF电路、音频电路、扬声器、麦克风、输入/输出(I/O)子系统、显示屏、其他输出或控制设备,以及外部端口等组件的计算机;所述计算机包括但不限于如台式电脑、笔记本电脑、平板电脑、智能手机、智能电视、个人数字助理(Personal Digital Assistant,简称PDA)等个人电脑。在另一些实施方式中,所述硬件设备还可以是服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成,本实施例不作限定。
如图1所示,在本实施例中,所述用于表格线大块干扰去除方法包括步骤S100至步骤S400。
步骤S100,获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;
步骤S200,获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;
步骤S300,对所述二值化图像进行平移获取平移图像;
步骤S400,从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
以下对本实施例中所述用于表格线大块干扰去除方法的步骤S100至步骤S400进行详细说明。
步骤S100,获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像。
其中,可以通过手机拍摄或扫描方式获取待处理表格图像。
于本实施例中,所述对获取的所述待处理表格图像进行预处理包括:对所述待处理表格图像进行图像缩放、灰度变换、图像增强、图像倾斜校正中的一种或多种组合。
具体地,于本实施例中,所述对获取的所述待处理表格图像进行预处理的一种方式如下:将待处理表格图像缩放、并灰度化、然后进行预处理增强获得图像I1,对图像I1进行自适应二值化处理得到图像I2。
例如,采用高斯模糊对待处理表格图像进行去噪,然后采用直方图均衡化算法以及伽马变换对去噪后的图像进行对比度拉伸,实现图像增强,然后采用自适应二值法得到二值图像。
进一步的可以采用仿射变换方法、霍夫直线法等对所述待处理表格图像进行倾斜矫正,获取矫正后图像M。
例如,采用Sobel边缘检测算法对待处理表格图像进行边缘提取,然后对边缘图像进行细化(公知常识,兹不赘述);采用Hough直线检测算法对待处理表格图像中表格进行直线检测,选取长度最长的直线作为表格水平方向线,计算其与水平方向夹角,得到水平边缘倾斜角度,垂直边缘与水平边缘具有垂直关系,直接推算即可(公知常识,兹不赘述);根据所述水平及垂直边缘倾斜角度进行仿射变换,获取校正后的待处理表格图像。
又例如,使用霍夫直线法得到图像中随机的50条直线,若不足50条则取所有直线;根据这50条直线的斜率计算平均斜率;根据得到的平均斜率对图像进行校正,使表格变水平。
上述仅是对本实施例的图像倾斜校正进行举例说明,对图像进行校正不局限于上述方法。
在获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像之后,接着执行步骤S200。
步骤S200,获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像。
具体地,于本实施例中,如图2所示,所述获取所述初始表格图像中的字符高度的一种实现方式包括:
步骤S210,对所述初始表格图像进行自适应二值化处理形成第一图像。
步骤S220,获取所述第一图像中的字符连通区域,并计算所述字符连通区域中的字符高度;
步骤S230,根据所述初始表格图像的缩放比例和所述字符连通区域中的字符高度确定所述初始表格图像中的字符高度。
例如,对缩放图上获取的二值化图像I2进行连通域查找,并进行若干规则剔除非字符连通域,对获取的字符连通域分别计算取其外接矩形框的高度及宽度最大值的平均值,作为字符高度h1;然后计算预处理时对图像的缩放比例,反算出实际的字符高度h,从而确定所述初始表格图像中的字符高度。
于本一些实施例中,所述用于表格线大块干扰去除方法还包括:根据获取的所述初始表格图像中的字符高度和预设高度阈值判断所述初始表格图像是否可以缩放,若是,则将所述初始表格图像进行缩放,形成缩放图像。
具体地,依据字符高度h,判断图像M是否可以缩放,例如,设置字符高度h大于28时则对其进行缩放,将图像缩放到20个像素高度(若发生了缩放,则此时字符高度h大小变为20),此处获取的缩放图像为M2、M2对应字符高度为charh。
于本申请一些实施例中,所述用于表格线大块干扰去除方法还包括:根据红章特征和表格线灰度图特征识别并去除所述缩放图像中的红章,生成去章图像;对所述去章图像进行灰度变换,生成单通道图像。
依据红章特征及表格线为灰度图特征对缩放图像M2进行红章去除,获得红章去除后的图像去章图像M3;将去章图像M3进行灰度变换,获得单通道图像M4。
如图3所示,于本些实施例中,所述根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像的一种实现方式包括:
步骤S240,根据所述字符高度构造匹配的水平结构元素和竖直结构元素;
步骤S250,根据构造的所述水平结构元素和所述竖直结构元素对所述单通道图像进行卷积处理以增强所述单通道图像中的表格线;
步骤S260,根据所述字符高度设置自适应二值化函数的核尺寸;
步骤S270,根据二值化函数和预设的二值化阈值获取所述单通道图像的二值化图像。
具体地,根据获取的字符高度h构造自适应大小的水平结构元素和竖直结构元素来分别对单通道图像M4进行卷积,达到增强图像中水平及竖直线的目的;根据字符高度来设置自适应二值化函数的核尺寸,依据计算获取的背景像素值、目标像素值设置自适应二值化的相应阈值(二值化阈值),来分别实现水平及竖直方向增强后图像的二值图M_bi_hori、M_bi_ver。
在获取单通道图像M4的二值化图像之后,通过平移对表格图像中的大块干扰进行去除。
步骤S300,对所述二值化图像进行平移获取平移图像。
于本些实施例中,根据所述对所述二值化图像进行平移获取平移图像包括但不仅限于:根据预设的水平方向步长和竖直方向步长将所述二值化图像向以下一种或多种方向组合进行移动:左上方向、右上方向、左下方向及右下方向。
于本实施例中,在对二值化图像进行平移之前,需要设定移动步长,步长的大小可以根据干扰的大小进行设定。
例如:水平线:
左右移动步长:mvstep_leftright=10;
上下移动步长:mvstep2_updown=7;
竖直线:
左右移动步长:mvstep_leftright=7;
上下移动步长:mvstep2_updown=10。
设待处理图像为M_line,将其按照上述步长向右上平移得到图像M_line_upright,如图4所示,其中实线为原始图像表格线图,虚线为平移后表格线图,向左上平移得到图像M_line_upleft,如图5所示,其中实线为原始图像表格线图,虚线为平移后表格线图;向右下平移得到图像M_line_downright,如图6所示,其中实线为原始图像表格线图,虚线为平移后表格线图;向左下平移得到图像M_line_downleft,如图7所示,其中实线为原始图像表格线图,虚线为平移后表格线图。
步骤S400,从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
具体操作为从原始表格线二值图中分别去除平移后的表格线图像,即可切断大块干扰,同时保持真实表格线的相对完整。从图4至图7可以看出经过平移操作分别达到了切断右上、左上、右下、左下大块干扰线的目的。
采用opencv具体实现的伪代码如下:
1)创建4个图像矩阵mv1_upleft,mv2_upright,mv3_downleft,mv4_downright,其对应的原图中区域分别为roi1_upleft,roi2_upright,roi3_downleft,roi4_downright。
其中:
w=M_line.cols,h=M_line.rows;
mv1_upleft=mv2_upright=mv3_downleft=mv4_downright=cv::Mat::zeros(Image_linebi.size(),CV_8UC1);
roi1_upleft=cv::Rect(mvstep_leftright,mvstep2_updown,w-mvstep_leftright,h-mvstep2_updown);
roi2_upright=cv::Rect(0,mvstep2_updown,w-mvstep_leftright,h-mvstep2_updown);
roi3_downleft=cv::Rect(mvstep_leftright,0,w-mvstep_leftright,h-mvstep2_updown);
roi4_downright=cv::Rect(0,0,w-mvstep_leftright,h-mvstep2_updown)。
2)从表格线二值图中,分别取出对应的矩形子图像信息。
cv::Mat bi1_upleft=M_line(roi1_upleft).clone();
cv::Mat bi2_upright=M_line(roi2_upright).clone();
cv::Mat bi3_downleft=M_line(roi3_downleft).clone();
cv::Mat bi4_downright=M_line(roi4_downright).clone()。
3)从移动目标图像中,取出对应的待赋值子图像区域。
cv::Mat mv1_roi=mv1_upleft(roi4_downright);
cv::Mat mv2_roi=mv2_upright(roi3_downleft);
cv::Mat mv3_roi=mv3_downleft(roi2_upright);
cv::Mat mv4_roi=mv4_downright(roi1_upleft)。
4)将对应的子图像放入移动目标图像内。
bi1_upleft(roi4_downright).convertTo(mv1_roi,mv1_roi.type());
bi2_upright(roi4_downright).convertTo(mv2_roi,mv2_roi.type());
bi3_downleft(roi4_downright).convertTo(mv3_roi,mv3_roi.type());
bi4_downright(roi4_downright).convertTo(mv4_roi,mv4_roi.type());
5)将原直线二值图,减去移动后的图像,达到大块干扰去除的目的。
M_line=M_line–mv1_upleft;
M_line=M_line–mv2_upright;
M_line=M_line–mv3_downleft;
M_line=M_line–mv4_downright。
于本申请的一些实施例中,所述用于表格线大块干扰去除方法还包括:根据预设直线检测方法对所述二值化图像中的水平表格线和竖直表格线进行检测,去除非表格线的干扰线。
包括但不限于用数学形态学的方法来进一步检测水平横线和竖直直线,过滤丢部分非表格线干扰,过淡线干扰去除,水平和竖直短直线的筛选过滤与合并及干扰线去除等操作。
此外,于本申请一些实施例中,所述用于表格线大块干扰去除方法还包括:根据所述二值化图像中的水平表格线和竖直表格线重建表格,并根据表格相交特征修正所述重建表格;检测所述重建表格各个交点,并获取所述重建表格中各个单元格的四个坐标点,采用基于字符识别模型对各个单元格中的字符进行识别;根据预设的标准映射表,对所述重构表格并进行校验。
具体地,,对获得的二值化图像采用自适应二值化和去噪预处理,运用仿射变换校正图像,分别构造水平和竖直结构元素对图像开运算,可以获得表格的横线和竖线图。原本在一条直线上的短直线根据间距大小合并,对于孤立极短的直线则是由于字体开运算留下的干扰线加以剔除。最后把横竖线图相加得到初始表格图,因为图像不清晰等原因时有的直线长度不完整、表格中应该纵横相交的直线因为太短而没有相交等,这些都可以通过表格横纵直线相结合的组成规律得到修正。
与本实施例中,可以对二值图上进行轮廓检测,找到所有交点区域的外接矩形框,以矩形框中心坐标作为该区域对应的表格交点的坐标。
本实施例还提供一种用于表格线大块干扰去除装置100,如图8所示,用于表格线大块干扰去除装置100包括:初始化模块110,二值化图像模块120、平移模块130以及干扰切断模块140。
于本实施例中,所述初始化模块110用于获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像。
其中,可以通过手机拍摄或扫描方式获取待处理表格图像。
于本实施例中,所述对获取的所述待处理表格图像进行预处理包括:对所述待处理表格图像进行图像缩放、灰度变换、图像增强、图像倾斜校正中的一种或多种组合。
具体地,于本实施例中,所述对获取的所述待处理表格图像进行预处理的一种方式如下:将待处理表格图像缩放、并灰度化、然后进行预处理增强获得图像I1,对图像I1进行自适应二值化处理得到图像I2。
例如,采用高斯模糊对待处理表格图像进行去噪,然后采用直方图均衡化算法以及伽马变换对去噪后的图像进行对比度拉伸,实现图像增强,然后采用自适应二值法得到二值图像。
进一步的可以采用仿射变换方法、霍夫直线法等对所述待处理表格图像进行倾斜矫正,获取矫正后图像M。
例如,采用Sobel边缘检测算法对待处理表格图像进行边缘提取,然后对边缘图像进行细化(公知常识,兹不赘述);采用Hough直线检测算法对待处理表格图像中表格进行直线检测,选取长度最长的直线作为表格水平方向线,计算其与水平方向夹角,得到水平边缘倾斜角度,垂直边缘与水平边缘具有垂直关系,直接推算即可(公知常识,兹不赘述);根据所述水平及垂直边缘倾斜角度进行仿射变换,获取校正后的待处理表格图像。
又例如,使用霍夫直线法得到图像中随机的50条直线,若不足50条则取所有直线;根据这50条直线的斜率计算平均斜率;根据得到的平均斜率对图像进行校正,使表格变水平。
上述仅是对本实施例的图像倾斜校正进行举例说明,对图像进行校正不局限于上述方式。
于本实施例中,所述二值化图像模块120用于获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像。
具体地,于本实施例中,所述二值化图像模块120获取所述初始表格图像中的字符高度的一种实现方式包括:对所述初始表格图像进行自适应二值化处理形成第一图像;获取所述第一图像中的字符连通区域,并计算所述字符连通区域中的字符高度;根据所述初始表格图像的缩放比例和所述字符连通区域中的字符高度确定所述初始表格图像中的字符高度。
例如,对缩放图上获取的二值化图像I2进行连通域查找,并进行若干规则剔除非字符连通域,对获取的字符连通域分别计算取其外接矩形框的高度及宽度最大值的平均值,作为字符高度h1;然后计算预处理时对图像的缩放比例,反算出实际的字符高度h,从而确定所述初始表格图像中的字符高度。
于本一些实施例中,所述用于表格线大块干扰去除方法还包括:缩放控制模块,用于根据获取的所述初始表格图像中的字符高度和预设高度阈值判断所述初始表格图像是否可以缩放,若是,则将所述初始表格图像进行缩放,形成缩放图像。
具体地,依据字符高度h,判断图像M是否可以缩放,例如,设置字符高度h大于28时则对其进行缩放,将图像缩放到20个像素高度(若发生了缩放,则此时字符高度h大小变为20),此处获取的缩放图像为M2、M2对应字符高度为charh。
于本申请一些实施例中,所述用于表格线大块干扰去除装置100还包括:第一处理模块,用于根据红章特征和表格线灰度图特征识别并去除所述缩放图像中的红章,生成去章图像,对所述去章图像进行灰度变换,生成单通道图像。
第一处理模块依据红章特征及表格线为灰度图特征对缩放图像M2进行红章去除,获得红章去除后的图像去章图像M3;将去章图像M3进行灰度变换,获得单通道图像M4。
于本些实施例中,所述二值化图像模块120根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像的一种实现方式包括:根据所述字符高度构造匹配的水平结构元素和竖直结构元素;根据构造的所述水平结构元素和所述竖直结构元素对所述单通道图像进行卷积处理以增强所述单通道图像中的表格线;根据所述字符高度设置自适应二值化函数的核尺寸;根据二值化函数和预设的二值化阈值获取所述单通道图像的二值化图像。
具体地,根据获取的字符高度h构造自适应大小的水平结构元素和竖直结构元素来分别对单通道图像M4进行卷积,达到增强图像中水平及竖直线的目的;根据字符高度来设置自适应二值化函数的核尺寸,依据计算获取的背景像素值、目标像素值设置自适应二值化的相应阈值(二值化阈值),来分别实现水平及竖直方向增强后图像的二值图M_bi_hori、M_bi_ver。
在获取单通道图像M4的二值化图像之后,通过平移对表格图像中的大块干扰进行去除。
于本实施例中,所述平移模块130用于对所述二值化图像进行平移获取平移图像。
于本些实施例中,根据所述对所述二值化图像进行平移获取平移图像包括但不仅限于:根据预设的水平方向步长和竖直方向步长将所述二值化图像向以下一种或多种方向组合进行移动:左上方向、右上方向、左下方向及右下方向。
于本实施例中,在对二值化图像进行平移之前,需要设定移动步长,步长的大小可以根据干扰的大小进行设定。
例如:水平线:
左右移动步长:mvstep_leftright=10;
上下移动步长:mvstep2_updown=7;
竖直线:
左右移动步长:mvstep_leftright=7;
上下移动步长:mvstep2_updown=10。
设待处理图像为M_line,将其按照上述步长向右上平移得到图像M_line_upright,如图4所示,其中实线为原始图像表格线图,虚线为平移后表格线图,向左上平移得到图像M_line_upleft,如图5所示,其中实线为原始图像表格线图,虚线为平移后表格线图;向右下平移得到图像M_line_downright,如图6所示,其中实线为原始图像表格线图,虚线为平移后表格线图;向左下平移得到图像M_line_downleft,如图7所示,其中实线为原始图像表格线图,虚线为平移后表格线图。
于本实施例中,所述干扰切断模块140,用于从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
具体操作为从原始表格线二值图中分别去除平移后的表格线图像,即可切断大块干扰,同时保持真实表格线的相对完整。从图4至图7可以看出经过平移操作分别达到了切断右上、左上、右下、左下大块干扰线的目的。
如图9所示,展示本申请一实施例中的电子终端的结构示意图,所述电子终端包括处理器1101和存储器1102;存储器1102通过系统总线与处理器1101连接并完成相互间的通信,存储器1102用于存储计算机程序,处理器1101用于运行计算机程序,以使所述电子终端执行所述的用于表格线大块干扰去除方法。上述已经对所述用于表格线大块干扰去除方法进行了详细说明,在此不再赘述。
另需说明的是,上述提到的系统总线可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器1101可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此外,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的用于表格线大块干扰去除方法。上述已经对所述用于表格线大块干扰去除方法进行了详细说明,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请针对报表中经常必须加盖印章产生的大块干扰去除具有较好的鲁棒性,而且该方法不受章颜色的限制(红章、黑章、蓝章等均可处理,同色对打印等产生的大块干扰也可较好的进行去除),较好解决了表格线中大块干扰的去除,提高获取表格线的精确度,对表格重建的鲁棒性有了显著提升。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (10)
1.一种用于表格线大块干扰去除方法,其特征在于,包括:
获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;
获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;
对所述二值化图像进行平移获取平移图像;
从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
2.根据权利要求1所述的用于表格线大块干扰去除方法,其特征在于,所述获取所述初始表格图像中的字符高度的一种实现方式包括:
对所述初始表格图像进行自适应二值化处理形成第一图像;
获取所述第一图像中的字符连通区域,并计算所述字符连通区域中的字符高度;
根据所述初始表格图像的缩放比例和所述字符连通区域中的字符高度确定所述初始表格图像中的字符高度。
3.根据权利要求2所述的用于表格线大块干扰去除方法,其特征在于,所述用于表格线大块干扰去除方法还包括:
根据获取的所述初始表格图像中的字符高度和预设高度阈值判断所述初始表格图像是否可以缩放,若是,则将所述初始表格图像进行缩放,形成缩放图像。
4.根据权利要求3所述的用于表格线大块干扰去除方法,其特征在于,所述用于表格线大块干扰去除方法还包括:
根据红章特征和表格线灰度图特征识别并去除所述缩放图像中的红章,生成去章图像;
对所述去章图像进行灰度变换,生成单通道图像。
5.根据权利要求4所述的用于表格线大块干扰去除方法,其特征在于,所述根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像的一种实现方式包括:
根据所述字符高度构造匹配的水平结构元素和竖直结构元素;
根据构造的所述水平结构元素和所述竖直结构元素对所述单通道图像进行卷积处理以增强所述单通道图像中的表格线;
根据所述字符高度设置自适应二值化函数的核尺寸;
根据二值化函数和预设的二值化阈值获取所述单通道图像的二值化图像。
6.根据权利要求1所述的用于表格线大块干扰去除方法,其特征在于,所述用于表格线大块干扰去除方法还包括:
根据预设直线检测方法对所述二值化图像中的水平表格线和竖直表格线进行检测,去除非表格线的干扰线。
7.根据权利要求1所述的用于表格线大块干扰去除方法,其特征在于,所述用于表格线大块干扰去除方法还包括:
根据所述二值化图像中的水平表格线和竖直表格线重建表格,并根据表格相交特征修正所述重建表格;
检测所述重建表格各个交点,并获取所述重建表格中各个单元格的四个坐标点,采用基于字符识别模型对各个单元格中的字符进行识别;
根据预设的标准映射表,对所述重构表格并进行校验。
8.一种用于表格线大块干扰去除装置,其特征在于,包括:
初始化模块,用于获取待处理表格图像,并对获取的所述待处理表格图像进行预处理,形成初始表格图像;
二值化图像模块,用于获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;
平移模块,用于对所述二值化图像进行平移获取平移图像;
干扰切断模块,用于从所述二值化图像中去除所述平移图像,切断所述二值化图像中的大块干扰。
9.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述电子终端执行如权利要求1至7中任一项所述的用于表格线大块干扰去除方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的用于表格线大块干扰去除方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910988755.XA CN110751156A (zh) | 2019-10-17 | 2019-10-17 | 用于表格线大块干扰去除方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910988755.XA CN110751156A (zh) | 2019-10-17 | 2019-10-17 | 用于表格线大块干扰去除方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110751156A true CN110751156A (zh) | 2020-02-04 |
Family
ID=69278678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910988755.XA Pending CN110751156A (zh) | 2019-10-17 | 2019-10-17 | 用于表格线大块干扰去除方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110751156A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275051A (zh) * | 2020-02-28 | 2020-06-12 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和计算机可读存储介质 |
CN111414919A (zh) * | 2020-03-26 | 2020-07-14 | 遥相科技发展(北京)有限公司 | 带表格印刷体图片文字提取方法、装置、设备及存储介质 |
CN112893172A (zh) * | 2021-01-18 | 2021-06-04 | 菲特(天津)检测技术有限公司 | 基于机器视觉的垫片尺寸检测系统、方法、处理终端及介质 |
-
2019
- 2019-10-17 CN CN201910988755.XA patent/CN110751156A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275051A (zh) * | 2020-02-28 | 2020-06-12 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和计算机可读存储介质 |
CN111414919A (zh) * | 2020-03-26 | 2020-07-14 | 遥相科技发展(北京)有限公司 | 带表格印刷体图片文字提取方法、装置、设备及存储介质 |
CN111414919B (zh) * | 2020-03-26 | 2023-12-12 | 广州市巨应信息科技有限公司 | 带表格印刷体图片文字提取方法、装置、设备及存储介质 |
CN112893172A (zh) * | 2021-01-18 | 2021-06-04 | 菲特(天津)检测技术有限公司 | 基于机器视觉的垫片尺寸检测系统、方法、处理终端及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896349B2 (en) | Text detection method and apparatus, and storage medium | |
CN111860502B (zh) | 图片表格的识别方法、装置、电子设备及存储介质 | |
CN108875723B (zh) | 对象检测方法、装置和系统及存储介质 | |
CN110348264B (zh) | 一种qr二维码图像校正方法及系统 | |
CN105740876B (zh) | 一种图像预处理方法及装置 | |
US11107202B2 (en) | Contrast enhancement and reduction of noise in images from cameras | |
TW201740316A (zh) | 圖像文字的識別方法和裝置 | |
CN110751156A (zh) | 用于表格线大块干扰去除方法、系统、设备及介质 | |
CN110427946B (zh) | 一种文档图像二值化方法、装置和计算设备 | |
CN109509200A (zh) | 基于轮廓提取的棋盘格角点检测方法、装置以及计算机可读存储介质 | |
CN109948521B (zh) | 图像纠偏方法和装置、设备及存储介质 | |
CN114820594B (zh) | 基于图像检测板材封边缺陷的方法、相关设备及存储介质 | |
CN110807404A (zh) | 基于深度学习的表格线检测方法、装置、终端、存储介质 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
CN110708568B (zh) | 一种视频内容突变检测方法及装置 | |
CN110738030A (zh) | 表格重建方法、装置、电子设备及存储介质 | |
CN110570442A (zh) | 一种复杂背景下轮廓检测方法、终端设备及存储介质 | |
CN111047496A (zh) | 阈值确定方法、水印检测方法、装置和电子设备 | |
CN116071272A (zh) | 一种图像校正方法、装置、电子设备及其存储介质 | |
CN106663317B (zh) | 数字图像的形态学处理方法和数字图像处理装置 | |
CN113392455B (zh) | 基于深度学习的户型图比例尺检测方法、装置及电子设备 | |
CN108960246B (zh) | 一种用于图像识别的二值化处理装置及方法 | |
Kim et al. | Algorithm of a perspective transform-based PDF417 barcode recognition | |
CN113129298A (zh) | 文本图像的清晰度识别方法 | |
WO2024016686A1 (zh) | 角点检测的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200204 |