CN114463764A - 表格线检测方法、装置、计算机设备和存储介质 - Google Patents
表格线检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114463764A CN114463764A CN202210119573.0A CN202210119573A CN114463764A CN 114463764 A CN114463764 A CN 114463764A CN 202210119573 A CN202210119573 A CN 202210119573A CN 114463764 A CN114463764 A CN 114463764A
- Authority
- CN
- China
- Prior art keywords
- image
- scale
- region
- line
- table line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 103
- 230000004927 fusion Effects 0.000 claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000009466 transformation Effects 0.000 claims abstract description 39
- 238000004590 computer program Methods 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 26
- 238000012216 screening Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种表格线检测方法、装置、计算机设备、存储介质和计算机程序产品,可用于金融领域或其他领域。所述方法包括:获取表格线图像,对表格线图像进行多尺度变换,获得多尺度图像集,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像,通过直线检测算法,在融合后的表格线图像中提取得到表格线。采用本方法通过对表格线图像进行多尺度变换,获得的多尺度图像集能够表现出更清晰的表格线特征,通过区域生长和区域融合,能够将带有不同特征的多尺度图像集进行特征融合,这种在直线检测算法的基础上结合多尺度变换提取出表格线的方法,能够提高表格线检测的准确率。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种表格线检测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
表格是数据记录的重要载体,表格图像对日常生活中记录信息有着重要的地位,随着日常信息的爆炸式增长,普通表格已经无法满足我们的日常需求,T型表格和无序表格更多的应用于工作和生活中。表格图像识别,核心在于表格线的检测,由于多样表格的出现,表格线间的联系不再强烈,同时表格图像更多时候会出现表格倾斜的现象,对表格线的检测准确率有着不同程度的影响。
目前表格线检测方法普遍采用基于像素点的表格线检测,然而基于像素点的表格线检测对样本质量要求较高,针对T型表格以及不清晰的表格线,存在表格线检测准确率低的问题。
发明内容
基于此,有必要针对传统表格线检测准确率低的问题,提供一种能够提高表格线检测准确率的表格线检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种表格线检测方法。所述方法包括:
获取表格线图像;
对表格线图像进行多尺度变换,获得多尺度图像集;
根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;
通过直线检测算法,在融合后的表格图像中提取得到表格线。
在其中一个实施例中,对表格线图像进行多尺度变换,获得多尺度图像集包括:
获取表格线图像的像素值;
将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间;
更新高斯核函数的标准差,返回将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间的步骤;
归集不同尺度空间下对应的多尺度图像,得到多尺度图像集。
在其中一个实施例中,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像包括:
根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域;
根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像。
在其中一个实施例中,根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域包括:
获取多尺度图像集的梯度值;
将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值;
若梯度差值小于或者等于预设阈值,则将当前像素点和相邻像素点结合,获得结合后的像素点;
将结合后的像素点赋给当前像素点,返回将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值的步骤;
根据结合后的像素点,获得多尺度图像的生长区域;
归集所有多尺度图像的生长区域,获得多尺度图像集的生长区域。
在其中一个实施例中,根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像包括:
根据多尺度图像集的生长区域,获得生长区域的区域角度、并在生长区域中选取目标生长区域;
将多尺度图像集的生长区域的区域角度与目标生长区域的区域角度求差,获得区域角度差值;
若区域角度差值小于或者等于第一预设角度阈值,则获得筛选后的生长区域;
将筛选后的生长区域进行融合,获得融合后的表格线图像。
在其中一个实施例中,通过直线检测算法,在融合后的表格图像中提取得到表格线包括:
根据融合后的表格线图像,通过直线检测算法,获得融合后的表格线图像中的线段;
获取线段的长度、线段的角度以及线段的错误预警值;
将每条线段的长度和对应的线段的错误预警值做加权平均,获得每条线段对应的加权平均值;
选取最大的加权平均值对应的线段,获得目标线段;
将线段的角度与目标线段的角度求差,获得线段角度差值;
若线段角度差值小于或者等于第二预设角度阈值,则获得第一表格线段集;
若线段角度差值与π/2之差小于或者等于第二预设角度阈值,则获得第二表格线段集;
归集第一表格线段集和第二表格线段集,获得表格线。
第二方面,本申请还提供了一种表格线检测装置。所述装置包括:
图像获取模块,用于获取表格线图像;
多尺度变换模块,用于对表格线图像进行多尺度变换,获得多尺度图像集;
图像集融合模块,用于根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;
表格线提取模块,用于通过直线检测算法,在融合后的表格图像中提取得到表格线。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取表格线图像;对表格线图像进行多尺度变换,获得多尺度图像集;根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;通过直线检测算法,在融合后的表格图像中提取得到表格线。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取表格线图像;对表格线图像进行多尺度变换,获得多尺度图像集;根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;通过直线检测算法,在融合后的表格图像中提取得到表格线。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取表格线图像;对表格线图像进行多尺度变换,获得多尺度图像集;根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;通过直线检测算法,在融合后的表格图像中提取得到表格线。
上述表格线检测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取表格线图像,对表格线图像进行多尺度变换,获得多尺度图像集,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像,通过直线检测算法,在融合后的表格线图像中提取得到表格线。上述方案,通过对表格线图像进行多尺度变换,获得的多尺度图像集能够表现出更清晰的表格线特征,通过区域生长和区域融合,能够将带有不同特征的多尺度图像集进行特征融合,通过直线检测算法提取融合后的表格线图像中的表格线,对于倾斜的表格线检测仍具有较高的正确率,这种在直线检测算法的基础上结合多尺度变换提取出表格线的方法,能够提高表格线检测的准确率。
附图说明
图1为一个实施例中表格线检测方法的应用环境图;
图2为一个实施例中表格线检测方法的流程示意图;
图3为一个实施例中表格线检测步骤的流程示意图;
图4为另一个实施例中表格线检测方法的流程示意图;
图5为一个实施例中S640的子流程示意图;
图6为一个实施例中区域生长和区域融合的流程示意图;
图7为一个实施例中表格线检测装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的表格线检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102获取表格线图像,对表格线图像进行多尺度变换,获得多尺度图像集,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像,通过直线检测算法,在融合后的表格图像中提取得到表格线。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种表格线检测方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
S200,获取表格线图像。
其中,表格是数据记录的重要载体,一般由平行和垂直的线段组成,表格线图像是包含表格线的图像,表格图像的识别核心在于表格线的检测,表格的类型可以为T型表格或者无序表格,本申请对采用的表格类型不做具体限定,表格线图像中的表格线角度可以为平行或者倾斜,本申请对表格线图像中的表格线角度不做具体限定,表格线图像的应用场景可以包括财务报表图像、转账单图像以及凭证单图像,本申请对表格线图像的应用场景不做限定。
具体地,获取表格线图像。
S400,对表格线图像进行多尺度变换,获得多尺度图像集。
其中,图像的多尺度是指图像的不同分辨率,图像的尺度越大,分辨率越低,图像的模糊程度越高,图像在多尺度下具有特征不变性,在不同的尺度下输入的同一图像,检测出的关键点是相同的,对图像进行多尺度变换,即是获得图像在不同尺度下的图像集。在提取图像的特征时,如果采取固定尺度的特征检测,就会得到偏向该尺度检测结果,而漏检很多其他尺度的特征,在图像的多个尺度上进行检测,可以使不同尺度图像中的特征被检测出。
具体地,对表格线图像进行多尺度变换,获得多尺度图像集。
S600,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像。
其中,区域生长是指将成组的像素或区域发展成更大区域的过程,从种子点的集合开始,从这些点的区域增长是通过将与每个种子点有相似属性,比如强度、灰度级、纹理颜色等的相邻像素合并到此区域,区域融合是将图像或者图像集中满足特定条件的图像区域结合在一起的过程,图像集中的图像经过区域生长后的,将满足特定条件的图像区域结合在一起,获得融合后的图像。
具体地,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像。
S800,通过直线检测算法,在融合后的表格图像中提取得到表格线。
其中,直线检测是图像检测技术中用于检测图像中直线的方法,常见的直线检测算法包括Hough_line(霍夫线)、LSD(Line Segment Detector,直线段检测)、FLD(FastLine Detector,快速直线检测)、EDlines(Edge Drawing lines,边缘绘制线)、LSWMS(LineSegment using Weighted Mean-Shift,加权均值偏移的线段)、CannyLines直线检测算法、MCMLSD(马尔可夫链边缘线段检测器)直线检测算法以及LSM(Log Structured MergeTrees,日志结构合并树),本申请对采用的直线检测算法类型不做具体限定。通过直线检测算法,可以从融合后的表格图像中提取出表格线。
具体地,通过直线检测算法,在融合后的表格图像中提取得到表格线。
上述表格线检测方法中,通过获取表格线图像,对表格线图像进行多尺度变换,获得多尺度图像集,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像,通过直线检测算法,在融合后的表格线图像中提取得到表格线。上述实施例的方案,通过对表格线图像进行多尺度变换,获得的多尺度图像集能够表现出更清晰的表格线特征,通过区域生长和区域融合,能够将带有不同特征的多尺度图像集进行特征融合,通过直线检测算法提取融合后的表格线图像中的表格线,对于倾斜的表格线检测仍具有较高的正确率,这种在直线检测算法的基础上结合多尺度变换提取出表格线的方法,能够提高表格线检测的准确率。
在一个实施例中,如图3所示,对表格线图像进行多尺度变换,获得多尺度图像集包括:
S420,获取表格线图像的像素值;
S440,将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间;
S460,更新高斯核函数的标准差,返回将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间的步骤;
S480,归集不同尺度空间下对应的多尺度图像,得到多尺度图像集。
本实施例中,像素是图像的计算单位,图像的分辨率越高,所包含的像素就越多,图像就越清晰,根据获得的图像,可以获得图像的像素值。尺度空间方法是将传统的单尺度视觉信息处理技术纳入尺度不断变化的动态分析框架中,因此更容易获得图像的本质特征,尺度空间的生成目的是模拟图像数据多尺度特征,而高斯卷积核是实现尺度变换的唯一线性核。高斯核函数(Gaussian kernel)也称径向基函数,是某种沿径向对称的标量函数,高斯核函数的核心思想是将每一个样本点映射到一个无穷维的特征空间,从而使原本线性不可分的数据能够线性可分,高斯核函数的定义为:
获取表格线图像的像素值I(x,y),将表格线图像的像素值与高斯核函数Gσ做卷积运算,获得表格线图像的尺度空间Iσ(x,y),其中,Iσ(x,y)=I(x,y)*Gσ(x,y),σ为高斯核函数的标准差,也即为图像的尺度,更新高斯核函数的标准差,返回将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间的步骤,也即为更新图像的尺度,获得更新后的高斯核函数,将更新后的高斯核函数带入尺度空间计算公式,获得不同尺度对应的尺度空间,每个尺度空间对应一个尺度的表格线图像,归集不同尺度空间下对应的多尺度图像,得到多尺度图像集。
上述实施例的方案,通过获取表格线图像的像素值,将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间,更新高斯核函数的标准差,获得多尺度空间,归集不同尺度空间下对应的多尺度图像,得到多尺度图像集,这种基于多尺度空间变换的图像处理方法能够呈现多尺度下的表格线图像特征,有利于不同尺度表格线图像中的特征被检测出,提高表格线检测的准确性。
在一个实施例中,如图4所示,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像包括:
S620,根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域;
S640,根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像。
本实施例中,根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域,具体地,将多尺度图像集中每个尺度的表格线图像通过区域生长,获得每个尺度表格线的生长区域,归集所有尺度表格线的生长区域,获得多尺度图像集的生长区域。图像在不同尺度下呈现出不同的特征,单一尺度下的生长区域很容易受到噪声干扰,根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像,具体地,将不同尺度表格线图像的生长区域在同一位置下进行区域融合,获得融合后的表格线图像。
上述实施例的方案,根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域,根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像,能够将多尺度表格线图像集中的不同特征区域融合起来,获得的融合后的表格线图像相较于多尺度变换前的表格线图像具有清晰的特征,有利于表格线特征被检测出,提高表格线检测的准确性。
在一个实施例中,根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域包括:获取多尺度图像集的梯度值;将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值;若梯度差值小于或者等于预设阈值,则将当前像素点和相邻像素点结合,获得结合后的像素点;将结合后的像素点赋给当前像素点,返回将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值的步骤;根据结合后的像素点,获得多尺度图像的生长区域;归集所有多尺度图像的生长区域,获得多尺度图像集的生长区域。
本实施例中,获取多尺度图像集的梯度值,具体地,根据获得的多尺度图像集,获得每个尺度表格线图像中每个像素点处的梯度值,还可以获取每个像素点处的梯度向量,选取多尺度图像中的当前像素点,当前像素点周围有8个相邻像素点,将多尺度图像中的当前像素点梯度值与每个相邻像素点的梯度值求差,获得多个梯度差值,若梯度差值小于或者等于预设阈值,则将当前像素点和该相邻像素点结合,获得结合后的像素点,返回将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值的步骤,继续将符合梯度差值小于或者等于预设阈值的像素点结合起来,获得多尺度图像的生长区域,归集所有的多尺度图像的生长区域,获得多尺度图像集的生长区域。
上述实施例的方案,通过获取多尺度图像集的梯度值,将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,判断梯度差值与预设阈值的大小,将满足梯度差值小于或者等于预设阈值的像素点结合起来,循环执行,获得结合后的像素点,进而获得多尺度图像集的生长区域,该方法通过判断当前像素点与相邻像素点的梯度差值与预设阈值的大小进行像素点集合,获得的多尺度图像集的生长区域相较于多尺度变换前的表格线图像具有清晰的特征,有利于表格线特征被检测出,提高表格线检测的准确性。
在一个实施例中,如图5所示,根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像包括:
S642,根据多尺度图像集的生长区域,获得生长区域的区域角度、并在生长区域中选取目标生长区域;
S644,将多尺度图像集的生长区域的区域角度与目标生长区域的区域角度求差,获得区域角度差值;
S646,若区域角度差值小于或者等于第一预设角度阈值,则获得筛选后的生长区域;
S648,将筛选后的生长区域进行融合,获得融合后的表格线图像。
本实施例中,根据多尺度图像集的生长区域,获得生长区域的区域角度,并在生长区域中选取目标生长区域,将每个多尺度图像的区域角度与目标生长区域的区域角度求差,获得的区域角度差值与预设第一角度阈值比较大小,将区域角度差值大于第一预设角度阈值的生长区域视为无关区域进行剔除,将区域角度差值小于或者等于第一预设角度阈值的生长区域筛选出来,获得筛选后的生长区域,筛选后的生长区域进行融合后,得到最终融合后的表格线图像。
上述实施例的方案,通过获得多尺度图像集生长区域的区域角度,并选取目标生长区域,根据多尺度图像集的生长区域的区域角度与目标生长区域的区域角度的差值,将区域角度差值小于或者等于第一预设角度阈值的生长区域筛选出来,并进行融合,获得的融合后的表格线图像相较于多尺度变换前的表格线图像具有清晰的特征,有利于表格线特征被检测出,提高表格线检测的准确性。
在一个实施例中,通过直线检测算法,在融合后的表格图像中提取得到表格线包括:根据融合后的表格线图像,通过直线检测算法,获得融合后的表格线图像中的线段;获取线段的长度、线段的角度以及线段的错误预警值;将每条线段的长度和对应的线段的错误预警值做加权平均,获得每条线段对应的加权平均值;选取最大的加权平均值对应的线段,获得目标线段;将线段的角度与目标线段的角度求差,获得线段角度差值;若线段角度差值小于或者等于第二预设角度阈值,则获得第一表格线段集;若线段角度差值与π/2之差小于或者等于第二预设角度阈值,则获得第二表格线段集;归集第一表格线段集和第二表格线段集,获得表格线。
本实施例中,根据融合后的表格线图像,通过直线检测算法,检测出融合后的表格线图像中的线段,获得线段的长度和角度,在融合后的表格线图像中的每个区域构造一个外接矩形,计算每个线段的错误预警值(NFA),当线段的错误预警值小于或者等于预设预警值阈值,则判定该线段为直线段,否则不是直线段。由于表格线图像中的表格线一般都是平行或者垂直关系,首先确定一条最为可能的线段作为目标表格线,然后以该条目标表格线为基线,与其他直线段进行对比过来,判断其他直线段是否与该目标表格线近似平行或者近似垂直,从而获得过滤后的表格线,具体地,给每条线段的错误预警值和线段长度设置预设权重,根据预设权重,对每条线段的错误预警值和线段的长度做加权平均,选取最大的加权平均值对应的线段作为目标线段,将每条线段的角度与目标线段的角度求差,判断线段角度差值与第二预设角度阈值比较,将线段角度差值小于或者等于第二预设角度阈值的线段归集起来,作为第一表格线段集,第一表格线段集也即是与目标表格线近似平行的线段,将线段角度差值与π/2之差小于或者等于第二预设角度阈值归集起来作为第二表格线段集,第二表格线段集也即是与目标表格线近似垂直的线段,归集第一表格线段集和第二表格线段集,获得表格线。
上述实施例的方案,通过直线检测算法,提取出融合后的表格线图像中的线段,将每条线段的长度和对应的线段的错误预警值做加权平均,选取最大的加权平均值对应的线段作为目标线段,根据线段的角度与目标线段的角度差值,若线段角度差值小于或者等于第二预设角度阈值,则获得与目标表格线近似平行的第一表格线段集,若线段角度差值与π/2之差小于或者等于第二预设角度阈值,则获得与目标表格线近似垂直的第二表格线段集,归集第一表格线段集和第二表格线段集,获得表格线,在多尺度变换的基础上,该方法获得的表格线具有清晰的特征,有利于表格线特征被检测出,能够有效减少漏检情况,而且对表格线倾斜的场景和非封闭式表格线都具有较高的检测正确率,提高表格线检测的准确性。
为详细说明本方案中表格线检测方法及效果,下面以一个最详细实施例进行说明:
针对金融领域常见的财务报表图像检测场景,财务报表中包括表格线,获取财务报表图像I和财务报表图像的像素I(x,y)值,将财务报表图像的像素值与高斯核函数Gσ做卷积运算,获得财务报表图像的尺度空间Iσ(x,y),其中,Iσ(x,y)=I(x,y)*Gσ(x,y),高斯核标准差的σ可设置多个不同值,生成多个不同尺度的财务报表图像,归集不同尺度空间下对应的多尺度图像,得到多尺度图像集,并获取多尺度图像中像素点(x,y)处的梯度值
其中,Ix为水平梯度,Iy为垂直梯度,LLA为梯度向量。
将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值,若梯度差值小于或者等于预设阈值,则将当前像素点和相邻像素点结合,获得结合后的像素点,将结合后的像素点赋给当前像素点,返回将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值的步骤,根据结合后的像素点,获得多尺度图像的生长区域,归集所有多尺度图像的生长区域,获得多尺度图像集的生长区域,根据多尺度图像集的生长区域,获得生长区域的区域角度θ:
其中,Sx为生长区域的水平像素长度,Sy为生长区域的垂直像素长度。
在生长区域中选取目标生长区域,将多尺度图像集的生长区域的区域角度θi与目标生长区域的区域角度θR求差,获得区域角度差值,若区域角度差值小于或者等于第一预设角度阈值τ,则获得筛选后的生长区域,
|θR-θi|≤τ
将筛选后的生长区域进行融合,获得融合后的财务报表图像。如图6所示为区域生长和区域融合的流程示意图。
根据融合后的财务报表图像,通过直线检测算法,获得融合后的财务报表图像中的线段,对融合后财务报表图像中的每个区域构造一个外接矩形,计算每条线段的错误预警值(NFA),若NFA小于或者等于预设预警值阈值ε,记为:NFA≤ε,则判定该线段为直线段。获取线段的长度和线段的角度,将每条线段的长度和对应的线段的错误预警值NFAi做加权平均,获得每条线段对应的加权平均值pi,其中,f1和f2分别为NFA和线段长度的预设权重,
选取最大的加权平均值对应的线段,获得目标线段L,将线段的角度θj与目标线段的角度θL求差,获得线段角度差值,若线段角度差值小于或者等于第二预设角度阈值δ,则获得第一表格线段集,
|θL-θj|≤δ
若线段角度差值与π/2之差小于或者等于第二预设角度阈值,则获得第二表格线段集,
|θL-θi-π/2|≤δ
归集第一表格线段集和第二表格线段集,获得表格线。
本申请的方法还可以针对金融领域转账单图像检测场景,转账单中包括表格线,根据转账单图像,通过多尺度转换,获得多尺度图像集,通过区域生长和区域融合,获得融合后的转账单图像,通过直线检测算法,在融合后的转账单图像中提取得到表格线。需要说明的是,本申请公开的表格线检测方法和装置还可以用于其他场景下的表格线检测,本申请公开的表格线检测方法和装置适用的场景不做限定。
上述表格线检测方法,通过获取表格线图像,对表格线图像进行多尺度变换,获得多尺度图像集,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像,通过直线检测算法,在融合后的表格线图像中提取得到表格线。上述实施例的方案,通过对表格线图像进行多尺度变换,获得的多尺度图像集能够表现出更清晰的表格线特征,通过区域生长和区域融合,能够将带有不同特征的多尺度图像集进行特征融合,通过直线检测算法提取融合后的表格线图像中的表格线,对于倾斜的表格线检测仍具有较高的正确率,这种在直线检测算法的基础上结合多尺度变换提取出表格线的方法,能够提高表格线检测的准确率。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的表格线检测方法的表格线检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个表格线检测装置实施例中的具体限定可以参见上文中对于表格线检测方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种表格线检测装置100,包括:图像获取模块120、多尺度变换模块140、图像集融合模块160和表格线提取模块180,其中:
图像获取模块120,用于获取表格线图像。
多尺度变换模块140,用于对表格线图像进行多尺度变换,获得多尺度图像集。
图像集融合模块160,用于根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像。
表格线提取模块180,用于通过直线检测算法,在融合后的表格图像中提取得到表格线。
上述表格线检测装置,通过获取表格线图像,对表格线图像进行多尺度变换,获得多尺度图像集,根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像,通过直线检测算法,在融合后的表格线图像中提取得到表格线。上述实施例的方案,通过对表格线图像进行多尺度变换,获得的多尺度图像集能够表现出更清晰的表格线特征,通过区域生长和区域融合,能够将带有不同特征的多尺度图像集进行特征融合,通过直线检测算法提取融合后的表格线图像中的表格线,对于倾斜的表格线检测仍具有较高的正确率,这种在直线检测算法的基础上结合多尺度变换提取出表格线的方法,能够提高表格线检测的准确率。
在一个实施例中,多尺度变换模块140还用于获取表格线图像的像素值;将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间;更新高斯核函数的标准差,返回将表格线图像的像素值与高斯核函数做卷积运算,获得表格线图像的尺度空间的步骤;归集不同尺度空间下对应的多尺度图像,得到多尺度图像集。
在一个实施例中,图像集融合模块160还用于根据多尺度图像集,通过区域生长,获得多尺度图像集的生长区域;根据多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像。
在一个实施例中,图像集融合模块160还用于获取多尺度图像集的梯度值;将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值;若梯度差值小于或者等于预设阈值,则将当前像素点和相邻像素点结合,获得结合后的像素点;将结合后的像素点赋给当前像素点,返回将多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值的步骤;根据结合后的像素点,获得多尺度图像的生长区域;归集所有多尺度图像的生长区域,获得多尺度图像集的生长区域。
在一个实施例中,图像集融合模块160还用于根据多尺度图像集的生长区域,获得生长区域的区域角度、并在生长区域中选取目标生长区域;将多尺度图像集的生长区域的区域角度与目标生长区域的区域角度求差,获得区域角度差值;若区域角度差值小于或者等于第一预设角度阈值,则获得筛选后的生长区域;将筛选后的生长区域进行融合,获得融合后的表格线图像。
在一个实施例中,表格线提取模块180还用于根据融合后的表格线图像,通过直线检测算法,获得融合后的表格线图像中的线段;获取线段的长度、线段的角度以及线段的错误预警值;将每条线段的长度和对应的线段的错误预警值做加权平均,获得每条线段对应的加权平均值;选取最大的加权平均值对应的线段,获得目标线段;将线段的角度与目标线段的角度求差,获得线段角度差值;若线段角度差值小于或者等于第二预设角度阈值,则获得第一表格线段集;若线段角度差值与π/2之差小于或者等于第二预设角度阈值,则获得第二表格线段集;归集第一表格线段集和第二表格线段集,获得表格线。
上述表格线检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储表格线图像和多尺度图像集。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种表格线检测方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取表格线图像;对表格线图像进行多尺度变换,获得多尺度图像集;根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;通过直线检测算法,在融合后的表格图像中提取得到表格线。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取表格线图像;对表格线图像进行多尺度变换,获得多尺度图像集;根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;通过直线检测算法,在融合后的表格图像中提取得到表格线。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取表格线图像;对表格线图像进行多尺度变换,获得多尺度图像集;根据多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;通过直线检测算法,在融合后的表格图像中提取得到表格线。
需要说明的是,本申请公开的表格线检测方法和装置可用于金融领域的表格线检测,也可用于除金融领域之外任意领域的表格线检测,本申请公开的表格线检测方法和装置的应用领域不做限定,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种表格线检测方法,其特征在于,所述方法包括:
获取表格线图像;
对所述表格线图像进行多尺度变换,获得多尺度图像集;
根据所述多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;
通过直线检测算法,在所述融合后的表格图像中提取得到表格线。
2.根据权利要求1所述的表格线检测方法,其特征在于,所述对所述表格线图像进行多尺度变换,获得多尺度图像集包括:
获取所述表格线图像的像素值;
将所述表格线图像的像素值与高斯核函数做卷积运算,获得所述表格线图像的尺度空间;
更新所述高斯核函数的标准差,返回将所述表格线图像的像素值与高斯核函数做卷积运算,获得所述表格线图像的尺度空间的步骤;
归集不同尺度空间下对应的多尺度图像,得到多尺度图像集。
3.根据权利要求1所述的表格线检测方法,其特征在于,所述根据所述多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像包括:
根据所述多尺度图像集,通过区域生长,获得所述多尺度图像集的生长区域;
根据所述多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像。
4.根据权利要求3所述的表格线检测方法,其特征在于,所述根据所述多尺度图像集,通过区域生长,获得所述多尺度图像集的生长区域包括:
获取所述多尺度图像集的梯度值;
将所述多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值;
若所述梯度差值小于或者等于预设阈值,则将所述当前像素点和所述相邻像素点结合,获得结合后的像素点;
将所述结合后的像素点赋给所述当前像素点,返回将所述多尺度图像中的当前像素点梯度值与相邻像素点的梯度值求差,获得梯度差值的步骤;
根据所述结合后的像素点,获得所述多尺度图像的生长区域;
归集所有所述多尺度图像的生长区域,获得所述多尺度图像集的生长区域。
5.根据权利要求3所述的表格线检测方法,其特征在于,所述根据所述多尺度图像集的生长区域,通过区域融合,获得融合后的表格线图像包括:
根据所述多尺度图像集的生长区域,获得所述生长区域的区域角度、并在所述生长区域中选取目标生长区域;
将所述多尺度图像集的生长区域的区域角度与所述目标生长区域的区域角度求差,获得区域角度差值;
若所述区域角度差值小于或者等于第一预设角度阈值,则获得筛选后的所述生长区域;
将所述筛选后的所述生长区域进行融合,获得融合后的表格线图像。
6.根据权利要求1所述的表格线检测方法,其特征在于,所述通过直线检测算法,在所述融合后的表格图像中提取得到表格线包括:
根据所述融合后的表格线图像,通过直线检测算法,获得所述融合后的表格线图像中的线段;
获取所述线段的长度、所述线段的角度以及所述线段的错误预警值;
将每条所述线段的长度和对应的所述线段的错误预警值做加权平均,获得每条所述线段对应的加权平均值;
选取最大的所述加权平均值对应的所述线段,获得目标线段;
将所述线段的角度与所述目标线段的角度求差,获得线段角度差值;
若所述线段角度差值小于或者等于第二预设角度阈值,则获得第一表格线段集;
若所述线段角度差值与π/2之差小于或者等于第二预设角度阈值,则获得第二表格线段集;
归集所述第一表格线段集和所述第二表格线段集,获得表格线。
7.一种表格线检测装置,其特征在于,所述装置包括:
图像获取模块,用于获取表格线图像;
多尺度变换模块,用于对所述表格线图像进行多尺度变换,获得多尺度图像集;
图像集融合模块,用于根据所述多尺度图像集,通过区域生长和区域融合,获得融合后的表格线图像;
表格线提取模块,用于通过直线检测算法,在所述融合后的表格图像中提取得到表格线。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119573.0A CN114463764A (zh) | 2022-02-08 | 2022-02-08 | 表格线检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119573.0A CN114463764A (zh) | 2022-02-08 | 2022-02-08 | 表格线检测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114463764A true CN114463764A (zh) | 2022-05-10 |
Family
ID=81413050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210119573.0A Pending CN114463764A (zh) | 2022-02-08 | 2022-02-08 | 表格线检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114463764A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117670917A (zh) * | 2024-02-02 | 2024-03-08 | 深圳市欧冶半导体有限公司 | 图像边缘检测方法、装置、计算机设备和存储介质 |
-
2022
- 2022-02-08 CN CN202210119573.0A patent/CN114463764A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117670917A (zh) * | 2024-02-02 | 2024-03-08 | 深圳市欧冶半导体有限公司 | 图像边缘检测方法、装置、计算机设备和存储介质 |
CN117670917B (zh) * | 2024-02-02 | 2024-05-07 | 深圳市欧冶半导体有限公司 | 图像边缘检测方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111080628B (zh) | 图像篡改检测方法、装置、计算机设备和存储介质 | |
Xie et al. | Multilevel cloud detection in remote sensing images based on deep learning | |
Xie et al. | Hyperspectral image super-resolution using deep feature matrix factorization | |
CN111199214B (zh) | 一种残差网络多光谱图像地物分类方法 | |
CN110781756A (zh) | 基于遥感图像的城市道路提取方法及装置 | |
CN110825900A (zh) | 特征重构层的训练方法、图像特征的重构方法及相关装置 | |
CN115035295B (zh) | 一种基于共享卷积核和边界损失函数的遥感图像语义分割方法 | |
CN110163294B (zh) | 基于降维操作和卷积网络的遥感图像变化区域检测方法 | |
CN111179270A (zh) | 基于注意力机制的图像共分割方法和装置 | |
CN115759148B (zh) | 图像处理方法、装置、计算机设备及计算机可读存储介质 | |
CN109064402B (zh) | 基于增强非局部总变分模型先验的单幅图像超分辨率重建方法 | |
CN114743189A (zh) | 指针式仪表读数识别方法、装置、电子设备及存储介质 | |
CN114241388A (zh) | 基于时空记忆信息的视频实例分割方法和分割装置 | |
CN113222921A (zh) | 一种图像处理方法及系统 | |
CN110516731B (zh) | 一种基于深度学习的视觉里程计特征点检测方法及系统 | |
CN111898693A (zh) | 能见度分类模型的训练方法、能见度估计方法、装置 | |
CN110163095B (zh) | 回环检测方法、回环检测装置及终端设备 | |
CN114463764A (zh) | 表格线检测方法、装置、计算机设备和存储介质 | |
Zeng et al. | Ro-SOS: Metric Expression Network (MEnet) for Robust Salient Object Segmentation | |
CN113918744A (zh) | 相似图像检索方法、装置、存储介质及计算机程序产品 | |
CN116503677B (zh) | 一种湿地分类信息提取方法、系统、电子设备及存储介质 | |
CN117409330A (zh) | 水生植被识别方法、装置、计算机设备和存储介质 | |
CN115797291A (zh) | 回路端子的识别方法、装置、计算机设备和存储介质 | |
CN113051901B (zh) | 一种身份证文本识别方法、系统、介质及电子终端 | |
CN114511862A (zh) | 表格识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |