CN113989314A - 一种基于霍夫变换直线检测去除页眉页脚的方法 - Google Patents

一种基于霍夫变换直线检测去除页眉页脚的方法 Download PDF

Info

Publication number
CN113989314A
CN113989314A CN202111250579.3A CN202111250579A CN113989314A CN 113989314 A CN113989314 A CN 113989314A CN 202111250579 A CN202111250579 A CN 202111250579A CN 113989314 A CN113989314 A CN 113989314A
Authority
CN
China
Prior art keywords
image
header
footers
page
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111250579.3A
Other languages
English (en)
Inventor
石朵伟
陈淑华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Original Assignee
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd filed Critical Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority to CN202111250579.3A priority Critical patent/CN113989314A/zh
Publication of CN113989314A publication Critical patent/CN113989314A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20061Hough transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于霍夫变换直线检测去除页眉页脚的方法,通过基于相位一致性方法提取合同类文本图像边缘信息,并通过霍夫变换直线检测页眉页脚处的横线,用背景色填充页眉页脚处区域,以此抹除页眉页脚,提高后续文本信息的提取精度,适应多样性板式合同类文本图像的识别需求,提高识别效率。

Description

一种基于霍夫变换直线检测去除页眉页脚的方法
技术领域
本发明涉及OCR文字识别技术领域,尤其涉及一种基于霍夫变换直线检测去除页眉页脚的方法。
背景技术
OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。在业务流程中用户上传的合同类文本图像中包含页眉页脚信息,其中,页眉页脚信息中存在合同名称和公司名称文本信息会对后续文本关键信息提取造成大的干扰。用户提供合同类文本图像中由于拍照方式多样和合同类文本图像模板多样,设定固定图片比例去除页眉页脚会出现以下两种情况:第一种情况是固定高度比例设定太小导致页眉页脚未能全部去除,出现页眉页脚信息干扰后续文本关键信息提取;第二种情况是固定高度比例设定太大导致文本关键信息丢失。现有的技术通过高度比例识别版式固定的图片中页眉页脚,计算OCR文本识别出文本行的位置信息,计算行高、行距等排版信息;根据页眉页脚在不同图片中的重复性,及位置、行高等特性识别出页眉、页脚的文本块,并去除页眉页脚。该技术目前存在的两个主要问题:
1.该技术适应板式固定的文本图片,该技术不适应多样性板式合同类文本图像;
2.该技术需要统计每张图片行高和行距才能识别出页眉页脚的文本块,效率比较低。
因此,现有技术存在缺陷,需要改进。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于霍夫变换直线检测去除页眉页脚的方法。
本发明的技术方案如下:提供一种基于霍夫变换直线检测去除页眉页脚的方法,包括如下步骤:
步骤1:对读入的合同类文本图像进行预处理;
步骤2:初步设定页眉页脚处横线所占图像高度比例,剪切页眉页脚横线区域;
步骤3:对剪切之后的图像进行灰度化处理,获得灰度图像;
步骤4:基于相位一致性方法提取灰度图像边缘并获得边缘图像;
步骤5:对获得的边缘图片采用霍夫变换检测直线方法检测页眉页脚处横线位置;
步骤6:对页眉处横线以上部分区域以及页脚处横线以下部分区域进行背景色填充;
步骤7:完成背景色填充后,输出图像,实现文本类图像的页眉页脚去除。
进一步地,所述步骤1的具体步骤如下:
步骤1.1:对读入的图片进行预判,利用傅里叶变换对读入的图片进行分类,将图片分为正常图片或噪声图片;
步骤1.2:若经过步骤1.1判别为正常图片,直接结束图片处理流程;
步骤1.3:若经过步骤1.1判别为噪声图片,则利用小波变换对图片进行降噪。
进一步地,所述步骤4中所采用的相位一致性方法计算图像边缘信息的步骤为:对图像信号进行傅里叶级数展开,然后计算所有频率成分的相位一致性,检测出各个方向的阶跃、线、角等特征,提取图像的纹理特征,获得边缘图像。
进一步地,所述步骤5的具体步骤为:
步骤5.1:将图像信息转换为霍夫参数空间中的点-线坐标图;
步骤5.2:在霍夫参数空间中进行累加统计;
步骤5.3:寻找霍夫参数空间中累加器的峰值,从而检测图像中的页眉页脚处横线位置。
采用上述方案,本发明基于相位一致性方法提取合同类文本图像边缘信息,并通过霍夫变换直线检测页眉页脚处的横线,用背景色填充页眉页脚处区域,以此抹除页眉页脚,提高后续文本信息的提取精度,适应多样性板式合同类文本图像的识别需求,提高识别效率。
附图说明
图1为本发明的流程框图。
具体实施方式
以下结合附图和具体实施例,对本发明进行详细说明。
请参阅图1,本发明提供一种基于霍夫变换直线检测去除页眉页脚的方法,包括如下步骤:
步骤1:对读入的合同类文本图像进行预处理。
用户提供的合同类文本图像存在大量的纹理噪声图片,纹理噪声图片会对后续边缘检测和直线检测产生较强的干扰,因此,需要对读入的图片进行预判,并对纹理噪声图片进行降噪。
图片的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。一般来讲,梯度大则该点的亮度强,否则该点亮度弱。这样通过观察傅里叶变换后的频谱图,也叫功率图,以此可知,在图片的能量分布中,如果频谱图中暗的点数更多,因为各点与邻域差异都不大,梯度相对较小,因此实际图像比较柔和;反之,如果频谱图中亮的点数多,那么实际图像一定是尖锐的,边界分明且边界两边像素差异较大。对频谱移频到原点以后,可以看出图像的频率分布是以原点为圆心,对称分布的。同时,还可以分离出有周期性规律的干扰信号,以此判断出读入的图片是正常图片或噪声图片。
具体步骤如下:
步骤1.1:对读入的图片进行预判,利用傅里叶变换对读入的图片进行分类,将图片分为正常图片或噪声图片;
步骤1.2:若经过步骤1.1判别为正常图片,直接结束图片处理流程;
步骤1.3:若经过步骤1.1判别为噪声图片,则利用小波变换对图片进行降噪。
步骤2:初步设定页眉页脚处横线所占图像高度比例,剪切页眉页脚横线区域。
如果直接对整个图像进行直线检测会造成较大的计算量,同时文本区域也会出现下划线干扰页眉页脚处横线的检测。因此,通过观察用户提供合同类文本图像数据,判定页眉页脚处横线所在占图像高度比例,初步设定页眉页脚处横线高度比例并对图像进行裁切。
步骤3:对剪切之后的图像进行灰度化处理,获得灰度图像。
步骤4:基于相位一致性方法提取灰度图像边缘并获得边缘图像。对图像信号进行傅里叶级数展开,然后计算所有频率成分的相位一致性,检测出各个方向的阶跃、线、角等特征,提取图像的纹理特征,获得边缘图像。
图像信号I进行傅里叶级数展开:
Figure BDA0003322331160000041
其中,An为第n个余弦分量的振幅,
Figure BDA0003322331160000042
代表傅里叶变量在x位置的局部相位。
其一维信号在x处的表现形式:
Figure BDA0003322331160000051
其中,An表示第n级傅里叶级数的系数,φn(x)表示第n级傅里叶变量在x处的局部相位,
Figure BDA0003322331160000052
表示在x处的平均相位,相位一致性PC1取值在[0,1]。如果PC1=1,表示所有的频率成分在x处相位一致。
通过将原图像与二维滤波器卷积求取图像相位的一致性,其中使相位一致性达到最大的点即为图像的边界点。相对传统基于梯度的检测算子,相位一致性方法具有光照条件变化和对比度变化的鲁棒性,能获得更加丰富和精准的合同类文本图像边缘信息,进行非极大值抑制处理和图像骨架化处理细化边缘和突出伪边缘。
步骤5:对获得的边缘图片采用霍夫变换检测直线方法检测页眉页脚处横线位置。具体步骤为:
步骤5.1:将图像信息转换为霍夫参数空间中的点-线坐标图;
步骤5.2:在霍夫参数空间中进行累加统计;
步骤5.3:寻找霍夫参数空间中累加器的峰值,从而检测图像中的页眉页脚处横线位置。
利用图像空间和霍夫参数空间的点-线对偶性,把图像空间中的检测问题转化到参数空间;通过参数空间里进行简单的累加统计,然后在霍夫参数空间寻找累加器峰值的方法检测直线;这样就把合同类文本图像中给定曲线的检测问题转化为寻找空间中的峰值问题。
在图像空间x-y中,一条直线在直角坐标系下可以表示为:y=kx+b。
其中,k和b是参数,表示直线的斜率和截距。
过某一点A(x0,y0)的所有直线的参数均满足方程y0=k*x0+b,即点A(x0,y0)确定了一族直线。
如果我们将方程改写为:b=-kx0+y0
也就是图像空间x-y中的点(x0,y0)对应了参数空间k-b中的直线b=-k*x0+y0。由此,图像空间的点与参数空间中的直线一一对应。
图像空间中的直线与参数空间中的直线一一对应:
在直线y=kx+b上再增加一个点B(x1,y1),那么点B(x1,y1)在参数空间k-b中同样对应了一条直线。图像空间中x-y中的点A和点B在参数空间k-b中个对应的直线相交于一点,也就是说AB所确定的直线,在参数空间中对应着唯一一个点。
参数空间的选择:
参数空间是不能选择直角坐标系的,因为原始图像直角坐标空间中的特殊直线x=c(垂直x轴,直线的斜率为无穷大)是没办法在基于直角坐标系的参数空间中表示的。一般采用极坐标方式作为参数空间,用极坐标表示为:r=xcosθ+ysinθ。
参数空间的每个点(ρ,θ)都对应了图像空间的一条直线,或者说图像空间的一个点在参数空间中就对应为一条曲线。参数空间采用极坐标系,以此在参数空间表示原始空间中的所有直线,从而检测页眉页脚处的横线。
步骤6:对页眉处横线以上部分区域以及页脚处横线以下部分区域进行背景色填充。
霍夫变换直线检测页眉处横线后,计算得到向高度坐标最大值header,对图像高度header以上,图像宽度保持不变的区域进行背景色填充。背景色RGB三个值是统计图像高度的第header+5行中出现次数最多RGB三个值;
霍夫变换直线检测页脚处横线后,计算得到横向高度坐标最小值footer,对图像高度footer以下,图像宽度保持不变的区域进行背景色填充。背景色RGB三个值是统计图像高度的第footer-5行中出现次数最多RGB三个值。
采用背景色填充页眉页脚处区域,以使得合同类文本图像整体更为自然,提高图片效果。
步骤7:完成背景色填充后,输出图像,实现文本类图像的页眉页脚去除。
本发明对光照条件变化和对比度变化的合同类文本图像的页眉页脚处横线进行检测,并将页眉页脚去除,具有很强的鲁棒性,保证了OCR文本识别文本信息结构化的正确性,提高文本信息提取精度和效率。
综上所述,本发明基于相位一致性方法提取合同类文本图像边缘信息,并通过霍夫变换直线检测页眉页脚处的横线,用背景色填充页眉页脚处区域,以此抹除页眉页脚,提高后续文本信息的提取精度,适应多样性板式合同类文本图像的识别需求,提高识别效率。
以上仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于霍夫变换直线检测去除页眉页脚的方法,其特征在于,包括如下步骤:
步骤1:对读入的合同类文本图像进行预处理;
步骤2:初步设定页眉页脚处横线所占图像高度比例,剪切页眉页脚横线区域;
步骤3:对剪切之后的图像进行灰度化处理,获得灰度图像;
步骤4:基于相位一致性方法提取灰度图像边缘并获得边缘图像;
步骤5:对获得的边缘图片采用霍夫变换检测直线方法检测页眉页脚处横线位置;
步骤6:对页眉处横线以上部分区域以及页脚处横线以下部分区域进行背景色填充;
步骤7:完成背景色填充后,输出图像,实现文本类图像的页眉页脚去除。
2.根据权利要求1所述的基于霍夫变换直线检测去除页眉页脚的方法,其特征在于,所述步骤1的具体步骤如下:
步骤1.1:对读入的图片进行预判,利用傅里叶变换对读入的图片进行分类,将图片分为正常图片或噪声图片;
步骤1.2:若经过步骤1.1判别为正常图片,直接结束图片处理流程;
步骤1.3:若经过步骤1.1判别为噪声图片,则利用小波变换对图片进行降噪。
3.根据权利要求1所述的基于霍夫变换直线检测去除页眉页脚的方法,其特征在于,所述步骤4中所采用的相位一致性方法计算图像边缘信息的步骤为:对图像信号进行傅里叶级数展开,然后计算所有频率成分的相位一致性,检测出各个方向的阶跃、线、角等特征,提取图像的纹理特征,获得边缘图像。
4.根据权利要求1所述的基于霍夫变换直线检测去除页眉页脚的方法,其特征在于,所述步骤5的具体步骤为:
步骤5.1:将图像信息转换为霍夫参数空间中的点-线坐标图;
步骤5.2:在霍夫参数空间中进行累加统计;
步骤5.3:寻找霍夫参数空间中累加器的峰值,从而检测图像中的页眉页脚处横线位置。
CN202111250579.3A 2021-10-26 2021-10-26 一种基于霍夫变换直线检测去除页眉页脚的方法 Pending CN113989314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111250579.3A CN113989314A (zh) 2021-10-26 2021-10-26 一种基于霍夫变换直线检测去除页眉页脚的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111250579.3A CN113989314A (zh) 2021-10-26 2021-10-26 一种基于霍夫变换直线检测去除页眉页脚的方法

Publications (1)

Publication Number Publication Date
CN113989314A true CN113989314A (zh) 2022-01-28

Family

ID=79741903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111250579.3A Pending CN113989314A (zh) 2021-10-26 2021-10-26 一种基于霍夫变换直线检测去除页眉页脚的方法

Country Status (1)

Country Link
CN (1) CN113989314A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130322730A1 (en) * 2012-06-05 2013-12-05 Jeffrey A. Borg Optical coin discrimination systems and methods for use with consumer-operated kiosks and the like
CN106408533A (zh) * 2016-09-12 2017-02-15 大连海事大学 一种卡片图像提取方法及系统
CN106651891A (zh) * 2016-10-13 2017-05-10 天津工业大学 三维编织物复合材料预制件表面参数测量方法
US20170293819A1 (en) * 2016-04-11 2017-10-12 The Nielsen Company (Us), Llc Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks
CN109766749A (zh) * 2018-11-27 2019-05-17 上海眼控科技股份有限公司 一种用于财务报表的弯曲表格线的检测方法
CN110543810A (zh) * 2019-06-28 2019-12-06 南京智录信息科技有限公司 一种完整识别pdf文件页眉页脚的技术
CN112818813A (zh) * 2018-12-13 2021-05-18 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130322730A1 (en) * 2012-06-05 2013-12-05 Jeffrey A. Borg Optical coin discrimination systems and methods for use with consumer-operated kiosks and the like
US20170293819A1 (en) * 2016-04-11 2017-10-12 The Nielsen Company (Us), Llc Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks
CN106408533A (zh) * 2016-09-12 2017-02-15 大连海事大学 一种卡片图像提取方法及系统
CN106651891A (zh) * 2016-10-13 2017-05-10 天津工业大学 三维编织物复合材料预制件表面参数测量方法
CN109766749A (zh) * 2018-11-27 2019-05-17 上海眼控科技股份有限公司 一种用于财务报表的弯曲表格线的检测方法
CN112818813A (zh) * 2018-12-13 2021-05-18 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN110543810A (zh) * 2019-06-28 2019-12-06 南京智录信息科技有限公司 一种完整识别pdf文件页眉页脚的技术

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘高军 等: "基于分割线和区域特征的页眉页脚判别方法", 北方工业大学学报, 31 March 2013 (2013-03-31), pages 17 - 24 *

Similar Documents

Publication Publication Date Title
Qureshi et al. A bibliography of pixel-based blind image forgery detection techniques
JP4771804B2 (ja) レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
CN109784342B (zh) 一种基于深度学习模型的ocr识别方法及终端
CN110210413A (zh) 一种基于深度学习的多学科试卷内容检测与识别系统及方法
CN105760901B (zh) 一种多语种倾斜文档图像的自动语言判别方法
CN111259891B (zh) 一种自然场景下身份证识别方法、装置、设备和介质
CN116758045B (zh) 一种半导体发光二极管的表面缺陷检测方法及系统
CA2267828A1 (en) Multiple size reductions for image segmentation
CN111915635A (zh) 支持自阅卷的试题解析信息生成方法及系统
CN116071763A (zh) 基于文字识别的教辅图书智能校编系统
CN102737240A (zh) 分析数字文档图像的方法
CN115497109A (zh) 基于智能翻译的文字图像预处理方法
CN109543525B (zh) 一种通用表格图像的表格提取方法
CN114121179A (zh) 化学结构式的提取方法及提取装置
CN113627423A (zh) 圆形印章字符识别方法、装置、计算机设备和存储介质
CN103617423A (zh) 基于色彩参数的图像拆分识别方法
CN111008635A (zh) 一种基于ocr的多票据自动识别方法及识别系统
CN113989314A (zh) 一种基于霍夫变换直线检测去除页眉页脚的方法
CN116386048A (zh) 一种印章去除方法、装置、设备及存储介质
CN113989481A (zh) 一种合同文本图像印章检测和去除方法
TWM637598U (zh) 電子計算裝置
CN112861861B (zh) 识别数码管文本的方法、装置及电子设备
CN115100663A (zh) 文档图像中文字高度的分布情况估计方法及装置
CN111402281B (zh) 一种书籍边缘检测方法及装置
Höhn Detecting arbitrarily oriented text labels in early maps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination