CN104166843B - 一种基于直线连续性的文档图像来源判别方法 - Google Patents

一种基于直线连续性的文档图像来源判别方法 Download PDF

Info

Publication number
CN104166843B
CN104166843B CN201410389826.1A CN201410389826A CN104166843B CN 104166843 B CN104166843 B CN 104166843B CN 201410389826 A CN201410389826 A CN 201410389826A CN 104166843 B CN104166843 B CN 104166843B
Authority
CN
China
Prior art keywords
length
line
straight
substrate
straightway
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410389826.1A
Other languages
English (en)
Other versions
CN104166843A (zh
Inventor
宋永红
郁冲
张元林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201410389826.1A priority Critical patent/CN104166843B/zh
Publication of CN104166843A publication Critical patent/CN104166843A/zh
Application granted granted Critical
Publication of CN104166843B publication Critical patent/CN104166843B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于直线连续性的文档图像来源判别方法,首先对输入的二值图像进行边缘提取的操作,然后使用3*N的直线检测模板进行水平和竖直方向的直线段检测,并通过搜索得到完整的直线段以及直线段两端局部区域内的孤立噪声点;随后在检测到的直线段上进行双向的扩展搜索得到直线段对应的基底直线长度;最后根据基底直线的长度进行分类,并计算每一类中直线段长度和基底直线长度的比值作为特征,将孤立噪声点的数目和直线段数目的比值作为附加的特征添加后输入训练过的SVM分类器中进行分类,最终输出图像的类别;本发明针对了二值文档图像来源判别方法中的不足和空白,在保证没有误判的基础上,可以快速地区分大多数含有直线的文档图像。

Description

一种基于直线连续性的文档图像来源判别方法
技术领域
本发明涉及文档图像来源判别方法技术领域,具体涉及一种基于直线连续性的文档图像来源判别方法。
背景技术
文档图像根据其制作来源可分为扫描图像和栅格图像。而图像存储时根据其每个像素存储的信息量可以分为彩色图像、灰度图像和二值图像。
目前针对文档图像来源判别的算法研究主要可以分为三类:
一是基于文档倾斜检测的方法,主要针对早期的扫描文档图像多出现整体倾斜的情况。该类方法一般先获取一整行文字行或文字行间的空白区域,通过投影及直线拟合的方法来计算文字行和水平方向间的角度,通过这个角度来刻画文档图像的倾斜情况。但是由于现在的扫描仪在扫描文档之前都会对纸张进行一个对齐操作,图像倾斜的情况也出现的越来越少,仅仅根据这一方法很难区分图像的来源。
二是基于模糊检测的方法,主要针对扫描图像相对于栅格图像会存在模糊边缘的情况。该类方法首先会提取图像的一个边缘,然后对不同方向求取边缘部分的梯度,从而推测出边缘的宽度,通过边缘宽度来刻画模糊的程度。然而在处理二值图像时,由于只存在0和1两种值,模糊情况无法得到有效的刻画,这类方法基本无法用于判别其来源。
三是基于噪声滤波的方法,主要利用扫描仪传感器在成像时形成的噪声来判别其来源。该类方法通过使用不同的滤波器对输入图像进行滤波操作,再将滤波后的图像与原图相减,从而构成噪声特征,最后将不同滤波得到的噪声特征输入到分类器中进行分类来得到图像来源判别的结果。但滤波在处理信息量较少的二值图像时很难得到一个理想的结果,并且一些栅格图像存在半色调来表征灰色图案的情况,更加误导了滤波后的结果,最终导致最后的分类不准确。
发明内容
为了解决上述现有技术存在的问题,本发明的目的在于提供一种基于直线连续性的文档图像来源判别方法,对二值文档图像能够有效地判断其制作来源。
为达到以上目的,本发明采用如下技术方案:
一种基于直线连续性的文档图像来源判别方法,包括如下步骤:
步骤1:对输入的二值图像进行边缘提取操作,输出去除填充部分的边缘图像;
步骤2:直线段和孤立噪声点检测:对于步骤1输出的边缘图像首先使用3*N的直线检测模板进行像素长度为N的直线段检测,具体的检测过程为:使用一个和3*N的直线检测模板同样大小的窗口对整幅图像进行遍历搜索,当搜索的窗口中的内容和3*N的直线检测模板内容相同时,则标记为一条检测到的基本直线段,否则继续使用3*N的直线检测模板进行搜索;得到基本直线段后继续向后续方向搜索得到完整无断裂的直线段长度,然后在检测到的直线段两端的局部区域检测孤立噪声点的数目以用于后续分类特征的构造;
步骤3:计算基底直线长度:在检测到的直线段上进行双向的扩展搜索,首先在直线段的一端搜索相邻3*1的区域,若此区域包含黑色像素点则将此点设为新的直线末端,再搜索新的直线末端相邻3*1的区域,如此反复操作直至相邻区域内不存在黑色像素点为止,然后在直线段的另一端进行同样的操作;最后输出基底直线长度即等于检测直线段长度加上双向扩展搜索的长度;
步骤4:直线连续性特征构造和分类:检测得到的基底直线根据水平或竖直方向分为两大类;根据已检测得到的基底直线长度相对图像尺寸进行进一步分类,分为长、中、短三类基底直线,该分类通过阈值直接划分,这样水平和竖直方向分别有三类基底直线,共得到六类基底直线;然后在每一类基底直线中,对其中检测到的直线段计算直线段长度和其对应的基底直线长度的比值,再求取平均值即作为直线连续性的特征;通过步骤2检测到的孤立噪声点数目除以检测到的基本直线段数目得到的比值作为附加的一维特征,六类基底直线共输出六维特征,最后得到七维特征,将此七维特征输入至训练过后的SVM分类器中进行分类,最终输出图像的类别。
所述3*N的直线检测模板为高度为3个像素且宽度为N个像素的矩形图像模板,其中除中间一行的像素值为1外其余像素值均为0。
所述根据已检测得到的基底直线长度相对图像尺寸进行分类的方法为:当基底直线为水平方向时,求取基底直线长度和图像宽度的比值与阈值进行比较;当基底直线为竖直方向时,求取基底直线长度和图像高度的比值与阈值进行比较。
本发明和现有技术相比,具有如下优点:
1、本发明的主要思想是将文档图像中的直线检测出来,同时扩展得到直线基底,通过对两者的比值构造特征,最后通过训练好的分类器进行分类。经过测试,本方法在保证没有误判的基础上,可以快速地区分大多数含有直线的文档图像。
2、本发明是基于直线连续性特征并利用SVM分类器对二值文档图像进行来源判别的方法,可以对含有直线的文档图像进行直线的检测以及根据直线的连续特性提取特征来进行分类,具有很高分类准确率,且算法的计算量不大,具有较好的时间性能。
3、本发明弥补了一般文档来源判别方法根据噪声可能误判的问题,同时克服了倾斜检测对未倾斜扫描文档无法判断的问题。
总之,本发明针对二值文档图像来源判别方法中的不足和空白,研究一种基于直线连续性的文档图像来源判别方法,从而对二值文档图像能够有效地判断其制作来源。
附图说明
图1为本发明方法整体流程图。
图2为直线段和孤立噪声点检测部分流程图。
图3为计算基底直线长度部分流程图。
图4为基底直线搜索过程示意图。
图5为直线连续性特征构造和分类部分流程图。
图6为直线段检测模板。
图7为倾斜直线的直线段检测和基底直线搜索结果。
具体实施方式
以下结合附图及具体实施例对本发明作进一步的详细描述。
如图1所示,本发明一种基于直线连续性的文档图像来源判别方法,主要包含三部分:直线段和孤立噪声点检测部分、计算基底直线长度部分和直线连续性特征构造和分类部分。具体方法如下:
步骤1:对输入的二值图像进行边缘提取操作,输出去除填充部分的边缘图像;
步骤2:直线段和孤立噪声点检测:对于步骤1输出的边缘图像首先使用3*N的直线检测模板进行像素长度为N的直线段检测,具体的检测过程为:使用一个和3*N的直线检测模板同样大小的窗口对整幅图像进行遍历搜索,当搜索的窗口中的内容和3*N的直线检测模板内容相同时,则标记为一条检测到的基本直线段,否则继续使用3*N的直线检测模板进行搜索;得到基本直线段后继续向后续方向搜索得到完整无断裂的直线段长度,然后在检测到的直线段两端的局部区域检测孤立噪声点的数目以用于后续分类特征的构造;
步骤3:计算基底直线长度:在检测到的直线段上进行双向的扩展搜索,首先在直线段的一端搜索相邻3*1的区域,若此区域包含黑色像素点则将此点设为新的直线末端,再搜索新的直线末端相邻3*1的区域,如此反复操作直至相邻区域内不存在黑色像素点为止,然后在直线段的另一端进行同样的操作;最后输出基底直线长度即等于检测直线段长度加上双向扩展搜索的长度;
步骤4:直线连续性特征构造和分类:检测得到的基底直线根据水平或竖直方向分为两大类;根据已检测得到的基底直线长度相对图像尺寸进行进一步分类,分为长、中、短三类基底直线,该分类通过阈值直接划分,这样水平和竖直方向分别有三类基底直线,共得到六类基底直线;然后在每一类基底直线中,对其中检测到的直线段计算直线段长度和其对应的基底直线长度的比值,再求取平均值即作为直线连续性的特征;通过步骤2检测到的孤立噪声点数目除以检测到的基本直线段数目得到的比值作为附加的一维特征,六类基底直线共输出六维特征,最后得到七维特征,将此七维特征输入至训练过后的SVM分类器中进行分类,最终输出图像的类别。
如图2所示,直线段和孤立噪声点检测过程可分为使用模板检测固定长度直线段、搜索完整直线和检测孤立噪声点的操作。首先使用3*N的直线检测模板进行像素长度为N的固定长度直线段检测,若检测到内容与3*N的直线检测模板内容相同的直线段时,则在检测到的直线段基础上做进一步的搜索得到完整无断裂的直线段,否则继续使用3*N的直线检测模板进行搜索;最后检测直线段的两端外部的局部区域是否存在孤立噪声点。完成这些操作后可以得到每条直线段的长度以及检测到的孤立噪声点数目的信息。
如图3所示,为计算基底直线长度部分流程图,首先搜索得到一条直线段后向左右两端分别搜索3*1的区域,若其中包含黑色像素点,则将区域中心的y坐标调整为之前搜索到的黑色像素位置继续向外搜索,直到新搜索的子区域中不存在黑色像素则停止搜索,搜索扩展的长度加上原直线段长度即为基底直线长度作为输出。
一个基底直线搜索过程如图4所示,其中每一个方格表示一个像素,斜线方格为黑色像素点,搜索的子区域用虚线框标出。
如图5所示,为直线连续性特征构造和分类部分流程图,首先根据基底直线属于水平方向或竖直方向分为两类,并在各方向上根据其长度相对于图像宽度(或高度)的比值使用阈值分为长、中、短三类,这样所以基底直线共分为了六类,即水平方向长、中、短和竖直方向长、中、短的基底直线;在每一类的基底直线中分别求取其对应的直线段长度和基底直线长度的比值,并取每一类中所得比值的平均作为这一类基底直线的特征,这样一共得到六维的直线特征;然后计算孤立噪声点的数目和检测到的直线段数目的比值作为第七维特征,将所得到的七维特征输入到已训练过的SVM分类器中进行分类,最终输出分类的结果即为图像的类别。
下面对本发明主要包含的三部分:直线段和孤立噪声点检测部分、计算基底直线长度部分和直线连续性特征构造和分类部分的算法进行说明。
直线段和孤立噪声点的检测算法
对于输入的二值文档图像,我们主要关心的是图像中形状表面直线的光滑程度,所以首先会对输入图像提取其边缘,也就是去除图像中填充的部分。在边缘图像上,使用3*N的直线检测模板来检测长度至少为N个像素的直线段,N的取值和图像尺寸有关,图像越大则N取值相应变大,这样做保证了算法的鲁棒性。图6为N取8时的直线段检测模板。
经过模板检测后的直线段并不一定就是最终要找的直线段,为了找到完整的直线段,并且避免表格中的交叉部分对直线检测的影响,在后续的搜索过程中只对已检测长度为N的直线段所在的水平方向继续向右搜索,设已检测的直线段最右端坐标为(x,y),只要(x+1,y)像素点为1就继续搜索,终止条件为(x+i,y)像素为0。所得最终检测直线的长度即为N+i-1。这样检测的结果可能会含有毛刺,但遇到直线断裂和偏移的情况就会终止搜索。
直线段检测完毕后,还要对直线端点附近的孤立噪声点作检测,检测的方法是当直线搜索终止后检测后续的3*4的区域,当其中包含孤立的单个像素点或两个像素则判定为孤立噪声点。孤立噪声点的检测主要用于辅助分类,并不是所有扫描图像均会含有孤立噪声,但直线端附近有孤立噪声的一般都是扫描图像。
基底直线的搜索算法
基底直线搜索的主要任务是在直线段检测的基础上搜索得到潜在的具有连续性的直线段。扫描的图像由于噪声、倾斜等原因,使用之前的直线段检测算法得到的直线段只是局部区域内较为完整的直线,而这些直线段可能是更长直线在噪声影响下改变而成。例如图7为一条轻微倾斜的直线段检测和基底直线搜索结果示意。通过对基底直线的搜索可以一定程度上表征图像受噪声的影响程度。
基底直线的搜索是在检测到的直线段基础上进行双向的扩展搜索。首先在直线段的末端搜索相邻3*1的区域,若区域包含黑色像素点则将此点设为新的直线末端,再搜索其相邻3*1的区域,如此反复操作直至相邻区域内不存在黑色像素点为止。基底直线长度即等于检测直线段长度加上双向扩展搜索的长度。
基于直线连续性的特征构造和分类
经前面步骤处理后,输入图像中的所有直线段和对应的基底直线都已检测出来,设某一条直线段的长度和其对应的基底直线长度分别为li和bi,则可以计算相对长度:
考虑到不同长度的基底直线在确定图像是否为扫描图像时所占的比重可能是不同的,因为较长的基底直线如果没有受噪声等影响,其中的直线段应该和基底直线长度接近,则该图像不是扫描图像的可能性就非常大。所以在构造特征时,首先将基底直线长度和图像的尺寸进行比较,把基底直线分为长、中、短三类,对每一类利用式(1)计算得到的相对长度求平均值作为最终的一维特征。同时,对于孤立噪声点计算其数目和直线段数目的比值(设为noiseRatio)作为附加的一维特征。所以最终的特征形式为:
其中x和y表示水平和竖直方向搜索的直线段,long、middle和short分别表示基底直线长度的不同类别,根据式(2)最终可以得到一个七维的特征,将此七维特征进行归一化后输入SVM分类器进行训练,使用训练后的SVM模型进行分类即可得到输入图像是扫描还是栅格图像的分类结果。

Claims (3)

1.一种基于直线连续性的文档图像来源判别方法,其特征在于:包括如下步骤:
步骤1:对输入的二值图像进行边缘提取操作,输出去除填充部分的边缘图像;
步骤2:直线段和孤立噪声点检测:对于步骤1输出的边缘图像首先使用3*N的直线检测模板进行像素长度为N的直线段检测,具体的检测过程为:使用一个和3*N的直线检测模板同样大小的窗口对整幅图像进行遍历搜索,当搜索的窗口中的内容和3*N的直线检测模板内容相同时,则标记为一条检测到的基本直线段,否则继续使用3*N的直线检测模板进行搜索;得到基本直线段后继续向后续方向搜索得到完整无断裂的直线段长度,然后在检测到的直线段两端的局部区域检测孤立噪声点的数目以用于后续分类特征的构造;
步骤3:计算基底直线长度:在检测到的直线段上进行双向的扩展搜索,首先在直线段的一端搜索相邻3*1的区域,若此区域包含黑色像素点则将此点设为新的直线段末端,再搜索新的直线段末端相邻3*1的区域,如此反复操作直至相邻区域内不存在黑色像素点为止,然后在直线段的另一端进行同样的操作;最后输出基底直线长度即等于检测直线段长度加上双向扩展搜索的长度;
步骤4:直线连续性特征构造和分类:检测得到的基底直线根据水平或竖直方向分为两大类;根据已检测得到的基底直线长度相对图像尺寸进行进一步分类,分为长、中、短三类基底直线,该分类通过阈值直接划分,这样水平和竖直方向分别有三类基底直线,共得到六类基底直线;然后在每一类基底直线中,对其中检测到的直线段计算直线段长度和其对应的基底直线长度的比值,再求取平均值即作为直线连续性的特征;通过步骤2检测到的孤立噪声点数目除以检测到的基本直线段数目得到的比值作为附加的一维特征,六类基底直线共输出六维特征,最后得到七维特征,将此七维特征输入至训练过后的SVM分类器中进行分类,最终输出图像的类别。
2.根据权利要求1所述的一种基于直线连续性的文档图像来源判别方法,其特征在于:所述3*N的直线检测模板是高度为3个像素且宽度为N个像素的矩形图像模板,其中除中间一行的像素值为1外其余像素值均为0。
3.根据权利要求1所述的一种基于直线连续性的文档图像来源判别方法,其特征在于:所述根据已检测得到的基底直线长度相对图像尺寸进行分类的方法为:当基底直线为水平方向时,求取基底直线长度和图像宽度的比值与阈值进行比较;当基底直线为竖直方向时,求取基底直线长度和图像高度的比值与阈值进行比较。
CN201410389826.1A 2014-08-08 2014-08-08 一种基于直线连续性的文档图像来源判别方法 Active CN104166843B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410389826.1A CN104166843B (zh) 2014-08-08 2014-08-08 一种基于直线连续性的文档图像来源判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410389826.1A CN104166843B (zh) 2014-08-08 2014-08-08 一种基于直线连续性的文档图像来源判别方法

Publications (2)

Publication Number Publication Date
CN104166843A CN104166843A (zh) 2014-11-26
CN104166843B true CN104166843B (zh) 2017-02-15

Family

ID=51910647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410389826.1A Active CN104166843B (zh) 2014-08-08 2014-08-08 一种基于直线连续性的文档图像来源判别方法

Country Status (1)

Country Link
CN (1) CN104166843B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019220163A (ja) * 2018-06-06 2019-12-26 コグネックス・コーポレイション ビジョンシステムでラインを検出するためのシステム及び方法
CN111860315A (zh) * 2020-07-20 2020-10-30 中国建设银行股份有限公司 一种表格线的检测方法、装置、设备及存储介质
CN112200202A (zh) * 2020-10-29 2021-01-08 上海商汤智能科技有限公司 文本检测方法及装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7978365B2 (en) * 2003-02-26 2011-07-12 Minolta Co., Ltd. Document type discriminating apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7978365B2 (en) * 2003-02-26 2011-07-12 Minolta Co., Ltd. Document type discriminating apparatus

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
一种改进的文档图像倾斜检测算法;张田;《西华大学学报(自然科学版)》;20100131;第29卷(第01期);第49-53页 *
一种新的直线特征提取和定位算法;邓宝松 等;《计算机工程》;20060731;第32卷(第13期);第198-202页 *
一种直线提取的新方法;杨波 等;《计算机工程》;20030131;第29卷(第01期);第45-47页 *
基于直线连续性的页面倾斜检测与校正;王姝华等;《计算机辅助设计与图形学学报》;20010831;第13卷(第08期);第1-6页 *

Also Published As

Publication number Publication date
CN104166843A (zh) 2014-11-26

Similar Documents

Publication Publication Date Title
CN106960208B (zh) 一种仪表液晶数字自动切分和识别的方法及系统
CN108416766B (zh) 双侧入光式导光板缺陷视觉检测方法
JP6620477B2 (ja) コンクリートのひび割れ検出方法及び検出プログラム
CN102175700B (zh) 数字x射线图像焊缝分割和缺陷检测方法
CN104268872B (zh) 基于一致性的边缘检测方法
CN105158257B (zh) 滑板测量方法及装置
KR20090101356A (ko) 결함 검출 장치 및 결함 검출 방법
RU2015134095A (ru) Способ и устройство для обнаружения прямой линии
JP2745764B2 (ja) 位置認識装置
CN103559490A (zh) 基于二值图像连通域统计的答题卡自动评分方法
CN103198468A (zh) 图像处理装置、图像处理方法和图像处理系统
CN106203397B (zh) 基于图像中表格分析技术的表格鉴别和定位方法
CN103852034B (zh) 一种电梯导轨垂直度检测方法
CN104166843B (zh) 一种基于直线连续性的文档图像来源判别方法
CN106709952B (zh) 一种显示屏幕的自动标定方法
CN112857252B (zh) 一种基于反射率强度的隧道影像边界线检测方法
CN112036232B (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
WO2023231262A1 (zh) 基于视觉振频识别的提升钢丝绳张力检测方法
CN113888446A (zh) 一种钣金结构件折弯线智能检测方法
CN115240197A (zh) 图像质量评价方法、装置、电子设备、扫描笔及存储介质
CN101950352B (zh) 一种去除光照影响的目标检测方法及装置
CN106530273B (zh) 高精度fpc直线线路检测与缺陷定位方法
CN101799922A (zh) 检测文字笔画的方法和装置、定位文字行的方法和装置、判断字幕重复的方法和装置
CN106815810B (zh) 一种确定拟合边界的方法及装置
CN104268536B (zh) 一种图像人脸检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant