CN104239880A - 一种基于投影算子的古籍文档图像处理算法 - Google Patents

一种基于投影算子的古籍文档图像处理算法 Download PDF

Info

Publication number
CN104239880A
CN104239880A CN201310221753.0A CN201310221753A CN104239880A CN 104239880 A CN104239880 A CN 104239880A CN 201310221753 A CN201310221753 A CN 201310221753A CN 104239880 A CN104239880 A CN 104239880A
Authority
CN
China
Prior art keywords
ancient books
document
stain
image
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310221753.0A
Other languages
English (en)
Inventor
姚志英
曹海青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wuzi University
Original Assignee
Beijing Wuzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wuzi University filed Critical Beijing Wuzi University
Priority to CN201310221753.0A priority Critical patent/CN104239880A/zh
Publication of CN104239880A publication Critical patent/CN104239880A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于投影算子的古籍文档图像处理算法,具体内容包括基于灰度投影算法的古籍文档灰度图像二值化算法、基于二值化图像内容行和列投影的古籍文档边框检测算法和基于投影算子的古籍文档污点检测算法。

Description

一种基于投影算子的古籍文档图像处理算法
技术领域
本发明属于图像处理技术领域,涉及古籍文档灰度图像二值化方法、古籍文档图像的边框检测方法和污点检测方法,具体而言是通过定义水平投影算子和垂直投影算子,并应用于古籍文档灰度图像二值化的阈值选取,将投影算子应用于古籍文档中边框检测和污点检测。 
背景技术
古籍是中华人民共和国的宝贵财富和民族文化发展的缩影,古籍文化是中华民族思想传承的载体,在信息数字化的时代,将古籍内容进行数字化的加工是古籍长期保存的发展趋势;目前的古籍有手写本、印刷本、骨刻本等多重形式,其内容行文格式更是千姿百态,形式各异,加大了古籍文档数字化加工的技术难度,其中古籍图像的处理是核心难点。研究发现在古籍文档的加工中,手写本和印刷本的古籍文档每本古籍文稿的版式和样式基本相同,有一定的规律性。因此为提高古籍文档数字加工的效率,古籍文档图像的处理技术成为人们研究的热门课题,尤其是古籍文档图像的二值化、古籍文档的边框检测和污点检测。 
图像二值化的关键是二值化阈值的选取,不同的阈值选取法对二值化的效率和二值化图像的质量有较大的影响;当前阈值选取的方法主要有直方图与直方图变换法、最大类间方差(otsu)法、最小误差法与均匀化误差法、共生矩阵法、最大熵方法、简单统计、概率松弛法和模糊集法等。传统的图像污点检测方法的核心都是通过遍历二值化图像的内容矩阵寻找图像连通域,这种方法对于内容简单、尺寸较小的图像,检测效果还可以,然而一旦图像内容复杂、尺寸较大时,这些污点检测算法的时间和空间复杂度将成级数般地递增,其污点检测效率极低。传统的文档边框的检测主要是通过图像边缘检测技术来实现的,传统的边缘检测算子主要有Sobe1算子、Canny算 子和Prewitt算子,这些算子是一阶或二阶微分算子,对于清晰图像检测效果较好,但对于历史悠久、保存质量不理想的古籍文档而言,存在着去除噪声和边缘准确定位之间的矛盾,经常出现误检和漏检,当然也有一些基于滤波技术和小波变换技术的改进边缘检测算法,但这些算法在滤波过程中有时会使得古籍文档边缘弱化和模糊化,造成边框检测的不准确。 
本发明将设计一种投影算子应用于古籍文档图像的处理中,主要是实现古籍文档灰度图像二值化阈值的合理选取、古籍文档二值化图中边缘的准确检测和文档中符合设定条件的污点检测。 
发明内容
本发明旨在提供一种基于投影算子的古籍文档图像处理算法,该算法能高效快捷地实现古籍文档灰度图像二值化阈值的选取、古籍文档图像中边框检测和污点检测。 
本发明实现上述目的的技术方案是,一种基于投影算子的古籍文档图像处理算法,其创新点在于:对古籍文档灰度图像进行二值化时,根据古籍文档的内容和结构进行文档灰度图像的区域划分,对不同的子区域利用投影算子求出其灰度均值作为该区域图像内容二值化的阈值,这样通过对不同区域二值化来实现对整个图像的二值化; 
本发明实现上述目的的技术方案是,一种基于投影算子的古籍文档图像处理算法,其创新点在于:对于古籍文档边框检测的步骤依次为: 
(1)对通过图像采集设备所采集到的大小尺寸为W×L的古籍文档彩色图像进行二值化处理,得到古籍文档的二值化图; 
(2)根据二值化图的内容,生成图像内容矩阵CW×L,其中C[i][j]=0或C[i][j]=1; 
(3)对二值化图进行水平投影,即求矩阵CW×L每一列元素的和构成数组 对二值化图进行垂直投影,即求矩阵CW×L每一行元 素的和构成数组 S rw [ i ] = Σ j = 0 L C [ i ] [ j ] ;
(4)求出从0到[W/4]和从[3W/4]+1到W-1的最大值Sc1[j1]和最大值Sc1[j2],则j1和j2就是古籍文档图像的边框所在列;求出从0到[L/4]和从[3L/4]+1到L-1的最大值Srw[i1]和最大值Srw[i],则i1和i2就是古籍文档图像的边框所在行。通过上述处理即可实现古籍文档的边框检测。 
本发明实现上述目的技术方案是,一种基于投影算子的古籍文档图像处理算法,其创新点在于:对于古籍文档中污点面积A满足A1≤A≤A2的检测步骤依次为: 
(1)分析数组Srw的内容,若Srw[i]≠0,则产生可能有污点的行信息数组DataRow[k]=i; 
(2)对可能出现污点的行i所在二值化图像信息按列进行分析,若C[k][j]≠0,则将j作为污点的起始列,如果可能出现污点的列信息相差为1,就将两污点连为线段,将线段的起点作为污点矩形起点的横坐标,线段终点(列)作为污点矩形终点的横坐标,将当前的行数作为污点矩形起点和终点的纵坐标; 
(3)依据污点行信息数组DataRow中数据,对古籍文档二值图内容重复(2)所做的分析,并判断所生产的线段之间的关系,如果当前行DataRow[k]中线段位置(列信息)和上一行DataRow[k-1]中线段位置(列信息)重复时,将污点矩形的起点纵坐标更改为上一行的行序号DataRow[k-1],这样通过分析二值化图的垂直投影和二值化图的内容即可快速地检测出可能是污点的矩形位置及大小。 
(4)如果所得污点矩形面积A满足A1≤A≤A2,则认为该矩形区域即为污点所在的区域,否则将舍弃所得到的矩形区域。这样通过上述四步,即可实现古籍文档二值图的污点检测。 
本发明的有益效果是:利用投影算子进行不同区域二值化阈值的确定,通过这种方式进行二值化可以很好地适应不同区域灰度分布不均匀对二值化图的影响,提高二值化图的质量和二值化过程的效率;利用投影算子进行文档图像的边框检测,这种方法具有较低空间复杂度和时间复杂度,简单易用,误检率较低;利用投影算子检测设定污点面积范围的图像污点,因方法简单,比广泛应用的通过连通域判别污点的方法,耗时短,检测精度高。 
附图说明
图1为古籍文档彩色图像样例; 
图2为古籍文档灰度图像样例; 
图3为古籍文档二值化图样例; 
图4是本发明中古籍文档边框检测流程; 
图5是本发明中古籍文档污点检测流程; 
图6为古籍文档污点检测结果样例; 
图7为古籍文档去除污点后结果样例。 
具体实施方式
以下结合附图对本发明进行进一步的详细描述。 
图1所示的为古籍文档彩色图像的样例,首先对彩色图像采取一定的方法转化为图2所示的灰度图像,关于灰度图像二值化的步骤如下: 
(1)首先根据古籍图像的内容和结构,将古籍绘度图像分成几个子区域; 
(2)对每个灰度图像的子区域求出其灰度均值,将灰度均值作为该区域二值化的阈值实现二值化,这样不同子区域独立进行二值化实现整个灰度图像的二值化,通过这种方式可以很好地抑制不同区域间灰度值分布不均匀对图像二值化的影响。以图3为样例可证实这种方法的二值化效果。 
一种基于投影算子的古籍文档边框检测流程如图4所示,其具体步骤依次为: 
(1)对通过图像采集设备所采集到的大小尺寸为W×L的古籍文档彩色图像进行二值化处理,得到古籍文档的二值化图; 
(2)根据二值化图的内容,生成图像内容矩阵CW×L,其中C[i][j]=0或C[i][j]=1; 
(3)对二值化图进行水平投影,即求矩阵CW×L每一列元素的和数组 
(4)求出从0到[W/4]和从[3W/4]+1到W-1的最大值Sc1[j1]和最大值Sc1[j2],则j1和j2就是古籍文档图像的边框所在的列;求出从0到[L/4]和从[3L/4]+1到L-1的最大值Srw[i1]和最大值Srw[i],则i1和i2就是古籍文档图像边框所在的行。通过上述处理即可实现古籍文档的边框检测。 
一种基于投影算子的古籍文档污点检测流程如图5所示,其具体检测步骤依次为: 
(1)分析数组Srw的内容,若Srw[i]≠0,则产生可能有污点的行信息数组DataRow[k]=i; 
(2)对可能出现污点的行i所在二值化图像信息按列进行分析,若C[k][j]≠0,则将j作为污点的起始列,如果可能出现污点的列信息相差为1,就将两污点连为线段,将线段的起点作为污点矩形起点的横坐标,线段终点(列)作为污点矩形终点的横坐标,将当前的行数作为污点矩形起点和终点的纵坐标; 
(3)依据污点行信息数组DataRow中数据,对古籍文档二值图内容重复(2)的所做的分析,并判断所产生线段之间的关系,如果当前行DataRow[k]中线段位置(列信息)和上一行DataRow[k-1]中线段位置(列信息)重复时,将污点矩形的起点纵坐标更改为上一行的行序 号DataRow[k-1],这样通过分析二值化图的垂直投影和二值化图的内容即可快速地检测出可能是污点的矩形位置及大小。 
(4)如果所得污点矩形面积A满足A1≤A≤A2,则认为该矩形区域即为污点所在的区域,否则将舍弃所得到的矩形区域。这样通过上述四步,即可实现古籍文档二值图的污点检测。 
本发明在具体实施时,可根据古籍文档图像的内容和结构特征,灵活地进行灰度图像子区域的划分,通过计算子区域的灰度均值作为该子区域二值化的阈值,可很好地抑制因古籍文档内容和结构造成灰度图像内容不均匀对二值化图所造成的影响;本发明在进行古籍文档的边框检测时,因文档中空白部分较多,因此二值化后所产生的内容矩阵中元素值大部分为0,这样降低了进一步生成列和数组、行和数组和边框检测的复杂度;本发明在进行污点检测时所采用的污点分析方法并不是完全基于分析图像内容寻求连通域,降低了污点检测的时间复杂度和空间复杂度。 
本发明效果可通过以下仿真结果进一步说明。 
仿真条件:本发明对通过图像采集设备所采集的古籍文档图像进行仿真试验,图1为古籍文档彩色图像的样例,其分辨率为3675X3300,图2为图1所对应的灰度图像。 
仿真内容:采用基于投影算子的算法,利用局部灰度均值进行图像二值化(方法1)和基于Ostu方法的图像二值化(方法2),对比两种方法二值化的效果和效率;采用基于投影算子的古籍文档边框检测(方法3)方法、Sobe1算子方法和Canny算子方法进行古籍文档的边框检测,分析检测精度和效率;采用基于投影算子的古籍文档污点检测方法和基于连通域的污点检测方法,进行污点面积为小于24大于12的污点检测,比较其检测效率。 
仿真结果: 
图3为本发明所用方法的二值化图,图7为基于Ostu方法的二值化图, 通过比较可得,本发明所用方法产生的二值化图可以很好地抑制因图像内容和结构所造成的灰度分布不均匀对二值化图的影响;而且本发明所用的方法图像二值化的过程耗时15ms,基于Ostu方法的图像二值化过程耗时25ms。 
分别用本发明所用的方法、Sobe1算子和Canny算子对古籍文档的边框进行检测,其检测结果如表1所示(单位为像素);分析检测结果可知本发明使用的方法检测古籍文档边框的精度最大,在检测过程本发明所用的方法耗时40ms,基于Sobe1算子的方法耗时128ms,基于Canny算子的方法耗时110ms,因此本发明所用的方法不仅检测精度高,而且耗时少,效率高。 
表1古籍文档边框检测结果 
文档矩形边框 上边沿(行) 下边沿(行) 左边沿(列) 右边沿(列)
实际位置 465-480 3165-3180 385-400 3975-3990
本发明 466-480 3167-3178 388-400 3973-3988
Sobe1算子 460-486 3160-3171 382-406 3970-3968
Canny算子 450-496 3140-3196 362-416 3960-3986
应用本发明所用的污点检测方法和基于连通域判别的污点检测方法,分别检测污点面积大于12小于24的污点,这两种方法的污点检测结果如图6所示,图中蓝色矩形即为检测到的污点区域,但两种方法的检测效率却相差很大,用本发明的方法进行污点检测耗时为892ms,而使用连通域判别的方法却耗时为4082ms。 
通过实验仿真验证,可以很清楚地体现出本发明的优越性。 

Claims (4)

1.一种基于投影算子的古籍文档图像处理算法,其特征在于:该算法所设计的投影算子包括水平投影算子H和垂直投影算子V,其中水平投影算子H是指对图像颜色信息按列进行求和;垂直投影算子V是指对图像的颜色信息按行进行求和。 
2.根据权利要求1所述的一种基于投影算子的古籍文档图像处理算法,其特征在于:该算法可以根据古籍文档的内容和结构对古籍文档的灰度图像进行区域划分,对各个子区域利用投影算子求出各区域的灰度均值作为该区域二值化的阈值,对各子区域进行二值化,实现对整个古籍文档灰度图像的二值化;经工程验证这种基于投影算子的灰度图像二值化法方法可有效抑制图像内容不均匀、局部破损和边框等对图像二值化的影响。 
3.根据权利要求1所述的一种投影算子的古籍文档图像处理算法,其特征在于:可通过投影算子实现古籍文档图像的边框检测,其检测流程如图1所示,具体检测步骤依次如下: 
(1)对图像采集设备采集到的大小尺寸为W×L的古籍文档彩色图像进行二值化处理,得到古籍文档的二值化图; 
(2)根据二值化图的内容,生成图像内容矩阵CW×L,其中C[i][j]=0或C[i][j]=1; 
(3)对二值化图进行水平投影,即求矩阵CW×L每一列元素的和构成数组 
(4)求出从0到[W/4]和从[3W/4]+1到W-1的最大值Sc1[j1]和最大值Sc1[j2],则j1和j2就是古籍文档图像边框所在的列;求出从0到[L/4]和从[3L/4]+1到L-1的最大值Srw[i1]和最大值Srw[i2],则i1和i2就是古籍文档图像边框所在的行;通过上述处理即可实现古籍文档的边框检测。 
4.根据权利要求1所述的一种基于投影算子的古籍文档图像处理算法,其特征 在于:可通过投影算子实现古籍文档图像的污点检测,设所要检测的污点面积A,且A1≤A≤A2,其检测流程如图2所示,具体检测步骤依次如下: 
(1)分析数组Srw的内容,若Srw[i]≠0,则产生可能有污点的行信息数组DataRow[k]=i; 
(2)对可能出现污点的行i所在二值化图像信息按列进行分析,若C[k][j]≠0,则将j作为污点的起始列,如果可能出现污点的列信息相差为1,就将两污点连为线段,将线段的起点作为污点矩形起点的横坐标,线段终点(列)作为污点矩形终点的横坐标,将当前的行数作为污点矩形起点和终点的纵坐标; 
(3)依据污点行信息数组DataRow中数据,对古籍文档二值图内容重复(2)所做的分析,并判断所产生的线段之间的关系,如果当前行DataRow[k]中线段位置(列信息)和上一行DataRow[k-1]中线段位置(列信息)重复时,将污点矩形的起点纵坐标更改为上一行的行序号DataRow[k-1],这样通过分析二值化图的垂直投影和二值化图的内容即可快速地检测出可能存在污点的矩形位置及大小。 
(4)如果所得污点矩形面积A满足A1≤A≤A2,则认为该矩形区域即为污点所在的区域,否则舍弃该矩形区域。这样通过上述四步,即可实现古籍文档二值图的污点检测。 
CN201310221753.0A 2013-06-06 2013-06-06 一种基于投影算子的古籍文档图像处理算法 Pending CN104239880A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310221753.0A CN104239880A (zh) 2013-06-06 2013-06-06 一种基于投影算子的古籍文档图像处理算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310221753.0A CN104239880A (zh) 2013-06-06 2013-06-06 一种基于投影算子的古籍文档图像处理算法

Publications (1)

Publication Number Publication Date
CN104239880A true CN104239880A (zh) 2014-12-24

Family

ID=52227905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310221753.0A Pending CN104239880A (zh) 2013-06-06 2013-06-06 一种基于投影算子的古籍文档图像处理算法

Country Status (1)

Country Link
CN (1) CN104239880A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107610132A (zh) * 2017-08-28 2018-01-19 西北民族大学 一种古籍文档图像污渍去除方法
CN111860521A (zh) * 2020-07-21 2020-10-30 西安交通大学 一种畸变喷码字符逐层分割的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101122952A (zh) * 2007-09-21 2008-02-13 北京大学 一种图片文字检测的方法
US20080240582A1 (en) * 2007-03-30 2008-10-02 Nidec Sankyo Corporation Method and apparatus for character string recognition
CN102789631A (zh) * 2011-05-17 2012-11-21 张学 基于图像分割和引力模型的遥感图像分辨率提高处理方法
CN102915438A (zh) * 2012-08-21 2013-02-06 北京捷成世纪科技股份有限公司 一种视频字幕的提取方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080240582A1 (en) * 2007-03-30 2008-10-02 Nidec Sankyo Corporation Method and apparatus for character string recognition
CN101122952A (zh) * 2007-09-21 2008-02-13 北京大学 一种图片文字检测的方法
CN102789631A (zh) * 2011-05-17 2012-11-21 张学 基于图像分割和引力模型的遥感图像分辨率提高处理方法
CN102915438A (zh) * 2012-08-21 2013-02-06 北京捷成世纪科技股份有限公司 一种视频字幕的提取方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姚志英等: "《一种基于投影算子的二值图像处理算法》", 《计算机系统应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107610132A (zh) * 2017-08-28 2018-01-19 西北民族大学 一种古籍文档图像污渍去除方法
CN107610132B (zh) * 2017-08-28 2021-12-31 西北民族大学 一种古籍文档图像污渍去除方法
CN111860521A (zh) * 2020-07-21 2020-10-30 西安交通大学 一种畸变喷码字符逐层分割的方法
CN111860521B (zh) * 2020-07-21 2022-04-22 西安交通大学 一种畸变喷码字符逐层分割的方法

Similar Documents

Publication Publication Date Title
CN106384112A (zh) 基于多通道多尺度与级联过滤器的快速图像文本检测方法
CN112215819B (zh) 基于深度特征融合的机场道面裂缝检测方法
CN105405142A (zh) 一种玻璃面板的边缺陷检测方法及系统
CN104408711B (zh) 一种基于多尺度区域融合的显著区域检测方法
CN102081731A (zh) 一种从图像中提取文本的方法和装置
CN110533064B (zh) 一种gis设备的局部放电图谱模式识别方法和系统
CN102880859A (zh) 一种车牌识别方法
CN104766344B (zh) 基于运动边缘提取器的车辆检测方法
CN104966047A (zh) 一种车牌识别的方法及装置
CN103632159A (zh) 训练分类器、图像中文字区域检测的方法及系统
CN104794479A (zh) 基于局部笔画宽度变换的自然场景图片中文本检测方法
CN105447834A (zh) 一种基于特征分类的麻将图像光照不均校正方法
Chakraborty et al. An improved template matching algorithm for car license plate recognition
CN104598907A (zh) 一种基于笔画宽度图的图像中文字数据提取方法
CN105894474A (zh) 一种非线性图像增强方法及边缘检测方法
CN110516673A (zh) 基于连通分量和回归式字切分的彝文古籍字符检测方法
CN104281850A (zh) 一种文字区域识别方法和装置
CN110516592A (zh) 一种基于手写数字字符的识别方法
CN103295238B (zh) 安卓平台上基于roi运动检测的视频实时定位方法
CN104239880A (zh) 一种基于投影算子的古籍文档图像处理算法
CN101877062A (zh) 图像版面区域轮廓分析方法
CN104637060A (zh) 一种基于邻域主成分分析-拉普拉斯的图像分割方法
CN105469099A (zh) 基于稀疏表示分类的路面裂缝检测和识别方法
CN103186777B (zh) 基于非负矩阵分解的人体检测方法
CN104598906A (zh) 车辆外轮廓检测方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141224

WD01 Invention patent application deemed withdrawn after publication