CN102750531A - 用于票据文档定位格的手写体标记符号检测方法 - Google Patents

用于票据文档定位格的手写体标记符号检测方法 Download PDF

Info

Publication number
CN102750531A
CN102750531A CN2012101828208A CN201210182820A CN102750531A CN 102750531 A CN102750531 A CN 102750531A CN 2012101828208 A CN2012101828208 A CN 2012101828208A CN 201210182820 A CN201210182820 A CN 201210182820A CN 102750531 A CN102750531 A CN 102750531A
Authority
CN
China
Prior art keywords
bill
angle
projection
proj
bill document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101828208A
Other languages
English (en)
Other versions
CN102750531B (zh
Inventor
沈志明
宋晓宁
刘梓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU SUNBOON INFORMATION TECHNOLOGY Co Ltd
Original Assignee
JIANGSU SUNBOON INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU SUNBOON INFORMATION TECHNOLOGY Co Ltd filed Critical JIANGSU SUNBOON INFORMATION TECHNOLOGY Co Ltd
Priority to CN201210182820.8A priority Critical patent/CN102750531B/zh
Publication of CN102750531A publication Critical patent/CN102750531A/zh
Application granted granted Critical
Publication of CN102750531B publication Critical patent/CN102750531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种用于票据文档定位格的手写体标记符号检测方法,其包括如下步骤:a、获取票据文档的图像;b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;c、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。本发明操作方便,检测精度高,具有较好的通用性及鲁棒性。

Description

用于票据文档定位格的手写体标记符号检测方法
技术领域
本发明涉及一种符号检测方法,尤其是一种用于票据文档定位格的手写体标记符号检测方法,属于图像处理的技术领域。
背景技术
在各类社会活动中,利用模式识别技术对各种票据进行自动分析、验证、检索和识别,对于确保相关业务安全、提高工作效率、增加处理准确性都具有非常重要的现实意义。票据自动处理技术以其较高的学术价值和应用价值近年来受到国内外众多研究机构以及学者的广泛重视,该技术主要包含了两方面的内容,第一,票据图像版面的预处理,它是各类票据图像内容理解和识别的前提和基础;第二,对预处理后的图像内容进行分析和识别,它是检验票据自动处理技术性能好坏的标准。
表格型票据是一种结构化的特殊文档,输入的信息被规范在预先印制好的表格框线所指示的区域内,这些框线为票据文档要素区域的定位和识别提供了重要的辅助信息。然而在实际应用中,如何动态检测指定区域内容并获取特殊字符的识别结果,是表格型图像处理工作的难点。实际票据图像的扫描位置、背景、票面受污染程度等情况会造成许多干扰因素,这对于票据系统后期的自动识别处理产生较大的影响,因此准确可靠的框线检测结果,是票据处理方法的基础。票据图像的框线检测主要用到直线检测技术,目前常用的直线检测方法主要有基于Hough变换的方法、连通域分析法、矢量化方法以及通过对笔画和框线交叠处的局部图像区域进行分析从而完成框线检测等。以上方法具有定义简单,物理意义明确,易于检测、存储和处理等优点,在一定条件下可以快速、准确地提取直线。
然而在上述传统方法的处理中,部分重要的局部边缘等细节特征难以被有效表达,以致复杂噪声背景下的框线检测工作时常失效。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种用于票据文档定位格的手写体标记符号检测方法,其操作方便,检测精度高,具有较好的通用性及鲁棒性。
按照本发明提供的技术方案,一种用于票据文档定位格的手写体标记符号检测方法,包括如下步骤:
a、获取票据文档的图像;
b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;
c、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;
d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;
e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。
所述步骤a中,利用摄像头拍摄票据文档,并以JPG方式存储票据文档图像。
所述步骤b中,包括如下步骤:
b1、对票据文档图像进行灰度化,并对灰度化的票据文档图像进行反色处理;
b2、对反色后的票据文档图像利用最大类间方差法进行二值分割,以形成所需的二值化图像;
b3、对二值化后的票据文档图像利用有限脊波变换进行离散脊波变换,得到稀疏脊波系数,去除系数幅值较小的区域,再进行离散脊波反变换;
b4、对上述离散脊波反变换后的图像进行闭运算处理;
b5、对上述进行闭运算处理后的图像进行链码跟踪,得到票据文档图像的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储。
所述步骤c中,包括如下步骤:
c1、最大封闭轮廓线的宽度是Width,轮廓线存储数组为BuffX、BuffY,投影后像素计数数组为Projline,投影角度范围为(-Angle,Angle),并建立正弦和余弦弧度表为:SIN_T[i+Angle]=sin(i×0.1×PI/180),COS_T[i+Angle]=cos(i×0.1×PI/180),其中,PI为圆周率,i表示投影角,i∈(-Angle,Angle);
c2、在投影角度(-Angle,Angle)的范围内,根据投影公式COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i]计算投影值并记为Proj_idx,同时对计数数组Projline[Proj_idx]进行累加;
c3、取投影轴中点Proj_mid,在投影轴中点Proj_mid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Proj_NullZero_L和左侧最大投影值Proj_NullZero_LMax;同理,在投影轴中点Proj_mid的右侧按自右向左顺序,计算右侧第一个不为零的投影值Proj_NullZero_R及右侧最大投影值Proj_NullZero_RMax;
c4、当Proj_NullZero_L等于int(COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i])时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R等于int(COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i]))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值D1;
c5、将本次投影角度i下最佳边界点之间的跨度值D1与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值D1最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束;
c6、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX,CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。
所述步骤d中,包括如下步骤:
d1、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板;
d2、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域;
d3、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域;
d4、提取出票据文档图像中打勾定位格区域。
所述步骤e包括如下步骤:
e1、对提取的打勾定位格区域进行闭运算;
e2、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像;
e3、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮廓,并对所述最大面积轮廓进行标记、存储;
e4、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。
所述卷积模板为 h = 0 1 0 0 2 0 0 1 0 , h = 0 1 1 0 0 2 2 0 0 2 2 0 0 1 1 0 h = 0 0 0 0 0 0 0 2 0 0 0 2 4 2 0 0 0 2 0 0 0 0 0 0 0 .
本发明的优点:引入多尺度几何分析方法-脊波变换,脊波变换通过将线状奇异特征转换成点奇异特征的方式,实现对线状奇异特征的稀疏表示,相比于小波,它具有更好的方向辨识能力,对图像边缘等细节特征具有更稀疏的表达形式;根据表格型票据文档的特点,重点针对在图像局部位置时常出现的某些特殊字符,充分突出了重要局部边缘和文字轮廓干扰等细节特征的表达形式,通过票据文档最大封闭轮廓的检测,通过最优轴投影测度确定票据文档的倾角,票据文档与票据模板比对后提取打勾定位格区域,利用掩膜法对打勾定位格进行检测,从而最终能判断是否存在手写体标记符号,经过大量实际银行支票图像的测试证明了本发明的有效性和鲁棒性,操作方便,检测精度高。
附图说明
图1为本发明的流程图。
图2为本发明银行票据样本的图像。
图3为本发明银行票据样本图像最大封闭边框的示意图。
图4为本发明求取最佳跨度的示意图。
图5为本发明提取打勾定位格区域的示意图。
图6为本发明将打勾定位格区域分割出打勾子识别区域的示意图。
图7为本发明将打勾定位格区域分割出未打勾子识别区域的示意图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
如图1所示:本发明中所指的手写体标记符号包括√符号、斜线、画圈、打叉或涂抹等标记符号,所述手写体标记符号票据文档中较长出现的符号,本发明实施例和附图中以√符号为例进行说明。为了能够对票据类图像处理具有较好的通用性,并能有效降低大规模多种类票据特殊内容的定位与识别难度,本发明对票据文档定位格的手写体标记符号检测方法包括如下步骤:
a、获取票据文档的图像;
获取票据文档图像时,利用摄像头拍摄票据文档,并以JPG方式存储票据文档图像;在利用摄像头进行拍摄获取图像时,需要进行摄像头的参数标定,摄像头的外部参数包括摄像头相对采集底面的高度H、俯视角
Figure BDA00001727191000041
偏离角θ等;其内部参数包括焦距f、视场角σ、光圈F等;通过对摄像头进行参数标定后,能使得所需的票据文档,提高对票据文档处理的效率;图2为获得银行票据的示意图。
b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;
所述步骤b包括如下步骤:
b1、对票据文档图像进行灰度化,并对灰度化的票据文档图像进行反色处理;通过对摄像头拍摄的RGB图像进行灰度化及反色处理,以在不丢失必要信息的同时降低图像维数及计算量;
b2、对反色后的票据文档图像利用最大类间方差法进行二值分割,以形成所需的二值化图像;
在进行图像二值分割时,动态确定一个阈值Thr,大于或等于阈值Thr的像素在二值图像中的值为Ta,小于阈值Thr的像素在二值图像中的值为Tb,动态阈值Thr可以根据获取票据文档进行设置;
b3、对二值化后的票据文档图像利用有限脊波变换进行离散脊波变换,得到稀疏脊波系数,去除系数幅值较小的区域,再进行离散脊波反变换;
b4、对上述离散脊波反变换后的图像进行闭运算处理;
通过闭运算处理后,进一步消除图像框线边缘断边和分支点噪声干扰,避免在后续链码跟踪时出现断裂直线的情况;
b5、对上述进行闭运算处理后的图像进行链码跟踪,得到票据文档图像的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储。
c、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;
为了能够更好地分析,需要将待检测票据文档与票据模板进行比较;而与票据模板进行比较时,需要将票据文档旋转到水平正方位置,通过最优轴投影测度来确定最大封闭轮廓的倾角,也即待检测票据文档的旋转角度。
所述步骤c中,包括如下步骤:
c1、最大封闭轮廓线的宽度是Width,轮廓线存储数组为BuffX、BuffY,投影后像素计数数组为Projline,投影角度范围为(-Angle,Angle),并建立正弦和余弦弧度表为:SIN_T[i+Angle]=sin(i×0.1×PI/180),COS_T[i+Angle]=cos(i×0.1×PI/180),其中,PI为圆周率,i表示投影角,i∈(-Angle,Angle);此处,投影角度范围为(-Angle,Angle),投影角度范围可以票据文档图像进行确定,一般为(-20°,20°);
c2、在投影角度(-Angle,Angle)的范围内,根据投影公式COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i]计算投影值并记为Proj_idx,同时对计数数组Projline[Proj_idx]进行累加;投影时,投影角度i在投影角度范围内遍历,投影角度i的遍历步长可以根据需要进行设置,步长较小时会增大计算量;此处,遍历是指投影角度i根据步长变化时取遍投影角度范围(-Angle,Angle)内的所有值;
c3、取投影轴中点Proj_mid,在投影轴中点Proj_mid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Proj_NullZero_L和左侧最大投影值Proj_NullZero_LMax;同理,在投影轴中点Proj_mid的右侧按自右向左顺序,计算右侧第一个不为零的投影值Proj_NullZero_R及右侧最大投影值Proj_NullZero_RMax;
c4、当Proj_NullZero_L等于int(COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i])时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R等于int(COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i]))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值D1;
一般地,跨度值D1为左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax之间差值的绝对值;
c5、将本次投影角度i下最佳边界点之间的跨度值D1与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值D1最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束;
如图3和图4所示:为票据文档的顶端存在干扰区域,由于干扰区域的存在,在计算宽度时,可能会存在跨度值D1与跨度值D2,而跨度值D2明显存在干扰,因此选择较小的跨度值D1能够较精确得到票据文档的宽度值;
c6、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX,CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。
d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;
图1中的先验信息包括票据模板等信息;所述步骤d包括如下步骤:
d1、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板;
在实际运用中,可以预先存储大量的票据模板,当将待检测票据文档的最大封闭轮廓、角点坐标确定后,就能够从预先存储的票据模板中找到所需的票据模板,通过票据模板能够提取后续所需的区域;
d2、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域;
附图中的银行票据图像中包含“币种”的五行方格区域,在具体应用中,根据票据模板能获取相应的方格区域,这些方格区域包括后续需要识别是否包括标记符号的区域;
d3、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域;
通过对Sobel变换以削弱水平框线,再向垂直方向投影,通过投影分析后,判断所述方格区域是否包含文字,当方格区域中未包含文字时,此方格区域势必不会存在标记符号,因此将此方格区域删除,降低整个检测的计算量;
d4、提取出票据文档图像中打勾定位格区域。
通过上述操作后,提取出的打勾定位格区域包括打勾子识别区域为未打勾子识别区域,一般地,在票据文档中,在同时成双存在两个表格区域,通过在两个表格区域进行打标记选取相应的选项,因此,本发明实施例提出出的打勾子识别区域、未打勾子识别区域符号实际情况。如图5所示,图6中显示了打勾子识别区域,图7中显示了未打勾子识别区域。
e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。
所述步骤e包括如下步骤:
e1、对提取的打勾定位格区域进行闭运算;当进行闭运算处理后,能消除图像边框边缘断边及分支点噪声干扰;
e2、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像;对打勾定位格区域利用最大类间方差法进行阈值分割为图像处理领域常规的操作步骤,此处不再详述。
e3、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮廓,并对所述最大面积轮廓进行标记、存储;
e4、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。
所述卷积模板与最大面积轮廓进行空间卷积时,能增强图像边缘以内的信号同时减弱边缘信号,当卷积后,打勾子识别区域的卷积值较大,未打勾子识别区域的卷积值较小;当打勾定位格区域分割出两个子区域后,能够根据卷积值来判断相应区域是否存在标记符号。而当两个子识别区域卷积值相同时,一般可以认为均不存在打勾区域,实际情况中,一般不会在同一行方格区域内同时存在两个打勾区域。由于不同人进行手写标记时情况各有不同,本发明实施例中通过利用卷积值进行判断具有通用性,符合实际情况。所述卷积模板为 h = 0 1 0 0 2 0 0 1 0 , h = 0 1 1 0 0 2 2 0 0 2 2 0 0 1 1 0 h = 0 0 0 0 0 0 0 2 0 0 0 2 4 2 0 0 0 2 0 0 0 0 0 0 0 .
本发明引入多尺度几何分析方法-脊波变换,脊波变换通过将线状奇异特征转换成点奇异特征的方式,实现对线状奇异特征的稀疏表示,相比于小波,它具有更好的方向辨识能力,对图像边缘等细节特征具有更稀疏的表达形式。本发明根据表格型票据文档的特点,重点针对在图像局部位置时常出现的某些特殊字符(例如在定位格内手写的勾符号),充分突出了重要局部边缘和文字轮廓干扰等细节特征的表达形式,通过票据文档最大封闭轮廓的检测,通过最优轴投影测度确定票据文档的倾角,票据文档与票据模板比对后提取打勾定位格区域,利用掩膜法对打勾定位格进行检测,从而最终能判断是否存在手写体标记符号,经过大量实际银行支票图像的测试证明了本发明的有效性和鲁棒性,操作方便,检测精度高。

Claims (7)

1.一种用于票据文档定位格的手写体标记符号检测方法,其特征是,所述手写体标记符号检测方法包括如下步骤:
(a)、获取票据文档的图像;
(b)、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;
(c)、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;
(d)、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;
(e)、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。
2.根据权利要求1所述的用于票据文档定位格的手写体标记符号检测方法,其特征是:所述步骤(a)中,利用摄像头拍摄票据文档,并以JPG方式存储票据文档图像。
3.根据权利要求1所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(b)中,包括如下步骤:
(b1)、对票据文档图像进行灰度化,并对灰度化的票据文档图像进行反色处理;
(b2)、对反色后的票据文档图像利用最大类间方差法进行二值分割,以形成所需的二值化图像;
(b3)、对二值化后的票据文档图像利用有限脊波变换进行离散脊波变换,得到稀疏脊波系数,去除系数幅值较小的区域,再进行离散脊波反变换;
(b4)、对上述离散脊波反变换后的图像进行闭运算处理;
(b5)、对上述进行闭运算处理后的图像进行链码跟踪,得到票据文档图像的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储。
4.根据权利要求1所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(c)中,包括如下步骤:
(c1)、最大封闭轮廓线的宽度是Width,轮廓线存储数组为BuffX、BuffY,投影后像素计数数组为Projline,投影角度范围为(-Angle,Angle),并建立正弦和余弦弧度表为:SIN_T[i+Angle]=sin(i×0.1×PI/180),COS_T[i+Angle]=cos(i×0.1×PI/180),其中,PI为圆周率,i表示投影角,i∈(-Angle,Angle);
(c2)、在投影角度(-Angle,Angle)的范围内,根据投影公式COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i]计算投影值并记为Proj_idx,同时对计数数组Projline[Proj_idx]进行累加;
(c3)、取投影轴中点Proj_mid,在投影轴中点Proj_mid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Proj_NullZero_L和左侧最大投影值Proj_NullZero_LMax;同理,在投影轴中点Proj_mid的右侧按自右向左顺序,计算右侧第一个不为零的投影值Proj_NullZero_R及右侧最大投影值Proj_NullZero_RMax;
(c4)、当Proj_NullZero_L等于int(COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i])时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R等于int(COS_T[i+Angle]×BuffX[i]+SIN_T[i+Angle]×BuffY[i]))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值D1;
(c5)、将本次投影角度i下最佳边界点之间的跨度值D1与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值D1最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束;
(c6)、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX,CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。
5.根据权利要求1所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(d)中,包括如下步骤:
(d1)、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板;
(d2)、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域;
(d3)、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域;
(d4)、提取出票据文档图像中打勾定位格区域。
6.根据权利要求1所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(e)包括如下步骤:
(e1)、对提取的打勾定位格区域进行闭运算;
(e2)、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像;
(e3)、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮廓,并对所述最大面积轮廓进行标记、存储;
(e4)、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。
7.根据权利要求6所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述卷积模板为 h = 0 1 0 0 2 0 0 1 0 , h = 0 1 1 0 0 2 2 0 0 2 2 0 0 1 1 0 h = 0 0 0 0 0 0 0 2 0 0 0 2 4 2 0 0 0 2 0 0 0 0 0 0 0 .
CN201210182820.8A 2012-06-05 2012-06-05 用于票据文档定位格的手写体标记符号检测方法 Active CN102750531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210182820.8A CN102750531B (zh) 2012-06-05 2012-06-05 用于票据文档定位格的手写体标记符号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210182820.8A CN102750531B (zh) 2012-06-05 2012-06-05 用于票据文档定位格的手写体标记符号检测方法

Publications (2)

Publication Number Publication Date
CN102750531A true CN102750531A (zh) 2012-10-24
CN102750531B CN102750531B (zh) 2014-08-06

Family

ID=47030697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210182820.8A Active CN102750531B (zh) 2012-06-05 2012-06-05 用于票据文档定位格的手写体标记符号检测方法

Country Status (1)

Country Link
CN (1) CN102750531B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488986A (zh) * 2013-09-18 2014-01-01 西安理工大学 自适应字符切分及提取方法
CN103824373A (zh) * 2014-01-27 2014-05-28 辰通智能设备(深圳)有限公司 一种票据图像金额分类方法及系统
CN104346320A (zh) * 2013-08-09 2015-02-11 株式会社东芝 手写文档处理装置、手写文档处理方法和手写文档处理程序
CN104636117A (zh) * 2013-11-12 2015-05-20 江苏奥博洋信息技术有限公司 一种表格图像的自动切分方法
CN106446881A (zh) * 2016-07-29 2017-02-22 北京交通大学 从医疗化验单图像中提取化验结果信息的方法
CN108681729A (zh) * 2018-05-08 2018-10-19 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN113449559A (zh) * 2020-03-26 2021-09-28 顺丰科技有限公司 一种表格识别方法、装置、计算机设备和存储介质
CN117746437A (zh) * 2024-02-20 2024-03-22 沈阳哲航信息科技有限公司 文档数据提取系统及其方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625760A (zh) * 2009-07-28 2010-01-13 谭洪舟 一种证件图像倾斜校正的办法
CN102054168A (zh) * 2010-12-23 2011-05-11 武汉大学苏州研究院 一种有价票据圆形印鉴识别方法
CN102096795A (zh) * 2010-11-25 2011-06-15 西北工业大学 磨损二维条码图像识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625760A (zh) * 2009-07-28 2010-01-13 谭洪舟 一种证件图像倾斜校正的办法
CN102096795A (zh) * 2010-11-25 2011-06-15 西北工业大学 磨损二维条码图像识别方法
CN102054168A (zh) * 2010-12-23 2011-05-11 武汉大学苏州研究院 一种有价票据圆形印鉴识别方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346320A (zh) * 2013-08-09 2015-02-11 株式会社东芝 手写文档处理装置、手写文档处理方法和手写文档处理程序
CN103488986A (zh) * 2013-09-18 2014-01-01 西安理工大学 自适应字符切分及提取方法
CN103488986B (zh) * 2013-09-18 2016-01-27 西安理工大学 自适应字符切分及提取方法
CN104636117A (zh) * 2013-11-12 2015-05-20 江苏奥博洋信息技术有限公司 一种表格图像的自动切分方法
CN103824373A (zh) * 2014-01-27 2014-05-28 辰通智能设备(深圳)有限公司 一种票据图像金额分类方法及系统
CN103824373B (zh) * 2014-01-27 2016-06-08 深圳辰通智能股份有限公司 一种票据图像金额分类方法及系统
CN106446881A (zh) * 2016-07-29 2017-02-22 北京交通大学 从医疗化验单图像中提取化验结果信息的方法
CN106446881B (zh) * 2016-07-29 2019-05-21 北京交通大学 从医疗化验单图像中提取化验结果信息的方法
CN108681729A (zh) * 2018-05-08 2018-10-19 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN108681729B (zh) * 2018-05-08 2023-06-23 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN113449559A (zh) * 2020-03-26 2021-09-28 顺丰科技有限公司 一种表格识别方法、装置、计算机设备和存储介质
CN113449559B (zh) * 2020-03-26 2023-05-26 顺丰科技有限公司 一种表格识别方法、装置、计算机设备和存储介质
CN117746437A (zh) * 2024-02-20 2024-03-22 沈阳哲航信息科技有限公司 文档数据提取系统及其方法
CN117746437B (zh) * 2024-02-20 2024-04-30 沈阳哲航信息科技有限公司 文档数据提取系统及其方法

Also Published As

Publication number Publication date
CN102750531B (zh) 2014-08-06

Similar Documents

Publication Publication Date Title
CN102750531B (zh) 用于票据文档定位格的手写体标记符号检测方法
CN102096795B (zh) 磨损二维条码图像识别方法
US8818099B2 (en) Document image binarization and segmentation using image phase congruency
CN102289676B (zh) 基于红外检测的变电站刀闸模式识别方法
CN101789122B (zh) 用于校正畸变文档图像的方法和系统
CN101576958B (zh) 一种基于形状特征的带边框矩形印章图形提取方法
CN101673338B (zh) 基于多角度投影的模糊车牌识别方法
CN103679638A (zh) 残缺或变形的四边形图像的校正方法
CN107563377A (zh) 一种利用边缘和文字区域的证件关键区域检测定位方法
CN104751187A (zh) 抄表图像自动识别方法
CN104462380A (zh) 商标检索方法
CN105046252A (zh) 一种人民币冠字码识别方法
CN101620732A (zh) 道路行驶线的视觉检测方法
CN105447512A (zh) 一种精粗结合的光学表面缺陷的检测方法及装置
CN102184550A (zh) 一种动平台地面运动目标检测方法
CN101625760A (zh) 一种证件图像倾斜校正的办法
CN104680550A (zh) 一种通过图像特征点的轴承表面瑕疵检测的方法
CN102693423A (zh) 一种在强光条件下车牌精确定位的方法
CN104766078A (zh) 目标图像的倾斜角检测方法及倾斜角检测设备
CN112233116B (zh) 基于邻域决策与灰度共生矩阵描述的凹凸痕视觉检测方法
CN103886589A (zh) 面向目标的自动化高精度边缘提取方法
CN103530590A (zh) Dpm二维码识别系统
CN103034848A (zh) 一种表单类型的识别方法
CN109325401A (zh) 基于边缘定位对题目区域进行标注、识别的方法及系统
CN104240204A (zh) 一种基于图像处理的太阳能硅片和电池片的计数方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant