CN107194435B - 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用 - Google Patents

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用 Download PDF

Info

Publication number
CN107194435B
CN107194435B CN201710465168.3A CN201710465168A CN107194435B CN 107194435 B CN107194435 B CN 107194435B CN 201710465168 A CN201710465168 A CN 201710465168A CN 107194435 B CN107194435 B CN 107194435B
Authority
CN
China
Prior art keywords
edge points
optical
character
brightness
false
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710465168.3A
Other languages
English (en)
Other versions
CN107194435A (zh
Inventor
许鸿奎
韩晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jianzhu University
Original Assignee
Shandong Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jianzhu University filed Critical Shandong Jianzhu University
Priority to CN201710465168.3A priority Critical patent/CN107194435B/zh
Publication of CN107194435A publication Critical patent/CN107194435A/zh
Application granted granted Critical
Publication of CN107194435B publication Critical patent/CN107194435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法包括:1)提取光学刻划字符边缘点,构成所述边缘点的′十′字简化邻域;2)根据刻划字符特点对特征进行3阶量化,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值;3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化,并转换成特征向量;4)对量化后的边缘点的特征向量进行人为真、假标记,作为训练集;5)利用Adaboost分类方法训练训练集,得到分类函数。本发明相比一般的方法对字符边缘点的真假分类上更加准确,对于图像整体光照变化有更强的鲁棒性,并且特征更加简单,为后续字符的处理带来很大帮助。

Description

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和 分类方法及应用
技术领域
本发明涉及一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用,属于工业追踪产品信息的技术领域。
背景技术
光学刻划字符广泛应用于工业产品的标牌和铭牌上,用以追踪产品信息。通常由硬质合金打标针或镶嵌工业钻石的打标针直接刻入金属工件的材料内部而形成的标示,采用低角度前景光式照明方法采集图像。由于这是一种凹凸的立体字符,笔画中存在光线被遮挡的情况,表现为与光线平行方向的笔画呈现高灰度值,与光线垂直方向的笔画呈现低灰度值,背景的灰度值介于以上两种之间,如图1所示。因此常用的基于梯度的边缘提取方法无法准确地提取刻划字符的边缘,因为在笔画中的高灰度像素区域和低灰度像素区域的交界处,梯度也发生了大幅变化,基于梯度的边缘提取方法也会把这些点检测出来,而这些点不是字符边缘的有效组成部分,属于假边缘点。这些假边缘点的存在为后续的字符识别与检测造成了巨大障碍。
中国专利文献CN 105279507公开了一种提取刻划字符轮廓的方法,该发明是采用多相活动轮廓模型确定高低亮度区域,通过直方图分析将多相图像转换成双相图像最后利用水平集的方法获得轮廓。
中国专利文献CN 106023191公开了一种基于结构特征的光学刻划字符边缘提取和边缘拟合方法,其在canny算子提取的边缘基础上,通过模式识别方法(结合模板提取和K近邻方法)去除字符边缘中的假边缘点,得到断续的字符轮廓,然后根据笔画结构特征和断点距离和位置对边缘进行拟合。
上述专利文献都是对刻划字符进行轮廓提取的方法,而本发明的目的是针对专利文献CN 106023191中,去除假边缘的方法(结合模板提取和K近邻的方法)进行了改进。为了去除这些假边缘点,可以使用模式识别的方法,首先提取边缘点的特征,然后使用分类器对特征进行分类,从而达到去除假边缘点的目的。专利文献CN 106023191,采用基于邻域特征结合K近邻分类器的方法,但是该种特征提取方法存在特征繁杂冗余、对光照鲁棒性不强和K近邻的模板选取复杂等问题,而本方法通过对邻域特征进行简化,降低了特征的维度,从而减少了模式的数量,有利于样本的选择。通过结合直方图的方法对邻域特征进行了量化,使得该种特征对光照有较好的鲁棒性。通过分析发现该种分类问题属于样本不均衡问题,采用Adaboost分类方法比K近邻具有更好的分类效果。
发明内容
针对现有技术存在的技术问题,本发明提出一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法。
本发明还提出了一种利用上述方法去除样本光学刻划字符中的假边缘点的方法。
发明概述:
一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,包括:
首先,使用Canny算子提取光学刻划字符边缘点,以所述边缘点为中心向上、向下、向左、向右分别提取一个字符笔画长度的像素灰度,构成所述边缘点的′十′字简化邻域;
其次,通过分析图像的灰度直方图,确定高亮度、低亮度和背景亮度的划分阈值;
继而,基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化,并转换成特征向量;
最后,对量化后的边缘点的特征向量进行真、假标记,作为训练集;利用Adaboost分类方法训练训练集,得到分类函数,利用分类函数去除样本点中的假边缘点。
本发明的技术方案如下:
一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,包括:
1)提取光学刻划字符边缘点,以所述边缘点为中心向上、向下、向左、向右分别提取单位字符笔画长度的像素灰度,构成所述边缘点的′十′字简化邻域;
2)根据刻划字符特点对特征进行3阶量化,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值;
3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化,并转换成特征向量;
4)对量化后的边缘点的特征向量进行人为真、假标记,作为训练集;
5)利用Adaboost分类方法训练训练集,得到分类函数。
根据本发明优选的,在步骤1)中,利用Canny算子提取光学刻划字符边缘点。
根据本发明优选的,在步骤1)中,以所述边缘点为中心向上、向下、向左、向右分别提取一个字符笔画长度的像素灰度。
根据本发明优选的,在步骤1)中,所述一个字符笔画长度为5个像素长度。即所述′十′字简化邻域的水平方向有11个像素灰度,垂直方向有11个像素灰度。
根据本发明优选的,在步骤2)中,通过分析光学刻划字符图像的灰度直方图,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值。在步骤2)中,通过分析刻划字符图像特点,发现其由高亮度区域、低亮度区域和背景亮度区域组成,所以对特征选择3阶量化最为符合图像特点。
根据本发明优选的,在步骤2)中,通过分析光学刻划字符图像的灰度直方图,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值的方法如下:
将所述低亮度和背景亮度的划分阈值,定为所述灰度直方图中最大连续单调上升的起始处;
将所述高亮度和背景亮度的划分阈值,定为所述灰度直方图中最大连续单调下降的结束处。
根据本发明优选的,所述划分阈值的具体方法为:
(1)所述光学刻划字符图像为256级的灰度图像表示为I(x,y),所述光学刻划字符图像的灰度直方图为h(n),n=1,2…256,灰度直方图的梯度
Figure BDA0001325795590000042
梯度符号g(n)=sign(G(n));
(2)梯度变号处标记为Cn=g(n)*g(n+1),当Cn>0时,表示在n处梯度符号不变,当Cn<0时,表示在n处梯度符号改变;Cn<0记为
Figure BDA0001325795590000041
(3)计算连续上升和连续下降的长度Ai=(ai+1-ai)*g(ai),当所述Ai为正时,表示是上升,当所述Ai为负时,表示是下降。
(4)计算max(Ai)时的Ai记为Ap,min(Ai)时的Ai记为Aq,最大连续上升起始处就是ap,最大连续下降的结束处就是aq+1;即ap是低亮度和背景亮度的划分阈值,aq+1是高亮度和背景亮度的划分阈值。
根据本发明优选的,所述步骤3)中转换成特征向量的方法:通过把垂直方向的像素经过转置后,添加于水平方向像素后,构成特征向量,即构成长度为22个像素的特征。
根据本发明优选的,所述步骤4)利用Adaboost分类方法训练训练集,得到分类函数的具体方法如下:
即,自适应增强算法Adaboost采用Gentle Adaboost模型,其训练过程描述如下:
4-1)训练样本共有N个,并且标记为:(x1,y1),...,(xN,yN),其中,xi∈Rn为待训练特征,yi∈{-1,1};yi=1表示为真边缘点,yi=-1表示为假边缘点;
4-2)初始化样本的权重:Wi=1/N,i=1,...N;
4-3)对j=1,2…M,其中M表示训练的轮数;
a.从所有的待训练特征样本中,挑选第j轮中,最佳的弱分类器hj(x),使得在该样本权重的分布下,样本的加权均方误差最小,即,选择
Figure BDA0001325795590000051
Figure BDA0001325795590000052
最小下的hj(x);
b.对权重进行更新:Wi←Wi·exp(-yi·hi(xi)),i=1,...N;
c.归一化权重使得:
Figure BDA0001325795590000053
4-4)输出强分类器:
Figure BDA0001325795590000054
当x≥0,sign(x)为1,否则为-1。
一种利用上述方法去除样本光学刻划字符中的假边缘点的方法,为利用分类函数去除样本点中的假边缘点。即,通过训练集,训练得到分类器H(x),把待分类点的特征(即简化邻域特征)输入,即可得到分类结果。
本发明的有益效果:
本发明相比一般的方法对字符边缘点的真假分类上更加准确,对于图像整体光照变化有更强的鲁棒性,并且特征更加简单,为后续字符的处理带来很大帮助。
本发明采用量化后的简化邻域特征,结合Adaboost进行分类:
1、通过对水平和垂直方向的像素进行采样,减少了特征维度,降低了样本选择的复杂度。
2、对特征进行了量化,并通过对直方图分析,确定量化阈值,使得本特征对光照的鲁棒性增强。
3、由于真假边缘点样本数量的不均,该问题是一种样本不均衡问题,采用Adaboost分类方法比K近邻方法更好。
附图说明
图1为原始光学刻划字符图像;
图2为本发明提取的边缘点结果;
图3为本发明中所述′十′字简化邻域示意图;
图4为光学刻划字符图像的灰度直方图;
图5-1为量化后的水平方向的结果;
图5-2为量化后的垂直方向的结果;
图6为使用分类器去除的假边缘点;
图7为去除假边缘点以后的结果;
图8是邻域特征K近邻分类结果图;
图9是简化邻域特征K近邻分类结果图;
图10邻域特征在Adaboost下分类结果;
图11简化邻域特征在Adaboost下分类结果;
图12是K近邻分类器下两种特征对真点分类错误率统计结果;
图13是K近邻分类器下两种特征对假点分类错误率统计结果;
图14是Adaboost分类器下两种特征对真点分类错误率统计结果;
图15是Adaboost分类器下两种特征对假点分类错误率统计结果。
具体实施方式
下面结合附图与实施例对本发明作进一步说明,但不限于此。
实施例1、
一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,包括:
1)利用Canny算子提取光学刻划字符边缘点,以所述边缘点为中心向上、向下、向左、向右分别提取一个字符笔画长度的像素灰度,构成所述边缘点的′十′字简化邻域;所述一个字符笔画长度为5个像素长度。即所述′十′字简化邻域的水平方向有11个像素灰度,垂直方向有11个像素灰度。
特征的选择对分类效果有至关重要的作用,既要考虑特征的准确性,还要考虑特征的鲁棒性和简易性。通过分析canny算子提取的边缘点周围像素灰度发现,真,假边缘点的邻域灰度分布有明显不同,真边缘点总位于,高灰度与背景灰度之间,或者低灰度与背景灰度之间,假边缘点总是位于高、低灰度的交界处,而且假边缘点的走向通常为水平方向、垂直方向和对角方向。虽然邻域灰度包含了该点的真假信息,但同时也有许多信息的冗余,而且邻域的长度也不能选择太大,否则随着邻域半径的增大会急剧增加特征的维度,并且加剧分类上的困难,经过以上分析发现,水平与垂直方向的灰度值也能够包含大部分边缘点的真假信息,并且简化了特征的维度。为此选择边缘点的上、下、左、右,各一个笔画长度的像素作为特征,如图3所示,为叙述方便,称为′十′字简化邻域。
2)根据刻划字符特点对特征进行3阶量化,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值;通过分析刻划字符图像特点,发现其由高亮度区域、低亮度区域和背景亮度区域组成,所以对特征选择3阶量化最为符合图像特点。
通过分析光学刻划字符图像的灰度直方图,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值;
将所述低亮度和背景亮度的划分阈值,定为所述灰度直方图中最大连续单调上升的起始处;
将所述高亮度和背景亮度的划分阈值,定为所述灰度直方图中最大连续单调下降的结束处。
为了进一步简化特征,对′十′字邻域的像素进行量化,结合刻画字符特点,考虑到刻画字符有低灰度区域、高灰度区域和背景灰度区域,所以量化阶数选择3最为合适。由于每个字符和光源的距离不一样,金属表面也不是绝对的平整,导致字符图像灰度有略微的变化,根据经验直接选择阈值进行量化,不能完全适用于所有字符,使得结果出现偏差。因而,对每个字符图像的灰度直方图进行分析,如图4所示,发现字符图像中背景区域像素占总像素的大部分,并在直方图中近似服从正态分布,高低像素位于直方图两侧区域,鉴于这个特点,把低阈值设定为直方图中最大连续单调上升的起始处,高阈值设定为直方图中最大连续单调下降的结束处,从而达到自适应的效果。
所述划分阈值的具体方法为:
(1)所述光学刻划字符图像为256级的灰度图像表示为I(x,y),所述光学刻划字符图像的灰度直方图为h(n),n=1,2…256,灰度直方图的梯度
Figure BDA0001325795590000092
梯度符号g(n)=sign(G(n));
(2)梯度变号处标记为Cn=g(n)*g(n+1),当Cn>0时,表示在n处梯度符号不变,当Cn<0时,表示在n处梯度符号改变;Cn<0记为
Figure BDA0001325795590000091
(3)计算连续上升和连续下降的长度Ai=(ai+1-ai)*g(ai),当所述Ai为正时,表示是上升,当所述Ai为负时,表示是下降。
(4)计算max(Ai)时的Ai记为Ap,min(Ai)时的Ai记为Aq,最大连续上升起始处就是ap,最大连续下降的结束处就是aq+1;即ap是低亮度和背景亮度的划分阈值,aq+1是高亮度和背景亮度的划分阈值。
3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化,并转换成特征向量;通过把垂直方向的像素经过转置后,添加于水平方向像素后,构成特征向量,即构成长度为22个像素的特征向量。
4)对量化后的边缘点的特征向量进行人为真、假标记,作为训练集;
5)利用Adaboost分类方法训练训练集,得到分类函数。
实施例2、
如实施例1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其区别在于,所述步骤4)利用Adaboost分类方法训练训练集,得到分类函数的具体方法如下:
即,自适应增强算法Adaboost采用Gentle Adaboost模型,其训练过程描述如下:
4-1)训练样本共有N个,并且标记为:(x1,y1),...,(xN,yN),其中,xi∈Rn为待训练特征,yi∈{-1,1};yi=1表示为真边缘点,yi=-1表示为假边缘点;
4-2)初始化样本的权重:Wi=1/N,i=1,...N;
4-3)for j=1:M,其中M表示训练的轮数;
a.从所有的待训练特征样本中,挑选第j轮中,最佳的弱分类器hj(x),使得在该样本权重的分布下,样本的加权均方误差最小,即,选择
Figure BDA0001325795590000101
Figure BDA0001325795590000102
下的hj(x);
b.对权重进行更新:Wi←Wi·exp(-yi·hi(xi)),i=1,...N;
c.归一化权重使得:
Figure BDA0001325795590000103
4-4)输出强分类器:
Figure BDA0001325795590000104
当x≥0,sign(x)为1,否则为-1。
为了采用分类器进行真假分类,首先需要对量化后的特征向量进行真、假标记,用来作为训练集。但是由于刻划字符样本中存在样本不平衡问题,真边缘点的数量远远大于假边缘点的数量,所以在训练样本的采集时,需要进行筛选,减少不平衡性。
分类器选择上,传统的K近邻算法在面对样本不平衡问题时,往往不能获得很好的效果,为了进一步减少样本不平衡对分类结果的影响,选择使用GentleAdaboost分类算法作为分类器,Gentle Adaboost算法通过将多个弱分类器,经过优化算法加权组合成强分类器,由于对分类错误的样本权值会加大,所以对于难以分类的样本能够表现很好的效果。
实施例3、
一种利用如实施例1、2所述方法去除样本光学刻划字符中的假边缘点的方法,为利用分类函数去除样本点中的假边缘点。
把后续待分类样本经过提取简化′十′字邻域特征向量,经过量化并转换成特征向量后,输入分类器H(x),输出的结果就是分类的结果。图6所示就是分类后去除的假边缘点,图7所示是去除假边缘后的边缘。
对比例、
将本发明所述方法与现有技术(结合K近邻方法对真假边缘点进行分类)的方法相比较。
现有技术:采用5×5邻域特征,结合K近邻方法对真假边缘点进行分类。
邻域特征用K近邻算法分类,在图像灰度整体改变的时候测试结果,以字符′G′为例,在灰度改变不大的时候邻域特征表现出较好的分类效果,但是在图像整体灰度值发生变化的时候基于邻域特征的识别率急剧下降,出现许多的错误,如图8所示。
邻域特征在图像灰度发生改变的时候,分类效果下降,而简化邻域特征由于根据直方图进行了量化,在面对图像整体灰度改变时,仍能够有较好的区分效果,表现出很好的稳定性,如图9。
Adaboost算法结果,由于K近邻算法对于不均衡样本存在样本选取困难等问题,采用Gentle Adaboost分类方法对邻域特征,以及简化邻域特征在模拟光照强度变化下进行比较。
邻域特征结合Adaboost的分类结果,如图10,简化特征结合Adaboost的分类结果,如图11。
对分类结果的错误率进行统计,数值越高表示分类效果越差。图12是K近邻分类器下两种特征对真点分类错误率统计结果;图13是K近邻分类器下两种特征对假点分类错误率统计结果;图14是Adaboost分类器下两种特征对真点分类错误率统计结果;图15是Adaboost分类器下两种特征对假点分类错误率统计结果。
结论
根据整体灰度值的变化统计了两种特征对于真假边缘点的分类错误率。如图14、图15,横坐标表示图像整体的灰度改变模拟光照的改变,由低到高,纵坐标表示分类错误率,数值越高表示分类效果越差。分别计算对假边缘点和真边缘点的分类误差。从实验结果上看,Adaboost算法对于占少数样本的假边缘点,相比K近邻算法具有更加高的识别率。而对于占多数样本的真边缘点,识别率有所下降。基于邻域灰度的特征在图像灰度不改变时拥有最高的识别效率,但是当灰度改变时分类错误率急剧上升。而发明所述方法基于简化邻域的特征,无论灰度如何改变,都能保持较好的分类效果。通过以上两种特征在K近邻算法和Adaboost下比较,本发明提出的基于简化邻域的特征,通过自适应改变量化阈值,使得在光照发生改变时,仍然获得很好的识别效率,对光照改变具有较强的鲁棒性。通过比较分类器,发现Adaboost算法在对假边缘点的分类上效果更好,但同时对于真边缘点的识别率也略有降低,由于对于假边缘点的去除相对更为重要,所以就去除假边缘点的问题,使用Adaboost算法更好。

Claims (7)

1.一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其特征在于,所述方法包括:
1)提取光学刻划字符边缘点,以所述边缘点为中心向上、向下、向左、向右分别提取单位字符笔画长度的像素灰度,构成所述边缘点的′十′字简化邻域;
2)根据刻划字符特点确定光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值;
3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化,并转换成特征向量;
4)对量化后的边缘点的特征向量进行人为真、假标记,作为训练集;
5)利用Adaboost分类方法训练训练集,得到分类函数;
在步骤2)中,通过分析光学刻划字符图像的灰度直方图,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值;
在步骤2)中,通过分析光学刻划字符图像的灰度直方图,确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值的方法如下:
将所述低亮度和背景亮度的划分阈值,定为所述灰度直方图中最大连续单调上升的起始处;
将所述高亮度和背景亮度的划分阈值,定为所述灰度直方图中最大连续单调下降的结束处。
2.根据权利要求1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其特征在于,在步骤1)中,利用Canny算子提取光学刻划字符边缘点。
3.根据权利要求1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其特征在于,在步骤1)中,所述单位字符笔画长度为5个像素长度。
4.根据权利要求1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其特征在于,所述划分阈值的具体方法为:
(1)所述光学刻划字符图像为256级的灰度图像表示为I(x,y),所述光学刻划字符图像的灰度直方图为h(n),n=1,2...256,灰度直方图的梯度G(n)=
Figure RE-FDA0002476661370000022
梯度符号g(n)=sign(G(n));
(2)根据梯度符号计算Cn=g(n)*g(n+1),当Cn>0时,表示在n处梯度符号不变,当Cn<0时,表示在n处梯度符号改变,此处梯度符号即梯度变号;Cn<0记为
Figure RE-FDA0002476661370000021
k=1,2...;
(3)计算连续上升和连续下降的长度Ak=(ak+1-ak)*g(ak),当所述Ak为正时,表示是上升,当所述Ak为负时,表示是下降;
(4)计算max(Ak)时的Ak记为Ap,min(Ak)时的Ak记为Aq,最大连续上升起始处就是ap,最大连续下降的结束处就是aq+1;即ap是低亮度和背景亮度的划分阈值,aq+1是高亮度和背景亮度的划分阈值。
5.根据权利要求1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其特征在于,所述步骤3)中转换成特征向量的方法:通过把垂直方向的像素经过转置后,添加于水平方向像素后,构成特征向量,即构成长度为22个像素的特征。
6.根据权利要求1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法,其特征在于,所述步骤4)利用Adaboost分类方法训练训练集,得到分类函数的具体方法如下:
4-1)训练样本共有N个,并且标记为:(x1,y1),...,(xN,yN),其中,xi∈Rn为待训练特征,yi∈{-1,1};yi=1表示为真边缘点,yi=-1表示为假边缘点;
4-2)初始化样本的权重:Wi=1/N,i=1,...N;
4-3)对j=1,2...M,其中M表示训练的轮数;
a.从所有的待训练特征样本中,挑选第j轮中,最佳的弱分类器hj(x),使得在该样本权重的分布下,样本的加权均方误差最小,即,选择
Figure RE-FDA0002476661370000031
Figure RE-FDA0002476661370000032
最小下的hj(x);
b.对权重进行更新:Wi←Wi·exp(-yi·hj(xi)),i=1,...N;
c.归一化权重使得:
Figure RE-FDA0002476661370000033
4-4)输出强分类器:
Figure RE-FDA0002476661370000034
Figure RE-FDA0002476661370000035
Figure RE-FDA0002476661370000036
为1,否则为-1。
7.一种利用如权利要求1-6任意一项所述方法去除样本光学刻划字符中的假边缘点的方法,其特征在于,该方法为:利用分类函数去除样本点中的假边缘点。
CN201710465168.3A 2017-06-19 2017-06-19 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用 Active CN107194435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710465168.3A CN107194435B (zh) 2017-06-19 2017-06-19 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710465168.3A CN107194435B (zh) 2017-06-19 2017-06-19 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用

Publications (2)

Publication Number Publication Date
CN107194435A CN107194435A (zh) 2017-09-22
CN107194435B true CN107194435B (zh) 2020-07-31

Family

ID=59879455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710465168.3A Active CN107194435B (zh) 2017-06-19 2017-06-19 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用

Country Status (1)

Country Link
CN (1) CN107194435B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1542697A (zh) * 2003-11-06 2004-11-03 上海交通大学 基于相邻边缘点距离统计的文字图象分割方法
CN1744665A (zh) * 2005-09-14 2006-03-08 上海广电(集团)有限公司中央研究院 一种逐点提高视频图像清晰度的处理方法
CN1794267A (zh) * 2005-12-29 2006-06-28 兆日科技(深圳)有限公司 用于防伪信息识别过程中矩形框定位的方法
EP2658265A1 (en) * 2012-04-24 2013-10-30 Vestel Elektronik Sanayi ve Ticaret A.S. Adaptive depth offset calculation for an image
CN104268872A (zh) * 2014-09-25 2015-01-07 北京航空航天大学 基于一致性的边缘检测方法
CN106023191A (zh) * 2016-05-16 2016-10-12 山东建筑大学 一种基于结构特征的光学刻划字符边缘提取和边缘拟合方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1542697A (zh) * 2003-11-06 2004-11-03 上海交通大学 基于相邻边缘点距离统计的文字图象分割方法
CN1744665A (zh) * 2005-09-14 2006-03-08 上海广电(集团)有限公司中央研究院 一种逐点提高视频图像清晰度的处理方法
CN1794267A (zh) * 2005-12-29 2006-06-28 兆日科技(深圳)有限公司 用于防伪信息识别过程中矩形框定位的方法
EP2658265A1 (en) * 2012-04-24 2013-10-30 Vestel Elektronik Sanayi ve Ticaret A.S. Adaptive depth offset calculation for an image
CN104268872A (zh) * 2014-09-25 2015-01-07 北京航空航天大学 基于一致性的边缘检测方法
CN106023191A (zh) * 2016-05-16 2016-10-12 山东建筑大学 一种基于结构特征的光学刻划字符边缘提取和边缘拟合方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Advance and prospects of adaboost algorithm;Y.Cao et al.;《Acta Automatica Sinica》;20131231;第39卷(第6期);第745-758页 *
低质量压印字符的分割与识别技术研究;王琼;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160215;第I138-1218页 *
结合假边缘提取和直方图分析的图像灰度变换;许鸿奎 等;《光学精密工程》;20170430;第25卷(第4期);第1071-1076页 *

Also Published As

Publication number Publication date
CN107194435A (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
CN110334706B (zh) 一种图像目标识别方法及装置
JP2020513133A (ja) 画像品質の評価方法及び装置
WO2018072233A1 (zh) 一种基于选择性搜索算法的车标检测识别方法及系统
CN110349126A (zh) 一种基于卷积神经网络带标记的钢板表面缺陷检测方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
CN111401372A (zh) 一种扫描文档图文信息提取与鉴别的方法
CN106446952A (zh) 一种乐谱图像识别方法及装置
CN109086687A (zh) 基于pca降维的hog-mblbp融合特征的交通标志识别方法
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN107729812B (zh) 一种适用于监控场景中的车辆颜色识别的方法
CN107256547A (zh) 一种基于显著性检测的表面裂纹识别方法
CN106529532A (zh) 一种基于积分特征通道与灰度投影的车牌识别系统
CN109376740A (zh) 一种基于视频的水尺读数检测方法
CN105404868B (zh) 一种基于交互平台的复杂背景中文本的快速检测方法
CN109086772A (zh) 一种扭曲粘连字符图片验证码的识别方法及系统
CN103530625A (zh) 一种基于数字图像处理的光学字符识别方法
CN112101108A (zh) 一种基于图形极点位置特征的左右转交通标志识别方法
CN111754525A (zh) 一种基于非精确切分的工业字符检测流程
CN111833347A (zh) 一种输电线路防振锤缺陷检测方法及相关装置
CN109902692A (zh) 一种基于局部区域深度特征编码的图像分类方法
CN107194435B (zh) 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用
CN105721738B (zh) 一种彩色扫描文档图像预处理方法
KR100703528B1 (ko) 영상 인식 장치 및 방법
CN111274891A (zh) 一种面向简谱图像的音高及对应歌词提取方法及系统
JP6377214B2 (ja) テキスト検出方法および装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Xu Hongkui

Inventor after: Han Xiao

Inventor before: Han Xiao

Inventor before: Xu Hongkui

GR01 Patent grant
GR01 Patent grant