CN105046257A - 一种后桥主齿轮特殊打标形式的字符识别方法及系统 - Google Patents

一种后桥主齿轮特殊打标形式的字符识别方法及系统 Download PDF

Info

Publication number
CN105046257A
CN105046257A CN201510463834.0A CN201510463834A CN105046257A CN 105046257 A CN105046257 A CN 105046257A CN 201510463834 A CN201510463834 A CN 201510463834A CN 105046257 A CN105046257 A CN 105046257A
Authority
CN
China
Prior art keywords
character
drive gear
main drive
pixel
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510463834.0A
Other languages
English (en)
Other versions
CN105046257B (zh
Inventor
潘昊
徐劲力
黄丰云
张晓帆
陈蒙
盛学明
郭雷
王新伟
左旭艳
徐晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201510463834.0A priority Critical patent/CN105046257B/zh
Publication of CN105046257A publication Critical patent/CN105046257A/zh
Application granted granted Critical
Publication of CN105046257B publication Critical patent/CN105046257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种后桥主齿轮特殊打标形式的字符识别方法及系统,其中,该方法包括步骤:对后桥主齿轮特殊打标形式的字符进行预处理;采用基于任意角度的环形字符分割算法对经过预处理后的字符图像进行分割,通过将定位到的环形字符区域转换成矩形字符区域,然后逐列扫描该区域的像素点,并将其分割成单一字符;最后对分割后的图像进行识别。本发明解决了后桥主齿轮特殊打标形式的字符由于格式特殊,难以使用现有技术定位字符的问题,使用该方法能显著提高字符识别的效率,并且和现有技术相比能够降低识别的误差。

Description

一种后桥主齿轮特殊打标形式的字符识别方法及系统
技术领域
本发明涉及字符识别领域,尤其涉及一种后桥主齿轮特殊打标形式的字符识别方法及系统。
背景技术
主齿轮特殊打标形式的字符位于主齿轮的一个不规则平面上。在主齿轮的轴心部分,存在一个圆形向内凹的小孔。主齿轮的字符,包括了主齿轮的各种生产信息,其中有主齿轮的出厂号,生产日期,生产批次号等等。主要由20位的字符,包括字母,数字和一个表示连接的横杠线组成。这二十位字符均匀的沿着主齿轮轴心上的圆形内凹小孔呈环形排列,每一个字符占据约15度角的扇形圆环,字符的起始位置和末尾位置之间留有约60度角的空白扇形圆环。
就目前的大多数字符识别系统,都需要待识别的字符呈线性排列,特别是在字符分割阶段,如果字符不是线性排列,比如基于投影量的分割算法等,就无法完成字符的分割了。所以主齿轮特殊打标形式的字符在主齿轮的正视图平面上呈约300度角的圆环形排列,使得字符很难用一般的分割算法来分割。主齿轮特殊打标形式的字符识别与一般的字符识别还存在区别,比如,主齿轮在热处理和打磨之后,表面毛刺较多,而且为了能够防锈,齿轮表面油污也很多;在生产车间内,由于光照不均衡,现场红紫外线较强,采集到的含有主齿轮的字符的图像中的噪声比较高;打标的字符需要适应工业生产,其字体不是标准字体,而且是以点阵的格式打标到主齿轮的表面上的,难于识别。
在一般的字符识别技术中,存在着很多问题,导致原本很有效的字符识别技术,反而不能发挥其本来的作用,变得误差很高且效率低下。在主齿轮特殊打标形式的字符图像中,如何定位到待识别的字符也是一个有挑战的问题,通常的字符识别算法要么待识别的字符在图像中的相应位置是固定的,比如扫描仪对标准打印字体的识别,要么能够依据与图像中的背景有明显区分的特定的几何图形来定位,比如在车牌识别系统中,车牌的号码是规则排列于车牌这个具有规则矩形形状的可以与背景明显区分的几何图形中。需要比较选取一种适合于主齿轮正视图平面特定形状的一种定位算法,来实现对主齿轮字符的定位。
发明内容
本发明要解决的技术问题在于针对现有技术中字符识别算法无法对后桥主齿轮特殊打标形式的字符图像进行识别的缺陷,提供一种可解决齿轮表面毛刺较多、图像噪声高、字符呈环形排列等问题的后桥主齿轮特殊打标形式的字符识别方法及系统。
本发明解决其技术问题所采用的技术方案是:
本发明的后桥主齿轮特殊打标形式的字符识别方法,包括以下步骤:
S1、获取后桥主齿轮特殊打标形式的字符图像,并对其进行预处理;
S2、对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:
S21、定位环形字符区域的圆心,并以该圆心为中心建立坐标系;
S22、根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;
S23、从起始位置坐标开始,将环形字符区域变换成矩形字符区域;
S24、从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;
S3、对分割后的单独字符图像进行识别。
所述步骤S1具体包括以下步骤:
S11、使用灰度化和高斯模糊算法,对获取到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;
S12、使用Canny边缘检测算法和腐蚀膨胀算法,对降噪处理后的图像进行边缘检测和去毛刺处理。
步骤S11具体包括以下步骤:
S111、从字符图像中提取红色像素矩阵、绿色像素矩阵和蓝色像素矩阵;
S112、对三个像素矩阵中每一个元素都进行加权平均,得到灰度值矩阵;
S113、将灰度值矩阵用高斯模糊算法的权重矩阵进行加权平均,得到高斯模糊后的灰度值矩阵。
步骤S12具体包括以下步骤:
S121、利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;
S122、进行非极大值抑制,把梯度的方向划为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点梯度值为0;
S123、用双阈值来对梯度矩阵进行检测,并连接边缘;
S124、对得到的二值图像,连续做多次CLOSE运算。
步骤S2中采用霍夫变换来对环形字符区域进行定位。
步骤S3中使用粒子群算法优化支持向量机算法的惩罚因子和核函数的参数对分割后的字符图像进行识别。
步骤S3具体包括以下步骤:
S31、对分割后的单一字符图像提取字符HOG特征;
S32、根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;
S33、根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。
本发明的后桥主齿轮特殊打标形式的字符识别系统,预处理单元、分割算法单元和字符识别单元,其中:
预处理单元,用于对获取的后桥主齿轮特殊打标形式的字符图像进行预处理;
分割算法单元,用于对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理;
该分割算法单元具体包括:
圆心定位单元,用于定位环形字符区域的圆心,并以该圆心为中心建立坐标系;
区域定位单元,用于根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;
区域变换单元,用于从起始位置坐标开始,将环形字符区域变换成矩形字符区域;
以及区域分割单元,用于从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;
字符识别单元,用于对分割后的单独字符图像进行识别。
预处理单元包括:
降噪处理单元,通过使用灰度化和高斯模糊算法,用于对获取到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;
边缘处理单元,通过使用Canny边缘检测算法和腐蚀膨胀算法,用于对降噪处理后的图像进行边缘检测和去毛刺处理。
字符识别单元包括:
特征提取单元,用于对分割后的单一字符图像提取字符HOG特征;
参数计算单元,用于根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;
识别单元,用于根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。
本发明产生的有益效果是:本发明提出了一种基于任意角度的环形字符分割算法,并采用这种算法对经过预处理后的后桥主齿轮特殊打标形式的字符进行分割,通过将定位到的环形字符区域转换成矩形字符区域,然后逐列扫描该区域的像素点,并将其分割成单一字符,最后对图像进行识别。本发明解决了后桥主齿轮特殊打标形式的字符由于格式特殊,难以使用现有技术定位字符的问题,使用该方法能显著提高字符识别的效率,并且和现有技术相比能够降低识别的误差率。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的一种后桥主齿轮特殊打标形式的字符识别方法流程图;
图2是本发明实施例的基于任意角度的环形字符分割算法流程图;
图3是本发明实施例的一种后桥主齿轮特殊打标形式的字符识别系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明实施例的后桥主齿轮特殊打标形式的字符识别方法包括以下步骤:
S1、获取后桥主齿轮特殊打标形式的字符图像,并对其进行预处理;
S11、使用灰度化和高斯模糊算法,对获取的后桥主齿轮特殊打标形式的字符图像进行降噪处理;
S111、从字符图像中提取红色像素矩阵、绿色像素矩阵和蓝色像素矩阵;
S112、对三个像素矩阵中每一个元素都进行加权平均,得到灰度值矩阵;
S113、将灰度值矩阵用高斯模糊算法的权重矩阵进行加权平均,得到高斯模糊后的灰度值矩阵;
S12、使用Canny边缘检测算法和腐蚀膨胀算法,对降噪处理后的图像进行边缘检测和去毛刺处理;
S121、利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;
S122、进行非极大值抑制,把梯度的方向划为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点梯度值为0;
S123、用双阈值来对梯度矩阵进行检测,并连接边缘;
S124、对得到的二值图像,连续做多次CLOSE运算;
S2、对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:
S21、定位环形字符区域的圆心,并以该圆心为中心建立坐标系;
S22、根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;
S23、从起始位置坐标开始,将环形字符区域变换成矩形字符区域;
S24、从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;
S3、对分割后的单独字符图像进行识别;
S31、对分割后的单一字符图像提取字符HOG特征;
S32、根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;
S33、根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。
先对获取的字符图像进行预处理,预处理的过程包括对字符图像进行降噪处理,通过灰度化和高斯模糊算法,对采集到的主齿轮特殊打标形式的字符图像进行降噪处理。对图像先进行灰度化处理,具体的处理过程是:从字符图像中提取红色像素矩阵,绿色像素矩阵和蓝色像素矩阵;对这三个像素矩阵中每一个元素都进行加权平均,采用的权值系数为W_R=0.3,W_G=0.59,W_B=0.11;对三个像素矩阵进行加权平均后,将得到的结果矩阵赋值给RGB三色通道中的红色像素矩阵,绿色像素矩阵和蓝色像素,使得这三个像素矩阵全部等于加权平均都得到的结果矩阵。这样就得到了主齿轮特殊打标形式的字符图像的灰度化图像,同时也就得到了主齿轮特殊打标形式的字符图像的灰度值矩阵。
对主齿轮的字符图像的灰度值矩阵进行处理,对灰度值矩阵中的每一个元素都用权重矩阵进行加权平均。具体的就是将每一个元素值,用该元素值和其周围一个范围内的元素值,采用由高斯模糊得到的权重矩阵,进行加权平均运算,得到一个新的元素值,来代替原有的元素值。这样就可以用图像中一个像素点周围像素的信息来对中心像素点进行平均处理,使得整个图像变得平滑,由此可以去除图像中的噪声。
在高斯模糊算法中,σ的取值不一样,会导致算法的权重矩阵不一样,继而使得最终的处理结果也不一样,设权重矩阵的大小为5*5,计算得出权重矩阵。其中权重矩阵的大小是依据距离中心待处理的目标像素越远的像素与中心像素关联越小,所以5*5的大小相对合适。在对待图像的边缘像素时,其周围的像素可能会有缺失,因为权重矩阵是对称的,所以可以把缺失的像素用其对称的像素值代替,来计算结果。
在完成对字符图像的降噪处理后,要对其进行边缘处理,这个过程使用Canny边缘检测算法和腐蚀膨胀算法,对图像进行边缘检测和去毛刺处理。用Canny边缘检测进行处理。具体步骤是:利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;进行非极大值抑制,把梯度的方向画为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点值为0值;利用双阈值来对前面处理得到的主齿轮特殊打标形式的字符图像的梯度矩阵进行检测,并连接边缘,在双阈值的选取上,采用50和200的固定阈值。
如何能有效的控制主齿轮特殊打标形式的字符图像中的毛刺显得十分重要,选择用腐蚀膨胀算法,对边缘检测后的主齿轮的字符图像进行处理。在一般的腐蚀膨胀算法中,对于毛刺的处理都是用OPEN运算来进行处理,因为其通过先对图像进行腐蚀运算,在进行膨胀运算,可以有效地将很小的像素点去除,但是由于主齿轮特殊打标形式的字符图像的特殊性,图中的轮廓都是由细小的像素点组成,特别的在图像的中心区域,圆环形的细线,如果先用了腐蚀运算那么该圆环线段将直接被抹掉,从而导致后续的处理没法继续进行。采用CLOSE运算来对主齿轮特殊打标形式的字符图像进行处理,连续做多次CLOSE运算。
图2为本发明的基于任意角度的环形字符分割算法流程图。在完成对字符图像的预处理过程后,需要对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:首先确定字符区域,用霍夫变换定位到中心圆,得到圆心与半径;由圆心向外,从半径的1.3倍处,按照半径的递增,对待处理的图像中的像素进行扫描,判断扫描到的一圈像素中,白色像素的比例是否大于10%且均匀分布,如果是,就记录下该半径值r1;接着增加半径,继续扫描,并继续判断扫描到的一圈像素中,白色像素的比例是否大于10%且均匀分布,如果否,就记录下当前的半径值r2。在待处理的主齿轮特殊打标形状的字符图像中,按照这两个半径值截取出一个圆环形的目标区域,该圆环形的目标区域就是包含有目标主齿轮特殊打标形状的字符的圆环形区域。
基于任意角度的环形字符分割算法。以定位到的圆心(a,b)为中心,建立一个坐标系,并设置计数器C=0,总偏移角度D=0;在圆环形字符图像中读取与X轴正方向重叠的像素点(x,y);判断其中是否有像素值等于255;如果有则C=0,没有则C=C+1;判断C是否大于等于20;如果不是则将坐标系顺时针旋转1度。继续读取与X轴正方向重叠的像素点(x1,y1)。并跳转到第3步;利用坐标旋转公式求取出当前要读取的像素点的坐标;如果C大于等于20,则当前总偏移角度D中的值,就是主齿轮特殊打标形式的字符图像,圆环形区域中的空白的位置。将D中的偏移角度作为下面将圆环形字符变换到矩形字符的起始位置;得到圆环形字符的起始位置以后将前面得到的起始位置设为割开圆环的位置,将圆环区域变换成矩形区域。
然后对矩形字符图像进行分割,具体步骤是:从起始位置开始,逐列扫描矩形区域的像素;如果出现白色像素,则认为出现了有效字符,并记录下横坐标的值x1;继续扫描,直到白色像素消失,即白色像素点占该列像素点数的百分比小于5%,记录下横坐标的值x2;利用x1与x2,分割字符,重复以上3步,直到扫描完整个矩形区域;在得到单一的字符以后,为了方便对单一字符提取特征,本文将单一字符归一到60*60大小。
最后对分割后的单独字符图像进行识别,使用SVM支持向量机算法进行识别,这个过程使用粒子群算法优化支持向量机算法的惩罚因子和核函数的参数,对主齿轮特殊打标形式字符进行识别。将细胞大小设置为6*6,块大小为12*12,每个块内有2*2个细胞,从图像的左上角开始,用块以6个像素为步长,遍历整幅图像,即得到9*9个块。求取图像X方向上的偏导数和Y方向上的偏导数,在求取出图像的梯度幅值矩阵和梯度方向矩阵。然后将梯度方向设为0-180度,并将其9等分,分为9个梯度方向。对每一个6*6细胞内的每一个像素点对该9个梯度方向进行投票,并用该方向上的梯度幅值进行加权,得到一个9维的特征向量。然后将一个块内的2*2个细胞的9维特征向量组合在一起,形成36维的特征向量,对其进行归一化。将单一字符图像中全部9*9个块的36维特征向量组合成2916维特征向量。对于一个单一的字符图像来说,该2916维特征向量就是其HOG特征向量,用来代表该字符。
在利用SVM算法对特殊打标形式的字符进行识别时,会遇到一些问题。比如,SVM的惩罚因子与核函数参数会对最终的识别效率产生很大的影响。粒子群算法是一种随机优化算法,可以进行全局寻优。在本发明实施例中,针对特殊打标形式的字符,采用粒子群算法对SVM的惩罚因子与核函数参数进行优化,其中利用k-fold交叉验证法计算误差作为粒子群算法的适应值,来对SVM的惩罚因子与核函数参数的优劣进行评价。最终得到最适合于本发明特殊打标形式的字符的惩罚因子和核函数参数。
在衡量SVM算法的推广能力时,采用k-fold交叉验证法来对SVM的参数进行优化筛选。具体将样本先分为大小大致相等的k个子集,总共进行k次训练和测试,每次进行训练和测试时,选取其中一个子集作为测试集,其余作为训练集。将每一次训练和测试所得到的错分类的个数总和与总样本的个数的比值作为错误率的估计。
本发明采用的粒子群算法优化惩罚因子C和核函数参数σ的具体步骤如下:读取训练集的字符样本数据,初始化粒子群,即用一组随机的C和σ值作为粒子的初始位置;针对每一个粒子,计算其适应值,并将初始的适应值作为每一个粒子个体的最优解,然后寻找全局最优解;用k-fold交叉验证误差作为适应值,记忆粒子个体与全局分别对应的最优解,计算得出粒子更新后的位置,然后继续计算其适应度,并将当前的适应度与其历史最优适应度进行比较,如果优于历史最优适应度,则用当前适应度,更新历史最优适应度,并将当前粒子的位置作为粒子的最优解;重复上述步骤,直到输出最优解。
如图3所示,是本发明的一种后桥主齿轮特殊打标形式的字符识别系统的结构示意图,该系统包括:预处理单元301,分割算法单元302,字符识别单元303。
预处理单元301,用于对获取的后桥主齿轮特殊打标形式的字符图像进行预处理,具体包括降噪处理单元,通过使用灰度化和高斯模糊算法,用于对采集到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;边缘处理单元,通过使用Canny边缘检测算法和腐蚀膨胀算法,用于对图像进行边缘检测和去毛刺处理。
分割算法单元302,用于对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括:圆心定位单元,用于定位环形字符区域的圆心,并以该圆心为中心建立坐标系;区域定位单元,用于根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;区域变换单元,用于从起始位置坐标开始,将环形字符区域变换成矩形字符区域;区域分割单元,用于从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;
字符识别单元303,用于对分割后的单独字符图像进行识别,具体包括:特征提取单元,用于对分割后的单一字符图像提取字符HOG特征;参数计算单元,用于根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;识别单元,用于根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,包括以下步骤:
S1、获取后桥主齿轮特殊打标形式的字符图像,并对其进行预处理;
S2、对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:
S21、定位环形字符区域的圆心,并以该圆心为中心建立坐标系;
S22、根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;
S23、从起始位置坐标开始,将环形字符区域变换成矩形字符区域;
S24、从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;
S3、对分割后的单独字符图像进行识别。
2.根据权利要求1所述的一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,所述步骤S1具体包括以下步骤:
S11、使用灰度化和高斯模糊算法,对获取的后桥主齿轮特殊打标形式的字符图像进行降噪处理;
S12、使用Canny边缘检测算法和腐蚀膨胀算法,对降噪处理后的图像进行边缘检测和去毛刺处理。
3.根据权利要求2所述的一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,所述步骤S11具体包括以下步骤:
S111、从字符图像中提取红色像素矩阵、绿色像素矩阵和蓝色像素矩阵;
S112、对三个像素矩阵中每一个元素都进行加权平均,得到灰度值矩阵;
S113、将灰度值矩阵用高斯模糊算法的权重矩阵进行加权平均,得到高斯模糊后的灰度值矩阵。
4.根据权利要求2所述的一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,所述步骤S12具体包括以下步骤:
S121、利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;
S122、进行非极大值抑制,把梯度的方向划为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点梯度值为0;
S123、用双阈值来对梯度矩阵进行检测,并连接边缘;
S124、对得到的二值图像,连续做多次CLOSE运算。
5.根据权利要求1所述的一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,步骤S2中采用霍夫变换来对环形字符区域进行定位。
6.根据权利要求1所述的一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,步骤S3中使用粒子群算法优化支持向量机算法的惩罚因子和核函数的参数对分割后的字符图像进行识别。
7.根据权利要求6所述的一种后桥主齿轮特殊打标形式的字符识别方法,其特征在于,步骤S3具体包括以下步骤:
S31、对分割后的单一字符图像提取字符HOG特征;
S32、根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;
S33、根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。
8.一种后桥主齿轮特殊打标形式的字符识别系统,其特征在于,包括预处理单元、分割算法单元和字符识别单元,其中:
预处理单元,用于对获取的后桥主齿轮特殊打标形式的字符图像进行预处理;
分割算法单元,用于对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理;
该分割算法单元具体包括:
圆心定位单元,用于定位环形字符区域的圆心,并以该圆心为中心建立坐标系;
区域定位单元,用于根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;
区域变换单元,用于从起始位置坐标开始,将环形字符区域变换成矩形字符区域;
以及区域分割单元,用于从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;
字符识别单元,用于对分割后的单独字符图像进行识别。
9.根据权利要求8所述的一种后桥主齿轮特殊打标形式的字符识别系统,其特征在于,所述预处理单元包括:
降噪处理单元,通过使用灰度化和高斯模糊算法,用于对获取到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;
边缘处理单元,通过使用Canny边缘检测算法和腐蚀膨胀算法,用于对降噪处理后的图像进行边缘检测和去毛刺处理。
10.根据权利要求8所述的一种后桥主齿轮特殊打标形式的字符识别系统,其特征在于,所述字符识别单元包括:
特征提取单元,用于对分割后的单一字符图像提取字符HOG特征;
参数计算单元,用于根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;
识别单元,用于根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。
CN201510463834.0A 2015-07-31 2015-07-31 一种后桥主齿轮特殊打标形式的字符识别方法及系统 Active CN105046257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510463834.0A CN105046257B (zh) 2015-07-31 2015-07-31 一种后桥主齿轮特殊打标形式的字符识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510463834.0A CN105046257B (zh) 2015-07-31 2015-07-31 一种后桥主齿轮特殊打标形式的字符识别方法及系统

Publications (2)

Publication Number Publication Date
CN105046257A true CN105046257A (zh) 2015-11-11
CN105046257B CN105046257B (zh) 2018-08-14

Family

ID=54452786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510463834.0A Active CN105046257B (zh) 2015-07-31 2015-07-31 一种后桥主齿轮特殊打标形式的字符识别方法及系统

Country Status (1)

Country Link
CN (1) CN105046257B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392205A (zh) * 2017-06-09 2017-11-24 广州视源电子科技股份有限公司 一种遥控器的码值表生成方法与装置
CN107490370A (zh) * 2016-06-13 2017-12-19 原相科技股份有限公司 测量装置及其运作方法,轨迹感测系统及其轨迹感测方法
CN109686346A (zh) * 2018-12-24 2019-04-26 余姚市荣大塑业有限公司 可移动式铜丝琴
CN110164174A (zh) * 2019-05-22 2019-08-23 安徽垚淼森信息科技有限责任公司 一种智能化侧方停车系统
CN110414525A (zh) * 2019-07-31 2019-11-05 新华三信息安全技术有限公司 一种字符识别方法及装置
CN110852315A (zh) * 2019-09-27 2020-02-28 武汉大学 环形文字快速识别方法及装置
CN111652879A (zh) * 2020-07-01 2020-09-11 济南中正金码科技有限公司 一种打标字符质量检测系统及方法
US10816321B2 (en) 2016-06-01 2020-10-27 Pixart Imaging Inc. Measurement device and operation method thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646193A (zh) * 2012-03-23 2012-08-22 河海大学 一种环形排布字符图像分割方法
CN102663386A (zh) * 2012-03-27 2012-09-12 江南大学 机械轴承环形分布压印字符的在线检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646193A (zh) * 2012-03-23 2012-08-22 河海大学 一种环形排布字符图像分割方法
CN102663386A (zh) * 2012-03-27 2012-09-12 江南大学 机械轴承环形分布压印字符的在线检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘君华: "《智能传感器系统》", 31 May 2010 *
李学勇: "金属标牌压印凹凸字符的特征提取和识别方法研究", 《中国博士学位论文全文数据库》 *
杨杰等: "《视频目标检测和跟踪及其应用》", 31 August 2012 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10816321B2 (en) 2016-06-01 2020-10-27 Pixart Imaging Inc. Measurement device and operation method thereof
CN107490370A (zh) * 2016-06-13 2017-12-19 原相科技股份有限公司 测量装置及其运作方法,轨迹感测系统及其轨迹感测方法
CN107490370B (zh) * 2016-06-13 2020-01-10 原相科技股份有限公司 测量装置及其运作方法,轨迹感测系统及其轨迹感测方法
CN107392205A (zh) * 2017-06-09 2017-11-24 广州视源电子科技股份有限公司 一种遥控器的码值表生成方法与装置
CN107392205B (zh) * 2017-06-09 2020-07-07 广州视源电子科技股份有限公司 一种遥控器的码值表生成方法与装置
CN109686346A (zh) * 2018-12-24 2019-04-26 余姚市荣大塑业有限公司 可移动式铜丝琴
CN110164174A (zh) * 2019-05-22 2019-08-23 安徽垚淼森信息科技有限责任公司 一种智能化侧方停车系统
CN110414525A (zh) * 2019-07-31 2019-11-05 新华三信息安全技术有限公司 一种字符识别方法及装置
CN110414525B (zh) * 2019-07-31 2022-02-25 新华三信息安全技术有限公司 一种字符识别方法及装置
CN110852315A (zh) * 2019-09-27 2020-02-28 武汉大学 环形文字快速识别方法及装置
CN111652879A (zh) * 2020-07-01 2020-09-11 济南中正金码科技有限公司 一种打标字符质量检测系统及方法

Also Published As

Publication number Publication date
CN105046257B (zh) 2018-08-14

Similar Documents

Publication Publication Date Title
CN105046257A (zh) 一种后桥主齿轮特殊打标形式的字符识别方法及系统
CN102945368B (zh) 啤酒瓶盖激光字符的定位识别方法
CN108389179B (zh) 一种基于机器视觉的罐盖表面缺陷检测方法
CN108369650B (zh) 标识校准图案的可能特征点的方法
CN105334219B (zh) 一种残差分析动态阈值分割的瓶口缺陷检测方法
CN107192716A (zh) 一种基于轮廓特征的工件缺陷快速检测方法
CN104751187A (zh) 抄表图像自动识别方法
CN108007388A (zh) 一种基于机器视觉的转盘角度高精度在线测量方法
CN103729632A (zh) 一种基于连通区域滤波的圆形Mark点的定位方法
CN102721364A (zh) 一种工件的定位方法及其装置
CN107240112B (zh) 一种复杂场景下个体x角点提取方法
CN111178190B (zh) 基于深度图像的目标检测方法、装置及存储介质
CN104899888A (zh) 一种基于Legendre矩的图像亚像素边缘检测方法
JP2010218232A (ja) 対象物追跡装置
CN112257721A (zh) 一种基于Fast ICP的图像目标区域匹配方法
CN103745236A (zh) 纹理图像识别方法以及纹理图像识别装置
CN112289377B (zh) 检测图像上的亮斑的方法、装置和计算机程序产品
JP7044504B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN112184723B (zh) 图像处理方法及装置、电子设备、存储介质
Pan et al. An efficient method for skew correction of license plate
CN112597868A (zh) 基于无定位点的试卷识别和矫正方法
CN111178111A (zh) 二维码检测方法、电子设备、存储介质及系统
CN114833648B (zh) 液压泵轴承磨削工艺中的表面损伤识别及磨削控制方法
CN108647713B (zh) 胚胎边界识别与激光轨迹拟合方法
CN115880303A (zh) 用于pcb板圆孔的亚像素精度定位检测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant