CN110929713A - 一种基于bp神经网络的钢印字符识别方法 - Google Patents

一种基于bp神经网络的钢印字符识别方法 Download PDF

Info

Publication number
CN110929713A
CN110929713A CN201911156708.5A CN201911156708A CN110929713A CN 110929713 A CN110929713 A CN 110929713A CN 201911156708 A CN201911156708 A CN 201911156708A CN 110929713 A CN110929713 A CN 110929713A
Authority
CN
China
Prior art keywords
image
character
neural network
value
steel seal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911156708.5A
Other languages
English (en)
Other versions
CN110929713B (zh
Inventor
谭建平
刘�文
邓积微
桑艳伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201911156708.5A priority Critical patent/CN110929713B/zh
Publication of CN110929713A publication Critical patent/CN110929713A/zh
Application granted granted Critical
Publication of CN110929713B publication Critical patent/CN110929713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于BP神经网络的钢印字符识别方法,属于图像识别技术领域,通过布置在工业现场的工业相机对工件钢印进行拍照,采集图像;通过机器学习聚类算法对图像进行阈值分割,实现了良好的分割效果,解决了针对钢印图片传统单一阈值分割无法准确分割特征与字符背景的问题,同时将聚类算法应用字符分割当中,实现了图像中字符的自动分割,而图像的归一化处理则解决了工件在移动过程中可能存在位置的偏移,从而导致图像大小的变化问题,提高了钢印识别的准确率;同时利用神经网络实现了对钢印识别模型的训练,且其模型在测试集中取得良好的效果。

Description

一种基于BP神经网络的钢印字符识别方法
技术领域
本发明属于图像识别技术领域,具体涉及一种基于BP神经网络的钢印字符识别方法。
背景技术
近年来,由于计算机技术以及传感技术的快速发展,传统工厂逐渐向智能化、无人化的方向发展,但是在大型铸件、铝件的加工过程中,其在锻压车间加工时,其工件表面温度可达上百摄氏度,从而无法通过传统的RFID(如二维码、传感器等等)识别技术自动识别,因此其产品物料钢印批号的录入则一般是通过人工手动录入,但是人工录入在批量多的情况下会存在录入速度慢、录入结果出错等问题,因此为实现工厂智能化升级、解决工厂物料自动识别存在的问题,亟需一种图像识别技术来实现对钢印字符的自动识别。
目前,人们对钢印字符识别技术的研究还处于起步阶段,已有图像识别技术主要应用在车牌识别、OCR文字识别等领域较多,但是其无法有效解决在钢印字符背景与字符特征相似,光线分布不均匀等情况下,字符区域与背景区域的准确分割。中国专利CN102426649B公开了一种简单的高准确率的钢印字符自动识别方法,其主要通过双阈值分割与神经网络算法实现对字符的识别,但是双阈值方法其阈值设置自适应性能差,在光照不均匀的情况下无法准确将字符与背景分割,同时无法解决图像分割后噪声的干扰;在学术界,也有很多学者针对图像分割做出一系列的研究,乔晓艳等人提出了基于模糊C均值聚类算法的心脏扭转运动中心室壁轮廓的自动提取方法,其使用模糊均值聚类算法与预设阈值相结合,从而完成图像阈值分割;赵红丹等人提出一种基于K-means算法分割遥感图像阈值确定方法,应用聚类算法的聚类中心平均值作为图像分割阈值,实现对图像的分割;但上述方法只是对传统阈值分割算法的改进,本质上还是传统的单阈值分割,依然无法解决在光照分布不均匀情况下字符区域和背景区域的准确分割难题。
发明内容
针对现有技术中图像特征提取中图像阈值分割效果不佳,图像分割后存在噪点等问题,本发明的目的在于提供一种基于BP神经网络的钢印字符识别方法,本发明方法在图像分割处理部分从样本容量出发,利用聚类算法将样本分成若干族(数量应根据实际情况而定),利用族内样本数占总体样本数的比例从而将其划分为字符区域、背景区域,实现对图像的分割,实现了钢印识别在的光照不均匀、字符与背景相似等条件下图像的准确分割,以及对图像分割后可能存在的图像噪点应用连通域大小判别实现字符区域和噪声区域的识别,进而实现噪声的去除,再利用聚类算法将图片分割成单个字符,进行归一化处理后,作为神经网络的输入得到相应的神经网络识别模型,与传统的字符识别技术相比,本方法中的图像分割算法通过样本容量占比而不是传统单阈值或多阈值方法实现图像字符与背景区域的分割,克服了传统单阈值或多阈值方法无法在光照不均匀、字符区域与背景区域特征相似条件下准确分割的问题,同时增加了对图像分割后噪声点的去除步骤,增强了算法识别的鲁棒性,其实际识别效果好、识别速度快,具备在工业现场环境下应用的条件。
为了达到上述目的,本发明提供以下技术方案:一种基于BP神经网络的钢印字符识别方法,包括以下步骤:
S1.通过CCD相机采集钢印表面图片,并将其放入训练集中;
S2.对训练集中的图片,通过灰度转换将RGB图像转换为灰度图;
S3.对灰度变化后图像,进行图像预处理;
S4.对预处理后的图像进行图像阈值分割,将字符区域与背景区域分离;
S5.对阈值分割后的图像进行连通域标记,通过判定连通域的大小来删除图像中存在的噪点;
S6.对删除噪声后的图像进行图像字符分割操作,将图像中的字符区域分割成单个字符图像;
S7.对图像字符分割后的图像进行归一化处理,并将分割处理后的字符图像分别放入相应的0~9的字符文件夹中,将训练集中的图片重复上述步骤,并判断是否全部执行,若未执行完,则继续上述步骤;
S8.若执行完毕,则将步骤S7中得到字符归一化处理后的字符图像以文件夹的名称作为训练标签放入BP神经网络中训练,得到BP神经网络训练的模型;
S9.对实际测试图片,重复图片测试集中图片处理流程S1~S8,实现字符图片的分割与归一化处理,将处理后的图片放入BP神经网络训练的模型中进行钢印字符识别,得到相应的结果。
在一个具体实施例中,所述步骤S2中灰度转换的具体操作为:
通过读取图片像素点的R、G、B值,则其灰度值
Figure BDA0002285006570000031
通过上述操作,将彩色图像转换为灰度图像。
在一个具体实施例中,所述步骤S3中图像预处理的具体操作为:
利用高斯滤波对图像进行平滑去噪,平滑的程度取决于标准差;其输出是领域像素的加权平均,离中心越近的像素权重越高。
通过图像预处理后,灰度图像的平滑效果更柔和,而且边缘保留的也更好,从而为下一步的图像处理做好准备。
在一个具体实施例中,所述步骤S4中图像阈值分割,通过机器学习聚类算法,将背景与钢印字符的灰度值分为两类,并分别将两个族内的灰度值分别重置为0与255,从而实现图像的阈值分割,其流程具体如下:
步骤1:首先随机选取两个像素点的像数值作为初始均值向量{u1,u2},然后计算各像素点到各均值量的曼哈顿距离
Figure BDA0002285006570000032
其中xi为初始均值,而xj则为图像中各像素点的像素值;
步骤2:遍历图像像素点,比较像素点与初始均值的曼哈顿距离,若与初始均值u1接近,即曼哈顿距离值小,则划入C1族内,反之则划入c2族内;
步骤3:计算两个族内的灰度值均值,并于初始向量{u1,u2,u3}相比,若其向量之差小于允许的误差值,则停止划分,等待下一步处理;反之则重复上述步骤,直至向量之差小于允许误差值;
步骤4:分别计算u1,u2,u3点在整个图像内的占比,假设u1<u2u3,根据图像预设背景区域大于70%,若u3占比大于70%,则认为u3为背景区域,将其族内点集灰度值置为0,其他两族置为1,反之,则认为u1,u3为背景区域,将其族内点集灰度值置为0,u2族点集置为1,完成图像阈值分割。
在一个具体实施例中,所述步骤S5中删除图像中存在的噪点,具体操作为:
噪点是表面坑洼造成的,通过连通域标记,确定阈值分割后的连通域个数,通过判定连通域面积大小从而可以判定哪些连通域是属于字符,哪些属于背景中,进而将属于背景的连通域删除,从而实现图像噪点的去除。
在一个具体实施例中,所述步骤S6中图像字符分割操作,具体为:
步骤1:计算0和255灰度值的占比,占比小的为字符区域,为减少字符识别特征向量的提取,将字符区域重置为255,背景区域重置为0,即若占比小的字符区域灰度值为0,则将该族内所有灰度值重置为255,则另外一族内重置为0;
步骤2:根据字符个数k,随机选取k个图片中灰度值为255的坐标作为初始向量{u1,u2,…,uk},其中ui=(xi,yi)即为随机选取点的像素坐标;
步骤3:遍历图中灰度值为255的坐标点,分别计算各点与初始均值的欧式距离,即
Figure BDA0002285006570000041
其中xi,xj分别对应遍历的坐标点和初始均值;
步骤4:计算出每点与初始向量中所有的均值向量的欧式距离,选取其中欧式距离最小的点,并将其划入相应的族Ci中;
步骤5:遍历灰度值为255的点后,分别计算新的均值向量
Figure BDA0002285006570000042
即取Ci族内点的平均坐标;
步骤6:计算新的均值向量u′与u的误差大小,若小于设定的误差值,则划分完毕,进入下一步骤,若大于误差值,则将均值向量更新,重新进行上述循环;
步骤7:对划分的族内坐标进行排序,选出其点x轴最大、最小值,y轴最大、最小值,并两两组合,形成矩形区域,其即为单个字符区域,字符划分结束。
在一个具体实施例中,所述步骤S7中归一化处理的具体操作为:
步骤1:首先计算图像的X,Y方向的质心,其计算公式如下:
Figure BDA0002285006570000043
Figure BDA0002285006570000044
式中c(i,j)为255时表示其为黑色即为字符区域颜色,为0时则表示为背景区域颜色;
步骤2:然后再计算水平和垂直方向的散度σI和σJ,其计算公式如下:
Figure BDA0002285006570000051
Figure BDA0002285006570000052
步骤3:最后按比例将图像线性放大或缩小成30×30像素大小的规定散度的图像点阵。
在一个具体实施例中,所述步骤S8中BP神经网络训练的模型,通过以下方式构建:
步骤1:构建神经网络,其包扣输入层、隐藏层以及输出层,确定输入层神经元、隐藏层神经元以及输出层神经元个数,初始化权值whj,vih和阈值θj,γh
步骤2:其中输出层个数为0~9的10个神经元,输入层神经元个数为归一化图像后像素点的个数,隐藏层神经元个数根据Kolmogorov定理,隐藏层神经元节点与输入层结点的关系如下:
s=2n+1
其中s为隐藏层神经元个数,n为输入层神经元个数;
步骤3:根据下述公式确定隐藏层、输出层的输入与输出:
βj=∑hwhjbh
Figure BDA0002285006570000053
αh=∑ivihxi
Figure BDA0002285006570000054
其中,yj,βj分别表示输出层的输入与输出,αh,bh分别表示隐藏层的输入与输出,xi表示为输入层输入;
其中,whj表示隐藏层第h个神经元与输出层第j个神经元的连接权重,θj为输出层第j个神经元激活阈值权重,vih表示隐藏层第h个神经元与输入层第i个神经元的连接权重,γh为隐藏层第h个神经元激活阈值权重;
步骤4:反向传播误差计算,记输出为
Figure BDA0002285006570000061
则其均方误差为:
Figure BDA0002285006570000062
其中,
Figure BDA0002285006570000063
为神经网络输出,yk为训练样本实际值;
步骤5:更新权值和阈值,根据广义感知机原则以及BP算法的基于梯度下降原则,可以权值增量以及阈值增量:
Δwhj=ηgjbh
Δθj=-ηgj
Δvih=ηehxi
Δwhj=-ηeh
Figure BDA0002285006570000064
Figure BDA0002285006570000065
其中,η为学习率;
步骤6:重复上述步骤,直到训练集上累计误差E小于允许阈值,累计误差其计算公式如下:
Figure BDA0002285006570000066
本发明的有益效果:
本发明通过布置在工业现场的工业相机对工件钢印进行拍照,采集图像;通过机器学习聚类算法对图像进行阈值分割,实现了良好的分割效果,解决了针对钢印图片传统单一阈值分割无法准确分割特征与字符背景的问题,同时将聚类算法应用字符分割当中,实现了图像中字符的自动分割,而图像的归一化处理则解决了工件在移动过程中可能存在位置的偏移,从而导致图像大小的变化问题,提高了钢印识别的准确率;同时利用神经网络实现了对钢印识别模型的训练,且其模型在测试集中取得良好的效果。
本发明所述图像分割是采用机器学习中的聚类算法,通过预设图像中字符个数,算法自动实现对图像字符的快速、准确分割。
本发明可以准确定位工件钢印表面字符区域并能进行有效分割与识别,减少图像噪声因素的干扰;能减少人为字符输入错误和资源的浪费,而且本发明基于机器学习中聚类算法和人工神经网络方法,能有效提高算法的识别进度与适应性,解决了现有识别方法的识别率较低的问题,在一定程度上有利于工厂的智能化发展。
附图说明
图1为本发明实施例一种基于BP神经网络的钢印字符识别方法的流程图。
图2为本发明实施例中钢印表面实物图。
图3为本发明实施例中提取数字区域的阈值分割图像。
图4为本发明实施例中删除噪点后的图像。
图5为本发明实施例中从数字区域分割出的单个数字图像。
图6为本发明实施例中归一化后的字符图像。
图7为本发明实施例中基于BP神经网络训练的模型中进行钢印字符识别的结果。
具体实施方式
下面结合具体实施例和附图对本发明进行进一步说明:
本发明实施例一种基于BP神经网络的钢印字符识别方法,如图1所示,包括以下步骤:
(1)、图像获取:图像获取是通过固定在工业现场的CCD工业相机拍摄的,如图2所示,其与工件表面距离基本固定,也可能随着工件的摆放位置差异距离会有小范围的波动;
(2)、图像灰度转换:通过读取图片像素点的R、G、B值,则其灰度值
Figure BDA0002285006570000071
通过上述操作,将彩色图像转换为灰度图像;
(3)、利用高斯滤波对图像进行平滑去噪,其平滑的程度取决于标准差,它的输出是领域像素的加权平均,同时离中心越近的像素权重越高,因此,相对于均值滤波它的平滑效果更柔和,而且边缘保留的也更好,从而为下一步的图像处理做好准备;
(4)、图像阈值分割:通过机器学习聚类算法,将背景与钢印字符的灰度值分为两类,并分别将两个族内的灰度值分别重置为0与255,从而实现图像的阈值分割,其流程具体如下:
步骤4.1:首先随机选取两个像素点的像数值作为初始均值向量{u1,u2},然后计算各像素点到各均值量的曼哈顿距离
Figure BDA0002285006570000081
其中xi为初始均值,而xj则为图像中各像素点的像素值;
步骤4.2:遍历图像像素点,比较像素点与初始均值的曼哈顿距离,若与初始均值u1接近,即曼哈顿距离值小,则划入C1族内,反之则划入C2族内;
步骤4.3:计算两个族内的灰度值均值,并于初始向量{u1,u2,u3}相比,若其向量之差小于允许的误差值,则停止划分,等待下一步处理;反之则重复上述步骤,直至向量之差小于允许误差值;
步骤4.4:分别计算u1,u2,u3点在整个图像内的占比,假设u1<u2<u3,根据图像预设背景区域大于70%,若u3占比大于70%,则认为u3为背景区域,将其族内点集灰度值置为0,其他两族置为1,反之,则认为u1,u3为背景区域,将其族内点集灰度值置为0,u2族点集置为1,完成图像阈值分割,如图3所示;
(5)、图像噪点去除:通过连通域标记,确定阈值分割后的连通域个数,通过判定连通域面积大小从而可以判定哪些连通域是属于字符,哪些属于背景中,进而将属于背景的连通域删除,从而实现图像噪点的去除,去噪后的图像如图4;
(6)、图像分割:
步骤6.1:计算0和255灰度值的占比,占比小的为字符区域,为减少字符识别特征向量的提取,将字符区域重置为255,背景区域重置为0,即若占比小的字符区域灰度值为0,则将该族内所有灰度值重置为255,则另外一族内重置为0;
步骤6.2:根据字符个数k,随机选取k个图片中灰度值为255的坐标作为初始向量{u1,u2,…,uk},其中ui=(xi,yi)即为随机选取点的像素坐标;
步骤6.3:遍历图中灰度值为255的坐标点,分别计算各点与初始均值的欧式距离,即
Figure BDA0002285006570000082
其中xi,xj分别对应遍历的坐标点和初始均值;
步骤6.4:计算出每点与初始向量中所有的均值向量的欧式距离,选取其中欧式距离最小的点,并将其划入相应的族Ci中;
步骤6.5:遍历灰度值为255的点后,分别计算新的均值向量
Figure BDA0002285006570000091
即取Ci族内点的平均坐标;
步骤6.6:计算新的均值向量u′与u的误差大小,若小于设定的误差值,则划分完毕,进入下一步骤,若大于误差值,则将均值向量更新,重新进行上述循环;
步骤6.7:对划分的族内坐标进行排序,选出其点x轴最大、最小值,v轴最大、最小值,并两两组合,形成矩形区域,其即为单个字符区域,字符划分结束,图5为聚类算法分割后的图片;
(7)、归一化处理:对图像字符分割后的图像进行归一化处理,并将分割处理后的字符图像分别放入相应的0~9的字符文件夹中,将训练集中的图片重复上述步骤,并判断是否全部执行,若未执行完,则继续上述步骤;
归一化处理的具体操作为:
步骤7.1:首先计算图像的X,Y方向的质心,其计算公式如下:
Figure BDA0002285006570000092
Figure BDA0002285006570000093
式中c(i,j)为255时表示其为黑色即为字符区域颜色,为0时则表示为背景区域颜色;
步骤7.2:然后再计算水平和垂直方向的散度σI和σJ,其计算公式如下:
Figure BDA0002285006570000094
Figure BDA0002285006570000095
步骤7.3:最后按比例将图像线性放大或缩小成30×30像素大小的规定散度的图像点阵,图6为归一化处理后的图像;
(8)、BP神经网络训练:若执行完毕,则将步骤(7)中得到字符归一化处理后的字符图像以文件夹的名称作为训练标签放入BP神经网络中训练,得到BP神经网络训练的模型;
BP神经网络训练的模型,通过以下方式得到:
步骤8.1:构建神经网络,其包扣输入层、隐藏层以及输出层,确定输入层神经元、隐藏层神经元以及输出层神经元个数,初始化权值whj,vih和阈值θi,γh
步骤8.2:其中输出层个数为0~9的10个神经元,输入层神经元个数为归一化图像后像素点的个数,隐藏层神经元个数根据Kolmogorov定理,隐藏层神经元节点与输入层结点的关系如下:
s=2n+1
其中s为隐藏层神经元个数,n为输入层神经元个数;
步骤8.3:根据下述公式确定隐藏层、输出层的输入与输出:
βj=∑hwhjbh
Figure BDA0002285006570000101
αh=∑ivihxi
Figure BDA0002285006570000102
其中,yj,βj分别表示输出层的输入与输出,αh,bh分别表示隐藏层的输入与输出,xi表示为输入层输入;
其中,whj表示隐藏层第h个神经元与输出层第j个神经元的连接权重,θj为输出层第j个神经元激活阈值权重,vih表示隐藏层第h个神经元与输入层第i个神经元的连接权重,γh为隐藏层第h个神经元激活阈值权重;
步骤8.4:反向传播误差计算,记输出为
Figure BDA0002285006570000103
则其均方误差为:
Figure BDA0002285006570000104
其中,
Figure BDA0002285006570000105
为神经网络输出,yk为训练样本实际值;
步骤8.5:更新权值和阈值,根据广义感知机原则以及BP算法的基于梯度下降原则,可以权值增量以及阈值增量:
Δwhj=ηgjbh
Δθj=-ηgj
Δvih=ηehxi
Δwhj=-ηeh
Figure BDA0002285006570000111
Figure BDA0002285006570000112
其中,η为学习率;
步骤8.6:重复上述步骤,直到训练集上累计误差E小于允许阈值,累计误差其计算公式如下:
Figure BDA0002285006570000113
(9)、图像识别:
将待识别图片按上述步骤(1)~(7)处理后,通过已训练好的模型进行识别,即可得到图像字符结果,具体如图7所示。
以上列举的应用实例只对本发明做具体说明,通过实施例对本发明进行具体描述,实施例只用于对本发明进行进一步说明,而不是对本发明保护范围的限定,该领域的技术人员可以根据本发明做出一些非本质的改进和调整。

Claims (8)

1.一种基于BP神经网络的钢印字符识别方法,其特征在于,包括以下步骤:
S1.通过CCD相机采集钢印表面图片,并将其放入训练集中;
S2.对训练集中的图片,通过灰度转换将RGB图像转换为灰度图;
S3.对灰度变化后图像,进行图像预处理;
S4.对预处理后的图像进行图像阈值分割,将字符区域与背景区域分离;
S5.对阈值分割后的图像进行连通域标记,通过判定连通域的大小来删除图像中存在的噪点;
S6.对删除噪声后的图像进行图像字符分割操作,将图像中的字符区域分割成单个字符图像;
S7.对图像字符分割后的图像进行归一化处理,并将分割处理后的字符图像分别放入相应的0~9的字符文件夹中,将训练集中的图片重复上述步骤,并判断是否全部执行,若未执行完,则继续上述步骤;
S8.若执行完毕,则将步骤S7中得到字符归一化处理后的字符图像以文件夹的名称作为训练标签放入BP神经网络中训练,得到BP神经网络训练的模型;
S9.对实际测试图片,重复图片测试集中图片处理流程S1~S8,实现字符图片的分割与归一化处理,将处理后的图片放入BP神经网络训练的模型中进行钢印字符识别,得到相应的结果。
2.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S2中灰度转换的具体操作为:
通过读取图片像素点的R、G、B值,则其灰度值
Figure FDA0002285006560000011
通过上述操作,将彩色图像转换为灰度图像。
3.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S3中图像预处理的具体操作为:
利用高斯滤波对图像进行平滑去噪,平滑的程度取决于标准差;其输出是领域像素的加权平均,离中心越近的像素权重越高。
4.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S4中图像阈值分割,通过机器学习聚类算法,将背景与钢印字符的灰度值分为两类,并分别将两个族内的灰度值分别重置为0与255,从而实现图像的阈值分割,其流程具体如下:
步骤1:首先随机选取两个像素点的像数值作为初始均值向量{u1,u2},然后计算各像素点到各均值量的曼哈顿距离
Figure FDA0002285006560000021
其中xi为初始均值,而xj则为图像中各像素点的像素值;
步骤2:遍历图像像素点,比较像素点与初始均值的曼哈顿距离,若与初始均值u1接近,即曼哈顿距离值小,则划入C1族内,反之则划入C2族内;
步骤3:计算两个族内的灰度值均值,并于初始向量{u1,u2,u3}相比,若其向量之差小于允许的误差值,则停止划分,等待下一步处理;反之则重复上述步骤,直至向量之差小于允许误差值;
步骤4:分别计算u1,u2,u3点在整个图像内的占比,假设u1<u2<u3,根据图像预设背景区域大于70%,若u3占比大于70%,则认为u3为背景区域,将其族内点集灰度值置为0,其他两族置为1,反之,则认为u1,u3为背景区域,将其族内点集灰度值置为0,u2族点集置为1,完成图像阈值分割。
5.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S5中删除图像中存在的噪点,具体操作为:
噪点是表面坑洼造成的,通过连通域标记,确定阈值分割后的连通域个数,通过判定连通域面积大小从而可以判定哪些连通域是属于字符,哪些属于背景中,进而将属于背景的连通域删除,从而实现图像噪点的去除。
6.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S6中图像字符分割操作,具体为:
步骤1:计算0和255灰度值的占比,占比小的为字符区域,为减少字符识别特征向量的提取,将字符区域重置为255,背景区域重置为0,即若占比小的字符区域灰度值为0,则将该族内所有灰度值重置为255,则另外一族内重置为0;
步骤2:根据字符个数k,随机选取k个图片中灰度值为255的坐标作为初始向量{u1,u2,…,uk},其中ui=(xi,yi)即为随机选取点的像素坐标;
步骤3:遍历图中灰度值为255的坐标点,分别计算各点与初始均值的欧式距离,即
Figure FDA0002285006560000022
其中xi,xj分别对应遍历的坐标点和初始均值;
步骤4:计算出每点与初始向量中所有的均值向量的欧式距离,选取其中欧式距离最小的点,并将其划入相应的族Ci中;
步骤5:遍历灰度值为255的点后,分别计算新的均值向量
Figure FDA0002285006560000031
即取Ci族内点的平均坐标;
步骤6:计算新的均值向量u′与u的误差大小,若小于设定的误差值,则划分完毕,进入下一步骤,若大于误差值,则将均值向量更新,重新进行上述循环;
步骤7:对划分的族内坐标进行排序,选出其点x轴最大、最小值,y轴最大、最小值,并两两组合,形成矩形区域,其即为单个字符区域,字符划分结束。
7.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S7中归一化处理的具体操作为:
步骤1:首先计算图像的X,Y方向的质心,其计算公式如下:
Figure FDA0002285006560000032
Figure FDA0002285006560000033
式中c(i,j)为255时表示其为黑色即为字符区域颜色,为0时则表示为背景区域颜色;
步骤2:然后再计算水平和垂直方向的散度σI和σJ,其计算公式如下:
Figure FDA0002285006560000034
Figure FDA0002285006560000035
步骤3:最后按比例将图像线性放大或缩小成30×30像素大小的规定散度的图像点阵。
8.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S8中BP神经网络训练的模型,通过以下方式构建:
步骤1:构建神经网络,其包扣输入层、隐藏层以及输出层,确定输入层神经元、隐藏层神经元以及输出层神经元个数,初始化权值whj,vih和阈值θj,γh
步骤2:其中输出层个数为0~9的10个神经元,输入层神经元个数为归一化图像后像素点的个数,隐藏层神经元个数根据Kolmogorov定理,隐藏层神经元节点与输入层结点的关系如下:
s=2n+1
其中s为隐藏层神经元个数,n为输入层神经元个数;
步骤3:根据下述公式确定隐藏层、输出层的输入与输出:
βj=∑hWhjbh
Figure FDA0002285006560000041
αh=∑ivihxi
Figure FDA0002285006560000042
其中,yj,βj分别表示输出层的输入与输出,αh,bh分别表示隐藏层的输入与输出,xi表示为输入层输入;
其中,whj表示隐藏层第h个神经元与输出层第j个神经元的连接权重,θj为输出层第j个神经元激活阈值权重,vih表示隐藏层第h个神经元与输入层第i个神经元的连接权重,γh为隐藏层第h个神经元激活阈值权重;
步骤4:反向传播误差计算,记输出为
Figure FDA0002285006560000043
则其均方误差为:
Figure FDA0002285006560000044
其中,
Figure FDA0002285006560000045
为神经网络输出,yk为训练样本实际值;
步骤5:更新权值和阈值,根据广义感知机原则以及BP算法的基于梯度下降原则,可以权值增量以及阈值增量:
Δwhj=ηgjbh
Δθj=-ηgj
Δvih=ηehxi
Δwhj=-ηeh
Figure FDA0002285006560000051
Figure FDA0002285006560000052
其中,η为学习率;
步骤6:重复上述步骤,直到训练集上累计误差E小于允许阈值,累计误差其计算公式如下:
Figure FDA0002285006560000053
CN201911156708.5A 2019-11-22 2019-11-22 一种基于bp神经网络的钢印字符识别方法 Active CN110929713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911156708.5A CN110929713B (zh) 2019-11-22 2019-11-22 一种基于bp神经网络的钢印字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911156708.5A CN110929713B (zh) 2019-11-22 2019-11-22 一种基于bp神经网络的钢印字符识别方法

Publications (2)

Publication Number Publication Date
CN110929713A true CN110929713A (zh) 2020-03-27
CN110929713B CN110929713B (zh) 2023-04-07

Family

ID=69850744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911156708.5A Active CN110929713B (zh) 2019-11-22 2019-11-22 一种基于bp神经网络的钢印字符识别方法

Country Status (1)

Country Link
CN (1) CN110929713B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428724A (zh) * 2020-04-13 2020-07-17 北京星网锐捷网络技术有限公司 一种试卷手写统分方法、装置及存储介质
CN112926563A (zh) * 2021-02-23 2021-06-08 辽宁科技大学 一种钢卷喷印标记故障诊断系统
CN112967000A (zh) * 2021-03-11 2021-06-15 中工美(北京)供应链物流管理有限责任公司 白银仓储自动入库系统的外观和重量识别方法
CN113240633A (zh) * 2021-04-28 2021-08-10 小孚科技(杭州)有限公司 基于智能图像识别与ocr技术的重工钢材数字化方案
CN114495083A (zh) * 2022-01-13 2022-05-13 深圳市瑞意博科技股份有限公司 钢印字符识别方法、装置、设备和介质
CN114771120A (zh) * 2022-06-18 2022-07-22 南通人民彩印有限公司 微接触印刷过程压力控制方法、装置及人工智能系统
CN115830599A (zh) * 2023-02-08 2023-03-21 成都数联云算科技有限公司 工业字符识别方法、模型训练方法、装置、设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5801857A (en) * 1989-09-28 1998-09-01 Gao Gesellschaft Fur Automation Und Organisation Mbh Data carrier having an optically variable element and methods for producing it
CN101408933A (zh) * 2008-05-21 2009-04-15 浙江师范大学 基于粗网格特征提取和bp神经网络的车牌字符识别方法
CN108009538A (zh) * 2017-12-22 2018-05-08 大连运明自动化技术有限公司 一种汽车发动机缸体序列号智能识别方法
CN108038482A (zh) * 2017-12-22 2018-05-15 大连运明自动化技术有限公司 一种汽车发动机缸体序列号视觉智能识别系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5801857A (en) * 1989-09-28 1998-09-01 Gao Gesellschaft Fur Automation Und Organisation Mbh Data carrier having an optically variable element and methods for producing it
CN101408933A (zh) * 2008-05-21 2009-04-15 浙江师范大学 基于粗网格特征提取和bp神经网络的车牌字符识别方法
CN108009538A (zh) * 2017-12-22 2018-05-08 大连运明自动化技术有限公司 一种汽车发动机缸体序列号智能识别方法
CN108038482A (zh) * 2017-12-22 2018-05-15 大连运明自动化技术有限公司 一种汽车发动机缸体序列号视觉智能识别系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
程立梅,翁世修: "用改进型BP网络识别生产线上加工零件的技术", 《组合机床与自动化加工技术》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428724A (zh) * 2020-04-13 2020-07-17 北京星网锐捷网络技术有限公司 一种试卷手写统分方法、装置及存储介质
CN111428724B (zh) * 2020-04-13 2023-09-22 北京星网锐捷网络技术有限公司 一种试卷手写统分方法、装置及存储介质
CN112926563A (zh) * 2021-02-23 2021-06-08 辽宁科技大学 一种钢卷喷印标记故障诊断系统
CN112926563B (zh) * 2021-02-23 2024-01-02 辽宁科技大学 一种钢卷喷印标记故障诊断系统
CN112967000A (zh) * 2021-03-11 2021-06-15 中工美(北京)供应链物流管理有限责任公司 白银仓储自动入库系统的外观和重量识别方法
CN113240633A (zh) * 2021-04-28 2021-08-10 小孚科技(杭州)有限公司 基于智能图像识别与ocr技术的重工钢材数字化方案
CN114495083A (zh) * 2022-01-13 2022-05-13 深圳市瑞意博科技股份有限公司 钢印字符识别方法、装置、设备和介质
CN114771120A (zh) * 2022-06-18 2022-07-22 南通人民彩印有限公司 微接触印刷过程压力控制方法、装置及人工智能系统
CN114771120B (zh) * 2022-06-18 2022-09-02 南通人民彩印有限公司 微接触印刷过程压力控制方法、装置及人工智能系统
CN115830599A (zh) * 2023-02-08 2023-03-21 成都数联云算科技有限公司 工业字符识别方法、模型训练方法、装置、设备和介质
CN115830599B (zh) * 2023-02-08 2023-04-21 成都数联云算科技有限公司 工业字符识别方法、模型训练方法、装置、设备和介质

Also Published As

Publication number Publication date
CN110929713B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110929713B (zh) 一种基于bp神经网络的钢印字符识别方法
CN108830188B (zh) 基于深度学习的车辆检测方法
CN109101924B (zh) 一种基于机器学习的路面交通标志识别方法
CN111709417B (zh) 一种矿车车牌识别方法
CN110120042B (zh) 一种基于slic超像素和自动阈值分割的农作物图像病虫害区域提取方法
CN110909618B (zh) 一种宠物身份的识别方法及装置
CN107038416B (zh) 一种基于二值图像改进型hog特征的行人检测方法
CN111724355B (zh) 一种鲍鱼体型参数的图像测量方法
Zang et al. Traffic sign detection based on cascaded convolutional neural networks
CN108710909B (zh) 一种可变形旋转不变装箱物体清点方法
CN112417931B (zh) 一种基于视觉显著性的水面物体检测和分类的方法
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
CN111738367B (zh) 一种基于图像识别的零件分类方法
CN111898621A (zh) 一种轮廓形状识别方法
CN102147867A (zh) 一种基于主体的国画图像和书法图像的识别方法
CN114331986A (zh) 一种基于无人机视觉的坝体裂纹识别与测量方法
CN106780376A (zh) 基于显著性检测和联合分割算法的背景图像分割方法
CN110543906A (zh) 基于数据增强和Mask R-CNN模型的肤质自动识别方法
CN113705579A (zh) 一种视觉显著性驱动的图像自动标注方法
CN110188646B (zh) 基于梯度方向直方图与局部二值模式融合的人耳识别方法
CN107729863B (zh) 人体指静脉识别方法
Chen et al. Image segmentation based on mathematical morphological operator
CN106548195A (zh) 一种基于改进型hog‑ulbp特征算子的目标检测方法
CN113989196A (zh) 一种基于视觉的耳机硅胶垫圈的外观缺陷检测方法
CN112926694A (zh) 基于改进的神经网络对图像中的猪只进行自动识别的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant