CN111488952A - 一种适用于轮毂自动化识别的深度残差模型构建方法 - Google Patents
一种适用于轮毂自动化识别的深度残差模型构建方法 Download PDFInfo
- Publication number
- CN111488952A CN111488952A CN202010596458.3A CN202010596458A CN111488952A CN 111488952 A CN111488952 A CN 111488952A CN 202010596458 A CN202010596458 A CN 202010596458A CN 111488952 A CN111488952 A CN 111488952A
- Authority
- CN
- China
- Prior art keywords
- layer
- hub
- output
- model
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种适用于轮毂自动化识别的深度残差模型构建方法。首先通过相机采集不同类型的轮毂图像,构建轮毂图像数据集,并对轮毂数据集按比例分割为训练集和测试集。然后设计深度学习的残差块,并基于卷积层、池化层、归一化层、失活层以及非线性激活层构建轮毂深度学习模型。采用Xavier对权重进行随机初始化,并结合Adam优化算法与批量随机梯度下降算法对模型参数进行优化。采用本发明方法构建的模型能够实现对多种轮毂类型的识别,没有过拟合现象,识别速度快,识别精度高,能够实现工业轮毂的实时识别。
Description
技术领域
本发明属于深度学习领域,本发明具体涉及一种适用于轮毂自动化识别的深度残差模型构建方法。
背景技术
在工业4.0框架下,智慧工厂的感知和控制技术具备高速、高精度、模块化、智能化、无损感知等特点,能够根据不同的任务实现自主配置和自适应调节,满足定制和个性化产品的自适应制造,然而传统的感知控制技术无法满足上述需求。机器视觉技术涉及神经生物学、计算机学、图像处理学、模式识别和人工智能等多门学科,具有高效率、高精度、非接触和易集成等特点,是实现现代集成制造技术的基础。将机器视觉技术应用到轮毂生产之中,可以在很大程度上提高生产过程的机械化和智能化水平。应用机器视觉检测与控制技术代替人眼、人脑、人手来进行检测、测量、分析、判断和决策控制,以满足智慧工厂对环境感知和自主控制的多项需求。
传统的轮毂制造业想要搭建上述的智慧工厂,就必须完成轮毂的生产智能化。由于我国在轮毂智能工厂的建设中存在诸多问题。在传统生产流程中,汽车轮毂通常在低压铸造生产后进行型号的人工识别和统计。一方面由于这种人工识别方式工作量庞大且易造成误差,无法实现有利于系统管理的数据自动生成和报送。另一方面由于工厂生产轮毂类型数量众多,随着产线的加长,识别工人的需求量也在增大,增大了轮毂制造的生产成本,无论对人力还是物力都是一种极大的浪费。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供一种适用于轮毂自动化识别的深度残差模型构建方法。
为了实现上述目的,本发明提供以下技术方案:
一种适用于轮毂自动化识别的深度残差模型构建方法,包括以下步骤:
步骤1. 通过图像传感器采集多种类型的轮毂图像构建轮毂数据集;
步骤3. 进行残差块设计,每一个残差块都由一个系列层和捷径和一个捷径连接组成,这个捷径将输入特征图像和输出图像在对应位置上的元素执行加法运算,所以需要残差模块的输入图像、输出图像的宽高要求一致;具体设计流程如下:
(3.2)承接上面两层卷积层,后面接两层批量归一化层,批归一化算法可以分为两个过程:1)对数据进行批归一化,2)按对批归一化的数据进行缩放和平移;
(3.3)将上述输出结果与步骤2中的图像数据相加,完成残差块设计;
步骤4. 基于残差块构建深度学习模型,模型主要包含以下组件:
(4.2)采用批量归一化层进行连接,其原理同步骤3的(3.2);
(4.3)采用基于Relu函数的激活层,如公式(5)对上层输出进行非线性变换,
(4.4)构建核尺寸为3,步长为2的最大池化层与上层相连接,其原理如公式(6),
(4.5)构建2个残差块相连接,其中包含16个形如步骤3中(3.1)的卷积核;
(4.6)构建同本步骤(4.2)中的批量归一化层;
(4.7)采用失活层,依0.5的概率去除上一步骤(4.6)中的输出数据,进一步降低数据维度,降低过拟合风险;
(4.8)接入形如本步骤(4.5)中的2个残差块,与之不同的是该残差块中包含32个卷积核;
(4.9)采用同本步骤(4.7)中的失活层,依0.5的概率去除上一步骤(4.8)中的输出数据;
(4.10)接入形如本步骤(4.8)中的2个残差块,与之不同的是该残差块中包含64个卷积核;
(4.11)接入全局平均池化层,即对于每个特征图输出一个平均值;
(4.12)最后一层采用全连接层,对上述输出数据进行线性变换,从而转化输出轮毂的类别。
步骤5. 采用Xavier初始化上述模型所有权重,引入权重衰减系数为0.001,学习率为0.01;
步骤6. 首先采用基于自适应矩估计的批量随机梯度下降算法对模型参数优化100个时间步,保存一个训练集正确率和测试集正确率都表现较好的模型参数,注意要使测试集在模型中表现比训练集更优越;
步骤7. 使用步骤6中保存的参数初始化步骤4中的深度学习模型参数,保持所有超参数不变,改用批量梯度下降算法继续优化模型参数,此时模型能够获得最佳参数。
进一步地,步骤(3.1)具体为:构建连续的两层核尺寸为,填充为1的卷积核,
其中步长为2;对于输入高为宽为的图像的每个元素与高为宽为的卷积核的二
维卷积计算,按照公式计算相应的输出,其中对应位置的像素点输出值,对应卷积核的像素点位置。
进一步地,步骤(3.2)中,批归一化算法具体过程为:
本发明的有益效果是:
(1)采用本发明的方法构建的深度学习模型能够实现对多种轮毂类型的识别,没有过拟合现象,识别速度快,识别精度高,能够实现工业轮毂的实时识别。
(2)采用本发明的方法构建的模型能够自动识别多类型轮毂,有利于克服轮毂生产过程中人工识别与分拣的弊端,提高低压铸造铝合金轮毂生产过程的效率,节省人力和物力。
附图说明
图1是模型的残差块设计原理图。
图2是深度学习网络模型总图,图中Conv表示卷积层,Norm表示归一化层,Activation表示激活层,Max Pool表示最大池化层,Dropout表示失活层,Avg Pool表示平均池化层,FCN表示全连接层。
图3是本发明深度学习模型优化流程图。
具体实施方式
以下结合附图对本发明的技术方案做进一步详细说明,应当指出的是,具体实施方式只是对本发明的详细说明,不应视为对本发明的限定。
如图1-3所示,一种适用于轮毂自动化识别的深度残差模型构建方法,包括以下步骤:
步骤1. 通过图像传感器采集大小各异,形状纹理不同的轮毂图像构建轮毂数据集;
步骤3. 进行残差块设计,如图1所示,每一个残差块都由一个系列层和捷径和一个捷
径连接组成,这个捷径将输入特征图像和输出图像在对应位置上的元素执行加法运算,所
以需要残差模块的输入图像、输出图像的宽高要求一致;具体设计流程如图1所示,其中x为
该模块的输入特征图,经过权重层weight layer以及激活函数ReLU以后映射输出,最
终输出为;
(3.1)构建连续的两层核尺寸为,填充为1的卷积核,其中卷积核个数在本发明中
分别取16,16,32,32,64,步长均为2。对于输入高为宽为的图像的每个元素与高为
宽为的卷积核的二维卷积计算可以按照公式可以计
算相应的输出,其中为对应位置的像素点输出值,为对应卷积核的像素点位
置;
(3.2)承接上面两层卷积层,后面接两层批量归一化层,批归一化算法可以分为两个过程:
(3.3)将上述输出结果与步骤2中的图像数据相加,完成残差块设计。
步骤4. 基于残差块构建深度学习模型,模型主要包含以下组件,如图2所示:
(4.2)采用批量归一化层进行连接,其原理同步骤3的(3.2);
(4.3)采用基于Relu函数的激活层,如公式(5)对上层输出进行非线性变换,增强模型的学习容量,能够拟合复杂的数据集;
(4.4)构建核尺寸为3,步长为2的最大池化层与上层相连接,其原理如公式(6),该层主要用来对特征维度的约简,降低过拟合风险;
(4.5)构建2个残差块相连接,其中包含16个形如步骤3中(3.1)的卷积核;
(4.6)构建同本步骤(4.2)中的批量归一化层;
(4.7)采用失活层(Dropout),依0.5的概率去除上一步骤(4.6)中的输出数据,进一步降低数据维度,降低过拟合风险;
(4.8)接入形如本步骤(4.5)中的2个残差块,与之不同的是该残差块中包含32个卷积核;
(4.9)采用同本步骤(4.7)中的失活层,依0.5的概率去除上一步骤(4.8)中的输出数据;
(4.10)接入形如本步骤(4.8)中的2个残差块,与之不同的是该残差块中包含64个卷积核;
(4.11)接入全局平均池化层(Avg Pool),即对于每个特征图输出一个平均值;
(4.12)最后一层采用全连接层(FCN),对上述输出数据依据公式进行线
性变换,其中为步骤(4.11)的输出结果,为类别输出结果,和为学习参数。由于本实
施例中对19类轮毂进行分类,所以输出维度为19,如图2所示。
步骤5. 采用Xavier初始化上述模型所有权重,引入权重衰减系数为0.001,学习率为0.01;
步骤6. 首先采用基于自适应矩估计(Adam)的批量随机梯度下降算法对模型中的所有卷积核权重、全连接权重等学习参数优化100个时间步,保存一个训练集正确率和测试集正确率都表现较好的模型参数,注意要使测试集在模型中表现比训练集更优越;
步骤7. 使用步骤6中保存的参数初始化步骤4中的深度学习模型中的所有权重系数,保持原有的权重衰减系数以及学习率,改用批量梯度下降算法继续优化模型参数,此时该模型在训练集和测试集上分别有99.95%和99.96%的图像识别率,单张识别不超过20毫秒,且不存在过拟合现象。采用本发明方法构建的模型对轮毂类型识别效果较好,识别速度快,识别精度高,能够实现工业轮毂的实时识别。
Claims (3)
1.一种适用于轮毂自动化识别的深度残差模型构建方法,其特征是,包括以下步骤:
步骤1. 通过图像传感器采集多种类型的轮毂图像构建轮毂数据集;
步骤3. 进行残差块设计,每一个残差块都由一个系列层和捷径和一个捷径连接组成,这个捷径将输入特征图像和输出图像在对应位置上的元素执行加法运算,所以需要残差模块的输入图像、输出图像的宽高要求一致;具体设计流程如下:
(3.2)承接上面两层卷积层,后面接两层批量归一化层,批归一化算法可以分为两个过程:1)对数据进行批归一化,2)按对批归一化的数据进行缩放和平移;
(3.3)将上述输出结果与步骤2中的图像数据相加,完成残差块设计;
步骤4. 基于残差块构建深度学习模型,模型主要包含以下组件:
(4.2)采用批量归一化层进行连接,其原理同步骤3的(3.2);
(4.3)采用基于Relu函数的激活层,如公式(5)对上层输出进行非线性变换,
(4.4)构建核尺寸为3,步长为2的最大池化层与上层相连接,其原理如公式(6),
(4.5)构建2个残差块相连接,其中包含16个形如步骤3中(3.1)的卷积核;
(4.6)构建同本步骤(4.2)中的批量归一化层;
(4.7)采用失活层,依0.5的概率去除上一步骤(4.6)中的输出数据,进一步降低数据维度,降低过拟合风险;
(4.8)接入形如本步骤(4.5)中的2个残差块,与之不同的是该残差块中包含32个卷积核;
(4.9)采用同本步骤(4.7)中的失活层,依0.5的概率去除上一步骤(4.8)中的输出数据;
(4.10)接入形如本步骤(4.8)中的2个残差块,与之不同的是该残差块中包含64个卷积核;
(4.11)接入全局平均池化层,即对于每个特征图输出一个平均值;
(4.12)最后一层采用全连接层,对上述输出数据进行线性变换,从而转化输出轮毂的类别;
步骤5. 采用Xavier初始化上述模型所有权重,引入权重衰减系数为0.001,学习率为0.01;
步骤6. 首先采用基于自适应矩估计的批量随机梯度下降算法对模型参数优化100个时间步,保存一个训练集正确率和测试集正确率都表现较好的模型参数,注意要使测试集在模型中表现比训练集更优越;
步骤7. 使用步骤6中保存的参数初始化步骤4中的深度学习模型参数,保持所有超参数不变,改用批量梯度下降算法继续优化模型参数,此时模型能够获得最佳参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010596458.3A CN111488952A (zh) | 2020-06-28 | 2020-06-28 | 一种适用于轮毂自动化识别的深度残差模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010596458.3A CN111488952A (zh) | 2020-06-28 | 2020-06-28 | 一种适用于轮毂自动化识别的深度残差模型构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111488952A true CN111488952A (zh) | 2020-08-04 |
Family
ID=71810598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010596458.3A Pending CN111488952A (zh) | 2020-06-28 | 2020-06-28 | 一种适用于轮毂自动化识别的深度残差模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111488952A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215868A (zh) * | 2020-09-10 | 2021-01-12 | 湖北医药学院 | 基于生成对抗网络的去除手势图像背景的方法 |
CN112380872A (zh) * | 2020-11-27 | 2021-02-19 | 深圳市慧择时代科技有限公司 | 一种目标实体的情感倾向确定方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109712119A (zh) * | 2018-12-13 | 2019-05-03 | 深圳先进技术研究院 | 一种磁共振成像及斑块识别方法和装置 |
CN110991402A (zh) * | 2019-12-19 | 2020-04-10 | 湘潭大学 | 一种基于深度学习的皮肤病分类装置及分类方法 |
CN111192200A (zh) * | 2020-01-02 | 2020-05-22 | 南京邮电大学 | 基于融合注意力机制残差网络的图像超分辨率重建方法 |
-
2020
- 2020-06-28 CN CN202010596458.3A patent/CN111488952A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109712119A (zh) * | 2018-12-13 | 2019-05-03 | 深圳先进技术研究院 | 一种磁共振成像及斑块识别方法和装置 |
CN110991402A (zh) * | 2019-12-19 | 2020-04-10 | 湘潭大学 | 一种基于深度学习的皮肤病分类装置及分类方法 |
CN111192200A (zh) * | 2020-01-02 | 2020-05-22 | 南京邮电大学 | 基于融合注意力机制残差网络的图像超分辨率重建方法 |
Non-Patent Citations (2)
Title |
---|
ZHEMING TONG 等: "A convolutional neural network approach for visual recognition in wheel production lines", 《INTERNATIONAL JOURNAL OF ADVANCED ROBOTIC SYSTEMS》 * |
李丹: "基于迁移学习和改进残差神经网络的黄瓜叶部病害识别方法", 《农业工程》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215868A (zh) * | 2020-09-10 | 2021-01-12 | 湖北医药学院 | 基于生成对抗网络的去除手势图像背景的方法 |
CN112215868B (zh) * | 2020-09-10 | 2023-12-26 | 湖北医药学院 | 基于生成对抗网络的去除手势图像背景的方法 |
CN112380872A (zh) * | 2020-11-27 | 2021-02-19 | 深圳市慧择时代科技有限公司 | 一种目标实体的情感倾向确定方法及装置 |
CN112380872B (zh) * | 2020-11-27 | 2023-11-24 | 深圳市慧择时代科技有限公司 | 一种目标实体的情感倾向确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107492098B (zh) | 一种基于pca和cnn的高温锻件表面缺陷在位检测方法 | |
CN106228185A (zh) | 一种基于神经网络的通用图像分类识别系统及方法 | |
CN111488952A (zh) | 一种适用于轮毂自动化识别的深度残差模型构建方法 | |
WO2021051987A1 (zh) | 神经网络模型训练的方法和装置 | |
CN105469376A (zh) | 确定图片相似度的方法和装置 | |
CN112990315B (zh) | 基于偏微分算子的等变3d卷积网络的3d形状图像分类方法 | |
CN111143567B (zh) | 一种基于改进神经网络的评论情感分析方法 | |
CN111008504A (zh) | 一种基于气象模式识别的风电功率预测误差建模方法 | |
CN113203566A (zh) | 一种基于一维数据增强和cnn的电机轴承故障诊断方法 | |
CN112947300A (zh) | 一种加工质量虚拟量测方法、系统、介质及设备 | |
CN111784777A (zh) | 基于卷积神经网络的smt物料数量统计方法及统计系统 | |
CN111028238A (zh) | 一种基于机器人视觉的复杂异形曲面三维分割方法及系统 | |
CN115204035A (zh) | 基于多尺度时序数据融合模型的发电机组运行参数预测方法、装置及存储介质 | |
CN116071560A (zh) | 一种基于卷积神经网络的水果识别方法 | |
CN112115983A (zh) | 一种基于深度学习的农作物果实分拣算法 | |
CN114880538A (zh) | 基于自监督的属性图社团检测方法 | |
CN117408913B (zh) | 待测物体点云去噪方法、系统及装置 | |
CN101285816A (zh) | 铜锍吹炼的过程参数软测量仪表及其软测量方法 | |
CN115330759B (zh) | 一种基于豪斯多夫距离计算距离损失的方法及装置 | |
CN107944553A (zh) | 一种cnn模型的微调方法及装置 | |
Zhao | The water potability prediction based on active support vector machine and artificial neural network | |
CN114880754B (zh) | 基于bim的建筑能耗管理方法及系统 | |
CN114115150B (zh) | 基于数据的热泵系统在线建模方法及装置 | |
WO2023122854A1 (zh) | 数据处理的方法和装置 | |
CN115206455A (zh) | 基于深度神经网络的稀土元素组分含量预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200804 |