CN110428014A

CN110428014A - 一种面向教育实训的物体识别系统和方法

Info

Publication number: CN110428014A
Application number: CN201910726506.3A
Authority: CN
Inventors: 崔晓辉; 闵文强; 胡少林
Original assignee: Beijing Sai Yu Da Ke Education Co Ltd
Current assignee: Beijing Sai Yu Da Ke Education Co Ltd
Priority date: 2019-08-07
Filing date: 2019-08-07
Publication date: 2019-11-08

Abstract

本发明提供了一种面向教育实训的物体识别系统和方法，其可有效帮助学生了解物体识别的原理与实现方式，并提高学生的实践经验；其包括工作台，所述工作台上装有通过网线连接的工控机和视觉装置，所述工控机内嵌于所述工作台上，所述视觉装置包括装于所述工作台上的相机架，所述相机架顶端装有相机，所述相机上装有镜头，所述镜头下方装有光源，位于所述光源正下方的所述工作台上设有产品放置区。

Description

一种面向教育实训的物体识别系统和方法

技术领域

本发明涉及物体识别技术领域，具体为一种面向教育实训的物体识别系统和方法。

背景技术

图像识别是利用视觉对图像进行处理、分析和理解，以识别各种不同模式的目标和对象，随着卷积神经网络的迅速发展，基于深度学习的物体识别方法在各个领域得到了广泛的应用，但物体识别方法往往十分抽象，且过程难以理解和掌握，学生只能学习到如何去利用已有的方法，但无法自己建立物体识别系统，这直接导致学生缺乏创新能力，因此亟需一套合适的物体识别教学平台与方法，帮助学生掌握物体识别技术。

发明内容

针对上述问题，本发明提供了一种面向教育实训的物体识别系统和方法，其可有效帮助学生了解物体识别的原理与实现方式，并提高学生的实践经验。

其技术方案是这样的：一种面向教育实训的物体识别系统，其包括工作台，其特征在于：所述工作台上装有通过网线连接的工控机和视觉装置，所述工控机内嵌于所述工作台上，所述视觉装置包括装于所述工作台上的相机架，所述相机架顶端装有相机，所述相机上装有镜头，所述镜头下方装有光源，位于所述光源正下方的所述工作台上设有产品放置区。

一种面向教育实训的物体识别方法，其特征在于：其包括以下步骤：

S1、采集目标对象的原始图像，作为样本图片，随后通过图像标注软件对原始图像中的所述目标对象的位置进行标注，将所述目标对象的边缘进行点划线连接起来，作为样本标签，从而得到样本图片与样本标签；

S2、对所述样本图片与样本标签进行缩放、旋转几何变换，使得所述样本图片与样本标签的图像大小满足神经网络输入格式要求；

S3、在python软件上构建CNN神经网络模型，所述CNN神经网络采用经典网络AlexNet；

S4、训练所述CNN神经网络，以实现对输入的图片的准确特征学习及分类，随后将训练后的神经网络参数进行保存，以便测试时使用；

S5、打开相机，在所述相机正下方的产品放置区放入所述目标对象，所述相机将拍摄到的物体图像传入工控机的所述CNN神经网络中，通过所述CNN神经网络输出物体图像中物体的类别。

其进一步特征在于：

在所述步骤S5中，当物体图像传入工控机的神经网络中后，所述神经网络会对物体图像进行预测属于每个类别的概率，最终输出最大概率对应的类别；

所述经典网络AlexNet依次组成为1个输入层、5个卷积层、2个全连接层以及1个输出层；

在所述步骤S4中，所述CNN神经网络的训练过程分为两个阶段：第一个阶段是将所述目标对象的图像数据由所述经典网络AlexNet网络结构从左向右传播，即前向传播阶段，当前向传播得出的结果与图片真实类别不相符时，执行第二个阶段，将误差从右往左进行传播训练的阶段，即反向传播阶段，反向传播的过程会对所述CNN神经网络参数进行修改，直至前向传播的结果与图片真实类别一致，即训练完成。

本发明的有益效果是，通过建立CNN神经网络、训练CNN神经网络，最终通过CNN神经网络输出目标物体图像的物体类别，实现了快速准确地对物体进行识别，并可根据不同场景、不同目标分别训练CNN神经网络，具有较强的灵活性；以及可方便让学生直接参与到目标识别的整个实现过程中，增强了学生的实践水平、技术能力，让学生能够更加深入的理解并掌握目标识别的原理，有助于提升学生的创新能力。

附图说明

图1是本发明的局部结构示意图；

图2是本发明中的AlexNet网络结构图。

具体实施方式

如图1、图2所示，本发明一种面向教育实训的物体识别系统，其包括工作台1，工作台1上装有通过网线连接的工控机7和视觉装置，工控机7内嵌于工作台1上，视觉装置包括装于工作台1上的相机架6，相机架6顶端装有相机3，相机3上装有镜头4，镜头4下方装有光源5，位于光源5正下方的工作台1上设有产品放置区2。

一种面向教育实训的物体识别方法，本实施例中采用了两种不同的类别的目标对象，其包括以下步骤：

S1、采集每个目标对象在不同背景下的原始图像，作为样本图片，随后通过现有的图像标注软件分别对原始图像中的目标对象的位置进行标注，将目标对象的边缘通过点划线连接起来，作为样本标签，从而得到样本图片与样本标签；其中，样本标签制作可让学生动手实践；

S2、对样本图片与样本标签进行图片预处理，生成指定大小的图片，也就是对样本图片与样本标签进行缩放、旋转几何变换，使得样本图片与样本标签的图像大小一一对应，且样本图片与样本标签的图像大小满足CNN神经网络输入格式要求，具体地，CNN神经网络输入格式要求为224×224×3的图片格式；

S3、在python软件上构建CNN神经网络模型，CNN神经网络的深度可由学生自行设置，可在最后对比不同神经网络模型的识别效果，其中，CNN神经网络采用经典网络AlexNet，而经典网络AlexNet的输出层可根据实际情况作相应修改，本实施例中采用了两种不同的类别的目标对象，故输出层数修改为两层，如图2所示，图2中是单个类别的目标对象的网络结构图，修改后的经典网络AlexNet从左往右依次组成为1个输入层8、5个卷积层9、2个全连接层10以及1个最终两种不同的类别的输出层11，其中，卷积层9的目的是为了识别特征，每深入一层，网络可学习到输入层8图像更本质的特征，充分提取图像所包含的各种信息，全连接层10是根据卷积层的输出(也就是之前提取到的特征)来决定这张图片有可能属于哪个类别，最后由最终的输出层11输出该图片概率最大的类别；

S4、训练CNN神经网络，CNN神经网络的训练过程分为两个阶段：第一个阶段是将目标对象的图像数据由修改后的经典网络AlexNet网络结构从左向右传播，即前向传播阶段，由于我们事先知道输入图片的类别，当前向传播得出的结果与图片真实类别不相符时，执行第二个阶段，将误差从右往左进行传播训练的阶段，即反向传播阶段，反向传播的过程会对CNN神经网络参数进行修改，直至前向传播的结果与图片真实类别一致，即训练完成；随后将训练后的CNN神经网络参数进行保存，以便测试时使用；因为训练过程中，CNN神经网络的参数不断进行改进，实现对输入图片的准确特征学习及分类，所以当CNN神经网络训练好后，再次输入未知图像，CNN神经网络就能够实现分类。该步骤可让学生依次训练不同时间，最后可对比不同训练时间下的识别效果；一般默认CNN神经网络训练次数为500次，学习率设为0.001，批处理量为30，训练完成后，将训练后的数据保存到工控机中；

S5、训练好CNN神经网络后，打开相机3，在相机3正下方的产品放置区2放入需要识别的目标对象，相机3将拍摄到的物体图像传入工控机7的CNN神经网络中，通过CNN神经网络输出物体图像中物体的类别；

在步骤S5中，当物体图像传入工控机7的CNN神经网络中后，CNN神经网络会对物体图像进行预测属于每个类别的概率，最终输出最大概率对应的类别。

在本发明中，通过建立CNN神经网络、训练CNN神经网络，最终通过CNN神经网络输出目标物体图像的物体类别，实现了快速准确地对物体进行识别，并可根据不同场景、不同目标分别训练CNN神经网络，具有较强的灵活性；以及可方便让学生直接参与到目标识别的整个实现过程中，增强了学生的实践水平、技术能力，让学生能够更加深入的理解并掌握目标识别的原理，有助于提升学生的创新能力，并通过实训对学生思维可产生一定的启发作用。

Claims

1.一种面向教育实训的物体识别系统，其包括工作台，其特征在于：所述工作台上装有通过网线连接的工控机和视觉装置，所述工控机内嵌于所述工作台上，所述视觉装置包括装于所述工作台上的相机架，所述相机架顶端装有相机，所述相机上装有镜头，所述镜头下方装有光源，位于所述光源正下方的所述工作台上设有产品放置区。

2.一种面向教育实训的物体识别方法，其特征在于：其包括以下步骤：

3.根据权利要求2所述的一种面向教育实训的物体识别方法，其特征在于：在所述步骤S5中，当物体图像传入工控机的神经网络中后，所述神经网络会对物体图像进行预测属于每个类别的概率，最终输出最大概率对应的类别。

4.根据权利要求2所述的一种面向教育实训的物体识别方法，其特征在于：所述经典网络AlexNet依次组成为1个输入层、5个卷积层、2个全连接层以及1个输出层。

5.根据权利要求2所述的一种面向教育实训的物体识别方法，其特征在于：在所述步骤S4中，所述CNN神经网络的训练过程分为两个阶段：第一个阶段是将所述目标对象的图像数据由所述经典网络AlexNet网络结构从左向右传播，即前向传播阶段，当前向传播得出的结果与图片真实类别不相符时，执行第二个阶段，将误差从右往左进行传播训练的阶段，即反向传播阶段，反向传播的过程会对所述CNN神经网络参数进行修改，直至前向传播的结果与图片真实类别一致，即训练完成。