CN110428014A - 一种面向教育实训的物体识别系统和方法 - Google Patents
一种面向教育实训的物体识别系统和方法 Download PDFInfo
- Publication number
- CN110428014A CN110428014A CN201910726506.3A CN201910726506A CN110428014A CN 110428014 A CN110428014 A CN 110428014A CN 201910726506 A CN201910726506 A CN 201910726506A CN 110428014 A CN110428014 A CN 110428014A
- Authority
- CN
- China
- Prior art keywords
- neural network
- camera
- workbench
- training
- oriented towards
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013528 artificial neural network Methods 0.000 claims description 41
- 238000013527 convolutional neural network Methods 0.000 claims description 41
- 230000000644 propagated effect Effects 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 230000000694 effects Effects 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种面向教育实训的物体识别系统和方法,其可有效帮助学生了解物体识别的原理与实现方式,并提高学生的实践经验;其包括工作台,所述工作台上装有通过网线连接的工控机和视觉装置,所述工控机内嵌于所述工作台上,所述视觉装置包括装于所述工作台上的相机架,所述相机架顶端装有相机,所述相机上装有镜头,所述镜头下方装有光源,位于所述光源正下方的所述工作台上设有产品放置区。
Description
技术领域
本发明涉及物体识别技术领域,具体为一种面向教育实训的物体识别系统和方法。
背景技术
图像识别是利用视觉对图像进行处理、分析和理解,以识别各种不同模式的目标和对象,随着卷积神经网络的迅速发展,基于深度学习的物体识别方法在各个领域得到了广泛的应用,但物体识别方法往往十分抽象,且过程难以理解和掌握,学生只能学习到如何去利用已有的方法,但无法自己建立物体识别系统,这直接导致学生缺乏创新能力,因此亟需一套合适的物体识别教学平台与方法,帮助学生掌握物体识别技术。
发明内容
针对上述问题,本发明提供了一种面向教育实训的物体识别系统和方法,其可有效帮助学生了解物体识别的原理与实现方式,并提高学生的实践经验。
其技术方案是这样的:一种面向教育实训的物体识别系统,其包括工作台,其特征在于:所述工作台上装有通过网线连接的工控机和视觉装置,所述工控机内嵌于所述工作台上,所述视觉装置包括装于所述工作台上的相机架,所述相机架顶端装有相机,所述相机上装有镜头,所述镜头下方装有光源,位于所述光源正下方的所述工作台上设有产品放置区。
一种面向教育实训的物体识别方法,其特征在于:其包括以下步骤:
S1、采集目标对象的原始图像,作为样本图片,随后通过图像标注软件对原始图像中的所述目标对象的位置进行标注,将所述目标对象的边缘进行点划线连接起来,作为样本标签,从而得到样本图片与样本标签;
S2、对所述样本图片与样本标签进行缩放、旋转几何变换,使得所述样本图片与样本标签的图像大小满足神经网络输入格式要求;
S3、在python软件上构建CNN神经网络模型,所述CNN神经网络采用经典网络AlexNet;
S4、训练所述CNN神经网络,以实现对输入的图片的准确特征学习及分类,随后将训练后的神经网络参数进行保存,以便测试时使用;
S5、打开相机,在所述相机正下方的产品放置区放入所述目标对象,所述相机将拍摄到的物体图像传入工控机的所述CNN神经网络中,通过所述CNN神经网络输出物体图像中物体的类别。
其进一步特征在于:
在所述步骤S5中,当物体图像传入工控机的神经网络中后,所述神经网络会对物体图像进行预测属于每个类别的概率,最终输出最大概率对应的类别;
所述经典网络AlexNet依次组成为1个输入层、5个卷积层、2个全连接层以及1个输出层;
在所述步骤S4中,所述CNN神经网络的训练过程分为两个阶段:第一个阶段是将所述目标对象的图像数据由所述经典网络AlexNet网络结构从左向右传播,即前向传播阶段,当前向传播得出的结果与图片真实类别不相符时,执行第二个阶段,将误差从右往左进行传播训练的阶段,即反向传播阶段,反向传播的过程会对所述CNN神经网络参数进行修改,直至前向传播的结果与图片真实类别一致,即训练完成。
本发明的有益效果是,通过建立CNN神经网络、训练CNN神经网络,最终通过CNN神经网络输出目标物体图像的物体类别,实现了快速准确地对物体进行识别,并可根据不同场景、不同目标分别训练CNN神经网络,具有较强的灵活性;以及可方便让学生直接参与到目标识别的整个实现过程中,增强了学生的实践水平、技术能力,让学生能够更加深入的理解并掌握目标识别的原理,有助于提升学生的创新能力。
附图说明
图1是本发明的局部结构示意图;
图2是本发明中的AlexNet网络结构图。
具体实施方式
如图1、图2所示,本发明一种面向教育实训的物体识别系统,其包括工作台1,工作台1上装有通过网线连接的工控机7和视觉装置,工控机7内嵌于工作台1上,视觉装置包括装于工作台1上的相机架6,相机架6顶端装有相机3,相机3上装有镜头4,镜头4下方装有光源5,位于光源5正下方的工作台1上设有产品放置区2。
一种面向教育实训的物体识别方法,本实施例中采用了两种不同的类别的目标对象,其包括以下步骤:
S1、采集每个目标对象在不同背景下的原始图像,作为样本图片,随后通过现有的图像标注软件分别对原始图像中的目标对象的位置进行标注,将目标对象的边缘通过点划线连接起来,作为样本标签,从而得到样本图片与样本标签;其中,样本标签制作可让学生动手实践;
S2、对样本图片与样本标签进行图片预处理,生成指定大小的图片,也就是对样本图片与样本标签进行缩放、旋转几何变换,使得样本图片与样本标签的图像大小一一对应,且样本图片与样本标签的图像大小满足CNN神经网络输入格式要求,具体地,CNN神经网络输入格式要求为224×224×3的图片格式;
S3、在python软件上构建CNN神经网络模型,CNN神经网络的深度可由学生自行设置,可在最后对比不同神经网络模型的识别效果,其中,CNN神经网络采用经典网络AlexNet,而经典网络AlexNet的输出层可根据实际情况作相应修改,本实施例中采用了两种不同的类别的目标对象,故输出层数修改为两层,如图2所示,图2中是单个类别的目标对象的网络结构图,修改后的经典网络AlexNet从左往右依次组成为1个输入层8、5个卷积层9、2个全连接层10以及1个最终两种不同的类别的输出层11,其中,卷积层9的目的是为了识别特征,每深入一层,网络可学习到输入层8图像更本质的特征,充分提取图像所包含的各种信息,全连接层10是根据卷积层的输出(也就是之前提取到的特征)来决定这张图片有可能属于哪个类别,最后由最终的输出层11输出该图片概率最大的类别;
S4、训练CNN神经网络,CNN神经网络的训练过程分为两个阶段:第一个阶段是将目标对象的图像数据由修改后的经典网络AlexNet网络结构从左向右传播,即前向传播阶段,由于我们事先知道输入图片的类别,当前向传播得出的结果与图片真实类别不相符时,执行第二个阶段,将误差从右往左进行传播训练的阶段,即反向传播阶段,反向传播的过程会对CNN神经网络参数进行修改,直至前向传播的结果与图片真实类别一致,即训练完成;随后将训练后的CNN神经网络参数进行保存,以便测试时使用;因为训练过程中,CNN神经网络的参数不断进行改进,实现对输入图片的准确特征学习及分类,所以当CNN神经网络训练好后,再次输入未知图像,CNN神经网络就能够实现分类。该步骤可让学生依次训练不同时间,最后可对比不同训练时间下的识别效果;一般默认CNN神经网络训练次数为500次,学习率设为0.001,批处理量为30,训练完成后,将训练后的数据保存到工控机中;
S5、训练好CNN神经网络后,打开相机3,在相机3正下方的产品放置区2放入需要识别的目标对象,相机3将拍摄到的物体图像传入工控机7的CNN神经网络中,通过CNN神经网络输出物体图像中物体的类别;
在步骤S5中,当物体图像传入工控机7的CNN神经网络中后,CNN神经网络会对物体图像进行预测属于每个类别的概率,最终输出最大概率对应的类别。
在本发明中,通过建立CNN神经网络、训练CNN神经网络,最终通过CNN神经网络输出目标物体图像的物体类别,实现了快速准确地对物体进行识别,并可根据不同场景、不同目标分别训练CNN神经网络,具有较强的灵活性;以及可方便让学生直接参与到目标识别的整个实现过程中,增强了学生的实践水平、技术能力,让学生能够更加深入的理解并掌握目标识别的原理,有助于提升学生的创新能力,并通过实训对学生思维可产生一定的启发作用。
Claims (5)
1.一种面向教育实训的物体识别系统,其包括工作台,其特征在于:所述工作台上装有通过网线连接的工控机和视觉装置,所述工控机内嵌于所述工作台上,所述视觉装置包括装于所述工作台上的相机架,所述相机架顶端装有相机,所述相机上装有镜头,所述镜头下方装有光源,位于所述光源正下方的所述工作台上设有产品放置区。
2.一种面向教育实训的物体识别方法,其特征在于:其包括以下步骤:
S1、采集目标对象的原始图像,作为样本图片,随后通过图像标注软件对原始图像中的所述目标对象的位置进行标注,将所述目标对象的边缘进行点划线连接起来,作为样本标签,从而得到样本图片与样本标签;
S2、对所述样本图片与样本标签进行缩放、旋转几何变换,使得所述样本图片与样本标签的图像大小满足神经网络输入格式要求;
S3、在python软件上构建CNN神经网络模型,所述CNN神经网络采用经典网络AlexNet;
S4、训练所述CNN神经网络,以实现对输入的图片的准确特征学习及分类,随后将训练后的神经网络参数进行保存,以便测试时使用;
S5、打开相机,在所述相机正下方的产品放置区放入所述目标对象,所述相机将拍摄到的物体图像传入工控机的所述CNN神经网络中,通过所述CNN神经网络输出物体图像中物体的类别。
3.根据权利要求2所述的一种面向教育实训的物体识别方法,其特征在于:在所述步骤S5中,当物体图像传入工控机的神经网络中后,所述神经网络会对物体图像进行预测属于每个类别的概率,最终输出最大概率对应的类别。
4.根据权利要求2所述的一种面向教育实训的物体识别方法,其特征在于:所述经典网络AlexNet依次组成为1个输入层、5个卷积层、2个全连接层以及1个输出层。
5.根据权利要求2所述的一种面向教育实训的物体识别方法,其特征在于:在所述步骤S4中,所述CNN神经网络的训练过程分为两个阶段:第一个阶段是将所述目标对象的图像数据由所述经典网络AlexNet网络结构从左向右传播,即前向传播阶段,当前向传播得出的结果与图片真实类别不相符时,执行第二个阶段,将误差从右往左进行传播训练的阶段,即反向传播阶段,反向传播的过程会对所述CNN神经网络参数进行修改,直至前向传播的结果与图片真实类别一致,即训练完成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910726506.3A CN110428014A (zh) | 2019-08-07 | 2019-08-07 | 一种面向教育实训的物体识别系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910726506.3A CN110428014A (zh) | 2019-08-07 | 2019-08-07 | 一种面向教育实训的物体识别系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110428014A true CN110428014A (zh) | 2019-11-08 |
Family
ID=68414684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910726506.3A Pending CN110428014A (zh) | 2019-08-07 | 2019-08-07 | 一种面向教育实训的物体识别系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110428014A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105679145A (zh) * | 2016-03-25 | 2016-06-15 | 佛山市新恒萃材料科技有限公司 | 一种机器视觉技术教育平台 |
CN108956645A (zh) * | 2018-07-18 | 2018-12-07 | 丹阳市精通眼镜技术创新服务中心有限公司 | 一种多视觉系统的光学镜片缺陷检测装置及方法 |
CN109127464A (zh) * | 2018-09-21 | 2019-01-04 | 河源职业技术学院 | 一种视觉自动检测分拣装置及其控制方法 |
CN109859158A (zh) * | 2018-11-27 | 2019-06-07 | 邦鼓思电子科技(上海)有限公司 | 一种基于视觉的工作区域边界的检测系统、方法及机器设备 |
-
2019
- 2019-08-07 CN CN201910726506.3A patent/CN110428014A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105679145A (zh) * | 2016-03-25 | 2016-06-15 | 佛山市新恒萃材料科技有限公司 | 一种机器视觉技术教育平台 |
CN108956645A (zh) * | 2018-07-18 | 2018-12-07 | 丹阳市精通眼镜技术创新服务中心有限公司 | 一种多视觉系统的光学镜片缺陷检测装置及方法 |
CN109127464A (zh) * | 2018-09-21 | 2019-01-04 | 河源职业技术学院 | 一种视觉自动检测分拣装置及其控制方法 |
CN109859158A (zh) * | 2018-11-27 | 2019-06-07 | 邦鼓思电子科技(上海)有限公司 | 一种基于视觉的工作区域边界的检测系统、方法及机器设备 |
Non-Patent Citations (1)
Title |
---|
郭小清等: "基于改进 Multi-Scale AlexNet 的番茄叶部病害图像识别", 《农业工程学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11010600B2 (en) | Face emotion recognition method based on dual-stream convolutional neural network | |
CN109816725B (zh) | 一种基于深度学习的单目相机物体位姿估计方法及装置 | |
CN105760835B (zh) | 一种基于深度学习的步态分割与步态识别一体化方法 | |
CN112085735A (zh) | 一种基于自适应锚框的铝材质图像缺陷检测方法 | |
CN110473173A (zh) | 一种基于深度学习语义分割的缺陷检测方法 | |
CN108596046A (zh) | 一种基于深度学习的细胞检测计数方法及系统 | |
CN111178120B (zh) | 一种基于作物识别级联技术的害虫图像检测方法 | |
CN105957086A (zh) | 一种基于优化神经网络模型的遥感图像变化检测方法 | |
CN105654066A (zh) | 一种车辆识别方法及装置 | |
CN107247952B (zh) | 基于深层监督的循环卷积神经网络的视觉显著性检测方法 | |
CN115699082A (zh) | 缺陷检测方法及装置、存储介质及电子设备 | |
CN112200057A (zh) | 人脸活体检测方法、装置、电子设备及存储介质 | |
WO2023273668A1 (zh) | 图像分类方法、装置、设备、存储介质及程序产品 | |
Xu et al. | Research on ResNet101 network chemical reagent label image classification based on transfer learning | |
CN111906782B (zh) | 一种基于三维视觉的智能机器人抓取方法 | |
CN108133235A (zh) | 一种基于神经网络多尺度特征图的行人检测方法 | |
CN110929795A (zh) | 高速焊线机焊点快速识别与定位方法 | |
CN113435355A (zh) | 多目标奶牛身份识别方法及系统 | |
Modasshir et al. | Mdnet: Multi-patch dense network for coral classification | |
CN114494773A (zh) | 一种基于深度学习的零件分拣识别系统和方法 | |
O’Brien et al. | Object detection using convolutional neural networks for smart manufacturing vision systems in the medical devices sector | |
CN116758621A (zh) | 基于自注意力机制的遮挡人脸面部表情深度卷积识别方法 | |
CN110428014A (zh) | 一种面向教育实训的物体识别系统和方法 | |
Ergene et al. | Imitation and learning of human hand gesture tasks of the 3D printed robotic hand by using artificial neural networks | |
CN113011486A (zh) | 鸡爪分类及定位模型的构建方法及系统、鸡爪分拣方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191108 |