CN109635795B

CN109635795B - 一种基于vgg16网络模型提高瓶罐识别率的智能补光方法

Info

Publication number: CN109635795B
Application number: CN201811230337.6A
Authority: CN
Inventors: 唐军; 张�林; 宋怡彪; 温彪
Original assignee: Xiaohuanggou Environmental Protection Technology Co ltd
Current assignee: Xiaohuanggou Environmental Protection Technology Co ltd
Priority date: 2018-10-22
Filing date: 2018-10-22
Publication date: 2023-05-16
Anticipated expiration: 2038-10-22
Also published as: CN109635795A

Abstract

一种基于VGG16网络模型提高瓶罐识别率的智能补光方法，包括有中心系统，所述中心系统通讯连接有补光装置和摄像头，包括以下步骤：S1、所述中心系统将回收仓内的亮度分为A、B、C、D四个区间并分别在各区间内获取X张照片；S2、将每一区间的照片随机分成两两对应的训练集与测试集；S3、所述中心系统对VGG16网络原始模型进行修改；S4、所述中心系统使用修改后的VGG16网络原始模型通过训练集训练出若干用于识别照片类别的训练模型；S5、所述中心系统通过所述测试集选出最终训练模型；S6、中心系统根据所述最终训练模型自动补光。本发明的中心系统通过最终训练模型更加准确地识别此刻回收仓内的实际亮度，从而准确控制补光装置进行智能补光。

Description

一种基于VGG16网络模型提高瓶罐识别率的智能补光方法

技术领域

本发明涉及一种瓶罐识别方法，特别是涉及一种基于VGG16网络模型提高瓶罐识别率的智能补光方法。

背景技术

随着我国城市现代化程度不断提高,城市人口的增加以及居民生活水平的提高,生活垃圾的产生量也急剧增大；部分生活垃圾如果处理不当必然会污染环境并影响人们的健康,同时还会造成部分可回收垃圾未被回收利用的资源浪费；因此生活垃圾的回收利用对发展循环经济和建立资源节约型、环境友好型社会具有重大意义，同时还可促进我国经济的可持续发展。

在现有的智能垃圾分类回收设备中，中心系统通过图像识别软件对饮料瓶和易拉罐进行识别即瓶罐识别；当智能垃圾分类回收设备打开其回收仓的仓门时正好有太阳光垂直照射，太阳光通过仓口照射到回收仓内，导致摄像头拍摄的照片中瓶子轮廓出现过曝光的情况，进一步的，导致智能垃圾分类回收设备无法进行准确的瓶罐识别；所以设备商在仓口处设置遮挡件，使得在阳光照射下回收仓内部的亮度极低，相应地，设备商还在回收仓内设置补光装置进行补光；然而随着频繁的使用补光装置会出现灯光衰弱的情况，导致预先设定的补光装置光照强度参数与实际的补光装置光照强度之间存在误差；进一步地，在摄像头拍摄的瓶罐投递照片中，瓶子轮廓因为补光有误而分不清前景和背景；最终，导致智能垃圾分类设备的瓶罐识别结果有误差。

因此，现有技术有待于改善和提高。

发明内容

针对现有技术的不足之处，本发明提供一种基于VGG16网络模型提高瓶罐识别率的智能补光方法，用以解决现有技术中智能垃圾分类回收设备无法准确补光而降低其瓶罐识别准确率的不足之处。

本发明提供了如下的技术方案：

一种基于VGG16网络模型提高瓶罐识别率的智能补光方法，包括有中心系统，所述中心系统通讯连接有补光装置和摄像头，包括以下步骤：

S1、将所述补光装置的亮度分为A、B、C、D四个区间；在封闭无外部光源的情况下所述中心系统将所述补光装置的亮度依次调节至A、B、C、D四个区间并通过所述摄像头在各区间内各获取X张照片，并将所有照片通过均值滤波算法消除图像噪声；

S2、所述中心系统对步骤S1得到的每一区间的X张照片采用python3.5编程语言随机生成两两对应的训练集与测试集；

S3、所述中心系统从官网下载VGG16网络原始模型，对所述VGG16网络原始模型的每一卷积层加入BatchNormalization算法，并将VGG16原始网络模型的最后一层池化层修改为多尺度特征提取的ROI pooling层；

S4、所述中心系统使用修改后的VGG16网络原始模型对所有所述训练集进行训练并得出若干用于识别照片类别的训练模型；

S5、所述中心系统依次使用每一所述训练模型对所有所述测试集进行区间分类测试，并选取分类准确率最高的训练模型为最终训练模型；

S6、中心系统根据所述最终训练模型自动调节所述补光装置的亮度，对用户投入瓶罐类的回收物进行补光。

优选的，所述补光装置包括有单片机以及所述单片机控制的补光灯。

本发明相较于现有技术，具有如下的有益效果：

中心系统通过对官网下载的VGG16原始模型进行修改，一方面使得修改后的VGG16网络原始模型可以输入任意尺寸的图片，增加了其适用的范围，另一方面修改后的VGG16网络原始模型对不同尺寸图片进行不同感受野大小的特征提取，提高对输入图片的特征提取的精度，并以此训练出最终训练模型；进一步地，中心系统控制摄像头拍摄照片并通过最终训练模型更加准确地识别此刻回收仓内的实际亮度，从而准确控制所述补光灯进行补光。

附图说明

图1是本发明所述均值滤波算法的核心代码；

图2是本发明将X张照片随机生成训练集与测试集的核心代码；

图3是本发明所述VGG16网络原始模型的局部结构示意图；

图4是本发明对训练集进行训练的部分过程图。

具体实施方式

下面结合附图对本发明的技术方案作进一步的详细说明。

实施例

一种基于VGG16网络模型提高瓶罐识别率的智能补光方法，包括有中心系统，所述中心系统通讯连接有补光装置和摄像头，其特征在于，包括以下步骤：

S1、将所述补光装置的亮度分为A、B、C、D四个区间；在封闭无外部光源的情况下所述中心系统将所述补光装置的亮度依次调节至A、B、C、D四个区间并通过所述摄像头在各区间内各获取X张照片，再将所有照片通过均值滤波算法消除图像噪声；

具体地说，所述补光装置的亮度由暗到亮平均分为250个档位，即不亮时为O档，最亮时为250档；O档至59档为A区间，6O档至119档为B区间,120档至179档为C区间,180档至250档为D区间；所述中心系统控制所述摄像头在A、B、C、D四个亮度区间的亮度下各以均匀取样的方法拍摄1000张照片；所述均值滤波算法的核心代码如图1所示。

S2、所述中心系统对步骤S2得到的每一区间的1000张照片采用python3.5编程语言随机生成两两对应的训练集与测试集，所述训练集与所述测试集各自包含的照片数量比例为9:1；实现此功能的核心代码如图2所示。

S3、所述中心系统从官网下载VGG16网络原始模型；对所述VGG16网络原始模型的每一卷积层加入BatchNormalization算法，使得每一卷积层输出结果的均值为0，方差为1；具体的，所述Batch Normalization算法的公式包括有：

其中，m为当前层输入的样本数，x_i当前层第i个特征，μ_β为当前层特征的均值，

当前层特征的方差，

为归一化后的数值，γ、β为引入的学习参数，y_i为当前层输出的特征。

将VGG16原始网络模型的最后一层池化层修改为使用多尺度特征提取的ROIpooling层；所述中心系统从官网下载的VGG16网络原始模型的结构如图3所示，其当前层输出的特征图的感受野为：

jo_ut＝j_in*s

r_out＝r_in+(f-1)*j_in

其中，n_in为当前层输入的特征图大小，n_out为当前层输出的特征图大小；p、f、s分别为当前层padding的大小、卷积核的大小和stride的大小；j_out、j_in分别为当前层与上一层、当前层与下一层的距离；r_in、r_out分别为当前层输入和输出的特征图的感受野大小；start_out、start_in为计算当前层输出和输入的特征图的感受野的中心位置。

为了提高VGG16原始网络模型的分类能力和训练速度，对最后一层的池化层即17层max_pooling层进行修改，使用多尺度的特征提取的方法；进一步地说，所述中心系统对VGG16网络原始模型的第17层max_pooling层使用ROIpooling算法进行修改得到ROIpooling层；具体运行时，修改后的VGG16网络原始模型对可以ROI pooling层输入的不同尺寸特征图；ROIpooling层的在进行公式

的计算步骤时采用不同的p、f、s值，使得结果n_out相同，从而将输入的不同尺寸特征图输出为同一尺寸的特征图；一方面使得修改后的VGG16网络原始模型可以输入任意尺寸的图片，增加了其适用的范围，另一方面修改后的VGG16网络原始模型对不同尺寸的图片进行不同感受野大小的特征提取，从而提高对输入图片的特征提取的精度。

S4、所述中心系统使用修改后的VGG16网络原始模型对所有所述训练集进行训练并得出若干用于识别照片类别的训练模型，即用于识别照片的实际亮度是属于A区间、B区间、C区间或D区间；具体的，首先，训练参数设置为batch_size＝128,learning_rate＝0.001，num_batches＝100；然后，训练出5个训练模型；其部分训练的过程如图4所示。

S5、所述中心系统依次使用每一所述训练模型对所有所述测试集进行区间分类测试，并选取分类准确率最高的训练模型为最终训练模型。

S6、中心系统根据所述最终训练模型自动调节所述补光装置的亮度，对用户投入瓶罐类的回收物进行补光；具体地说，中心系统先控制摄像头拍摄一张当前瓶罐类投递物的照片，再通过所述最终训练模型识别当前摄像头拍摄的照片的亮度属于A区间、B区间、C区间或D区间，然后控制调节所述补光装置的亮度进行准确的补光。

优选的，所述补光装置包括有单片机以及所述单片机控制的补光灯，所述中心系统与所述单片机通讯从而调节所述补光灯的亮度。

综上，中心系统通过对官网下载的VGG16原始模型进行修改，一方面使得修改后的VGG16网络原始模型可以输入任意尺寸的图片，增加了其适用的范围，另一方面修改后的VGG16网络原始模型对不同尺寸图片进行不同感受野大小的特征提取，提高对输入图片的特征提取的精度，并以此训练出的最终训练模型；进一步地，中心系统控制摄像头拍摄照片并通过最终训练模型更加准确地识别此刻回收仓内的实际亮度档位，从而准确控制所述补光灯进行补光。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于VGG16网络模型提高瓶罐识别率的智能补光方法，包括有中心系统，所述中心系统通讯连接有补光装置和摄像头，其特征在于，包括以下步骤：

S2、所述中心系统对步骤S2得到的每一区间的1000张照片采用python3.5编程语言随机生成两两对应的训练集与测试集，所述训练集与所述测试集各自包含的照片数量比例为9:1；

S3、所述中心系统从官网下载VGG16网络原始模型；对所述VGG16网络原始模型的每一卷积层加入Batch Normalization算法，使得每一卷积层输出结果的均值为0，方差为1；具体的，所述Batch Normalization算法的公式包括有：

当前层特征的方差，

为归一化后的数值，γ、β为引入的学习参数，y_i为当前层输出的特征；

将VGG16原始网络模型的最后一层池化层修改为使用多尺度特征提取的ROI pooling层；所述中心系统从官网下载的VGG16网络原始模型的结构，其当前层输出的特征图的感受野为：

jo_ut＝j_in*s

r_out＝r_in+(f-1)*j_in

其中，n_in为当前层输入的特征图大小，n_out为当前层输出的特征图大小；p、f、s分别为当前层padding的大小、卷积核的大小和stride的大小；j_out、j_in分别为当前层与上一层、当前层与下一层的距离；r_in、r_out分别为当前层输入和输出的特征图的感受野大小；start_out、start_in为计算当前层输出和输入的特征图的感受野的中心位置；

为了提高VGG16原始网络模型的分类能力和训练速度，对最后一层的池化层即17层max_pooling层进行修改，使用多尺度的特征提取的方法；所述中心系统对VGG16网络原始模型的第17层max_pooling层使用ROIpooling算法进行修改得到ROIpooling层；具体运行时，修改后的VGG16网络原始模型对可以ROIpooling层输入的不同尺寸特征图；ROIpooling层的在进行公式

的计算步骤时采用不同的p、f、s值，使得结果n_out相同，从而将输入的不同尺寸特征图输出为同一尺寸的特征图；

2.根据权利要求1所述的基于VGG16网络模型提高瓶罐识别率的智能补光方法，其特征在于：所述补光装置包括有单片机以及所述单片机控制的补光灯。