CN112115974B

CN112115974B - 一种城市垃圾分类处理智能视觉检测方法

Info

Publication number: CN112115974B
Application number: CN202010831619.2A
Authority: CN
Inventors: 班瑞
Original assignee: Zhengzhou Ruiru Information Technology Co ltd
Current assignee: Zhengzhou Ruiru Information Technology Co ltd
Priority date: 2020-08-18
Filing date: 2020-08-18
Publication date: 2024-04-09
Anticipated expiration: 2040-08-18
Also published as: CN112115974A

Abstract

本发明提供了一种城市垃圾分类处理智能视觉检测方法，针对城市垃圾智能自动分类回收需求，采用新型卷积神经网络NCNN包括改进神经网络特征提取部分，使用新的复合卷积池化层取代传统的卷积神经网络卷积层；本发明将网络架构设计为12个层，包括6个卷积层，3个池化层和3个全连接层，模型泛化能力强，可迁移性强，革新了城市垃圾智能分类实现方法，能够自动完成垃圾分类任务，减轻人工操作，使垃圾分类做到减量化、资源化、无害化，确保垃圾分类效果。

Description

一种城市垃圾分类处理智能视觉检测方法

技术领域

本发明涉及垃圾分类视觉智能检测技术领域，尤其涉及一种城市垃圾分类处理智能视觉检测方法。

背景技术

目前的垃圾分类大多由人工判断分拣完成，自动化程度较低，这不仅占用大量的人力资源，还容易发生环境污染、毒害泄漏、人员受伤等危险情况，面对目前巨额的城市垃圾，如何实现快速、自动化分拣，是目前亟待解决的难题。

发明内容

为解决上述问题，提供了一种城市垃圾分类处理智能视觉检测方法。

一种城市垃圾分类处理智能视觉检测方法，其中包括如下步骤：

步骤1)、采集多种城市垃圾图像，制作垃圾图像数据集，将除厨余垃圾外的生活垃圾类别分为18个二级类别，包含：1：玻璃类、2：牛奶盒、3：金属类、4：塑料类、5：废纸类、6：织物类、7：废电池、8：废墨盒、9：废油漆桶、10：过期药品、11：废灯管、12：杀虫剂、13：污染塑料袋、14：烟头、15：污染纸张、16：破旧陶瓷品、17：灰土、18：一次性餐具；按照垃圾所属二级类别，对各图像的所属类别进行标注，保存每张图像属于类别1-18中的哪一类别，标注结果保存为.xml文件；然后进入步骤2)对全体样本集进行训练；

步骤2)、每次送单张训练集图像数据进入新型卷积神经网络，训练集图像数据为3通道彩色图，图片格式为.jpg，图像尺寸参数为512像素*512像素*3通道；将所述新型卷积神经网络共有12层，相邻层与层之间采用串联方式；

设置学习率为0.005，迭代次数为500次，使用垃圾图像数据集进行训练；

所述卷积层在处理过程中要用到的公式中的变量及其含义说明如下：

*：表示数乘，乘数均为实数；v：表示当前处理的卷积层在整个网络中所处的层级，v为正整数，v≥1，当v的值确定时，指定当前的层数，所有下标包含v的变量均以v的值代入来表示此变量的名称；Cv：表示网络第v层为卷积层；w_v：单位为像素，表示第v层输入图像的尺寸为w_v*w_v；这里我们设置输入图像宽高比均为1:1；d_v：正整数，表示第v层Cv输入图像的通道数，输入图像为彩色3通道，分别是R、G、B，分别代表图像某点像素中的红色、绿色、蓝色分量值，这里的R、G、B均为正整数；f_v：正整数，表示第v层Cv使用的卷积核的大小，即卷积核的长度和宽度，中的所有卷积核的长度等于其宽度；t_v：正整数，表示第v层Cv使用的卷积核的个数；k_vu：三维实矩阵，表示第v层Cv使用的第u个卷积核，即长度*宽度*图像通道数，1≤u≤t₁；K_vu(m_v，n_v)：表示卷积核k_vu内的值，可看作对图像进行卷积运算的计算权重，为d_v维实向量，m_v、n_v为正整数，表示第v层Cv使用的卷积核内的位置，m_v表示横坐标，n_v表示纵坐标，m_v、n_v的取值范围为：1≤m_v，n_v≤f_v；K_vu(m_v，n_v，c_v)：表示卷积核k_vu内各通道的值，m_v、n_v为正整数，表示第v层使用的卷积核内的位置，m_v是表示横坐标，n_v表示纵坐标，m_v、n_v的取值范围为1≤m_v，n_v≤f_v，c_v为正整数，表示卷积核内第c_v个通道，1≤c_v≤d_v；b_v：代表第v层使用的全部t_v个卷积核对应的t_v个偏置量；k_v：代表第v层使用的全部t_v个卷积核，没有数学意义，仅做符号表示；p_v：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d_v，这里说的“0像素”是指一个像素的所有通道上的值均为0的像素；s_v：正整数，第v层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔几个像素进行一次卷积运算，这个间隔数即操作步长，以像素为单位；layer_v(i_v，j_v)：表示第v层输入图像中的第i_v行，第j_v列的像素值，其由(R，G，B)三个数来表示，其中0≤R，G，B≤255，1≤i_v，j_v≤w_v；layer_v(i_v，j_v，c_v)：表示第v层输入图像中的第i_v行，第j_v列，第c_v通道的像素值，1≤i_v，j_v≤w_v，1≤c_v≤d_v；layer_vout(p_v，q_v，k_vu)：表示第v层输入图像经与卷积核k_vu做卷积运算后得到的特征图的第p_v行，第q_v列的像素值，每个值可以看做一个神经元，其中1≤p_v，q_v≤w_vout；w_vout：单位为像素，表示第v层输入图像layer_v与卷积核k_vu进行卷积运算后得到的特征图layer_vout的尺寸为w_vout*w_vout；

对第一层卷积网络做卷积运算，所需参数的值如下：v＝1，w₁＝512，d₁＝3，f₁＝5，t₁＝6，s₁＝1，p₁＝0，k_1u和b₁设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第一卷积层C1与卷积核k_1u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₁移动，将卷积核k_1u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_1out(p₁，q₁，k_1u)，公式表示如下：

其中layer₁(i₁+m₁，j₁+n₁，c₁)表示卷积运算进行到输入图像layer₁第c₁通道的i₁+m₁行、第j₁+n₁列，1≤i₁，j₁≤w₁–f₁+1，第一层图像layer₁做卷积运算后输出的特征图尺寸由第一层图像尺寸w₁、卷积核大小f₁及扫描步长s₁和填充p₁决定，计算公式为：代入上述数据计算可得，/>则第一层与卷积核k_1u做卷积操作后的输出特征图尺寸为508像素*508像素；分别利用t₉＝256个卷积核依次重复上述卷积过程，最终形成t₉＝256层二维特征图，神经元的个数为508*508*6个，这就是第一卷积层的全部输出结果，这里以下式代表：layer_1out(p₁,q₁,k₁)；

所述第一卷积层激活函数采用LeakyReLU，其数学表达式为：

其中，layer_1out(p₁，q₁，k₁)+b₁做为本层激活函数LeakyReLU的输入，layer₂(i₂，j₂，c₂)代表新型卷积神经网络第一卷积层激活后的输出，b₁代表偏置量，其中i₂、j₂、c₂均为正整数，且1≤i₂，j₂≤508，1≤c₂≤6，这里c取值为50；之后，进入步骤3)；

步骤3)、进入所述新型卷积神经网络的第二层池化层，本文中所有的池化层在计算过程中要用到的公式中的变量及其含义说明如下：

max：池化过程运算符号，表示取最大值；z：表示当前处理的池化层在整个网络中所处的层级，当z的值在一层被指定后，所有下标包含z的变量均以z的值代入来表示此变量的名称；w_z：单位为像素，表示第z层输入图像的尺寸为w_z*w_z；d_z：正整数，表示第z层输入图像的通道数，这里为第z层的输出结果的通道数，d_z＝t_z-1；f_z：正整数，表示第z层使用的池化过滤器的大小，即过滤器的长度和宽度，中所有池化层过滤器的长度等于其宽度；layer_z(i_z，j_z)：无单位，表示第z层输入图像中的第i_z行，第j_z列的像素值，其是一个d_z维向量，其中1≤i_z，j_z≤w_z；layer_z(i_z，j_z，c_z)：无单位，表示第z层输入图像中的第i_z行，第j_z列，第c_z通道的像素值，1≤i_z，j_z≤w_z，1≤c_z≤d_z；layer_zout(p_z，q_z，d_z)：无单位，表示第z层输出图像中的第p_z行，第q_z列，第d_z通道位置处的值，1≤p_z，q_z≤(w_z/f_z)；对第二层池化层做运算时，所需参数的值如下：z＝2，w₂＝508，d₂＝6，f₂＝2，池化层使用的池化操作为最大池化，即：把输图像的一个通道内的w₂*w₂个像素划分为(w₂/f₂)行，(w₂/f₂)列个f₂*f₂的小块，对每个小块中的数，取最大数做为输出结果，然后遍历完每行上的小块和每列上的小块，依小块原有的次序放在相应的位置，最终构成一个(w₂/f₂)*(w₂/f₂)的矩阵，对输入数据的d₂通道的第i₂行，j₂列位置的池化计算公式如下：

对一个通道做完池化操作后，形成输出特征图layer_2out的1层二维池化结果，再对另外d₂-1个通道，依次重复上述池化过程，最终形成d₂层二维池化结果，这就是第二池化层的全部输出结果，以下式代表：layer_2out(p₂,q₂,d₂)

式中，1≤p₂，q₂≤(w₂/f₂)＝254，d₂＝6；之后，进入步骤4)；

步骤4)、进入所述新型卷积神经网络第三层为卷积层C3,对第三层卷积网络做卷积运算时，所需参数的值如下：v＝3，w₃＝254，d₃＝6，f₃＝3，t₃＝16，s₃＝1，p₃＝0，k_3u和b₃设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第三层卷积层C3与卷积核k_3u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₃移动，将卷积核k_3u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_3out(p₃，q₃，k_3u)，公式表示如下：

其中layer₃(i₃+m₃，j₃+n₃，c₃)表示卷积运算进行到输入图像layer₃第c₃通道的i₃+m₃行，第j₃+n₃列，1≤i₃，j₃≤w₃–f₃+1，第三层图像layer₃做卷积运算后输出的特征图尺寸由第一层图像尺寸w₃、卷积核大小f₃及扫描步长s₃和填充p₃决定，计算公式为：代入上述数据计算可得，/>则第三层与卷积核k_3u做卷积操作后的输出特征图尺寸为252像素*252像素；分别利用t₃＝16个卷积核依次重复上述卷积过程，最终形成t₃＝16层二维特征图，利用一个卷积核k_3u完成卷积运算后，形成输出特征图layer_3out的一层二维结果，再用另外t₃-1个不同的卷积核，依次重复上述卷积过程，即共t₃＝16个卷积核，每个卷积核运算后均生成一层二维特征图结果，最终形成16层二维特征图，神经元的个数为252*252*16个，这就是第三层卷积层的全部输出结果，这里以下式代表：layer_3out(p₃,q₃,k₃)

第三层卷积层激活函数采用LeakyReLU，其数学表达式为：

其中，layer_3out(p₃，q₃，k₃)+b₃做为本层激活函数LeakyReLU的输入，layer₄(i₄，j₄，c₄)代表新型卷积神经网络第三层卷积层激活后的输出，b₃代表偏置量，其中i₄、j₄、c₄均为正整数，且1≤i₄，j₄≤508，1≤c₄≤6，这里c取值为50；之后，进入步骤5)；

步骤5)、进入所述新型卷积神经网络第四层为池化层，对第四层池化层做运算时，所需参数的值如下：z＝4，w₄＝252，d₄＝16，f₄＝2，池化层使用的池化操作为最大池化，即：把输入图像的一个通道内的w₄*w₄个像素划分为w₄/f₄行，w₄/f₄列个f₄*f₄的小块，对每个小块中的数，取最大数做为输出结果，然后遍历完每行上的小块和每列上的小块，依小块原有的次序放在相应的位置，最终构成一个(w₄/f₄)*(w₄/f₄)的矩阵，对输入数据的d₄通道的第i₄行，j₄列位置的池化计算公式如下：

对一个通道做完池化操作后，形成输出特征图layer_4out的1层二维池化结果，再对另外d₄-1个通道，依次重复上述池化过程，最终形成d₄层二维池化结果，这就是第四层池化层的全部输出结果，以下式表示：layer_4out(p₄,q₄,d₄)

式中，1≤p₄，q₄≤(w₄/f₄)＝126，d₄＝16；之后，进入步骤6)；

步骤6)、进入所述新型卷积神经网络第五层，第五层为卷积层C5，对第五层卷积网络做卷积运算时，所需参数的值如下：v＝5，w₅＝126，d₅＝16，f₅＝3，t₅＝32，s₅＝1，p₅＝0，k_5u和b₅设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第五层卷积层C5与卷积核k_5u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₅移动，将卷积核k_5u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_5out(p₅，q₅，k_5u)，公式表示如下：

其中layer₅(i₅+m₅，j₅+n₅，c₅)表示卷积运算进行到输入图像layer₅第c₅通道的i₅+m₅行，第j₅+n₅列，1≤i₅，j₅≤w₅–f₅+1，第五层图像layer₅做卷积运算后输出的特征图尺寸由第五层图像尺寸w₅、卷积核大小f₅及扫描步长s₅和填充p₅决定，计算公式为：代入上述数据计算可得，/>则第五层与卷积核k_5u做卷积操作后的输出特征图尺寸为126像素*126像素；利用一个卷积核k_5u完成卷积运算后，形成输出特征图layer_5out的一层二维结果，再用另外t₅-1个不同的卷积核，依次重复上述卷积过程，即共t₅＝32个卷积核，每个卷积核运算后均生成一层二维特征图结果，最终形成31层二维特征图，神经元的个数为126*126*32个，这就是第一卷积层的全部输出结果，这里以下式表示：layer_5out(p₅,q₅,k₅)

第五层卷积层激活函数采用LeakyReLU，其数学表达式为：

layer_5out(p₅，q₅，k₅)做为本层激活函数LeakyReLU的输入，b₅代表偏置量，layer₆(i₆，j₆，c₆)代表新型卷积神经网络第五层卷积层激活后的输出，其中i₆、j₆、c₆均为正整数，且1≤i₆，j₆≤126，1≤c₆≤32，这里c取值为50；之后，进入步骤7)；

步骤7)、进入所述新型卷积神经网络第六层为池化层，对第六层池化层做运算时所需参数的值如下：z＝6，w₆＝126，d₆＝32，f₆＝2，池化层使用的池化操作为最大池化，即：把输图像的一个通道内的w₆*w₆个像素划分为w₆/f₆行，w₆/f₆列个f₆*f₆的小块，对每个小块中的数，取最大数做为输出结果，然后遍历完每行上的小块和每列上的小块，依小块原有的次序放在相应的位置，最终构成一个(w₆/f₆)*(w₆/f₆)的矩阵，对输入数据的d₆通道的第i₆行、j₆列位置的池化计算公式如下：

对一个通道做完池化操作后，形成输出特征图layer_6out的1层二维池化结果，再对另外d₆-1个通道，依次重复上述池化过程，最终形成d₆层二维池化结果，这就是第六层池化层的全部输出结果，以下式表示：layer_6out(p₆,q₆,d₆)；

式中，1≤p₆，q₆≤(w₆/f₆)＝63，d₆＝32；之后，进入步骤8)；

步骤8)、进入所述新型卷积神经网络第七层，第七层为卷积层C7，

对第七层卷积网络做卷积运算时，所需参数的值如下：v＝7，w₇＝63，d₇＝32，f₇＝3，t₇＝64，s₇＝2，p₇＝0，k_7u和b₇设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第七层卷积层C7与卷积核k_7u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₇移动，将卷积核k_7u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_7out(p₇，q₇，k_7u)，公式如下：

其中layer₇(i₇+m₇，j₇+n₇，c₇)表示卷积运算进行到输入图像layer₇第c₇通道的i₇+m₇行，第j₇+n₇列，1≤i₇，j₇≤w₇–f₇+1，第七层图像layer₇做卷积运算后输出的特征图尺寸由第七层图像尺寸w₇、卷积核大小f₇及扫描步长s₇和填充p₇决定，计算公式为：代入上述数据计算可得，/>则第七层与卷积核k_7u做卷积操作后的输出特征图尺寸为31像素*31像素；利用一个卷积核k_7u完成卷积运算后，形成输出特征图layer_7out的一层二维结果，再用另外t₇-1个不同的卷积核，依次重复上述卷积过程，即共t₇＝64个卷积核，每个卷积核运算后均生成一层二维特征图结果，最终形成64层二维特征图，神经元的个数为31*31*64个，这就是第一卷积层的全部输出结果，这里以下式代表：layer_7out(p₇,q₇,k₇)；

第七层卷积层激活函数采用LeakyReLU，其数学表达式为：

其中，layer_7out(p₇，q₇，k₇)做为本层激活函数LeakyReLU的输入，b₇代表偏置量，layer₈(i₈，j₈，c₈)代表新型卷积神经网络第五层卷积层激活后的输出，其中i₈、j₈、c₈均为正整数，且1≤i₈，j₈≤31，1≤c₈≤64，这里c取值为50；之后，进入步骤9)；

步骤9)、进入所述新型卷积神经网络第八层，第八层为卷积层C8，对第八层卷积网络做卷积运算时，所需参数的值如下：w₈＝31，d₈＝64，f₈＝3，t₈＝128，s₈＝2，p₈＝0，k_8u和b₈设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第八层卷积层C8与卷积核k_8u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₈移动，将卷积核k_8u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_8out(p₈，q₈，k_8u)，公式表示如下：

其中layer₈(i₈+m₈，j₈+n₈，c₈)表示卷积运算进行到输入图像layer₈第c₈通道的i₈+m₈行，第j₈+n₈列，1≤i₈，j₈≤w₈–f₈+1，第八层图像layer₈做卷积运算后输出的特征图尺寸由第八层图像尺寸w₈、卷积核大小f₈及扫描步长s₈和填充p₈决定，计算公式为：代入上述数据计算可得，/>则第八层与卷积核k_8u做卷积操作后的输出特征图尺寸为15像素*15像素；利用一个卷积核k_8u完成卷积运算后，形成输出特征图layer_8out的一层二维结果，再用另外t₈-1个不同的卷积核，依次重复上述卷积过程，即共t₈＝128个卷积核，每个卷积核运算后均生成一层二维特征图结果，最终形成128层二维特征图，神经元的个数为15*15*128个，这就是第八卷积层的全部输出结果，这里以下式代表：layer_8out(p₈,q₈,k₈)；

第八层卷积层激活函数采用LeakyReLU，其数学表达式为：

其中，layer_8out(p₈，q₈，k₈)做为本层激活函数LeakyReLU的输入，b₈代表偏置量，layer₉(i₉，j₉，c₉)代表新型卷积神经网络第五层卷积层激活后的输出，其中i₉、j₉、c₉均为正整数，且1≤i₉，j₉≤15，1≤c₉≤128，这里c为设定的常量，c取值为50；之后，进入步骤10)；

步骤10)、进入所述新型卷积神经网络第九层为卷积层C9，对第九层卷积网络做卷积运算时，所需参数的值如下：v＝9，w₉＝15，d₉＝128，f₉＝3，t₉＝256，s₉＝2，p₉＝0，k_9u和b₉设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第九层卷积层C9与卷积核k_9u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₉移动，将卷积核k_9u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_9out(p₉，q₉，k_9u)，公式表示如下：

其中layer₉(i₉+m₉，j₉+n₉，c₉)表示卷积运算进行到输入图像layer₉第c₉通道的i₉+m₉行，第j₉+n₉列，1≤i₉，j₉≤w₉–f₉+1，第九层图像layer₉做卷积运算后输出的特征图尺寸由第九层图像尺寸w₉、卷积核大小f₉及扫描步长s₉和填充p₉决定，计算公式为：代入上述数据计算可得，/>则第九层与卷积核k_9u做卷积操作后的输出特征图尺寸为15像素*15像素；利用一个卷积核k_9u完成卷积运算后，形成输出特征图layer_9out的一层二维结果，再用另外t₉-1个不同的卷积核，依次重复上述卷积过程，即共t₉＝256个卷积核，每个卷积核运算后均生成一层二维特征图结果，最终形成256层二维特征图，神经元的个数为7*7*256个，这就是第九层卷积层的全部输出结果，这里以下式代表：layer_9out(p₉,q₉,k₉)

第九层卷积层激活函数采用LeakyReLU，其数学表达式为：

layer_9out(p₉，q₉，k₉)做为本层激活函数LeakyReLU的输入，b₉代表偏置量，layer₁₀(i₁₀，j₁₀，c₁₀)代表新型卷积神经网络第九层卷积层激活后的输出，其中i₁₀、j₁₀、c₁₀均为正整数，且1≤i₁₀，j₁₀≤7，1≤c₁₀≤256，这里c取值为50；之后，进入步骤11)；

步骤11)、进入所述新型卷积神经网络第十层的全连接层,本文中所有全连接层在计算过程中要用到的公式中的变量及其含义说明如下：a：表示当前处理的全连接层在整个网络中所处的层级，当a的值在一层被指定后，所有下标包含a的变量均以a的值代入来表示此变量的名称；x_a：正整数，表示第a层的输入数据的维数；X_a：列向量，表示第a层的输入数据是一个包含x_a行的列向量，每行包含一个实数，这里的x_a个元素从上到下分别为layer_a(i_a，j_a，c_a)以层、行、列为顺序每次取出一个数值依次排列而成；d_a：正整数，表示第a层连接单元的数量；W_a：实矩阵，表示第a层与第a-1层间的连接权重所构成的二维实矩阵，此矩阵的行数为d_a，列数为x_a；B_a：列向量，为第a层计算过程中需要用到的中间阈值变量，其行数为d_a；Layer_aout：列向量，为第a层输入图像经过运算得到的结果的d_a维列向量；Layer_aout(k_a)：实数，layer_aout的第k_a个分量的值，1≤k_a≤d_a；

对第10层全连接层做运算时，所需参数的值如下：

a＝10，x₁₀＝i₁₀*j₁₀*c₁₀＝12544，d₁₀＝2¹³＝8192，W₁₀中所有值设置为(-1，1)之间的非0的随机数，B₁₀中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十层全连接层F10的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_10out，公式表示如下：layer_10out＝W₁₀X₁₀+B₁₀；第十层全连接层激活函数采用sigmoid函数，对layer_10out的第k₁₀个分量进行激活的公式为：

其中，layer_10out(k₁₀)做为本层激活函数sigmoid函数的一个分量的输入，layer₁₁(c₁₁)代表新型卷积神经网络第十层全连接层激活后的一个分量的输出，其中c₁₁均为正整数，且1≤c₁₁＝k₁₀≤d₁₀；第十层全连接层的全部输出以layer₁₁表示，layer₁₁为d₁₀维的一个列向量；之后，进入步骤12)；

步骤12)、进入所述新型卷积神经网络第十一层为全连接层，对第十一层全连接层做运算时，所需参数的值如下：a＝11，x₁₁＝d₁₀＝8192，d₁₁＝4096，W₁₁中所有值设置为(-1，1)之间的非0的随机数，B₁₁中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十一层全连接层F11的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_11out，公式如下：layer_11out＝W₁₁X₁₁+B₁₁；

第十一层全连接层激活函数采用sigmoid函数，对layer_11out的第k₁₁个分量进行激活的数学表达式为：

其中，layer_11out(k₁₁)做为本层激活函数sigmoid函数的一个分量的输入，layer₁₂(c₁₂)代表新型卷积神经网络第十一层全连接层激活后的一个分量的输出，其中c₁₂均为正整数，且1≤c₁₂＝k₁₁≤d₁₁；第十一层全连接层的全部输出以layer₁₂表示，layer₁₂为d₁₁维的一个列向量；之后，进入步骤13)；

步骤13)、进入所述新型卷积神经网络第十二层为全连接层，对第十二层全连接层做运算时，所需参数的值如下：a＝12，x₁₂＝d₁₁＝4096，d₁₂＝18，W₁₂中所有值设置为(-1，1)之间的非0的随机数，B₁₂中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十二层全连接层F12的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_12out，公式表示如下：layer_12out＝W₁₂X₁₂+B₁₂；

第十二层全连接层激活函数采用sigmoid函数，对layer_12out的第k₁₂个分量进行激活的数学表达式为：

其中，layer_12out(k₁₂)做为本层激活函数sigmoid函数的一个分量的输入，layer₁₃(c₁₃)代表新型卷积神经网络第十一层全连接层激活后的一个分量的输出，其中c₁₃均为正整数，且1≤c₁₃＝k₁₂≤d₁₂；第十一层全连接层的全部输出以layer₁₃表示，layer₁₃为d₁₂维的一个列向量，代表d₁₂个二级分类类型；之后，进入步骤14)；

步骤14)、进入所述新型卷积神经网络的输出层，输出层过程中要用到的公式中的标号及其含义说明如下：e：为自然常数，其值约为2.71828；S_w：无单位，表示softmax函数的输出，也即输出层的输出；S_w(c₁₃)：无单位，表示输出层第c₁₃个神经元，为(0，1)间的概率值；layer₁₃：列向量，为第十二层输出的d₁₂个神经元输出的对应值，同时作为本层的输入；layer₁₃(c₁₃)：正整数，表示layer₁₃中的第c₁₃个元素，其中1≤c₁₃≤d₁₂；M：无单位，表示强度参数，预设为1；S_wmax：表示layer₁₃中神经元对应值经softmax函数输出后，d₁₂个节点概率中最大的一个，也即最终的分类结果对应的概率值，为(0，1)间的概率值；最后一层的输出层将d₁₂个神经元的输出映射到(0，1)区间内，用概率解释分类，使用经典softmax函数进行计算，得到第c₁₃个元素对应的概率输出，数学表达式为：

则若18个神经元在第十一层全连接层的输出为layer₁₃(1)，layer₁₃(2)，…，layer₁₃(18)，则经最后输出层softmax作用后的d₁₂＝18个神经元的输出概率值依次为：S_w(1)，S_w(2)，…，S_w(18)，对应所属的18个二级类别，即：属于玻璃类的概率为S_w(1)、属于牛奶盒的概率为S_w(2)、属于金属类的概率为S_w(3)、属于塑料类的概率为S_w(4)、属于废纸类的概率为S_w(5)、属于织物类的概率为S_w(6)、属于废电池的概率为S_w(7)、属于废墨盒的概率为S_w(8)、属于废油漆桶的概率为S_w(9)、属于过期药品的概率为S_w(10)、属于废灯管的概率为S_w(11)、属于杀虫剂的概率为S_w(12)、属于污染塑料袋的概率为S_w(13)、属于烟头的概率为S_w(14)、属于污染纸张的概率为S_w(15)、属于破旧陶瓷品的概率为S_w(16)、属于灰土的概率为S_w(17)、属于一次性餐具的概率为S_w(18)，经softmax映射后所有节点概率值的累和为1，选取输出节点概率值最大的作为预测目标和分类结果，如下公式所示：则选取S_wmax为分类结果；

步骤15)、对卷积核k_1u、b₁、k_3u、b₃、k_5u、b₅、k_7u、b₇、k_8u、b₈、k_9u、b₉以及全连接层内的W₁₀、B₁₀、W₁₁、B₁₁、W₁₂、B₁₂的值进行误差反向传播计算更新，进行循环迭代，调整上述参数，不断减小模型输出结果与实际结果之间的误差，找到所有样本的整体平均误差最小的k_1u、b₁、k_3u、b₃、k_5u、b₅、k_7u、b₇、k_8u、b₈、k_9u、b₉以及W₁₀、B₁₀、W₁₁、B₁₁、W₁₂、B₁₂的值，由此作为本新型卷积神经网络训练完成的模型参数，可用来做图像预测；之后，进入步骤16)；

步骤16)、将待分类图像送入训练好的神经网络，过程如下；

16-1)、将待分类图像做为预测输入数据；

16-2)、加载训练好的网络模型，加载网络模型时使用训练好的k_1u、b₁、k_3u、b₃、k_5u、b₅、k_7u、b₇、k_8u、b₈、k_9u、b₉以及W₁₀、B₁₀、W₁₁、B₁₁、W₁₂、B₁₂的值做为计算参数；

16-3)、依次经过步骤2)至步骤14)的计算步骤后，输出分类结果，即待分类图像所属类别及其准确率S_w(c₁₃)，1≤c₁₃≤18，0≤S_w(c₁₃)≤1；将最终的S_wmax作为分类结果，其对应值为所属二级类别的概率，判断出来的结果为待分类垃圾所属的二级类别：如果S_wmax属于{S_w(1)，S_w(2)，S_w(3)，S_w(4)，S_w(5)，S_w(6)}，即图像分类识别结果为{玻璃类，牛奶盒，金属类，塑料类，废纸类，织物类}，则判断该垃圾属于可回收垃圾；若S_wmax属于{S_w(7)，S_w(8)，S_w(9)，S_w(10)，S_w(11)，S_w(12)}，即图像分类识别结果为{废电池，废墨盒，废油漆桶，过期药品，废灯管，杀虫剂}，则判断该垃圾属于有害垃圾；若S_wmax＝{S_w(13)，S_w(14)，S_w(15)，S_w(16)，S_w(17)，S_w(18)}，即图像分类识别结果为{污染塑料袋，烟头，污染纸张，破旧陶瓷品，灰土，一次性餐具}，则判断该垃圾属于其他垃圾。

本发明提供了一种城市垃圾分类处理智能视觉检测方法，针对城市垃圾智能自动分类回收需求，采用新型卷积神经网络(NCNN)包括改进设计神经网络特征提取部分，使用新的复合卷积池化层取代传统的卷积神经网络卷积层；本发明将网络架构设计为12个层，包括6个卷积层，3个池化层和3个全连接层，在控制模型复杂度的情况下，提高了模型的分类精度；卷积核大小依次采用5*5，3*3和1*1，同时模型采用LeakyReLU作为激活函数，提高了降采样速度和特征提取效率；构造属于三大类(可回收垃圾、有害垃圾、其他垃圾)的十八个二级类别的常见的城市垃圾样本图像数据，标注图像数据，制作数据集，并扩充训练集；利用扩充好的训练集输入新型卷积神经网络进行训练，获取网络模型；实验结果表明，该网络在自制垃圾数据集上进行训练测试后，得到了95.8％的准确率，具有较高的运算速度；同时，利用新型卷积神经网络进行垃圾的分类识别，模型泛化能力强，可迁移性强，革新了城市垃圾智能分类实现方法，能够自动完成垃圾分类任务，减轻人工操作，使垃圾分类做到减量化、资源化、无害化，确保垃圾分类效果。

附图说明

图1为本发明一种城市垃圾分类处理智能视觉检测方法的流程图；

图2为本发明的原理结构图。

具体实施方式

本发明提供了一种城市垃圾分类处理智能视觉检测方法，其流程图如图1所示，其原理结构图，其中：包括如下步骤：

步骤2)、每次送单张训练集图像数据进入新型卷积神经网络，训练集图像数据为3通道彩色图，图片格式为.jpg，图像尺寸参数为512像素*512像素*3通道；将所述新型卷积神经网络共有12层，每个层与层之间采用串联的连接方式；设置学习率为0.005，迭代次数为500次，所述训练和测试过程使用win10系统，配置Anaconda环境，使用python3.6编程语言，搭建keras框架，使用垃圾图像数据集进行训练；

网络第一层处理过程中要用到的公式中的标号及其含义说明如下：

*：表示数乘，乘数均为实数；C1：表示网络第一层为卷积层；w₁：单位为像素，表示第一层输入图像的尺寸为w₁*w₁；这里我们设置输入图像宽高比均为1:1；d₁：正整数，表示第一层C1输入图像的通道数，输入图像为彩色3通道，分别是R、G、B，分别代表图像某点像素中的红色、绿色、蓝色分量值，这里的R、G、B均为正整数；f₁：正整数，表示第一层C1使用的卷积核的大小，即卷积核的长度和宽度，所有卷积核的长度等于其宽度；t₁：正整数，表示第一层C1使用的卷积核的个数；k_1u：三维实矩阵，表示第一层C1使用的第u个卷积核，即：长度*宽度*图像通道数，1≤u≤t₁；k_1u(m₁，n₁)：表示卷积核k_1u内的值，可看作对图像进行卷积运算的计算权重，为d₁维实向量，m₁、n₁为正整数，表示第一层C1使用的卷积核内的位置，m₁表示横坐标，n₁表示纵坐标，m₁、n₁的取值范围为：1≤m₁，n₁≤f₁；k_1u(m₁，n₁，c₁)：表示卷积核k_1u内各通道的值，m₁、n₁为正整数，表示第一层使用的卷积核内的位置，m₁是表示横坐标，n₁表示纵坐标，m₁、n₁的取值范围为1≤m₁，n₁≤f₁，c₁为正整数，表示卷积核内c₁通道，1≤c₁≤d₁；k₁：代表第一层使用的全部t₁个卷积核；p₁：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d₁，所述的“0像素”是指一个像素的所有通道上的值均为0的像素；s₁：正整数，是第一层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔几个像素进行一次卷积运算，这个间隔数即操作步长，以像素为单位；layer₁(i₁，j₁)：表示第一层输入图像中的第i₁行，第j₁列的像素值，其由(R，G，B)三个数来表示，其中0≤R，G，B≤255，1≤i₁，j₁≤w₁；layer₁(i₁，j₁，c₁)：表示第一层输入图像中的第i₁行，第j₁列，第c₁通道的像素值，1≤i₁，j₁≤w₁，1≤c₁≤d₁；layer_1out(p₁，q₁，k_1u)：表示第一层输入图像经与卷积核k_1u做卷积运算后得到的特征图的第p₁行，第q₁列的像素值，每个值可以看做一个神经元，其中1≤p₁，q₁≤w_1out；w_1out：单位为像素，表示第一层输入图像layer₁与卷积核k_1u进行卷积运算后得到的特征图layer_1out的尺寸为w₁out*w_1out；需要说明的是，由于所有卷积核尺寸都是一样的，所以t₁个卷积核做卷积运算得到的结果都是一样的。

对第一层卷积网络做卷积运算时，所需参数的值如下：w₁＝512，d₁＝3，f₁＝5，t₁＝6，s₁＝1，p₁＝0，k_1u设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第一卷积层C1与卷积核k_1u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₁移动，将卷积核k_1u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_1out(p₁，q₁，k_1u)，公式表示如下：

其中layer₁(i₁+m₁，j₁+n₁，c₁)表示卷积运算进行到输入图像layer₁第c₁通道的i₁+m₁行、第j₁+n₁列，1≤i₁，j₁≤w₁–f₁+1，第一层图像layer₁做卷积运算后输出的特征图尺寸由第一层图像尺寸w₁、卷积核大小f₁及扫描步长s₁和填充p₁决定，计算公式为：代入上述数据计算可得，/>则第一层与卷积核k_1u做卷积操作后的输出特征图尺寸为508像素*508像素；分别利用t₁＝6个卷积核依次重复上述卷积过程，最终形成t₁＝6层二维特征图，神经元的个数为508*508*6个，这就是第一卷积层的全部输出结果，这里以下式代表：layer_1out(p₁,q₁,k₁)；

所述第一卷积层激活函数采用LeakyReLU，其数学表达式为：

步骤3)、进入所述新型卷积神经网络的第二层池化层S2，池化层S2计算过程中要用到的公式中的标号及其含义说明如下：max：池化过程运算符号，表示取最大值；S2：表示第二层为池化层；w₂：单位为像素，表示第二层输入图像的尺寸为w₂*w₂；d₂：正整数，表示第二层输入图像的通道数，这里为第一层的输出结果的通道数，d₂＝t₁；f₂：正整数，表示第二层使用的池化过滤器的大小，即过滤器的长度和宽度，所有池化层过滤器的长度等于其宽度；layer₂(i₂，j₂)：表示第二层输入图像中的第i₂行，第j₂列的像素值，其是一个d₂维向量，其中1≤i₂，j₂≤w₂；layer₂(i₂，j₂，c₂)：表示第二层输入图像中的第i₂行，第j₂列，第c₂通道的像素值，1≤i₂，j₂≤w₂，1≤c₂≤d₂；layer_2out(p₂，q₂，d₂)：表示第二层输出图像中的第p₂行，第q₂列，第d₂通道位置处的值，1≤p₂，q₂≤(w₂/f₂)；

对第z层池化层做运算时，操作步骤如下：把池化层的输入图像的一个通道内的w_z*w_z个像素划分为(w_z/f_z)行，(w_z/f_z)列个f_z*f_z的小块，对每个小块中的数，取最大数做为输出结果，然后遍历完每行上的小块和每列上的小块，依小块原有的次序放在相应的位置，最终构成一个(w_z/f_z)*(w_z/f_z)的矩阵，所有下标包含z的变量均以z的值代入来表示此变量的名称；

对第二层池化层做运算时，所需参数的值如下：w₂＝508，d₂＝6，f₂＝2，池化层使用的池化操作为最大池化，对输入数据的d₂通道的第i₂行，j₂列位置的池化计算公式如下：

对一个通道做完池化操作后，形成输出特征图layer_2out的1层二维池化结果，再对另外d₂-1个通道，依次重复上述池化过程，最终形成d₂层二维池化结果，这就是第二池化层的全部输出结果，以下式代表：layer_2out(p₂,q₂,d₂)；式中，1≤p₂，q₂≤(w₂/f₂)＝254，d₂＝6；之后，进入步骤4)；

步骤4)、进入所述新型卷积神经网络第三层为卷积层C3，C3层过程中要用到的公式中的标号及其含义说明如下：C3：表示第三层为卷积层；w₃：单位为像素，表示第三层输入图像的尺寸为w₃*w₃；这里我们设置输入图像宽高比均为1:1；d₃：正整数，表示第三层输入图像的通道数，这里为第二层的输出结果的通道数，d₃＝d₂；f₃：正整数，表示第三层使用的卷积核的大小，即卷积核的长度和宽度，所有卷积核的长度等于其宽度；t₃：正整数，表示第三层使用的卷积核的个数；k_3u：三维实矩阵，表示第三层使用的第u个卷积核，即长度*宽度*图像通道数，1≤u≤t₃；k_3u(m₃，n₃)：表示卷积核k_3u内的值，作为对图像进行卷积运算的计算权重，为d₃维实向量，m₃、n₃为正整数，表示第三层使用的卷积核内的位置，m₃表示横坐标，n₃表示纵坐标，m₃、n₃的取值范围为1≤m₃，n₃≤f₃；k_3u(m₃，n₃，c₃)：表示卷积核k_3u内各通道的值，m₃、n₃为正整数，表示第三层使用的卷积核内的位置，m₃是表示横坐标，n₃表示纵坐标，m₃、n₃的取值范围为1≤m₃，n₃≤f₃，c₃为正整数，表示卷积核内c₃通道，1≤c₃≤d₃；k₃：代表第三层使用的全部t₃个卷积核，仅做符号表示；p₃：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d₃，这里所述的“0像素”是指一个像素的所有通道上的值均为0的像素；s₃：正整数，第三层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔几个像素进行一次卷积运算，这个间隔数即操作步长，以像素为单位；layer₃(i₃，j₃)：表示第三层输入图像中的第i₃行，第j₃列的像素值，其是一个d₃维向量，layer₃(i₃，j₃)＝layer_2out(p₂，q₂)，其中1≤i₃，j₃≤w₃；

layer₃(i₃，j₃，c₃)：表示第三层输入图像中的第i₃行，第j₃列，第c₃通道的像素值，1≤i₃，j₃≤w₃，1≤c₃≤d₃；layer_3out(p₃，q₃，k_3u)：表示第三层输入图像经与卷积核k_3u做卷积运算后得到的特征图的第p₃行，第q₃列的像素值，每个值可以看做一个神经元，其中1≤p₃，q₃≤w_3out；w_3out：单位为像素，表示第三层输入图像layer₃与卷积核k_3u进行卷积运算后得到的特征图layer_3out的尺寸为w_3out*w_3out；需要说明的是，由于所有卷积核尺寸都是一样的，所以t₃个卷积核做卷积运算得到的结果都是一样的；

对第三层卷积网络做卷积运算时，所需参数的值如下：w₃＝254，d₃＝6，f₃＝3，t₃＝16，s₃＝1，p₃＝0，k_3u和b₃设置为初始值在(-1，1)之间的随机数；对所述新型卷积神经网络的第三层卷积层C3与卷积核k_3u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₃移动，将卷积核k_3u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_3out(p₃，q₃，k_3u)，公式表示如下：

其中layer₃(i₃+m₃，j₃+n₃，c₃)表示卷积运算进行到输入图像layer₃第c₃通道的i₃+m₃行，第j₃+n₃列，1≤i₃，j₃≤w₃–f₃+1，第三层图像layer₃做卷积运算后输出的特征图尺寸由第一层图像尺寸w₃、卷积核大小f₃及扫描步长s₃和填充p₃决定，计算公式为：代入上述数据计算可得，/>则第三层与卷积核k_3u做卷积操作后的输出特征图尺寸为252像素*252像素；分别利用t₃＝16个卷积核依次重复上述卷积过程，最终形成t₃＝16层二维特征图，神经元的个数为252*252*16个，这就是第三层卷积层的全部输出结果，这里以下式代表：layer_3out(p₃,q₃,k₃)；

第三层卷积层激活函数采用LeakyReLU，其数学表达式为：

步骤5)、进入所述新型卷积神经网络第四层为池化层S4，S4层计算过程中要用到的公式中的标号及其含义说明如下：

S4：表示第四层为池化层；w₄：单位为像素，表示第四层输入图像的尺寸为w₄*w₄；d₄：正整数，表示第四层输入图像的通道数，这里为第三层的输出结果的通道数，d₄＝t₃；f₄：正整数，表示第四层使用的池化过滤器的大小，即过滤器的长度和宽度，中所有池化层过滤器的长度等于其宽度；layer₄(i₄，j₄)：表示第四层输入图像中的第i₄行、第j₄列的像素值，是一个d₄维向量，其中1≤i₄，j₄≤w₄；layer₄(i₄，j₄，c₄)：表示第四层输入图像中的第i₄行，第j₄列，第c₄通道的像素值，1≤i₄，j₄≤w₄，1≤c₄≤d₄；layer_4out(p₄，q₄，d₄)：表示第四层输出图像中的第p₄行，第q₄列，第d₄通道位置处的值，1≤p₄，q₄≤(w₄/f₄)；

对第四层池化层做运算时，所需参数的值如下：w₄＝252，d₄＝16，f₄＝2，池化层使用的池化操作为最大池化，对输入数据的d₄通道的第i₄行，j₄列位置的池化计算公式如下：

对一个通道做完池化操作后，形成输出特征图layer_4out的1层二维池化结果，再对另外d₄-1个通道，依次重复上述池化过程，最终形成d₄层二维池化结果，这就是第四层池化层的全部输出结果，以下式表示：layer_4out(p₄,q₄,d₄)；式中，1≤p₄，q₄≤(w₄/f₄)＝126，d₄＝16；之后，进入步骤6)；

步骤6)、进入所述新型卷积神经网络第五层，第五层为卷积层C5，C5层计算中要用到的公式中的标号及其含义说明如下：

w₅：单位为像素，表示第五层输入图像的尺寸为w₅*w₅；设置输入图像宽高比均为1:1；d₅：正整数，表示第五层输入图像的通道数，这里为第四层的输出结果的通道数，d₅＝d₄；f₅：正整数，表示第五层使用的卷积核的大小，即卷积核的长度和宽度，所有卷积核中任一卷积核的长度等于其宽度，卷积核都是以奇数为边长的方阵；t₅：正整数，表示第五层使用的卷积核的个数；k_5u：三维实矩阵，表示第五层使用的第u个卷积核，即长度*宽度*图像通道数，1≤u≤t₅；k_5u(m₅，n₅)：表示卷积核k_5u内的值，表示卷积核内一个对图像进行卷积运算的计算权重，为d₅维实向量，m₅、n₅为正整数，表示第五层使用的卷积核内的位置，m₅是表示横坐标，n₅表示纵坐标，m₅、n₅的取值范围为1≤m₅，n₅≤f₅；k_5u(m₅，n₅，c₅)：表示卷积核k_5u内各通道的值，m₅、n₅为正整数，表示第五层使用的卷积核内的位置，m₅是表示横坐标，n₅表示纵坐标，m₅、n₅的取值范围为1≤m₅，n₅≤f₅，c₅为正整数，表示卷积核内c₅通道，1≤c₅≤d₅；k₅：代表第五层使用的全部t₅个卷积核；p₅：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d₅；s₅：正整数，第五层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔一定数量的像素进行一次卷积运算，这个间隔数量即操作步长，以像素为单位；layer₅(i₅，j₅)：表示第五层输入图像中的第i₅行，第j₅列的像素值，其是一个d₅维向量，layer₅(i₅，j₅)＝layer_4out(p₄，q₄)，其中1≤i₅，j₅≤w₅；layer₅(i₅，j₅，c₅)：表示第五层输入图像中的第i₅行，第j₅列，第c₅通道的像素值，1≤i₅，j₅≤w₅，1≤c₅≤d₅；layer_5out(p₅，q₅，k_5u)：表示第五层输入图像经与卷积核k_5u做卷积运算后得到的特征图的第p₅行，第q₅列的像素值，每个值可以看做一个神经元，其中1≤p₅，q₅≤w_5out；w_5out：单位为像素，表示第五层输入图像layer₅与卷积核k_5u进行卷积运算后得到的特征图layer_5out的尺寸为w₅out*w_5out；需要说明的是，由于所有卷积核尺寸都是一样的，所以t₅个卷积核做卷积运算得到的结果都是一样的；

对第五层卷积网络做卷积运算时，所需参数的值如下：w₅＝126，d₅＝16，f₅＝3，t₅＝32，s₅＝1，p₅＝0，k_5u和b₅设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第五层卷积层C5与卷积核k_5u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₅移动，将卷积核k_5u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_5out(p₅，q₅，k_5u)，公式表示如下：

其中layer₅(i₅+m₅，j₅+n₅，c₅)表示卷积运算进行到输入图像layer₅第c₅通道的i₅+m₅行，第j₅+n₅列，1≤i₅，j₅≤w₅–f₅+1，第五层图像layer₅做卷积运算后输出的特征图尺寸由第五层图像尺寸w₅、卷积核大小f₅及扫描步长s₅和填充p₅决定，计算公式为：代入上述数据计算可得，/>则第五层与卷积核k_5u做卷积操作后的输出特征图尺寸为126像素*126像素；分别利用t₅＝32个卷积核依次重复上述卷积过程，最终形成t₅＝32层二维特征图，神经元的个数为126*126*32个，这就是第一卷积层的全部输出结果，这里以下式表示：layer_5out(p₅,q₅,k₅)；

第五层卷积层激活函数采用LeakyReLU，其数学表达式为：

layer_5out(p₅，q₅，k₅)做为本层激活函数LeakyReLU的输入，b₅代表偏置量；layer₆(i₆，j₆，c₆)代表新型卷积神经网络第五层卷积层激活后的输出，其中i₆、j₆、c₆均为正整数，且1≤i₆，j₆≤126，1≤c₆≤32，这里c取值为50；之后，进入步骤7)；

步骤7)、进入所述新型卷积神经网络第六层为池化层S6，S6层计算过程中要用到的公式中的标号及其含义说明如下：

S6：表示第六层为池化层；w₆：单位为像素，表示第六层输入图像的尺寸为w₆*w₆；d₆：正整数，表示第六层输入图像的通道数，这里为第五层的输出结果的通道数，d₆＝t₅；f₆：正整数，表示第六层使用的池化过滤器的大小，即过滤器的长度和宽度，所有池化层过滤器的长度等于其宽度；layer₆(i₆，j₆)：表示第六层输入图像中的第i₆行，第j₆列的像素值，其是一个d₆维向量，其中1≤i₆，j₆≤w₆；layer₆(i₆，j₆，c₆)：表示第六层输入图像中的第i₆行，第j₆列，第c₆通道的像素值，1≤i₆，j₆≤w₆，1≤c₆≤d₆；layer_6out(p₆，q₆，d₆)：表示第六层输出图像中的第p₆行，第q₆列，第d₆通道位置处的值，1≤p₆，q₆≤(w₆/f₆)；对第六层池化层做运算时，所需参数的值如下：w₆＝126，d₆＝32，f₆＝2，池化层使用的池化操作为最大池化，对输入数据的d₆通道的第i₆行，j₆列位置的池化计算公式如下：

步骤8)、进入所述新型卷积神经网络第七层，第七层为卷积层C7，C7层运算过程中要用到的公式中的标号及其含义说明如下：

w₇：单位为像素，表示第七层输入图像的尺寸为w₇*w₇；这里我们设置输入图像宽高比均为1:1；d₇：正整数，表示第七层输入图像的通道数，这里为第六层的输出结果的通道数，d₇＝d₆；f₇：正整数，表示第七层使用的卷积核的大小，即卷积核的长度和宽度，所有卷积核的长度等于其宽度；t₇：正整数，表示第七层使用的卷积核的个数；k_7u：三维实矩阵，表示第七层使用的第u个卷积核，即长度*宽度*图像通道数，1≤u≤t₇；k_7u(m₇，n₇)：表示卷积核k_7u内的值，可看作对图像进行卷积运算的计算权重，为d₇维实向量，m₇、n₇为正整数，表示第七层使用的卷积核内的位置，m₇是表示横坐标，n₇表示纵坐标，m₇、n₇的取值范围为1≤m₇，n₇≤f₇；k_7u(m₇，n₇，c₇)：表示卷积核k_7u内各通道的值，m₇、n₇为正整数，表示第七层使用的卷积核内的位置，m₇是表示横坐标，n₇表示纵坐标，m₇、n₇的取值范围为1≤m₇，n₇≤f₇，c₇为正整数，表示卷积核内c₇通道，1≤c₇≤d₇；k₇：代表第七层使用的全部t₇个卷积核；p₇：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d₇；s₇：正整数，第七层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔一定数量像素进行一次卷积运算，这个间隔数量即操作步长，以像素为单位；layer₇(i₇，j₇)：表示第七层输入图像中的第i₇行，第j₇列的像素值，其是一个d₇维向量，layer₇(i₇，j₇)＝layer_6out(p₆，q₆)，其中1≤i₇，j₇≤w₇；

layer₇(i₇，j₇，c₇)：表示第七层输入图像中的第i₇行，第j₇列，第c₇通道的像素值，1≤i₇，j₇≤w₇，1≤c₇≤d₇；layer_7out(p₇，q₇，k_7u)：表示第七层输入图像经与卷积核k_7u做卷积运算后得到的特征图的第p₇行，第q₇列的像素值，每个值可以看做一个神经元，其中1≤p₇，q₇≤w_7out；w_7out：单位为像素，表示第七层输入图像layer₇与卷积核k_7u进行卷积运算后得到的特征图layer_7out的尺寸为w_7out*w_7out，需要说明的是，由于所有卷积核尺寸都是一样的，所以t₇个卷积核做卷积运算得到的结果都是一样的；

对第七层卷积网络做卷积运算时，所需参数的值如下：w₇＝63，d₇＝32，f₇＝3，t₇＝64，s₇＝2，p₇＝0，k_7u和b₇设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第七层卷积层C7与卷积核k_7u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₇移动，将卷积核k_7u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_7out(p₇，q₇，k_7u)，公式表示如下：

其中layer₇(i₇+m₇，j₇+n₇，c₇)表示卷积运算进行到输入图像layer₇第c₇通道的i₇+m₇行，第j₇+n₇列，1≤i₇，j₇≤w₇–f₇+1，第七层图像layer₇做卷积运算后输出的特征图尺寸由第七层图像尺寸w₇、卷积核大小f₇及扫描步长s₇和填充p₇决定，计算公式为：代入上述数据计算可得，/>则第七层与卷积核k_7u做卷积操作后的输出特征图尺寸为31像素*31像素；分别利用t₇＝64个卷积核依次重复上述卷积过程，最终形成t₇＝64层二维特征图，神经元的个数为31*31*64个，这就是第一卷积层的全部输出结果，这里以下式代表：layer_7out(p₇,q₇,k₇)；

第七层卷积层激活函数采用LeakyReLU，其数学表达式为：

步骤9)、进入所述新型卷积神经网络第八层，第八层为卷积层C8，C8层计算过程中要用到的公式中的标号及其含义说明如下：w₈：单位为像素，表示第八层输入图像的尺寸为w₈*w₈；设置输入图像宽高比均为1:1；d₈：正整数，表示第八层输入图像的通道数，这里为第八层的输出结果的通道数，d₈＝d₇；f₈：正整数，表示第八层使用的卷积核的大小，即卷积核的长度和宽度，所有卷积核的长度等于其宽度；t₈：正整数，表示第八层使用的卷积核的个数；k_8u：三维实矩阵，表示第八层使用的第u个卷积核，即长度*宽度*图像通道数，1≤u≤t₈；k_8u(m₈，n₈)：表示卷积核k_8u内的值，可看作对图像进行卷积运算的计算权重，为d₈维实向量，m₈、n₈为正整数，表示第八层使用的卷积核内的位置，m₈是表示横坐标，n₈表示纵坐标，m₈、n₈的取值范围为1≤m₈，n₈≤f₈；k_8u(m₈，n₈，c₈)：表示卷积核k_8u内各通道的值，m₈、n₈为正整数，表示第八层使用的卷积核内的位置，m₈是表示横坐标，n₈表示纵坐标，m₈、n₈的取值范围为1≤m₈，n₈≤f₈，c₈为正整数，表示卷积核内c₈通道，1≤c₈≤d₈；k₈：代表第八层使用的全部t₈个卷积核；p₈：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d₈；s₈：正整数，第八层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔几个像素进行一次卷积运算，这个间隔数即操作步长，以像素为单位；layer₈(i₈，j₈)：表示第八层输入图像中的第i₈行，第j₈列的像素值，其是一个d₈维向量，其中1≤i₈，j₈≤w₈；layer₈(i₈，j₈，c₈)：表示第八层输入图像中的第i₈行，第j₈列，第c₈通道的像素值，1≤i₈，j₈≤w₈，1≤c₈≤d₈；layer_8out(p₈，q₈，k_8u)：表示第八层输入图像经与卷积核k_8u做卷积运算后得到的特征图的第p₈行，第q₈列的像素值，每个值可以看做一个神经元，其中1≤p₈，q₈≤w_8out；w_8out：单位为像素，表示第八层输入图像layer₈与卷积核k_8u进行卷积运算后得到的特征图layer_8out的尺寸为w_8out*w_8out；需要说明的是，由于所有卷积核尺寸都是一样的，所以t₈个卷积核做卷积运算得到的结果都是一样的；

对第八层卷积网络做卷积运算时，所需参数的值如下：w₈＝31，d₈＝64，f₈＝3，t₈＝128，s₈＝2，p₈＝0，k_8u和b₈设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第八层卷积层C8与卷积核k_8u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₈移动，将卷积核k_8u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_8out(p₈，q₈，k_8u)，公式表示如下：

/>

其中layer₈(i₈+m₈，j₈+n₈，c₈)表示卷积运算进行到输入图像layer₈第c₈通道的i₈+m₈行，第j₈+n₈列，1≤i₈，j₈≤w₈–f₈+1，第八层图像layer₈做卷积运算后输出的特征图尺寸由第八层图像尺寸w₈、卷积核大小f₈及扫描步长s₈和填充p₈决定，计算公式为：代入上述数据计算可得，/>则第八层与卷积核k_8u做卷积操作后的输出特征图尺寸为15像素*15像素；分别利用t₈＝128个卷积核依次重复上述卷积过程，最终形成t₈＝128层二维特征图，神经元的个数为15*15*128个，这就是第八卷积层的全部输出结果，这里以下式代表：layer_8out(p₈,q₈,k₈)；

第八层卷积层激活函数采用LeakyReLU，其数学表达式为：

其中，layer_8out(p₈，q₈，k₈)做为本层激活函数LeakyReLU的输入，b₈代表偏置量，layer₉(i₉，j₉，c₉)代表新型卷积神经网络第五层卷积层激活后的输出，其中i₉、j₉、c₉均为正整数，且1≤i₉，j₉≤15，1≤c₉≤128，这里c取值为50；之后，进入步骤10)；

步骤10)、进入所述新型卷积神经网络第九层为卷积层C9，C9层计算过程中要用到的公式中的标号及其含义说明如下：C9：表示第九层为卷积层；w₉：单位为像素，表示第九层输入图像的尺寸为w₉*w₉；这里我们设置输入图像宽高比均为1:1；d₉：正整数，表示第九层输入图像的通道数，这里为第八层的输出结果的通道数，d₉＝d₈；f₉：正整数，表示第九层使用的卷积核的大小，即卷积核的长度和宽度，所有卷积核的长度等于其宽度；t₉：正整数，表示第九层使用的卷积核的个数；k_9u：三维实矩阵，表示第九层使用的第u个卷积核，即长度*宽度*图像通道数，1≤u≤t₉；k_9u(m₉，n₉)：表示卷积核k_9u内的值，可看作对图像进行卷积运算的计算权重，为d₉维实向量，m₉、n₉为正整数，表示第九层使用的卷积核内的位置，m₉是表示横坐标，n₉表示纵坐标，m₉、n₉的取值范围为1≤m₉，n₉≤f₉；k_9u(m₉，n₉，c₉)：表示卷积核k_9u内各通道的值，m₉、n₉为正整数，表示第九层使用的卷积核内的位置，m₉是表示横坐标，n₉表示纵坐标，m₉、n₉的取值范围为1≤m₉，n₉≤f₉，c₉为正整数，表示卷积核内c₉通道，1≤c₉≤d₉；k₉：代表第九层使用的全部t₉个卷积核；p₉：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d₉；s₉：正整数，第九层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔一定数量像素进行一次卷积运算，这个间隔数即操作步长，以像素为单位；

layer₉(i₉，j₉)：表示第九层输入图像中的第i₉行，第j₉列的像素值，其是一个d₉维向量，其中1≤i₉，j₉≤w₉；layer₉(i₉，j₉，c₉)：表示第九层输入图像中的第i₉行，第j₉列，第c₉通道的像素值，1≤i₉，j₉≤w₉，1≤c₉≤d₉；layer_9out(p₉，q₉，k_9u)：表示第九层输入图像经与卷积核k_9u做卷积运算后得到的特征图的第p₉行，第q₉列的像素值，每个值可以看做一个神经元，其中1≤p₉，q₉≤w_9out；w_9out：单位为像素，表示第九层输入图像layer₉与卷积核k_9u进行卷积运算后得到的特征图layer_9out的尺寸为w_9out*w_9out；需要说明的是，由于所有卷积核尺寸都是一样的，所以t₉个卷积核做卷积运算得到的结果都是一样的；

对第九层卷积网络做卷积运算时，所需参数的值如下：w₉＝15，d₉＝128，f₉＝3，t₉＝256，s₉＝2，p₉＝0，k_9u和b₉设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第九层卷积层C9与卷积核k_9u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₉移动，将卷积核k_9u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_9out(p₉，q₉，k_9u)，公式表示如下：

其中layer₉(i₉+m₉，j₉+n₉，c₉)表示卷积运算进行到输入图像layer₉第c₉通道的i₉+m₉行，第j₉+n₉列，1≤i₉，j₉≤w₉–f₉+1，第九层图像layer₉做卷积运算后输出的特征图尺寸由第九层图像尺寸w₉、卷积核大小f₉及扫描步长s₉和填充p₉决定，计算公式为：代入上述数据计算可得，/>则第九层与卷积核k_9u做卷积操作后的输出特征图尺寸为15像素*15像素；分别利用t₉＝256个卷积核依次重复上述卷积过程，最终形成t₉＝256层二维特征图，神经元的个数为7*7*256个，这就是第九层卷积层的全部输出结果，这里以下式代表：layer_9out(p₉,q₉,k₉)；

第九层卷积层激活函数采用LeakyReLU，其数学表达式为：

layer_9out(p₉，q₉，k₉)做为本层激活函数LeakyReLU的输入，b₉代表偏置量；layer₁₀(i₁₀，j₁₀，c₁₀)代表新型卷积神经网络第九层卷积层激活后的输出，其中i₁₀、j₁₀、c₁₀均为正整数，且1≤i₁₀，j₁₀≤7，1≤c₁₀≤256，这里c取值为50；之后，进入步骤11)；

步骤11)、进入所述新型卷积神经网络第十层为全连接层F10，F10层计算过程中要用到的公式中的标号及其含义说明如下：

x₁₀：正整数，表示第十层的输入数据的维数；X₁₀：列向量，表示第十层的输入数据是一个包含x₁₀行的列向量，每行包含一个实数，这里的x₁₀个元素从上到下分别为layer₁₀(i₁₀，j₁₀，c₁₀)以层、行、列为顺序每次取出一个数值依次排列而成；d₁₀：正整数，表示第十层连接单元的数量；W₁₀：实矩阵，表示第十层与第九层间的连接权重所构成的二维实矩阵，此矩阵的行数为d₁₀，列数为x₁₀；B₁₀：列向量，表示第十层计算过程中需要用到的中间阈值变量，其行数为d₁₀；layer_10out：列向量，表示第十层输入图像经过运算得到的结果的d₁₀维列向量；layer_10out(k₁₀)：实数，layer_10out的第k₁₀个分量的值，1≤k₁₀≤d₁₀；

对第十层全连接层做运算时，所需参数的值如下：x₁₀＝i₁₀*j₁₀*c₁₀＝12544，d₁₀＝2¹³＝8192，W₁₀中所有值设置为(-1，1)之间的非0的随机数，B₁₀中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十层全连接层F10的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_10out，公式表示如下：layer_10out＝W₁₀X₁₀+B₁₀

第十层全连接层激活函数采用sigmoid函数，对layer_10out的第k₁₀个分量进行激活的数学表达式为：

步骤12)、进入所述新型卷积神经网络第十一层为全连接层F11，F11层计算过程中要用到的公式中的标号及其含义说明如下：x₁₁：正整数，表示第十一层的输入数据的维数，x₁₁等于第十层输出的列向量的行数；X₁₁：列向量，表示第十一层的输入数据是一个包含x₁₁行的列向量，每行包含一个实数，X₁₁等于第十层的输出结果layer₁₁；d₁₁：正整数，表示第十一层连接单元的数量；W₁₁：实矩阵，表示第十一层与第十层间的连接权重所构成的二维实矩阵，此矩阵的行数为d₁₁，列数为x₁₁；B₁₁：列向量，表示第十一层计算过程中需要用到的中间阈值变量，其行数为d₁₁；layer_11out：列向量，表示第十一层输入图像经过运算得到的结果的d₁₁维列向量；layer_11out(k₁₁)：实数，layer_11out的第k₁₁个分量的值，1≤k₁₁≤d₁₁；

对第十一层全连接层做运算时，所需参数的值如下：

x₁₁＝d₁₀＝8192，d₁₁＝4096，W₁₁中所有值设置为(-1，1)之间的非0的随机数，B₁₁中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十一层全连接层F11的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_11out，公式表示如下：layer_11out＝W₁₁X₁₁+B₁₁；

步骤13)、进入所述新型卷积神经网络第十二层为全连接层F12，F12层计算过程中要用到的公式中的标号及其含义说明如下：

x₁₂：正整数，表示第十二层的输入数据的维数，x₁₂等于第十一层输出的列向量的行数；X₁₂：列向量，表示第十二层的输入数据是一个包含x₁₂行的列向量，每行包含一个实数，X₁₂等于第十一层的输出结果layer₁₂；d₁₂：正整数，表示第十二层连接单元的数量；W₁₂：实矩阵，表示第十二层与第十一层间的连接权重所构成的二维实矩阵，此矩阵的行数为d₁₂，列数为x₁₂；B₁₂：列向量，表示第十二层计算过程中需要用到的中间阈值变量，其行数为d₁₂；layer_12out：列向量，表示第十二层输入图像经过运算得到的结果的d₁₂维列向量；layer_12out(k₁₂)：实数，layer_12out的第k₁₂个分量的值，1≤k₁₂≤d₁₂；

对第十二层全连接层做运算时，所需参数的值如下：

x₁₂＝d₁₁＝4096，d₁₂＝18，W₁₂中所有值设置为(-1，1)之间的非0的随机数，B₁₂中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十二层全连接层F12的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_12out，公式表示如下：layer_12out＝W₁₂X₁₂+B₁₂；

步骤14)、进入所述新型卷积神经网络的输出层，输出层过程中要用到的公式中的标号及其含义说明如下：e：为自然常数，其值约为2.71828；S_w：表示softmax函数的输出，也即输出层的输出；S_w(c₁₃)：表示输出层第c₁₃个神经元，为(0，1)间的概率值；layer₁₃：列向量，表示第十二层输出的d₁₂个神经元输出的对应值，同时作为本层的输入；layer₁₃(c₁₃)：正整数，表示layer₁₃中的第c₁₃个元素，其中1≤c₁₃≤d₁₂；M：表示强度参数，可预设为1；

S_wmax：表示layer₁₃中神经元对应值经softmax函数输出后，d₁₂个节点概率中最大的一个，也即最终的分类结果对应的概率值，为(0，1)间的概率值；

最后一层的输出层将d₁₂个神经元的输出映射到(0，1)区间内，用概率解释分类，使用经典softmax函数进行计算，得到第c₁₃个元素对应的概率输出，数学表达式为：

步骤16)、将待分类图像送入训练好的神经网络，过程如下；

16-1)、将待分类图像做为预测输入数据；

实验结果表明，该网络在自制垃圾数据集上进行训练测试后，得到了97.8％的准确率，具有较高的运算速度；同时，利用新型卷积神经网络进行垃圾的分类识别，模型泛化能力强，可迁移性强，革新了城市垃圾智能分类实现方法，能够自动完成垃圾分类任务，减轻人工操作，使垃圾分类做到减量化、资源化、无害化，确保垃圾分类效果。

Claims

1.一种城市垃圾分类处理智能视觉检测方法，其特征在于：包括如下步骤：

卷积层在处理过程中要用到的公式中的变量及其含义说明如下：

*：表示数乘，乘数均为实数；

v：表示当前处理的卷积层在整个网络中所处的层级，v为正整数，v≥1，当v的值确定时，指定当前的层数，所有下标包含v的变量均以v的值代入来表示此变量的名称；

Cv：表示网络第v层为卷积层；

w_v：单位为像素，表示第v层输入图像的尺寸为w_v*w_v；这里我们设置输入图像宽高比均为1:1；

d_v：正整数，表示第v层Cv输入图像的通道数，输入图像为彩色3通道，分别是R、G、B，分别代表图像某点像素中的红色、绿色、蓝色分量值，这里的R、G、B均为正整数；

f_v：正整数，表示第v层Cv使用的卷积核的大小，即卷积核的长度和宽度，中的所有卷积核的长度等于其宽度；

t_v：正整数，表示第v层Cv使用的卷积核的个数；

k_vu：三维实矩阵，表示第v层Cv使用的第u个卷积核，即

长度*宽度*图像通道数，1≤u≤t₁；

K_vu(m_v，n_v)：表示卷积核k_vu内的值，可看作对图像进行卷积运算的计算权重，为d_v维实向量，m_v、n_v为正整数，表示第v层Cv使用的卷积核内的位置，m_v表示横坐标，n_v表示纵坐标，m_v、n_v的取值范围为：1≤m_v，n_v≤f_v；

K_vu(m_v，n_v，c_v)：表示卷积核k_vu内各通道的值，m_v、n_v为正整数，表示第v层使用的卷积核内的位置，m_v是表示横坐标，n_v表示纵坐标，m_v、n_v的取值范围为1≤m_v，n_v≤f_v，c_v为正整数，表示卷积核内第c_v个通道，1≤c_v≤d_v；

b_v：代表第v层使用的全部t_v个卷积核对应的t_v个偏置量；

k_v：代表第v层使用的全部t_v个卷积核，没有数学意义，仅做符号表示；

p_v：正整数，做卷积运算之前，对将要做卷积运算的图像的上、下、左、右四边均添加0像素的行数或列数，每个0像素的通道数均为d_v，这里说的“0像素”是指一个像素的所有通道上的值均为0的像素；

s_v：正整数，第v层卷积运算操作步长，使用卷积核对将要做卷积运算的图像进行卷积运算时，无论是横向，还是纵向，均要每隔几个像素进行一次卷积运算，这个间隔数即操作步长，以像素为单位；

layer_v(i_v，j_v)：表示第v层输入图像中的第i_v行，第j_v列的像素值，其由(R，G，B)三个数来表示，其中0≤R，G，B≤255，1≤i_v，j_v≤w_v；

layer_v(i_v，j_v，c_v)：表示第v层输入图像中的第i_v行，第j_v列，第c_v通道的像素值，1≤i_v，j_v≤w_v，1≤c_v≤d_v；

layer_vout(p_v，q_v，k_vu)：表示第v层输入图像经与卷积核k_vu做卷积运算后得到的特征图的第p_v行，第q_v列的像素值，每个值可以看做一个神经元，其中1≤p_v，q_v≤w_vout；

w_vout：单位为像素，表示第v层输入图像layer_v与卷积核k_vu进行卷积运算后得到的特征图layer_vout的尺寸为w_vout*w_vout；

对第一层卷积网络做卷积运算，所需参数的值如下：

v＝1，w₁＝512，d₁＝3，f₁＝5，t₁＝6，s₁＝1，p₁＝0，k_1u和b₁设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第一卷积层C1与卷积核k_1u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₁移动，将卷积核k_1u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_1out(p₁，q₁，k_1u)，公式表示如下：

其中layer₁(i₁+m₁，j₁+n₁，c₁)表示卷积运算进行到输入图像layer₁第c₁通道的i₁+m₁行、第j₁+n₁列，1≤i₁，j₁≤w₁–f₁+1，第一层图像layer₁做卷积运算后输出的特征图尺寸由第一层图像尺寸w₁、卷积核大小f₁及扫描步长s₁和填充p₁决定，计算公式为：代入上述数据计算可得，/>则第一层与卷积核k_1u做卷积操作后的输出特征图尺寸为508像素*508像素；分别利用t₁＝6个卷积核依次重复上述卷积过程，最终形成t₁＝6层二维特征图，神经元的个数为508*508*6个，这就是第一卷积层的全部输出结果，这里以下式代表：layer_1out(p₁,q₁,k₁)

所述第一卷积层激活函数采用LeakyReLU，其数学表达式为：

max：池化过程运算符号，表示取最大值；

z：表示当前处理的池化层在整个网络中所处的层级，当z的值在一层被指定后，所有下标包含z的变量均以z的值代入来表示此变量的名称；

w_z：单位为像素，表示第z层输入图像的尺寸为w_z*w_z；

d_z：正整数，表示第z层输入图像的通道数，这里为第z层的输出结果的通道数，d_z＝t_z-1；

f_z：正整数，表示第z层使用的池化过滤器的大小，即过滤器的长度和宽度，中所有池化层过滤器的长度等于其宽度；

layer_z(i_z，j_z)：无单位，表示第z层输入图像中的第i_z行，第j_z列的像素值，其是一个d_z维向量，其中1≤i_z，j_z≤w_z；

layer_z(i_z，j_z，c_z)：无单位，表示第z层输入图像中的第i_z行，第j_z列，第c_z通道的像素值，1≤i_z，j_z≤w_z，1≤c_z≤d_z；

layer_zout(p_z，q_z，d_z)：无单位，表示第z层输出图像中的第p_z行，第q_z列，第d_z通道位置处的值，1≤p_z，q_z≤(w_z/f_z)；

对第z层池化层做运算时，操作步骤如下：

把池化层的输入图像的一个通道内的w_z*w_z个像素划分为(w_z/f_z)行，(w_z/f_z)列个f_z*f_z的小块，对每个小块中的数，取最大数做为输出结果，然后遍历完每行上的小块和每列上的小块，依小块原有的次序放在相应的位置，最终构成一个(w_z/f_z)*(w_z/f_z)的矩阵，所有下标包含z的变量均以z的值代入来表示此变量的名称；

对第二层池化层做运算时，所需参数的值如下：z＝2，w₂＝508，d₂＝6，f₂＝2，池化层使用的池化操作为最大池化，对输入数据的d₂通道的第i₂行，j₂列位置的池化计算公式如下：

步骤4)、进入所述新型卷积神经网络第三层为卷积层C3,对第三层卷积网络做卷积运算时，所需参数的值如下：

v＝3，w₃＝254，d₃＝6，f₃＝3，t₃＝16，s₃＝1，p₃＝0，k_3u和b₃设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第三层卷积层C3与卷积核k_3u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₃移动，将卷积核k_3u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_3out(p₃，q₃，k_3u)，公式表示如下：

其中layer₃(i₃+m₃，j₃+n₃，c₃)表示卷积运算进行到输入图像layer₃第c₃通道的i₃+m₃行，第j₃+n₃列，1≤i₃，j₃≤w₃–f₃+1，第三层图像layer₃做卷积运算后输出的特征图尺寸由第一层图像尺寸w₃、卷积核大小f₃及扫描步长s₃和填充p₃决定，计算公式为：代入上述数据计算可得，/>则第三层与卷积核k_3u做卷积操作后的输出特征图尺寸为252像素*252像素；分别利用t₃＝16个卷积核依次重复上述卷积过程，最终形成t₃＝16层二维特征图，神经元的个数为252*252*16个，这就是第三层卷积层的全部输出结果，这里以下式代表：layer_3out(p₃,q₃,k₃)

第三层卷积层激活函数采用LeakyReLU，其数学表达式为：

步骤5)、进入所述新型卷积神经网络第四层为池化层，对第四层池化层做运算时，所需参数的值如下：z＝4，w₄＝252，d₄＝16，f₄＝2，对输入数据的d₄通道的第i₄行，j₄列位置的池化计算公式如下：

步骤6)、进入所述新型卷积神经网络第五层，第五层为卷积层C5，对第五层卷积网络做卷积运算时，所需参数的值如下：w₅＝126，d₅＝16，f₅＝3，t₅＝32，s₅＝1，p₅＝0，k_5u和b₅设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第五层卷积层C5与卷积核k_5u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₅移动，将卷积核k_5u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_5out(p₅，q₅，k_5u)，公式表示如下：

其中layer₅(i₅+m₅，j₅+n₅，c₅)表示卷积运算进行到输入图像layer₅第c₅通道的i₅+m₅行，第j₅+n₅列，1≤i₅，j₅≤w₅–f₅+1，第五层图像layer₅做卷积运算后输出的特征图尺寸由第五层图像尺寸w₅、卷积核大小f₅及扫描步长s₅和填充p₅决定，计算公式为：代入上述数据计算可得，/>则第五层与卷积核k_5u做卷积操作后的输出特征图尺寸为126像素*126像素；分别利用t₅＝32个卷积核依次重复上述卷积过程，最终形成t₅＝32层二维特征图，神经元的个数为126*126*32个，这就是第一卷积层的全部输出结果，这里以下式表示：layer_5out(p₅,q₅,k₅)

第五层卷积层激活函数采用LeakyReLU，其数学表达式为：

步骤7)、进入所述新型卷积神经网络第六层为池化层，对第六层池化层做运算时，所需参数的值如下：z＝6，w₆＝126，d₆＝32，f₆＝2，池化层使用的池化操作为最大池化，对输入数据的d₆通道的第i₆行，j₆列位置的池化计算公式如下：

对一个通道做完池化操作后，形成输出特征图layer_6out的1层二维池化结果，再对另外d₆-1个通道，依次重复上述池化过程，最终形成d₆层二维池化结果，这就是第六层池化层的全部输出结果，以下式表示：layer_6out(p₆,q₆,d₆)

步骤8)、进入所述新型卷积神经网络第七层，第七层为卷积层C7，对第七层卷积网络做卷积运算时，所需参数的值如下：w₇＝63，d₇＝32，f₇＝3，t₇＝64，s₇＝2，p₇＝0，k_7u和b₇设置为初始值在(-1，1)之间的随机数，对所述新型卷积神经网络的第七层卷积层C7与卷积核k_7u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₇移动，将卷积核k_7u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_7out(p₇，q₇，k_7u)，公式表示如下：

第七层卷积层激活函数采用LeakyReLU，其数学表达式为：

其中layer₈(i₈+m₈，j₈+n₈，c₈)表示卷积运算进行到输入图像layer₈第c₈通道的i₈+m₈行，第j₈+n₈列，1≤i₈，j₈≤w₈–f₈+1，第八层图像layer₈做卷积运算后输出的特征图尺寸由第八层图像尺寸w₈、卷积核大小f₈及扫描步长s₈和填充p₈决定，计算公式为：代入上述数据计算可得，/>则第八层与卷积核k_8u做卷积操作后的输出特征图尺寸为15像素*15像素；分别利用t₈＝128个卷积核依次重复上述卷积过程，最终形成t₈＝128层二维特征图，神经元的个数为15*15*128个，这就是第八卷积层的全部输出结果，这里以下式代表：layer_8out(p₈,q₈,k₈)

第八层卷积层激活函数采用LeakyReLU，其数学表达式为：

layer_8out(p₈，q₈，k₈)做为本层激活函数LeakyReLU的输入，b₈为偏置量；

layer₉(i₉，j₉，c₉)代表新型卷积神经网络第五层卷积层激活后的输出，i₉、j₉、c₉均为正整数，且1≤i₉，j₉≤15，1≤c₉≤128，c取值为50；之后进入步骤10)；

步骤10)、进入所述新型卷积神经网络第九层：卷积层C9，对第九层卷积网络做卷积运算时，所需参数的值如下：w₉＝15，d₉＝128，f₉＝3，t₉＝256，s₉＝2，p₉＝0，k_9u和b₉设置为初始值在(-1，1)之间的随机数，对第九层卷积层C9与卷积核k_9u进行卷积计算的过程为：根据输入图像从左至右，从上到下，按照指定步长s₉移动，将卷积核k_9u在每个位置上与输入图像对应位置且对应通道的像素值相乘后求和，所得结果作为输出的二维特征图，每个值可看作一个神经元layer_9out(p₉，q₉，k_9u)，公式表示如下：

其中layer₉(i₉+m₉，j₉+n₉，c₉)表示卷积运算进行到输入图像layer₉第c₉通道的i₉+m₉行，第j₉+n₉列，1≤i₉，j₉≤w₉–f₉+1，第九层图像layer₉做卷积运算后输出的特征图尺寸由第九层图像尺寸w₉、卷积核大小f₉及扫描步长s₉和填充p₉决定，计算公式为：代入上述数据计算可得，/>则第九层与卷积核k_9u做卷积操作后的输出特征图尺寸为15像素*15像素；分别利用t₉＝256个卷积核依次重复上述卷积过程，最终形成t₉＝256层二维特征图，神经元的个数为7*7*256个，这就是第九层卷积层的全部输出结果，这里以下式代表：layer_9out(p₉,q₉,k₉)

第九层卷积层激活函数采用LeakyReLU，其数学表达式为：

步骤11)、进入所述新型卷积神经网络第十层的全连接层,所有全连接层在计算过程中要用到的公式中的变量及其含义说明如下：a：表示当前处理的全连接层在整个网络中所处的层级，当a的值在一层被指定后，所有下标包含a的变量均以a的值代入来表示此变量的名称；x_a：正整数，表示第a层的输入数据的维数；X_a：列向量，表示第a层的输入数据是一个包含x_a行的列向量，每行包含一个实数，这里的x_a个元素从上到下分别为layer_a(i_a，j_a，c_a)以层、行、列为顺序每次取出一个数值依次排列而成；d_a：正整数，表示第a层连接单元的数量；W_a：实矩阵，表示第a层与第a-1层间的连接权重所构成的二维实矩阵，此矩阵的行数为d_a，列数为x_a；B_a：列向量，为第a层计算过程中需要用到的中间阈值变量，其行数为d_a；Layer_aout：列向量，为第a层输入图像经过运算得到的结果的d_a维列向量；Layer_aout(k_a)：实数，layer_aout的第k_a个分量的值，1≤k_a≤d_a；对第10层全连接层做运算时，所需参数的值如下：a＝10，x₁₀＝i₁₀*j₁₀*c₁₀＝12544，d₁₀＝2¹³＝8192，W₁₀中所有值设置为(-1，1)之间的非0的随机数，B₁₀中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十层全连接层F10的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_10out，公式表示如下：layer_10out＝W₁₀X₁₀+B₁₀；

layer_10out(k₁₀)做为本层激活函数sigmoid函数的一个分量的输入，layer₁₁(c₁₁)代表新型卷积神经网络第十层全连接层激活后的一个分量的输出，其中c₁₁均为正整数，且1≤c₁₁＝k₁₀≤d₁₀；第十层全连接层的全部输出以layer₁₁表示，layer₁₁为d₁₀维的一个列向量；之后，进入步骤12)；

步骤12)、进入所述新型卷积神经网络第十一层为全连接层，对第十一层全连接层做运算时，所需参数的值如下：

a＝11，x₁₁＝d₁₀＝8192，d₁₁＝4096，W₁₁中所有值设置为(-1，1)之间的非0的随机数，B₁₁中所有分量初始设置全部为-1；对所述新型卷积神经网络的第十一层全连接层F11的计算过程为：以本层的权值矩阵与输入向量做矩阵相乘，再与阈值向量相加得到layer_11out，公式表示如下：layer_11out＝W₁₁X₁₁+B₁₁；第十一层全连接层激活函数采用sigmoid函数，对layer_11out的第k₁₁个分量进行激活的数学表达式为：

layer_12out(k₁₂)做为本层激活函数sigmoid函数的一个分量的输入，layer₁₃(c₁₃)代表新型卷积神经网络第十一层全连接层激活后的一个分量的输出，其中c₁₃均为正整数，且1≤c₁₃＝k₁₂≤d₁₂；第十一层全连接层的全部输出以layer₁₃表示，layer₁₃为d₁₂维的一个列向量，代表d₁₂个二级分类类型；之后，进入步骤14)；

步骤14)、进入所述新型卷积神经网络的输出层，输出层过程中要用到的公式中的标号及其含义说明如下：

e：为自然常数，其值约为2.71828；S_w：无单位，表示softmax函数的输出，也即输出层的输出；S_w(c₁₃)：无单位，表示输出层第c₁₃个神经元，为(0，1)间的概率值；layer₁₃：列向量，为第十二层输出的d₁₂个神经元输出的对应值，同时作为本层的输入；layer₁₃(c₁₃)：正整数，表示layer₁₃中的第c₁₃个元素，其中1≤c₁₃≤d₁₂；M：无单位，表示强度参数，预设为1；S_wmax：表示layer₁₃中神经元对应值经softmax函数输出后，d₁₂个节点概率中最大的一个，也即最终的分类结果对应的概率值，为(0，1)间的概率值；最后一层的输出层将d₁₂个神经元的输出映射到(0，1)区间内，用概率解释分类，使用经典softmax函数进行计算，得到第c₁₃个元素对应的概率输出，数学表达式为：

步骤16)、将待分类图像送入训练好的神经网络，过程如下；

16-1)、将待分类图像做为预测输入数据；