CN115661511A

CN115661511A - 通道全局排序指导剪枝和量化联合的神经网络压缩方法

Info

Publication number: CN115661511A
Application number: CN202211217914.4A
Authority: CN
Inventors: 谢卫莹; 樊潇怡; 张鑫; 李云松; 雷杰
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2022-09-30
Filing date: 2022-09-30
Publication date: 2023-01-31

Abstract

本发明公开了一种通道全局排序指导剪枝和量化联合的神经网络压缩方法，包括下述步骤：获取训练样本集和测试样本集；构建图像分类卷积神经网络模型；对图像分类卷积神经网络模型进行迭代训练；计算训练好的图像分类卷积神经网络模型中所有通道的重要性得分并获取剪枝量化后的图像分类卷积神经网络模型；更新剪枝量化后的图像分类卷积神经网络模型；获取图像分类卷积神经网络的压缩结果。本发明在通道重要性的全局排序指导下对图像分类卷积神经网络模型联合进行剪枝和量化，解决了现有技术中存在的仅在同一层内比较通道重要性且剪枝和量化互不相关导致在指定压缩比下压缩后网络相比于未压缩网络的分类准确性的下降值大的问题。

Description

通道全局排序指导剪枝和量化联合的神经网络压缩方法

技术领域

本发明属于深度学习领域，涉及一种卷积神经网络压缩方法，具体涉及一种通道全局排序指导剪枝和量化联合的神经网络压缩方法，可用于在计算、存储资源受限的边缘设备上部署图像分类卷积神经网络并完成图像分类任务。

背景技术

卷积神经网络目前已经在视频、图像和语音等信息的处理过程中取得了巨大的成功，这得益于它越来越深和越来越宽的模型架构，但由此也产生了网络推理过程的计算复杂度高和内存空间占用大的问题，使得在计算、存储资源受限的边缘设备上部署卷积神经网络受到限制，尤其是对于移动平台、智能化嵌入式设备、现场可编程逻辑门阵列等需要实时推理完成信息处理的硬件，进而导致卷积神经网络在许多场景，如森林火灾救援、人脸识别等中的应用受到阻碍。

因此，既能降低计算复杂度、减少内存占用空间，又能保持卷积神经网络性能的卷积神经网络压缩方法被提出，具体包括剪枝、量化、低秩分解、知识蒸馏等，这些方法可以单独使用，也可以联合使用。其中，剪枝和量化的应用更为广泛。剪枝是删除卷积神经网络中卷积层的部分通道；量化是将权值参数或激活层输出值的浮点数形式转换为比特位表示的整数形式，并且是硬件部署前必不可少的操作。衡量图像分类卷积神经网络压缩方法的标准是在指定压缩比下压缩后网络相比于未压缩网络的分类准确性的下降值大小，下降值越小，则压缩后网络的性能越好。

Yu Po-Hsiang等人在2020年发表的论文“Joint Pruning&Quantization forExtremely Sparse Neural Networks”(arXiv preprint arXiv:2010.01892)中，公开了一种剪枝和量化联合的图像分类卷积神经网络模型压缩方法，该方法首先提出一个泰勒评分来评价二维卷积层的所有通道在同一层内的通道重要性，然后根据每个二维卷积层的每个通道的泰勒评分，对泰勒评分低于预设阈值的通道进行删除，在完成剪枝后，手动指定权重和激活层的量化位宽，通过微调得到压缩后的图像分类卷积神经网络模型压缩方法。但是，该方法仍然存在的不足之处是，二维卷积层的通道重要性的比较范围只是在同一层内，而且剪枝和量化本质上是互不相关的，并不能确保最大化各自的优势，因此导致在指定压缩比下压缩后网络相比于未压缩网络的分类准确性的下降值大。

发明内容

本发明的目的在于针对上述现有技术的不足，提出一种通道全局排序指导剪枝和量化联合的神经网络压缩方法，用于解决现有技术中存在的仅在同一二维卷积层内比较通道重要性且剪枝和量化本质上互不相关导致在指定压缩比下压缩后网络相比于未压缩网络的分类准确性的下降值大的问题。

为实现上述目的，本发明采取的技术方案包括如下步骤：

(1)获取训练样本集和测试样本集：

获取包括M个目标类别且每个类别包含N幅RGB图像的数据集X，并对每幅RGB图像中的图像类别进行标注，然后随机选取数据集X中每类别包含的N₀幅图像，并将所选取的共MN₀幅RGB图像及其标签组成训练样本集X_train，将剩余的M(N-N₀)幅RGB图像及其标签组成测试样本集X_test，其中M≥10，N≥6000，N₀≥0.8N；

(2)构建图像分类卷积神经网络模型O并对其进行迭代训练：

构建包括顺次连接的二维卷积层、批归一化层、分段线性激活层、多个残差单元模块、自适应平均池化层、全连接层和softmax激活函数层的图像分类卷积神经网络模型O；第一残差单元模块包括顺次连接的卷积模块和分段线性激活层，且卷积模块的输入与分段线性激活层跳跃连接；第二残差单元模块包括并行排布的卷积模块和平均池化层，以及与卷积模块和平均池化层的输出端连接的分段线性激活层；卷积模块包括多个二维卷积层、多个批归一化层和一个分段线性激活层；其中二维卷积层和分段线性激活层的总数均为L，L≥55，每个二维卷积层包括I个通道，I≥16；

(3)对图像分类卷积神经网络模型进行迭代训练：

(3a)初始化迭代次数为e，最大迭代次数为E，E≥600,第e次迭代图像分类卷积神经网络模型的权值参数为θ_e，并令e＝0；

(3b)将训练样本集X_train作为O的输入，对每个训练样本进行特征提取，得到MN₀个特征图，并对每幅特征图中的目标进行分类，得到每个训练样本的分类结果

(3c)采用交叉熵损失函数

并通过每个训练样本的分类结果及其对应的标签计算O的损失值

再采用随机梯度下降法，通过

对权值参数θ_e的偏导值

对θ_e进行更新，得到本次迭代的图像分类卷积神经网络模型O_e；

(3d)判断e≥E是否成立，若是，得到训练好的图像分类卷积神经网络模型

否则，令e＝e+1，O_e＝O，并执行步骤(3b)；

(4)计算训练好的图像分类卷积神经网络模型中所有通道的重要性得分并对图像分类卷积神经网络模型进行剪枝和量化：

(4a)将从训练样本集X_train中随机选取的MN₁个训练样本及其标签组成的秩生成样本集X_choose作为

的输入，并使用钩子Hook函数提取

中输入第c幅图像

时每个二维卷积层的每个通道的特征图

再对

进行奇异值分解，得到输入

时每个通道的秩

然后根据

计算每个通道的平均秩

后保存，其中，N₁≥0.01N₀，1≤l≤L，1≤i≤I；

(4b)通过每个通道的平均秩

计算该通道的重要性得分

并对训练好的图像分类卷积神经网络模型

中重要性得分最低的ρ个通道进行删除，获得剪枝率为Ω的剪枝后的图像分类卷积神经网络模型，其中，a_l、b_l分别表示

中可优化的伸缩变量、偏移变量；

(4c)通过每个二维卷积层的I个通道组成的稀疏掩模

计算该二维卷积层的稀疏性S_l＝||Ψ_l||₀，并根据S_l计算每个二维卷积层的权重量化位宽

和每个分段线性激活层量化位宽

其中，

表示通道被删除，

表示通道未删除，||·||₀表示L1范数，

表示向上取整操作，

是第l个二维卷积层的权重量化位宽上界，

是第l个分段线性激活层所需的激活量化位宽上界，p表示惩罚因子；

(4d)根据每个二维卷积层的权重量化位宽

和每个分段线性激活层量化位宽

对剪枝后的图像分类卷积神经网络模型中每个二维卷积层的权重向量W_l进行量化，同时替换每个分段线性激活层的激活函数，得到量化后权重向量为W_l ^q、分段线性激活层的激活函数为

的剪枝量化后的图像分类卷积神经网络模型

(5)对剪枝量化后的图像分类卷积神经网络模型重新进行剪枝并更新权重、激活层量化位宽：

通过遗传进化算法对

中可优化的伸缩变量a_l、偏移变量b_l进行优化，并通过a_l、b_l的优化结果a_l ^*、b_l ^*和每个通道的平均秩

重新计算每个通道的重要性得分，然后按重新计算的所有通道的重要性得分对剪枝量化后的图像分类卷积神经网络模型

重新进行剪枝并更新

的权重、激活层量化位宽，得到更新的剪枝量化后的图像分类卷积神经网络模型

(6)获取图像分类卷积神经网络的压缩结果：

对更新的剪枝量化后的图像分类卷积神经网络模型

的权值参数进行微调，获得压缩后的图像分类卷积神经网络模型

本发明与现有的技术相比具有以下优点：

本发明在对训练好的图像分类卷积神经网络模型计算所有二维卷积层的所有通道的重要性得分后对其进行全局排序，并在通道重要性的全局排序指导下对图像分类卷积神经网络模型联合进行剪枝和量化，解决了现有技术中存在的仅在同一二维卷积层内比较通道重要性且剪枝和量化本质上互不相关导致在指定压缩比下压缩后网络相比于未压缩网络的分类准确性的下降值大的问题。

附图说明

图1是本发明的实现流程图；

图2是本发明残差单元模块的结构图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的详细描述。

参照附图1，本发明包括如下步骤。

步骤1)获取训练样本集和测试样本集：

获取包括M个目标类别且每个类别包含N幅RGB图像的数据集X，并对每幅RGB图像中的图像类别进行标注，然后随机选取数据集X中每类别包含的N₀幅图像，并将所选取的共MN₀幅RGB图像及其标签组成训练样本集X_train，将剩余的M(N-N₀)幅RGB图像及其标签组成测试样本集X_test，本实例中，M＝10，N＝6000，

步骤2)构建图像分类卷积神经网络模型O：

构建包括顺次连接的二维卷积层、批归一化层、分段线性激活层、多个残差单元模块、自适应平均池化层、全连接层和softmax激活函数层的图像分类卷积神经网络模型O；第一残差单元模块包括顺次连接的卷积模块和分段线性激活层，且卷积模块的输入与分段线性激活层跳跃连接；第二残差单元模块包括并行排布的卷积模块和平均池化层，以及与卷积模块和平均池化层的输出端连接的分段线性激活层；卷积模块包括多个二维卷积层、多个批归一化层和一个分段线性激活层；其中二维卷积层和分段线性激活层的总数均为L，每个二维卷积层包括I个通道，本实例中，L＝55；

多个残差单元模块的具体排列方式为：第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第二残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第二残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块→第一残差单元模块；

其中，本实例第一残差单元模块的具体结构如图2(a)所示；

第一残差单元模块的具体结构为：卷积模块→分段线性激活层，卷积模块的输入与分段线性激活层跳跃连接；

其中，本实例第二残差单元模块的具体结构如图2(b)所示；

第二残差单元模块的具体结构为：并行排布的卷积模块和平均池化层→分段线性激活层；

卷积模块的具体结构为：二维卷积层→批归一化层→分段线性激活层→卷积层→批归一化层；

所述的O的每层参数设置为：第一卷积层的卷积核大小为3×3，通道数I＝16，步长为1；在第一个到第九个第一残差单元模块中的卷积模块中，每个二维卷积层的卷积核大小为3×3，通道数I＝16，步长为1；第十个第二残差单元模块中的卷积模块中，第一个二维卷积层的卷积核大小为3×3，通道数I＝32，步长为2，第二个二维卷积层的卷积核大小为3×3，通道数I＝32，步长为1，平均池化层的核大小为1×1，步长为2；在第十一个到第十八个第一残差单元模块中，每个二维卷积层的卷积核大小为3×3，通道数I＝32，步长为1；第十九个第二残差单元模块中的卷积模块中，第一个二维卷积层的卷积核大小为3×3，通道数I＝64，步长为2，第二个二维卷积层的卷积核大小为3×3，通道数I＝64，步长为1，平均池化层的核大小为1×1，步长为2；在第二十个到第二十七个第一残差单元模块中，每个二维卷积层的卷积核大小为3×3，通道数I＝64，步长为1；每个批归一化层的通道数与它的上一个二维卷积层通道数保持一致；全连接层的通道数为10；自适应平均池化层的核大小为1×1，步长为1；所有分段线性激活层由ReLU函数实现；最后一层激活层由softmax函数实现；

步骤3)对图像分类卷积神经网络模型进行迭代训练：

步骤3a)初始化迭代次数为e，最大迭代次数为E，本实例中，E＝600,第e次迭代图像分类卷积神经网络模型的权值参数为θ_e，并令e＝0；

步骤3b)将训练样本集X_train作为O的输入，对每个训练样本进行特征提取，得到MN₀个特征图，并对每幅特征图中的目标进行分类，得到每个训练样本的分类结果

步骤3c)采用交叉熵损失函数

再采用随机梯度下降法，通过

对权值参数θ_e的偏导值

对θ_e进行更新，得到本次迭代的图像分类卷积神经网络模型O_e，计算O的损失值

以及对θ_e进行更新，计算、更新方法分别为：

其中，MN₀是输入训练样本的数量，

表示输入第c幅图像

时网络输出的分类结果，P^c表示第c幅输入图像的标签，:＝是将公式右边的值赋值给左边的操作，γ表示学习率，本实例中，γ＝0.001；

步骤3d)判断e≥E是否成立，若是，得到训练好的图像分类卷积神经网络模型

否则，令e＝e+1，O_e＝O，并执行步骤3b)；

步骤4)计算训练好的图像分类卷积神经网络模型中所有通道的重要性得分并获取剪枝量化后的图像分类卷积神经网络模型：

步骤4a)将从训练样本集X_train中随机选取的MN₁个训练样本及其标签组成的秩生成样本集X_choose作为

的输入，本实例中，N₁＝64，并使用钩子Hook函数提取

中输入第c幅图像

时每个二维卷积层的每个通道的特征图

再对

进行奇异值分解，得到输入

时每个通道的秩

然后根据

计算每个通道的平均秩

后保存，其中，1≤l≤L，1≤i≤I，每个通道的秩

以及每个通道的平均秩

其计算公式分别为：

其中，σ_j,u_j,v_j分别表示

的左奇异向量，前j个奇异值和右奇异向量，

是输入第c幅图像

时每个通道的秩；

步骤4b)通过每个通道的平均秩

计算该通道的重要性得分

并对训练好的图像分类卷积神经网络模型

中可优化的伸缩变量、偏移变量，实例中，Ω＝30％；

步骤4c)通过每个二维卷积层的I个通道组成的稀疏掩模

和每个分段线性激活层量化位宽

其中，其中，

表示通道被删除，

表示通道未删除，||·||₀表示L1范数，

表示向上取整操作，

是第l个二维卷积层的权重量化位宽上界，

是第l个分段线性激活层所需的激活量化位宽上界，p表示惩罚因子，本实例中，

步骤4d)根据每个二维卷积层的权重量化位宽

和每个分段线性激活层量化位宽

的剪枝量化后的图像分类卷积神经网络模型

量化、替换公式分别为：

其中，W_l ^q表示第l个二维卷积层的量化后权重向量，tanh(·)表示双曲正切函数，|·|表示取绝对值操作，max(·)表示取最大值操作，round(·)表示将浮点数映射为整数的操作，y_l表示输入到第l个分段线性激活层的特征向量，

表示用于对输入的特征向量进行量化的函数，clamp(·,d₁,d₂)用于将输入数据映射到[d₁,d₂]区间；

步骤5)更新剪枝量化后的图像分类卷积神经网络模型：

通过遗传进化算法对

重新进行剪枝并更新

遗传进化算法对a_l、b_l进行优化的实现步骤为：

步骤5a)初始化a_l＝1，b_l＝0，计算

中每个二维卷积层中I个通道的平均秩的标准差std^l，将种群Pool初始化为大小为P的队列，包含P种随机产生的样本

初始化突变率为μ，随机步长为λ，梯度迭代更新步数为τ，迭代次数为k，最大迭代次数为K，最高准确性为ACC_max，P≥64，0＜μ≤1，50≤τ≤300，K≥330,并令λ＝1，k＝0，ACC_max＝0，本实例中，P＝64，μ＝0.1，τ＝200，K＝336；

步骤5b)通过从Pool中抽样的S种样本和所有通道的平均秩所计算的S组所有通道的重要性得分对

进行剪枝后进行量化，获得S个剪枝量化后的图像分类卷积神经网络模型，本实例中，S＝16；

步骤5c)按照

中的权值参数初始化S个剪枝量化后的图像分类卷积神经网络模型的权值参数，将测试样本集X_test分别输入S个剪枝量化后的图像分类卷积神经网络模型，获得图像分类准确性，将分类准确性最高的网络模型对应的样本作为当前最优的a_l′、b_l′；

步骤5d)随机抽取μ×L层二维卷积层，对抽取到的层的对应的a_l′、b_l′进行计算，得到更新后的a_l″、b_l″：

其中，

步骤5e)根据更新后的a_l″、b_l″和所有通道的平均秩所计算的每个通道的重要性得分

进行剪枝后进行量化，获得新的剪枝量化后的图像分类卷积神经网络模型，将训练样本集X_train输入新的剪枝量化后的图像分类卷积神经网络模型，使用交叉熵损失函数和随机梯度下降法将梯度迭代更新τ步，获得梯度迭代更新好的剪枝量化后的图像分类卷积神经网络模型；

步骤5f)将测试样本集X_test输入梯度迭代更新好的剪枝量化后的图像分类卷积神经网络模型，获得图像分类准确性ACC_k，如果该准确性大于ACC_max，则ACC_max＝ACC_k，并将本次更新后的a_l″、b_l″加入Pool，否则，执行步骤5g)；

步骤5g)判断k≥K是否成立，若是，得到ACC_max对应的最优的a_l ^*、b_l ^*，否则，令k＝k+1，并执行步骤5b)；

步骤6)获取图像分类卷积神经网络的压缩结果：

对更新的剪枝量化后的图像分类卷积神经网络模型

微调过程为：

步骤6a)初始化迭代次数为t，最大迭代次数为T，T≥1200,第t次迭代剪枝量化后图像分类卷积神经网络模型

的权值参数为

并令t＝0，对

关闭权重量化操作，对所有分段线性激活层用ReLU函数替换

函数；

步骤6b)将训练样本集X_train作为

的输入，对

进行更新，得到本次迭代的图像分类卷积神经网络模型

步骤6c)判断

是否成立，若是，对

中所有分段线性激活层使用

函数并执行步骤6d)，否则，令t＝t+1，

并执行步骤6b)；

步骤6d)判断

是否成立，若是，对

恢复权重量化操作并执行步骤6e)，否则，令t＝t+1，

并执行步骤6b)；

步骤6e)判断t≥T是否成立，若是，获得压缩后的图像分类卷积神经网络模型

否则，令t＝t+1，

并执行步骤6b)；

下面结合仿真实验对本发明的技术效果做进一步的说明：

1.实验条件：

仿真实验的硬件平台为：NVIDIA 2080Ti GPU，软件平台为：操作系统为Linux，Python版本为3.7，Pytorch版本为1.7.1。

仿真实验采用CIFAR-10图像分类数据集，图片数据类型为RGB，每幅图片的大小为32像素×32像素，该数据集包含10种不同类别的带标签的图片，每个类别包含6000副图片；参考官方提供的数据集划分方式，从数据集包含的每个类别中随机选择5000幅图片及其标签作为训练样本集，其余每个类别中的1000幅图片及其标签作为测试样本集。

2.仿真内容与结果分析：

对本发明和现有的受层内通道评分指导的剪枝和量化联合的方法的分类准确性、压缩倍数分别进行对比仿真，其结果如表1所示。

现有的剪枝和量化联合的神经网络模型压缩方法是指：YuPo-Hsiang等人在其发表的论文“Joint Pruning&Quantization for Extremely Sparse Neural Networks”(arXiv preprint arXiv:2010.01892)中，提出的剪枝和量化联合的图像分类卷积神经网络模型压缩方法。

为了评价本发明的效果，利用下述的评价指标公式，分别计算本发明仿真实验中三种方法的分类准确性ACC、分类准确性ACC下降值↓ΔACC、压缩倍数Comp：

↓ΔACC＝ACC_{未压缩网络}-ACC_{压缩后网络}

比特运算操作次数BOPs的计算方法为：

其中，Ω_l-1表示第l-1层二维卷积层的剪枝率，Ω_l表示第l层二维卷积层的剪枝率，F_w,l·F_h,l分别是第l层二维卷积层所有通道的特征图的大小，δ_w,l·δ_h,l分别是第l层二维卷积层对应的卷积核的大小。

表1.本发明仿真的ACC_{未压缩网络}、ACC_{压缩后网络}、↓ΔACC、Comp对比表

方法	ACC<sub>未压缩网络</sub>	ACC<sub>压缩后网络</sub>	↓ΔACC	Comp
					现有技术	94.03％	93.28％	0.75％	54.01倍
本发明	94.03％	93.93％	0.10％	54.96倍

综合表1可以看出，本发明与现有技术相比，在略高于现有技术的压缩倍数下，↓ΔACC为0.10％，而现有技术的↓ΔACC为0.75％，证明了本方法压缩后的图像分类卷积神经网络模型相比于未压缩的网络模型有较小的分类准确性下降值。

以上仿真实验表明：本发明在通道重要性的全局排序指导下对图像分类卷积神经网络模型联合进行剪枝和量化，解决了现有技术中存在的仅在同一二维卷积层内比较通道重要性且剪枝和量化互不相关导致在指定压缩比下压缩后网络相比于未压缩网络的分类准确性的下降值大的问题。

Claims

1.一种通道全局排序指导剪枝和量化联合的卷积神经网络压缩方法，其特征在于，包括如下步骤：

(1)获取训练样本集和测试样本集：

(2)构建图像分类卷积神经网络模型O并对其进行迭代训练：

(3)对图像分类卷积神经网络模型进行迭代训练：

(3c)采用交叉熵损失函数

再采用随机梯度下降法，通过

对权值参数θ_e的偏导值

否则，令e＝e+1，O_e＝O，并执行步骤(3b)；

的输入，并使用钩子Hook函数提取

中输入第c幅图像

时每个二维卷积层的每个通道的特征图

再对

进行奇异值分解，得到输入

时每个通道的秩

然后根据

计算每个通道的平均秩

后保存，其中，N₁≥0.01N₀，1≤l≤L，1≤i≤I；

(4b)通过每个通道的平均秩

计算该通道的重要性得分

并对训练好的图像分类卷积神经网络模型

中可优化的伸缩变量、偏移变量；

(4c)通过每个二维卷积层的I个通道组成的稀疏掩模

和每个分段线性激活层量化位宽

其中，

表示通道被删除，

表示通道未删除，||·||₀表示L1范数，

表示向上取整操作，

是第l个二维卷积层的权重量化位宽上界，

(4d)根据每个二维卷积层的权重量化位宽

和每个分段线性激活层量化位宽

对剪枝后的图像分类卷积神经网络模型中每个二维卷积层的权重向量W_l进行量化，同时替换每个分段线性激活层的激活函数，得到量化后权重向量为

分段线性激活层的激活函数为

的剪枝量化后的图像分类卷积神经网络模型

通过遗传进化算法对

重新进行剪枝并更新

(6)获取图像分类卷积神经网络的压缩结果：

对更新的剪枝量化后的图像分类卷积神经网络模型

2.根据权利要求1所述的一种通道全局排序指导剪枝和量化联合的卷积神经网络压缩方法，其特征在于，步骤(2)中所述的图像分类卷积神经网络模型O，其所包含的第一残差单元模块、第二残差单元模块的个数分别为25、2；卷积模块所包含的二维卷积层和批归一化层的个数均为2；其中：

所述的O的每层参数设置为：第一卷积层的卷积核大小为3×3，通道数为16，步长为1；在第一个到第九个第一残差单元模块中的卷积模块中，每个二维卷积层的卷积核大小为3×3，通道数为16，步长为1；第十个第二残差单元模块中的卷积模块中，第一个二维卷积层的卷积核大小为3×3，通道数为32，步长为2，第二个二维卷积层的卷积核大小为3×3，通道数为32，步长为1，平均池化层的核大小为1×1，步长为2；在第十一个到第十八个第一残差单元模块中，每个二维卷积层的卷积核大小为3×3，通道数为32，步长为1；第十九个第二残差单元模块中的卷积模块中，第一个二维卷积层的卷积核大小为3×3，通道数为64，步长为2，第二个二维卷积层的卷积核大小为3×3，通道数为64，步长为1，平均池化层的核大小为1×1，步长为2；在第二十个到第二十七个第一残差单元模块中，每个二维卷积层的卷积核大小为3×3，通道数为64，步长为1；每个批归一化层的通道数与它的上一个二维卷积层通道数保持一致；全连接层的通道数为10；自适应平均池化层的核大小为1×1，步长为1；所有分段线性激活层由ReLU函数实现；最后一层激活层由softmax函数实现。

3.根据权利要求1所述的一种通道全局排序指导剪枝和量化联合的卷积神经网络压缩方法，其特征在于，步骤(3c)中所述的计算O的损失值