CN110728361A - 一种基于强化学习的深度神经网络压缩方法 - Google Patents

一种基于强化学习的深度神经网络压缩方法 Download PDF

Info

Publication number
CN110728361A
CN110728361A CN201910978856.9A CN201910978856A CN110728361A CN 110728361 A CN110728361 A CN 110728361A CN 201910978856 A CN201910978856 A CN 201910978856A CN 110728361 A CN110728361 A CN 110728361A
Authority
CN
China
Prior art keywords
model
network
reinforcement learning
layer
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910978856.9A
Other languages
English (en)
Other versions
CN110728361B (zh
Inventor
胡章一
彭凝多
唐博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Homwee Technology Co ltd
Original Assignee
Homwee Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Homwee Technology Co ltd filed Critical Homwee Technology Co ltd
Priority to CN201910978856.9A priority Critical patent/CN110728361B/zh
Publication of CN110728361A publication Critical patent/CN110728361A/zh
Application granted granted Critical
Publication of CN110728361B publication Critical patent/CN110728361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于强化学习的深度神经网络压缩方法,步骤S100:基于已训练完成的卷积神经网络,训练强化学习智能体,所述强化学习智能体用于识别网络稀疏性,采用压缩方法对模型进行压缩;步骤S200:对压缩后的模型再次训练,对模型的参数进行优化,得到最终压缩模型。本发明将庞大而复杂的深度神经网络模型压缩,使压缩后的模型能够在智能家居设备等硬件资源有限的平台上运行,相较于原模型,压缩后的模型不仅存储空间和运算量需求大幅减少,同时模型性能仍保持在原有水平,有助于实现图像识别技术在日常生活中的广泛应用,对提高生活的便利性和安全性。

Description

一种基于强化学习的深度神经网络压缩方法
技术领域
本发明涉及图像识别技术领域,具体的说,是一种基于强化学习的深度神经网络压缩方法。
背景技术
在图像识别以及人脸识别领域,利用深度学习技术和卷积神经网络能够达到非常好的识别效果,其识别准确率远高于传统的图像识别方法。在训练过程中,卷积神经网络接收大量的训练图像样本,利用卷积层逐层提取图像中的特征,并通过方向传播算法对网络中的参数进行调整,从而达到最小化输出误差的目的。由于其极高的准确率,深度卷积神经网络逐渐成为了图像识别领域的主流方法。然而,基于深度学习的图像识别方法也存在一些不足之处。首先,针对图像的多层卷积计算在运算过程中带来了很高的计算量。同时,在一个深度神经网络中包含及大量的参数(神经元间的权重、偏移量以及卷积层的参数等,在复杂网络中其总数量可达百万)。因此,常规深度学习模型对设备的计算能力和存储空间具有较高的要求,而目前的智能家居设备往往不能满足深度学习所需的硬件条件,不能直接运行体积巨大但性能很好的深度神经网络模型的问题,以及存在人工对模型进行压缩过程中耗时、且不够灵活的问题。
发明内容
本发明的目的在于提供一种基于强化学习的深度神经网络压缩方法,用于解决硬件资源受限的智能家居设备上不能直接运行体积巨大但性能很好的深度神经网络模型的问题,还解决了人工对模型进行压缩过程中耗时、且不够灵活的问题。
本发明通过下述技术方案解决上述问题:
一种基于强化学习的深度神经网络压缩方法,包括:
步骤S100:基于已训练完成的卷积神经网络,训练强化学习智能体,所述强化学习智能体用于识别网络稀疏性,采用压缩方法对模型进行压缩;
步骤S200:对压缩后的模型再次训练,对模型的参数进行优化,得到最终压缩模型。
本方法涉及输入模块,用于读取已训练好的卷积神经网络模型,包括网络结构、变量取值、变量索引等信息,作为下一模块的数据来源;
强化学习模块,基于已经训练好的卷积神经网络模型,训练出一个能够识别出网络稀疏性的强化学习智能体;
压缩模块,借助强化学习智能体对卷积神经网络模型各层的稀疏性进行判断,并结合多种模型压缩方法从不同角度对模型进行压缩;
输出模块,对经过压缩后得到的模型再次训练,从而对模型的参数进一步的调整,提高压缩后的模型的准确率,降低模型压缩对性能的影响。
将输出模块最终输出的模型应用于智能家居中的图像识别领域场景,在硬件条件受限的情况下最小化输出误差,保持原有模型的性能。
进一步地,所述步骤S100训练强化学习智能体的步骤为:
步骤S110:载入已训练好的卷积神经网络模型及其网络结构和参数;
步骤S120:初始化训练参数:设置网络总层数L、整个模型的目标压缩比例C0、强化学习智能体的行为即对l层的压缩比例,记为Cl,其中l为强化学习智能体当前所在层;
步骤S130:强化学习智能体从第l层开始前向通过网络各层,设置初始值l=1,设置对第一层的压缩比例C1=C0
步骤S140:对l层压缩时,先计算该层中每个神经元的输入权值的平均值,将输入权值的平均值从小到大排序,然后根据该层的压缩比例Cl从平均值最小的神经元开始删去神经元;
步骤S150:对卷积核进行低秩分解以及模型参数的低位量化;
步骤S160:重复步骤S140-步骤S150,重复次数达到设定次数Y后结束,根据当前智能体所在的层数l和当前网络总体压缩比例
Figure BDA0002234538200000031
选择合适的下一层的压缩比例Cl+1
步骤S170:判断:若l<L,l=l+1,返回步骤S140;否则,进入下一步;
步骤S180:整个网络被压缩完一次后,计算该次压缩操作的输出总损失值Loss并记录;
步骤S190:利用最优策略对原网络模型进行压缩判断压缩后的模型的体积是否满足要求;若不满足,将压缩后的模型作为新的“待压缩模型”再次进行压缩;若满足,进入步骤S200。
训练强化学习智能体在模型压缩过程中自行判断各层网络稀疏性,并预测出接下来所需执行的行动。进一步提高模型压缩方法的自动化程度在模型压缩方法方面,本发明针对网络中不同方面的冗余,分别结合网络剪枝、低秩分解以及参数量化等多种技术,使网络模型能够被更大程度地压缩,实现在硬件资源受限的设备上运行的可能。
本发明与现有技术相比,具有以下优点及有益效果:
(1)本发明将庞大而复杂的深度神经网络模型压缩,使压缩后的模型能够在智能家居设备等硬件资源有限的平台上运行,相较于原模型,压缩后的模型不仅存储空间和运算量需求大幅减少,同时模型性能仍保持在原有水平,有助于实现图像识别技术在日常生活中的广泛应用,对提高生活的便利性和安全性。
(2)本发明结合强化学习的模型压缩方法,训练强化学习智能体在模型压缩过程中自行判断各层网络稀疏性,并预测出接下来所需执行的行动,进一步提高模型压缩方法的自动化程度和灵活性,代替人工对网络稀疏性进行判断。
(3)本发明提出一种复合的模型压缩技术,针对网络中不同方面的冗余,分别结合网络剪枝、低秩分解以及参数量化等多种技术,从多角度分别对模型的计算量和占用存储空间进行压缩,相较于采用单一的压缩技术能在保证模型准确度的情况下提高模型压缩比例,从而使压缩后的模型能在资源受限的设备上运行。
具体实施方式
首先,在对本申请的具体实施方式进行介绍之前,首先对现有技术中常用的模型压缩方法进行说明:
常用的模型压缩方法可归类为网络修剪、低秩分解、迁移/压缩卷积滤波器、知识蒸馏和网络量化等几大类,其中,
网络修剪的主要思想为:在一个已经训练好的模型中,根据一定标准判断各个神经元的重要程度,在模型压缩过程中可以将重要性相对较低的神经元从网络中移除,从而得到一个更少神经元的网络,最后再对精简后的网络进行进一步训练,调整余下的参数。
低秩分解或低秩近似将权值矩阵分解为多个秩更小的矩阵,即把一个方形矩阵用为两个向量的乘积来近似表示,从而实现减少参数数量的目的。
迁移卷积滤波器利用一组基础卷积滤波器构建出网络所需的各个卷积滤波器,因此只需要在系统中保存少量的基本滤波器,模型中所需的卷积滤波器都可以通过基本滤波器的线性组合来近似表示。
知识蒸馏参考了迁移学习的思路,在训练结构更加简单的小型网络的过程中,将已训练好的复杂网络的输出作为监督信号,从而实现对小型网络训练过程的“指导”。
网络量化主要用于压缩各个权值的表示长度,例如二值量化将浮点数权值均用简单的两个定值(如仅用0和1)来表示,大大减少了存储权值所需的空间。
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例1:
一种基于强化学习的深度神经网络压缩方法,包括:
步骤S100:基于已训练完成的卷积神经网络,训练强化学习智能体,所述强化学习智能体用于识别网络稀疏性,采用压缩方法对模型进行压缩;
步骤S200:对压缩后的模型再次训练,对模型的参数进行优化,得到最终压缩模型。
本方法涉及输入模块,用于读取已训练好的卷积神经网络模型,包括网络结构、变量取值、变量索引等信息,作为下一模块的数据来源;
强化学习模块,基于已经训练好的卷积神经网络模型,训练出一个能够识别出网络稀疏性的强化学习智能体;
压缩模块,借助强化学习智能体对卷积神经网络模型各层的稀疏性进行判断,并结合多种模型压缩方法从不同角度对模型进行压缩;
输出模块,对经过压缩后得到的模型再次训练,从而对模型的参数进一步的调整,提高压缩后的模型的准确率,降低模型压缩对性能的影响。
由于不同压缩方法针对的压缩内容并不完全相同,因此可以结合多种方法,以达到互补的作用,提高模型的压缩比例,同时尽量降低模型准确度的损失。
强化学习是机器学习的一个分支,可看作是一种在探索过程中学习的方法。在强化学习中,学习的主体是强化学习智能体,并且设计者并不会给智能体提供监督信号。相反,智能体在每一个时刻预测出自己接下来的行为,在与环境的交互中得到对应每个行为的奖励信号。通过不同奖励信号的高低,智能体逐渐能够改变自己的行为预测规则,从而使一系列行为所积累的奖励最大,从而自行探索出目标问题的最优解。
进一步地,所述步骤S100训练强化学习智能体的步骤为:
本发明采用的强化学习方法中,强化学习智能体的状态空间(state space)为
Figure BDA0002234538200000061
智能体的行为即对第l层的压缩比例,记为Cl,表示将当前层l的神经元个数压缩至原来的Cl
行为对应的奖励(reward)为损失函数的相反数,即R=-Loss。
其中:l表示智能体当前所在的网络层数,l=1,...,L;
cl的取值为0到1之间的N等分点(不包括0),例如:根据网络以及训练设备硬件条件选择N=20时,强化学习智能体的行为Cl∈{0.05,0.10,0.15,...,0.90,0.95,1};
表示智能体完成对第l层的压缩后整个网络的总体压缩比例,即经过该层压缩后所有神经元个数与原网络神经元总个数之间的比例,
构建损失函数时,基于目标压缩比例、模型输出准确度、网络参数数量、网络计算量等变量进行设计,使得最终得到的智能体在工作过程中能够兼顾压缩体积与保持准确度。
构建损失函数举例:假设整个模型的目标压缩比例为C0,结合强化学习的状态变量,可构建出一个如公式(1)所示的损失函数:
Loss=α1·(Cf-C0)+α2·V+α3·(Nf-N0)+α4·(Mf-M0) (1)
其中,V表示网络输出结果对应的损失指标,Cf表示模型被压缩完毕后的总体压缩比例,Nf表示压缩后的模型剩余的参数总量,N0表示原模型的参数总量,Mf表示压缩后的模型运行一次的总计算量,M0表示原模型运行一次的总计算量;各个部分的权重系数αi,i=1,2,3,4;αi可根据实际情况进行取值,以保证各项在训练过程中的损失贡献相当。
训练过程中,模型的输入为图像。由于待压缩的模型是已经训练好的模型,并且不同图像处理网络的输入在图像大小、图像张数等方面有不同要求,因此,在训练强化学习智能体的过程中,模型输入数据与原网络要求的输入保持一致即可。
针对不同的模型输出,可构建出不同的网络输出损失指标V。例如,对于一个人脸身份识别网络,其输入为一张人脸照片,输出为该照片是设备主人的概率p∈[0,1],p越大则表示网络认为此照片是主人的概率越大(假设p>0.8则认定输入图像为设备主人)。在这种情况下,V可以按照表1的方式定义,各项的定义值仅做参考,可以根据实际系统更改。表1如下表:
Figure BDA0002234538200000071
表1网络输出损失指标的定义示例
在另一个网络模型中,网络输入可能是3张人脸照片,其中2张来自同一人,第3张来自另一个人。经过训练的网络的输出为2个正标签P1,P2以及1个负标签N1。在训练强化学习智能体的过程中,当网络输出正确对3张图片进行分类时,可将损失指标V设为0。当网络输出出现标记错误时,可将损失指标V设为10或更大的数值,用以惩罚强化学习智能体。
训练强化学习智能体的完整流程如下:
1.入已训练好的复杂模型,包括其网络结构与参数;
2.初始化训练参数,如:设置起始网络层数l=1,该层的目标压缩比例Cl=C0,即将第l层的神经元个数压缩至原来的Cl,即强化学习智能体的行为为Cl
3.强化学习智能体从第1层开始前向通过网络各层(即从第1层到第层)。自行为每层选取压缩比例Cl
4.智能体对某一层进行压缩时,先计算该层中每个神经元的输入权值的平均值并将权值平均值从小到大排序,根据该层的压缩比例从平均值最小的神经元开始删去相应数目的神经元;
5.整个网络被压缩完一次后,计算该次压缩操作的输出总损失值Loss并记录;
6.重复操作②-④步骤Y次(Y根据实际时间以及训练设备条件选取),Y次结束后学习出使奖励R最大的策略(policy),即根据当前智能体所在的层数l和当前网络总体压缩比例选择合适的下一层的压缩比例Cl+1
7.利用最优策略对原网络模型进行压缩判断压缩后的模型的体积是否满足要求;若不满足,可考虑将压缩后的模型作为新的“待压缩模型”再次进行压缩;
8.通过强化学习确定了新的模型结构之后,针对新的模型再次训练网络,调整好模型参数以便于接下来的其他模型压缩方法对模型进行进一步的压缩。
初次训练强化学习智能体的过程可能会比较花费时间。训练好一个针对模型压缩的智能体后,再对类似结构的深度神经网络模型进行压缩时可考虑直接使用该智能体进行压缩,若不能满足压缩条件再对智能体进行进一步的训练。
本发明所提出的模型压缩方法,除了利用强化学习智能体直接删去一定数目的神经元外,还包括对卷积核的低秩分解以及对模型参数的低位量化,其中低秩分解主要用于减少模型参数数目,而低位量化主要用于降低参数的存储空间。由于本发明所涉及的深度神经网络主要用于图像处理,因此在网络中会用到两层或更多卷积层。卷积核多为长宽均是奇数的正方形矩阵,如3×3矩阵、5×5矩阵等。为了进一步减少模型的参数量,可以将卷积核方阵用两个向量的乘积来近似表示。例如,对于一个卷积核
Figure BDA0002234538200000091
将其近似表示为
Figure BDA0002234538200000092
其中
Figure BDA0002234538200000093
经过该近似操作后,表示一个卷积核所需的参数量由9个降至6个,对于更大的卷积核其参数压缩效果更加明显。由于大部分卷积核方阵都是满秩,用两个向量的乘积得到的方阵各行或各列之间线性不独立,即近似得到的方阵的秩更低。因此,采用低秩分解或低秩近似的方法与原卷积核相比必然会损失一定的性能,可以通过压缩完成后对网络参数再次进行微调来减少性能的损失。
完成对卷积核的低秩分解后,可以进一步对网络中的所有参数进行低位量化。在深度神经网络中,除了卷积层之外,全连接层中也包含了大量的权重和偏移量参数,网络参数总数可达几万甚至上百万。为了节省参数所占用的存储空间,可以用8bit整数来近似表示各参数,根据实际需求甚至可以采用更低位数的表示方法(如二值量化)。低位量化的近似方法可以在保持模型参数量的情况下降低模型所需的存储空间,使得模型的整体体积减小。
尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims (2)

1.一种基于强化学习的深度神经网络压缩方法,其特征在于,包括:
步骤S100:基于已训练完成的卷积神经网络,训练强化学习智能体,所述强化学习智能体用于识别网络稀疏性,采用压缩方法对模型进行压缩;
步骤S200:对压缩后的模型再次训练,对模型的参数进行优化,得到最终压缩模型。
2.根据权利要求1所述的一种基于强化学习的深度神经网络压缩方法,其特征在于,所述步骤S100训练强化学习智能体的步骤为:
步骤S110:载入已训练好的卷积神经网络模型及其网络结构和参数;
步骤S120:初始化训练参数:设置网络总层数L、整个模型的目标压缩比例C0、强化学习智能体的行为即对l层的压缩比例,记为Cl,其中l为强化学习智能体当前所在层;
步骤S130:强化学习智能体从第l层开始前向通过网络各层,设置初始值l=1,设置对第一层的压缩比例C1=C0
步骤S140:对l层压缩时,先计算该层中每个神经元的输入权值的平均值,将输入权值的平均值从小到大排序,然后根据该层的压缩比例Cl从平均值最小的神经元开始删去神经元;
步骤S150:对卷积核进行低秩分解以及模型参数的低位量化;
步骤S160:重复步骤S140-步骤S150,重复次数达到设定次数Y后结束,根据当前智能体所在的层数l和当前网络总体压缩比例选择合适的下一层的压缩比例Cl+1
步骤S170:判断:若l<L,l=l+1,返回步骤S140;否则,进入下一步;
步骤S180:整个网络被压缩完一次后,计算该次压缩操作的输出总损失值Loss并记录;
步骤S190:利用最优策略对原网络模型进行压缩判断压缩后的模型的体积是否满足要求;若不满足,将压缩后的模型作为新的“待压缩模型”再次进行压缩;若满足,进入步骤S200。
CN201910978856.9A 2019-10-15 2019-10-15 一种基于强化学习的深度神经网络压缩方法 Active CN110728361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910978856.9A CN110728361B (zh) 2019-10-15 2019-10-15 一种基于强化学习的深度神经网络压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910978856.9A CN110728361B (zh) 2019-10-15 2019-10-15 一种基于强化学习的深度神经网络压缩方法

Publications (2)

Publication Number Publication Date
CN110728361A true CN110728361A (zh) 2020-01-24
CN110728361B CN110728361B (zh) 2022-05-13

Family

ID=69221264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910978856.9A Active CN110728361B (zh) 2019-10-15 2019-10-15 一种基于强化学习的深度神经网络压缩方法

Country Status (1)

Country Link
CN (1) CN110728361B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369559A (zh) * 2020-04-16 2020-07-03 福州海豚世纪科技有限公司 妆容评估方法、装置、化妆镜和存储介质
CN111626328A (zh) * 2020-04-16 2020-09-04 湘潭大学 一种基于轻量化深度神经网络的图像识别方法及装置
CN111898484A (zh) * 2020-07-14 2020-11-06 华中科技大学 生成模型的方法、装置、可读存储介质及电子设备
CN112244853A (zh) * 2020-10-26 2021-01-22 生物岛实验室 边缘计算节点的制造方法和边缘计算节点
CN112380895A (zh) * 2020-09-30 2021-02-19 深圳点猫科技有限公司 一种基于深度学习的人像分割方法、装置及设备
CN112766496A (zh) * 2021-01-28 2021-05-07 浙江工业大学 基于强化学习的深度学习模型安全性保障压缩方法与装置
CN112926672A (zh) * 2021-03-15 2021-06-08 中国科学院计算技术研究所 用于眼底检测仪数据的检测方法和系统
CN113408724A (zh) * 2021-06-17 2021-09-17 博众精工科技股份有限公司 模型压缩方法及装置
CN113406893A (zh) * 2021-07-14 2021-09-17 南通大学 一种基于边缘网关的智能家居系统及其应用
CN113449867A (zh) * 2021-07-02 2021-09-28 电子科技大学 一种基于知识蒸馏的深度强化学习多智能体协作方法
CN113657592A (zh) * 2021-07-29 2021-11-16 中国科学院软件研究所 一种软件定义卫星自适应剪枝模型压缩方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184362A (zh) * 2015-08-21 2015-12-23 中国科学院自动化研究所 基于参数量化的深度卷积神经网络的加速与压缩方法
US20180137417A1 (en) * 2016-11-17 2018-05-17 Irida Labs S.A. Parsimonious inference on convolutional neural networks
CN110020724A (zh) * 2019-03-18 2019-07-16 浙江大学 一种基于权重显著性的神经网络列稀疏方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184362A (zh) * 2015-08-21 2015-12-23 中国科学院自动化研究所 基于参数量化的深度卷积神经网络的加速与压缩方法
US20180137417A1 (en) * 2016-11-17 2018-05-17 Irida Labs S.A. Parsimonious inference on convolutional neural networks
CN110020724A (zh) * 2019-03-18 2019-07-16 浙江大学 一种基于权重显著性的神经网络列稀疏方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626328A (zh) * 2020-04-16 2020-09-04 湘潭大学 一种基于轻量化深度神经网络的图像识别方法及装置
CN111369559A (zh) * 2020-04-16 2020-07-03 福州海豚世纪科技有限公司 妆容评估方法、装置、化妆镜和存储介质
CN111626328B (zh) * 2020-04-16 2023-12-15 湘潭大学 一种基于轻量化深度神经网络的图像识别方法及装置
CN111898484A (zh) * 2020-07-14 2020-11-06 华中科技大学 生成模型的方法、装置、可读存储介质及电子设备
CN112380895A (zh) * 2020-09-30 2021-02-19 深圳点猫科技有限公司 一种基于深度学习的人像分割方法、装置及设备
CN112244853B (zh) * 2020-10-26 2022-05-13 生物岛实验室 边缘计算节点的制造方法和边缘计算节点
CN112244853A (zh) * 2020-10-26 2021-01-22 生物岛实验室 边缘计算节点的制造方法和边缘计算节点
CN112766496A (zh) * 2021-01-28 2021-05-07 浙江工业大学 基于强化学习的深度学习模型安全性保障压缩方法与装置
CN112766496B (zh) * 2021-01-28 2024-02-13 浙江工业大学 基于强化学习的深度学习模型安全性保障压缩方法与装置
CN112926672A (zh) * 2021-03-15 2021-06-08 中国科学院计算技术研究所 用于眼底检测仪数据的检测方法和系统
CN113408724A (zh) * 2021-06-17 2021-09-17 博众精工科技股份有限公司 模型压缩方法及装置
CN113449867A (zh) * 2021-07-02 2021-09-28 电子科技大学 一种基于知识蒸馏的深度强化学习多智能体协作方法
CN113406893A (zh) * 2021-07-14 2021-09-17 南通大学 一种基于边缘网关的智能家居系统及其应用
CN113657592A (zh) * 2021-07-29 2021-11-16 中国科学院软件研究所 一种软件定义卫星自适应剪枝模型压缩方法
CN113657592B (zh) * 2021-07-29 2024-03-05 中国科学院软件研究所 一种软件定义卫星自适应剪枝模型压缩方法

Also Published As

Publication number Publication date
CN110728361B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN110728361B (zh) 一种基于强化学习的深度神经网络压缩方法
CN110175628A (zh) 一种基于自动搜索与知识蒸馏的神经网络剪枝的压缩算法
US20220114455A1 (en) Pruning and/or quantizing machine learning predictors
CN114422382B (zh) 网络流量预测方法、计算机装置、产品及存储介质
CN114286093A (zh) 一种基于深度神经网络的快速视频编码方法
CN110020721B (zh) 一种基于参数压缩的目标检测深度学习网络优化方法
CN109409505A (zh) 一种用于分布式深度学习的压缩梯度的方法
CN112906747A (zh) 一种基于知识蒸馏的图像分类方法
CN114970853A (zh) 一种跨范围量化的卷积神经网络压缩方法
CN114329233A (zh) 一种跨区域跨评分协同过滤推荐方法及系统
CN112884149A (zh) 一种基于随机敏感度st-sm的深度神经网络剪枝方法及系统
CN116844041A (zh) 一种基于双向卷积时间自注意力机制的耕地提取方法
CN111832817A (zh) 基于mcp罚函数的小世界回声状态网络时间序列预测方法
CN116170328A (zh) 图形编码的使用带宽预测方法及装置
CN117454943A (zh) 一种自动模型压缩方法、装置及介质
CN113011091A (zh) 一种自动分组的多尺度轻量型深度卷积神经网络优化方法
CN116303386A (zh) 一种基于关系图谱的缺失数据智能插补方法和系统
CN113590748B (zh) 基于迭代网络组合的情感分类持续学习方法及存储介质
Li et al. Hierarchical classification and vector quantization with neural trees
CN115905546A (zh) 基于阻变存储器的图卷积网络文献识别装置与方法
CN113177627A (zh) 优化系统、重新训练系统及其方法及处理器和可读介质
CN113222142A (zh) 一种通道剪枝和快捷连接层剪枝方法及系统
CN113361707A (zh) 一种模型压缩方法、系统及计算机可读介质
KR20210157826A (ko) 심층 신경망 구조 학습 및 경량화 방법
CN113111308A (zh) 基于数据驱动遗传编程算法的符号回归方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant