CN114241230A - 目标检测模型剪枝方法和目标检测方法 - Google Patents
目标检测模型剪枝方法和目标检测方法 Download PDFInfo
- Publication number
- CN114241230A CN114241230A CN202111376597.6A CN202111376597A CN114241230A CN 114241230 A CN114241230 A CN 114241230A CN 202111376597 A CN202111376597 A CN 202111376597A CN 114241230 A CN114241230 A CN 114241230A
- Authority
- CN
- China
- Prior art keywords
- target detection
- detection model
- layer
- neural network
- pruned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 475
- 238000013138 pruning Methods 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000013528 artificial neural network Methods 0.000 claims abstract description 158
- 238000010586 diagram Methods 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims description 59
- 238000004590 computer program Methods 0.000 claims description 51
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000012163 sequencing technique Methods 0.000 claims description 28
- 238000002372 labelling Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 abstract description 8
- 239000000523 sample Substances 0.000 description 166
- 238000013139 quantization Methods 0.000 description 12
- 230000007547 defect Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000012468 concentrated sample Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
Abstract
本申请涉及一种目标检测模型剪枝方法和目标检测方法。所述目标检测模型剪枝方法包括:获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;根据分类结果,确定与每层神经网络对应的剪枝率;根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。采用本方法能够减少目标检测模型所需要的计算、存储资源,提高检测效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种目标检测模型剪枝方法和目标检测方法。
背景技术
随着计算机技术的发展,利用计算机图像处理技术进行目标检测越来越热门,目标检测技术在智能化交通系统、智能监控系统等方面具有广泛的应用价值。举例说明,目标检测技术可应用于输电设备缺陷识别,即在智能电网运维检修中,利用目标检测技术提升部件和缺陷识别效果。
传统技术中,在实现目标检测时,常利用深度学习目标检测模型,深度学习方法能够自主学习数据深层次抽象特征,具有较强的检测性能与泛化能力。
然而,由于深度学习目标检测模型所需要的计算、存储资源较大,在利用深度学习目标检测模型进行目标检测的过程时,无法实现实时检测,存在检测效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高检测效率的目标检测模型剪枝方法、装置、计算机设备、计算机可读存储介质和计算机程序产品以及实现高效检测的目标检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种目标检测模型剪枝方法。所述方法包括:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
在其中一个实施例中,获取待剪枝目标检测模型包括:
获取初始目标检测模型以及携带标注框的样本图像集;
将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框;
根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵;
根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
在其中一个实施例中,根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型包括:
根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度;
根据更新梯度,对初始目标检测模型中网络参数进行调整;
返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
在其中一个实施例中,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果包括:
根据输出特征图的秩,确定每层神经网络对应的秩;
对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
在其中一个实施例中,根据剪枝率,对每层神经网络的网络参数进行更新,得到已训练目标检测模型包括:
对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数;
重置待重置网络参数,得到已训练目标检测模型。
在其中一个实施例中,重置待重置网络参数,得到已训练目标检测模型包括:
重置待重置网络参数,得到第一目标检测模型;
利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型;
对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型;
调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型。
第二方面,本申请还提供了一种目标检测模型剪枝装置。所述装置包括:
模型获取模块,用于获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
第一处理模块,用于将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
分类模块,用于确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
第二处理模块,用于根据分类结果,确定与每层神经网络对应的剪枝率;
更新模块,用于根据剪枝率,对每层神经网络的网络参数进行更新,得到已训练目标检测模型。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
第六方面,本申请提供了一种目标检测方法。所述方法包括:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
第七方面,本申请还提供了一种目标检测装置。所述装置包括:
数据获取模块,用于获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
检测模块,用于将待检测图像输入已训练目标检测模型,得到目标检测结果。
第八方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
第九方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
第十方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
上述目标检测模型剪枝方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过获取根据样本图像集中样本图像训练得到的待剪枝目标检测模型,将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图,确定输出特征图的秩,能够根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果,从而利用分类结果,确定与每层神经网络对应的剪枝率,进而可以根据剪枝率,实现对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型,整个过程,能够通过剪枝对目标检测模型进行简化,从而可以减少目标检测模型所需要的计算、存储资源,提高检测效率。
上述目标检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过获取待检测图像以及已训练目标检测模型,将待检测图像输入已训练目标检测模型,能够利用已剪枝的已训练目标检测模型实现高效检测,快速得到目标检测结果。
附图说明
图1为一个实施例中目标检测模型剪枝方法的流程示意图;
图2为一个实施例中目标检测方法的流程示意图;
图3为另一个实施例中目标检测方法的流程示意图;
图4为一个实施例中目标检测模型剪枝装置的结构框图;
图5为一个实施例中目标检测装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种目标检测模型剪枝方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤:
步骤102,获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到。
其中,待剪枝目标检测模型是指根据样本图像集中样本图像对初始目标检测模型进行训练所得到的模型。样本图像集中样本图像是指携带标注框的图像,标注框用于标注出样本图像中目标对象。比如,在输电设备缺陷识别中,样本图像具体可以是指标注有输电设备缺陷的样本图像。初始目标检测模型是指未进行训练的目标检测模型。比如,初始目标检测模型具体可以是指基于yolo-v3(You Only Look Once-version3)算法的模型等,本实施例在此处不对初始目标检测模型进行限定,只要是能够实现目标检测的模型即可。
具体的,服务器会获取初始目标检测模型以及携带标注框的样本图像集,利用携带标注框的样本图像集中样本图像对初始目标检测模型进行训练,得到待剪枝目标检测模型。
步骤104,将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图。
其中,待剪枝目标检测模型是由多层神经网络组成的,待剪枝目标检测模型中每层神经网络都会对样本图像进行处理。比如,每层神经网络具体可以是指不同尺度的卷积层,可对样本图像进行卷积。输出特征图是指样本图像经过神经网络处理后所得到的图像特征。比如,输出特征图具体可以用特征向量来表示。
具体的,在得到待剪枝目标检测模型后,服务器会再次将样本图像依次输入待剪枝目标检测模型,以得到与样本图像对应的每层神经网络的输出特征图。
步骤106,确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
其中,秩是线性代数术语,在线性代数中,一个矩阵的秩是其非零子式的最高阶数,一个向量组的秩则是其最大无关组所含的向量个数。由于输出特征图具体可以是指特征向量,则输出特征图的秩即是指的特征向量的秩。
具体的,服务器会利用线性代数中矩阵的秩的计算方法,去计算输出特征图的秩,根据输出特征图的秩,去计算每层神经网络对应的秩,根据每层神经网络对应的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。其中,根据输出特征图的秩,去计算每层神经网络对应的秩,是指针对样本图像集中样本图像,计算相同层神经网络的输出特征图的秩的平均值,以该输出特征图的秩的平均值,作为每层神经网络对应的秩。
其中,根据每层神经网络对应的秩,对待剪枝目标检测模型中每层神经网络进行分类,是指对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果进行分类。其中的预设类别数可按照需要自行设置。比如,当预设类别数为3时,可根据预设类别数将神经网络层分为三类。又比如,当预设类别数为4时,可根据预设类别数将神经网络层分为四类。进一步的,在进行分类时主要是按照秩的大小对神经网络层进行分类,即秩较大的神经网络层会被归为一类,秩较小的神经网络层会被归为一类。
步骤108,根据分类结果,确定与每层神经网络对应的剪枝率。
其中,剪枝是指通过某种判断,避免一些没必要的遍历进程,形象的说,就是剪去了搜索树中的某些“枝条”。本实施例中,主要指的是剪去了待剪枝目标检测模型中每层神经网络的一些网络参数。剪枝率是指需要调整的网络参数比例。比如,当剪枝率为85%时,表示需要对该层神经网络中85%的网络参数进行调整。
具体的,在按照秩的大小对神经网络层进行分类,得到分类结果后,服务器会根据分类结果以及预先设置的类别与剪枝率对应关系,确定与每层神经网络对应的剪枝率。其中,预先设置的类别与剪枝率对应关系中预先设置有不同类别所对应的剪枝率。比如,预先设置的类别与剪枝率对应关系具体可以为,秩最大的一类神经网络层的剪枝率为X,秩次大的一类神经网络层的剪枝率为Y,秩最小的一类神经网络层的剪枝率为Z这样的形式,具体的每个类别的剪枝率可按照需要自行设置,主要的设置思路为秩较大则设置较小的剪枝率,秩较小则设置较大的剪枝率。
步骤110,根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
具体的,在得到剪枝率以后,服务器会根据剪枝率,对每层神经网络的网络参数进行更新,即进行剪枝,得到第一目标检测模型,再利用样本图像集中样本图像,对第一目标检测模型进行训练,以调整第一目标检测模型中网络参数,得到第二目标检测模型,再通过精度量化以及模型推理优化等,对第二目标检测模型进行优化,得到已训练目标检测模型。
上述目标检测模型剪枝方法,通过获取根据样本图像集中样本图像训练得到的待剪枝目标检测模型,将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图,确定输出特征图的秩,能够根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果,从而利用分类结果,确定与每层神经网络对应的剪枝率,进而可以根据剪枝率,实现对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型,整个过程,能够通过剪枝对目标检测模型进行简化,从而可以减少目标检测模型所需要的计算、存储资源,提高检测效率。
在一个实施例中,获取待剪枝目标检测模型包括:
获取初始目标检测模型以及携带标注框的样本图像集;
将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框;
根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵;
根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
其中,样本图像集中样本图像是指携带标注框的图像,标注框用于标注出样本图像中目标对象。比如,本实施例中的标注具体可以是指人工标注,标注具体可以为VOC(Visual Object Classes,可视对象类)格式标注。比如,在输电设备缺陷识别中,样本图像具体可以是指标注有输电设备缺陷的样本图像。需要说明的是,本实施例中,还可以通过对样本图像使用图像旋转、随机亮度调节、随机对比度调节等方法进行图像增强,以得到更多样的样本图像。初始目标检测模型是指未进行训练的目标检测模型。比如,初始目标检测模型具体可以是指基于yolo-v3算法的模型等,本实施例在此处不对初始目标检测模型进行限定,只要是能够实现目标检测的模型即可。
其中,预测框用于标注出初始目标检测模型所预测的样本图像中目标对象。比如,在输电设备缺陷识别中,预测框用于标注出初始目标检测模型所预测的样本图像中输电设备缺陷。网络参数矩阵是指由初始目标检测模型中每层神经网络的网络参数所组成的矩阵。
具体的,服务器会获取初始目标检测模型以及携带标注框的样本图像集,将样本图像集中样本图像,输入初始目标检测模型,初始目标检测模型会对样本图像进行目标检测,以输出与样本图像对应的预测框。在得到预测框后,服务器会根据标注框和预测框,去计算与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵,根据模型损失函数和网络参数矩阵,对初始目标检测模型中网络参数进行调整,以得到新的初始目标检测模型,再返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
其中,预设停止迭代条件可按照需要自行设置。比如,预设停止迭代条件具体可以是指当迭代次数达到预先设置的迭代次数阈值。又比如,预设迭代停止条件具体可以是指模型损失函数收敛。本实施例中在此处不对预设停止迭代条件进行限定。
本实施例中,通过将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框,能够根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,从而可以在获取初始目标检测模型的网络参数矩阵后,利用模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,实现对待剪枝目标检测模型的获取。
在一个实施例中,根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型包括:
根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度;
根据更新梯度,对初始目标检测模型中网络参数进行调整;
返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
具体的,在得到模型损失函数和网络参数矩阵后,服务器会根据模型损失函数和网络参数矩阵,对每个网络参数进行求导,以计算初始目标检测模型中每个网络参数的更新梯度,从而可以根据更新梯度进行反向传播更新,对初始目标检测模型中网络参数进行调整,返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,利用更新后的初始目标检测模型再次对样本图像集中样本图像进行目标检测预测,得到新的预测框,再继续根据标注框和新的预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵,利用模型损失函数和网络参数矩阵重新计算新的更新梯度,再次对初始目标检测模型中网络参数进行调整,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标剪枝模型。
其中,根据模型损失函数和网络参数矩阵,对每个网络参数进行求导,以计算初始目标检测模型中每个网络参数的更新梯度是指,在模型损失函数上加上一个网络参数正则项,该网络参数正则项的形式具体可以为网络参数的1范数,以该叠加值作为新的模型损失函数,对每个网络参数进行求导,以计算初始目标检测模型中每个网络参数的更新梯度。举例说明,该叠加值的公式具体可以为:
loss(W;x;y)=lossraw(W;x;y)+λ||W||1;
其中,lossraw(W;x;y)是指模型损失函数,W是指网络参数矩阵,x是网络输入(即样本图像集中样本图像),y是网络输出(即样本图像的标注框),λ是正则化参数(可按照需要自行设置,具体可以设置为0.1),利用网络前向传播计算模型损失函数、反向传播更新网络参数矩阵,反复迭代一定次数后即可完成训练,得到待剪枝目标剪枝模型。
下面对初始目标检测模型中任意网络参数ωi进行调整进行举例说明。
其中,L是指新的模型损失函数,L(W)是指通过标注框以及预测框计算得到的模型损失函数,是指网络参数正则项,sign(ωi)是符号函数,ωi=0,sign(ωi)=0;ωi>0,sign(ωi)=1;ωi<0,sign(ωi)=-1,η是指步进,可按照需要自行设置,为求导后得到的更新梯度。
本实施例中,通过根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度,根据更新梯度,对初始目标检测模型中网络参数进行调整,再返回重新训练,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型,能够实现对待剪枝目标检测模型的稀疏化训练。
在一个实施例中,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果包括:
根据输出特征图的秩,确定每层神经网络对应的秩;
对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
具体的,服务器会根据输出特征图的秩,去计算相同层神经网络的输出特征图的秩的平均值,以该输出特征图的秩的平均值,作为每层神经网络对应的秩,再对每层神经网络对应的秩进行排序,根据预设类别数以及秩的大小对神经网络层进行均分,将秩较大的神经网络层归为一类,秩较小的神经网络层归为一类,得到分类结果。其中的预设类别数可按照需要自行设置。比如,当预设类别数为3时,可根据预设类别数将神经网络层分为三类。又比如,当预设类别数为4时,可根据预设类别数将神经网络层分为四类。
本实施例中,能够利用输出特征图的秩实现对神经网络层的分类。
在一个实施例中,根据剪枝率,对每层神经网络的网络参数进行更新,得到已训练目标检测模型包括:
对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数;
重置待重置网络参数,得到已训练目标检测模型。
其中,待重置网络参数是指每层神经网络中需要被重置的网络参数。
具体的,在得到剪枝率之后,服务器会对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,选取与剪枝率数量对应的参数值较小的网络参数作为待重置网络参数,将待重置网络参数的参数值重置为0,得到第一目标检测模型,再利用样本图像集中样本图像,对第一目标检测模型进行训练,以调整第一目标检测模型中网络参数,得到第二目标检测模型,再通过精度量化以及模型推理优化等,对第二目标检测模型进行优化,得到已训练目标检测模型。举例说明,当剪枝率为85%时,服务器会选取神经网络层中85%参数值较小的网络参数作为待重置网络参数,将待重置网络参数的参数值重置为0。
本实施例中,能够利用剪枝率对每层神经网络的网络参数进行重置,以此实现剪枝,得到已训练目标检测模型。
在一个实施例中,重置待重置网络参数,得到已训练目标检测模型包括:
重置待重置网络参数,得到第一目标检测模型;
利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型;
对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型;
调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型。
具体的,在重置待重置网络参数后,服务器会得到第一目标检测模型,此时需要对剪枝后的第一目标检测模型再次进行训练,服务器会利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型。在得到第二目标检测模型后,为了进一步压缩模型大小,服务器会对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型,最后,为了加速模型的推理速度,服务器会调用TensorRT工具,对第三目标检测模型进行优化,将第三目标检测模型中卷积层、非线性激活层、bn(BatchNormalization,批量归一化)层进行合并,得到已训练目标检测模型。其中,进行精度量化是指调整网络参数的精度,比如进行精度量化具体可以是指将原始FP32单精度浮点值转化为半精度FP16浮点值。
其中,在利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型时,服务器会直接比对第一目标检测模型所输出的预测框与标注框,得到与第一目标检测模型所对应的损失函数,利用该损失函数调整第一目标检测模型的网络参数,直到该损失函数达到预先设置的与第一目标检测模型对应的迭代停止条件为止,得到第二目标检测模型。其中,与第一目标检测模型对应的迭代停止条件可按照需要自行设置。比如,与第一目标检测模型对应的迭代停止条件具体可以是指当迭代次数达到预先设置的迭代次数阈值。又比如,与第一目标检测模型对应的迭代停止条件具体可以是指损失函数收敛。本实施例中在此处不对该停止迭代条件进行限定。
在一个实施例中,如图2所示,提供了一种目标检测方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤:
步骤202,获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到。
步骤204,将待检测图像输入已训练目标检测模型,得到目标检测结果。
具体的,在需要进行目标检测时,服务器会获取待检测图像以及已训练目标检测模型,将待检测图像输入已训练目标检测模型,即可得到目标检测结果。
举例说明,本实施例中所涉及的目标检测方法可以应用于输电设备缺陷识别,具体在应用时,需要将已训练目标检测模型在无人机端侧的计算平台进行重新编译和优化,从而可以利用已训练目标检测模型对无人机采集的图像进行实时地识别,发现输电设备缺陷。
上述目标检测方法,通过获取待检测图像以及已训练目标检测模型,将待检测图像输入已训练目标检测模型,能够利用已剪枝的已训练目标检测模型实现高效检测,快速得到目标检测结果。
在一个实施例中,如图3所示,通过一个流程示意图来说明本申请的目标检测方法,该目标检测方法具体包括以下步骤:
步骤302,获取初始目标检测模型以及携带标注框的样本图像集;
步骤304,将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框;
步骤306,根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵;
步骤308,根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度;
步骤310,根据更新梯度,对初始目标检测模型中网络参数进行调整;
步骤312,返回步骤304,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型;
步骤314,将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
步骤316,确定输出特征图的秩,根据输出特征图的秩,确定每层神经网络对应的秩;
步骤318,对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
步骤320,根据分类结果,确定与每层神经网络对应的剪枝率;
步骤322,对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数;
步骤324,重置待重置网络参数,得到第一目标检测模型;
步骤326,利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型;
步骤328,对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型;
步骤330,调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型;
步骤332,获取待检测图像;
步骤334,将待检测图像输入已训练目标检测模型,得到目标检测结果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的目标检测模型剪枝方法的目标检测模型剪枝装置以及一种用于实现上述所涉及的目标检测方法的目标检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标检测模型剪枝装置以及目标检测装置实施例中的具体限定可以参见上文中对于目标检测模型剪枝方法以及目标检测方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种目标检测模型剪枝装置,包括:模型获取模块402、第一处理模块404、分类模块406、第二处理模块408和更新模块410,其中:
模型获取模块402,用于获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
第一处理模块404,用于将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
分类模块406,用于确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
第二处理模块408,用于根据分类结果,确定与每层神经网络对应的剪枝率;
更新模块410,用于根据剪枝率,对每层神经网络的网络参数进行更新,得到已训练目标检测模型。
上述目标检测模型剪枝装置,通过获取根据样本图像集中样本图像训练得到的待剪枝目标检测模型,将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图,确定输出特征图的秩,能够根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果,从而利用分类结果,确定与每层神经网络对应的剪枝率,进而可以根据剪枝率,实现对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型,整个过程,能够通过剪枝对目标检测模型进行简化,从而可以减少目标检测模型所需要的计算、存储资源,提高检测效率。
在一个实施例中,模型获取模块还用于获取初始目标检测模型以及携带标注框的样本图像集,将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框,根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵,根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
在一个实施例中,模型获取模块还用于根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度,根据更新梯度,对初始目标检测模型中网络参数进行调整,返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
在一个实施例中,分类模块还用于根据输出特征图的秩,确定每层神经网络对应的秩,对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
在一个实施例中,更新模块还用于对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数,重置待重置网络参数,得到已训练目标检测模型。
在一个实施例中,更新模块还用于重置待重置网络参数,得到第一目标检测模型,利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型,对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型,调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型。
在一个实施例中,如图5所示,提供了一种目标检测装置,包括:数据获取模块502和检测模块504,其中:
数据获取模块502,用于获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
检测模块504,用于将待检测图像输入已训练目标检测模型,得到目标检测结果。
上述目标检测装置,通过获取待检测图像以及已训练目标检测模型,将待检测图像输入已训练目标检测模型,能够利用已剪枝的已训练目标检测模型实现高效检测,快速得到目标检测结果。
上述目标检测模型剪枝装置以及目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本图像集等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测模型剪枝方法以及目标检测方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取初始目标检测模型以及携带标注框的样本图像集;将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框;根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵;根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度;根据更新梯度,对初始目标检测模型中网络参数进行调整;返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据输出特征图的秩,确定每层神经网络对应的秩;对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数;重置待重置网络参数,得到已训练目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:重置待重置网络参数,得到第一目标检测模型;利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型;对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型;调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取初始目标检测模型以及携带标注框的样本图像集;将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框;根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵;根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度;根据更新梯度,对初始目标检测模型中网络参数进行调整;返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据输出特征图的秩,确定每层神经网络对应的秩;对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数;重置待重置网络参数,得到已训练目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:重置待重置网络参数,得到第一目标检测模型;利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型;对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型;调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待剪枝目标检测模型,待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将样本图像输入待剪枝目标检测模型,得到与样本图像对应的每层神经网络的输出特征图;
确定输出特征图的秩,根据输出特征图的秩,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与每层神经网络对应的剪枝率;
根据剪枝率,对每层神经网络的网络参数进行剪枝,得到已训练目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取初始目标检测模型以及携带标注框的样本图像集;将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框;根据标注框和预测框,得到与初始目标检测模型对应的模型损失函数,并获取初始目标检测模型的网络参数矩阵;根据模型损失函数和网络参数矩阵,对初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据模型损失函数和网络参数矩阵,计算初始目标检测模型中网络参数的更新梯度;根据更新梯度,对初始目标检测模型中网络参数进行调整;返回将样本图像集中样本图像,输入初始目标检测模型,得到与样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据输出特征图的秩,确定每层神经网络对应的秩;对每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对每层神经网络的网络参数进行排序,根据排序结果以及剪枝率,确定每层神经网络的待重置网络参数;重置待重置网络参数,得到已训练目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:重置待重置网络参数,得到第一目标检测模型;利用样本图像集中样本图像,对第一目标检测模型进行训练,得到第二目标检测模型;对第二目标检测模型的每层神经网络的网络参数进行精度量化,得到第三目标检测模型;调用TensorRT工具,对第三目标检测模型进行优化,得到已训练目标检测模型。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待检测图像以及已训练目标检测模型,已训练目标检测模型通过上述目标检测模型剪枝方法得到;
将待检测图像输入已训练目标检测模型,得到目标检测结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标检测模型剪枝方法,其特征在于,所述方法包括:
获取待剪枝目标检测模型,所述待剪枝目标检测模型根据样本图像集中样本图像训练得到;
将所述样本图像输入所述待剪枝目标检测模型,得到与所述样本图像对应的每层神经网络的输出特征图;
确定所述输出特征图的秩,根据所述输出特征图的秩,对所述待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
根据分类结果,确定与所述每层神经网络对应的剪枝率;
根据所述剪枝率,对所述每层神经网络的网络参数进行更新,得到已训练目标检测模型。
2.根据权利要求1所述的方法,其特征在于,所述获取待剪枝目标检测模型包括:
获取初始目标检测模型以及携带标注框的样本图像集;
将所述样本图像集中样本图像,输入所述初始目标检测模型,得到与所述样本图像对应的预测框;
根据所述标注框和所述预测框,得到与所述初始目标检测模型对应的模型损失函数,并获取所述初始目标检测模型的网络参数矩阵;
根据所述模型损失函数和所述网络参数矩阵,对所述初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述模型损失函数和所述网络参数矩阵,对所述初始目标检测模型进行稀疏化训练,得到待剪枝目标检测模型包括:
根据所述模型损失函数和所述网络参数矩阵,计算所述初始目标检测模型中网络参数的更新梯度;
根据所述更新梯度,对所述初始目标检测模型中网络参数进行调整;
返回所述将所述样本图像集中样本图像,输入所述初始目标检测模型,得到与所述样本图像对应的预测框的步骤,直到最新的模型损失函数满足预设停止迭代条件,得到待剪枝目标检测模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述输出特征图的秩,对所述待剪枝目标检测模型中每层神经网络进行分类,得到分类结果包括:
根据所述输出特征图的秩,确定每层神经网络对应的秩;
对所述每层神经网络对应的秩进行排序,根据预设类别数以及排序结果,对所述待剪枝目标检测模型中每层神经网络进行分类,得到分类结果。
5.根据权利要求1所述的方法,其特征在于,所述根据所述剪枝率,对所述每层神经网络的网络参数进行更新,得到已训练目标检测模型包括:
对所述每层神经网络的网络参数进行排序,根据排序结果以及所述剪枝率,确定每层神经网络的待重置网络参数;
重置所述待重置网络参数,得到已训练目标检测模型。
6.一种目标检测方法,其特征在于,所述方法包括:
获取待检测图像以及已训练目标检测模型,所述已训练目标检测模型通过上述权利要求1-5中任一项所述方法得到;
将所述待检测图像输入所述已训练目标检测模型,得到目标检测结果。
7.一种目标检测模型剪枝装置,其特征在于,所述装置包括:
模型获取模块,用于获取待剪枝目标检测模型,所述待剪枝目标检测模型根据样本图像集中样本图像训练得到;
第一处理模块,用于将所述样本图像输入所述待剪枝目标检测模型,得到与所述样本图像对应的每层神经网络的输出特征图;
分类模块,用于确定所述输出特征图的秩,根据所述输出特征图的秩,对所述待剪枝目标检测模型中每层神经网络进行分类,得到分类结果;
第二处理模块,用于根据分类结果,确定与所述每层神经网络对应的剪枝率;
更新模块,用于根据所述剪枝率,对所述每层神经网络的网络参数进行更新,得到已训练目标检测模型。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111376597.6A CN114241230A (zh) | 2021-11-19 | 2021-11-19 | 目标检测模型剪枝方法和目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111376597.6A CN114241230A (zh) | 2021-11-19 | 2021-11-19 | 目标检测模型剪枝方法和目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114241230A true CN114241230A (zh) | 2022-03-25 |
Family
ID=80750182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111376597.6A Pending CN114241230A (zh) | 2021-11-19 | 2021-11-19 | 目标检测模型剪枝方法和目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114241230A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781640A (zh) * | 2022-06-16 | 2022-07-22 | 阿里巴巴达摩院(杭州)科技有限公司 | 模型部署方法、系统、存储介质以及电子设备 |
CN114972334A (zh) * | 2022-07-19 | 2022-08-30 | 杭州因推科技有限公司 | 一种管材瑕疵检测方法、装置、介质 |
CN115265881A (zh) * | 2022-09-28 | 2022-11-01 | 宁波普瑞均胜汽车电子有限公司 | 压力检测方法和装置 |
CN116304677A (zh) * | 2023-01-30 | 2023-06-23 | 格兰菲智能科技有限公司 | 模型的通道剪枝方法、装置、计算机设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052211A (zh) * | 2021-03-11 | 2021-06-29 | 天津大学 | 一种基于特征的秩和通道重要性的剪枝方法 |
CN113516230A (zh) * | 2021-07-20 | 2021-10-19 | 华侨大学 | 基于平均秩重要性排序的自动化卷积神经网络剪枝方法 |
CN113592085A (zh) * | 2021-07-06 | 2021-11-02 | 厦门路桥信息股份有限公司 | 一种基于高秩卷积图的核剪枝方法、装置、设备及介质 |
-
2021
- 2021-11-19 CN CN202111376597.6A patent/CN114241230A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052211A (zh) * | 2021-03-11 | 2021-06-29 | 天津大学 | 一种基于特征的秩和通道重要性的剪枝方法 |
CN113592085A (zh) * | 2021-07-06 | 2021-11-02 | 厦门路桥信息股份有限公司 | 一种基于高秩卷积图的核剪枝方法、装置、设备及介质 |
CN113516230A (zh) * | 2021-07-20 | 2021-10-19 | 华侨大学 | 基于平均秩重要性排序的自动化卷积神经网络剪枝方法 |
Non-Patent Citations (3)
Title |
---|
MINGBAO LIN ET AL.: "HRank: Filter Pruning using High-Rank Feature Map", 《2020 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》, 5 August 2020 (2020-08-05), pages 1525 - 1535 * |
杨康等: "基于模型性能相关性的分级剪枝率剪枝方法", 《计算机工程与设计》, vol. 42, no. 4, 30 April 2021 (2021-04-30), pages 1109 - 1115 * |
詹永照: "多层次深度特征融合的目标检测方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 February 2021 (2021-02-15), pages 38 - 41 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781640A (zh) * | 2022-06-16 | 2022-07-22 | 阿里巴巴达摩院(杭州)科技有限公司 | 模型部署方法、系统、存储介质以及电子设备 |
CN114781640B (zh) * | 2022-06-16 | 2022-09-27 | 阿里巴巴达摩院(杭州)科技有限公司 | 模型部署方法、系统、存储介质以及电子设备 |
CN114972334A (zh) * | 2022-07-19 | 2022-08-30 | 杭州因推科技有限公司 | 一种管材瑕疵检测方法、装置、介质 |
CN114972334B (zh) * | 2022-07-19 | 2023-09-15 | 杭州因推科技有限公司 | 一种管材瑕疵检测方法、装置、介质 |
CN115265881A (zh) * | 2022-09-28 | 2022-11-01 | 宁波普瑞均胜汽车电子有限公司 | 压力检测方法和装置 |
CN115265881B (zh) * | 2022-09-28 | 2022-12-20 | 宁波普瑞均胜汽车电子有限公司 | 压力检测方法和装置 |
CN116304677A (zh) * | 2023-01-30 | 2023-06-23 | 格兰菲智能科技有限公司 | 模型的通道剪枝方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114241230A (zh) | 目标检测模型剪枝方法和目标检测方法 | |
WO2019091020A1 (zh) | 权重数据存储方法和基于该方法的神经网络处理器 | |
CN113128558B (zh) | 基于浅层空间特征融合与自适应通道筛选的目标检测方法 | |
CN112163628A (zh) | 一种适用于嵌入式设备的改进目标实时识别网络结构的方法 | |
WO2023201924A1 (zh) | 对象缺陷检测方法、装置、计算机设备和存储介质 | |
CN112052951A (zh) | 一种剪枝神经网络方法、系统、设备及可读存储介质 | |
CN113191241A (zh) | 一种模型训练方法及相关设备 | |
CN110647990A (zh) | 基于灰色关联分析的深度卷积神经网络模型的裁剪方法 | |
CN116362325A (zh) | 一种基于模型压缩的电力图像识别模型轻量化应用方法 | |
WO2022039675A1 (en) | Method and apparatus for forecasting weather, electronic device and storage medium thereof | |
CN116188878A (zh) | 基于神经网络结构微调的图像分类方法、装置和存储介质 | |
CN114677548A (zh) | 基于阻变存储器的神经网络图像分类系统及方法 | |
KR20210039921A (ko) | 신경망 모델을 최적화하도록 구성된 심층 신경망 시스템의 동작 방법 | |
CN115393690A (zh) | 一种轻量化神经网络的空对地观测多目标识别方法 | |
CN113222209B (zh) | 基于域适应的区域尾气迁移预测方法、系统及存储介质 | |
CN116524296A (zh) | 设备缺陷检测模型的训练方法、装置和设备缺陷检测方法 | |
CN112288084A (zh) | 一种基于特征图通道重要性程度的深度学习目标检测网络压缩方法 | |
CN113033804B (zh) | 一种面向遥感图像的卷积神经网络压缩方法 | |
CN111062477B (zh) | 一种数据处理方法、装置及存储介质 | |
Zhao et al. | U-net for satellite image segmentation: Improving the weather forecasting | |
Xu et al. | Efficient block pruning based on kernel and feature stablization | |
Metta et al. | Drought prediction using artificial neural network | |
CN111382761B (zh) | 一种基于cnn的检测器、图像检测方法及终端 | |
CN114239684A (zh) | 变电站设备异常检测模型优化方法、装置和计算机设备 | |
CN117953395A (zh) | 一种输电线路异物图像检测方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |