CN110503135A - 用于电力设备边缘侧识别的深度学习模型压缩方法及系统 - Google Patents

用于电力设备边缘侧识别的深度学习模型压缩方法及系统 Download PDF

Info

Publication number
CN110503135A
CN110503135A CN201910698625.2A CN201910698625A CN110503135A CN 110503135 A CN110503135 A CN 110503135A CN 201910698625 A CN201910698625 A CN 201910698625A CN 110503135 A CN110503135 A CN 110503135A
Authority
CN
China
Prior art keywords
matrix
full articulamentum
deep learning
model
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910698625.2A
Other languages
English (en)
Other versions
CN110503135B (zh
Inventor
李喆
史晋涛
盛戈皞
江秀臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yantai Institute Of Information Technology Shanghai Jiaotong University
Shanghai Jiaotong University
Original Assignee
Yantai Institute Of Information Technology Shanghai Jiaotong University
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yantai Institute Of Information Technology Shanghai Jiaotong University, Shanghai Jiaotong University filed Critical Yantai Institute Of Information Technology Shanghai Jiaotong University
Priority to CN201910698625.2A priority Critical patent/CN110503135B/zh
Publication of CN110503135A publication Critical patent/CN110503135A/zh
Application granted granted Critical
Publication of CN110503135B publication Critical patent/CN110503135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种用于电力设备边缘侧识别的深度学习模型压缩方法,通过直接修改已训练完成的深度学习模型,实现相关识别模型的压缩和加速,包括:批量归一化层融合:将批量归一化层与其之前的卷积层进行融合;针对全连接层的奇异值分解:基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩;模型权重的量化:采用权值共享方法,根据深度学习模型的冗余性,对参数进行量化转换。各步骤既可独立使用,也可相互配合工作。同时提供了一种压缩系统。本发明实现对已训练完成的深度学习模型的压缩和加速,在当前电力公司积极推进泛在电力物联网的环境下,有着广泛的应用前景。

Description

用于电力设备边缘侧识别的深度学习模型压缩方法及系统
技术领域
本发明涉及深度学习领域以及电力泛在物联网领域,具体是一种针对训练完成的电力巡检或电力图像监控识别模型的用于电力设备边缘侧识别的深度学习模型压缩方法及系统。
背景技术
电力系统是保障国民经济平稳发展的重要支柱,电力系统架空线路规模大、周边环境复杂,气候变化多端。为保证电力系统的安全平稳运行,预防事故的发生,需要进行定点监控及定期巡检。
定点监控采取安装固定式摄像装置的方式,对电网内重要的区域进行监视,防止外来异物和闲杂人员入侵。监控的方式通常是指定专人在监控画面前实时检查。由于往往需要同时观察多个场景的监控画面,安全隐患出现时工作人员很难及时发现。基于深度学习的图像识别的方式可以有效地降低人力的消耗,并且可以避免因工作人员的疲惫或疏忽造成的漏检。
电力巡检采用无人机进行输电线路巡查,不但提高了输电线路运维的效率和质量,还可降低劳动强度和成本,保障巡线作业人员的人身安全。现阶段电力公司主要在巡线结束后由专人对无人机采集的巡线照片进行辨识,排查线路中的设备缺损等情况。鉴于巡线照片数量较大,但包含设备缺损的比例较低,工作人员容易出现疲劳,导致漏检的情况发生。借助合适算法,使用计算机对巡线照片中的设备缺损进行识别有助于改善人工筛查的弊端。
但如果在监控或电力巡检时的同时完成缺陷的识别工作,并在发现缺陷时及时发送告警信号和缺陷详情,而在没有发现问题时适当减少回传的图像数量,则可以进一步提升电网监控及电力巡检的工作效率,减轻工作人员的负担及对网络资源的消耗。深度学习算法具有准确度高、算法易于训练等特征。但其庞大的运算量及复杂的网络结构使其无法直接运行在性能较弱的机载嵌入式设备中。因此必须对算法进行精简,降低算法识别所需的计算量,同时识别模型进行,使识别模型能够运行在嵌入式设备中。基于深度学习的图像识别技术现已在电力巡检中逐步投入使用,相比于需要重新训练的压缩加速算法,对于已训练好的模型直接进行压缩和加速,更易于使用和推广。
发明内容
针对现有技术中存在的上述不足,本发明的目的是提供一种用于电力设备边缘侧识别的深度学习模型压缩方法及系统,该方法及系统直接修改已训练完成的模型,无需重新训练,操作方便。
本发明是通过以下技术方案实现的。
根据本发明的一个方面,提供了一种用于电力设备边缘侧识别的深度学习模型压缩方法,通过直接修改已训练完成的深度学习模型,实现相关识别模型的压缩和加速,包括:
-批量归一化层融合:将批量归一化层与其之前的卷积层进行融合,在无精度损失的情况下降低层间延迟,在一定程度上降低计算量,压缩模型大小;
-针对全连接层的奇异值分解:基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩,以极小的精度下降换取极高的压缩比率;
-对模型权重的量化:根据深度学习模型的冗余性,将模型权重进行量化转换,参数替换为较低精度的数值,以较小的精度下降为代价换取较大的模型压缩和加速效果。
优选地,所述批量归一化层融合,包括如下步骤:
设卷积层Y为:
Y=W×X+b (1)
其中,W为权重,X为输入数据,bconv为卷积层偏置;
设批量归一化层Xbn为:
其中,m为均值,σ为方差,s为比例,bbn为偏置,ε为滑动系数;
将卷积层的输出作为批量归一化层的输入,得到融合后的批量归一化层Xbn'为:
融合后的权重为:
其中,Wconv为融合后的权重,b_conv为融合后的偏置。
优选地,所述针对全连接层的奇异值分解,包括:
设某一全连接层的权重矩阵为矩阵A,则对矩阵A的奇异值分解记为:
A=UΣVT (5)
其中,U为一个m×m的矩阵;Σ为一个m×n的矩阵,该矩阵除主对角线上的元素外均为0,主对角线上各元素称为奇异值;V为一个n×n的矩阵;矩阵U、V均为酉矩阵,即正交矩阵在复数域上的推广;
假设原全连接层的权重矩阵W大小为p×q,奇异值分解算法的平衡系数为r,采用奇异值分解算法在全连接层前插入一个中间层,该中间层的神经元个数即为r;记压缩后的中间层与全连接层的权重矩阵分别为U'、V';其中,U'由矩阵U取其前r列得到,V'由矩阵Σ中的前r个奇异值组成的方阵与矩阵V的前r行进行矩阵乘法得到;如此,全连接层的参数数量由p×q变为r(p+q)。
优选地,对矩阵U、Σ、V的求解方法如下:
对A×AT做特征分解,所得特征值和特征向量满足如下条件:
(A×AT)ui=λi'ui (6)
其中,ui为特征向量;λi为特征值;将所有特征向量组合为一个m×m的矩阵,即得到矩阵U;
对AT×A做特征分解,所得特征值和特征向量满足如下条件:
(AT×A)vi=λivi (7)
其中,vi为特征向量;将所有特征向量组合为一个n×n的矩阵,即得到矩阵V;
矩阵Σ对角线上为奇异值σi,按照降序排列,其余位置均为零,其中奇异值σi为:
σi=Avi/ui (8)。
优选地,所述针对全连接层的奇异值分解中,根据模型权重的量化位数选择压缩参数,用以平衡模型的识别精度及模型的压缩大小。
压缩参数(奇异值分解值)与模型量化均会导致深度学习模型的识别能力下降,但是针对不同模型,造成的下降会不同。例如有模型1和模型2压缩前识别能力相同,但结构不同,若压缩参数:奇异值分解取256,量化位数选择int8,可能造成压缩后的模型1表现优于模型2;但若压缩参数选择奇异值分解64,量化位数为float16,则可能压缩后的模型2优于模型1。因此在针对全连接层的奇异值分解时,需要根据实际模型的具体情况加以选择。
优选地,所述对模型权重的量化,为一种权值共享方法,包括:
其中,Vx表示原始浮点输入;Vq表示量化后的定点数值;Vqr为根据量化参数还原出的浮点数;Vmax和Vmin分别表示量化参数中的最大值和最小值;符号<<为位操作符,表示左移;qbit表示量化位数。
优选地,所述对模型权重的量化步骤中,基于计算机的数据存储方式,选择量化位数,其中在选择量化位数时考虑模型的识别精度与模型的压缩大小,并综合全连接层的压缩参数进行选取。
根据本发明的另一个方面,提供了一种用于电力设备边缘侧识别的深度学习模型压缩系统,包括如下任意一个或任意多个模块:
批量归一化层融合模块:所述批量归一化层融合模块用于将批量归一化层与其之前的卷积层进行融合;
全连接层奇异值分解模块:所述全连接层奇异值分解模块基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩;
模型权重量化模块:所述模型权重量化模块根据深度学习模型的冗余性,对参数进行量化转换。
与现有技术相比,本发明具有如下有益效果:
本发明所提供的用于电力设备边缘侧识别的深度学习模型压缩方法及系统,各步骤或模块既可以独立使用,又可以相互配合,实现对已训练完成的深度学习模型的压缩和加速;由于原始深度学习模型占用空间巨大,运算量也非常高,嵌入式设备往往无法提供所需的存储空间即运算能力,因此需要对模型做大小的压缩和运算的加速,使之能够部署在性能羸弱的嵌入式设备上,本发明能够实现深度学习模型部署在诸如监控摄像头、巡检无人机等嵌入式设备上。在当前电力公司积极推进泛在电力物联网的环境下,有着广泛的应用前景。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为原始特征提取网络的网络结构示意图;
图2为融合批量归一化层之后的模型结构示意图;
图3为全连接层做奇异值分解后的模型结构示意图;
图4为本发明所提供的用于电力设备边缘侧识别的深度学习模型压缩方法流程图。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
本发明实施例提供了一种用于电力设备边缘侧识别的深度学习模型压缩方法,该方法可以直接修改已训练完成的模型,无需重新训练。包括如下任意一个或任意多个步骤:批量归一化层融合、针对全连接层的奇异值分解以及模型权重的量化。其中:
所述批量归一化层融合,将批量归一化层与其之前的卷积层进行融合,在无精度损失的情况下降低层间延迟,在一定程度上降低计算量,压缩模型大小;
所述针对全连接层的奇异值分解,基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩,以极小的精度下降换取极高的压缩比率。
所述对模型权重的量化,是一种权值共享方法,根据深度学习模型的冗余性,对模型权重进行量化转换,将参数替换为较低精度的数,以较小的精度下降为代价换取较大的模型加速和压缩效果;
所述针对全连接层的奇异值分解中可以自行选择压缩参数,以平衡精度下降及模型大小的压缩。压缩参数需配合量化算法的量化位数综合考虑进行选择。
所述模型权重的量化中,量化方法基于计算机的数据存储方式,可选择其量化位数,在选择量化位数时需考虑识别精度下降与模型的压缩加速效果之间的平衡,并综合全连接层的压缩参数进行选取。
进一步地:
所述批量归一化层融合步骤会将批量归一化层与其之前的卷积层进行融合。在神经网络训练的过程中,批量归一化层能够加速网络收敛,并且能够控制过拟合,不过这样也增加了一些运算和参数。鉴于批量归一化层的主要用途在于提升训练阶段的表现,因此在推理过程中,可以通过将批量归一化层与卷积层的参数融合的方式,来降低运算量,并略微地压缩模型,而并不会造成任何精度的损失。该步骤描述如下:
卷积层计算公式如公式(1)所示:
Y=W×X+b (1)
其中,W为权重,X为输入数据,bconv为卷积层偏置;
批量归一化层的计算公式如公式(2)所示:
其中,m为均值,σ为方差,s为比例,bbn为偏置,ε为滑动系数。
将卷积层的输出作为BN层的输入,带入得到融合后的表达式,如公式(3)所示:
融合后的权重如公式(4)所示:
其中,Wconv为融合后的权重,b_conv为融合后的偏置。
所述针对全连接层的奇异值分解步骤是针对全连接层的参数进行压缩的一种方法。在一般的深度学习权重模型中,全连接层往往会占据超过一半的参数,因此,对全连接层作奇异值分解可以得到极大的压缩收益。对全连接层的奇异值分解算法其实是对矩阵的奇异值分解。假设某一全连接层的权重矩阵为矩阵A。则对矩阵A的奇异值分解可记为公式(5)的形式,
A=UΣVT (5)
其中,U是一个m×m的矩阵;Σ是一个m×n的矩阵,除主对角线上的元素外均为0,主对角线上各元素称为奇异值;V是一个n×n的矩阵,矩阵U、V均为酉矩阵,即正交矩阵在复数域上的推广。U、Σ、V的求法如下:
对A×AT做特征分解,所得特征值和特征向量满足公式(6),
(A×AT)ui=λiui (6)
其中,ui为特征向量,λi为特征值。将所有特征向量组合为一个m×m的矩阵,即得到矩阵U。
对AT×A做特征分解,所得特征值和特征向量满足公式(7),
(AT×A)vi=λivi (7)
其中,vi为特征向量。将所有特征向量组合为一个n×n的矩阵,即得到矩阵V。
矩阵Σ对角线上为奇异值,按照降序排列,其余位置均为零,奇异值σi按照公式(8)所示求出:
σi=Avi/ui (8)
假设原来的全连接层的权重矩阵W大小为p×q,奇异值分解算法的平衡系数为r,使用奇异值分解算法会在全连接层前边插入一个中间层,该中间层的神经元个数即为r。记压缩后模型的中间层与全连接层的权重矩阵分别为U',V'。其中,U'由矩阵A的奇异值分解中的矩阵U取其前r列得到,V'由前r各奇异值组成的方阵与矩阵V的前r行进行矩阵乘法得到。如此,参数数量由原本的p×q变为了现在的r(p+q)。
所述模型权重的量化步骤采用的是一种权值共享方法。深度神经网络存在着一定的冗余性,因此,合理的量化操作可以在保证精度的情况下达到压缩和加速深度学习模型的效果。深度学习模型一般默认使用32位的浮点数进行计算。该算法使用较低精度的数如16位整型或8位整型数等替代浮点数。量化方法是一种类似于离差标准化的归一化方法,是对原始数据进行线性变换,使结果映射到一定范围内,具体公式如公式(9)所示。
其中,
Vx表示原始浮点输入,Vq表示量化后的定点数值,Vqr是根据量化参数还原出的浮点数,Vmax和Vmin表示参数中的最大值和最小值,“<<”表示位操作符“左移”,qbit表示量化位数。
本发明实施例同时提供了一种用于电力设备边缘侧识别的深度学习模型压缩系统,该系统可以用于实施本发明实施例中所提供的用于电力设备边缘侧识别的深度学习模型压缩方法。该系统包括如下任意一个或任意多个模块:
批量归一化层融合模块:所述批量归一化层融合模块用于将批量归一化层与其之前的卷积层进行融合;
全连接层奇异值分解模块:所述全连接层奇异值分解模块基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩;
模型权重量化模块:所述模型权重量化模块根据深度学习模型的冗余性,对模型权重进行量化转换。
下面结合一具体应用实例,对本发明上述实施例进一步详细说明。
本具体应用实例以电力巡检任务为例,基于Caffe平台的深度学习模型说明本发明的具体实施过程。应用Caffe版本的Faster R-CNN算法,原始特征提取网络的结构如附图1所示。已得到由已标注好的巡检图像数据集训练完成的识别模型。
修改模型的prototxt文件,删去其中的批量归一化层(即bn层),然后将模型文件的bn层与其之前的卷积层(即conv层)进行融合,融合后的模型结构如附图2所示。
修改模型的prototxt文件,在各全连接层和其之前一层之间均插入中间层,设置平衡系数分别为256,128,64,插入的中间层神经元个数也同样为256,128,64个。在prototxt文件修改完成后,对模型文件的全连接层进行分解。分解完成的模型结构如附图3所示。
完成模型的全连接层的奇异值分解后,将模型文件内部的参数进行量化转换,将原来的float32转为int8类型,并采用哈夫曼编码进行存储。
经过以上压缩步骤,模型大小已压缩至合理区间,可以安装到电力巡检无人机所载嵌入式平台上,并将计算量降至合理范围,实现在电力巡检无人机上接近实时的检测和识别。
本发明上述实施例所提供的用于电力设备边缘侧识别的深度学习模型压缩方法及系统,可以直接修改已训练完成的模型,无需重新训练,操作方便。其中方法包括:批量归一化层融合、针对全连接层的奇异值分解以及模型权重的量化步骤。各个步骤既可独立使用,也可相互配合工作,完成对相关识别模型的压缩和加速。批量归一化层融合步骤将批量归一化层和与其相邻的卷积层的参数融合在一起,降低模型的参数量、运算量以及层间延迟。针对全连接层的奇异值分解步骤的主要原理为矩阵的奇异值分解。通过对全连接层的奇异值分解操作,可以在精度损失较小的情况下大幅降低全连接层的参数数量,有效压缩模型大小,降低运算量。对模型权重的量化步骤其实是一种权值共享策略,其将相近的值变为同一个数,得到一个高度稀疏的权重矩阵,即可实现模型大小的压缩和计算量的下降。其中系统包括批量归一化层融合、针对全连接层的奇异值分解以及模型权重的量化模块,可用于实施上述方法。本发明上述实施例提供的方法及系统,可实现对现有电力巡检模型的直接压缩加速,无需重新训练,是一种高效且易于推广的方案。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (8)

1.一种用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,通过直接修改已训练完成的深度学习模型,实现相关识别模型的压缩和加速,包括如下任意一个或任意多个步骤:
-批量归一化层融合:将批量归一化层与其之前的卷积层进行融合;
-针对全连接层的奇异值分解:基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩;
-对模型权重的量化:根据深度学习模型的冗余性,对模型权重进行量化转换。
2.根据权利要求1所述的用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,所述批量归一化层融合,包括如下步骤:
设卷积层Y为:
Y=W×X+bconv (1)
其中,W为权重,X为输入数据,bconv为卷积层偏置;
设批量归一化层Xbn为:
其中,m为均值,σ为方差,s为比例,bbn为批量归一化层偏置,ε为滑动系数;
将卷积层的输出作为批量归一化层的输入,得到融合后的批量归一化层Xbn'为:
融合后的权重为:
其中,W′conv为融合后的权重,b_conv为融合后的偏置。
3.根据权利要求1所述的用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,所述针对全连接层的奇异值分解,包括:
设某一全连接层的权重矩阵为矩阵A,则对矩阵A的奇异值分解记为:
A=UΣVT (5)
其中,U为一个m×m的矩阵;Σ为一个m×n的矩阵,该矩阵除主对角线上的元素外均为0,主对角线上各元素称为奇异值;V为一个n×n的矩阵;矩阵U、V均为酉矩阵,即正交矩阵在复数域上的推广;
假设原全连接层的权重矩阵W大小为p×q,奇异值分解算法的平衡系数为r,采用奇异值分解算法在全连接层前插入一个中间层,该中间层的神经元个数即为r;记压缩后的中间层与全连接层的权重矩阵分别为U'、V';其中,U'由矩阵U取其前r列得到,V'由矩阵Σ中的前r个奇异值组成的方阵与矩阵V的前r行进行矩阵乘法得到;如此,全连接层的参数数量由p×q变为r(p+q)。
4.根据权利要求3所述的用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,对矩阵U、Σ、V的求解方法如下:
对A×AT做特征分解,所得特征值和特征向量满足如下条件:
(A×AT)ui=λiui (6)
其中,ui为特征向量;λi为特征值;将所有特征向量组合为一个m×m的矩阵,即得到矩阵U;
对AT×A做特征分解,所得特征值和特征向量满足如下条件:
(AT×A)vi=λivi (7)
其中,vi为特征向量;将所有特征向量组合为一个n×n的矩阵,即得到矩阵V;
矩阵Σ对角线上为奇异值σi,按照降序排列,其余位置均为零,其中奇异值σi为:
σi=Avi/ui (8) 。
5.根据权利要求1所述的用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,所述针对全连接层的奇异值分解中,根据模型权重的量化位数选择压缩参数,用以平衡模型的识别精度及压缩大小。
6.根据权利要求1所述的用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,所述对模型权重的量化,为一种权值共享方法,包括:
其中,Vx表示原始浮点输入;Vq表示量化后的定点数值;Vqr为根据量化参数还原出的浮点数;Vmax和Vmin分别表示量化参数中的最大值和最小值;符号<<为位操作符,表示左移;qbit表示量化位数。
7.根据权利要求1所述的用于电力设备边缘侧识别的深度学习模型压缩方法,其特征在于,所述对模型权重的量化步骤中,基于计算机的数据存储方式,选择量化位数,其中在选择量化位数时考虑模型的识别精度与压缩大小,并综合全连接层的压缩参数进行选取。
8.一种用于电力设备边缘侧识别的深度学习模型压缩系统,其特征在于,包括如下任意一个或任意多个模块:
批量归一化层融合模块:所述批量归一化层融合模块用于将批量归一化层与其之前的卷积层进行融合;
全连接层奇异值分解模块:所述全连接层奇异值分解模块基于矩阵的奇异值分解算法,在全连接层之前加入中间层,对全连接层的参数进行压缩;
模型权重量化模块:所述模型权重量化模块根据深度学习模型的冗余性,对模型权重进行量化转换。
CN201910698625.2A 2019-07-31 2019-07-31 用于电力设备边缘侧识别的深度学习模型压缩方法及系统 Active CN110503135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910698625.2A CN110503135B (zh) 2019-07-31 2019-07-31 用于电力设备边缘侧识别的深度学习模型压缩方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910698625.2A CN110503135B (zh) 2019-07-31 2019-07-31 用于电力设备边缘侧识别的深度学习模型压缩方法及系统

Publications (2)

Publication Number Publication Date
CN110503135A true CN110503135A (zh) 2019-11-26
CN110503135B CN110503135B (zh) 2023-04-25

Family

ID=68587859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910698625.2A Active CN110503135B (zh) 2019-07-31 2019-07-31 用于电力设备边缘侧识别的深度学习模型压缩方法及系统

Country Status (1)

Country Link
CN (1) CN110503135B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144456A (zh) * 2019-12-13 2020-05-12 东南大学 一种基于本征特征迁移的深度模型压缩方法
CN111652351A (zh) * 2020-05-09 2020-09-11 济南浪潮高新科技投资发展有限公司 一种神经网络模型的部署方法、设备及介质
CN113052258A (zh) * 2021-04-13 2021-06-29 南京大学 基于中间层特征图压缩的卷积方法、模型及计算机设备
CN116432089A (zh) * 2023-05-15 2023-07-14 厦门星拉科技有限公司 一种电力物联网巡检系统及方法
CN113052258B (zh) * 2021-04-13 2024-05-31 南京大学 基于中间层特征图压缩的卷积方法、模型及计算机设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150180689A1 (en) * 2013-12-20 2015-06-25 King Fahd University Of Petroleum And Minerals Cognitive radio spectrum sensing with improved edge detection of frequency bands
CN107147906A (zh) * 2017-06-12 2017-09-08 中国矿业大学 一种虚拟视角合成视频质量的无参考评价方法
US20180018590A1 (en) * 2016-07-18 2018-01-18 NantOmics, Inc. Distributed Machine Learning Systems, Apparatus, and Methods
CN107967516A (zh) * 2017-10-12 2018-04-27 中科视拓(北京)科技有限公司 一种基于迹范数约束的神经网络的加速与压缩方法
CN108629410A (zh) * 2018-04-28 2018-10-09 中国科学院计算技术研究所 基于主成分分析降维和/或升维的神经网络处理方法
CN109214441A (zh) * 2018-08-23 2019-01-15 桂林电子科技大学 一种细粒度车型识别系统及方法
US20190108444A1 (en) * 2017-10-11 2019-04-11 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for customizing kernel machines with deep neural networks
CN109975665A (zh) * 2019-03-22 2019-07-05 华南理工大学 一种电力设备局部放电信号放电类型识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150180689A1 (en) * 2013-12-20 2015-06-25 King Fahd University Of Petroleum And Minerals Cognitive radio spectrum sensing with improved edge detection of frequency bands
US20180018590A1 (en) * 2016-07-18 2018-01-18 NantOmics, Inc. Distributed Machine Learning Systems, Apparatus, and Methods
CN107147906A (zh) * 2017-06-12 2017-09-08 中国矿业大学 一种虚拟视角合成视频质量的无参考评价方法
US20190108444A1 (en) * 2017-10-11 2019-04-11 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for customizing kernel machines with deep neural networks
CN107967516A (zh) * 2017-10-12 2018-04-27 中科视拓(北京)科技有限公司 一种基于迹范数约束的神经网络的加速与压缩方法
CN108629410A (zh) * 2018-04-28 2018-10-09 中国科学院计算技术研究所 基于主成分分析降维和/或升维的神经网络处理方法
CN109214441A (zh) * 2018-08-23 2019-01-15 桂林电子科技大学 一种细粒度车型识别系统及方法
CN109975665A (zh) * 2019-03-22 2019-07-05 华南理工大学 一种电力设备局部放电信号放电类型识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
万晓琪等: "卷积神经网络在局部放电图像模式识别中的应用", 《电网技术》 *
吴进等: "一种基于Lasso回归与SVD融合的深度学习模型压缩方法", 《电讯技术》 *
高彩亮等: "基于小波奇异值和支持向量机的高压线路故障诊断", 《电力系统保护与控制》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144456A (zh) * 2019-12-13 2020-05-12 东南大学 一种基于本征特征迁移的深度模型压缩方法
CN111652351A (zh) * 2020-05-09 2020-09-11 济南浪潮高新科技投资发展有限公司 一种神经网络模型的部署方法、设备及介质
CN113052258A (zh) * 2021-04-13 2021-06-29 南京大学 基于中间层特征图压缩的卷积方法、模型及计算机设备
CN113052258B (zh) * 2021-04-13 2024-05-31 南京大学 基于中间层特征图压缩的卷积方法、模型及计算机设备
CN116432089A (zh) * 2023-05-15 2023-07-14 厦门星拉科技有限公司 一种电力物联网巡检系统及方法

Also Published As

Publication number Publication date
CN110503135B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
AU2019430859B2 (en) Generative adversarial mechanism and attention mechanism-based standard face generation method
CN111368993B (zh) 一种数据处理方法及相关设备
CN110503135A (zh) 用于电力设备边缘侧识别的深度学习模型压缩方法及系统
CN108764456B (zh) 机载目标识别模型构建平台、机载目标识别方法及设备
CN110175248B (zh) 一种基于深度学习和哈希编码的人脸图像检索方法和装置
CN110163205A (zh) 图像处理方法、装置、介质和计算设备
CN111160096A (zh) 禽蛋异常的识别方法、装置及系统、存储介质、电子装置
CN113902007A (zh) 模型训练方法及装置、图像识别方法及装置、设备和介质
CN114332104A (zh) 电网输电场景rgb点云语义分割多阶段模型联合优化方法
CN114241522A (zh) 现场作业安全穿戴识别方法、系统、设备及存储介质
CN110855474B (zh) Kqi数据的网络特征提取方法、装置、设备及存储介质
CN116912774A (zh) 一种基于边缘计算的输变电设备红外图像目标识别方法、电子装置及存储介质
WO2023174256A1 (zh) 一种数据压缩方法以及相关设备
Ying et al. An improved defect detection method for substation equipment
CN115100592A (zh) 一种输电通道外破隐患识别方法、装置及存储介质
CN114283442A (zh) 一种二次接线图智能识别方法、装置及存储介质
CN114882214A (zh) 一种基于深度学习从图像预测物体抓取顺序的方法
Wang et al. A small target recognition algorithm based on improved SSD
Jiang et al. Research on Lightweight Method of Image Deep Learning Model for Power Equipment
CN114330634A (zh) 一种神经网络的处理方法及相关设备
Xie et al. Visual Intelligent Monitoring Technology of Data Center Based on SSD Algorithm
Cummings et al. Building Change Detection Using Modified Siamese Neural Networks
CN116503398B (zh) 绝缘子污闪检测方法、装置、电子设备及存储介质
WO2023095934A1 (ko) 객체 탐지기의 헤드 신경망 경량화 방법 및 시스템
Ji et al. Detecting Foreign Objects on Transmission Lines via Improved YOLOv5 Optimized by Attention Mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant