CN114723043A - 基于超图模型谱聚类的卷积神经网络卷积核剪枝方法 - Google Patents

基于超图模型谱聚类的卷积神经网络卷积核剪枝方法 Download PDF

Info

Publication number
CN114723043A
CN114723043A CN202210334415.7A CN202210334415A CN114723043A CN 114723043 A CN114723043 A CN 114723043A CN 202210334415 A CN202210334415 A CN 202210334415A CN 114723043 A CN114723043 A CN 114723043A
Authority
CN
China
Prior art keywords
convolutional
convolution
kernel
neural network
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210334415.7A
Other languages
English (en)
Inventor
赵曦滨
林航
高跃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210334415.7A priority Critical patent/CN114723043A/zh
Publication of CN114723043A publication Critical patent/CN114723043A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法、系统、电子设备及存储介质,方法包括:提取目标卷积神经网络的当前卷积层的卷积核集合,并基于该集合生成卷积核特征集合;根据特征集合,构建超图模型,获得超图关联矩阵;根据超图谱聚类算法和预设剪枝率,进行卷积核特征聚类并生成聚类生成卷积核聚类结果;基于卷积核聚类结果对进行剪枝,生成卷积神经网络并进行训练,直至满足目标网络性能;将下一卷积层作为当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,由此,实现了对经典卷积神经网络模型的轻量化,在高剪枝率的前提下,保证了剪枝后的轻量化模型性能维持在原来的水平,并极大地加速了神经网络模型的推断速率。

Description

基于超图模型谱聚类的卷积神经网络卷积核剪枝方法
技术领域
本申请涉及模型压缩和加速技术领域,特别涉及一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
背景技术
随着深度学习的快速发展,卷积神经网络凭借其超越人类水平的性能,已经成为了各种各样计算机视觉任务的主流架构,比如:图像分类、物体检测等。然而,近些年来,随着卷积神经网络性能的不断提升,其网络宽度越来越广,网络深度也越来越深,带来了大量的参数和浮点运算数量,产生巨大的内存占用和计算负担。这极大限制了卷积神经网络在资源受限的嵌入式设备端的应用。为了解决这个问题,在保持卷积神经网络模型性能的前提下,最大程度地压缩卷积神经网络模型的参数和浮点运算数十分重要。
现有卷积神经网络压缩和加速技术中,主要包括权重剪枝,卷积核剪枝。其中权重剪枝是指删除卷积神经网络中权重小的连接,生成一个更加稀疏的卷积神经网络结构。然而,这种方法会导致不规则的稀疏的连接,并且在硬件实现中往往不能实现真正的在硬件实现中的加速。卷积核剪枝一般分为两种,基于重要性的卷积核剪枝和基于冗余的卷积核剪枝。其中,基于重要性的卷积核剪枝主要是根据一定的策略寻找卷积神经网络中重要性低的卷积核,将卷积核直接从卷积神经网络中移除。然而基于重要性的卷积核剪枝一定会带来一些信息上的损失,因为任意一个卷积核的重要性都不可能为0。现有的基于冗余的剪枝方式大多采用了基于卷积核之间欧式距离的方式,然而在高维空间中,一个卷积核与他最近邻与最远邻的距离几乎是相同的,不具有可区分性。因此,这也给基于冗余的卷积核剪枝方式带来了一定的挑战。
发明内容
本申请提供一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法、系统、电子设备及存储介质,实现了对经典卷积神经网络模型的轻量化,在高剪枝率的前提下,保证了剪枝后的轻量化模型性能维持在原来的水平,并极大地加速了神经网络模型的推断速率。
本申请第一方面实施例提供一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法,包括以下步骤:提取目标卷积神经网络的当前卷积层的卷积核集合,并基于所述卷积核集合中卷积核特征生成卷积核特征集合;利用所述卷积核特征集合构建超图模型,并确定超图关联矩阵;基于所述超图模型、所述超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果;基于所述卷积核聚类结果对所述当前卷积层进行剪枝,生成卷积神经网络,并训练所述卷积神经网络,直至满足目标网络性能;将下一卷积层作为所述当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,获取所述卷积神经网络的最终卷积核剪枝结果。
可选地,在本申请的一个实施例中,所述提取目标卷积神经网络的当前卷积层的卷积核集合,并基于所述卷积核集合中卷积核特征生成卷积核特征集合,包括:提取所述目标卷积神经网络任一层的多个卷积核,将每一个卷积核的参数矩阵展平为一维向量,提取所述一维向量的特征,生成所述卷积核特征集合。
可选地,在本申请的一个实施例中,所述基于所述超图模型、所述超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果,包括:根据所述预设剪枝率计算聚类的类别数;根据所述超图关联矩阵和所述超图模型,通过超图模型结构学习计算获得新的卷积核特征集合;根据所述新的卷积核特征集合和所述聚类的类别数进行卷积核特征聚类,获得所述卷积核聚类结果。
可选地,在本申请的一个实施例中,所述基于所述卷积核聚类结果对所述当前卷积层进行剪枝,生成卷积神经网络,包括:根据所述卷积核聚类结果,计算每个类簇的聚类中心;根据所述聚类中心,获得并保留每个类簇中与所述聚类中心最近的卷积核,生成待保留卷积核集合;根据所述待保留卷积核集合,将其他卷积核从所述目标卷积神经网络中移除,生成剪枝后的所述卷积神经网络。
本申请第二方面实施例提供一种基于超图模型谱聚类的卷积神经网络卷积核剪枝系统,包括:特征提取单元,用于提取目标卷积神经网络的当前卷积层的卷积核集合,并基于所述卷积核集合中卷积核特征生成卷积核特征集合;超图构建单元,用于利用所述卷积核特征集合构建超图模型,并确定超图关联矩阵;聚类单元,用于基于所述超图模型、所述超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果;剪枝单元,用于基于所述卷积核聚类结果对所述当前卷积层进行剪枝,生成卷积神经网络,并训练所述卷积神经网络,直至满足目标网络性能;输出单元,用于将下一卷积层作为所述当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,获取所述卷积神经网络的最终卷积核剪枝结果。
可选地,在本申请的一个实施例中,所述特征提取单元进一步用于,提取所述目标卷积神经网络任一层的多个卷积核,将每一个卷积核的参数矩阵展平为一维向量,提取所述一维向量的特征,生成所述卷积核特征集合。
可选地,在本申请的一个实施例中,所述聚类单元进一步用于,根据所述预设剪枝率计算聚类的类别数;根据所述超图关联矩阵和所述超图模型,通过超图模型结构学习计算获得新的卷积核特征集合;根据所述新的卷积核特征集合和所述聚类的类别数进行卷积核特征聚类,获得所述卷积核聚类结果。
可选地,在本申请的一个实施例中,所述剪枝单元进一步用于,根据所述卷积核聚类结果,计算每个类簇的聚类中心;根据所述聚类中心,获得并保留每个类簇中与所述聚类中心最近的卷积核,生成待保留卷积核集合;根据所述待保留卷积核集合,将其他卷积核从所述目标卷积神经网络中移除,生成剪枝后的所述卷积神经网络。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以执行如上述实施例所述的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以执行如上述实施例所述的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
本申请具有如下有益效果:
计算目标卷积神经网络其中一层的卷积核特征集合,根据卷积核特征集合构建超图模型,获得超图关联矩阵,进而根据预设剪枝率,通过超图谱聚类算法进行卷积核聚类,生成聚类中心,最后保留每个类簇中离聚类中心最近的卷积核,根据保留的卷积核重新构建一个轻量化的卷积神经网络,进而重新训练卷积神经网络模型恢复模型性能,直到卷积神经网络所有卷积层的卷积核都完成剪枝,实现了卷积神经网络模型卷积核剪枝,减小了卷积神经网络模型参数,降低了卷积神经网络推断时浮点运算量,提高了卷积神经网络模型的推理速度,有利于卷积神经网络模型在资源受限端的运用。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法的流程图;
图2为根据本申请实施例的基于超图模型谱聚类的卷积神经网络卷积核剪枝系统的结构示意图;
图3为申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法、系统、电子设备及存储介质。针对上述背景技术中心提到相关技术的网络压缩和加速方法,导致网络性能降低问题,本申请提供了一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法,在该方法中,通过计算目标卷积神经网络其中一层的卷积核特征集合,根据卷积核特征集合构建超图模型,获得超图关联矩阵,进而根据预设剪枝率,通过超图谱聚类算法进行卷积核聚类,生成聚类中心,最后保留每个类簇中离聚类中心最近的卷积核,根据保留的卷积核重新构建一个轻量化的卷积神经网络,进而重新训练卷积神经网络模型恢复模型性能,直到卷积神经网络所有卷积层的卷积核都完成剪枝,实现了卷积神经网络模型卷积核剪枝,减小了卷积神经网络模型参数,降低了卷积神经网络推断时浮点运算量,提高了卷积神经网络模型的推理速度,有利于卷积神经网络模型在资源受限端的运用。
具体而言,图1为根据本申请实施例提供的一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法的流程图。
如图1所示,该基于超图模型谱聚类的卷积神经网络卷积核剪枝方法包括以下步骤:
在步骤S101中,提取目标卷积神经网络的当前卷积层的卷积核集合,并基于卷积核集合中卷积核特征生成卷积核特征集合。
在本申请的实施例中,目标卷积神经网络可以是已经训练好的经典的图像分类模型;根据已经训练好的经典的图像分类模型,提取其中一层卷积层的卷积核集合,并根据卷积核集合生成卷积核特征集合。
可选地,在本申请的一个实施例中,提取目标卷积神经网络的当前卷积层的卷积核集合,并基于卷积核集合中卷积核特征生成卷积核特征集合,包括:提取目标卷积神经网络任一层的多个卷积核,将每一个卷积核的参数矩阵展平为一维向量,提取一维向量的特征,生成卷积核特征集合。
具体地,在目标卷积神经网络中,提取第l层卷积层的卷积核集合
Figure BDA0003574018300000041
Figure BDA0003574018300000042
式中
Figure BDA0003574018300000043
为第l层的第i个卷积核,1≤i≤n,n为第l层卷积核数量。针对每一个卷积核
Figure BDA0003574018300000044
将卷积核的参数矩阵展平为一维向量,提取其特征
Figure BDA0003574018300000045
最后生成卷积核特征集合
Figure BDA0003574018300000051
在步骤S102中,利用卷积核特征集合构建超图模型,并确定超图关联矩阵。
具体地,对于卷积核特征集合fl中的每一个卷积核,通过k近邻算法寻找与该卷积核欧式距离最近的k个卷积核,将这k个卷积核用一条超边连接起来。直到所有的卷积核都遍历一遍之后,就生成了超图,获得超图关联矩阵。
在步骤S103中,基于超图模型、超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果。
通过上述步骤得到超图模型和超图关联矩阵。利用预先设定的剪枝率以及超图谱聚类算法进行卷积核特征聚类,进而生成聚类中心。
可选地,在本申请的一个实施例中,基于超图模型、超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果,包括:根据预设剪枝率计算聚类的类别数;根据超图关联矩阵和超图模型,通过超图模型结构学习计算获得新的卷积核特征集合;根据新的卷积核特征集合和聚类的类别数进行卷积核特征聚类,获得卷积核聚类结果。
具体地,设定剪枝率为α,卷积神经网络第l层的卷积核数量为n,那么聚类的类别数为m=int(α×n)。根据超图模型,通过超图关联结构学习,生成卷积核特征集合
Figure BDA0003574018300000052
式中,
Figure BDA0003574018300000053
为卷积神经网络第l层,第i个卷积核经过超图结构学习之后获得的新特征。假设卷积神经网络第l层的卷积核数量有9个,剪枝率为34%,卷积核为
Figure BDA0003574018300000054
对应的卷积核特征集合为
Figure BDA0003574018300000055
Figure BDA0003574018300000056
经过超图结构学习获得的对应的新特征集合为
Figure BDA0003574018300000057
Figure BDA0003574018300000058
此时所求的聚类类别数为3,我们使用k-means算法将卷积核新特征集合聚成3组,形成类簇集合H={H1,H2,H3},其中H1={s1,s2},H2={s3,s4,s5},H3={s6,s7,s8,s9}。
在步骤S104中,基于卷积核聚类结果对当前卷积层进行剪枝,生成卷积神经网络,并训练卷积神经网络,直至满足目标网络性能。
在本申请的实施例中,根据聚类结果可以得到卷积核聚类中心,保留每个聚类中离聚类中心最近的卷积核,根据所保留的卷积核重新构建一个轻量化的卷积神经网络。
可选地,基于卷积核聚类结果对当前卷积层进行剪枝,生成卷积神经网络,包括:根据卷积核聚类结果,计算每个类簇的聚类中心;根据聚类中心,获得并保留每个类簇中与聚类中心最近的卷积核,生成待保留卷积核集合;根据待保留卷积核集合,将其他卷积核从目标卷积神经网络中移除,生成剪枝后的卷积神经网络。
具体地,根据步骤S103获得的聚类结果,分别计算类簇的聚类中心,记H1的聚类中心为o1,H2的聚类中心为o2,H3的聚类中心为o3。根据步骤S103获得的卷积核类簇集合H={H1,H2,H3},其中H1={s1,s2},H2={s3,s4,s5},H3={s6,s7,s8,s9},以及获得的聚类中心o1,o2,o3,计算每个类簇中与聚类中心最近的卷积核,假设s1与o1距离最近,s3与o2距离最近,s6与o3距离最近,由此生成的待保留卷积核集合为R={F1,F3,F6}。通过待保留卷积核集合R={F1,F3,F6},重新构建一个轻量化卷积神经网络。对构建的轻量化卷积神经网络重新进行训练,使其恢复到原有的卷积神经网络模型性能。
在步骤S105中,将下一卷积层作为当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,获取卷积神经网络的最终卷积核剪枝结果。
对目标卷积神经网络的每一卷积层均进行上述的步骤S101-S104的过程,直至目标卷积神经网络所有卷积层都完成剪枝过程,得到最终卷积核剪枝结果。
需要说明的是,本申请实施例中的步骤可根据实际需求进行顺序调整、合并和删减。
根据本申请实施例提出的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法,通过计算目标卷积神经网络其中一层的卷积核特征集合,根据卷积核特征集合构建超图模型,获得超图关联矩阵,进而根据预设剪枝率,通过超图谱聚类算法进行卷积核聚类,生成聚类中心,最后保留每个类簇中离聚类中心最近的卷积核,根据保留的卷积核重新构建一个轻量化的卷积神经网络,进而重新训练卷积神经网络模型恢复模型性能,直到卷积神经网络所有卷积层的卷积核都完成剪枝,实现了卷积神经网络模型卷积核剪枝,减小了卷积神经网络模型参数,降低了卷积神经网络推断时浮点运算量,提高了卷积神经网络模型的推理速度,有利于卷积神经网络模型在资源受限端的运用。
其次参照附图描述根据本申请实施例提出的基于超图模型谱聚类的卷积神经网络卷积核剪枝系统。
图2为根据本申请实施例的基于超图模型谱聚类的卷积神经网络卷积核剪枝系统的结构示意图。
如图2所示,该基于超图模型谱聚类的卷积神经网络卷积核剪枝系统10包括:特征提取单元100、超图构建单元200、聚类单元300、剪枝单元400和输出单元500。
其中,特征提取单元100,用于提取目标卷积神经网络的当前卷积层的卷积核集合,并基于卷积核集合中卷积核特征生成卷积核特征集合。超图构建单元200,用于利用卷积核特征集合构建超图模型,并确定超图关联矩阵。聚类单元300,用于基于超图模型、超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果。剪枝单元400,用于基于卷积核聚类结果对当前卷积层进行剪枝,生成卷积神经网络,并训练卷积神经网络,直至满足目标网络性能。输出单元500,用于将下一卷积层作为当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,获取卷积神经网络的最终卷积核剪枝结果。
可选地,在本申请的一个实施例中,特征提取单元100进一步用于,提取目标卷积神经网络任一层的多个卷积核,将每一个卷积核的参数矩阵展平为一维向量,提取一维向量的特征,生成卷积核特征集合。
可选地,在本申请的一个实施例中,聚类单元200进一步用于,根据预设剪枝率计算聚类的类别数;根据超图关联矩阵和超图模型,通过超图模型结构学习计算获得新的卷积核特征集合;根据新的卷积核特征集合和聚类的类别数进行卷积核特征聚类,获得卷积核聚类结果。
可选地,在本申请的一个实施例中,剪枝单元400进一步用于,根据卷积核聚类结果,计算每个类簇的聚类中心;根据聚类中心,获得并保留每个类簇中与聚类中心最近的卷积核,生成待保留卷积核集合;根据待保留卷积核集合,将其他卷积核从目标卷积神经网络中移除,生成剪枝后的卷积神经网络。
需要说明的是,前述对基于超图模型谱聚类的卷积神经网络卷积核剪枝方法实施例的解释说明也适用于该实施例的基于超图模型谱聚类的卷积神经网络卷积核剪枝系统,此处不再赘述。
根据本申请实施例提出的基于超图模型谱聚类的卷积神经网络卷积核剪枝系统,通过计算目标卷积神经网络其中一层的卷积核特征集合,根据卷积核特征集合构建超图模型,获得超图关联矩阵,进而根据预设剪枝率,通过超图谱聚类算法进行卷积核聚类,生成聚类中心,最后保留每个类簇中离聚类中心最近的卷积核,根据保留的卷积核重新构建一个轻量化的卷积神经网络,进而重新训练卷积神经网络模型恢复模型性能,直到卷积神经网络所有卷积层的卷积核都完成剪枝,实现了卷积神经网络模型卷积核剪枝,减小了卷积神经网络模型参数,降低了卷积神经网络推断时浮点运算量,提高了卷积神经网络模型的推理速度,有利于卷积神经网络模型在资源受限端的运用。
图3为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器301、处理器302及存储在存储器301上并可在处理器302上运行的计算机程序。
处理器302执行程序时实现上述实施例中提供的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
进一步地,电子设备还包括:
通信接口303,用于存储器301和处理器302之间的通信。
存储器301,用于存放可在处理器302上运行的计算机程序。
存储器301可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器301、处理器302和通信接口303独立实现,则通信接口303、存储器301和处理器302可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器301、处理器302及通信接口303,集成在一块芯片上实现,则存储器301、处理器302及通信接口303可以通过内部接口完成相互间的通信。
处理器302可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

Claims (10)

1.一种基于超图模型谱聚类的卷积神经网络卷积核剪枝方法,其特征在于,包括以下步骤:
提取目标卷积神经网络的当前卷积层的卷积核集合,并基于所述卷积核集合中卷积核特征生成卷积核特征集合;
利用所述卷积核特征集合构建超图模型,并确定超图关联矩阵;
基于所述超图模型、所述超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果;
基于所述卷积核聚类结果对所述当前卷积层进行剪枝,生成卷积神经网络,并训练所述卷积神经网络,直至满足目标网络性能;
将下一卷积层作为所述当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,获取所述卷积神经网络的最终卷积核剪枝结果。
2.根据权利要求1所述的方法,其特征在于,所述提取目标卷积神经网络的当前卷积层的卷积核集合,并基于所述卷积核集合中卷积核特征生成卷积核特征集合,包括:
提取所述目标卷积神经网络任一层的多个卷积核,将每一个卷积核的参数矩阵展平为一维向量,提取所述一维向量的特征,生成所述卷积核特征集合。
3.根据权利要求1所述的方法,其特征在于,所述基于所述超图模型、所述超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果,包括:
根据所述预设剪枝率计算聚类的类别数;
根据所述超图关联矩阵和所述超图模型,通过超图模型结构学习计算获得新的卷积核特征集合;
根据所述新的卷积核特征集合和所述聚类的类别数进行卷积核特征聚类,获得所述卷积核聚类结果。
4.根据权利要求1所述的方法,其特征在于,所述基于所述卷积核聚类结果对所述当前卷积层进行剪枝,生成卷积神经网络,包括:
根据所述卷积核聚类结果,计算每个类簇的聚类中心;
根据所述聚类中心,获得并保留每个类簇中与所述聚类中心最近的卷积核,生成待保留卷积核集合;
根据所述待保留卷积核集合,将其他卷积核从所述目标卷积神经网络中移除,生成剪枝后的所述卷积神经网络。
5.一种基于超图模型谱聚类的卷积神经网络卷积核剪枝系统,其特征在于,包括:
特征提取单元,用于提取目标卷积神经网络的当前卷积层的卷积核集合,并基于所述卷积核集合中卷积核特征生成卷积核特征集合;
超图构建单元,用于利用所述卷积核特征集合构建超图模型,并确定超图关联矩阵;
聚类单元,用于基于所述超图模型、所述超图关联矩阵和预设剪枝率进行卷积核特征聚类,生成卷积核聚类结果;
剪枝单元,用于基于所述卷积核聚类结果对所述当前卷积层进行剪枝,生成卷积神经网络,并训练所述卷积神经网络,直至满足目标网络性能;
输出单元,用于将下一卷积层作为所述当前卷积层,继续剪枝,直至所有卷积层均完成剪枝,获取所述卷积神经网络的最终卷积核剪枝结果。
6.根据权利要求5所述的系统,其特征在于,所述特征提取单元进一步用于,提取所述目标卷积神经网络任一层的多个卷积核,将每一个卷积核的参数矩阵展平为一维向量,提取所述一维向量的特征,生成所述卷积核特征集合。
7.根据权利要求5所述的系统,其特征在于,所述聚类单元进一步用于,根据所述预设剪枝率计算聚类的类别数;根据所述超图关联矩阵和所述超图模型,通过超图模型结构学习计算获得新的卷积核特征集合;根据所述新的卷积核特征集合和所述聚类的类别数进行卷积核特征聚类,获得所述卷积核聚类结果。
8.根据权利要求5所述的系统,其特征在于,所述剪枝单元进一步用于,根据所述卷积核聚类结果,计算每个类簇的聚类中心;根据所述聚类中心,获得并保留每个类簇中与所述聚类中心最近的卷积核,生成待保留卷积核集合;根据所述待保留卷积核集合,将其他卷积核从所述目标卷积神经网络中移除,生成剪枝后的所述卷积神经网络。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的基于超图模型谱聚类的卷积神经网络卷积核剪枝方法。
CN202210334415.7A 2022-03-30 2022-03-30 基于超图模型谱聚类的卷积神经网络卷积核剪枝方法 Pending CN114723043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210334415.7A CN114723043A (zh) 2022-03-30 2022-03-30 基于超图模型谱聚类的卷积神经网络卷积核剪枝方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210334415.7A CN114723043A (zh) 2022-03-30 2022-03-30 基于超图模型谱聚类的卷积神经网络卷积核剪枝方法

Publications (1)

Publication Number Publication Date
CN114723043A true CN114723043A (zh) 2022-07-08

Family

ID=82241068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210334415.7A Pending CN114723043A (zh) 2022-03-30 2022-03-30 基于超图模型谱聚类的卷积神经网络卷积核剪枝方法

Country Status (1)

Country Link
CN (1) CN114723043A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168275A (zh) * 2023-04-20 2023-05-26 新立讯科技股份有限公司 基于特征分组和通道置换的轻量型双注意力机制识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168275A (zh) * 2023-04-20 2023-05-26 新立讯科技股份有限公司 基于特征分组和通道置换的轻量型双注意力机制识别方法

Similar Documents

Publication Publication Date Title
CN109978142B (zh) 神经网络模型的压缩方法和装置
EP4080416A1 (en) Adaptive search method and apparatus for neural network
CN111950656B (zh) 图像识别模型生成方法、装置、计算机设备和存储介质
CN109214353B (zh) 一种基于剪枝模型的人脸图像快速检测训练方法和装置
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN113657421B (zh) 卷积神经网络压缩方法和装置、图像分类方法和装置
WO2023098544A1 (zh) 基于局部稀疏约束的结构化剪枝方法和装置
CN111860771B (zh) 一种应用于边缘计算的卷积神经网络计算方法
CN111723915A (zh) 深度卷积神经网络的剪枝方法、计算机设备及应用方法
CN111784699B (zh) 一种对三维点云数据进行目标分割方法、装置及终端设备
CN113850281A (zh) 一种基于meanshift优化的数据处理方法和装置
CN113283473B (zh) 一种基于cnn特征映射剪枝的快速水下目标识别方法
CN113177580A (zh) 基于通道重要性剪枝与二值量化的图像分类系统
WO2023236319A1 (zh) 一种面向微控制器的卷积神经网络部署和优化方法
CN114332500A (zh) 图像处理模型训练方法、装置、计算机设备和存储介质
CN114861880A (zh) 基于空洞卷积神经网络的工业设备故障预测方法及装置
KR20200117690A (ko) 멀티 홉 이웃을 이용한 컨볼루션 학습 기반의 지식 그래프 완성 방법 및 장치
CN114723043A (zh) 基于超图模型谱聚类的卷积神经网络卷积核剪枝方法
CN117690451A (zh) 一种基于集成学习的神经网络噪声源分类的方法及装置
CN116912576B (zh) 基于脑网络高阶结构的自适应图卷积脑疾病分类方法
CN113313237A (zh) 一种神经网络训练方法
CN112613604A (zh) 神经网络的量化方法及装置
CN113240090A (zh) 图像处理模型生成方法、图像处理方法、装置及电子设备
CN117421657A (zh) 一种基于过采样策略的带噪标签样本筛选学习方法及系统
CN110321799B (zh) 一种基于sbr和平均类间距离的场景数选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination