CN113516638A - 一种神经网络内部特征重要性可视化分析及特征迁移方法 - Google Patents

一种神经网络内部特征重要性可视化分析及特征迁移方法 Download PDF

Info

Publication number
CN113516638A
CN113516638A CN202110710164.3A CN202110710164A CN113516638A CN 113516638 A CN113516638 A CN 113516638A CN 202110710164 A CN202110710164 A CN 202110710164A CN 113516638 A CN113516638 A CN 113516638A
Authority
CN
China
Prior art keywords
network
layer
data
value
neuron
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110710164.3A
Other languages
English (en)
Other versions
CN113516638B (zh
Inventor
周芳芳
谭依静
王心远
胡坤霖
胡雨豪
马建光
刘超
张健
郭克华
任盛
王磊
刘熙尧
赵颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese People's Liberation Army 32801
Central South University
Original Assignee
Chinese People's Liberation Army 32801
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese People's Liberation Army 32801, Central South University filed Critical Chinese People's Liberation Army 32801
Priority to CN202110710164.3A priority Critical patent/CN113516638B/zh
Publication of CN113516638A publication Critical patent/CN113516638A/zh
Application granted granted Critical
Publication of CN113516638B publication Critical patent/CN113516638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10048Infrared image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种神经网络内部特征重要性可视化分析及特征迁移方法,通过基于先验知识对数据集进行采样,划分代表性数据子集,对数据子集平均化、正则化,得到数据子集标准平均图,根据导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像,基于特征可视化图像与标准平均图的余弦相似度作为对应神经元的价值,根据层相似值判断网络层拟合情况和层内神经元相似值评估网络神经元拟合情况,使用神经网络剪枝算法提取高价值网络模块并进行迁移测试。本发明实现以量化与可视化结合的方式衡量卷积神经网络特征重要性,完成对原模型重要特征的提取重用,提高神经网络模型可解释性,帮助分析理解模型拟合情况。

Description

一种神经网络内部特征重要性可视化分析及特征迁移方法
技术领域
本发明属于迁移学习、神经网络深度学习技术领域,具体地说,涉及一种神经网络内部特征重要性可视化分析及特征迁移方法。
背景技术
深度学习模型不依赖手工制作特征,能够自动地从标注的图像数据中学习目标特性,可有效区分真实目标与复杂背景物,表现出很强的泛化能力。但深度学习模型结构复杂,特征丰富,通常有数百层和数以万计的自学习特征,具有不可解释特性,人工无法有效获取和理解其学习到的目标特性,使得这些潜在的重要目标特性不能被量化评估和高效利用。由于神经网络的复杂性产生的黑盒属性,许多可视化方法被用于解释其内部神经元特征,如导向反向传播等。
尽管对神经网络特征进行可视化有利于人眼直观感受,却不能指导计算机评估神经网络的特征好坏。而在迁移学习领域中,人们通常通过L2正则化值等方法来判断某个神经元的价值,以此来指导神经元剪枝,便于重要模块与高价值神经元的保留与重用,但是这些指标存在评估方式单一,评估不准确,指标客观性难以衡量的问题。
发明内容
本发明的目的在于解决现有技术中存在的问题,提供一种神经网络内部特征重要性可视化分析及特征迁移方法。该方法通过基于先验知识对数据集进行采样,划分代表性数据子集,对数据子集平均化、正则化,得到数据子集标准平均图,根据导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像,最后基于特征可视化图像与标准平均图的余弦相似度作为对应神经元的价值,根据层相似值判断网络层拟合情况,根据层内神经元相似值评估网络神经元拟合情况,使用神经网络剪枝算法提取高价值网络模块并进行迁移测试。本发明针对深度神经网络解释性不足的问题,实现了以量化与可视化结合的方式衡量卷积神经网络特征重要性,并完成了对原模型重要特征的提取重用,可以提高神经网络模型可解释性、帮助研究人员分析理解模型拟合情况、辅助模型优化。
其具体技术方案为:
一种神经网络内部特征重要性可视化分析及特征迁移方法,包括以下步骤:
步骤1:获取已训练的神经网络模型的特征提取部分,识别其卷积层位置;
步骤2:基于先验知识对数据集进行采样,划分代表性数据子集:
对于共有K类的数据,CK={Ci|i=0,1,...,K}表示所有类的数据,根据先验知识,如目标大小、方向、类别等目标特性将原数据划分为数据子集CN={Ci|i=0,1,...,K;K≥N};
步骤3:数据子集平均化和正则化,获取数据子集标准平均图:
对于数据子集CN,每个数据子集包含n个数据实例,计算每个数据子集的标准平均图
Figure BDA0003133316600000021
σ为min-max正则化;
步骤4:使用导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像Ω={ωilf|i=0,1,...,N,l=0,1,...,L,f=0,1,...,F};
步骤5:计算特征可视化图像与标准平均图的余弦相似度
Figure BDA0003133316600000022
Figure BDA0003133316600000023
获取每个神经元的平均指标相似值;
步骤6:对网络相似值进行层间分析与层内分析:
基于步骤5获取的网络神经元相似度指标,进行神经元、层、网络模块多层次的信息提取能力分析,基于层内与层间相似值波动性、稳定性、梯度变化,对网络进行多角度分析,了解网络拟合程度、泛化程度、过拟合问题等信息;
步骤7:根据层及神经元相似值排序,获取神经元价值排序序列;
步骤8:使用神经网络剪枝算法提取高价值网络模块并进行迁移测试。
进一步地,所述步骤2与步骤3中,基于先验知识对数据集进行采样,划分代表性数据子集,并求取标准平均图包括以下步骤:
步骤2.1:基于目标物体类别、目标大小、目标方向、主体语义内容对数据集进行采样,数据子集采样数量为每个子集20~30张图像,数据子集数量为每个原数据类别划分4个数据子集;
步骤3.1:将数据子集中图像归一化至0-1区间后,计算每个数据子集图像的平均图像,得到平均图;
步骤3.2:计算原数据子集的图像的最大最小值,对平均图进行min-max正则化,获取标准平均图。
进一步地,所述步骤4与步骤5中,使用导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像及其价值指标相似值,包括以下步骤:
步骤4.1:加载网络模型,修改网络反向传播终止位置,使网络可以获取输入层的梯度信息,修改ReLU层的梯度反向传播过程;
步骤4.2:加载网络卷积层信息,包含卷积层位置,卷积层神经元数量,网络层次信息;
步骤4.3:加载标准平均图,转换为GPU张量形式;
步骤4.4:从浅层至深层遍历网络,基于导向反向传播计算每层每个神经元的特征可视化图像;
步骤5.1:计算特征可视化图像与对应输入的标准平均图的余弦相似值,存储为该神经元的价值指标。
进一步地,所述步骤6中,对网络相似值进行层间分析与层内分析包括以下步骤:
步骤6.1:显示网络单层内神经元可视化图像与对应相似值,观察相似值分布情况,观察特征可视化图像对应相似值。
步骤6.2:可视化图像列表基于神经元相似值进行排序,观察高相似值及低相似值特征可视化图像中目标语义信息,目标纹理信息。
步骤6.3:绘制单层神经元相似值折线图,分析每层神经元对应曲线的波动情况,高波动层泛化能力更强,低波动层泛化能力更弱,层相似值中线对应网络层拟合情况,高相似值拟合更优;
步骤6.4:根据步骤6.3中的相似值曲线,观察网络由浅至深的曲线变化情况,判断网络相似值是否逐步上升并稳定;
步骤6.5:计算每层网络相似值的平均值,绘制层平均相似值曲线;
步骤6.6:根据步骤6.5的层平均相似值曲线,观察曲线突变点对应网络层,该层为高价值层;
步骤6.7:根据步骤6.5的层平均相似值曲线,观察网络深层折线变化情况,折线平缓代表网络发生过拟合问题,可以通过减少网络层、增大数据集、冻结浅层网络重复训练提升网络深层性能;
步骤6.7:根据步骤6.5的层平均相似值曲线,对比不同数据类别或不同子集曲线,判断网络对对应数据的拟合情况。
进一步地,所述步骤7与步骤8中,使用神经网络剪枝算法基于神经元相似值排序提取高价值网络模块并进行迁移测试包括以下步骤:
步骤7.1:根据层及神经元相似值排序,获取神经元价值排序序列;
步骤7.2:根据原数据类别对数据子集相似值进行平均,选取测试准确率最高的类别的相似值作为价值排序基准;
步骤8.1:加载网络测试模块与网络层信息,在测试集上测试每类数据准确率,绘制准确率混淆矩阵作为基准;
步骤8.2:选取单层网络,设置神经元提取数量,根据价值排序将BatchNorm层低价值神经元对应激活置零;
步骤8.3:将该层网络嵌回原网络,在测试集上测试每类数据准确率,绘制准确率混淆矩阵,与基准矩阵做差进行比较,判断对应类别准确率变化及整体准确率变化情况;
步骤8.4:重复执行步骤8.1至步骤8.4,每隔5层进行神经元提取重用测试,提取数量为10%或30%。
步骤8.5:加载网络测试模块与网络层信息,在测试集上测试每类数据准确率,绘制准确率混淆矩阵作为基准;
步骤8.6:选取更高层次的网络模块,每个模块包含多个卷积层,设置神经元提取数量,根据价值排序将模块内每层对应的BatchNorm层低价值神经元对应激活置零;
步骤8.7:将该网络模块嵌回原网络,在测试集上测试每类数据准确率,绘制准确率混淆矩阵,与基准矩阵做差进行比较,判断对应类别准确率变化及整体准确率变化情况;
步骤8.8:重复执行步骤8.5至步骤8.8,由浅层至深层对网络的每个模块进行提取重用测试;
步骤8.9:根据层提取重用测试及模块提取重用测试得到的准确率变化结果,判断网络各结构的重要性。
与现有技术相比,本发明的有益效果:
本发明的方法能够基于平均图原理对红外舰船目标识别模型内部特征进行重要性可视化分析及重要特征迁移,帮助找到对舰船目标识别起关键作用的重要目标特性与可解释特征,实现重要特征迁移重用与域不变特征提取,达到更好的军事舰船分类检测效果和泛化能力。
附图说明
图1是本发明神经网络内部特征重要性可视化分析及特征迁移方法的流程图;
图2是本发明实施例中将平均图进行min-max正则化的结果示意图;
图3是本发明实施例中的模块2子模块1层4的第64号神经元与类0的姿态1的相似值;
图4是本发明实施例中的层内分析结果示意图;
图5是本发明实施例中的层间分析结果示意图。
具体实施方式
下面结合附图和具体实施方案对本发明的技术方案作进一步详细地说明。
参照图1,本发明提供了一种神经网络内部特征重要性可视化分析及特征迁移方法,
包括以下步骤:
步骤1:获取已训练的神经网络模型的特征提取部分,识别其卷积层位置;
步骤2:基于先验知识对数据集进行采样,划分代表性数据子集:
对于共有K类的数据,CK={Ci|i=0,1,...,K}表示所有类的数据,根据先验知识,如目标大小、方向、类别等目标特性将原数据划分为数据子集CN={Ci|i=0,1,...,K;K≥N};
步骤3:数据子集平均化和正则化,获取数据子集标准平均图:
对于数据子集CN,每个数据子集包含n个数据实例,计算每个数据子集的标准平均图
Figure BDA0003133316600000071
σ为min-max正则化;
步骤4:使用导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像Ω={ωilf|i=0,1,...,N,l=0,1,...,L,f=0,1,...,F};
步骤5:计算特征可视化图像与标准平均图的余弦相似度
Figure BDA0003133316600000072
Figure BDA0003133316600000073
获取每个神经元的平均指标相似值;
步骤6:对网络相似值进行层间分析与层内分析:
基于步骤5获取的网络神经元相似度指标,进行神经元、层、网络模块多层次的信息提取能力分析,基于层内与层间相似值波动性、稳定性、梯度变化,对网络进行多角度分析,了解网络拟合程度、泛化程度、过拟合问题等信息;
步骤7:根据层及神经元相似值排序,获取神经元价值排序序列;
步骤8:使用神经网络剪枝算法提取高价值网络模块并进行迁移测试。
所述步骤1中,深度神经网络模型为卷积神经网络模型或神经网络的卷积网络模块。
所述步骤2中,对数据集的采样方式为基于目标物体类别、目标大小、目标方向、主体语义内容。
所述步骤3中,对于数据子集进行平均化后,对平均图像使用正则化方法,正则化方法为min-max正则化,正则化后的平均图像的最大最小值与原数据集的最大最小值相同。
所述步骤4中,使用导向反向传播特征可视化算法对网络卷积层的所有神经元求取所有标准平均图的特征可视化图像,导向反向传播程序输入标准平均图及网络卷积层信息,反向传播算法部分针对输入模型结构进行设计。
所述步骤5中,导向反向传播算法获取特征可视化图像的同时,计算特征可视化图像与对应数据子集类别的标准平均图的相似度,该相似度包括余弦相似度、欧式距离。
所述步骤6中,对网络神经元相似值进行层内分析,层内分析策略包括:网络层神经元可视化图像与对应相似值耦合显示,基于神经元相似值排序的可视化图像列表分析,单层神经元相似值折线图波动分析,单层神经元相似值折线图变化分析。
所述步骤6中,对网络神经元相似值进行层间分析,层间分析策略为层平均相似值曲线分析,分析角度包括:层相似值突变位置分析,层相似值梯度变化分析,深层网络拟合分析,多类数据曲线对比分析。
所述步骤7中,基于神经元相似值,逐层计算层内神经元价值排序,存储为神经元下标索引。
所述步骤8中,使用基于网络BatchNorm层的剪枝算法,神经元提取剪枝策略为基于神经元相似值排序,提取高相似值神经元,第相似值神经元激活置零。
所述步骤8中,对高价值网络模块迁移的测试方法为单层迁移与模块迁移:单层迁移为从网络浅层至深层,每间隔五层进行神经元重用测试,提取当前层多种比例的神经元数量,如10%,30%等,然后将重用网络在测试集测试其准确率变化,观察其准确率混淆矩阵与标准网络的混淆矩阵的变化,判断提取性能;多层迁移与单层迁移策略一致,迁移目标变更为由多层网络组成的网络高层次模块。
本发明的方法通过对舰船热图数据集基于先验知识的平均图获取,包括舰船姿态数据子集选取,对每个数据子集平均化得到平均图,将平均图进行min-max正则化得到标准平均图;再通过将平均图输入网络,利用导向反向传播获取网络中每个神经元对于每张标准平均图的可视化图像,再计算每张平均图与可视化图像的余弦距离得到网络中每个神经元的相似性重要性价值指标;最后基于神经元相似度值指标可以进行神经元、层、网络模块多层次的信息提取能力分析,对网络模型进行神经元、层、模块中重要结构的提取,并进一步重用至原模型或新模型中,完成特征迁移的任务。本发明提供了一种基于平均图原理对红外舰船目标识别模型内部特征进行重要性可视化分析及重要特征迁移的方法,帮助找到对舰船目标识别起关键作用的重要目标特性与可解释特征,实现重要特征迁移重用与域不变特征提取,达到更好的军事舰船分类检测效果和泛化能力。
本发明方法具体实施方式如下:
步骤1:基于先验知识的平均图获取。通过已有先验知识对舰船数据集进行采样,获取具有代表性的舰船姿态数据子集。每类舰船数据中选取四种舰船姿态(低仰角,高仰角旋转1,高仰角旋转2,小目标),每种姿态20~30张图片,最终得到4类*4姿态的16组数据子集;对每个数据子集进行平均化操作得到16张平均图;将平均图进行min-max正则化,由此得到如图2所示的结果。
步骤2:可视化特征图与标准平均图相似性度量。使用导向反向传播在孪生网络跨域模型的所有神经元上计算平均图的特征可视化图像,使用余弦相似度评估标准平均图与特征可视化图像的相似性,由此得到每个神经元对于该类数据子集的相似值,此相似值即为衡量神经元信息提取能力的量化指标。图3为模块2子模块1层4的第64号神经元与类0的姿态1的相似值:
步骤3:多尺度特征重要性分析与网络模块的提取、剪枝、重用。
步骤3.1:基于神经元相似度重要性指标,可从层内与层间两个角度对神经元特征进行重要性分析。具体分析结果如图4、图5所示。
A.层内分析结果(针对类别0姿态0)如图4所示。
B.层间分析结果如图5所示。
步骤3.2:基于批归一化层BatchNorm的神经网络剪枝策略,通过将BatchNorm层指定位置的权重置0可以实现对特定神经元的修剪。分别将VGG模型的前6,7,8卷积层及其权重保存下来,拼接上新的分类器,冻结特征提取器,使用原数据只训练分类器,经过一个epoch与之前相同的训练,分别在训练集上得到了87%,97%,96%的准确率。该可结果证明sim值可以代表层信息量。
VGG_S_6:
Avg.loss:0.0186,Accuracy:13969/16000(87%)
VGG_S_7:
Avg.loss:0.0071,Accuracy:15462/16000(97%)
VGG_S_8:
Avg.loss:0.0083,Accuracy:15316/16000(96%)
本发明的方法能够基于平均图原理对红外舰船目标识别模型内部特征进行重要性可视化分析及重要特征迁移,帮助找到对舰船目标识别起关键作用的重要目标特性与可解释特征,实现重要特征迁移重用与域不变特征提取,达到更好的军事舰船分类检测效果和泛化能力。
以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

Claims (5)

1.一种神经网络内部特征重要性可视化分析及特征迁移方法,其特征在于,包括以下步骤:
步骤1:获取已训练的神经网络模型的特征提取部分,识别其卷积层位置;
步骤2:基于先验知识对数据集进行采样,划分代表性数据子集:
对于共有K类的数据,CK={Ci|i=0,1,...,K}表示所有类的数据,根据先验知识,目标大小、方向、类别的目标特性将原数据划分为数据子集CN={Ci|i=0,1,...,K;K≥N};
步骤3:数据子集平均化和正则化,获取数据子集标准平均图:
对于数据子集CN,每个数据子集包含n个数据实例,计算每个数据子集的标准平均图
Figure FDA0003133316590000011
σ为min-max正则化;
步骤4:使用导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像Ω={ωilf|i=0,1,...,N,l=0,1,...,L,f=0,1,...,F};
步骤5:计算特征可视化图像与标准平均图的余弦相似度
Figure FDA0003133316590000012
Figure FDA0003133316590000013
获取每个神经元的平均指标相似值;
步骤6:对网络相似值进行层间分析与层内分析:
基于步骤5获取的网络神经元相似度指标,进行神经元、层、网络模块多层次的信息提取能力分析,基于层内与层间相似值波动性、稳定性、梯度变化,对网络进行多角度分析,了解网络拟合程度、泛化程度、过拟合问题;
步骤7:根据层及神经元相似值排序,获取神经元价值排序序列;
步骤8:使用神经网络剪枝算法提取高价值网络模块并进行迁移测试。
2.根据权利要求1所述的神经网络内部特征重要性可视化分析及特征迁移方法,其特征在于,所述步骤2与步骤3中,基于先验知识对数据集进行采样,划分代表性数据子集,并求取标准平均图包括以下步骤:
步骤2.1:基于目标物体类别、目标大小、目标方向、主体语义内容对数据集进行采样,数据子集采样数量为每个子集20~30张图像,数据子集数量为每个原数据类别划分4个数据子集;
步骤3.1:将数据子集中图像归一化至0-1区间后,计算每个数据子集图像的平均图像,得到平均图;
步骤3.2:计算原数据子集的图像的最大最小值,对平均图进行min-max正则化,获取标准平均图。
3.根据权利要求1所述的神经网络内部特征重要性可视化分析及特征迁移方法,其特征在于,所述步骤4与步骤5中,使用导向反向传播特征可视化方法获取神经网络内部所有神经元针对每张标准平均图的特征可视化图像及其价值指标相似值,包括以下步骤:
步骤4.1:加载网络模型,修改网络反向传播终止位置,使网络获取输入层的梯度信息,修改ReLU层的梯度反向传播过程;
步骤4.2:加载网络卷积层信息,包含卷积层位置,卷积层神经元数量,网络层次信息;
步骤4.3:加载标准平均图,转换为GPU张量形式;
步骤4.4:从浅层至深层遍历网络,基于导向反向传播计算每层每个神经元的特征可视化图像;
步骤5.1:计算特征可视化图像与对应输入的标准平均图的余弦相似值,存储为该神经元的价值指标。
4.根据权利要求1所述的神经网络内部特征重要性可视化分析及特征迁移方法,其特征在于,所述步骤6中,对网络相似值进行层间分析与层内分析包括以下步骤:
步骤6.1:显示网络单层内神经元可视化图像与对应相似值,观察相似值分布情况,观察特征可视化图像对应相似值;
步骤6.2:可视化图像列表基于神经元相似值进行排序,观察高相似值及低相似值特征可视化图像中目标语义信息,目标纹理信息;
步骤6.3:绘制单层神经元相似值折线图,分析每层神经元对应曲线的波动情况,高波动层泛化能力更强,低波动层泛化能力更弱,层相似值中线对应网络层拟合情况,高相似值拟合更优;
步骤6.4:根据步骤6.3中的相似值曲线,观察网络由浅至深的曲线变化情况,判断网络相似值是否逐步上升并稳定;
步骤6.5:计算每层网络相似值的平均值,绘制层平均相似值曲线;
步骤6.6:根据步骤6.5的层平均相似值曲线,观察曲线突变点对应网络层,该层为高价值层;
步骤6.7:根据步骤6.5的层平均相似值曲线,观察网络深层折线变化情况,折线平缓代表网络发生过拟合问题,通过减少网络层、增大数据集、冻结浅层网络重复训练提升网络深层性能;
步骤6.7:根据步骤6.5的层平均相似值曲线,对比不同数据类别或不同子集曲线,判断网络对对应数据的拟合情况。
5.根据权利要求1所述的神经网络内部特征重要性可视化分析及特征迁移方法,其特征在于,所述步骤7与步骤8中,使用神经网络剪枝算法基于神经元相似值排序提取高价值网络模块并进行迁移测试包括以下步骤:
步骤7.1:根据层及神经元相似值排序,获取神经元价值排序序列;
步骤7.2:根据原数据类别对数据子集相似值进行平均,选取测试准确率最高的类别的相似值作为价值排序基准;
步骤8.1:加载网络测试模块与网络层信息,在测试集上测试每类数据准确率,绘制准确率混淆矩阵作为基准;
步骤8.2:选取单层网络,设置神经元提取数量,根据价值排序将BatchNorm层低价值神经元对应激活置零;
步骤8.3:将该层网络嵌回原网络,在测试集上测试每类数据准确率,绘制准确率混淆矩阵,与基准矩阵做差进行比较,判断对应类别准确率变化及整体准确率变化情况;
步骤8.4:重复执行步骤8.1至步骤8.4,每隔5层进行神经元提取重用测试,提取数量为10%或30%;
步骤8.5:加载网络测试模块与网络层信息,在测试集上测试每类数据准确率,绘制准确率混淆矩阵作为基准;
步骤8.6:选取更高层次的网络模块,每个模块包含多个卷积层,设置神经元提取数量,根据价值排序将模块内每层对应的BatchNorm层低价值神经元对应激活置零;
步骤8.7:将该网络模块嵌回原网络,在测试集上测试每类数据准确率,绘制准确率混淆矩阵,与基准矩阵做差进行比较,判断对应类别准确率变化及整体准确率变化情况;
步骤8.8:重复执行步骤8.5至步骤8.8,由浅层至深层对网络的每个模块进行提取重用测试;
步骤8.9:根据层提取重用测试及模块提取重用测试得到的准确率变化结果,判断网络各结构的重要性。
CN202110710164.3A 2021-06-25 2021-06-25 一种神经网络内部特征重要性可视化分析及特征迁移方法 Active CN113516638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110710164.3A CN113516638B (zh) 2021-06-25 2021-06-25 一种神经网络内部特征重要性可视化分析及特征迁移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110710164.3A CN113516638B (zh) 2021-06-25 2021-06-25 一种神经网络内部特征重要性可视化分析及特征迁移方法

Publications (2)

Publication Number Publication Date
CN113516638A true CN113516638A (zh) 2021-10-19
CN113516638B CN113516638B (zh) 2022-07-19

Family

ID=78065928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110710164.3A Active CN113516638B (zh) 2021-06-25 2021-06-25 一种神经网络内部特征重要性可视化分析及特征迁移方法

Country Status (1)

Country Link
CN (1) CN113516638B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241271A (zh) * 2021-11-16 2022-03-25 电子科技大学 一种多孪生迁移学习融合多信息的机械故障智能诊断方法
CN114330714A (zh) * 2022-03-08 2022-04-12 北京环境特性研究所 卷积神经网络剪枝优化方法、装置、电子设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170249547A1 (en) * 2016-02-26 2017-08-31 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Holistic Extraction of Features from Neural Networks
CN109800277A (zh) * 2018-12-18 2019-05-24 合肥天源迪科信息技术有限公司 一种机器学习平台及基于该平台的数据模型优化方法
KR20190062225A (ko) * 2017-11-28 2019-06-05 주식회사 날비컴퍼니 컨볼루션 신경망 내 필터 프루닝 장치 및 방법
US20190171926A1 (en) * 2017-12-01 2019-06-06 International Business Machines Corporation Convolutional neural network with sparse and complementary kernels
CN110458160A (zh) * 2019-07-09 2019-11-15 北京理工大学 一种基于深度压缩神经网络的无人艇水面目标识别算法
CN110504029A (zh) * 2019-08-29 2019-11-26 腾讯医疗健康(深圳)有限公司 一种医学图像处理方法、医学图像识别方法及装置
CN111243042A (zh) * 2020-02-28 2020-06-05 浙江德尚韵兴医疗科技有限公司 基于深度学习的超声甲状腺结节良恶性特征可视化的方法
CN111260662A (zh) * 2020-01-16 2020-06-09 南开大学 超小参数量的分割模型的实现方法
KR102165273B1 (ko) * 2019-04-02 2020-10-13 국방과학연구소 소형 뉴럴 네트워크의 채널 프루닝(pruning) 방법 및 시스템
CN112183747A (zh) * 2020-09-29 2021-01-05 华为技术有限公司 神经网络训练的方法、神经网络的压缩方法以及相关设备
CN112270405A (zh) * 2020-11-26 2021-01-26 湖南大学 基于范数的卷积神经网络模型的滤波器剪枝方法和系统
CN112906867A (zh) * 2021-03-03 2021-06-04 安徽省科亿信息科技有限公司 一种基于像素梯度加权的卷积神经网络特征可视化方法及系统
CN112927173A (zh) * 2021-04-12 2021-06-08 平安科技(深圳)有限公司 模型压缩方法、装置、计算设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170249547A1 (en) * 2016-02-26 2017-08-31 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Holistic Extraction of Features from Neural Networks
KR20190062225A (ko) * 2017-11-28 2019-06-05 주식회사 날비컴퍼니 컨볼루션 신경망 내 필터 프루닝 장치 및 방법
US20190171926A1 (en) * 2017-12-01 2019-06-06 International Business Machines Corporation Convolutional neural network with sparse and complementary kernels
CN109800277A (zh) * 2018-12-18 2019-05-24 合肥天源迪科信息技术有限公司 一种机器学习平台及基于该平台的数据模型优化方法
KR102165273B1 (ko) * 2019-04-02 2020-10-13 국방과학연구소 소형 뉴럴 네트워크의 채널 프루닝(pruning) 방법 및 시스템
CN110458160A (zh) * 2019-07-09 2019-11-15 北京理工大学 一种基于深度压缩神经网络的无人艇水面目标识别算法
CN110504029A (zh) * 2019-08-29 2019-11-26 腾讯医疗健康(深圳)有限公司 一种医学图像处理方法、医学图像识别方法及装置
CN111260662A (zh) * 2020-01-16 2020-06-09 南开大学 超小参数量的分割模型的实现方法
CN111243042A (zh) * 2020-02-28 2020-06-05 浙江德尚韵兴医疗科技有限公司 基于深度学习的超声甲状腺结节良恶性特征可视化的方法
CN112183747A (zh) * 2020-09-29 2021-01-05 华为技术有限公司 神经网络训练的方法、神经网络的压缩方法以及相关设备
CN112270405A (zh) * 2020-11-26 2021-01-26 湖南大学 基于范数的卷积神经网络模型的滤波器剪枝方法和系统
CN112906867A (zh) * 2021-03-03 2021-06-04 安徽省科亿信息科技有限公司 一种基于像素梯度加权的卷积神经网络特征可视化方法及系统
CN112927173A (zh) * 2021-04-12 2021-06-08 平安科技(深圳)有限公司 模型压缩方法、装置、计算设备及存储介质

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
ALESSIO ANSUINI ET AL: "《investigating similarity metrics for convolutional neural networks in th case of unstructured pruning》", 《HTTPS://LINK.SPRINGER.COM/CHAPTER/10.1007/978-3-030-66125-0_6》 *
CHENGLONG ZHAO ET AL: "《Variational Convolutional Neural Network Pruning》", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
CODY BLAKENEY ET AL: "《is pruning compression? investigating pruning via network layer similarity》", 《2020 IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION (WACV)》 *
YUNXIANG ZHANG ET AL: "《exploiting channel similarity for accelerating deep convolutional neural networks》", 《HTTPS://ARXIV.ORG/ABS/1908.02620》 *
卢泓宇 等: "《卷积神经网络特征重要性分析及增强特征选择模型》", 《软件学报》 *
巩凯强: "《基于目标检测的卷积神经网络模型压缩算法研究》", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
毛远宏 等: "《目标跟踪中基于深度可分离卷积的剪枝方法》", 《西安交通大学学报》 *
纪守领 等: "《机器学习模型可解释性方法、应用与安全研究综述》", 《计算机研究与发展》 *
耿丽丽 等: "《深度神经网络模型压缩综述》", 《计算机科学与探索》 *
赵新杰: "《深度神经网络的可视化理解方法研究》", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241271A (zh) * 2021-11-16 2022-03-25 电子科技大学 一种多孪生迁移学习融合多信息的机械故障智能诊断方法
CN114241271B (zh) * 2021-11-16 2023-04-25 电子科技大学 一种多孪生迁移学习融合多信息的机械故障智能诊断方法
CN114330714A (zh) * 2022-03-08 2022-04-12 北京环境特性研究所 卷积神经网络剪枝优化方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113516638B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
CN111598881B (zh) 基于变分自编码器的图像异常检测方法
CN112101426A (zh) 基于自编码器的无监督学习图像异常检测方法
CN113516638B (zh) 一种神经网络内部特征重要性可视化分析及特征迁移方法
Elhariri et al. Using hybrid filter-wrapper feature selection with multi-objective improved-salp optimization for crack severity recognition
CN112200211A (zh) 一种基于残差网络和迁移学习的小样本鱼识别方法及系统
Tian et al. Multidimensional face representation in a deep convolutional neural network reveals the mechanism underlying AI racism
Dong et al. Automatic inspection and evaluation system for pavement distress
Ke et al. Mango varieties classification-based optimization with transfer learning and deep learning approaches
CN113887559A (zh) 一种脑不在环路应用的脑机信息融合分类方法及系统
Khunratchasana et al. Thai digit handwriting image classification with convolutional neural networks
CN114387524B (zh) 基于多层级二阶表征的小样本学习的图像识别方法和系统
Charisma et al. Transfer Learning With Densenet201 Architecture Model For Potato Leaf Disease Classification
CN115757112A (zh) 基于变异分析的测试子集构建方法及相关设备
Nurtiwi et al. Convolutional Neural Network (CNN) Method for Classification of Images by Age
Jadah et al. Breast Cancer Image Classification Using Deep Convolutional Neural Networks
CN113627522A (zh) 基于关系网络的图像分类方法、装置、设备及存储介质
CN113935413A (zh) 一种基于卷积神经网的配网录波文件波形识别方法
Yildiz et al. Nuclei segmentation in colon histology images by using the deep CNNs: a U-net based multi-class segmentation analysis
Ali et al. Image classification with Deep Convolutional Neural Network Using Tensorflow and Transfer of Learning
Cao et al. Alzheimer’s Disease Stage Detection Method Based on Convolutional Neural Network
Farooq Improving Pith Detection and Automated Log Identification using AI
Olimov et al. Unsupervised deep learning-based end-to-end network for anomaly detection and localization
SINGH et al. Brain Tumor Detection Using Python
TREY et al. Classification of Plants into Families Based on Leaf Texture
Kaméus et al. Comparing Convolutional Neural Networks to traditional methods and the human eye for copy-move forgery detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant