CN106909945A - 深度学习的特征可视化及模型评估方法 - Google Patents

深度学习的特征可视化及模型评估方法 Download PDF

Info

Publication number
CN106909945A
CN106909945A CN201710119177.7A CN201710119177A CN106909945A CN 106909945 A CN106909945 A CN 106909945A CN 201710119177 A CN201710119177 A CN 201710119177A CN 106909945 A CN106909945 A CN 106909945A
Authority
CN
China
Prior art keywords
layer
evaluation method
model
sub
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710119177.7A
Other languages
English (en)
Inventor
付琨
许光銮
王洋
孙显
李峰
袁文龙
刁文辉
林道玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Electronics of CAS
Original Assignee
Institute of Electronics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Electronics of CAS filed Critical Institute of Electronics of CAS
Priority to CN201710119177.7A priority Critical patent/CN106909945A/zh
Publication of CN106909945A publication Critical patent/CN106909945A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

一种深度学习的特征可视化及模型评估方法,包括以下步骤:对深度学习网络模型从图像数据库输入图像数据,经过卷积层、非线性层、池化层对传入的所述图像数据进行一次前向传播,得到分类结果;利用反向传播算法或反卷积算法或LRP算法,计算对应输入图像的特征图;以及基于所述特征图进行可视化分析及对深度学习网络模型模型进行评估。

Description

深度学习的特征可视化及模型评估方法
技术领域
本发明涉及人工智能技术领域,尤其涉及深度学习的特征可视化及模型评估方法。
背景技术
深度学习是机器学习拉出的分支,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。
深度学习是机器学习中一种基于对数据进行表征学习的方法。
观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。
深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
现有的深度学习研究虽然在图像分类、语音识别等领域都取得了很好的变现,但是由于其多层的非线性结构,使得深度学习就像一个‘黑盒子’。
这样使得初学者并不能对深度学习这个工具有个直观的印象,对学者来说也不清楚深度学习网络究竟学习到了什么特征。
故此提出深度学习的特征可视化及模型评估方法,对模型学习到的特征经行可视化显示,使得深度学习更加直观易懂,并根据可视化后的结果来判断学习到的模型的好坏。
发明内容
鉴于现有方案存在的问题,为了克服上述现有技术方案的不足,本发明提出了一种深度学习的特征可视化及模型评估方法。
根据本发明的一个方面,提供了1、一种深度学习的特征可视化及模型评估方法,包括以下步骤:对深度学习网络模型从图像数据库输入图像数据,经过卷积层、非线性层、池化层对传入的所述图像数据进行一次前向传播,得到分类结果;利用反向传播算法或反卷积算法或LRP算法,计算对应输入图像的特征图;以及基于所述特征图进行可视化分析及对深度学习网络模型模型进行评估。
从上述技术方案可以看出,本发明具有以下有益效果:
采用反向传播算法或反卷积算法或LRP算法求得对应输入图像的特征图,进而实现可视化分析;
深度学习与可视化技术结合,直观的表现出模型所学习到的每个特征,使得深度学习更加易于理解;同时对特征图进行评价指标计算,达到模型评价的目的。
附图说明
图1是本发明实施例深度学习的特征可视化及模型评估方法流程图;
图2是图1中是深度学习模型利用反向求导算法求特征图流程图;
图3是图1中深度学习模型利用反卷积算法求特征图流程图;
图4是深度学习模型利用LRP算法求特征图流程图;
图5是图1中深度学习模型可视化及评价方法流程图。
具体实施方式
本发明某些实施例于后方将参照所附附图做更全面性地描述,其中一些但并非全部的实施例将被示出。实际上,本发明的各种实施例可以许多不同形式实现,而不应被解释为限于此数所阐述的实施例;相对地,提供这些实施例使得本发明满足适用的法律要求。
在本说明书中,下述用于描述本发明原理的各种实施例只是说明,不应该以任何方式解释为限制发明的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本发明的示例性实施例。下述描述包括多种具体细节来帮助理解,但这些细节应认为仅仅是示例性的。因此,本领域普通技术人员应认识到,在不悖离本发明的范围和精神的情况下,可以对本文中描述的实施例进行多种改变和修改。此外,为了清楚和简洁起见,省略了公知功能和结构的描述。此外,贯穿附图,相同附图标记用于相似功能和操作。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明实施例提供了一种深度学习的特征可视化及模型评估方法,利用反向传播算法或反卷积算法或LRP算法求得对应输入图像的特征图,利用求得的特征图,进行可视化分析,并对模型进行评估。
图1示出了本发明实施例深度学习的特征可视化及模型评估方法流程图,附图1所示,实施例深度学习的特征可视化及模型评估方法包括如下步骤:
S100:对深度学习网络模型从图像数据库输入图像数据,经过卷积层、非线性层、池化层对传入的图像数据进行一次前向传播,得到分类结果;
其中,输入图像数据可以为任意大小,任意格式,一次前向传播表示从输入图像数据计算到其分类结果。
S200:利用算法,计算对应输入图像的特征图,算法包括反向传播算法或反卷积算法或LRP算法。
S300:基于所述特征图进行可视化分析及对深度学习网络模型模型进行评估。
图2是深度学习模型利用反向求导算法求特征图流程图,如图2所示,若采用反向传播算法,步骤S200具体包括:
步骤S201:在目标层设置优化函数,其中目标层可以为卷积层或非线性层或池化层,然后在网络中对优化函数针对输入图像求偏导数,通过链式求导法则从一层到另一层,其中连续的两层x(l)和x(l+1)对激励的贡献通过式(1)计算,通过反向传播算法获得特征数据;
具体地,在对深度学习中池化层求偏导数时(即图2中反池化层),针对最大池化操作在前向传播时需记住取得最大值的位置,在反池化操作时根据记住的位置返回为原来的空间;
在对深度学习中非线性层求偏导数时(即图2中反线性层求导),根据前向非线性层传播取得最大值索引返回上一层的导数;
对卷积层求偏导数(即图2中滤波器层)时,通过对前向计算的卷积层偏置参数的转置求卷积。
步骤S202:特征数据组合成特征图。
图3是深度学习模型利用反卷积算法求特征图流程图,如图3所示,若采用反卷积算法,步骤S200具体包括:
步骤S211:在目标层设置优化函数,其中目标层可以为卷积层或非线性层或池化层,通过反卷积算法获得特征数据;
具体的,在对深度学习中池化层反向传播时(即图3中反池化层),针对最大池化操作在前向传播时需记住取得最大值的位置,在反池化操作时根据记住的位置返回为原来的空间;
在对深度学习中非线性层反向传播时(即图3中非线性层),其非线性层的操作和正向传播的非线性层的操作一致;
在对深度学习中卷积层反向传播时(即图3中反卷积层)通过式(2)对神经网络的输出映射为输入图像空间,其中R(l),R(l+1)表示反向传递的信号值,mdec表示反卷积操作,Q(l ,l+1)表示神经网络l层和l+1层之间的权重。
R(l)=mdec(R(l+1);Q(l,l+1))………………(2)
步骤S212:特征数据组合成特征图。
图4是深度学习模型利用LRP算法求特征图流程图,如图4所示若采用LRP算法,步骤S200具体包括:
步骤S221:指定输出层的某一类概率之后,对LRP算法需要满足一致性约束条件,如式(3)所示,获得特征数据:
具体的,在对深度学习中池化层反向传播时(即图4中反池化层),针对最大池化操作在前向传播时需记住取得最大值的位置,在反池化操作时根据记住的位置返回为原来的空间;
对于LRP算法,其反卷积层(即图4中反卷积层)一种计算方法计算如式(4),其中zij表示神经元i传递到下一层神经元j的数值。
对于LRP算法,其反卷积层(即图4中反卷积层)另一种计算方法计算如式(5),其中的α=2和β=-1公式(5)中为神经元i传递到下一层神经元j的正数部分,为神经元i传递到下一层神经元j的负数部分。
步骤S222:特征数据组合成特征图。
图5为深度学习模型可视化及评价方法流程图,如图5所示,步骤300具体包括:
步骤S301:对步骤S200获得的特征图进行显示可视化;
步骤S302:对步骤S200获得的特征图用一个有序的局部特征集合来表示(图5中局部特征划分),如式(6),其中rp表示局部区域的二维向量,其中p为1,2.....L,L为为所设定的局部特征个数。
步骤S303:对于上式所表示的有序特征集合进行局部特征排序,其局部特征排列顺序(图5中局部特征区域排序)由式(7)决定,其中x为对应的输入图像,f为模型的分类函数,i,j表示神经网络的第i层和第j层。
步骤S304:对输入图像所对应的局部特征局域像素进行扰动(图5中扰动输入图像)。对于局部特征的扰动处理如式(8)所示,其中g表示在x的rk周围的像素用均匀分布的像素随机替代,其中k为1,2…L。
x(0)=x
x(k)=g(xk-1,rk)………………(8)
步骤S305:对处理后的输入图像根据式(9)计算模型评价指标,深度学习模型的评价指标由下式所决定其中,p(x)为表示对数据集里的所有图片求平均,其中AOPC指标数值越高表示模型的性能越好。
至此,本发明实施例介绍完毕。
前面的附图中所描绘的进程或方法可通过包括硬件(例如,电路、专用逻辑等)、固件、软件(例如,被承载在非瞬态计算机可读介质上的软件),或两者的组合的处理逻辑来执行。虽然上文按照某些顺序操作描述了进程或方法,但是,应该理解,所描述的某些操作能以不同顺序来执行。此外,可并行地而非顺序地执行一些操作。
需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各元件和方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式,本领域普通技术人员可对其进行简单地更改或替换。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种深度学习的特征可视化及模型评估方法,其特征在于,包括以下步骤:
S100:对深度学习网络模型从图像数据库输入图像数据,经过卷积层、非线性层、池化层对传入的所述图像数据进行一次前向传播,得到分类结果;
S200:利用反向传播算法或反卷积算法或LRP算法,计算对应输入图像的特征图;以及
S300:基于所述特征图进行可视化分析及对深度学习网络模型模型进行评估。
2.根据权利要求1所述的特征可视化及模型评估方法,其特征在于,利用反向传播算法时,步骤S200包括以下步骤:
子步骤S201:在目标层设置优化函数,在网络中对优化函数针对输入图像求偏导数,通过链式求导法则从一层到另一层,通过反向传播算法获得特征数据,所述目标层为卷积层或非线性层或池化层;
子步骤S202:将所述特征数据组合成特征图。
3.根据权利要求2所述的特征可视化及模型评估方法,其特征在于,所述链式求导法中,连续的两层x(l)和x(l+1)对激励的贡献通过下式计算
∂ f ∂ x ( l ) = ∂ x ( l + 1 ) ∂ x ( l ) ∂ f ∂ x ( l + 1 ) .
4.根据权利要求2所述的特征可视化及模型评估方法,其特征在于,所述子步骤S201包括:
对池化层求偏导数时,针对最大池化操作在前向传播时需记住取得最大值的位置,在反池化操作时根据记住的位置返回为原来的空间;
对非线性层求偏导数时根据前向非线性层传播取得最大值索引返回上一层的导数;和/或
对卷积层求偏导数时,通过对前向计算的卷积层偏置参数的转置求卷积。
5.根据权利要求1所述的特征可视化及模型评估方法,其特征在于,利用反卷积算法时,步骤S200包括以下步骤:
子步骤S211:在目标层设置优化函数,其中目标层为卷积层或非线性层或池化层,通过反卷积算法获得特征数据;
子步骤S212:将所述特征数据组合成特征图。
6.根据权利要求5所述的特征可视化及模型评估方法,其特征在于,所述子步骤S211包括:
对池化层反向传播时,针对最大池化操作在前向传播时需记住取得最大值的位置,在反池化操作时根据记住的位置返回为原来的空间;
非线性层反向传播时,其非线性层的操作和正向传播的非线性层的操作一致;和/或
卷积层反向传播时通过下式对神经网络的输出映射为输入图像空间,
R(l)=mdec(R(l+1);Q(l,l+1))
其中R(l),R(l+1)表示反向传递的信号值,mdec表示反卷积操作,Q(l,l+1)表示神经网络l层和l+1层之间的权重。
7.根据权利要求1所述的特征可视化及模型评估方法,其特征在于,利用反卷积算法时,步骤S200包括以下步骤:
子步骤S211:指定输出层的某一类概率之后,对LRP算法需要满足下式的一致性约束条件,
获得特征数据,其中R为反向传播所求得的值;
子步骤S212:将所述特征数据组合成特征图。
8.根据权利要求7所述的特征可视化及模型评估方法,其特征在于,所述子步骤S211包括:
池化层反向传播时,针对最大池化操作在前向传播时需记住取得最大值的位置,在反池化操作时根据记住的位置返回为原来的空间;和/或
对反卷积层进行LRP算法计算。
9.根据权利要求8所述的特征可视化及模型评估方法,其特征在于,所述对反卷积层进行LRP算法计算包括:
采用下式进行LPR算法计算,
R i ( l ) = Σ j z i j Σ i ′ z i ′ j + ∈ s i g n ( Σ i ′ z i ′ j ) R j ( l + 1 )
其中Zij表示神经元i传递到下一层神经元j的数值;或
采用下式进行LPR算法计算,
R i ( l ) = Σ j ( α · n ! r ! ( n - r ) ! Σ i ′ z i ′ j + + β · z i j - Σ i ′ z i ′ j - ) R j ( l + 1 )
其中的α=2和β=-1公式(5)中∈=0.01,为神经元i传递到下一层神经元j的正数部分,为神经元i传递到下一层神经元j的负数部分。
10.根据权利要求1所述的特征可视化及模型评估方法,其特征在于,步骤300包括:
子步骤S301:对步骤S200获得的特征图进行显示可视化;
子步骤S302:对步骤S200获得的特征图用下式中一个有序的局部特征集合来表示,
其中rp表示局部区域的二维向量,其中p为1,2.....L,L为为所设定的局部特征个数;
子步骤S303:对于所述有序特征集合进行局部特征排序,其局部特征排列顺序下式决定,
其中,x为对应的输入图像,f为模型的分类函数,i,j表示神经网络的第i层和第j层;
步骤S304:对输入图像所对应的局部特征局域像素进行扰动,对于局部特征的扰动处理下式所示,
x(0)=x
x(k)=g(xk-1,rk)
其中g表示在x的rk周围的像素用均匀分布的像素随机替代,其中k为1,2...L;
步骤S305:对处理后的输入图像下式计算模型评价指标,深度学习模型的评价指标由下式所决定,
A O P C = 1 L + 1 < &Sigma; k = 0 L f ( x ( 0 ) ) - f ( x ( k ) ) > p ( x )
其中,p(x)为表示对数据集里的所有图片求平均,其中AOPC指标数值越高表示模型的性能越好。
CN201710119177.7A 2017-03-01 2017-03-01 深度学习的特征可视化及模型评估方法 Pending CN106909945A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710119177.7A CN106909945A (zh) 2017-03-01 2017-03-01 深度学习的特征可视化及模型评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710119177.7A CN106909945A (zh) 2017-03-01 2017-03-01 深度学习的特征可视化及模型评估方法

Publications (1)

Publication Number Publication Date
CN106909945A true CN106909945A (zh) 2017-06-30

Family

ID=59186205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710119177.7A Pending CN106909945A (zh) 2017-03-01 2017-03-01 深度学习的特征可视化及模型评估方法

Country Status (1)

Country Link
CN (1) CN106909945A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704925A (zh) * 2017-10-16 2018-02-16 清华大学 深度神经网络训练过程的可视分析系统及方法
CN107766933A (zh) * 2017-10-24 2018-03-06 天津大学 一种解释卷积神经网络的可视化方法
CN109769080A (zh) * 2018-12-06 2019-05-17 西北大学 一种基于深度学习的加密图像破解方法及系统
CN109858506A (zh) * 2018-05-28 2019-06-07 哈尔滨工程大学 一种面向卷积神经网络分类结果的可视化算法
CN110472667A (zh) * 2019-07-19 2019-11-19 广东工业大学 基于反卷积神经网络的小目标分类方法
CN112884021A (zh) * 2021-01-29 2021-06-01 之江实验室 一种面向深度神经网络可解释性的可视分析系统
CN114239685A (zh) * 2021-11-18 2022-03-25 北京墨云科技有限公司 评估神经网络图像分类模型鲁棒性的方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834716A (zh) * 2015-05-11 2015-08-12 浪潮集团有限公司 一种降维映射的大数据可视化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834716A (zh) * 2015-05-11 2015-08-12 浪潮集团有限公司 一种降维映射的大数据可视化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
K SIMONYAN 等: "Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps", 《HTTP://CN.ARXIV.ORG/ABS/1312.6034》 *
WOJCIECH SAMEK 等: "Evaluating the visualization of what a Deep Neural Network has learned,", 《HTTPS://WWW.RESEARCHGATE.NET/PUBLICATION/282000089》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704925A (zh) * 2017-10-16 2018-02-16 清华大学 深度神经网络训练过程的可视分析系统及方法
CN107704925B (zh) * 2017-10-16 2020-04-14 清华大学 深度神经网络训练过程的可视分析系统及方法
CN107766933A (zh) * 2017-10-24 2018-03-06 天津大学 一种解释卷积神经网络的可视化方法
CN107766933B (zh) * 2017-10-24 2021-04-23 天津大学 一种解释卷积神经网络的可视化方法
CN109858506A (zh) * 2018-05-28 2019-06-07 哈尔滨工程大学 一种面向卷积神经网络分类结果的可视化算法
CN109769080A (zh) * 2018-12-06 2019-05-17 西北大学 一种基于深度学习的加密图像破解方法及系统
CN110472667A (zh) * 2019-07-19 2019-11-19 广东工业大学 基于反卷积神经网络的小目标分类方法
CN110472667B (zh) * 2019-07-19 2024-01-09 广东工业大学 基于反卷积神经网络的小目标分类方法
CN112884021A (zh) * 2021-01-29 2021-06-01 之江实验室 一种面向深度神经网络可解释性的可视分析系统
CN112884021B (zh) * 2021-01-29 2022-09-02 之江实验室 一种面向深度神经网络可解释性的可视分析系统
CN114239685A (zh) * 2021-11-18 2022-03-25 北京墨云科技有限公司 评估神经网络图像分类模型鲁棒性的方法及装置

Similar Documents

Publication Publication Date Title
CN106909945A (zh) 深度学习的特征可视化及模型评估方法
CN109635917B (zh) 一种多智能体合作决策及训练方法
CN105095862B (zh) 一种基于深度卷积条件随机场的人体动作识别方法
CN107358293B (zh) 一种神经网络训练方法及装置
JP6574503B2 (ja) 機械学習方法および装置
CN109800789A (zh) 基于图网络的糖尿病视网膜病变分类方法及装置
CN108416327A (zh) 一种目标检测方法、装置、计算机设备及可读存储介质
DE112018006189T5 (de) Robuste gradienten-gewichtskomprimierungsschemata für deep-learning-anwendungen
CN110134774A (zh) 一种基于注意力决策的图像视觉问答模型、方法和系统
CN106981080A (zh) 基于红外图像和雷达数据的夜间无人车场景深度估计方法
CN108228728B (zh) 一种参数化的论文网络节点表示学习方法
CN109766995A (zh) 深度神经网络的压缩方法与装置
CN106897254A (zh) 一种网络表示学习方法
CN105205453A (zh) 基于深度自编码器的人眼检测和定位方法
CN107480788A (zh) 一种深度卷积对抗生成网络的训练方法及训练系统
CN108122048A (zh) 一种运输路径调度方法及其系统
CN107516304A (zh) 一种图像去噪方法及装置
CN108416535A (zh) 基于深度学习的专利价值评估的方法
CN107689036A (zh) 一种基于深度双边学习的实时图像增强方法
CN106997373A (zh) 一种基于深度置信网络的链路预测方法
CN113627596A (zh) 基于动态图神经网络的多智能体对抗方法及系统
CN108710950A (zh) 一种图像量化分析方法
CN108171328A (zh) 一种卷积运算方法和基于该方法的神经网络处理器
Kaburlasos et al. Intervals' numbers (INs) interpolation/extrapolation
CN111598252A (zh) 基于深度学习的大学计算机基础知识解题方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170630