CN110516787A - 基于易分特征丢弃策略的深度学习网络正则化约束方法 - Google Patents
基于易分特征丢弃策略的深度学习网络正则化约束方法 Download PDFInfo
- Publication number
- CN110516787A CN110516787A CN201910635196.4A CN201910635196A CN110516787A CN 110516787 A CN110516787 A CN 110516787A CN 201910635196 A CN201910635196 A CN 201910635196A CN 110516787 A CN110516787 A CN 110516787A
- Authority
- CN
- China
- Prior art keywords
- network
- formula
- easy
- dtex
- indicate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于易分特征丢弃策略的深度学习网络正则化约束方法,本发明改进了对特征随机置零的正则化方法,提出了丢弃易分特征策略,即置零易分特征的同时,保留难分特征,约束网络仅通过难分特征学习提升特征的辨别能力和网络的泛化性。本发明将易分特征丢弃策略运用到了全连接层和卷积层中,特别地通过滑窗方式找出特征图上的易分矩形区域并将其置零,解决了置零离散的状态下,网络可以根据特征图上地非零特征自动进行信息补全,导致正则化的作用减弱地问题,从而有效约束了网络的训练,进而提高网络的泛化性能。
Description
技术领域
本发明涉及深度学习和机器视觉领域,具体涉及到深度学习网络训练过程中所使用的正则化约束方法。
技术背景
由于深度学习网络训练参数过多,且训练数据不足等原因,过拟合一直是网络训练时无法回避的问题。针对上述问题,除了在网络输入端运用数据增强方法以外,更为普遍的方法是对网络中间层输出进行正则化处理。例如Dropout和DropConnect方法都是广泛使用的正则化约束手段,前者随机将每个网络节点的输出以一定概率随机置零,后者则将节点中每个与之相连的输入权值以一定概率随机置零。但是由于卷积神经网络输出特征图中的特征具有高度相关性,当置零特征过于离散,网络容易通过非零特征进行信息补全,将减弱正则化的作用,因此DropPath方法进一步提出随机对子网络的输出置零,并阻止其他并行网络的协同适应,这大大提高了每个子网络的独立性,但是将某个子网络的输出置零意味着该网络的所有权值将不再更新变化,会降低网络的学习效率,且该方法只能用于具有分形结构的网络。
可以发现,上述正则化约束方法都是采取随机策略,将输出的特征都等同对待,但是对于网络所提取的特征来说,存在着易分特征和难分特征。例如对于行人重识别任务,易分特征容易区别不同身份的行人或者识别出同一身份的行人,难分特征则相反。对于网络来说,所提取的特征中易分特征越多越好,因此在训练过程中,如何将难分特征训练为易分特征是一个很有意义的问题。
发明内容
本发明提出了基于易分特征丢弃策略的深度学习网络正则化约束方法,主要包括作用于卷积层的正则化约束方法DropEasy2d,以及作用于全连接层的正则化约束方法DropEasyld。对于DropEasy2d来说,计算前一层输出特征图对应特征之间的距离,如果是正样本对,则采用滑窗方式找出特征图上距离总和最小的特征区域,将其置零,如果是负样本对,则采用滑窗方式找出特征图上距离总和最大的特征区域,将其置零,就获得了一对难分特征图;对于DropEasyld来说,计算前一层输出的特征向量中对应特征之间的距离,如果是正样本对,则将距离相对小的特征置零;如果是负样本对,则将距离相对大的特征置零,同时保持其他特征不变,就获得了一对难分特征向量。将获得的难分特征图或难分特征向量输入到下一层网络层,继续网络的前向传播过程。因为本发明方法搜索样本对之间的易分特征并将其置零,网络利用难分特征来学习正负样本对的差异,逐渐将难分特征转化为易分特征,因此将显著增强所提取特征的辨别能力,提高网络的泛化性。
本发明的步骤如下,其中步骤1~步骤4为作用于卷积层的正则化约束方法,即DropEasy2d,而步骤5~步骤8为作用于全连接层的正则化约束方法,即DropEasyld;
步骤1:令{xa,xb}表示深度学习网络的输入数据对;y表示输入数据对的二值标签,当y=1,表示{xa,xb}为正样本对,当y=0时,表示{xa,xb}是负样本对;rh和rw∈(0,1),表示作用于卷积层的正则化约束方法在长和宽两个维度上的置零比率;r∈(0,1),表示作用于全连接层的正则化约束方法的置零比率。将{xa,xb}输入到网络中,经过卷积层输出一对多通道的特征图,分别按通道求平均,得到单通道特征图对{Fa,Fb},式(1)和(2)所示:
其中h和w分别是{Fa,Fb}的长和宽,和分别是Fa和Fb中第j行第i列所对应的特征分量。
步骤2:对特征图对{Fa,Fb},按式(3)计算得到特征图对之间的距离dist2d:
其中|·|1表示绝对值运算,dj,i表示{Fa,Fb}中第j行第i列所对应特征分量之间的距离。
步骤3:先按式(4)和(5),分别得到滑窗的长和宽
其中表示向下取整操作。然后采用从左到右,从上到下的方式对dist2d进行滑窗遍历,对落入滑窗内的dist2d元素进行相加,找到易分特征区域坐标列表region,满足式(6):
其中(vi,uj)表示易分特征分量的坐标,sum表示对矩阵中所有元素进行相加,当y=1时,■表示≤,;当y=0时,■表示≥。
步骤4:根据易分特征区域坐标列表region,对{Fa,Fb}中的特征分量分别进行置零。以对Fa的置零操作得到难分特征图为例,扩大1/(1-rh*rwr)倍,以补偿网络的训练过程相对于测试过程的数值偏差,具体计算过程如式(7)所示。经过相同操作可以得到Fb的难分特征图 就是丢弃了易分特征,保留了难分特征的特征图对。
步骤5:将输入到下一个网络层,继续进行网络的前向传播过程。当经过全连接层,则输出特征向量对{fa,fb},fa和fb分别如式(8)和(9)所示:
其中n是{fa,fb}的维数,和表示fa和fb的第i维特征分量。
步骤6:对于特征向量对{fa,fb},按式(10)计算{fa,fb}的特征距离dist1d:
其中di表示{fa,fb}第i维特征分量之间的距离。当y=1,对dist1d从小到大进行排序,得到排序后的序号列表index,如式(11)所示:
当y=0,对dist从大到小进行排序得到排序后的序号列表index,如式(12)所示:
步骤7:对于序号列表index,取前m个元素,得到{fa,fb}需要置零特征的位置列表subindex,如式(13)所示:
subindex=(z1,z2,…,zi,…,zm) (13)
其中m由式(14)所得:
步骤8:根据subindex,以对fa进行置零操作,得到难分特征向量为例,与步骤4类似,扩大1/(1-r)倍,具体计算过程如式(15)所示。经过相同操作,可以得到fb的难分特征向量 就是丢弃了易分特征,保留了难分特征的特征向量对。
步骤9:将输入到下一个网络层,按前述的卷积层正则化约束方法DropEasy2d,以及全连接层正则化约束方法DropEasyld,继续进行网络的前向传播过程。
本发明有如下益处:
1.将深度学习网络输出特征划分为易分和难分两类特征,本发明改进了对特征随机置零的正则化方法,提出了丢弃易分特征策略,即置零易分特征的同时,保留难分特征,约束网络仅通过难分特征学习提升特征的辨别能力和网络的泛化性。
2.将易分特征丢弃策略运用到了全连接层和卷积层中,特别地通过滑窗方式找出特征图上的易分矩形区域并将其置零,解决了置零离散的状态下,网络可以根据特征图上地非零特征自动进行信息补全,导致正则化的作用减弱地问题,从而有效约束了网络的训练,进而提高网络的泛化性能。
3.本发明的方法并不涉及深度学习网络的结构更改,因此任何深度学习网络都可以不改变网络结构的情况下使用本发明的正则化方法提高网络的性能。
附图说明
图1.DropEasy2d原理示意图。
图2.DropEasyld原理示意图。
具体实施方式:
以利用深度网络做行人重识别(分类)任务为例,本发明的步骤如下,其中步骤1~步骤4对应于作用于卷积层的正则化约束方法DropEasy2d,而步骤5~步骤8对应于作用于全连接层的正则化约束方法DropEasyld。DropEasy2d和DropEasyld的原理示意图分别如图1和图2所示。
步骤1:令{xa,xb}表示深度学习网络的输入行人数据对;y表示输入数据对的二值标签,当y=1,表示{xa,xb}为正样本对(行人身份相同),当y=0时,表示{xa,xb}是负样本对(行人身份相异);rh和rw∈(0,1),表示DropEasy2d在长和宽两个维度上的置零比率,r∈(0,1),表示DropEasyld的置零比率。将{xa,xb}输入到网络中,经过卷积层输出一对多通道的特征图,分别按通道求平均,得到单通道特征图对{Fa,Fb},式(1)和(2)所示:
其中h和w分别是{Fa,Fb}的长和宽,和分别是Fa和Fb中第j行第i列所对应的特征分量。此时可以运用DropEasy2d对特征图对{Fa,Fb}进行正则化设置。
步骤2:对特征图对{Fa,Fb},按式(3)计算得到特征图对之间的距离dist2d:
其中|·|1表示绝对值运算,dj,i表示{Fa,Fb}中第j行第i列所对应特征分量之间的距离。
步骤3:先按式(4)和(5),分别得到滑窗的长和宽
其中表示向下取整操作。然后采用从左到右,从上到下的方式对dist2d进行滑窗遍历,对落入滑窗内的dist2d元素进行相加,找到易分特征区域坐标列表region,满足式(6):
其中(vi,uj)表示易分特征分量的坐标,sum表示对矩阵中所有元素进行相加,当y=1时,■表示≤,;当y=0时,■表示≥。
步骤4:根据易分特征区域坐标列表region,对{Fa,Fb}中的特征分量分别进行置零。以对Fa的置零操作得到难分特征图为例,考虑到网络测试时并不需要使用DropEasy2d,因此需扩大1/(1-rh*rwr)倍,以补偿网络的训练过程相对于测试过程的数值偏差,具体计算过程如式(7)所示。经过相同操作可以得到Fb的难分特征图 就是丢弃了易分特征,保留了难分特征的特征图对。
步骤5:将输入到下一个网络层,继续进行网络的前向传播过程。当经过全连接层,则输出特征向量对{fa,fb},fa和fb分别如式(8)和(9)所示:
其中n是{fa,fb}的维数,和表示fa和fb的第i维特征分量。
步骤6:对于特征向量对{fa,fb},按式(10)计算{fa,fb}的特征距离dist1d:
其中di表示{fa,fb}第i维特征分量之间的距离。当y=1,对dist1d从小到大进行排序,得到排序后的序号列表index,如式(11)所示:
当y=0,对dist从大到小进行排序得到排序后的序号列表index,如式(12)所示:
步骤7:对于序号列表index,取前m个元素,得到{fa,fb}需要置零特征的位置列表subindex,如式(13)所示:
subindex=(z1,z2,…,zi,…,zm) (13)
其中m由式(14)所得:
步骤8:根据subindex,以对fa进行置零操作,得到难分特征向量为例,与步骤4类似,需扩大1/(1-r)倍,具体计算过程如式(15)所示。经过相同操作,可以得到fb的难分特征向量 就是丢弃了易分特征,保留了难分特征的特征向量对。
步骤9:将输入到下一个网络层,按前述的卷积层正则化约束方法DropEasy2d,以及全连接层正则化约束方法DropEasyld,继续进行网络的前向传播过程,直到最后一层输出对行人所属身份的分类概率。
Claims (1)
1.基于易分特征丢弃策略的深度学习网络正则化约束方法,其特征在于,该方法具体包括以下步骤:
其中步骤1~步骤4为作用于卷积层的正则化约束方法,作用于卷积层的正则化约束方法即DropEasy2d,而步骤5~步骤8为作用于全连接层的正则化约束方法,作用于全连接层的正则化约束方法即DropEasy1d;
步骤1:令{xa,xb}表示深度学习网络的输入数据对;y表示输入数据对的二值标签,当y=1,表示{xa,xb}为正样本对,当y=0时,表示{xa,xb}是负样本对;rh和rw∈(0,1),表示作用于卷积层的正则化约束方法在长和宽两个维度上的置零比率;r∈(0,1),表示作用于全连接层的正则化约束方法的置零比率;将{xa,xb}输入到网络中,经过卷积层输出一对多通道的特征图,分别按通道求平均,得到单通道特征图对{Fa,Fb},式(1)和(2)所示:
其中h和w分别是{Fa,Fb}的长和宽,和分别是Fa和Fb中第j行第i列所对应的特征分量;
步骤2:对特征图对{Fa,Fb},按式(3)计算得到特征图对之间的距离dist2d:
其中|·|1表示绝对值运算,dj,i表示{Fa,Fb}中第j行第i列所对应特征分量之间的距离;
步骤3:先按式(4)和(5),分别得到滑窗的长和宽
其中表示向下取整操作;然后采用从左到右,从上到下的方式对dist2d进行滑窗遍历,对落入滑窗内的dist2d元素进行相加,找到易分特征区域坐标列表region,满足式(6):
其中(vi,uj)表示易分特征分量的坐标,sum表示对矩阵中所有元素进行相加,当y=1时,■表示≤,;当y=0时,■表示≥;
步骤4:根据易分特征区域坐标列表region,对{Fa,Fb}中的特征分量分别进行置零;以对Fa的置零操作得到难分特征图为例,扩大1/(1-rh*rwr)倍,以补偿网络的训练过程相对于测试过程的数值偏差,具体计算过程如式(7)所示;经过相同操作可以得到Fb的难分特征图 就是丢弃了易分特征,保留了难分特征的特征图对;
步骤5:将输入到下一个网络层,继续进行网络的前向传播过程;当经过全连接层,则输出特征向量对{fa,fb},fa和fb分别如式(8)和(9)所示:
其中n是{fa,fb}的维数,和表示fa和fb的第i维特征分量;
步骤6:对于特征向量对{fa,fb},按式(10)计算{fa,fb}的特征距离dist1d:
其中di表示{fa,fb}第i维特征分量之间的距离;当y=1,对dist1d从小到大进行排序,得到排序后的序号列表index,如式(11)所示:
当y=0,对dist从大到小进行排序得到排序后的序号列表index,如式(12)所示:
步骤7:对于序号列表index,取前m个元素,得到{fa,fb}需要置零特征的位置列表subindex,如式(13)所示:
subindex=(z1,z2,…,zi,…,zm) (13)
其中m由式(14)所得:
步骤8:根据subindex,以对fa进行置零操作,得到难分特征向量为例,与步骤4类似,扩大1/(1-r)倍,具体计算过程如式(15)所示;经过相同操作,可以得到fb的难分特征向量 就是丢弃了易分特征,保留了难分特征的特征向量对;
步骤9:将输入到下一个网络层,按前述的卷积层正则化约束方法DropEasy2d,以及全连接层正则化约束方法DropEasy1d,继续进行网络的前向传播过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910635196.4A CN110516787B (zh) | 2019-07-15 | 2019-07-15 | 基于易分特征丢弃的网络正则化约束的行人重识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910635196.4A CN110516787B (zh) | 2019-07-15 | 2019-07-15 | 基于易分特征丢弃的网络正则化约束的行人重识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110516787A true CN110516787A (zh) | 2019-11-29 |
CN110516787B CN110516787B (zh) | 2021-04-09 |
Family
ID=68623360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910635196.4A Active CN110516787B (zh) | 2019-07-15 | 2019-07-15 | 基于易分特征丢弃的网络正则化约束的行人重识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110516787B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130343642A1 (en) * | 2012-06-21 | 2013-12-26 | Siemens Corporation | Machine-learnt person re-identification |
CN107657249A (zh) * | 2017-10-26 | 2018-02-02 | 珠海习悦信息技术有限公司 | 多尺度特征行人重识别的方法、装置、存储介质及处理器 |
WO2018196396A1 (zh) * | 2017-04-24 | 2018-11-01 | 清华大学 | 基于一致性约束特征学习的行人再识别方法 |
CN109800710A (zh) * | 2019-01-18 | 2019-05-24 | 北京交通大学 | 行人重识别系统及方法 |
CN109977882A (zh) * | 2019-03-29 | 2019-07-05 | 广东石油化工学院 | 一种半耦合字典对学习的行人重识别方法及系统 |
-
2019
- 2019-07-15 CN CN201910635196.4A patent/CN110516787B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130343642A1 (en) * | 2012-06-21 | 2013-12-26 | Siemens Corporation | Machine-learnt person re-identification |
WO2018196396A1 (zh) * | 2017-04-24 | 2018-11-01 | 清华大学 | 基于一致性约束特征学习的行人再识别方法 |
CN107657249A (zh) * | 2017-10-26 | 2018-02-02 | 珠海习悦信息技术有限公司 | 多尺度特征行人重识别的方法、装置、存储介质及处理器 |
CN109800710A (zh) * | 2019-01-18 | 2019-05-24 | 北京交通大学 | 行人重识别系统及方法 |
CN109977882A (zh) * | 2019-03-29 | 2019-07-05 | 广东石油化工学院 | 一种半耦合字典对学习的行人重识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110516787B (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103106265B (zh) | 相似图像分类方法及系统 | |
CN103456013B (zh) | 一种表示超像素以及度量超像素之间相似性的方法 | |
Thirunavukkarasu et al. | Classification of IRIS dataset using classification based KNN algorithm in supervised learning | |
CN109583483A (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN105389583A (zh) | 图像分类器的生成方法、图像分类方法和装置 | |
CN107392241A (zh) | 一种基于加权列抽样XGBoost的图像目标分类方法 | |
CN107832412B (zh) | 一种基于文献引用关系的刊物聚类方法 | |
CN101980210A (zh) | 一种标的词分类分级方法及系统 | |
CN103942749A (zh) | 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法 | |
CN104598925A (zh) | 一种基于ELM的多类Adaboost集成学习方法 | |
CN106228136A (zh) | 基于聚合通道特征的全景街景隐私保护方法 | |
CN110929624A (zh) | 一种基于正交损失函数的多任务分类网络的构建方法 | |
CN110704662A (zh) | 一种图像分类方法及系统 | |
CN104966075A (zh) | 一种基于二维判别特征的人脸识别方法与系统 | |
CN111582373A (zh) | 一种基于加权迁移极限学习机算法的辐射源识别方法 | |
CN103679269A (zh) | 基于主动学习的分类器样本选择方法及其装置 | |
Hamza et al. | Incremental classification of invoice documents | |
CN106203469A (zh) | 一种基于有序模式的图分类方法 | |
CN110516787A (zh) | 基于易分特征丢弃策略的深度学习网络正则化约束方法 | |
CN106951920A (zh) | 一种基于半监督的稀疏子空间聚类算法 | |
CN106204538A (zh) | 一种图像分割方法及系统 | |
CN106997473A (zh) | 一种基于神经网络的图像识别方法 | |
CN107038721B (zh) | 一种基于lapjv算法的直线检测方法 | |
CN109472289A (zh) | 关键点检测方法和设备 | |
CN113033683B (zh) | 一种基于静态与动态联合分析的工业系统工况监测方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |