CN110135460B - 基于vlad卷积模块的图像信息强化方法 - Google Patents

基于vlad卷积模块的图像信息强化方法 Download PDF

Info

Publication number
CN110135460B
CN110135460B CN201910305793.0A CN201910305793A CN110135460B CN 110135460 B CN110135460 B CN 110135460B CN 201910305793 A CN201910305793 A CN 201910305793A CN 110135460 B CN110135460 B CN 110135460B
Authority
CN
China
Prior art keywords
convolution module
vlad
convolution
channel
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910305793.0A
Other languages
English (en)
Other versions
CN110135460A (zh
Inventor
袁嘉杰
张灵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910305793.0A priority Critical patent/CN110135460B/zh
Publication of CN110135460A publication Critical patent/CN110135460A/zh
Application granted granted Critical
Publication of CN110135460B publication Critical patent/CN110135460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及数字图像处理技术领域,提出一种基于VLAD卷积模块的图像信息强化方法,包括以下步骤:初始化VLAD卷积模块参数;将通道数为D的中间特征图输入VLAD卷积模块,中间特征图进行压缩得到压缩特征图;中间特征图进行一次卷积操作,通过softmax函数归一化得到输出权重;将输出权重进行各自求和,保留求和结果较大的输出权重;将聚类中心与中间特征图中的特征向量进行差值运算,得到每个通道的残差;将输出权重关于每个通道的残差中对应的元素相乘后进行累加,得到固定向量;将固定向量进行softmax函数归一化得到鉴别特征,将鉴别特征与压缩特征图进行逐通道相乘,输出完成信息强化的特征图。本发明能够强化特征图的有用信息,具有计算量小的特点。

Description

基于VLAD卷积模块的图像信息强化方法
技术领域
本发明涉及数字图像处理技术领域,更具体地,涉及一种基于VLAD卷积模块的图像信息强化方法。
背景技术
卷积神经网络(CNN)是常用于计算机视觉任务上的实用模型,为了提高卷积神经网络的性能,最近的实验工作主要研究对于在深度神经网络的中间层分支进行深度融合,产生潜在可以共享有用信息的基础网络,从而优化信息流动,提升深度神经网络的性能。
对此研究者提出残差注意力网络,综合了ResNeXt和Inception的方法,通过bottom-up top-down的形式构建旁路,通过一系列的卷积层与池化操作,逐渐提取特征图中的高级特征并增大模型的感受域,由于高层特征中所激活的特征值能够反映注意力所在的区域,于是再通过相同数量的up sample将特征图的尺寸放大到原来的输入大小,再与干路特征结合,能够增强干路上特征图中有用信息的权重。然而该方法对特征图的信息强化结果仍不能满足现有的需求,且该方法中的基础网络的两路都是以3D形式进行数据流动,对此基础网络参数将会相应地增加,而以此构建的深度神经网络的训练时间与能耗会相应地大量增加。
Jegou et al.在2010年提出一种局部聚合描述子向量(Vector of LocallyAggregated Descriptors,VLAD)卷积模块,一般用于将图像的局部描述进行聚合操作,然后通过一个长向量来表征一副图像,主要应用于图像检索领域。然而现有技术中采用VLAD卷积模块的图像特征检索中由于图像特征的检索结果主要依赖于聚类中心,因此存在不稳定性,无法确保能够精确检索图像特征从而进行强化。
发明内容
本发明为克服上述现有技术所述的图像信息强化的结果不能满足需求等缺陷,提供一种基于VLAD卷积模块的图像信息强化方法。
为解决上述技术问题,本发明的技术方案如下:
基于VLAD卷积模块的图像信息强化方法,包括以下步骤:
S1、初始化VLAD卷积模块参数,设定VLAD卷积模块中的K个D维的聚类中心和K+G个卷积核,其中,D、K、G为正整数;
S2、将通道数为D的中间特征图输入VLAD卷积模块后分别进行以下操作:中间特征图进行压缩得到大小为K,通道数为D的压缩特征图;中间特征图进行一次卷积操作,并通过归一化指数函数(softmax函数)进行归一化处理,得到K+G个输出权重;
S3、将K+G个输出权重进行各自求和,保留求和结果较大的K个输出权重;
S4、将聚类中心分别与中间特征图中的特征向量进行差值运算,得到每个通道的残差;
S5、将S3步骤保留的K个输出权重与每个通道的残差中对应的元素相乘,再将各通道的所有差值进行累加,得到K个固定向量;
S6、将固定向量通过softmax函数进行归一化处理,得到鉴别特征;
S7、将鉴别特征与压缩特征图进行逐通道相乘,输出的特征图即为完成信息强化的图像。
本技术方案中,以中间特征图作为输入,与初始化的卷积核进行卷积操作,获取输出权重,其中输出权重为矩阵,每个权重值代表特征图与聚类中心的远近关系,距离越近权重值越大;然后将输出权重进行各自求和,将求和结果最小的G个权重进行丢弃,即表示将低质量的图像特征对应的权重进行丢弃,保留图像质量较高的图像特征,从而实现图像信息的强化;将中间特征图与初始化的聚类中心做差值运算,并将差值与输出权重对应的元素相乘处理,再将该通道的所有差值进行累加,从而把原本的中间特征图压缩成K个固定向量,避免与最终处理的压缩特征图大小不一致;将固定向量通过softmax函数进行归一化处理后与经过压缩的特征图进行逐通道相乘,达到强化有用信息,抑制无用信息的效果,最终得到完成信息强化的图像。本技术方案可应用于图像识别或图像鉴别的深度神经网络中。
优选地,VLAD卷积模块包括树干分支和旁路分支,其中树干分支由两组残差模块构成并与深度神经网络衔接,旁路分支为VLAD层,VLAD层包括K+G个卷积核和K个聚类中心。其中旁路分支为改进的VLAD层,其改进在于:在现有的VLAD层中额外增加了G个卷积核,用于得到额外的输出权重。具体地,根据各输出权重各自求和的结果大小,判断中间特征图中低质量的图像特征对应的输出权重,然后将该输出权重划分到额外的输出权重中进行丢弃,实现对中间特征图中低质量的图像特征进行丢弃,从而提高图像特征提取效果,能够强化树干分支对图像特征的鉴别性,同时对特征图进行降维。此外,卷积核能够使VLAD层具有学习可训练性能,在构建模型时通过迭代更新模型参数。
优选地,步骤S2的具体步骤如下:
S201、将通道数为D,大小为H×W的中间特征图输入VLAD卷积模块中,中间特征图通过VLAD卷积模块的树干分支得到大小为K,通道数为D的压缩特征图;
S202、中间特征图通过VLAD卷积模块的旁路分支,中间特征图被处理为D个H×W维的特征向量,然后对特征向量进行一次卷积操作,并通过softmax函数进行归一化处理,得到K+G个输出权重,其中输出权重为H×W大小的矩阵。
优选地,S1步骤中卷积核的大小为(D,1),即卷积核的大小与输入的中间特征图的通道数相同。
优选地,VLAD卷积模块参数还包括K+G个偏置项,其中偏置项用于参与中间特征图的卷积操作。
优选地,S5步骤中的固定向量的计算公式如下:
Figure BDA0002029778870000031
其中,V(j,k)为固定向量,表示第j个通道维度上的中间特征图与第k个聚类中心的差值之和,xi(j)表示通道维度为j的中间特征图上第i个值,ck表示第k个聚类中心上第j维度上的值,Wk表示第k个聚类中心的输出权重。
优选地,S6步骤中的鉴别特征的范围为0~1。
优选地,本图像信息强化方法应用于ResNet50深度残差网络中。
与现有技术相比,本发明技术方案的有益效果是:通过提高高质量图像特征的权重,丢弃低质量图像特征的权重,实现强化中间特征图的有用信息,有效增强应用本发明的网络模型对图像的鉴别性能;具有计算量小、检索精度高的特点,能够有效减少构建深度网络的训练时间和能耗。
附图说明
图1为本实施例的基于VLAD卷积模块的图像信息强化方法的流程图。
图2为本实施例的VLAD卷积模块的结构示意图。
图3为本实施例的处理结果对照图。
图4为现有技术的处理结果对照图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
如图1所示,为本实施例的基于VLAD卷积模块的图像信息强化方法的流程图。
本实施例的基于VLAD卷积模块的图像信息强化方法包括以下步骤:
步骤一:初始化VLAD卷积模块参数,设定VLAD卷积模块中的K个D维的聚类中心、K+G个卷积核和K+G个偏置项,其中,D、K、G为正整数。
步骤二:将中间特征图输入VLAD卷积模块后分别进行以下操作:中间特征图进行压缩得到大小为K,通道数为D的压缩特征图;中间特征图进行一次卷积操作,并通过softmax函数进行归一化处理,得到K+G个输出权重。其具体步骤如下:
S201、将通道数为D,大小为H×W的中间特征图输入VLAD卷积模块中,中间特征图通过VLAD卷积模块的树干分支得到大小为K,通道数为D的压缩特征图;
S202、中间特征图通过VLAD卷积模块的旁路分支,中间特征图被处理为D个H×W维的特征向量,然后对特征向量进行一次卷积操作,并通过softmax函数进行归一化处理,得到K+G个输出权重,其中输出权重为H×W大小的矩阵。
步骤三:将K+G个输出权重进行各自求和,保留求和结果较大的K个输出权重。
步骤四:将聚类中心分别与中间特征图中的特征向量进行差值运算,得到每个通道的残差。
步骤五:将步骤三保留的K个输出权重与每个通道的残差中对应的元素相乘,再将各通道的所有差值进行累加,得到K个固定向量。其中,固定向量的计算公式如下:
Figure BDA0002029778870000051
其中,V(j,k)为固定向量,表示第j个通道维度上的中间特征图与第k个聚类中心的差值之和,xi(j)表示通道维度为j的中间特征图上第i个值,ck表示第k个聚类中心上第j维度上的值,Wk表示输出权重。
步骤六:将固定向量通过softmax函数进行归一化处理,得到鉴别特征。
步骤七:将鉴别特征与压缩特征图进行逐通道相乘,输出的特征图即为完成信息强化的图像。
如图2所示,为本实施例的VLAD卷积模块的结构示意图。本实施例中的VLAD卷积模块包括树干分支和旁路分支,其中树干分支由两组残差模块构成并与深度神经网络衔接,旁路分支为VLAD层,VLAD层中包括K+G个卷积核和K个聚类中心。
本实施例中的卷积核的大小根据输入的中间特征图的通道数决定,其大小为(D,1)。
在具体实施过程中,将本实施例提出的方法应用于ResNet50深度残差网络中。
步骤一:初始化VLAD卷及模块参数,设定VLAD卷积模块中56×56个128维的聚类中心、56×56+14×14个大小为(128,1)的卷积核以及56×56+14×14个偏置项。
步骤二:将大小为128×128,通道数为128的中间特征图输入VLAD模块,中间特征图通过树干分支的两组残差模块后得到大小为56×56,通道数为128的压缩特征图;中间特征图进入旁路分支后被处理为128个128×128维的特征向量,然后进行一次卷积操作,并通过softmax函数进行归一化处理,得到56×56+14×14个输出权重,其中输出权重为128×128大小的矩阵,代表中间特征图的特征位置与聚类中心位置的远近关系。
步骤三:将56×56+14×14个输出权重进行各自求和,保留求和结果较大的56×56个大小为128×128的输出权重矩阵,将求和结果最小的14×14个输出权重舍弃,使中间特征图中质量较低的图像特征,即中间特征图中的无用信息舍弃,从而降低低质量图像的权重,增强模型对图像的鉴别性能。
步骤四:将56×56个128维的聚类中心分别与中间特征图的128个128×128维的特征向量进行差值运算,每个通道上的128×128维的向量元素与该通道的一个聚类中心值分别进行差值运算,最终每个通道上得到128×128个差值作为残差。
步骤五:将步骤三中保留的56×56个大小为128×128的输出权重矩阵与步骤四中得到的128×128个残差中对应的元素相乘,再将这通道的所有差值进行累加,得到56×56个128维的固定向量,即把原输入的128×128个128维的中间特征图压缩成56×56个128维的固定向量,使旁路分支的输出与树干分支输出的特征图尺寸大小一致。
步骤六:将56×56个128维的固定向量通过softmax函数进行归一化处理,输出0~1的值,即为鉴别特征。
步骤七:将鉴别特征与树干分支输出的大小为56×56,通道数为128的特征图进行逐通道相乘,达到强化有用信息抑制无用信息的效果。
如图3、4所示,图3为本实施例的处理结果对照图,图4为现有技术的处理结果对照图。其中输入的中间特征图为人脸表情照片,因此特征图中需要强化的信息为人脸的五官等。由图示可看出,本实施例能够对特征图中高质量的图像特征进行强化,舍弃低质量的图像特征,从而增强网络模型对图像的鉴别性能。
本实施例的基于VLAD卷积模块的图像信息强化方法能够强化输入的中间特征图中的有用信息,丢弃无用信息,从而增强网络模型对图像的鉴别性能,同时本实施例的图像信息强化方法中的计算量较小,在应用过程中能够有效减少构建深度神经网络的训练时间和能耗。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (8)

1.基于VLAD卷积模块的图像信息强化方法,其特征在于,包括以下步骤:
S1、初始化局部聚合描述子向量卷积模块参数,设定卷积模块中的K个D维的聚类中心和K+G个卷积核,其中,D、K、G为正整数;
S2、将通道数为D的中间特征图输入局部聚合描述子向量卷积模块后分别进行以下操作:中间特征图进行压缩得到大小为K,通道数为D的压缩特征图;将中间特征图进行一次卷积操作,并通过归一化指数函数进行归一化,得到K+G个输出权重;所述局部聚合描述子向量卷积模块包括树干分支和旁路分支,其中所述树干分支由两组残差模块构成并与深度神经网络衔接,所述旁路分支为局部聚合描述子向量层,所述局部聚合描述子向量层包括K+G个卷积核和K个聚类中心;所述局部聚合描述子向量卷积模块参数还包括K+G个偏置项,所述偏置项用于参与中间特征图的卷积操作;
S3、将K+G个输出权重进行各自求和,保留求和结果较大的K个输出权重,将求和结果最小的G个输出权重舍弃;
S4、将聚类中心分别与中间特征图中的特征向量进行差值运算,得到每个通道的残差;
S5、将S3步骤保留的K个输出权重与每个通道的残差中对应的元素相乘,再将各通道的所有差值进行累加,得到K个固定向量;
S6、将固定向量通过归一化指数函数进行归一化处理,得到鉴别特征;
S7、将鉴别特征与压缩特征图进行逐通道相乘,输出的特征图即为完成信息强化的图像。
2.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述局部聚合描述子向量卷积模块包括树干分支和旁路分支,其中所述树干分支由两组残差模块构成并与深度神经网络衔接,所述旁路分支为局部聚合描述子向量层,所述局部聚合描述子向量层包括K+G个卷积核和K个聚类中心。
3.根据权利要求2所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S2的具体步骤如下:
S201、将通道数为D,大小为H×W的中间特征图输入局部聚合描述子向量卷积模块中,中间特征图通过卷积模块的树干分支得到大小为K,通道数为D的压缩特征图;
S202、中间特征图通过卷积模块的旁路分支,中间特征图被处理为D个H×W维的特征向量,然后对特征向量进行一次卷积操作,并通过归一化指数函数进行归一化处理,得到K+G个输出权重,其中输出权重为H×W大小的矩阵。
4.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S1步骤中卷积核的大小为(D,1)。
5.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述局部聚合描述子向量卷积模块参数还包括K+G个偏置项,所述偏置项用于参与中间特征图的卷积操作。
6.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S5步骤中的固定向量的计算公式如下:
Figure FDA0004112903900000021
其中,V(j,k)为固定向量,表示第j个通道维度上的中间特征图与第k个聚类中心的差值之和,xi(j)表示通道维度为j的中间特征图上第i个值,ck表示第k个聚类中心上第j维度上的值,Wk表示输出权重。
7.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S6步骤中的鉴别特征的范围为0~1。
8.根据权利要求1~7任一项所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述方法应用于ResNet50深度残差网络中。
CN201910305793.0A 2019-04-16 2019-04-16 基于vlad卷积模块的图像信息强化方法 Active CN110135460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910305793.0A CN110135460B (zh) 2019-04-16 2019-04-16 基于vlad卷积模块的图像信息强化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910305793.0A CN110135460B (zh) 2019-04-16 2019-04-16 基于vlad卷积模块的图像信息强化方法

Publications (2)

Publication Number Publication Date
CN110135460A CN110135460A (zh) 2019-08-16
CN110135460B true CN110135460B (zh) 2023-04-18

Family

ID=67570172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910305793.0A Active CN110135460B (zh) 2019-04-16 2019-04-16 基于vlad卷积模块的图像信息强化方法

Country Status (1)

Country Link
CN (1) CN110135460B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027670B (zh) * 2019-11-04 2022-07-22 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
US11403486B2 (en) 2019-11-13 2022-08-02 Huawei Technologies Co., Ltd. Methods and systems for training convolutional neural network using built-in attention
CN111126488B (zh) * 2019-12-24 2023-08-18 威创集团股份有限公司 一种基于双重注意力的图像识别方法
CN111968150B (zh) * 2020-08-19 2022-09-02 中国科学技术大学 一种基于全卷积神经网络的弱监督视频目标分割方法
CN113269218B (zh) * 2020-12-30 2023-06-09 威创集团股份有限公司 基于改进的vlad算法的视频分类方法
CN113486875B (zh) * 2021-09-08 2021-12-07 浙江大学 基于词分离和自适应的跨域人脸表示攻击检测方法和系统
CN113989579B (zh) * 2021-10-27 2024-07-12 腾讯科技(深圳)有限公司 图像检测方法、装置、设备以及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169415B (zh) * 2017-04-13 2019-10-11 西安电子科技大学 基于卷积神经网络特征编码的人体动作识别方法
CN109063719B (zh) * 2018-04-23 2022-02-01 湖北工业大学 一种联合结构相似性和类信息的图像分类方法
CN108596163A (zh) * 2018-07-10 2018-09-28 中国矿业大学(北京) 一种基于cnn和vlad的煤岩识别方法
CN109255381B (zh) * 2018-09-06 2022-03-29 华南理工大学 一种基于二阶vlad稀疏自适应深度网络的图像分类方法

Also Published As

Publication number Publication date
CN110135460A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN110135460B (zh) 基于vlad卷积模块的图像信息强化方法
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
CN108764317B (zh) 一种基于多路特征加权的残差卷积神经网络图像分类方法
CN113326930B (zh) 数据处理方法、神经网络的训练方法及相关装置、设备
CN106096538A (zh) 基于定序神经网络模型的人脸识别方法及装置
CN109740679B (zh) 一种基于卷积神经网络和朴素贝叶斯的目标识别方法
CN111696101A (zh) 一种基于SE-Inception的轻量级茄科病害识别方法
CN112699958A (zh) 一种基于剪枝和知识蒸馏的目标检测模型压缩与加速方法
CN112016450B (zh) 机器学习模型的训练方法、装置和电子设备
CN112766229B (zh) 基于注意力机制的人脸点云图像智能识别系统及方法
CN115035418A (zh) 一种基于改进DeepLabV3+网络的遥感图像语义分割方法及系统
CN107564007B (zh) 融合全局信息的场景分割修正方法与系统
CN112819039A (zh) 基于多尺度集成特征编码的纹理识别模型建立方法及应用
CN110245621A (zh) 人脸识别装置及图像处理方法、特征提取模型、存储介质
CN112766378A (zh) 一种专注细粒度识别的跨域小样本图像分类模型方法
CN112084895A (zh) 一种基于深度学习的行人重识别方法
CN112766134B (zh) 一种强化类间区分的表情识别方法
CN110796182A (zh) 一种少量样本的票据分类方法及系统
CN111783688B (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN110942106B (zh) 一种基于平方平均的池化卷积神经网络图像分类方法
CN112308213A (zh) 一种基于全局特征关系的卷积神经网络压缩方法
CN116883746A (zh) 一种基于分区池化超图神经网络的图节点分类方法
CN111695450A (zh) 一种基于IMobileNet的人脸快速识别方法
CN116797850A (zh) 基于知识蒸馏和一致性正则化的类增量图像分类方法
CN116433980A (zh) 脉冲神经网络结构的图像分类方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant