CN112949655A - 一种结合注意力混合裁剪的细粒度图像识别方法 - Google Patents

一种结合注意力混合裁剪的细粒度图像识别方法 Download PDF

Info

Publication number
CN112949655A
CN112949655A CN202110226004.1A CN202110226004A CN112949655A CN 112949655 A CN112949655 A CN 112949655A CN 202110226004 A CN202110226004 A CN 202110226004A CN 112949655 A CN112949655 A CN 112949655A
Authority
CN
China
Prior art keywords
fine
attention
grained
network
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110226004.1A
Other languages
English (en)
Inventor
刘宁钟
白瑜颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202110226004.1A priority Critical patent/CN112949655A/zh
Publication of CN112949655A publication Critical patent/CN112949655A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种结合注意力混合裁剪的细粒度图像识别方法,进行各类细粒度图像识别。包括以下步骤:首先,采集各类细粒度图像数据,并对其进行标注;之后对图像进行数据增强,与采集的图片一起形成细粒度图像数据集;然后将样本数据送入到结合注意力混合裁剪的细粒度分类网络中进行训练,直至网络收敛获取权重文件;最后训练完成的结合注意力混合裁剪的细粒度分类网络以及权重文件即可用于细粒度图像识别。本方法可进行细粒度图像识别,算法简单清晰,精度高,鲁棒性强,可用于商品识别,车型识别等等需要进行细粒度识别的现实场景,具有良好的应用前景。

Description

一种结合注意力混合裁剪的细粒度图像识别方法
技术领域
本发明属于计算机视觉技术领域,特别涉及了一种结合注意力混合裁剪的细粒度图像识别方法。
背景技术
细粒度图像识别不同于通用图像识别,旨在区分同属某一大类下更为精细的子类,如区分鸟的种类,狗的种类,车的类型等等,在智能安防,智能零售等领域有着重要的应用,其具有类间差距小和类内差距大的特点,识别具有不小的难度;同时细粒度数据集往往种类多,而数据量较少,容易产生训练时的过拟合。近年来,在传统图像分类任务已达到了一个较高的精确度之后,研究人员将自己的目光放在了细粒度图像识别上。
Part-based R-CNN方法借鉴了目标检测领域的R-CNN方法,利用部件级别标注信息训练出一个部件检测器,进行目标的头部和躯干的检测,之后将检测到的头部和躯干的特征与图像整体分别通过卷积神经网络提取特征,并依据该特征通过SVM分类器得到最终的分类结果。双线性卷积神经网络B-CNN率先提出了利用Bilinear Pooling双线性池化操作融合两个不同的卷积神经网络提取到的特征,融合之后的高阶特征被证明更适应细粒度分类任务。循环注意力卷积神经网络RA-CNN,借鉴了目标检测领域的RPN区域建议网络思想,在结合注意力机制后提出了APN注意力建议网络。通过多阶段的注意力网络,逐级的将注意力网络关注的区域进行裁剪放大,之后送入下一阶段注意力网络,以此来获得更加细节的特征。
但是,上述算法均存在不足,例如Part-based R-CNN需要对图像进行部件级别的强监督信息标注,性价比不高;BCNN则计算量较大;而RA-CNN较为复杂,且同样计算量较大。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了一种结合注意力混合裁剪的细粒度图像识别方法,解决细粒度图像识别问题。
为了实现上述技术目的,本发明的技术方案为:
一种结合注意力混合裁剪的细粒度图像识别方法,包括以下步骤:
(1)图像采集过程:采集待识别的细粒度图像;
(2)数据增强过程:采用数据增强方法来扩大步骤(1)所述图像数据量,与原本采集得到的图像一起形成细粒度图像数据库;
(3)细粒度分类网络训练过程:使用获得的细粒度图像数据库送入细粒度分类网络进行学习,直到损失函数收敛;
(4)测试图像检测过程:利用训练好的细粒度分类网络和权重文件来获取目标图像中细粒度目标的精确分类。
以上所述步骤中,步骤(1)具体包括以下步骤:对采集到的图像进行清洗处理,过滤掉模糊,曝光过度,不包含仪表目标,仪表不完整等不满足要求的照片,之后对余下图像进行标注;
步骤(3)中所述细粒度分类网络为结合注意力混合裁剪的细粒度图像识别网络,结合了注意力混合裁剪,相较于其他细粒度分类网络具有更简单直观,主干网络可根据实际任务替换的优点,
步骤(3)具体包括以下步骤:
(31)将细粒度图像数据送入结合注意力混合裁剪的细粒度网络中,使用ImageNet预训练权重作为初始权重,设置学习率为0.002,设置最大迭代轮次为200轮,设置batchsize为32,使用StepLR策略进行学习率衰减,每两个epoch将学习率衰减为原来的0.9;
(32)采用卷积神经网络进行特征的提取,提取到图像的高阶语义信息;
(33)对于获取到的特征图,使用1*1大小的卷积核将特征图映射为注意力图;
(34)对于获取到的注意力图,将其与原特征图通过注意力双线性池化操作获取二阶特征,并拼接成特征矩阵之后通过SoftMax层计算交叉熵分类损失;
(35)对于注意力图中得到的位置信息,进行注意力混合裁剪,并将混合裁剪后的图片重新送入网络中进行学习,直到损失函数收敛,即可停止训练获得用于测试的网络模型;
进一步地,步骤(32)中的卷积神经网络可视实际情况进行选择,在速度要求较高的应用场景下,可选择轻量级的基础网络;而在精度要求较高的应用场景下则可以选择重量级的基础网络;
进一步的,步骤(34)中双线性注意力池化操作具体包括以下步骤:首先对于注意力图,与原特征图分别两两逐元素相乘进行局部特征的强化;接着对得到的特征向量进行带符号开方操作与L2正则化;之后通过全局池化操作将特征向量降维到原特征图维度;最后将降维后的多个特征向量拼接成特征矩阵,用于分类。
进一步的,步骤(35)中的注意力混合裁剪包括以下步骤:
(351)首先通过下式将特征图转化为特征热力图:
Figure BDA0002956170080000031
(352)之后通过给定阈值计算出特征热力图中响应最强烈的区域掩模
Figure BDA0002956170080000032
(353)之后根据所述掩模在原图中进行裁剪,并在调整大小之后将两张图片裁剪的区域进行交换,并交换两张图片的标记信息,由此便得到两张混合裁剪的图片:
Figure BDA0002956170080000033
Figure BDA0002956170080000034
进一步地,步骤(4)具体包含以下步骤:
(41)将待检测细粒度图像数据送入基础网络,进行卷积特征提取;
(42)通过M个1*1卷积获取注意力特征图,之后通过双线性注意力池化操作汇合注意力特征图与原特征图,获取特征矩阵;
(43)通过SoftMax层进行输出的规范化,并得到最终的预测结果。
有益效果:本发明提供了一种结合注意力混合裁剪的细粒度图像识别方法,利用注意力网络在弱监督学习到的位置信息引导混合裁剪,一方面利用混合裁剪丰富训练数据背景,同时避免随机混合裁剪混合到背景的问题;另一方面增强网络对局部特征的学习,避免网络对背景的过拟合。本发明中双线性注意力池化有利于细粒度特征的提取,注意力混合裁剪操作可以增强模型泛化性能。本方法的基础网络可随实际需求更换,灵活度高、精度高,鲁棒性强,提升了细粒度图像识别任务的精度,进而应用在商品识别,车型识别,动物识别等场景中。
附图说明
图1是本发明的整体流程图;
图2是本发明步骤3的整体流程图;
图3是本发明步骤3中的双线性池化流程图;
图4是本发明步骤3中的注意力混合裁剪流程图;
图5是本发明步骤4的流程图;
图6是本发明实施例中的混合裁剪示意图,其中左图为鸟类,右图为狗类。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明:
如图1所示,一种结合注意力混合裁剪的细粒度图像识别方法,包括以下步骤:
步骤1:图像采集过程:采集待识别细粒度图像,如细粒度鸟类与狗类图片,并对其进行标注;
步骤2:数据增强过程:采用数据增强方法来扩大步骤(1)所述图像数据量,与原本采集得到的图像一起形成细粒度图像数据库;
步骤3:细粒度分类网络训练过程:使用获得的细粒度图像数据库送入细粒度分类网络进行学习,直到损失函数收敛;
步骤4:测试图像检测过程:利用训练好的细粒度分类网络和权重文件来获取目标图像中细粒度目标的精确分类,从而获取到细粒度目标的量程信息,进而用于下一步的任务。
在本实施例中,步骤(1)采用如下优选方案:
对采集到的图像进行清洗处理,过滤掉模糊,曝光过度,不包含目标,目标不完整等不满足要求的照片,之后对余下图像进行标注。
在本实施例中,步骤(2)采用如下优选方案:
所述数据增强包括:随机裁剪,随机水平翻转,随机灰度变换,随机色彩抖动。
在本实施例中,步骤(3)采用如下优选方案:
所述细粒度分类网络为结合注意力混合裁剪的细粒度图像识别网络,结合了注意力混合裁剪,相较于其他细粒度分类网络具有更简单直观,主干网络可根据实际任务替换的优点,本实施例中选择ResNet-50作为主干网络。
如图2所示,步骤3的具体展开步骤如下:
(31)将细粒度图像数据送入结合注意力混合裁剪的细粒度网络中,使用ImageNet预训练权重作为初始权重,设置学习率为0.002,设置最大迭代轮次为200轮,设置batchsize为32,使用StepLR策略进行学习率衰减,每两个epoch将学习率衰减为原来的0.9;
(32)采用卷积神经网络进行特征的提取,提取到图像的高阶语义信息;
(33)之后对于获取到的特征图,使用1*1大小的卷积核将特征图映射为注意力图;
(34)之后对于获取到的注意力图,将其与原特征图通过注意力双线性池化操作获取二阶特征,并拼接成特征矩阵之后通过SoftMax层计算交叉熵分类损失;
(35)然后对于注意力图中得到的位置信息,进行注意力混合裁剪,并将混合裁剪后的图片重新送入网络中进行学习,直至网络损失函数收敛或者达到最大迭代轮次;
进一步地,步骤(32)中的卷积神经网络可视实际情况进行选择,在速度要求较高的应用场景下,可选择轻量级的基础网络;而在精度要求较高的应用场景下则可以选择重量级的基础网络;
进一步的如图3,步骤(34)中双线性注意力池化操作是指,首先对于注意力图,与原特征图分别两两逐元素相乘进行局部特征的强化;接着对得到的特征向量进行带符号开方操作与L2正则化;之后通过全局池化操作将特征向量降维到原特征图维度;最后将降维后的多个特征向量拼接成特征矩阵,用于分类。
进一步的如图4,步骤(35)中的注意力混合裁剪包括以下步骤:
(351)首先通过下式将特征图转化为特征热力图:
Figure BDA0002956170080000051
(352)之后通过给定阈值计算出特征热力图中响应最强烈的区域掩模
Figure BDA0002956170080000052
(353)之后根据该掩模在原图中进行裁剪,并在调整大小之后将两张图片裁剪的区域进行交换,并交换两张图片的标记信息,由此便得到两张如图6所示的混合裁剪的图片:
Figure BDA0002956170080000061
Figure BDA0002956170080000062
进一步地如图5,步骤(4)中包含以下步骤:
(41)将待检测细粒度图像数据,如细粒度狗类鸟类图片,送入基础网络,进行卷积特征提取;
(42)通过M个1*1卷积获取注意力特征图,之后通过双线性注意力池化操作汇合注意力特征图与原特征图,获取特征矩阵;
(43)通过SoftMax层进行输出的规范化,并得到最终的预测结果。
以上仅为本发明优选实施例,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (8)

1.一种结合注意力混合裁剪的细粒度图像识别方法,其特征在于,包括以下步骤:
(1)图像采集过程:采集待识别的细粒度图像;
(2)数据增强过程:采用数据增强方法来扩大所述图像数据量,与原本采集得到的图像一起形成细粒度图像数据库;
(3)细粒度分类网络训练过程:使用获得的细粒度图像数据库送入细粒度分类网络进行学习,直到损失函数收敛;
(4)测试图像检测过程:利用训练好的细粒度分类网络和权重文件来获取目标图像中细粒度目标的精确分类。
2.根据权利要求1所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(1)具体包括以下步骤:对采集到的图像进行清洗处理,过滤掉不满足要求的照片,之后对余下图像进行标注。
3.根据权利要求1所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(3)中所述细粒度分类网络为结合注意力混合裁剪的细粒度图像识别网络,结合了注意力混合裁剪。
4.根据权利要求1或3所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(3)具体包括以下步骤:
(31)将细粒度图像数据送入结合注意力混合裁剪的细粒度网络中,使用ImageNet预训练权重作为初始权重,设置学习率为0.002,设置最大迭代轮次为200轮,设置batch size为32,使用StepLR策略进行学习率衰减,每两个epoch将学习率衰减为原来的0.9;
(32)采用卷积神经网络进行特征的提取,提取到图像的高阶语义信息;
(33)对于获取到的特征图,使用1*1大小的卷积核将特征图映射为注意力图;
(34)对于获取到的注意力图,将其与原特征图通过注意力双线性池化操作获取二阶特征,并拼接成特征矩阵之后通过SoftMax层计算交叉熵分类损失;
(35)对于注意力图中得到的位置信息,进行注意力混合裁剪,并将混合裁剪后的图片重新送入网络中进行学习,直到损失函数收敛,即可停止训练获得用于测试的网络模型。
5.根据权利要求4所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(32)中的卷积神经网络可视实际情况进行选择,在速度要求较高的应用场景下,可选择轻量级的基础网络;而在精度要求较高的应用场景下则可以选择重量级的基础网络。
6.根据权利要求4所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(34)中所述双线性注意力池化操作具体包括以下步骤:首先对于注意力图,与原特征图分别两两逐元素相乘进行局部特征的强化;接着对得到的特征向量进行带符号开方操作与L2正则化;之后通过全局池化操作将特征向量降维到原特征图维度;最后将降维后的多个特征向量拼接成特征矩阵,用于分类。
7.根据权利要求4所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(35)中的注意力混合裁剪包括以下步骤:
(351)首先通过下式将特征图转化为特征热力图:
Figure FDA0002956170070000021
(352)之后通过给定阈值计算出特征热力图中响应最强烈的区域掩模
Figure FDA0002956170070000022
(353)之后根据所述掩模在原图中进行裁剪,并在调整大小之后将两张图片裁剪的区域进行交换,并交换两张图片的标记信息,由此便得到两张混合裁剪的图片:
Figure FDA0002956170070000023
Figure FDA0002956170070000024
8.根据权利要求1所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(4)具体包含以下步骤:
(41)将待检测细粒度图像数据送入基础网络,进行卷积特征提取;
(42)通过M个1*1卷积获取注意力特征图,之后通过双线性注意力池化操作汇合注意力特征图与原特征图,获取特征矩阵;
(43)通过SoftMax层进行输出的规范化,并得到最终的预测结果。
CN202110226004.1A 2021-03-01 2021-03-01 一种结合注意力混合裁剪的细粒度图像识别方法 Pending CN112949655A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110226004.1A CN112949655A (zh) 2021-03-01 2021-03-01 一种结合注意力混合裁剪的细粒度图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110226004.1A CN112949655A (zh) 2021-03-01 2021-03-01 一种结合注意力混合裁剪的细粒度图像识别方法

Publications (1)

Publication Number Publication Date
CN112949655A true CN112949655A (zh) 2021-06-11

Family

ID=76246935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110226004.1A Pending CN112949655A (zh) 2021-03-01 2021-03-01 一种结合注意力混合裁剪的细粒度图像识别方法

Country Status (1)

Country Link
CN (1) CN112949655A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743497A (zh) * 2021-09-02 2021-12-03 南京理工大学 基于注意力机制与多尺度特征的细粒度识别方法及系统
CN114708466A (zh) * 2022-06-08 2022-07-05 南京智莲森信息技术有限公司 零部件异常细粒度分类方法、系统、存储介质及计算设备
CN115937113A (zh) * 2022-11-24 2023-04-07 脉得智能科技(无锡)有限公司 一种皮肤病超声图像多病种识别方法、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191737A (zh) * 2020-01-05 2020-05-22 天津大学 基于多尺度反复注意力机制的细粒度图像分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191737A (zh) * 2020-01-05 2020-05-22 天津大学 基于多尺度反复注意力机制的细粒度图像分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DEVESH WALAWALKAR等: "Attentive CutMix: An Enhanced Data Augmentation Approach for Deep Learning Based Image Classification", 《HTTPS://ARXIV.ORG/PDF/2003.13048.PDF》, pages 1 - 6 *
TAO HU等: "See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visual Classification", 《HTTPS://ARXIV.ORG/PDF/1901.09891.PDF》, pages 1 - 9 *
学AI的年轻人: "[细粒度]WS-DAN", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/94799831》, pages 1 - 6 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743497A (zh) * 2021-09-02 2021-12-03 南京理工大学 基于注意力机制与多尺度特征的细粒度识别方法及系统
CN114708466A (zh) * 2022-06-08 2022-07-05 南京智莲森信息技术有限公司 零部件异常细粒度分类方法、系统、存储介质及计算设备
CN114708466B (zh) * 2022-06-08 2022-09-09 南京智莲森信息技术有限公司 零部件异常细粒度分类方法、系统、存储介质及计算设备
CN115937113A (zh) * 2022-11-24 2023-04-07 脉得智能科技(无锡)有限公司 一种皮肤病超声图像多病种识别方法、设备及存储介质
CN115937113B (zh) * 2022-11-24 2024-01-30 脉得智能科技(无锡)有限公司 一种皮肤病超声图像多病种识别方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107563372B (zh) 一种基于深度学习ssd框架的车牌定位方法
CN112949655A (zh) 一种结合注意力混合裁剪的细粒度图像识别方法
CN111027493B (zh) 一种基于深度学习多网络软融合的行人检测方法
Jia et al. Visual tracking via adaptive structural local sparse appearance model
CN109165623B (zh) 基于深度学习的水稻病斑检测方法及系统
CN109684922B (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
CN110796057A (zh) 行人重识别方法、装置及计算机设备
CN111460980B (zh) 基于多语义特征融合的小目标行人的多尺度检测方法
CN106815601A (zh) 基于递归神经网络的高光谱图像分类方法
CN109522925B (zh) 一种图像识别方法、装置和存储介质
CN108280460B (zh) 基于改进卷积神经网络的sar车辆目标识别方法
Kang et al. Deep learning-based weather image recognition
CN109410184B (zh) 基于稠密对抗网络半监督学习的直播色情图像检测方法
Zhang et al. Road recognition from remote sensing imagery using incremental learning
CN110569754A (zh) 图像目标检测方法、装置、存储介质及设备
Herdiyeni et al. Mobile application for Indonesian medicinal plants identification using fuzzy local binary pattern and fuzzy color histogram
CN108647682A (zh) 一种基于区域卷积神经网络模型的品牌Logo检测与识别方法
CN111898432A (zh) 一种基于改进YOLOv3算法的行人检测系统及方法
CN114627447A (zh) 基于注意力机制和多目标跟踪的公路车辆跟踪方法及系统
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
Alsanad et al. Real-time fuel truck detection algorithm based on deep convolutional neural network
CN111444816A (zh) 一种基于Faster RCNN的多尺度密集行人检测方法
CN113627481A (zh) 一种面向智慧园林的多模型组合的无人机垃圾分类方法
CN116630828B (zh) 基于地形环境适配的无人机遥感信息采集系统及方法
Zeng et al. Masanet: Multi-angle self-attention network for semantic segmentation of remote sensing images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination