CN113283409A - 基于EfficientDet和Transformer的航空图像中的飞机检测方法 - Google Patents
基于EfficientDet和Transformer的航空图像中的飞机检测方法 Download PDFInfo
- Publication number
- CN113283409A CN113283409A CN202110835879.1A CN202110835879A CN113283409A CN 113283409 A CN113283409 A CN 113283409A CN 202110835879 A CN202110835879 A CN 202110835879A CN 113283409 A CN113283409 A CN 113283409A
- Authority
- CN
- China
- Prior art keywords
- module
- layer
- efficientdet
- transformer
- deformable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于EfficientDet和Transformer的航空图像中的飞机检测方法,所述TransEffiDet架构包括有建立数据集模块、EfficientDet模块、BiFPN模块、可变形Transformer模块和实施细节模块。本发明通过设置有可变形Transformer模块优化网络结构,引入多尺度可变形自关注MS‑DMSA机制来实现有效的长距离语境建模,通过元素相加将位置编码与扁平化的特征图结合起来,形成Transformer的输入序列,保护空间信息不被丢失。
Description
技术领域
本发明涉及飞机检测技术领域,具体为基于EfficientDet和Transformer的航空图像中的飞机检测方法。
背景技术
近年来,基于图像数据的分析和优化算法一直是研究热点方向,基于航空图像的飞机检测可以为准确的物体打击提供数据支持,其中卷积CNN神经网络作为较为成熟的算法,其内部含有的卷积层,其内部的每层卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到,卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网络能从低级特征中迭代提取更复杂的特征,因而大量用于航空图像中的飞机检测中。
现有的飞机检测方法存在的缺陷是:
1、目前大多通过CNN的方法来实现图像检测,但是由于CNN的内部含有卷积层,在卷积操作的内在定位性的限制即卷积核不可能覆盖整个高分辨率图像,基于CNN的方法很难捕捉到长距离的信息,导致图像检测结果的精度不高;
2、目前大多采用PANet架构来进行特征网络的构建,但是PANet架构只有一条自上而下和一条自下而上的路径,对特征网络融合不同特征的贡献较小;
3、目前在图像检测过程中,大多将CNN编码器{P5}产生的特征图压扁为一维序列,然而扁平化特征的操作导致了空间信息的丢失,而空间信息对于图像分割是至关重要的影响因素。
发明内容
本发明的目的在于提供基于EfficientDet和Transformer的航空图像中的飞机检测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:基于EfficientDet和Transformer的航空图像中的飞机检测方法,包括TransEffiDet架构,所述TransEffiDet架构基本遵循单阶段目标检测方法的模式,所述TransEffiDet架构包括有建立数据集、EfficientDet模块、BiFPN模块、可变形Transformer模块和实施细节;
所述建立数据集的输出端连接有EfficientDet模块,所述EfficientDet模块的输入端连接有BiFPN模块,所述BiFPN模块的输出端连接有可变形Transformer模块,所述可变形Transformer模块的输出端连接有实施细节,所述EfficientDet模块包括有P1、P2、P3、P4、P5、P6和P7七级特征;
检测方法工作步骤如下:
步骤一、建立数据集;
步骤二、通过EfficientDet模块建立骨干网络,从骨干网络中提取3—7级特征{P3、P4、P5、P6、P7},并反复应用自上而下和自下而上的双向特征融合BiFPN网络;
步骤三、通过可变形Transformer模块进行数据处理,实现网络结构优化;
步骤四、其他细节处理;
步骤五、进行结果分析,通过视觉检测和消融研究。
优选的,所述建立数据集模块作为评估所提方法性能的基准,所述EfficientDet模块为主干网络,所述BiFPN模块为特征网络,所述可变形Transformer模块为优化网络。
优选的,所述可变形Transformer模块包括有输入序列转换、可变形Transformer层、MS-DMSA层和特征融合模块。
优选的,所述可变形Transformer层由一个MS-DMSA层和一个前馈网络组成,每个层之后都要进行规范化处理,每个子层中都采用跳过连接策略。
优选的,所述BiFPN模块只拥有一个输入的节点被删除,每个双向即自上而下和自下而上的路径视为一个特征网络层,并多次重复同一层。
优选的,所述输入序列转换包括有编码器和解码器。
优选的,所述实施细节包括有数据增强策略、优化预训练的权重和其他优化方法。
优选的,所述数据集图像的典型分辨率为1600×1024,3500×2280像素,数据集中的每张图像可能包含战斗机、武装直升机、轰炸机、预警机和客运飞机,而且数据集中的每张图像包含不同数量的飞机物体,且飞机图像的标签包含飞机的边界框和飞机的类型。
优选的,所述可变形Transformer模块处理数据的步骤如下:
S1.输入到序列的转换
在编码器和解码器堆栈底部的输入嵌入中加入位置编码,使用不同频率的正弦和余弦函数来计算每个维度pos的位置坐标,如下所示:
其中pos是位置,是CNN特征图的维度,i是控制不同位置的频率,dmodel是特征图的维度,对于每个特征层,我们通过元素相加将位置编码与扁平化的特征图结合起来,形成Transformer的输入序列;
S2.MS-DMSA层
S3.结构优化的特征融合模块
首先将其重塑为一个与P5大小相同的二维特征图,并对每个二维特征图采用核大小的卷积层,该卷积层的输出通道被减半,为了结合Transformer捕获的全局上下文信息和EfficientDet骨干提取的丰富局部语义信息,将所有通道减半的特征图和输入特征图P5连接起来,得到一个特征图;
最后,该特征图被送入具有核大小和相同通道的卷积层,进行特征自适应校准,得到最终的融合特征,将第六层和第十二层Transformer的输出和用来产生{P6}层的输入,这样可以更好地获得不同层的特征,并保持计算和效率的平衡,具体来说,这两张调整后的特征图被串联起来,最后通过卷积函数得到特征。
与现有技术相比,本发明的有益效果是:
1、本发明通过采用可变形Transformer模块优化网络结构,引入多尺度可变形自关注MS-DMSA机制来实现有效的长距离语境建模,通过元素相加将位置编码与扁平化的特征图结合起来,形成Transformer的输入序列,保护空间信息不被丢失,通过只关注参考位置周围的一小部分关键采样位置,而不是所有位置的MS-DMSA层来提高收敛速度,而可变形Transformer层内部每个子层中都采用了跳过连接策略,以避免梯度消失,解决Transformer和CNN骨干的特征图之间的尺寸不一致问题。
2、本发明通过采用BiFPN网络作为特征网络对跨尺度连接进行,第一,与PANet相比,BiFPN网络只拥有一个输入的节点被删除,因为如果一个节点在没有特征融合的情况下只有一个输入,它对特征网络融合不同特征的贡献较小;第二,在每一层中,从输入节点到输出节点增加一条边,这种设置可以在不增加太多额外计算成本的情况下整合更多的特征;第三,与PANet只有一条自上而下和一条自下而上的路径不同,BiFPN网络将每个双向即自上而下和自下而上的路径视为一个特征网络层,并多次重复同一层,以实现更高级的特征融合,使用快速归一化融合,使每个归一化权重的值也在0和1之间,由于快速归一化融合中没有softmax操作,故而效率更高。
3、本发明通过在P5和P6之间添加了12个的可变形Transforme,进而提高了在全局背景下的建模效率。
附图说明
图1为本发明的整体流程结构示意图;
图2为本发明的TransEffiDet的示意图;
图3为本发明的卷积核的接受域示意图;
图4为本发明的Transformer的详细尺寸及变化示意图;
图5为本发明的PANet和BiFPN架构示意图;
图6为本发明的Transformer和特征融合模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图6,本发明提供的一种实施例:基于EfficientDet和Transformer的航空图像中的飞机检测方法,包括TransEffiDet架构,所述TransEffiDet架构基本遵循单阶段目标检测方法的模式,所述TransEffiDet架构包括有建立数据集、EfficientDet模块、BiFPN模块、可变形Transformer模块和实施细节;
所述建立数据集的输出端连接有EfficientDet模块,所述EfficientDet模块的输入端连接有BiFPN模块,所述BiFPN模块的输出端连接有可变形Transformer模块,所述可变形Transformer模块的输出端连接有实施细节,所述EfficientDet模块包括有P1、P2、P3、P4、P5、P6和P7七级特征;
检测方法工作步骤如下:
步骤一、建立数据集;
步骤二、通过EfficientDet模块建立骨干网络,从骨干网络中提取3—7级特征{P3、P4、P5、P6、P7},并反复应用自上而下和自下而上的双向特征融合BiFPN网络;
步骤三、通过可变形Transformer模块进行数据处理,实现网络结构优化;
步骤四、其他细节处理;
步骤五、进行结果分析,通过视觉检测和消融研究,视觉检测:在一些典型图像上可看出与EfficientDet方法相比,提出的TransEffiDet可以实现更精确的检测,EfficientDet产生的检测框比真实物体大或小,导致较低的精度,而TransEffiDet产生的检测框可以达到更好的精度,由于某些类型的飞机是相似的,导致EfficientDet方法会产生一些飞机的假阳性结果,从而使得网络很难检测到这些类似的物体,Transformer可以提供对提取的特征图的长距离依赖,并进一步使网络集中于飞机的特征,进而消除假阳性结果,提升精度;
消融研究:其中mAP被用来评估性能,通过使用融合的方法,即连接(Cat),添加(Add),不同层的输入和Transformer的输出Z4(Z6 ,Z8,Z12),以获得最佳的融合特征表示,Transformer的所有输出被送入卷积层(核大小3*3),其中有(*/半)和没有特征通道减半的操作,*代表输入和不同转化器层的输出,如下表所示:
从上表中模型1、2和8的结果,可以看到一个明显的趋势,即添加的特征图越多,性能越好,与模型1相比,模型2通过添加Transformer中间层的特征图明显提高了性能。模型4通过在最终融合特征中引入输入,获得了进一步提高的性能,此外,为了探索特征融合方式的影响,建立了模型3、4和5,我们可以看到,连接融合方式可以获得相对较好的检测结果,这是由于简单的加法不能很好地整合不同的特征图,最后,构建模型6和7,以进一步证明所提出的特征融合模块的有效性,通过结合Transformer的长期建模能力和输入特征的丰富局部信息,导致模型8的良好表现。
所述建立数据集模块作为评估所提方法性能的基准,所述EfficientDet模块为主干网络,所述BiFPN模块为特征网络,所述可变形Transformer模块为优化网络。
所述可变形Transformer模块包括有输入序列转换、可变形Transformer层、MS-DMSA层和特征融合模块。
所述可变形Transformer层由一个MS-DMSA层和一个前馈网络组成,每个层之后都要进行规范化处理,每个子层中都采用跳过连接策略。
所述BiFPN模块只拥有一个输入的节点被删除,每个双向即自上而下和自下而上的路径视为一个特征网络层,并多次重复同一层。
所述输入序列转换包括有编码器和解码器。
所述实施细节包括有数据增强策略、优化预训练的权重和其他优化方法,其中数据增强策略采用数据增强的方法,通过在图像中加入不同的特征变量来实现不同的特征学习,为了在保留基本特征的同时扩大训练数据集,数据增强被仔细地应用于生成新的图像集,在训练数据集中包含了各种随机变化,包括移动、旋转、缩放和水平或垂直翻转,优化预训练的权重处于高阶特征是在Imagenet数据集上学习的,可能与飞机的检测没有直接关系,因此重新训练了一些卷积块来微调分类任务的权重,加强飞机检测之间的联系,在其他优化方法方面,为了减少内存需求,我们将图像的大小调整为768×768的分辨率进行训练,减少内存需求。
所述数据集图像的典型分辨率为1600×1024,3500×2280像素,数据集中的每张图像可能包含战斗机、武装直升机、轰炸机、预警机和客运飞机,而且数据集中的每张图像包含不同数量的飞机物体,且飞机图像的标签包含飞机的边界框和飞机的类型。
所述可变形Transformer模块处理数据的步骤如下:
S1.输入到序列的转换
在编码器和解码器堆栈底部的输入嵌入中加入位置编码,使用不同频率的正弦和余弦函数来计算每个维度pos的位置坐标,如下所示:
其中pos是位置,是CNN特征图的维度,i是控制不同位置的频率,dmodel是特征图的维度,对于每个特征层,我们通过元素相加将位置编码与扁平化的特征图结合起来,形成Transformer的输入序列;
S2.MS-DMSA层
S3.结构优化的特征融合模块
首先将其重塑为一个与P5大小相同的二维特征图,并对每个二维特征图采用核大小的卷积层,该卷积层的输出通道被减半,为了结合Transformer捕获的全局上下文信息和EfficientDet骨干提取的丰富局部语义信息,将所有通道减半的特征图和输入特征图P5连接起来,得到一个特征图;
最后,该特征图被送入具有核大小和相同通道的卷积层,进行特征自适应校准,得到最终的融合特征,将第六层和第十二层Transformer的输出和用来产生{P6}层的输入,这样可以更好地获得不同层的特征,并保持计算和效率的平衡,具体来说,这两张调整后的特征图被串联起来,最后通过卷积函数得到特征。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (9)
1.基于EfficientDet和Transformer的航空图像中的飞机检测方法,包括TransEffiDet架构,其特征在于:所述TransEffiDet架构基本遵循单阶段目标检测方法的模式,所述TransEffiDet架构包括有建立数据集、EfficientDet模块、BiFPN模块、可变形Transformer模块和实施细节;
所述建立数据集的输出端连接有EfficientDet模块,所述EfficientDet模块的输入端连接有BiFPN模块,所述BiFPN模块的输出端连接有可变形Transformer模块,所述可变形Transformer模块的输出端连接有实施细节,所述EfficientDet模块包括有P1、P2、P3、P4、P5、P6和P7七级特征;
检测方法工作步骤如下:
步骤一、建立数据集;
步骤二、通过EfficientDet模块建立骨干网络,从骨干网络中提取3—7级特征{P3、P4、P5、P6、P7},并反复应用自上而下和自下而上的双向特征融合BiFPN网络;
步骤三、通过可变形Transformer模块进行数据处理,实现网络结构优化;
步骤四、其他细节处理;
步骤五、进行结果分析,通过视觉检测和消融研究。
2.根据权利要求1所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述建立数据集模块作为评估所提方法性能的基准,所述EfficientDet模块为主干网络,所述BiFPN模块为特征网络,所述可变形Transformer模块为优化网络。
3.根据权利要求1所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述可变形Transformer模块包括有输入序列转换、可变形Transformer层、MS-DMSA层和特征融合模块。
4.根据权利要求3所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述可变形Transformer层由一个MS-DMSA层和一个前馈网络组成,每个层之后都要进行规范化处理,每个子层中都采用跳过连接策略。
5.根据权利要求1所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述BiFPN模块只拥有一个输入的节点被删除,每个双向即自上而下和自下而上的路径视为一个特征网络层,并多次重复同一层。
6.根据权利要求3所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述输入序列转换包括有编码器和解码器。
7.根据权利要求1所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述实施细节包括有数据增强策略、优化预训练的权重和其他优化方法。
8.根据权利要求1所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于:所述数据集图像的典型分辨率为1600×1024,3500×2280像素,数据集中的每张图像可能包含战斗机、武装直升机、轰炸机、预警机和客运飞机,而且数据集中的每张图像包含不同数量的飞机物体,且飞机图像的标签包含飞机的边界框和飞机的类型。
9.根据权利要求1所述的基于EfficientDet和Transformer的航空图像中的飞机检测方法,其特征在于,所述可变形Transformer模块处理数据的步骤如下:
S1.输入到序列的转换
在编码器和解码器堆栈底部的输入嵌入中加入位置编码,使用不同频率的正弦和余弦函数来计算每个维度pos的位置坐标,如下所示:
其中pos是位置,是CNN特征图的维度,i是控制不同位置的频率,dmodel是特征图的维度,对于每个特征层,我们通过元素相加将位置编码与扁平化的特征图结合起来,形成Transformer的输入序列;
S2.MS-DMSA层
S3.结构优化的特征融合模块
首先将其重塑为一个与P5大小相同的二维特征图,并对每个二维特征图采用核大小的卷积层,该卷积层的输出通道被减半,为了结合Transformer捕获的全局上下文信息和EfficientDet骨干提取的丰富局部语义信息,将所有通道减半的特征图和输入特征图P5连接起来,得到一个特征图;
最后,该特征图被送入具有核大小和相同通道的卷积层,进行特征自适应校准,得到最终的融合特征,将第六层和第十二层Transformer的输出和用来产生{P6}层的输入,这样可以更好地获得不同层的特征,并保持计算和效率的平衡,具体来说,这两张调整后的特征图被串联起来,最后通过卷积函数得到特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110835879.1A CN113283409B (zh) | 2021-07-23 | 2021-07-23 | 基于EfficientDet和Transformer的航空图像中的飞机检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110835879.1A CN113283409B (zh) | 2021-07-23 | 2021-07-23 | 基于EfficientDet和Transformer的航空图像中的飞机检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113283409A true CN113283409A (zh) | 2021-08-20 |
CN113283409B CN113283409B (zh) | 2022-02-11 |
Family
ID=77287232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110835879.1A Active CN113283409B (zh) | 2021-07-23 | 2021-07-23 | 基于EfficientDet和Transformer的航空图像中的飞机检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113283409B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837305A (zh) * | 2021-09-29 | 2021-12-24 | 北京百度网讯科技有限公司 | 目标检测及模型训练方法、装置、设备和存储介质 |
CN113902744A (zh) * | 2021-12-10 | 2022-01-07 | 湖南师范大学 | 基于轻量级网络的图像检测方法、系统、设备和存储介质 |
CN114550460A (zh) * | 2022-04-25 | 2022-05-27 | 中国科学院自动化研究所 | 轨道交通异常检测方法、装置及存储介质 |
CN115984277A (zh) * | 2023-03-20 | 2023-04-18 | 中国烟草总公司四川省公司 | 一种卷烟箱外包装油污破损检测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764082A (zh) * | 2018-05-17 | 2018-11-06 | 淘然视界(杭州)科技有限公司 | 一种飞机目标检测方法、电子设备、存储介质及系统 |
CN111563494A (zh) * | 2020-07-16 | 2020-08-21 | 平安国际智慧城市科技股份有限公司 | 基于目标检测的行为识别方法、装置和计算机设备 |
CN112084945A (zh) * | 2020-09-09 | 2020-12-15 | 深圳市赛为智能股份有限公司 | 主动式驱鸟方法、装置、计算机设备及存储介质 |
CN112150821A (zh) * | 2020-10-14 | 2020-12-29 | 清华大学 | 轻量化车辆检测模型构建方法、系统及装置 |
-
2021
- 2021-07-23 CN CN202110835879.1A patent/CN113283409B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764082A (zh) * | 2018-05-17 | 2018-11-06 | 淘然视界(杭州)科技有限公司 | 一种飞机目标检测方法、电子设备、存储介质及系统 |
CN111563494A (zh) * | 2020-07-16 | 2020-08-21 | 平安国际智慧城市科技股份有限公司 | 基于目标检测的行为识别方法、装置和计算机设备 |
CN112084945A (zh) * | 2020-09-09 | 2020-12-15 | 深圳市赛为智能股份有限公司 | 主动式驱鸟方法、装置、计算机设备及存储介质 |
CN112150821A (zh) * | 2020-10-14 | 2020-12-29 | 清华大学 | 轻量化车辆检测模型构建方法、系统及装置 |
Non-Patent Citations (4)
Title |
---|
SADRA NADDAF-SH等: "An Efficient and Scalable Deep Learning Approach for Road Damage Detection", 《ARXIV:2011.09577V1 [CS.CV]》 * |
XIZHOU ZHU等: "DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION", 《ICLR2021》 * |
YUTONG XIE等: "CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image Segmentation", 《ARXIV:2103.03024V1 [CS.CV]》 * |
徐歆恺 等: "自动驾驶场景的尺度感知实时行人检测", 《中国图象图形学报》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837305A (zh) * | 2021-09-29 | 2021-12-24 | 北京百度网讯科技有限公司 | 目标检测及模型训练方法、装置、设备和存储介质 |
CN113837305B (zh) * | 2021-09-29 | 2022-09-23 | 北京百度网讯科技有限公司 | 目标检测及模型训练方法、装置、设备和存储介质 |
US11823437B2 (en) | 2021-09-29 | 2023-11-21 | Beijing Baidu Netcom Science Technology Co., Ltd. | Target detection and model training method and apparatus, device and storage medium |
CN113902744A (zh) * | 2021-12-10 | 2022-01-07 | 湖南师范大学 | 基于轻量级网络的图像检测方法、系统、设备和存储介质 |
CN113902744B (zh) * | 2021-12-10 | 2022-03-08 | 湖南师范大学 | 基于轻量级网络的图像检测方法、系统、设备和存储介质 |
CN114550460A (zh) * | 2022-04-25 | 2022-05-27 | 中国科学院自动化研究所 | 轨道交通异常检测方法、装置及存储介质 |
CN114550460B (zh) * | 2022-04-25 | 2022-07-12 | 中国科学院自动化研究所 | 轨道交通异常检测方法、装置及存储介质 |
CN115984277A (zh) * | 2023-03-20 | 2023-04-18 | 中国烟草总公司四川省公司 | 一种卷烟箱外包装油污破损检测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113283409B (zh) | 2022-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111612066B (zh) | 基于深度融合的卷积神经网络的遥感图像分类方法 | |
CN113283409A (zh) | 基于EfficientDet和Transformer的航空图像中的飞机检测方法 | |
CN114022432B (zh) | 基于改进的yolov5的绝缘子缺陷检测方法 | |
CN108596055B (zh) | 一种复杂背景下高分辨遥感图像的机场目标检测方法 | |
CN106504233A (zh) | 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及系统 | |
CN116229295A (zh) | 基于融合卷积注意力机制的遥感图像目标检测方法 | |
CN105740909A (zh) | 一种基于空间变换的自然场景下文本识别方法 | |
CN104978580A (zh) | 一种用于无人机巡检输电线路的绝缘子识别方法 | |
CN112488025B (zh) | 基于多模态特征融合的双时相遥感影像语义变化检测方法 | |
CN107563433A (zh) | 一种基于卷积神经网络的红外小目标检测方法 | |
CN110189304A (zh) | 基于人工智能的光学遥感图像目标在线快速检测方法 | |
CN109034192B (zh) | 一种基于深度学习的轨道-车体振动状态预测方法 | |
CN110414616B (zh) | 一种利用空间关系的遥感图像字典学习分类方法 | |
CN109712127A (zh) | 一种用于机巡视频流的输电线路故障检测方法 | |
CN112818777B (zh) | 一种基于密集连接与特征增强的遥感图像目标检测方法 | |
CN113297915A (zh) | 一种基于无人机巡检的绝缘子识别目标检测方法 | |
CN105574489A (zh) | 基于层次级联的暴力群体行为检测方法 | |
CN107767416A (zh) | 一种低分辨率图像中行人朝向的识别方法 | |
CN111612030A (zh) | 基于深度学习的风电机组叶片表面故障识别与分类方法 | |
CN112348758A (zh) | 一种光学遥感图像数据增强方法及目标识别方法 | |
CN114565824B (zh) | 基于全卷积网络的单阶段旋转舰船检测方法 | |
CN114187506A (zh) | 视点意识的动态路由胶囊网络的遥感图像场景分类方法 | |
CN111507353A (zh) | 一种基于文字识别的中文字段检测方法及系统 | |
CN112668662B (zh) | 基于改进YOLOv3网络的野外山林环境目标检测方法 | |
Gao et al. | FSOD4RSI: Few-Shot Object Detection for Remote Sensing Images Via Features Aggregation and Scale Attention |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |