CN113065511B - 基于深度学习的遥感图像飞机检测模型及方法 - Google Patents
基于深度学习的遥感图像飞机检测模型及方法 Download PDFInfo
- Publication number
- CN113065511B CN113065511B CN202110430858.1A CN202110430858A CN113065511B CN 113065511 B CN113065511 B CN 113065511B CN 202110430858 A CN202110430858 A CN 202110430858A CN 113065511 B CN113065511 B CN 113065511B
- Authority
- CN
- China
- Prior art keywords
- module
- layer
- unit
- resunit
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 114
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 title claims description 8
- 230000004927 fusion Effects 0.000 claims abstract description 67
- 238000005070 sampling Methods 0.000 claims description 57
- 101100112467 Rattus norvegicus Cblc gene Proteins 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008034 disappearance Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 241000405217 Viola <butterfly> Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Astronomy & Astrophysics (AREA)
- Multimedia (AREA)
- Remote Sensing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种基于深度学习的遥感图像飞机检测模型及方法。该模型包括:下采样单元、上采样单元、特征融合单元和检测单元;所述下采样单元的输出和所述上采样单元的输出作为所述特征融合单元的输入,所述特征融合单元的输出作为检测单元的输入;所述下采样单元包括依次相连接的CBL模块、ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块和CBL*5模块;其中,ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块分别对应5次下采样操作,每次下采样操作均使得输入的遥感图像的大小缩小为原来的1/2。本发明可以提高目标物体的检测率。
Description
技术领域
本发明涉及遥感图像目标检测技术领域,尤其涉及一种基于深度学习的遥感图像飞机检测模型及方法。
背景技术
飞机作为民用生活和军事活动不可或缺的重要物体之一,在航空领域中发挥着重要的作用,因此对飞机的目标检测具有相当大的指导意义。另一方面,遥感图像目标检测的难度与物体所处的背景环境有着很大的关联,处于广阔机场范围领域内的飞机,以机场为背景,检测目标与背景之间存在严重的差异性,会造成背景和检测目标之间的平衡性失调,此外由于飞机的尺寸普遍偏小,给飞机目标检测增加了很大的难度。
传统的目标检测方法(如Viola P, Jones M. Rapid object detection using aboosted cascade of simple features[C]//Proceedings of the 2001 IEEE computersociety conference on computer vision and pattern recognition. CVPR 2001.IEEE, 2001, 1: I-I;Viola P, Jones M J. Robust real-time face detection[J].International journal of computer vision, 2004, 57(2): 137-154.)通过手动设计的特征,对图像进行特征的提取,然后将提取出来的特征输入到网络模型中,通过滑动窗口的机制进行候选框的选取,最后再将选取的候选框通过分类器进行类别的分类。然而,这种手动提取的特征往往不具备鲁棒性,难以适当地描述图像的特征,并且滑动窗口的提取策略相当复杂和耗时。
发明内容
针对传统目标检测方法存在手动提取特征困难并且提取出来的特征鲁棒性不强的问题,本发明提供一种基于深度学习的遥感图像飞机检测模型及方法,实验证明,本发明在遥感图像飞机检测中Precision、Recall、F1-score以及Map等各项性能指标均有所提高。
一方面,本发明提供一种基于深度学习的遥感图像飞机检测模型,包括下采样单元、上采样单元、特征融合单元和检测单元;所述下采样单元的输出和所述上采样单元的输出作为所述特征融合单元的输入,所述特征融合单元的输出作为检测单元的输入;其中:
所述下采样单元包括依次相连接的CBL模块、ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块和CBL*5模块;其中,ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块分别对应5次下采样操作,每次下采样操作均使得输入的遥感图像的大小缩小为原来的1/2;
所述上采样单元包括3层结构相同的上采样模块;每层所述上采样模块均包括依次连接的CBL模块和UpSample模块;
所述特征融合单元包括3层结构相同的融合模块,每层所述融合模块均包括依次连接的Concat模块和CBL*5模块;
所述检测单元包括4层结构相同的检测分支网络;每个所述检测分支网络均包括依次相连接的CBL*5模块、CBL模块和Conv模块;
其中,ResUnit*N卷积块包括1个CBL模块和N个子卷积块;每个所述子卷积块均包括依次相连接的2个CBL模块和1个ADD模块;所述ResUnit*N卷积块中的CBL模块分别和每个所述子卷积块中的第一个CBL模块与ADD模块相连接;N个子卷积块之间并行连接;N=1、2、4和8;
所述CBL模块包括依次相连接的Conv层、BN层和Leaky Relu函数。
进一步地,将所述下采样单元中的CBL*5模块替换为依次相连接的CBL*3模块、DAWM模块和CBL*3模块;所述DAWM模块包括相互并行连接的第一分支网络、第二分支网络、第三分支网络和第四分支网络;所述第一分支网络、第二分支网络、第三分支网络和第四分支网络的输出结果共同再经过一个1*1的卷积核后与上一层网络的输出结果相加作为FileConcatenation的输入;其中:
所述第一分支网络包括1个1*1的卷积核;
所述第二分支网络包括依次相连接的1个1*1的卷积核和1个3*3的卷积核;
所述第三分支网络包括依次相连接的1个1*1的卷积核和2个3*3的卷积核;
所述第四分支网络包括依次相连接的1个1*1的卷积核和3个3*3的卷积核。
另一方面,本发明提供一种基于深度学习的遥感图像飞机检测方法,采用上述的遥感图像飞机检测模型,所述方法包括:
将待测遥感图像输入至遥感图像飞机检测模型;
所述下采样单元对所述待测遥感图像连续进行5次下采样操作,并将第五次下采样操作的输出结果作为所述检测单元中的第一层检测分支网络的输入;
所述上采样单元中的第一层上采样模块对第五次下采样操作的输出结果进行第一次上采样操作;
所述特征融合单元中的第一层融合模块对第一次上采样操作的输出结果和第四次下采样操作的输出结果进行特征融合,将第一层融合模块的输出结果分别作为所述上采样单元中的第二层上采样模块的输入和所述检测单元中的第二层检测分支网络的输入;
所述上采样单元中的第二层上采样模块对第一层融合模块的输出结果进行第二次上采样操作;
所述特征融合单元中的第二层融合模块对第二次上采样操作的输出结果和第三次下采样操作的输出结果进行特征融合,将第二层融合模块的输出结果分别作为所述上采样单元中的第三层上采样模块的输入和所述检测单元中的第三层检测分支网络的输入;
所述上采样单元中的第三层上采样模块对第二层融合模块的输出结果进行第三次上采样操作;
所述特征融合单元中的第三层融合模块对第三次上采样操作的输出结果和第二次下采样操作的输出结果进行特征融合,将第三层融合模块的输出结果作为所述检测单元中的第四层检测分支网络的输入。
本发明的有益效果:
(1)本发明引进了多尺度检测模型MSDN,通过将图片划分成不同大小的检测网格,增大目标物体掉落在负责检测的网格的位置,从而提高目标物体的检测率。
(2)本发明提出了新的网络模块DAWM,通过不同卷积核尺度的堆叠,在加深网络宽度和深度的同时,增强了网络对不同尺度的输出能力,同时引入残差结构,使得网络不会由于过深而导致梯度消失。
(3)本发明将DAWM模块引入到MSDN网络模型中,经过DAWM模块泛化过的特征能够更好地提高网络的非线性化能力,在通过MSDN网络模型的特征融合,可以将泛化的特征进行传递并进行特征融合,从而可以提高不同检测尺度的检测效果。
附图说明
图1为本发明实施例提供的基于深度学习的遥感图像飞机检测模型的结构图;
图2为本发明又一实施例提供的基于深度学习的遥感图像飞机检测模型的结构图;
图3为本发明实施例提供的DAWM模块的结构图;
图4为本发明实施例提供的算法性能指标对比图;
图5为本发明实施例提供的实验数据对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种基于深度学习的遥感图像飞机检测模型,包括下采样单元、上采样单元、特征融合单元和检测单元;所述下采样单元的输出和所述上采样单元的输出作为所述特征融合单元的输入,所述特征融合单元的输出作为检测单元的输入;其中:
所述下采样单元包括依次相连接的CBL模块、ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块和CBL*5模块;其中,ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块分别对应5次下采样操作,每次下采样操作均使得输入的遥感图像的大小缩小为原来的1/2;
所述上采样单元包括3层结构相同的上采样模块;每层所述上采样模块均包括依次连接的CBL模块和UpSample模块;
所述特征融合单元包括3层结构相同的融合模块,每层所述融合模块均包括依次连接的Concat模块和CBL*5模块;
所述检测单元包括4层结构相同的检测分支网络;每个所述检测分支网络均包括依次相连接的CBL*5模块、CBL模块和Conv模块;
其中,ResUnit*N卷积块包括1个CBL模块和N个子卷积块;每个所述子卷积块均包括依次相连接的2个CBL模块和1个ADD模块;所述ResUnit*N卷积块中的CBL模块分别和每个所述子卷积块中的第一个CBL模块与ADD模块相连接;N个子卷积块之间并行连接;N=1、2、4和8;
所述CBL模块包括依次相连接的Conv层、BN层和Leaky Relu函数。
本发明实施例提供的遥感图像飞机检测模型(Multi-Scale Detection Network,简称为:MSDN),通过使用不同的检测尺度进行目标的预测,将输入到网络模型的遥感图像划分成不同大小的网格,使得目标物体可以更大概率地掉落在负责检测的网格中去,达到可以检测不同大小物体的效果,降低目标物体检测的漏检率,从而实现多尺度目标检测的效果。
为了能够进一步提高检测模型的非线性化能力,提高检测模型的泛化能力,在上述实施例的基础上,如图2所示,本发明实施例还提供一种基于深度学习的遥感图像飞机检测模型,与上述实施例的不同之处在于,本发明实施例中,将所述下采样单元中的CBL*5模块替换为依次相连接的CBL*3模块、DAWM模块和CBL*3模块;其中,如图3所示,所述DAWM模块包括相互并行连接的第一分支网络、第二分支网络、第三分支网络和第四分支网络;
所述第一分支网络、第二分支网络、第三分支网络和第四分支网络的输出结果共同再经过一个1*1的卷积核后与上一层网络的输出结果相加作为File Concatenation的输入;其中:
所述第一分支网络包括1个1*1的卷积核;所述第二分支网络包括依次相连接的1个1*1的卷积核和1个3*3的卷积核;所述第三分支网络包括依次相连接的1个1*1的卷积核和2个3*3的卷积核;所述第四分支网络包括依次相连接的1个1*1的卷积核和3个3*3的卷积核。
其中,2个3*3的卷积核相当于1个5*5的卷积核,3个3*3的卷积核相当于1个7*7的卷积核。
本发明实施例提供的基于深度学习的遥感图像飞机检测模型,引入新的网络模块DAWM(Deeper And Wider Module),将之命名为Muti-Scale Refined Detection Network(MSRDN)模型。该检测模型通过DAWM模块中的不同卷积核尺度的堆叠,在加深网络宽度和深度的同时,增强了网络对不同尺度的输出能力,同时引入残差结构,使得网络不会由于过深而导致梯度消失。
对应上述的基于深度学习的遥感图像飞机检测模型,本发明实施例还提供一种基于深度学习的遥感图像飞机检测方法,所述方法包括:
将待测遥感图像输入至遥感图像飞机检测模型;
所述下采样单元对所述待测遥感图像连续进行5次下采样操作,并将第五次下采样操作的输出结果作为所述检测单元中的第一层检测分支网络的输入;
所述上采样单元中的第一层上采样模块对第五次下采样操作的输出结果进行第一次上采样操作;
所述特征融合单元中的第一层融合模块对第一次上采样操作的输出结果和第四次下采样操作的输出结果进行特征融合,将第一层融合模块的输出结果分别作为所述上采样单元中的第二层上采样模块的输入和所述检测单元中的第二层检测分支网络的输入;
所述上采样单元中的第二层上采样模块对第一层融合模块的输出结果进行第二次上采样操作;
所述特征融合单元中的第二层融合模块对第二次上采样操作的输出结果和第三次下采样操作的输出结果进行特征融合,将第二层融合模块的输出结果分别作为所述上采样单元中的第三层上采样模块的输入和所述检测单元中的第三层检测分支网络的输入;
所述上采样单元中的第三层上采样模块对第二层融合模块的输出结果进行第三次上采样操作;
所述特征融合单元中的第三层融合模块对第三次上采样操作的输出结果和第二次下采样操作的输出结果进行特征融合,将第三层融合模块的输出结果作为所述检测单元中的第四层检测分支网络的输入。
具体地,结合图1和图2所示的检测模型,将遥感图像输入到检测模型中以后,遥感图像会经过若干层的卷积层进行特征提取,在进行特征提取的过程中,主干网络会对输入的遥感图像进行5次相应的下采样操作,每次下采样操作都会使输入的图像的大小变为原来的1/2,随着不断的下采样操作,图像特征的细节信息会减少,但是图像特征的语义信息会增多,在MSDN网络模型中,ResUnit*1,ResUnit*2,ResUnit*8,ResUnit*8,ResUnit*4卷积块内部,分别对应着五次下采样操作。例如,若输入的初始遥感图像的大小为416*416,那么连续经过5次下采样操作之后,最终输出的遥感图像的大小为13*13。
为了能够充分地利用上下层的特征,本发明实施例将深层特征与浅层特征进行特征融合,即:将第五次下采样操作之后的结果,进行第一次上采样操作之后,与第四次下采样操作的结果进行特征融合;同理,将第四次下采样操作的结果与第三次下采样操作的结果,将第三次下采样操作的结果与第二次下采样操作的结果以同样的方式进行特征融合,将融合之后的特征进行目标的检测,融合之后的检测尺度分别对应着原图的1/4、1/8、1/16和1/32,分别对应着MSDN(或MSRDN)检测模型中的Predict4(第四层检测分支网络)、Predict3(第三层检测分支网络)、Predict2(第二层检测分支网络)和Predict1(第一层检测分支网络),通过使用不同的检测尺度进行目标的预测,将输入网络的图片划分成不同大小的网格,使得目标物体可以更大概率地掉落在负责检测的网格中去,达到可以检测不同大小物体的效果,降低目标物体检测的漏检率,从而实现多尺度目标检测的效果。
可以理解,在采用MSRDN检测模型进行飞机检测时,通过DAWM模块中不同的卷积核进行特征提取,对输入的图像进行特征的泛化,可以使得检测模型的感知野进一步扩大,将泛化之后的特征传递到不同的检测尺度当中去,泛化之后的特征可以大幅度地提高检测尺度的准确性,在提高网络模型检测结果的同时,从而降低目标物体的漏检率;同时DAWM模块中使用了残差连接,可以避免随着卷积层堆叠太多而网络层数变深所导致的梯度消失或者梯度爆炸问题的出现,从而不会影响网络的反向传播。
为了验证本发明提供的检测模型及方法的有效性,本发明还提供有以下实验,具体如下:
采用遥感图像飞机数据集RSOD-DataSet上进行训练和测试,其中该数据集包括446张飞机图像,总共包含4993个飞机物体,训练集和测试集按照4比1的比例进行随机划分;
实验平台采用的是操作系统Ubuntu16.4.0,处理器为Intel(R) Xeon(R) Silver4114 CPU @ 2.20GHz,显卡为两块8G运行内存的Quadro P4000;
通过与Yolov3目标检测算法进行对比,采用Precision、Recall、F1-score、Map等性能指标作为评价算法性能的标准,算法性能指标对比图如图4所示。从图4中可以明显看出,本发明提供的检测模型及方法在遥感图像飞机检测中Precision、Recall、F1-score以及Map等各项性能指标均有所提高;
实验数据对比图如图5示,其中方框为算法检测出来的物体,圆框为算法漏检的物体,从图中可以明显地看出来,Yolov3算法漏检了部分小目标,并且存在重复的框选,而MSDN算法检测出来了这些小目标,MSRDN算法在MSDN算法的基础上提高了部分小目标的精准率,从而使得小目标检测不出来,漏检率高等问题得到了改善。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (1)
1.基于深度学习的遥感图像飞机检测方法,其特征在于,包括:
将待测遥感图像输入至遥感图像飞机检测模型;所述遥感图像飞机检测模型包括下采样单元、上采样单元、特征融合单元和检测单元;所述下采样单元的输出和所述上采样单元的输出作为所述特征融合单元的输入,所述特征融合单元的输出作为检测单元的输入;其中:
所述下采样单元包括依次相连接的CBL模块、ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块、CBL*3模块、DAWM模块和CBL*3模块;其中,ResUnit*1卷积块、ResUnit*2卷积块、第一ResUnit*8卷积块、第二ResUnit*8卷积块、ResUnit*4卷积块分别对应5次下采样操作,每次下采样操作均使得输入的遥感图像的大小缩小为原来的1/2;所述DAWM模块包括相互并行连接的第一分支网络、第二分支网络、第三分支网络和第四分支网络;所述第一分支网络、第二分支网络、第三分支网络和第四分支网络的输出结果共同再经过一个1*1的卷积核后与上一层网络的输出结果相加作为File Concatenation的输入;其中:
所述第一分支网络包括1个1*1的卷积核;
所述第二分支网络包括依次相连接的1个1*1的卷积核和1个3*3的卷积核;
所述第三分支网络包括依次相连接的1个1*1的卷积核和2个3*3的卷积核;
所述第四分支网络包括依次相连接的1个1*1的卷积核和3个3*3的卷积核;
所述上采样单元包括3层结构相同的上采样模块;每层所述上采样模块均包括依次连接的CBL模块和UpSample模块;
所述特征融合单元包括3层结构相同的融合模块,每层所述融合模块均包括依次连接的Concat模块和CBL*5模块;
所述检测单元包括4层结构相同的检测分支网络;每个所述检测分支网络均包括依次相连接的CBL*5模块、CBL模块和Conv模块;
其中,ResUnit*N卷积块包括1个CBL模块和N个子卷积块;每个所述子卷积块均包括依次相连接的2个CBL模块和1个ADD模块;所述ResUnit*N卷积块中的CBL模块分别和每个所述子卷积块中的第一个CBL模块与ADD模块相连接;N个子卷积块之间并行连接;N=1、2、4和8;
所述CBL模块包括依次相连接的Conv层、BN层和Leaky Relu函数;
所述下采样单元对所述待测遥感图像连续进行5次下采样操作,并将第五次下采样操作的输出结果作为所述检测单元中的第一层检测分支网络的输入;
所述上采样单元中的第一层上采样模块对第五次下采样操作的输出结果进行第一次上采样操作;
所述特征融合单元中的第一层融合模块对第一次上采样操作的输出结果和第四次下采样操作的输出结果进行特征融合,将第一层融合模块的输出结果分别作为所述上采样单元中的第二层上采样模块的输入和所述检测单元中的第二层检测分支网络的输入;
所述上采样单元中的第二层上采样模块对第一层融合模块的输出结果进行第二次上采样操作;
所述特征融合单元中的第二层融合模块对第二次上采样操作的输出结果和第三次下采样操作的输出结果进行特征融合,将第二层融合模块的输出结果分别作为所述上采样单元中的第三层上采样模块的输入和所述检测单元中的第三层检测分支网络的输入;
所述上采样单元中的第三层上采样模块对第二层融合模块的输出结果进行第三次上采样操作;
所述特征融合单元中的第三层融合模块对第三次上采样操作的输出结果和第二次下采样操作的输出结果进行特征融合,将第三层融合模块的输出结果作为所述检测单元中的第四层检测分支网络的输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110430858.1A CN113065511B (zh) | 2021-04-21 | 2021-04-21 | 基于深度学习的遥感图像飞机检测模型及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110430858.1A CN113065511B (zh) | 2021-04-21 | 2021-04-21 | 基于深度学习的遥感图像飞机检测模型及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113065511A CN113065511A (zh) | 2021-07-02 |
CN113065511B true CN113065511B (zh) | 2024-02-02 |
Family
ID=76567267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110430858.1A Active CN113065511B (zh) | 2021-04-21 | 2021-04-21 | 基于深度学习的遥感图像飞机检测模型及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113065511B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245754A (zh) * | 2019-06-14 | 2019-09-17 | 西安邮电大学 | 一种基于位置敏感图的知识蒸馏方法 |
CN110298292A (zh) * | 2019-06-25 | 2019-10-01 | 东北大学 | 基于规则多边形物体角点检测的高精度实时抓取检测方法 |
CN110689054A (zh) * | 2019-09-10 | 2020-01-14 | 华中科技大学 | 一种工人违规行为监测方法 |
WO2020244261A1 (zh) * | 2019-06-05 | 2020-12-10 | 中国科学院长春光学精密机械与物理研究所 | 高分辨率遥感图像的场景识别系统及模型生成方法 |
CN112215207A (zh) * | 2020-11-10 | 2021-01-12 | 中国人民解放军战略支援部队信息工程大学 | 联合多尺度和注意力机制的遥感影像飞机目标检测方法 |
CN112215208A (zh) * | 2020-11-10 | 2021-01-12 | 中国人民解放军战略支援部队信息工程大学 | 基于改进YOLOv4的遥感影像桥梁目标检测算法 |
CN112232309A (zh) * | 2020-12-08 | 2021-01-15 | 飞础科智慧科技(上海)有限公司 | 用于热像人脸识别的方法、电子设备和存储介质 |
CN112329861A (zh) * | 2020-11-06 | 2021-02-05 | 北京工业大学 | 一种面向移动机器人多目标检测的分层特征融合方法 |
CN112380952A (zh) * | 2020-11-10 | 2021-02-19 | 广西大学 | 基于人工智能的电力设备红外图像实时检测及识别方法 |
CN112464717A (zh) * | 2020-10-23 | 2021-03-09 | 西安电子科技大学 | 一种遥感图像目标检测方法、系统、电子设备和存储介质 |
CN112597897A (zh) * | 2020-12-24 | 2021-04-02 | 华南农业大学 | 基于深度神经网络的果园香蕉检测方法、系统、设备及介质 |
CN112633335A (zh) * | 2020-12-10 | 2021-04-09 | 长春理工大学 | 一种垃圾分类方法及垃圾桶 |
US10984290B1 (en) * | 2019-11-15 | 2021-04-20 | Zoox, Inc. | Multi-task learning for real-time semantic and/or depth aware instance segmentation and/or three-dimensional object bounding |
-
2021
- 2021-04-21 CN CN202110430858.1A patent/CN113065511B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020244261A1 (zh) * | 2019-06-05 | 2020-12-10 | 中国科学院长春光学精密机械与物理研究所 | 高分辨率遥感图像的场景识别系统及模型生成方法 |
CN110245754A (zh) * | 2019-06-14 | 2019-09-17 | 西安邮电大学 | 一种基于位置敏感图的知识蒸馏方法 |
CN110298292A (zh) * | 2019-06-25 | 2019-10-01 | 东北大学 | 基于规则多边形物体角点检测的高精度实时抓取检测方法 |
CN110689054A (zh) * | 2019-09-10 | 2020-01-14 | 华中科技大学 | 一种工人违规行为监测方法 |
US10984290B1 (en) * | 2019-11-15 | 2021-04-20 | Zoox, Inc. | Multi-task learning for real-time semantic and/or depth aware instance segmentation and/or three-dimensional object bounding |
CN112464717A (zh) * | 2020-10-23 | 2021-03-09 | 西安电子科技大学 | 一种遥感图像目标检测方法、系统、电子设备和存储介质 |
CN112329861A (zh) * | 2020-11-06 | 2021-02-05 | 北京工业大学 | 一种面向移动机器人多目标检测的分层特征融合方法 |
CN112380952A (zh) * | 2020-11-10 | 2021-02-19 | 广西大学 | 基于人工智能的电力设备红外图像实时检测及识别方法 |
CN112215208A (zh) * | 2020-11-10 | 2021-01-12 | 中国人民解放军战略支援部队信息工程大学 | 基于改进YOLOv4的遥感影像桥梁目标检测算法 |
CN112215207A (zh) * | 2020-11-10 | 2021-01-12 | 中国人民解放军战略支援部队信息工程大学 | 联合多尺度和注意力机制的遥感影像飞机目标检测方法 |
CN112232309A (zh) * | 2020-12-08 | 2021-01-15 | 飞础科智慧科技(上海)有限公司 | 用于热像人脸识别的方法、电子设备和存储介质 |
CN112633335A (zh) * | 2020-12-10 | 2021-04-09 | 长春理工大学 | 一种垃圾分类方法及垃圾桶 |
CN112597897A (zh) * | 2020-12-24 | 2021-04-02 | 华南农业大学 | 基于深度神经网络的果园香蕉检测方法、系统、设备及介质 |
Non-Patent Citations (3)
Title |
---|
Diverse receptive field network with context aggregation for fast object detection;Shaorong Xie 等,;《Journal of Visual Communication and Image Representation》;20200731;第70卷;第4-5页 * |
基于YOLOv4卷积神经网络的口罩佩戴检测方法;管军霖 等,;《现代信息科技》;20200610;第4卷(第11期);第9-12页 * |
遥感图像中飞机的改进YOLOv3实时检测算法;戴伟聪;金龙旭;李国宁;郑志强;;光电工程(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113065511A (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114120019B (zh) | 一种轻量化的目标检测方法 | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
US20220335711A1 (en) | Method for generating pre-trained model, electronic device and storage medium | |
CN113569667B (zh) | 基于轻量级神经网络模型的内河船舶目标识别方法及系统 | |
CN112766087A (zh) | 一种基于知识蒸馏的光学遥感图像舰船检测方法 | |
Wang et al. | FE-YOLOv5: Feature enhancement network based on YOLOv5 for small object detection | |
Li et al. | A new method of image detection for small datasets under the framework of YOLO network | |
US20230130006A1 (en) | Method of processing video, method of quering video, and method of training model | |
CN110390340B (zh) | 特征编码模型、视觉关系检测模型的训练方法及检测方法 | |
CN110569738A (zh) | 基于密集连接网络的自然场景文本检测方法、设备和介质 | |
CN110826056B (zh) | 一种基于注意力卷积自编码器的推荐系统攻击检测方法 | |
US11587345B2 (en) | Image identification device, method for performing semantic segmentation, and storage medium | |
CN114742799A (zh) | 基于自监督异构网络的工业场景未知类型缺陷分割方法 | |
CN111815576B (zh) | 金属部件腐蚀状况检测方法、装置、设备和存储介质 | |
Luo et al. | A lightweight face detector by integrating the convolutional neural network with the image pyramid | |
CN110852066A (zh) | 一种基于对抗训练机制的多语言实体关系抽取方法及系统 | |
Zhao et al. | ST-YOLOA: a Swin-transformer-based YOLO model with an attention mechanism for SAR ship detection under complex background | |
Shankar et al. | Comparing YOLOV3, YOLOV5 & YOLOV7 Architectures for Underwater Marine Creatures Detection | |
CN117911394A (zh) | 基于改进YOLOv5的钢材表面缺陷检测方法及系统 | |
CN113065511B (zh) | 基于深度学习的遥感图像飞机检测模型及方法 | |
CN117437555A (zh) | 一种基于深度学习的遥感影像目标提取处理方法及装置 | |
CN117173759A (zh) | 一种基于多尺度特征融合的人脸检测方法 | |
CN114898454A (zh) | 一种神经网络模型的训练方法、装置、电子设备及介质 | |
CN114882428A (zh) | 一种基于注意力机制与多尺度融合的目标检测方法 | |
Yao et al. | Enhanced Deeplab Network for Infrared Small Target Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |