CN112132093B - 高分辨率遥感图像目标检测方法、装置和计算机设备 - Google Patents
高分辨率遥感图像目标检测方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112132093B CN112132093B CN202011057391.2A CN202011057391A CN112132093B CN 112132093 B CN112132093 B CN 112132093B CN 202011057391 A CN202011057391 A CN 202011057391A CN 112132093 B CN112132093 B CN 112132093B
- Authority
- CN
- China
- Prior art keywords
- image
- preset
- remote sensing
- training
- target detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 177
- 238000012549 training Methods 0.000 claims abstract description 152
- 108700016304 palmitoyl tuberactinamine N Proteins 0.000 claims abstract description 67
- BOUNXJOSVRWQIH-LYBHJNIJSA-N n-[(6e)-3-(2-amino-1,4,5,6-tetrahydropyrimidin-6-yl)-6-[(carbamoylamino)methylidene]-9,12-bis(hydroxymethyl)-2,5,8,11,14-pentaoxo-1,4,7,10,13-pentazacyclohexadec-15-yl]hexadecanamide Chemical compound N1C(=O)\C(=C/NC(N)=O)NC(=O)C(CO)NC(=O)C(CO)NC(=O)C(NC(=O)CCCCCCCCCCCCCCC)CNC(=O)C1C1NC(N)=NCC1 BOUNXJOSVRWQIH-LYBHJNIJSA-N 0.000 claims abstract description 66
- 238000005520 cutting process Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 29
- 230000006870 function Effects 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 10
- WDLRUFUQRNWCPK-UHFFFAOYSA-N Tetraxetan Chemical group OC(=O)CN1CCN(CC(O)=O)CCN(CC(O)=O)CCN(CC(O)=O)CC1 WDLRUFUQRNWCPK-UHFFFAOYSA-N 0.000 claims description 9
- 230000001537 neural effect Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 19
- 238000013527 convolutional neural network Methods 0.000 description 63
- 238000010586 diagram Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 210000005036 nerve Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003331 infrared imaging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Astronomy & Astrophysics (AREA)
- Multimedia (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种高分辨率遥感图像目标检测方法、装置和计算机设备。所述方法包括:根据关注目标类型和待检测像的覆盖区域对包括真实边界框的高分辨率遥感数据进行缩放和裁剪,生成样本集用于训练预先设置的基于级联R‑CNN网络的PTAN目标检测模型,并根据级联R‑CNN网络的分类误差和回归误差构建目标函数。将待检测的高分辨率遥感图像裁剪成与样本集中的训练图像块大小相同的检测图像块,输入训练好的PTAN目标检测模型,得到目标检测结果。本申请根据遥感图像的特点,在PTAN目标检测模型训练阶段对图像进行了缩放和裁剪处理,以增强PTAN目标检测模型的泛化能力,基于处理后的图像生成样本集训练PTAN目标检测模型,可提高目标检测和识别精度。
Description
技术领域
本申请涉及遥感图像处理技术领域,特别是涉及一种高分辨率遥感图像目标检测方法、装置和计算机设备。
背景技术
基于深度学习图像处理方法已经在自然图像处理领域取得了巨大的成功,基于神经网络建立的各种图像处理模型能够基于提取图像中的目标区域、目标类别、运动轨迹等信息,并在此基础上实现目标检测、识别和跟踪等图像处理功能。
作为图像数据的另一个重要来源,遥感成像技术也广泛应用于目标检测。遥感成像技术具有许多优势,如卫星遥感成像不易受障碍物遮挡,红外成像系统、合成孔径雷达等则可以在恶劣天气下正常拍摄等。由于成像方式的差异,遥感图像与自然图像数据相比具有以下特点:一是图像尺寸大,处理耗时且占用大量存储空间。二是目标尺寸、密度和数量跨度大,且同类目标在不同遥感图像中的尺寸差异也可能非常大。三是拍摄角度不同,由于遥感图像大多通过高空或空间平台拍摄,图像中的目标的成像角度、阴影与自然图像数据有很大不同,并且受大气环境干扰,目标的边缘更加模糊。
正是由于遥感图像的上述特点,使得自然图像处理领域的目标检测算法很难直接迁移到光学遥感图像中。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对大尺寸的遥感图像进行目标检测的高分辨率遥感图像目标检测方法、装置和计算机设备。
一种高分辨率遥感图像目标检测方法,包括:
获取包括真实边界框的高分辨率遥感训练图像。
按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
其中一个实施例中,构建预先设置的基于级联R-CNN网络的PTAN目标检测模型的方法包括:
构建用于图像特征提取的神经卷积网络。
将神经卷积网络输出的特征图输入预先构建的第1级Faster R-CNN网络,输出第1级回归结果。
将第t-1级回归结果输入预先构建的第t级Faster R-CNN网络,输出第t级回归结果。其中,t≥2。
其中一个实施例中,Faster R-CNN网络的级数t=3。
其中一个实施例中,预先设置的一组缩放倍数值包括a、b和c,其中a>1,b<1,c=1。
其中一个实施例中,按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集的步骤包括:
按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,得到对应的多个图像。
根据预设的交叠尺寸,按照预设尺寸将缩放处理得到的多个图像剪成大小相同的训练图像块。
根据训练图像块构建用于模型训练的样本集。
其中一个实施例中,获取待检测的高分辨率遥感图像,按照预设尺寸将高分辨率遥感图像裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果的步骤包括:
获取待检测的高分辨率遥感图像。
根据预设的交叠尺寸和裁剪尺寸,将高分辨率遥感图像裁剪成大小相同的检测图像块。
将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
其中一个实施例中,包括真实边界框的高分辨率遥感训练图像为DOTA数据集或NWPU VHR-10数据集。
一种高分辨率遥感图像目标检测装置,包括:
训练图像获取模块,用于获取包括真实边界框的高分辨率遥感训练图像。
训练样本集构建模块,用于按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
模型训练模块,用于根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取包括真实边界框的高分辨率遥感训练图像。
按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取包括真实边界框的高分辨率遥感训练图像。
按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
上述高分辨率遥感图像目标检测方法、装置、计算机设备和存储介质,根据关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定训练数据的缩放倍数值和裁剪尺寸,将包括真实边界框的高分辨率遥感数据进行缩放和裁剪处理,生成大小相同的训练图像块作为样本集,使用该样本集训练预先设置的基于级联R-CNN网络的PTAN目标检测模型,并根据级联R-CNN网络的分类误差和回归误差构建损失函数,评估模型的优化程度。当模型训练完成后,由待检测的高分辨率遥感图像生成检测图像块,输入训练好的PTAN目标检测模型,得到模型输出的目标检测结果。本申请可以根据特定遥感系统和/或特定区域遥感图像的特点训练PTAN目标检测模型,增强PTAN目标检测模型的泛化能力:对于较大的目标,能够使目标处于同一个图像块中,提供全面的目标特征信息;对于较小的目标,能够充分利用图像的分辨率,获得其细节特征信息。基于处理后的图像生成样本集,对基于级联R-CNN的目标检测网络进行训练,可以使训练得到的PTAN目标检测模型具有更高的目标检测和识别精度。
附图说明
图1为一个实施例中一种高分辨率遥感图像目标检测方法的步骤图;
图2为一个实施例中一种高分辨率遥感图像目标检测方法的训练数据缩放裁剪方式和推理数据裁剪方式示意图;
图3为一个实施例中一种高分辨率遥感图像目标检测方法的流程示意图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种高分辨率遥感图像目标检测方法,包括以下步骤:
步骤102,获取包括真实边界框的高分辨率遥感训练图像。
可以从已有的遥感图像数据库或特定的遥感成像设备中获得高分辨率遥感训练图像,也可以使用开源的遥感图像训练数据集。在直接获取的图像数据中不包括真实边界框时,可以通过人工标定的方式给出真实边界框数据。真实边界框作为高分辨率遥感训练图像中的先验知识,在训练阶段与PTAN目标检测模型的输出进行比较,以优化模型的网络参数。其中,PTAN是指即基于图像块的3级聚合网络(a patch-based three-stageaggregation network),即本申请提供的目标检测模型的实现网络。
步骤104,按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
具体地,需要根据待检测的高分辨率遥感图像的采集系统(即PTAN目标检测模型的应用环境)、图像覆盖区域、区域中常见目标以及目标检测关注的目标类型等要素确定训练图像数据的缩放倍数值和裁剪尺寸。由于遥感图像不同于自然图像的特点,对于不同的遥感图像采集系统,同一个目标在图像中的变化非常大。对此,可以结合待检测的遥感图像的采集平台,以及用于训练的遥感图像采集平台之间的成像距离比,作为训练图像的一个或多个缩放比例值。另外,当关注不同类型的目标时,也可以根据单个关注目标的尺度以及多个关注目标的尺度比例确定训练图像的多个缩放比例。例如当关注目标的尺度较小时,可以利用遥感图像分辨率高的特点,指定一个较大的放大比例值,以更好地获得小目标的细节信息;而当多个关注目标的尺寸相差较大时,可以根据最大和最小目标分别设定缩放比例值,以更好地兼顾多种目标的获取。另外,在对特定区域进行监测的情况下,还可以根据对该区域的先验知识(包括可能存在的目标类型)指定适当的缩放值。
而在裁剪训练图像时,对于缩放后的图像进行裁剪的目的是获取适应于对应缩放比例的目标。为此,可以针对不同缩放比例的图像定义相同大小的裁剪尺寸,并且为了确保不将目标裁剪到两个训练图像块中,需要定义适当的交叠区域,对缩放后的遥感图像进行滑动裁剪。裁剪大小和交叠区域可以根据关注目标类型(大小)和图像缩放比例共同确定,滑动的距离可以根据目标可能的分布密度确定。
步骤106,根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
具体地,将步骤104生成的样本集输入预先设置好的PTAN目标检测模型。PTAN目标检测模型基于级联R-CNN网络构建,输出多级的分类和回归结果。根据多级的分类和回归结果可以定义模型训练的目标函数,获得使级联R-CNN的最后一级输出的分类误差和回归误差满足预设性能要求的PTAN目标检测模型。由于检测结果的IoU会高于检测时的IoU阈值,因此这一网络结构会逐级提高输出的边界框的IoU值,从而提高检测结果的精度。
步骤108,将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
将待检测的高分辨率遥感图像按照训练样本集的图像裁剪方式进行处理,并输入训练好的检测模型,得到对应的目标检测结果。
上述高分辨率遥感图像目标检测方法根据遥感图像的特点,在PTAN目标检测模型训练阶段根据关注目标类型和待检测的高分辨率遥感图像的覆盖区域对图像进行了缩放和裁剪处理,以增强PTAN目标检测模型的泛化能力:对于较大的目标,能够使目标处于同一个图像块中,提供全面的目标特征信息;对于较小的目标,能够充分利用图像的分辨率,获得其细节特征信息。基于处理后的图像生成样本集,对基于级联R-CNN的目标检测网络进行训练,可以使训练得到的PTAN目标检测模型具有更高的目标检测和识别精度。
在一个实施例中,提供了一种高分辨率遥感图像目标检测方法,包括以下步骤:
步骤202,获取高分辨率遥感训练图像。
具体地,可以采用NMPU、UCAS-AOD、COWC、DOTA、DIOR、NWPU VHR-10等开源数据集。
步骤204,按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,得到对应的多个图像。
本实施例中,采用的缩放倍数值为0.5、1和2。对每一幅高分辨率遥感训练图像可以对应获得3幅缩放后的图像(缩放值为1时即是原图像)。
步骤206,根据预设的交叠尺寸,按照预设尺寸将缩放处理得到的多个图像剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。
具体地,如图2所示,本实施例中,选择训练图像块的大小为1000×1000像素,滑动距离为500个像素,即同一区域分别包括在4个相邻的训练图块中,以保证目标能够更完整地包含在一个训练图块内,可以改善对裁剪位置附近图像的识别性能,避免由于裁剪导致的特征丢失。对于裁剪后的训练图块,随机选择了30000个图像块作为模型训练的样本集。通过上述处理方式获得的样本集,一方面能够兼顾大尺度目标和小尺度目标在模型中的检测性能,还能提高模型对尺度变化的同一目标的检测性能,能够增强训练好的PTAN目标检测模型的泛化能力。
步骤208,根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
具体地,如图3所示,本实施例中预先设置的基于级联R-CNN网络的PTAN目标检测模型包括一个RPN网络和一个3级Faster R-CNN网络级联的聚合网络。RPN(RegionProposal Network,区域生成网络)是一种全卷积网络,利用“锚框”机制可以处理任意大小的图像,根据输入的图片或特征图推荐候选框,候选框带有目标得分信息。训练图像块输入模型后,生成的特征图由RPN网络提取出候选框,将候选框输入第1级Faster R-CNN网络的池化层生成固定大小的特征图,然后通过全连接网络(FC)输出第1级的分类网络和回归网络,获得对于的分类结果和回归结果。对于第1级的回归结果,再次基于RPN提取与第1级同样数量的候选框,输入第2级Faster R-CNN网络,输出第2级的回归结果。类似地,根据第2级的回归结果获得第3级的回归结果,作为PTAN目标检测模型的目标检测框输出。PTAN目标检测模型中,每一级Faster R-CNN网络的IoU阈值u都设置为高于前一级,本实施例中分别设置为0.5、0.6和0.7。
IoU阈值用于定义并生成正负样本,当候选框和预先标定的真实边界框的IoU大于阈值时,就判断为候选框包括目标,即为正样本;否则为负样本。对于第t级Faster R-CNN网络的输入候选框xt,定义其分类标签为yt,表示为:
其中,是真实目标g对应的分类标签,ut是第t级的IoU阈值。如果xt和目标g对应的真实边界框之间的IoU大于给定的IoU阈值ut,则将判断其属于该类目标。现有的目标检测算法中一般将IoU阈值设置为0.5,这一值比较低,实际上引入了较多的检测噪声。如果为了降低检测噪声而单纯提高IoU阈值,会使正样本数量减少,PTAN目标检测模型训练可能出现过拟合,造成性能下降。此外,在推理阶段如果输入图像的IoU与IoU阈值相差过大,也会导致目标检测结果精度的下降。这是由于推理阶段无法获得真实边界框数据,只能将候选框都作为正样本,其中必然包括IoU较低的候选框。而使用IoU阈值较高的检测网络处理IoU较低的候选框时,由于网络没有针对该IoU取值范围进行过优化,其检测性能反而会下降。
本实施例中,R-CNN网络中各级网络都包括针对给定的IoU阈值ut进行优化的一个分类器ht和一个回归器ft。各级网络的损失函数定义为:
L(xt,g)=Lcls(ht(xt),yt)+λ[yt≥1]Lloc(ft(xt,bt),g)
其中,Lcls表示分类损失,采用了交叉熵损失函数。ht(xt)是K+1维(包括K类目标和背景)的分类结果后验分布估计,将xt分类成K+1类。yt是对应的分类标签。λ是平衡参数(本实施例中设为1),yt≥1是分类识别函数,只有标注了分类标签的样本才参与坐标回归计算。Lloc表示回归损失,采用了Fast-RCNN的平滑L1损失函数。边界框回归的过程是根据候选框xt和对应的真实边界框g,使用回归器ft(xt,bt)得到边界框bt。bt可以由框左上角坐标(x,y)以及比框的宽值w和高度h确定,表示为bt=(bx,by,bw,bh)。由于当前级的回归器和上一级的回归器相关,bt还可以表示为bt=ft-1(xt-1,bt-1)。由于检测网络输出数据的IoU一般会好于输入数据的IoU,且模型中各级网络的IoU阈值设置为依次递增,因此其输出数据的IoU会逐层提高,使最终的目标检测精度将上升。另外,上一级Faster R-CNN网络输出的回归结果,经过重新采样后选择与上一级相同数量的候选框作为下一级Faster R-CNN网络的输入,这样可以保证各级网络输入的候选框数量相同,同时也改变了数据的分布,提高模型的目标检测能力。
步骤210,获取待检测的高分辨率遥感图像。根据预设的交叠尺寸和裁剪尺寸,将高分辨率遥感图像裁剪成大小相同的检测图像块。将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
具体地,本步骤根据预设的图像大小和交叠尺寸裁剪待检测的高分辨率遥感图像,使用训练好的PTAN目标检测模型得到目标检测结果。这里裁剪大小和交叠尺寸可以和训练阶段一致,本实施例中为了加快目标检测速度,待检测图像裁剪为1300×1300像素的图像块,滑动距离为200像素。
本实施例提供了高分辨率遥感图像目标检测方法的一种具体实现方式,使用专用的遥感图像训练数据集,经过处理后输入预先设置的3级级联R-CNN网络,得到对应的目标检测结果。
为了进一步说明本申请提供方法的有效性,下面以ResNet50为基础分别实现了输入图像尺寸为800×800、900×900、1000×1000的基于级联R-CNN网络的PTAN目标检测模型,各级IoU阈值分别设为0.5、0.6和0.7,分别使用DOTA数据集和NWPU VHR-10数据集对本实施例的PTAN目标检测模型进行了训练。DOTA数据集的图像大小从800×800像素至4000×4000像素不等,实验中对其进行了相应的缩放和裁剪(缩放比例分别为0.5、1、2,裁剪尺寸分别为800×800、900×900、1000×1000),将不同尺寸的图像块都划分为训练数据集、验证数据集合测试数据集。对每个模型的训练共进行了60万次迭代,前30万次的学习率为0.0025,随后10万次的学习率为0.00025,最后20万次的学习率为0.000025。对于NWPU VHR-10数据集中的图像(一般为600×800像素)未进行缩放,而是将其划分为训练数据集和测试数据集。训练中进行了6000次迭代,学习率设置比例与DOTA数据集一致。模型训练过程采用了随机梯度下降算法(SGD),算法中最小批量为1幅图像,每次迭代中的候选框数量为128个,权重衰减和动量分别为0.0001和0.9。
对于训练得到的模型,使用DOTA测试数据集和NWPU VHR-10测试数据集进行验证,根据平均精度(AP)指标比较基于各种网络的目标检测模型的性能。表1给出了级联R-CNN网络和本申请提供的PTAN目标检测模型的对不同类型目标的检测AP值,以及模型对各种类型目标的平均AP值(mAP)。PTAN后面的数字表示训练样本的训练图像块大小。
方法 | R-CNN | PTAN800 | PTAN900 | PTAN1000 |
飞机 | 0.7486 | 0.9008 | 0.9037 | 0.9020 |
船只 | 0.6727 | 0.8921 | 0.8922 | 0.8974 |
油罐 | 0.4399 | 0.7692 | 0.8031 | 0.8049 |
棒球场 | 0.6515 | 0.8368 | 0.8231 | 0.8291 |
网球场 | 0.8966 | 0.9080 | 0.9082 | 0.9080 |
篮球场 | 0.4504 | 0.6826 | 0.6991 | 0.7469 |
田径场 | 0.4632 | 0.7909 | 0.8050 | 0.8136 |
港口 | 0.8573 | 0.8868 | 0.8923 | 0.8905 |
桥梁 | 0.3620 | 0.6206 | 0.6448 | 0.6332 |
大型车辆 | 0.7100 | 0.7923 | 0.7871 | 0.8464 |
小型车辆 | 0.6254 | 0.6600 | 0.6552 | 0.6993 |
直升机 | 0.3627 | 0.7371 | 0.6945 | 0.7438 |
环岛 | 0.3670 | 0.7370 | 0.7414 | 0.7837 |
足球场 | 0.4048 | 0.7044 | 0.6893 | 0.7120 |
游泳池 | 0.4748 | 0.7093 | 0.6917 | 0.7261 |
mAP | 0.5662 | 0.7752 | 0.7761 | 0.7958 |
表1不同PTAN和级联R-CNN的平均精度比较
实验以级联R-CNN网络为参照。表1中可以看到,几种基于PTAN的PTAN目标检测模型的性能普遍优于级联的R-CNN网络,更适用于遥感图像处理;且随着训练图像块的增大,目标检测准确率随之提高,mPA最大提高为22.96%(从0.5662提高到0.7958)。
实验还对比了级联R-CNN、FPN和本申请提供方法(PTAN100)的目标检测性能,如表2所示。
方法 | FPN | 级联R-CNN | 本申请 |
飞机 | 0.7072 | 0.7486 | 0.9020 |
船只 | 0.6073 | 0.6727 | 0.8974 |
油罐 | 0.3864 | 0.4399 | 0.8049 |
棒球场 | 0.6043 | 0.6515 | 0.8291 |
网球场 | 0.8155 | 0.8966 | 0.9080 |
篮球场 | 0.4913 | 0.4504 | 0.7469 |
田径场 | 0.4190 | 0.4632 | 0.8136 |
港口 | 0.7699 | 0.8573 | 0.8905 |
桥梁 | 0.2631 | 0.3620 | 0.6332 |
大型车辆 | 0.6706 | 0.7100 | 0.8464 |
小型车辆 | 0.5276 | 0.6254 | 0.6993 |
直升机 | 0.2976 | 0.3627 | 0.7438 |
环岛 | 0.2589 | 0.3670 | 0.7837 |
足球场 | 0.3784 | 0.4048 | 0.7120 |
游泳池 | 0.3235 | 0.4748 | 0.7261 |
mAP | 0.4966 | 0.5662 | 0.7958 |
表2 FPN、级联R-CNN和PTAN100的平均精度值比较
可以看到,本申请提供的方法在性能上具有明显的优势。此外,为了本申请中各级的IoU阈值的设置是基于实验得到的。使用NWPU VHR-10数据集对设置为不同IoU阈值的PTAN目标检测模型进行了测试,结果如表3所示。可以看到,本申请中第二个实施例选择的三级IoU阈值0.5、0.6和0.7对于各种目标具有较高的综合检测性能。
表3 IoU阈值设置与平均精度值变化
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,提供了一种高分辨率遥感图像目标检测装置,包括:
训练图像获取模块,用于获取包括真实边界框的高分辨率遥感训练图像。
训练样本集构建模块,用于按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
模型训练模块,用于根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
目标检测模块,用于将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
其中一个实施例中,还包括PTAN目标检测模型构建模块,用于构建用于图像特征提取的神经卷积网络。将神经卷积网络输出的特征图输入预先构建的第1级Faster R-CNN网络,输出第1级回归结果。将第t-1级回归结果输入预先构建的第t级Faster R-CNN网络,输出第t级回归结果。其中,t≥2。
其中一个实施例中,Faster R-CNN网络的级数t=3。
其中一个实施例中,预先设置的一组缩放倍数值包括a、b和c,其中a>1,b<1,c=1。
其中一个实施例中,训练样本集构建模块用于按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,得到对应的多个图像。根据预设的交叠尺寸,按照预设尺寸将缩放处理得到的多个图像剪成大小相同的训练图像块。根据训练图像块构建用于模型训练的样本集。
其中一个实施例中,目标检测模块用于获取待检测的高分辨率遥感图像。根据预设的交叠尺寸和裁剪尺寸,将高分辨率遥感图像裁剪成大小相同的检测图像块。将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
其中一个实施例中,包括真实边界框的高分辨率遥感训练图像为DOTA数据集或NWPU VHR-10数据集。
关于高分辨率遥感图像目标检测装置的具体限定可以参见上文中对于高分辨率遥感图像目标检测方法的限定,在此不再赘述。上述高分辨率遥感图像目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种高分辨率遥感图像目标检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取包括真实边界框的高分辨率遥感训练图像。
按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:构建用于图像特征提取的神经卷积网络。将神经卷积网络输出的特征图输入预先构建的第1级Faster R-CNN网络,输出第1级回归结果。将第t-1级回归结果输入预先构建的第t级Faster R-CNN网络,输出第t级回归结果。其中,t≥2。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,得到对应的多个图像。根据预设的交叠尺寸,按照预设尺寸将缩放处理得到的多个图像剪成大小相同的训练图像块。根据训练图像块构建用于模型训练的样本集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待检测的高分辨率遥感图像。根据预设的交叠尺寸和裁剪尺寸,将高分辨率遥感图像裁剪成大小相同的检测图像块。将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取包括真实边界框的高分辨率遥感训练图像。
按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据训练图像块构建用于模型训练的样本集。缩放倍数值和预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定。
根据样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练。目标函数包括根据级联R-CNN网络的分类误差和回归误差构建的损失函数,级联R-CNN网络的各级IoU阈值依次递增。
将待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:构建用于图像特征提取的神经卷积网络。将神经卷积网络输出的特征图输入预先构建的第1级Faster R-CNN网络,输出第1级回归结果。将第t-1级回归结果输入预先构建的第t级Faster R-CNN网络,输出第t级回归结果。其中,t≥2。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:按照预先设置的一组缩放倍数值,对高分辨率遥感训练图像进行多次缩放处理,得到对应的多个图像。根据预设的交叠尺寸,按照预设尺寸将缩放处理得到的多个图像剪成大小相同的训练图像块。根据训练图像块构建用于模型训练的样本集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待检测的高分辨率遥感图像。根据预设的交叠尺寸和裁剪尺寸,将高分辨率遥感图像裁剪成大小相同的检测图像块。将检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种高分辨率遥感图像目标检测方法,其特征在于,所述方法包括:
获取包括真实边界框的高分辨率遥感训练图像;
按照预先设置的一组缩放倍数值,对所述高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据所述训练图像块构建用于模型训练的样本集;所述缩放倍数值和所述预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定;
根据所述样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练;所述目标函数包括根据所述级联R-CNN网络的分类误差和回归误差构建的损失函数,所述级联R-CNN网络的各级IoU阈值依次递增;
将所述待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将所述检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果;
构建所述预先设置的基于级联R-CNN网络的PTAN目标检测模型的方法包括:
构建用于图像特征提取的神经卷积网络;
将所述神经卷积网络输出的特征图输入预先构建的第1级Faster R-CNN网络,输出第1级回归结果;
将第t-1级回归结果输入预先构建的第t级Faster R-CNN网络,输出第t级回归结果;其中,t≥2。
2.根据权利要求1所述的方法,其特征在于,所述Faster R-CNN网络的级数t=3。
3.根据权利要求1所述的方法,其特征在于,所述预先设置的一组缩放倍数值包括a、b和c,其中a>1,b<1,c=1。
4.根据权利要求1所述的方法,其特征在于,所述按照预先设置的一组缩放倍数值,对所述高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据所述训练图像块构建用于模型训练的样本集的步骤包括:
所述按照预先设置的一组缩放倍数值,对所述高分辨率遥感训练图像进行多次缩放处理,得到对应的多个图像;
根据预设的交叠尺寸,按照预设尺寸将缩放处理得到的多个图像剪成大小相同的训练图像块;
根据所述训练图像块构建用于模型训练的样本集。
5.根据权利要求3所述的方法,其特征在于,获取待检测的高分辨率遥感图像,按照所述预设尺寸将所述高分辨率遥感图像裁剪成大小相同的检测图像块,将所述检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果的步骤包括:
获取待检测的高分辨率遥感图像;
根据预设的交叠尺寸和裁剪尺寸,将所述高分辨率遥感图像裁剪成大小相同的检测图像块;
将所述检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述包括真实边界框的高分辨率遥感训练图像为DOTA数据集或NWPU VHR-10数据集。
7.一种高分辨率遥感图像目标检测装置,其特征在于,所述装置包括:
训练图像获取模块,用于获取包括真实边界框的高分辨率遥感训练图像;
训练样本集构建模块,用于按照预先设置的一组缩放倍数值,对所述高分辨率遥感训练图像进行多次缩放处理,将得到的多个图像按照预设图像尺寸和交叠尺寸裁剪成大小相同的训练图像块,根据所述训练图像块构建用于模型训练的样本集;所述缩放倍数值和所述预设图像尺寸和交叠尺寸,根据预设的关注目标类型和待检测的高分辨率遥感图像的覆盖区域确定;
模型训练模块,用于根据所述样本集和预先设置的目标函数,对预先设置的基于级联R-CNN网络的PTAN目标检测模型进行训练;所述目标函数包括根据所述级联R-CNN网络的分类误差和回归误差构建的损失函数,所述级联R-CNN网络的各级IoU阈值依次递增;
目标检测模块,用于将所述待检测的高分辨率遥感图像按照预设尺寸裁剪成大小相同的检测图像块,将所述检测图像块输入训练好的PTAN目标检测模型,得到目标检测结果;
模型训练模块还用于构建用于图像特征提取的神经卷积网络;将所述神经卷积网络输出的特征图输入预先构建的第1级Faster R-CNN网络,输出第1级回归结果;将第t-1级回归结果输入预先构建的第t级Faster R-CNN网络,输出第t级回归结果;其中,t≥2。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011057391.2A CN112132093B (zh) | 2020-09-30 | 2020-09-30 | 高分辨率遥感图像目标检测方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011057391.2A CN112132093B (zh) | 2020-09-30 | 2020-09-30 | 高分辨率遥感图像目标检测方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112132093A CN112132093A (zh) | 2020-12-25 |
CN112132093B true CN112132093B (zh) | 2024-01-05 |
Family
ID=73843363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011057391.2A Active CN112132093B (zh) | 2020-09-30 | 2020-09-30 | 高分辨率遥感图像目标检测方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132093B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819814A (zh) * | 2021-02-25 | 2021-05-18 | 汇鸿智能科技(辽宁)有限公司 | 金相组织的识别方法、装置、计算机设备及存储介质 |
CN113222889B (zh) * | 2021-03-30 | 2024-03-12 | 大连智慧渔业科技有限公司 | 高分辨率图像下水产养殖物的工厂化养殖计数方法及装置 |
CN113111960B (zh) * | 2021-04-25 | 2024-04-26 | 北京文安智能技术股份有限公司 | 图像处理方法和装置以及目标检测模型的训练方法和系统 |
CN113011528B (zh) * | 2021-04-28 | 2022-11-01 | 中国电子科技集团公司第五十四研究所 | 一种基于上下文和级联结构的遥感图像小目标检测方法 |
CN113361487B (zh) * | 2021-07-09 | 2024-09-06 | 无锡时代天使医疗器械科技有限公司 | 异物检测方法、装置、设备及计算机可读存储介质 |
CN113610045B (zh) * | 2021-08-20 | 2023-01-06 | 大连理工大学 | 深度特征集成学习的遥感图像目标识别泛化性方法 |
CN114333070A (zh) * | 2022-03-10 | 2022-04-12 | 山东山大鸥玛软件股份有限公司 | 一种基于深度学习的考生异常行为检测方法 |
CN114581781B (zh) * | 2022-05-05 | 2022-08-09 | 之江实验室 | 一种高分辨率遥感图像的目标检测方法及装置 |
CN114862683B (zh) * | 2022-07-07 | 2022-12-09 | 浪潮电子信息产业股份有限公司 | 模型生成方法、目标检测方法、装置、设备及介质 |
CN118230084A (zh) * | 2022-12-08 | 2024-06-21 | 中兴通讯股份有限公司 | 一种目标检测方法、目标检测模型的训练方法及装置 |
CN116363435B (zh) * | 2023-04-03 | 2023-10-27 | 盐城工学院 | 一种基于深度学习的遥感图像目标检测系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919108A (zh) * | 2019-03-11 | 2019-06-21 | 西安电子科技大学 | 基于深度哈希辅助网络的遥感图像快速目标检测方法 |
WO2019232836A1 (zh) * | 2018-06-04 | 2019-12-12 | 江南大学 | 基于改进全卷积网络的多尺度感知行人检测方法 |
CN110796634A (zh) * | 2019-09-10 | 2020-02-14 | 中国三峡建设管理有限公司 | 大坝状态检测方法、装置、计算机设备和可读存储介质 |
CN111091105A (zh) * | 2019-12-23 | 2020-05-01 | 郑州轻工业大学 | 基于新的边框回归损失函数的遥感图像目标检测方法 |
CN111626176A (zh) * | 2020-05-22 | 2020-09-04 | 中国科学院空天信息创新研究院 | 一种遥感图像的地物目标检测方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544534B (zh) * | 2018-11-26 | 2020-10-16 | 上海联影智能医疗科技有限公司 | 一种病灶图像检测装置、方法和计算机可读存储介质 |
-
2020
- 2020-09-30 CN CN202011057391.2A patent/CN112132093B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019232836A1 (zh) * | 2018-06-04 | 2019-12-12 | 江南大学 | 基于改进全卷积网络的多尺度感知行人检测方法 |
CN109919108A (zh) * | 2019-03-11 | 2019-06-21 | 西安电子科技大学 | 基于深度哈希辅助网络的遥感图像快速目标检测方法 |
CN110796634A (zh) * | 2019-09-10 | 2020-02-14 | 中国三峡建设管理有限公司 | 大坝状态检测方法、装置、计算机设备和可读存储介质 |
CN111091105A (zh) * | 2019-12-23 | 2020-05-01 | 郑州轻工业大学 | 基于新的边框回归损失函数的遥感图像目标检测方法 |
CN111626176A (zh) * | 2020-05-22 | 2020-09-04 | 中国科学院空天信息创新研究院 | 一种遥感图像的地物目标检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
基于Faster R-CNN的高分辨率图像目标检测技术;谢奇芳;姚国清;张猛;;国土资源遥感(02);第38-43页 * |
基于级联卷积神经网络的港口多方向舰船检测与分类;孙嘉赤等;系统工程与电子技术(第9期);第1903-1910页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112132093A (zh) | 2020-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112132093B (zh) | 高分辨率遥感图像目标检测方法、装置和计算机设备 | |
CN110991311B (zh) | 一种基于密集连接深度网络的目标检测方法 | |
CN109816012B (zh) | 一种融合上下文信息的多尺度目标检测方法 | |
CN109034078B (zh) | 年龄识别模型的训练方法、年龄识别方法及相关设备 | |
CN108960230B (zh) | 基于旋转矩形框的轻量化目标识别方法及装置 | |
CN112800964B (zh) | 基于多模块融合的遥感影像目标检测方法及系统 | |
CN108764325B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN109815770B (zh) | 二维码检测方法、装置及系统 | |
CN111709416B (zh) | 车牌定位方法、装置、系统及存储介质 | |
CN110163213B (zh) | 基于视差图和多尺度深度网络模型的遥感图像分割方法 | |
CN107808138B (zh) | 一种基于FasterR-CNN的通信信号识别方法 | |
CN110796048A (zh) | 一种基于深度神经网络的船舰目标实时检测方法 | |
CN106530271B (zh) | 一种红外图像显著性检测方法 | |
CN110610143B (zh) | 多任务联合训练的人群计数网络方法、系统、介质及终端 | |
CN107784288A (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
CN112800955A (zh) | 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统 | |
CN111753682A (zh) | 一种基于目标检测算法的吊装区域动态监控方法 | |
CN109410189B (zh) | 图像分割方法以及图像的相似度计算方法、装置 | |
CN111310609A (zh) | 基于时序信息和局部特征相似性的视频目标检测方法 | |
CN113762251B (zh) | 一种基于注意力机制的目标分类方法及系统 | |
CN110751671B (zh) | 一种基于核相关滤波与运动估计的目标跟踪方法 | |
CN117710728A (zh) | Sar图像目标识别方法、装置、计算机设备和存储介质 | |
CN104680181A (zh) | 基于似然比特征的sar图像超像素分割方法 | |
CN115630660B (zh) | 基于卷积神经网络的条码定位方法和装置 | |
CN115861595B (zh) | 一种基于深度学习的多尺度域自适应异源图像匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |