CN111798417A - 一种基于ssd遥感图像目标检测的方法及装置 - Google Patents
一种基于ssd遥感图像目标检测的方法及装置 Download PDFInfo
- Publication number
- CN111798417A CN111798417A CN202010568175.8A CN202010568175A CN111798417A CN 111798417 A CN111798417 A CN 111798417A CN 202010568175 A CN202010568175 A CN 202010568175A CN 111798417 A CN111798417 A CN 111798417A
- Authority
- CN
- China
- Prior art keywords
- data set
- target
- detected
- image
- prior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 43
- 238000012360 testing method Methods 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000002372 labelling Methods 0.000 claims abstract description 30
- 238000011176 pooling Methods 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 62
- 230000004913 activation Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10032—Satellite or aerial image; Remote sensing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30181—Earth observation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种基于SSD遥感图像目标检测的方法及装置,该方法包括:确定出图像训练数据集和图像测试数据集,在图像训练数据集以及图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注;将图像训练数据集输入到构建的SSD网络模型得到多个特征图,在每个特征图的每个像素点处设置一组尺度不同的先验框;将每个待检测目标的位置分别与每个先验框进行匹配确定出每个待检测目标对应的至少一个第一预测框,根据至少一个第一预测框对SSD网络模型进行优化;将图像测试数据集输入到优化后的SSD网络模型中,确定出每个待检测目标对应的至少一个第二预测框。本申请解决了现有技术中目标检测的效率较低的技术问题。
Description
技术领域
本申请涉及遥感图像处理和视觉分析技术领域,尤其涉及一种基于SSD遥感图像目标检测的方法及装置。
背景技术
遥感图像在遥感技术的迅速发展下得到了极大地丰富,人类对于地球进行观测分析的需求也愈发强烈,遥感图像的智能化处理分析技术由此应运而生。目标检测作为遥感图像的一种处理分析方法,在图像判读中起着至关重要的作用,被广泛应用于智能监测、城市规划、精准农业、地理信息系统(GIS)等领域。
目前,主要采用基于深度学习的目标检测方法。具体的,基于深度学习的目标检测方法包含两个关键步骤:图像特征提取和分类器训练,其中,分类器训练是指寻找一系列的规则,来确定当前图像中物体的类别和位置。目前基于深度学习的目标检测方法的过程为:先通过启发式方式或者卷积神经网络产生一系列稀疏的候选框,然后进行分类回归操作,由于属于两个步骤过程,因此检测效率较低。
发明内容
本申请解决的技术问题是:针对现有技术中目标检测的效率较低的问题,本申请提供了一种基于SSD遥感图像目标检测的方法及装置,在本申请实施例所提供的方案中,通过SSD网络模型中得到多个不同分辨率的特征图,根据所述多个不同分辨率的特征图进行目标检测,以及通过采用不同尺度与长宽比的先验框均匀地在特征图的不同像素点位置进行密集抽样,不仅能够适应对不同尺寸的物体检测需求,提高了识别的准确率,而且利用网络模型提取特征后直接进行分类与回归,整个过程只需要一步,从而提高了目标检测的效率。
第一方面,本申请实施例提供一种基于SSD遥感图像目标检测的方法,该方法包括:
从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注;
构建SSD网络模型,将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,其中,所述先验框为矩形框;
将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,其中,所述第一预测框是指与任一所述待检测目标位置匹配的先验框;
将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。
本申请实施例所提供的方案中,通过将图像训练数据集输入到SSD网络模型中得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,即采用不同尺寸的先验框均匀地在特征图的不同像素点位置进行密集抽样,然后将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,再根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型。因此,在本申请实施例所提供的方案中,通过SSD网络模型中得到多个不同分辨率的特征图,根据所述多个不同分辨率的特征图进行目标检测,以及通过采用不同尺寸的先验框均匀地在特征图的不同像素点位置进行密集抽样,仅能够适应对不同尺寸的物体检测需求,提高了方案的适用性,还通过多个不同分辨率的特征图以及在每个像素点处设置一组尺度不同的先验框进行目标检测,即进行多尺度检测,提高了目标检测速度以及准确性。
可选地,从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,包括:
根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集;
在所述第一图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第一图像数据集;
在所述第二图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第二图像数据集;
分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。
可选地,构建SSD网络模型,包括:
将预设的VGG16模型中的全连接层fc6转换成3×3的卷积层,以及将全连接层fc7转换成1×1的卷积层;
在所述VGG16模型中卷积层conv1到卷积层conv5之间,每个卷积层之后添加一个池化层;
在所述VGG16模型中卷积层conv7之后添加四个依次相连的卷积层,得到所述SSD网络模型。
可选地,在每个所述特征图的每个像素点处设置一组尺度不同的先验框,包括:
确定所述每个特征图中每个像素点的位置信息,以及所述每个特征图的尺度;
根据先验框尺度与特征图尺度之间预设的关系,计算所述先验框与所述特征图尺度之间的比值;
根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度;
根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。
可选地,将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,包括:
计算所述任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比;
根据所述第一交并比确定出所述至少一个第一预测框,其中,所述第一预测框是指所述第一交并比大于第一预设阈值所对应的先验框。
可选地,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,包括:
计算所述每个先验框对应的类别置信度误差,确定出所述类别置信度误差最大的第一先验框,判断所述至少一个第一预测框中是否包括所述第一先验框;
若包括,则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本,将剩余所述先验框设置为负样本;
确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差,并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数;
根据预设的优化算法对所述损失函数进行优化,得到所述优化后的SSD网络模型。
可选地,将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框,包括:
将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中,确定所述图像测试数据集中所述每个待检测目标的类别置信度,根据所述类别置信度确定所述每个待检测目标的类别;
根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框,得到至少一个第二先验框,确定所述至少一个第二先验框的置信度;
将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉,并根据所述置信度将所述过滤后的至少一个第二先验框进行排序,得到一先验框序列,从所述先验框序列选择出预设个数的第三先验框;
根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。
可选地,所述方法,还包括:
确定所述每个待检测目标位置与其对应的所述至少一个第二预测框之间重合度;
根据所述重合度判断所述每个待检测目标位置的检测是否正确;
若正确,则根据所述重合度计算每个类别的待检测目标的平均精度均值,以及确定检测速度评价指标。
第二方面,本申请实施例提供了一种基于SSD遥感图像目标检测的装置,该装置包括:
第一确定单元,用于从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注;
建模单元,用于构建SSD网络模型,将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,其中,所述先验框为矩形框;
优化单元,用于将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,其中,所述第一预测框是指与任一所述待检测目标位置匹配的先验框;
第二确定单元,用于将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。
可选地,所述第一确定单元,用于:
根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集;
在所述第一图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第一图像数据集;
在所述第二图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第二图像数据集;
分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。
可选的,所述建模单元,具体用于:
将预设的VGG16模型中的全连接层fc6转换成3×3的卷积层,以及将全连接层fc7转换成1×1的卷积层;
在所述VGG16模型中卷积层conv1到卷积层conv5之间,每个卷积层之后添加一个池化层;
在所述VGG16模型中卷积层conv7之后添加四个依次相连的卷积层,得到所述SSD网络模型。
可选地,所述优化单元,具体用于:
确定所述每个特征图中每个像素点的位置信息,以及所述每个特征图的尺度;
根据先验框尺度与特征图尺度之间预设的关系,计算所述先验框与所述特征图尺度之间的比值;
根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度;
根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。
可选地,所述优化单元,具体用于:
计算所述任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比;
根据所述第一交并比确定出所述至少一个第一预测框,其中,所述第一预测框是指所述第一交并比大于第一预设阈值所对应的先验框。
可选地,所述优化单元,具体用于:
计算所述每个先验框对应的类别置信度误差,确定出所述类别置信度误差最大的第一先验框,判断所述至少一个第一预测框中是否包括所述第一先验框;
若包括,则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本,将剩余所述先验框设置为负样本;
确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差,并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数;
根据预设的优化算法对所述损失函数进行优化,得到所述优化后的SSD网络模型。
可选地,所述第二确定单元,具体用于:
将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中,确定所述图像测试数据集中所述每个待检测目标的类别置信度,根据所述类别置信度确定所述每个待检测目标的类别;
根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框,得到至少一个第二先验框,确定所述至少一个第二先验框的置信度;
将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉,并根据所述置信度将所述过滤后的至少一个第二先验框进行排序,得到一先验框序列,从所述先验框序列选择出预设个数的第三先验框;
根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。
可选地,所述第二确定单元,还用于:
确定所述每个待检测目标位置与其对应的所述至少一个第二预测框之间重合度;根据所述重合度判断所述每个待检测目标位置的检测是否正确;
若正确,则根据所述重合度计算每个类别的待检测目标的平均精度均值,以及确定检测速度评价指标。
第三方面,本申请提供一种计算机设备,该计算机设备,包括:
存储器,用于存储至少一个处理器所执行的指令;
处理器,用于执行存储器中存储的指令执行第一方面所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行第一方面所述的方法。
附图说明
图1为本申请实施例所提供的一种基于SSD遥感图像目标检测的方法的流程示意图;
图2a为本申请实施例所提供的一种海港SSD遥感图像目标检测后的效果图;
图2b为本申请实施例所提供的一种飞机场SSD遥感图像目标检测后的效果图;
图2c为本申请实施例所提供的一种运动场SSD遥感图像目标检测后的效果图;
图2d为本申请实施例所提供的一种运动场SSD遥感图像目标检测后的效果图;
图3为本申请实施例所提供的一种基于SSD遥感图像目标检测的装置的结构示意图;
图4为本申请实施例所提供的一种计算机设备的结构示意图。
具体实施方式
以下结合说明书附图对本申请实施例所提供的一种基于SSD遥感图像目标检测的方法做进一步详细的说明,该方法具体实现方式可以包括以下步骤(方法流程如图1所示):
步骤101,从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注。
在本申请实施例所提供的方案中,确定图像训练数据集和图像测试数据集的方式有多种,下面以一种较佳的方式为例进行说明。
在一种可能实现的方式中,从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,包括:根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集;在所述第一图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第一图像数据集;在所述第二图像数据集中设置至少一个检测目标,对所述每个检测目标进行位置标注以及类别标注,得到标注后的第二图像数据集;分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。
例如,收集的遥感图像为100张,其中,该100张遥感图像中包含汽车、飞机或者建筑平面等;预设的比例为8:2。计算机设备在收集100张遥感图像之后,根据8:2的比例将100张遥感图像划分为第一图像数据集以及第二图像数据集,其中,第一图像数据集包含80张遥感图像,第二图像数据集包含20张遥感图像。在第一图像数据集中设置至少一个待检测目标,例如,待检测目标包括汽车、飞机或者建筑平面等,然后通过人工或自动方式对待检测目标进行位置标注以及类型标注,其中,通过所述待检测目标进行位置标注;在第二图像数据集中设置至少一个检测目标,例如,检测目标包括汽车、飞机或者建筑平面等,然后对检测目标进行位置标注以及类型标注,其中,通过所述待检测目标进行位置标注。最后将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集,其中,预处理操作包括裁剪、翻转或颜色扭曲。
步骤102,构建SSD网络模型,将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,其中,所述先验框为矩形框。
在本申请实施例所提供的方案中,构建目标检测算法SSD(Single ShotDetector)模型的方式有多种,下面以一种较佳的方式为例进行说明。
在一种可能实现的方式中,构建SSD网络模型,包括:
将预设的VGG16模型中的全连接层fc6转换成3×3的卷积层,以及将全连接层fc7转换成1×1的卷积层;
在所述VGG16模型中卷积层conv1到卷积层conv5之间,每个卷积层之后添加一个池化层;
在所述VGG16模型中卷积层conv7之后添加四个依次相连的卷积层,得到所述SSD网络模型。
为了便于理解下面以举例的形式对本申请实施例所构建的SSD网络模型的结构以及参数进行简要介绍。
例如,若SSD网络模型包括28层卷积层,各卷积层的参数设置如下:第1层卷积层conv1-1,卷积核的大小为3×3,卷积核的个数为64,步长为1,激活函数为relu函数;第2层卷积层conv1-2,卷积核的大小为3×3,卷积核的个数为64,步长为1,激活函数为relu函数;第3层最大池化层pool1,池化核的大小为2×2,步长为2;第4层卷积层conv2-1,卷积核的大小为3×3,卷积核的个数为128,步长为1,激活函数为relu函数;第5层卷积层conv2-2,卷积核的大小为3×3,卷积核的个数为128,步长为1,激活函数为relu函数;第6层最大池化层pool2,池化核的大小为2×2,步长为2;第7层卷积层conv3-1,卷积核的大小为3×3,卷积核的个数为256,步长为1,激活函数为relu函数;第8层卷积层conv3-2,卷积核的大小为3×3,卷积核的个数为256,步长为1,激活函数为relu函数;第9层卷积层conv3-3,卷积核的大小为3×3,卷积核的个数为256,步长为1,激活函数为relu函数;第10层最大池化层pool3,池化核的大小为2×2,步长为2;第11层卷积层conv4-1,卷积核的大小为3×3,卷积核的个数为512,步长为1,激活函数为relu函数;第12层卷积层conv4-2,卷积核的大小为3×3,卷积核的个数为512,步长为1,激活函数为relu函数;第13层卷积层conv4-3,卷积核的大小为3×3,卷积核的个数为512,步长为1,激活函数为relu函数;第14层最大池化层pool4,池化核的大小为2×2,步长为2;第15层卷积层conv5-1,卷积核的大小为3×3,卷积核的个数为512,步长为1,激活函数为relu函数;第16层卷积层conv5-2,卷积核的大小为3×3,卷积核的个数为512,步长为1,激活函数为relu函数;第17层卷积层conv5-3,卷积核的大小为3×3,卷积核的个数为512,步长为1,激活函数为relu函数;第18层最大池化层pool5,池化核的大小为3×3,步长为1;第19层卷积层conv6,卷积核的大小为3×3,卷积核的个数为1024,步长为1,激活函数为relu函数;第20层卷积层conv7,卷积核的大小为1×1,卷积核的个数为1024,步长为1,激活函数为relu函数;第21层卷积层conv8-1,卷积核的大小为1×1,卷积核的个数为256,步长为1,激活函数为relu函数;第22层卷积层conv8-2,卷积核的大小为3×3,卷积核的个数为512,步长为2,填充padding为1,激活函数为relu函数;第23层卷积层conv9-1,卷积核的大小为1×1,卷积核的个数为128,步长为1,激活函数为relu函数;第24层卷积层conv9-2,卷积核的大小为3×3,卷积核的个数为256,步长为2,填充padding为1,激活函数为relu函数;第25层卷积层conv10-1,卷积核的大小为1×1,卷积核的个数为128,步长为1,激活函数为relu函数;第26层卷积层conv10-2,卷积核的大小为3×3,卷积核的个数为256,步长为1,激活函数为relu函数;第27层卷积层conv11-1,卷积核的大小为1×1,卷积核的个数为128,步长为1,激活函数为relu函数;第28层卷积层conv11-2,卷积核的大小为3×3,卷积核的个数为256,步长为1,激活函数为relu函数。
进一步,计算机设备构建SSD网络模型之后,将图像训练数据集中每个图像依次输入到该SSD网络模型中,由于该SSD网络模型具有多个不同深度的卷积层,通过不同深度的卷积层对图像训练数据集中的图像进行特征提取得到多个不同分辨率的特征图,然后在每个所述特征图的每个像素点处设置一组尺度不同的先验框。在本申请实施例所提供的方案中,在每个像素点处设置一组尺度不同的先验框的方式有多种,下面以一种较佳的方式为例进行说明。
在一种可能实现的方式中,在每个所述特征图的每个像素点处设置一组尺度不同的先验框,包括:确定所述每个特征图中每个像素点的位置信息,以及所述每个特征图的尺度;根据先验框尺度与特征图尺度之间预设的关系,计算所述先验框与所述特征图尺度之间的比值;根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度;根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。
为了便于理解下面基于上述SSD网络模型以举例的形式对每个像素点处设置一组尺度不同的先验框的过程进行说明。
例如,选取SSD网络模型中conv4-3、conv7、conv8-2、conv9-2、conv10-2、conv11-2六个卷积层生成的特征图,其中,特征图的大小分别为(38,38)、(19,19)、(10,10)、(5,5)、(3,3)以及(1,1),若每个特征图的每个像素点位置设置5个不同的先验框,预设的5个先验框的长度和宽度的比ar分别为1、2、3、1/2、1/3。
进一步,对于先验框的尺度遵循一个线性递增规则:随特征图尺度减小,先验框尺度线性增加,具体先验框尺度与特征图尺度之间满足如下关系:
其中,Sk表示先验框的尺度与特征图尺度之间的比值;m表示选中的SSD网络模型中六个层,m=6;表示层数,k∈[1,m];Smin表示选中的六层中第一层的尺度比值,Smin=0.2;Smax表示选中的六层中第六层的尺度比值,Smax=0.9。
然后,根据ar以及Sk计算每个先验框的长和宽,具体公式如下:
其中,wk表示先验框的长度;hk表示先验框的宽度。
步骤103,将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,其中,所述第一预测框是指与任一所述待检测目标位置匹配的先验框。
在一种可能实现方式中,将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,包括:
计算所述任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比;
根据所述第一交并比确定出所述至少一个第一预测框,其中,所述第一预测框是指所述第一交并比大于第一预设阈值所对应的先验框。
具体的,在本申请实施例所提供的方案中,通过如下公式计算任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比:
其中,IoU表示第一交并比;A表示先验框的尺度;B表示待检测目标的尺度。
进一步,在计算机设备的数据库中预先存储着交并比的阈值,计算机设备在确定任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比之后,提取第一交并比不小于预设阈值的至少一个先验框,并将该至少一个先验框作为第一预测框。
进一步,计算机设备在确定出至少一个第一预测框之后,根据第一预测框对SSD网络模型进行优化。具体的,在本申请实施例所提供的方案中,对SSD网络模型进行优化的方式有多种,下面以一种较佳的方式为例进行说明。
在一种可能实现的方式中,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,包括:计算所述每个先验框对应的类别置信度误差,确定出所述类别置信度误差最大的第一先验框,判断所述至少一个第一预测框中是否包括所述第一先验框;若包括,则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本,将剩余所述先验框设置为负样本;确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差,并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数;根据预设的优化算法对所述损失函数进行优化,得到所述优化后的SSD网络模型。
在本申请实施例所提供的方案中,计算机设备每个特征图的每个像素点设置一组先验框之后,确定每个先验框中的物体属于任一类别的概率,根据所述概率确定每个先验框中物体的类别,根据所述类别与预设的类别计算每个先验框对应的类别置信度误差,然后根据类别置信度误差对先验框进行降序排列,确定出置信度误差最大的第一先验框,再判断至少一个第一预测框是否包含第一先验框,若包括,则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本,将剩余所述先验框设置为负样本,确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差,再根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数。具体的,可以通过如下公式计算损失函数:
其中,L表示所述损失函数;N表示正样本的数量;Lconf表示类别置信度误差;α表示权重系数;Lloc表示位置回归误差。
进一步,计算机设备在计算出SSD网络模型的损失函数之后,根据预设的优化算法对所述损失函数进行迭代优化,得到所述优化后的SSD网络模型,例如,预设的优化算法包括随机梯度下降的方法。
步骤104,将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。
在本申请实施例所提供的方案中,图像测试数据集包含至少一个遥感图像,计算机设备将SSD网络模型优化得到优化后的SSD网络模型之后,需要确定图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。具体的,确定每个待检测目标对应的至少一个第二预测框的方式有多种,下面以一种较佳的方式为例进行说明。
在一种可能实现的方式中,将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框,包括:将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中,确定所述图像测试数据集中所述每个待检测目标的类别置信度,根据所述类别置信度确定所述每个待检测目标的类别;根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框,得到至少一个第二先验框,确定所述至少一个第二先验框的置信度;将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉,并根据所述置信度将所述过滤后的至少一个第二先验框进行排序,得到一先验框序列,从所述先验框序列选择出预设个数的第三先验框;根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。具体的,参见图2a表示一种海港SSD遥感图像目标检测后的效果图,在图2a中目标检测物体为港口;图2b表示一种飞机场SSD遥感图像目标检测后的效果图,在图2b中目标检测物体为飞机;图2c表示一种运动场SSD遥感图像目标检测后的效果图,在图2c中目标检测物体为棒球球场;图2d表示一种运动场SSD遥感图像目标检测后的效果图,在图2d中目标检测物体为网球场。
具体的,在本申请实施例所提供的方案中,从第三先验框中筛选出至少一个第二预测框的算法有多种,包括但不限制于非极大值抑制算法(Non-maximum suppression,NMS)。
进一步,为了提高目标检测结果的准确性。在本申请实施例所提供的方案中,在步骤104之后,还包括:确定所述每个待检测目标的位置与其对应的所述至少一个第二预测框之间重合度;根据所述重合度判断所述每个待检测目标的检测是否正确;若正确,则根据所述重合度计算每个类别的检测目标的平均精度均值,以及确定检测速度评价指标。
本申请实施例所提供的方案中,通过将图像训练数据集输入到SSD网络模型中得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,即采用不同尺寸的先验框均匀地在特征图的不同像素点位置进行密集抽样,然后将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,再根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型。因此,在本申请实施例所提供的方案中,通过SSD网络模型中得到多个不同分辨率的特征图,根据所述多个不同分辨率的特征图进行目标检测,以及通过采用不同尺度与长宽比的先验框均匀地在特征图的不同像素点位置进行密集抽样,不仅能够适应对不同尺寸的物体检测需求,提高了识别的准确率,而且利用网络模型提取特征后直接进行分类与回归,整个过程只需要一步,从而提高了目标检测的效率。
基于与上述图1所述的方法相同的发明构思,本申请实施例提供了一种基于SSD遥感图像目标检测的装置,参见图2,该装置包括:
第一确定单元201,用于从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注;
建模单元202,用于构建SSD网络模型,将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,其中,所述先验框为矩形框;
优化单元203,用于将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,其中,所述第一预测框是指与任一所述待检测目标位置匹配的先验框;
第二确定单元204,用于将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。
可选地,所述第一确定单元201,用于:
根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集;
在所述第一图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第一图像数据集;
在所述第二图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第二图像数据集;
分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。
可选的,所述建模单元202,具体用于:
将预设的VGG16模型中的全连接层fc6转换成3×3的卷积层,以及将全连接层fc7转换成1×1的卷积层;
在所述VGG16模型中卷积层conv1到卷积层conv5之间,每个卷积层之后添加一个池化层;
在所述VGG16模型中卷积层conv7之后添加四个依次相连的卷积层,得到所述SSD网络模型。
可选地,所述优化单元203,具体用于:
确定所述每个特征图中每个像素点的位置信息,以及所述每个特征图的尺度;
根据先验框尺度与特征图尺度之间预设的关系,计算所述先验框与所述特征图尺度之间的比值;
根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度;
根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。
可选地,所述优化单元203,具体用于:
计算所述任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比;
根据所述第一交并比确定出所述至少一个第一预测框,其中,所述第一预测框是指所述第一交并比大于第一预设阈值所对应的先验框。
可选地,所述优化单元203,具体用于:
计算所述每个先验框对应的类别置信度误差,确定出所述类别置信度误差最大的第一先验框,判断所述至少一个第一预测框中是否包括所述第一先验框;
若包括,则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本,将剩余所述先验框设置为负样本;
确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差,并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数;
根据预设的优化算法对所述损失函数进行优化,得到所述优化后的SSD网络模型。
可选地,所述第二确定单元204,具体用于:
将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中,确定所述图像测试数据集中所述每个待检测目标的类别置信度,根据所述类别置信度确定所述每个待检测目标的类别;
根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框,得到至少一个第二先验框,确定所述至少一个第二先验框的置信度;
将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉,并根据所述置信度将所述过滤后的至少一个第二先验框进行排序,得到一先验框序列,从所述先验框序列选择出预设个数的第三先验框;
根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。
可选地,所述第二确定单元204,还用于:
确定所述每个待检测目标位置与其对应的所述至少一个第二预测框之间重合度;根据所述重合度判断所述每个待检测目标位置的检测是否正确;
若正确,则根据所述重合度计算每个类别的待检测目标的平均精度均值,以及确定检测速度评价指标。
参见图3,本申请提供一种计算机设备,该计算机设备,包括:
存储器301,用于存储至少一个处理器所执行的指令;
处理器302,用于执行存储器中存储的指令执行图1所述的方法。
本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行图1所述的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种基于SSD遥感图像目标检测的方法,其特征在于,包括:
从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注;
构建SSD网络模型,将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,其中,所述先验框为矩形框;
将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,其中,所述第一预测框是指与任一所述待检测目标位置匹配的先验框;
将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。
2.如权利要求1所述的方法,其特征在于,从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,包括:
根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集;
在所述第一图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第一图像数据集;
在所述第二图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第二图像数据集;
分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。
3.如权利要求2所述的方法,其特征在于,构建SSD网络模型,包括:
将预设的VGG16模型中的全连接层fc6转换成3×3的卷积层,以及将全连接层fc7转换成1×1的卷积层;
在所述VGG16模型中卷积层conv1到卷积层conv5之间,每个卷积层之后添加一个池化层;
在所述VGG16模型中卷积层conv7之后添加四个依次相连的卷积层,得到所述SSD网络模型。
4.如权利要求3所述的方法,其特征在于,在每个所述特征图的每个像素点处设置一组尺度不同的先验框,包括:
确定所述每个特征图中每个像素点的位置信息,以及所述每个特征图的尺度;
根据先验框尺度与特征图尺度之间预设的关系,计算所述先验框与所述特征图尺度之间的比值;
根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度;
根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。
5.如权利要求4所述的方法,其特征在于,将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,包括:
计算所述任一待检测目标位置的尺度与所述每个先验框尺度之间的第一交并比;
根据所述第一交并比确定出所述至少一个第一预测框,其中,所述第一预测框是指所述第一交并比大于第一预设阈值所对应的先验框。
6.如权利要求5所述的方法,其特征在于,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,包括:
计算所述每个先验框对应的类别置信度误差,确定出所述类别置信度误差最大的第一先验框,判断所述至少一个第一预测框中是否包括所述第一先验框;
若包括,则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本,将剩余所述先验框设置为负样本;
确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差,并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数;
根据预设的优化算法对所述损失函数进行优化,得到所述优化后的SSD网络模型。
7.如权利要求1~6任一项所述的方法,其特征在于,将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框,包括:
将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中,确定所述图像测试数据集中所述每个待检测目标的类别置信度,根据所述类别置信度确定所述每个待检测目标的类别;
根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框,得到至少一个第二先验框,确定所述至少一个第二先验框的置信度;
将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉,并根据所述置信度将所述过滤后的至少一个第二先验框进行排序,得到一先验框序列,从所述先验框序列选择出预设个数的第三先验框;
根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。
8.如权利要求1~6任一项所述的方法,其特征在于,所述方法,还包括:
确定所述每个待检测目标位置与其对应的所述至少一个第二预测框之间重合度;
根据所述重合度判断所述每个待检测目标位置的检测是否正确;
若正确,则根据所述重合度计算每个类别的待检测目标的平均精度均值,以及确定检测速度评价指标。
9.一种基于SSD遥感图像目标检测的装置,其特征在于,包括:
第一确定单元,用于从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集,并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注;
建模单元,用于构建SSD网络模型,将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图,并在每个所述特征图的每个像素点处设置一组尺度不同的先验框,其中,所述先验框为矩形框;
优化单元,用于将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框,根据所述至少一个第一预测框对所述SSD网络模型进行优化,得到优化后的SSD网络模型,其中,所述第一预测框是指与任一所述待检测目标位置匹配的先验框;
第二确定单元,用于将所述图像测试数据集输入到所述优化后的SSD网络模型中,确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。
10.如权利要求9所述的装置,其特征在于,所述第一确定单元,用于:
根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集;
在所述第一图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第一图像数据集;
在所述第二图像数据集中设置至少一个待检测目标,对所述每个待检测目标进行位置标注以及类别标注,得到标注后的第二图像数据集;
分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010568175.8A CN111798417A (zh) | 2020-06-19 | 2020-06-19 | 一种基于ssd遥感图像目标检测的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010568175.8A CN111798417A (zh) | 2020-06-19 | 2020-06-19 | 一种基于ssd遥感图像目标检测的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111798417A true CN111798417A (zh) | 2020-10-20 |
Family
ID=72803638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010568175.8A Pending CN111798417A (zh) | 2020-06-19 | 2020-06-19 | 一种基于ssd遥感图像目标检测的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111798417A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112184708A (zh) * | 2020-11-04 | 2021-01-05 | 成都朴华科技有限公司 | 精子存活率检测方法及装置 |
CN112884055A (zh) * | 2021-03-03 | 2021-06-01 | 歌尔股份有限公司 | 一种目标标注方法和一种目标标注装置 |
CN112966558A (zh) * | 2021-02-03 | 2021-06-15 | 华设设计集团股份有限公司 | 基于优化ssd目标检测模型的港口自动识别方法及系统 |
CN113298130A (zh) * | 2021-05-14 | 2021-08-24 | 嘉洋智慧安全生产科技发展(北京)有限公司 | 目标图像的检测、目标对象检测模型的生成方法 |
CN113313273A (zh) * | 2021-07-28 | 2021-08-27 | 佛山市东信科技有限公司 | 基于大数据环境下的公共设施检测方法、系统和存储介质 |
CN114049628A (zh) * | 2021-11-24 | 2022-02-15 | 镇江大全现代农业发展有限公司 | 一种基于改进ssd深度学习模型的苹果边界框识别方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886359A (zh) * | 2019-03-25 | 2019-06-14 | 西安电子科技大学 | 基于卷积神经网络的小目标检测方法及检测模型 |
CN110263819A (zh) * | 2019-05-28 | 2019-09-20 | 中国农业大学 | 一种用于贝类图像的目标检测方法及装置 |
CN110414574A (zh) * | 2019-07-10 | 2019-11-05 | 厦门美图之家科技有限公司 | 一种目标检测方法、计算设备及存储介质 |
CN111091095A (zh) * | 2019-12-19 | 2020-05-01 | 华中科技大学 | 一种遥感图像中船只目标的检测方法 |
-
2020
- 2020-06-19 CN CN202010568175.8A patent/CN111798417A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886359A (zh) * | 2019-03-25 | 2019-06-14 | 西安电子科技大学 | 基于卷积神经网络的小目标检测方法及检测模型 |
CN110263819A (zh) * | 2019-05-28 | 2019-09-20 | 中国农业大学 | 一种用于贝类图像的目标检测方法及装置 |
CN110414574A (zh) * | 2019-07-10 | 2019-11-05 | 厦门美图之家科技有限公司 | 一种目标检测方法、计算设备及存储介质 |
CN111091095A (zh) * | 2019-12-19 | 2020-05-01 | 华中科技大学 | 一种遥感图像中船只目标的检测方法 |
Non-Patent Citations (1)
Title |
---|
秦东辉: ""基于FPGA的SSD算法加速设计与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 03, 15 March 2020 (2020-03-15), pages 77 - 78 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112184708A (zh) * | 2020-11-04 | 2021-01-05 | 成都朴华科技有限公司 | 精子存活率检测方法及装置 |
CN112184708B (zh) * | 2020-11-04 | 2024-05-31 | 成都朴华科技有限公司 | 精子存活率检测方法及装置 |
CN112966558A (zh) * | 2021-02-03 | 2021-06-15 | 华设设计集团股份有限公司 | 基于优化ssd目标检测模型的港口自动识别方法及系统 |
CN112884055A (zh) * | 2021-03-03 | 2021-06-01 | 歌尔股份有限公司 | 一种目标标注方法和一种目标标注装置 |
CN113298130A (zh) * | 2021-05-14 | 2021-08-24 | 嘉洋智慧安全生产科技发展(北京)有限公司 | 目标图像的检测、目标对象检测模型的生成方法 |
CN113313273A (zh) * | 2021-07-28 | 2021-08-27 | 佛山市东信科技有限公司 | 基于大数据环境下的公共设施检测方法、系统和存储介质 |
CN113313273B (zh) * | 2021-07-28 | 2021-10-29 | 佛山市东信科技有限公司 | 基于大数据环境下的公共设施检测方法、系统和存储介质 |
CN114049628A (zh) * | 2021-11-24 | 2022-02-15 | 镇江大全现代农业发展有限公司 | 一种基于改进ssd深度学习模型的苹果边界框识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111798417A (zh) | 一种基于ssd遥感图像目标检测的方法及装置 | |
CN110084292B (zh) | 基于DenseNet和多尺度特征融合的目标检测方法 | |
CN109685776B (zh) | 一种基于ct图像的肺结节检测方法及系统 | |
CN109784203B (zh) | 基于分层传播和激活的弱监督x光图像违禁品检查方法 | |
CN108846835B (zh) | 基于深度可分离卷积网络的图像变化检测方法 | |
CN110287942B (zh) | 年龄估计模型的训练方法、年龄估计方法以及对应的装置 | |
CN106408030B (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
CN108038846A (zh) | 基于多层卷积神经网络的输电线路设备图像缺陷检测方法及系统 | |
CN111402227B (zh) | 一种桥梁裂缝检测方法 | |
CN110599537A (zh) | 基于Mask R-CNN的无人机图像建筑物面积计算方法及系统 | |
CN111507370A (zh) | 获得自动标注图像中检查标签的样本图像的方法和装置 | |
CN113989662A (zh) | 一种基于自监督机制的遥感图像细粒度目标识别方法 | |
CN104182985A (zh) | 遥感图像变化检测方法 | |
CN103745233B (zh) | 基于空间信息迁移的高光谱图像分类方法 | |
CN111353580B (zh) | 目标检测网络的训练方法、电子设备及存储介质 | |
CN111753682A (zh) | 一种基于目标检测算法的吊装区域动态监控方法 | |
CN111985325A (zh) | 特高压环境评价中的航拍小目标快速识别方法 | |
CN110008899B (zh) | 一种可见光遥感图像候选目标提取与分类方法 | |
CN116206185A (zh) | 一种基于改进YOLOv7的轻量级小目标检测方法 | |
CN112163530B (zh) | 基于特征增强和样本选择的ssd小目标检测方法 | |
CN105469099B (zh) | 基于稀疏表示分类的路面裂缝检测和识别方法 | |
CN114140663A (zh) | 一种基于多尺度注意力学习网络的害虫识别方法及系统 | |
CN114140395A (zh) | 肺部纤维化智能判定方法 | |
CN113496260A (zh) | 基于改进YOLOv3算法的粮库人员不规范作业检测法 | |
CN112614121A (zh) | 一种多尺度小目标设备缺陷识别监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |