CN114092813A - 一种工业园区图像提取方法、模型、电子设备和存储介质 - Google Patents
一种工业园区图像提取方法、模型、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114092813A CN114092813A CN202111416650.0A CN202111416650A CN114092813A CN 114092813 A CN114092813 A CN 114092813A CN 202111416650 A CN202111416650 A CN 202111416650A CN 114092813 A CN114092813 A CN 114092813A
- Authority
- CN
- China
- Prior art keywords
- image
- industrial park
- characteristic
- scale
- satellite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 55
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000010586 diagram Methods 0.000 claims description 24
- 238000011176 pooling Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000002708 enhancing effect Effects 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000003344 environmental pollutant Substances 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009435 building construction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本公开提供了一种工业园区图像提取方法、模型、电子设备和存储介质,其中,工业园区图像提取方法包括:获取卫星影像的特征图像和多尺度学习特征,卫星影像中包含工业园区图像,将特征图像与多尺度学习特征相加,得到多尺度工业园区图像特征,基于多尺度工业园区图像特征,从卫星影像中提取工业园区图像。该方法将通过卫星影像获得的特征图像和多尺度学习特征相加,能够保留更多的卫星影像中工业园区图像的相关信息,使从卫星影像中提取的工业园区图像更准确和更完整,能够有效地提高从卫星影像中提取工业园区图像的精确度。
Description
技术领域
本公开涉及图像处理、模式识别领域,具体涉及一种工业园区图像提取方法、模型、电子设备和存储介质。
背景技术
工业园区,作为一个重要的土地利用类型,是衡量城市建设发展的重要指标。由于工业生产过程中会产生大量污染物和气体,对其开展实时监测有助于对污染物追溯和控制。同时,为了躲避政府部门的监管,存在一些违规厂房的建设。因此,很有必要开发高效的监测技术手段,定期开展市级范围内工业园区监测,分析厂房建设的动态变化,为城建和环保等相关部门提供夯实的数据支撑。随着遥感技术的不断改进,越来越多重访周期短的高空间分辨率遥感影像可以为大范围工业园区监测提供数据基础。目前,针对大范围工业园区监测的相关技术研究较少,大多将工业园区作为土地利用类型中的一种,归类为建筑物进行提取。建筑物监测主要面临的挑战是其多样的形状、颜色、材质和尺寸,以及受阴影和植被遮挡等影响。而工业园区多被包含在建筑物地类中,专门针对工业园区的提取方法研究较少。由于遥感影像成像质量的好坏受成像条件影响较大,而且同一建筑物的不同像素反射率不尽一致,因此提取出的建筑物存在部分残缺等问题,而且建筑物边缘对复杂背景地物信息多比较敏感,很难真实反映建筑物范围。
公开内容
(一)要解决的技术问题
针对现有技术的上述不足,本公开的主要目的在于提供一种工业园区图像提取方法、模型、电子设备和存储介质,以期至少部分地解决上述技术问题中的至少之一。
(二)技术方案
为了实现上述目的,本公开提出了一种工业园区图像提取方法,该方法包括:
获取卫星影像的特征图像和多尺度学习特征,上述卫星影像中包含工业园区图像;
将上述特征图像与上述多尺度学习特征相加,得到多尺度工业园区图像特征;
基于上述多尺度工业园区图像特征,从上述卫星影像中提取上述工业园区图像。
可选地,在上述获取卫星影像的特征图像和多尺度学习特征之前,上述方法还包括:
对上述卫星影像进行预处理,得到输入特征图;
上述获取卫星影像的特征图像和多尺度学习特征包括:
对上述输入特征图进行1×1卷积操作,得到特征图像x1,x2,x3;
对上述特征图像x1,x2,x3均进行3×3卷积操作,得到多尺度学习特征y1,y2,y3。
可选地,上述基于上述多尺度工业园区图像特征,从上述卫星影像中提取上述工业园区图像,具体包括:
对上述多尺度工业园区图像特征进行1×1卷积操作;
对进行1×1卷积操作后的上述多尺度工业园区图像特征中的特征信息进行增强,得到增强特征图;
将上述增强特征图和上述输入特征图进行拼接,得到输出特征图;
将上述输出特征图拼接,得到只包括上述工业园区图像的图像。
可选地,上述对上述多尺度工业园区图像特征中的特征信息进行增强,得到输出特征图,具体包括:
对进行1×1卷积操作后的上述多尺度工业园区图像特征分别进行空间最大池化操作和空间平均池化操作,对上述空间最大池化操作和上述空间平均池化操作的结果均进行卷积操作,将卷积操作的结果相加,得到第一增强特征图;
对上述第一增强特征图分别进行通道最大池化操作和通道平均池化操作,将上述通道最大池化操作和上述通道平均池化操作的结果进行拼接操作,对拼接操作的结果进行卷积操作,得到增强特征图。
另一方面,本公开还提供了一种工业园区图像提取模型,包括:
注意力卷积模块,用于获取卫星影像的特征图像和多尺度学习特征,上述卫星影像中包含工业园区图像,以及用于将上述特征图像与上述多尺度学习特征相加,得到多尺度工业园区图像特征,还用于基于上述多尺度工业园区图像特征,从上述卫星影像中提取上述工业园区图像。
可选地,上述工业园区图像提取模型还包括:
预处理模块,用于对卫星影像进行预处理,得到输入特征图;
上述提取模块包括:
卷积模块,用于对上述多尺度工业园区图像特征进行1×1卷积操作;
增强模块,用于对进行1×1卷积操作后的上述多尺度工业园区图像特征中的特征信息进行增强,得到增强特征图;
拼接模块,用于将上述增强特征图和上述输入特征图进行拼接,得到输出特征图,以及用于将上述输出特征图拼接,得到只包括上述工业园区图像的图像。
可选地,上述工业园区图像提取模型的损失函数采用交叉熵损失函数,上述损失函数为:
loss(x,y)=-(ylogx+(1-y)log(1-x))
其中,x表示上述工业园区图像提取模型的预测值,y表示上述工业园区图像提取模型的真实值。
可选地,基于UNet语义分割网络模型构建上述工业园区图像提取模型,其中,基于上述UNet语义分割网络提出上述注意力卷积模块,采用3×3卷积模块,改为粒度学习,采用残差式布局。
另一方面,本公开还提供了一种电子设备,上述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行根据执行如上述的工业园区图像提取方法。
另一方面,本公开还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上述的工业园区图像提取方法。
(三)有益效果
本公开提供的一种工业园区图像提取方法包括:获取卫星影像的特征图像和多尺度学习特征,卫星影像中包含工业园区图像,将特征图像与多尺度学习特征相加,得到多尺度工业园区图像特征,基于多尺度工业园区图像特征,从卫星影像中提取工业园区图像。该方法将通过卫星影像获得的特征图像和多尺度学习特征相加,能够保留更多的卫星影像中工业园区图像的相关信息,使从卫星影像中提取的工业园区图像更准确和更完整,能够有效地提高从卫星影像中提取工业园区图像的精确度。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1示意性示出了根据本公开实施例的工业园区图像提取方法的流程图;
图2示意性示出了本公开一实施例提供的工业园区图像提取模型的框图;
图3示意性示出了本公开一实施例提供的工业园区图像提取模型中提取模块的框图;
图4A为本公开一实施例提供的包括工业园区图像原始卫星影像;
图4B为利用本公开提供的工业园区图像提取模型对图4A中的原始卫星影像进行提取的结果二值图;
图4C为图4A中的原始卫星影像中的工业园区图像的真实分布二值图;
图5A为本公开一实施例提供的包括工业园区图像原始卫星影像;
图5B为利用本公开提供的工业园区图像提取模型对图5A中的原始卫星影像进行提取的结果二值图;
图5C为图5A中的原始卫星影像中的工业园区图像的真是分布二值图;
图6示意性示出了本公开一实施例提供的Granular-AttenionUnet网络结构图;
图7示意性示出了本公开一实施例提供的注意力卷积模块示意图;以及
图8示意性示出了根据本公开实施例的适于实现工业园区图像提取方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
图1示意性示出了根据本公开实施例的一种工业园区图像提取方法的流程图。
如图1所示,在本公开一实施例中,上述工业园区图像提取方法包括操作S110~操作S130。
在操作S110,获取卫星影像的特征图像和多尺度学习特征,上述卫星影像中包含工业园区图像。
随着遥感技术的不断改进,越来越多重访周期短的高空间分辨率遥感影像可以为工业园区图像的监测提供数据基础,监测时,首先获取需要监测的区域的卫星影像,获取到卫星影像之后需要对卫星影像进行预处理,得到输入特征图,通过输入特征图才可以得到卫星影像的特征图像和多尺度学习特征,预处理的方法例如将每景影像裁剪成512x512像素大小的斑块,每个斑块即为一个输入特征图,针对每一个输入特征图,对上述输入特征图进行1×1卷积操作,得到特征图像x1,x2,x3,再对特征图像x1,x2,x3均进行3×3卷积操作,得到多尺度学习特征y1,y2,y3。
在操作S120,将上述特征图像与上述多尺度学习特征相加,得到多尺度工业园区图像特征。
在操作S130,基于上述多尺度工业园区图像特征,从上述卫星影像中提取上述工业园区图像。
将特征图像与多尺度学习特征相加得到多尺度工业园区图像特征,基于多尺度工业园区图像特征,便可从卫星影像中提取出工业园区图像,例如对多尺度工业园区图像特征进行1×1卷积操作,为了使最终提取结果更为准确,在对多尺度工业园区图像特征进行1×1卷积操作之后,还需要对进行1×1卷积操作后的多尺度工业园区图像特征进行处理,对多尺度工业园区图像特征中的特征信息进行增强,例如对进行1×1卷积操作后的多尺度工业园区图像特征分别进行空间最大池化操作和空间平均池化操作,然后对空间最大池化操作和空间平均池化操作的结果均进行卷积操作,将卷积操作的结果相加,得到第一增强特征图,再对第一增强特征图分别进行通道最大池化操作和通道平均池化操作,将通道最大池化操作和通道平均池化操作的结果进行拼接操作,最后对拼接操作的结果进行卷积操作,便可得到增强特征图,将增强特征图和上述512x512像素大小的输入特征图进行拼接得到输出特征图,再将输出特征图拼接,即可得到只包括工业园区图像的图像。
在本实施例中,从卫星影像中获取特征图像和多尺度学习特征,从卫星影像中获取特征图像和多尺度学习特征之后,对特征图像和多尺度学习特征进行处理,例如将特征图像和多尺度学习特征相加,再基于相加的结果提取工业园区图像,可以更好的保留工业园区图像的多维信息,提高最终提取结果的精确度。
应当理解,本实施例中的关于卫星影像的预处理、获取特征图像和多尺度学习特征的方法以及基于多尺度工业园区图像特征提取工业园区图像的方法的举例是示例性的,以帮助本领域技术人员理解本公开的技术方案,并非用以限制本公开的保护范围。
基于上述一种工业园区图像提取方法,本公开还提供了一种工业园区图像的提取模型。以下将结合图2和图3对该模型进行详细描述。
如图2所示,在本公开一实施例中,该模型200包括:注意力卷积模块210。
注意力卷积模块210,用于获取卫星影像的特征图像和多尺度学习特征,上述卫星影像中包含工业园区图像,以及用于将上述特征图像与上述多尺度学习特征相加,得到多尺度工业园区图像特征还用于基于上述多尺度工业园区图像特征,从上述卫星影像中提取上述工业园区图像。
在本公开一实施例中,上述模型200还包括:预处理模块。
预处理模块,用于对卫星影像进行预处理,得到输入特征图。
如图3所示,在本公开一实施例中,上述注意力卷积模块210包括:卷积模块310、增强模块320和拼接模块330。
卷积模块310,用于对上述多尺度工业园区图像特征进行1×1卷积操作;
增强模块320,用于对进行1×1卷积操作后的上述多尺度工业园区图像特征中的特征信息进行增强,得到增强特征图;
拼接模块330,用于将上述增强特征图和上述输入特征图进行拼接,得到输出特征图,以及用于将上述输出特征图拼接,得到只包括上述工业园区图像的图像。
在本公开一实施例中,上述工业园区图像提取模型的损失函数采用交叉熵损失函数,上述损失函数为:
loss(x,y)=-(ylogx+(1-y)log(1-x))
其中,x表示上述工业园区图像提取模型的预测值,y表示上述工业园区图像提取模型的真实值。
在本实施例中,工业园区图像提取模型构建完成后需要对模型进行训练,在本实施例中,在模型训练过程中,采用随机梯度下降法SGD(stochastic gradient descent)优化模型,学习率设置为0.01。模型训练完成后,还需要对模型进行检验,本实施例中选择将卫星影像预处理后的输入特征图分为测试集和训练集,例如,将所有输入特征图中含有工业园区图像的输入特征图随机选取70%做训练集,30%做测试集,在模型训练完成后,采用测试集对模型进行评估检验,得到工业园区图像的提取结果。为了更客观的评估模型的提取结果,可以结合工业园区图像的真实分布图(如图4C和图5C所示)和提取结果二值图(如图4B和图5B所示)根据公式(2)-(5)计算召回率recall和精度precision,以及两个综合评价参数交并比IOU(Intersection over union)和F1-measure值。
其中,TP代表被提取为工业园区图像的真实像素个数,TN代表被模型识别为背景地物的真实像素个数,FP代表被错分为工业园区图像的真实背景地物的像素个数,FN代表被错分为背景地物的真实工业园区图像的像素个数。
表1工业园区图像提取精度统计表(%)
IOU | Recall | Precision | F1-measure |
81.27 | 89.43 | 89.91 | 89.67 |
从表1可以看出,本公开提供的工业园区图像提取方法可以获得比较高的精度和召回率,表明大部分工业园区图像都被正确的提取出来。此外,综合指标IOU和F1-measure值也均在80%以上,验证了本公开提供的工业园区图像提取方法的可靠性。
在本公开一实施例中,基于UNet语义分割网络模型构建上述工业园区图像提取模型,其中,基于上述UNet语义分割网络提出上述注意力卷积模块210,采用3×3卷积模块,改为粒度学习,采用残差式布局。
在本实施例中,基于现有的UNet语义分割网络模型提出了Granular-AttenionUnet网络结构,如图6所示,基于Granular-AttenionUnet网络结构构建了注意力卷积模块210,如图7所示,其中,将传统的3x3卷积模块采用残差式布局,改为更细粒度学习。
需要说明的是,模型部分实施例中各模块/单元/子单元等的实施方式、解决的技术问题、实现的功能、以及达到的技术效果分别与方法部分实施例中各对应的步骤的实施方式、解决的技术问题、实现的功能、以及达到的技术效果相同或类似,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图8示意性示出了根据本公开实施例的适于实现一种工业园区图像提取方法的电子设备的方框图。
如图8所示,根据本公开实施例的电子设备800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、ROM802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序包含如上文所述的一种工业园区图像提取方法。该计算机可读存储介质可以是上述实施例中描述的装置/设备中所包含的;也可以是单独存在,而未装配入该装置/设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。
Claims (10)
1.一种工业园区图像提取方法,其特征在于,包括:
获取卫星影像的特征图像和多尺度学习特征,所述卫星影像中包含工业园区图像;
将所述特征图像与所述多尺度学习特征相加,得到多尺度工业园区图像特征;
基于所述多尺度工业园区图像特征,从所述卫星影像中提取所述工业园区图像。
2.根据权利要求1所述的工业园区图像提取方法,其特征在于,在所述获取卫星影像的特征图像和多尺度学习特征之前,所述方法还包括:
对卫星影像进行预处理,得到输入特征图;
所述获取卫星影像的特征图像和多尺度学习特征包括:
对所述输入特征图进行1×1卷积操作,得到特征图像x1,x2,x3;
对所述特征图像x1,x2,x3均进行3×3卷积操作,得到多尺度学习特征y1,y2,y3。
3.根据权利要求2所述的工业园区图像提取方法,其特征在于,所述基于所述多尺度工业园区图像特征,从所述卫星影像中提取所述工业园区图像,具体包括:
对所述多尺度工业园区图像特征进行1×1卷积操作;
对进行1×1卷积操作后的所述多尺度工业园区图像特征中的特征信息进行增强,得到增强特征图;
将所述增强特征图和所述输入特征图进行拼接,得到输出特征图;
将所述输出特征图拼接,得到只包括所述工业园区图像的图像。
4.根据权利要求3所述的工业园区图像提取方法,其特征在于,所述对进行1×1卷积操作后的所述多尺度工业园区图像特征中的特征信息进行增强,得到输出特征图,具体包括:
对进行1×1卷积操作后的所述多尺度工业园区图像特征分别进行空间最大池化操作和空间平均池化操作,对所述空间最大池化操作和所述空间平均池化操作的结果均进行卷积操作,将卷积操作的结果相加,得到第一增强特征图;
对所述第一增强特征图分别进行通道最大池化操作和通道平均池化操作,将所述通道最大池化操作和所述通道平均池化操作的结果进行拼接操作,对拼接操作的结果进行卷积操作,得到增强特征图。
5.一种工业园区图像提取模型,其特征在于,包括:
注意力卷积模块,用于获取卫星影像的特征图像和多尺度学习特征,所述卫星影像中包含工业园区图像,以及用于将所述特征图像与所述多尺度学习特征相加,得到多尺度工业园区图像特征,还用于基于所述多尺度工业园区图像特征,从所述卫星影像中提取所述工业园区图像。
6.根据权利要求5所述的工业园区图像提取模型,其特征在于,所述工业园区图像提取模型还包括:
预处理模块,用于对卫星影像进行预处理,得到输入特征图;
所述注意力卷积模块包括:
卷积模块,用于对所述多尺度工业园区图像特征进行1×1卷积操作;
增强模块,用于对进行1×1卷积操作后的所述多尺度工业园区图像特征中的特征信息进行增强,得到增强特征图;
拼接模块,用于将所述增强特征图和所述输入特征图进行拼接,得到输出特征图,以及用于将所述输出特征图拼接,得到只包括所述工业园区图像的图像。
7.根据权利要求5所述的工业园区图像提取模型,其特征在于,所述工业园区图像提取模型的损失函数采用交叉熵损失函数,所述损失函数为:
loss(x,y)=-(y logx+(1-y)log(1-x))
其中,x表示所述工业园区图像提取模型的预测值,y表示所述工业园区图像提取模型的真实值。
8.根据权利要求5所述的工业园区图像提取模型,其特征在于,基于UNet语义分割网络模型构建所述工业园区图像提取模型,其中,基于所述UNet语义分割网络提出所述注意力卷积模块,采用3×3卷积模块,改为粒度学习,采用残差式布局。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据执行如权利要求1~4中任一项所述的工业园区图像提取方法。
10.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1~4中任一项所述的工业园区图像提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111416650.0A CN114092813B (zh) | 2021-11-25 | 2021-11-25 | 一种工业园区图像提取方法、系统、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111416650.0A CN114092813B (zh) | 2021-11-25 | 2021-11-25 | 一种工业园区图像提取方法、系统、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114092813A true CN114092813A (zh) | 2022-02-25 |
CN114092813B CN114092813B (zh) | 2022-08-05 |
Family
ID=80304739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111416650.0A Active CN114092813B (zh) | 2021-11-25 | 2021-11-25 | 一种工业园区图像提取方法、系统、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114092813B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115144350A (zh) * | 2022-09-06 | 2022-10-04 | 中国科学院地理科学与资源研究所 | 基于高光谱相似像元比对的场地烃类污染判识方法及系统 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830870A (zh) * | 2018-05-21 | 2018-11-16 | 千寻位置网络有限公司 | 基于多尺度结构学习的卫星影像高精度农田边界提取方法 |
CN109446992A (zh) * | 2018-10-30 | 2019-03-08 | 苏州中科天启遥感科技有限公司 | 基于深度学习的遥感影像建筑物提取方法及系统、存储介质、电子设备 |
CN110197147A (zh) * | 2019-05-23 | 2019-09-03 | 星际空间(天津)科技发展有限公司 | 遥感影像的建筑物实例提取方法、装置、存储介质及设备 |
US10402686B1 (en) * | 2019-01-25 | 2019-09-03 | StradVision, Inc. | Learning method and learning device for object detector to be used for surveillance based on convolutional neural network capable of converting modes according to scales of objects, and testing method and testing device using the same |
CN110781923A (zh) * | 2019-09-27 | 2020-02-11 | 重庆特斯联智慧科技股份有限公司 | 特征提取方法及装置 |
CN110942013A (zh) * | 2019-11-22 | 2020-03-31 | 佛山科学技术学院 | 一种基于深度神经网络的卫星影像特征提取方法及系统 |
CN111080567A (zh) * | 2019-12-12 | 2020-04-28 | 长沙理工大学 | 基于多尺度动态卷积神经网络的遥感图像融合方法及系统 |
CN111458148A (zh) * | 2020-04-26 | 2020-07-28 | 上海电机学院 | 一种基于cbam的卷积神经网络滚动轴承故障诊断方法 |
CN111738110A (zh) * | 2020-06-10 | 2020-10-02 | 杭州电子科技大学 | 基于多尺度注意力机制的遥感图像车辆目标检测方法 |
CN111767800A (zh) * | 2020-06-02 | 2020-10-13 | 华南师范大学 | 遥感影像场景分类得分融合方法、系统、设备及存储介质 |
CN111783934A (zh) * | 2020-05-15 | 2020-10-16 | 北京迈格威科技有限公司 | 卷积神经网络构建方法、装置、设备及介质 |
CN111783774A (zh) * | 2020-06-22 | 2020-10-16 | 联想(北京)有限公司 | 图像处理方法、设备及存储介质 |
CN111915592A (zh) * | 2020-08-04 | 2020-11-10 | 西安电子科技大学 | 基于深度学习的遥感图像云检测方法 |
CN112085735A (zh) * | 2020-09-28 | 2020-12-15 | 西安交通大学 | 一种基于自适应锚框的铝材质图像缺陷检测方法 |
CN112215243A (zh) * | 2020-10-30 | 2021-01-12 | 百度(中国)有限公司 | 图像特征提取方法、装置、设备及存储介质 |
CN112329766A (zh) * | 2020-10-14 | 2021-02-05 | 北京三快在线科技有限公司 | 文字识别方法、装置、电子设备及存储介质 |
CN112396701A (zh) * | 2020-12-01 | 2021-02-23 | 腾讯科技(深圳)有限公司 | 卫星图像的处理方法、装置、电子设备和计算机存储介质 |
CN113063741A (zh) * | 2021-03-12 | 2021-07-02 | 中国科学院空天信息创新研究院 | 一种基于光谱特征的城市建筑材质提取方法及装置 |
CN113205051A (zh) * | 2021-05-10 | 2021-08-03 | 中国科学院空天信息创新研究院 | 基于高空间分辨率遥感影像的储油罐提取方法 |
WO2021159751A1 (zh) * | 2020-09-22 | 2021-08-19 | 平安科技(深圳)有限公司 | 基于语义和图像识别的心电信息提取方法、装置、计算机设备及存储介质 |
CN113283419A (zh) * | 2021-04-29 | 2021-08-20 | 国网浙江省电力有限公司湖州供电公司 | 基于注意力的卷积神经网络指针式仪表图像读数识别方法 |
EP3869403A2 (en) * | 2020-10-23 | 2021-08-25 | Beijing Baidu Netcom Science And Technology Co. Ltd. | Image recognition method, apparatus, electronic device, storage medium and program product |
-
2021
- 2021-11-25 CN CN202111416650.0A patent/CN114092813B/zh active Active
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830870A (zh) * | 2018-05-21 | 2018-11-16 | 千寻位置网络有限公司 | 基于多尺度结构学习的卫星影像高精度农田边界提取方法 |
CN109446992A (zh) * | 2018-10-30 | 2019-03-08 | 苏州中科天启遥感科技有限公司 | 基于深度学习的遥感影像建筑物提取方法及系统、存储介质、电子设备 |
US10402686B1 (en) * | 2019-01-25 | 2019-09-03 | StradVision, Inc. | Learning method and learning device for object detector to be used for surveillance based on convolutional neural network capable of converting modes according to scales of objects, and testing method and testing device using the same |
CN110197147A (zh) * | 2019-05-23 | 2019-09-03 | 星际空间(天津)科技发展有限公司 | 遥感影像的建筑物实例提取方法、装置、存储介质及设备 |
CN110781923A (zh) * | 2019-09-27 | 2020-02-11 | 重庆特斯联智慧科技股份有限公司 | 特征提取方法及装置 |
CN110942013A (zh) * | 2019-11-22 | 2020-03-31 | 佛山科学技术学院 | 一种基于深度神经网络的卫星影像特征提取方法及系统 |
CN111080567A (zh) * | 2019-12-12 | 2020-04-28 | 长沙理工大学 | 基于多尺度动态卷积神经网络的遥感图像融合方法及系统 |
CN111458148A (zh) * | 2020-04-26 | 2020-07-28 | 上海电机学院 | 一种基于cbam的卷积神经网络滚动轴承故障诊断方法 |
CN111783934A (zh) * | 2020-05-15 | 2020-10-16 | 北京迈格威科技有限公司 | 卷积神经网络构建方法、装置、设备及介质 |
CN111767800A (zh) * | 2020-06-02 | 2020-10-13 | 华南师范大学 | 遥感影像场景分类得分融合方法、系统、设备及存储介质 |
CN111738110A (zh) * | 2020-06-10 | 2020-10-02 | 杭州电子科技大学 | 基于多尺度注意力机制的遥感图像车辆目标检测方法 |
CN111783774A (zh) * | 2020-06-22 | 2020-10-16 | 联想(北京)有限公司 | 图像处理方法、设备及存储介质 |
CN111915592A (zh) * | 2020-08-04 | 2020-11-10 | 西安电子科技大学 | 基于深度学习的遥感图像云检测方法 |
WO2021159751A1 (zh) * | 2020-09-22 | 2021-08-19 | 平安科技(深圳)有限公司 | 基于语义和图像识别的心电信息提取方法、装置、计算机设备及存储介质 |
CN112085735A (zh) * | 2020-09-28 | 2020-12-15 | 西安交通大学 | 一种基于自适应锚框的铝材质图像缺陷检测方法 |
CN112329766A (zh) * | 2020-10-14 | 2021-02-05 | 北京三快在线科技有限公司 | 文字识别方法、装置、电子设备及存储介质 |
EP3869403A2 (en) * | 2020-10-23 | 2021-08-25 | Beijing Baidu Netcom Science And Technology Co. Ltd. | Image recognition method, apparatus, electronic device, storage medium and program product |
CN112215243A (zh) * | 2020-10-30 | 2021-01-12 | 百度(中国)有限公司 | 图像特征提取方法、装置、设备及存储介质 |
CN112396701A (zh) * | 2020-12-01 | 2021-02-23 | 腾讯科技(深圳)有限公司 | 卫星图像的处理方法、装置、电子设备和计算机存储介质 |
CN113063741A (zh) * | 2021-03-12 | 2021-07-02 | 中国科学院空天信息创新研究院 | 一种基于光谱特征的城市建筑材质提取方法及装置 |
CN113283419A (zh) * | 2021-04-29 | 2021-08-20 | 国网浙江省电力有限公司湖州供电公司 | 基于注意力的卷积神经网络指针式仪表图像读数识别方法 |
CN113205051A (zh) * | 2021-05-10 | 2021-08-03 | 中国科学院空天信息创新研究院 | 基于高空间分辨率遥感影像的储油罐提取方法 |
Non-Patent Citations (3)
Title |
---|
XU LI等: ""Replay and Synthetic Speech Detection with Res2net Architecture"", 《ARXIV》 * |
徐沁等: ""基于SE-Res2Net与多尺度空谱融合注意力机制的高光谱图像分类"", 《计算机辅助设计与图形学学报》 * |
李奇芪: ""顾及多尺度上下文信息的深度学习城市绿地分类"", 《测绘》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115144350A (zh) * | 2022-09-06 | 2022-10-04 | 中国科学院地理科学与资源研究所 | 基于高光谱相似像元比对的场地烃类污染判识方法及系统 |
CN115144350B (zh) * | 2022-09-06 | 2023-02-17 | 中国科学院地理科学与资源研究所 | 基于高光谱相似像元比对的场地烃类污染判识方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114092813B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111553406B (zh) | 基于改进yolo-v3的目标检测系统、方法及终端 | |
CN112580439B (zh) | 小样本条件下的大幅面遥感图像舰船目标检测方法及系统 | |
Ma et al. | A real-time crack detection algorithm for pavement based on CNN with multiple feature layers | |
CN110910343A (zh) | 路面裂缝检测的方法、装置及计算机设备 | |
CN111523459B (zh) | 遥感影像裸地识别方法、装置、电子设备及存储介质 | |
CN112084923B (zh) | 一种遥感图像语义分割方法、存储介质及计算设备 | |
CN111582104B (zh) | 基于自注意特征聚合网络的遥感图像语义分割方法及装置 | |
CN112418212B (zh) | 一种基于EIoU改进的YOLOv3算法 | |
CN112085056B (zh) | 目标检测模型生成方法、装置、设备及存储介质 | |
CN115409069A (zh) | 村镇建筑的识别方法、分类方法、装置、电子设备和介质 | |
WO2023001059A1 (zh) | 检测方法、装置、电子设备及存储介质 | |
CN115223054A (zh) | 一种基于分区聚类与卷积的遥感影像变化检测方法 | |
CN114092813B (zh) | 一种工业园区图像提取方法、系统、电子设备和存储介质 | |
CN111353580A (zh) | 目标检测网络的训练方法、电子设备及存储介质 | |
Xu et al. | Building height calculation for an urban area based on street view images and deep learning | |
CN115527121A (zh) | 一种端到端林地变化检测方法、系统、介质、设备及终端 | |
Ikeno et al. | An enhanced 3D model and generative adversarial network for automated generation of horizontal building mask images and cloudless aerial photographs | |
CN111199539A (zh) | 一种基于集成神经网络的裂缝检测方法 | |
CN103837135A (zh) | 工件检测方法及其系统 | |
Li et al. | Automated bridge crack detection based on improving encoder–decoder network and strip pooling | |
CN112487855A (zh) | 基于mtcnn网络模型的人脸检测方法及装置、终端 | |
Wang et al. | Surface defect detection of solar cell based on similarity non-maximum suppression mechanism | |
CN115272898A (zh) | 基于管网无人机巡检视频的识别方法、装置、介质和设备 | |
CN114973022A (zh) | 基于高空间分辨率遥感影像的畜牧业牲畜监测提取方法 | |
CN115273009A (zh) | 基于深度学习的道路裂纹检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |