CN116977876A - 一种无人机图像处理方法、系统及介质 - Google Patents
一种无人机图像处理方法、系统及介质 Download PDFInfo
- Publication number
- CN116977876A CN116977876A CN202310835602.8A CN202310835602A CN116977876A CN 116977876 A CN116977876 A CN 116977876A CN 202310835602 A CN202310835602 A CN 202310835602A CN 116977876 A CN116977876 A CN 116977876A
- Authority
- CN
- China
- Prior art keywords
- image
- frequency domain
- features
- domain features
- spatial domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000004927 fusion Effects 0.000 abstract description 9
- 238000007689 inspection Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/17—Terrestrial scenes taken from planes or by drones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种无人机图像处理方法、系统及介质,该方法包括:获取无人机拍摄到的遥感图像数据,作为输入图像;基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征,其中,所述双分支网络包括空间域分支和频域分支;将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示。本发明采用自适应的双分支网络,可以更好地应对遥感图像小目标检测的挑战,减少缺乏足够空间域的信息,增强语义信息的表示。另外,本发明通过一种融合机制,结合图像增强网络实现语义增强,挖掘空间和频域元素的联合表示,从而提高了小目标检测的精度。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种融合频域信息的无人机图像处理方法、系统及介质。
背景技术
遥感目标检测可以应用于通信网络巡检的场景,以提高巡检的效率和准确性。通信网络无人机巡检可以用于监测和巡视电信基站、塔桅、光缆等基础设施的状态和安全性。它可以通过图像识别和传感器数据分析来检测潜在的故障、损坏或异常情况,帮助提前发现和解决问题,提高基础设施的可靠性和可用性。
通信网络安全巡检是保障通信网络正常运行的重要环节,也是建设智能电网的重要内容。随着无人机技术的发展,选用无人机巡检成为当前最主要的方向之一。因此,通过计算机视觉技术对无人机遥感图像进行高准确率检测是必要的。
目前,无人机遥感图像检测主要分为两类:
第一类是基于经典机器学习算法,主要通过人工特征和线性分类器结合进行检测,一般应用于背景简单类目标检测。这类技术所消耗的时间较长且比较难以推广。
第二类是使用深度学习算法对遥感图像进行检测。这类技术在目标单一且背景简单的图像检测效果最好,但现在的遥感图像大多背景复杂且种类多样,而且由于遥感图像具有小目标繁多的特点,导致检测效果大打折扣。
发明内容
本发明的主要目的在于提供一种融合频域信息的无人机图像处理方法、系统及介质,旨在提高小目标检测的精度。
为了达到上述目的,本发明提出一种无人机图像处理方法,所述方法包括以下步骤:
步骤S10,获取无人机拍摄到的遥感图像数据,作为输入图像;
步骤S20,基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征,其中,所述双分支网络包括空间域分支和频域分支;
步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示。
本发明的进一步技术方案是,所述基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征的步骤包括:
将所述图像从空间域移动到频域,采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征。
本发明的进一步技术方案是,所述采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征的步骤中所采用的公式为:
其中,表示二维离散余弦变换的结果,C(u)是一个与变量u相关的系数,用于调整变换的幅度,C(u)是一个与变量v相关的系数,用于调整变换的幅度,f(i,j)表示信号在空间域中的取样值;
表示两个余弦函数的乘积,表示了两个余弦函数在给定的频率和位置上的取值。
本发明的进一步技术方案是,所述将所述图像从空间域移动到频域,采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征的步骤之后还包括:
基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰。
本发明的进一步技术方案是,所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤包括:
对所述图像进行下采样生成多尺度图像xf={x1,x2,...,xn},其中,n是指4;
采用特征增强模块构建多尺度特征图,其中,所述特征增强模块的一部分写成:
其中,表示输入图像,/>是最终的增强图像,GELU代表GELU激活函数。
本发明的进一步技术方案是,所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤还包括:
将特征传递给前馈网络FFN以增强信道信息,其中,前馈网络FFN可以写成:
其中,DW-Conv3x3表示内核大小为3x3的深度卷积层。
本发明的进一步技术方案是,所述步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示的步骤包括:
基于注意力机制将所述图像的空间域特征和频域特征进行融合,其中,所述空间域特征通过通道注意力自动捕获重要的区域特征,所述频域特征通过空间注意力增强其局部细节并抑制冗余语义信息。
本发明的进一步技术方案是,所述步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示的步骤还包括:
通过点乘法将所述空间域特征和所述频域特征进行融合,其中,三个反向特征可以写成:
Msf=Conv1×1(Conv1×1(Xs)·Conv1×1(Yf));
其中,X′s,Y′f和Msf表示三个反向特征,Xs和Yf分别表示空间域特征和频域特征,FC表示两个线性层,GN表示群范数,sigmoid表示激活函数;
将三个反向特征添加到最终的注意力模块中,以获得所述空间域特征和所述频域特征的统一表示Ai,其中,统一表示Ai可以写成:
Ai=atten(Conv1×1(X′s+Y′f+Msf));
其中,atten表示普通注意力模块。
本发明的进一步技术方案是,所述将三个反向特征添加到最终的注意力模块中,以获得所述空间域特征和所述频域特征的统一表示Ai的步骤之后还包括:
借助特征金字塔PAFPN将所述空间域特征和所述频域特征的统一表示Ai融合得到遥感图像以进一步丰富语义信息;
将所述空间域特征和所述频域特征的统一表示Ai输入检测头得到最后的检测结果。
为实现上述目的,本发明还提出一种无人机图像处理系统,所述系统包括存储器、处理器以及存储在所述处理器上的无人机图像处理程序,所述无人机图像处理程序被所述处理器运行时执行如上所述的方法的步骤。
为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有无人机图像处理程序,所述无人机图像处理程序被处理器运行时执行如上所述的方法的步骤。
本发明无人机图像处理方法、系统及介质的有益效果是:本发明通过上述技术方案,采用自适应的双分支网络,可以更好地应对遥感图像小目标检测的挑战,减少缺乏足够空间域的信息,增强语义信息的表示。另外,本发明通过一种融合机制,结合图像增强网络实现语义增强,挖掘空间和频域元素的联合表示,从而提高了小目标检测的精度。
附图说明
图1是本发明无人机图像处理方法第一实施例的流程示意图;
图2是本发明无人机图像处理方法所涉及到的模型框架图。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
考虑到目前基于计算机视觉技术的目标检测并不能有效的处理航拍图像总多小目标问题,这是因为现在的目标检测器在图像处理时会损失空间域信息,从而导致航拍图像的小目标检测准确率较低,为解决这个问题,本发明采用一种从空间域转移到频域的注意力机制,针对航拍图像小物体进行了检测优化,同时,本发明结合图像增强网络的融合机制实现语义增强并提取空间域和频域的联合表示组件提高了小物体检测的准确性。
请参照图1,本发明提出一种无人机图像处理方法,本发明无人机图像处理方法第一实施例包括以下步骤:
步骤S10,获取无人机拍摄到的遥感图像数据,作为输入图像。
本发明无人机图像处理方法所涉及的模型框架图如图2所示,本实施例中,整个模型的输入是遥感图像数据,该图像可为无人机拍摄得到。本实施例中,设表示输入的表格图像,其中H和W分别表示输入图像的高度和宽度。
步骤S20,基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征,其中,所述双分支网络包括空间域分支和频域分支。
本实施例中,所述双分支网络包括空间域分支和频域分支。
ResNet-50凭借其强大的残差块,已成为计算机视觉任务中使用最广泛的骨干网络之一,本实施例采用ResNet-50作为提取空间域特征的骨干网络。
图像的压缩会显著影响图像的空间域信息,但是频域信息可以保留,因此,需要合并频域信息和空间域信息,以获得坚固的表示以进行检测。
步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示。
值得提出的是,为了融合所述图像的空间域特征和频域特征,最简单的方法就是将相应的元素添加或连接在一起,但这种方案有时可能会难以产生最佳性能,因此,本实施例基于神经网络中汲取灵感,通过在空间频域融合模块中加入了注意力机制,将所述图像的空间域特征和频域特征结合起来,进行融合,得到所述图像的空间域特征和频域特征的统一表示。
本实施例的有益效果是:本实施例通过上述技术方案,采用自适应的双分支网络,可以更好地应对遥感图像小目标检测的挑战,减少缺乏足够空间域的信息,增强语义信息的表示。另外,本实施例通过一种融合机制,结合图像增强网络实现语义增强,挖掘空间和频域元素的联合表示,从而提高了小目标检测的精度。
基于图1所示的第一实施例,提出本发明无人机图像处理方法第二实施例,本实施例与图1所示的第一实施例的区别在于,本实施例中,所述基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征的步骤包括:
将所述图像从空间域移动到频域,采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征。
图像压缩通常采用离散余弦变换(DCT),本实施例利用DCT将输入图像I从空间域移动到频域,此外,DCT可以比其他技术(如快速傅里叶变换)更有效地变换频域特征。
具体地,本实施例中,所述采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征的步骤中所采用的公式为:
其中,表示二维离散余弦变换的结果,C(u)是一个与变量u相关的系数,用于调整变换的幅度,C(u)是一个与变量v相关的系数,用于调整变换的幅度,f(i,j)表示信号在空间域中的取样值;
表示两个余弦函数的乘积,表示了两个余弦函数在给定的频率和位置上的取值。
所述将所述图像从空间域移动到频域,采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征的步骤之后还包括:
基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰。
在DCT应用之后,高频信息通常位于图像的右下角,而低频信息位于左上角,为了消除频域中多余的语义信息和噪声干扰,本实施例采用了特征增强模块(TEB)。
所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤具体包括:
对所述图像进行下采样生成多尺度图像xf={x1,x2,...,xn},其中,n是指4。
本实施例首先形成输入图像I,然后通过DCT变换到频域,模型对其进行下采样生成多尺度图像xf。
然后采用特征增强模块(TEB)构建多尺度特征图,其中,所述特征增强模块的一部分写成:
其中,表示输入图像,/>是最终的增强图像,GELU代表GELU激活函数。
本实施例中,所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤还包括:
将特征传递给前馈网络FFN以增强信道信息,其中,前馈网络FFN可以写成:
其中,DW-Conv3x3表示内核大小为3x3的深度卷积层。在TEB模块之后,Xout将使用空间频域特征融合块(SFFB)模块与空间域图片融合。
本实施例中,所述步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示的步骤包括:
基于注意力机制将所述图像的空间域特征和频域特征进行融合,其中,所述空间域特征通过通道注意力自动捕获重要的区域特征,所述频域特征通过空间注意力增强其局部细节并抑制冗余语义信息。
为了融合空间域特征和频域特征,最简单的方法是将相应的元素添加或连接在一起,尽管这是一项简单的操作,但是有时可能难以产生最佳性能。因此,本实施例从人工神经网络中汲取灵感,在空间频域特征融合模块中加入了注意力机制,将空间域特征和频域特征结合起来。具体地,本实施例主要是通过以下方法获得最终的融合特征表示。首先,空间域的特征通过通道注意力自动捕获重要的区域特征;频域特征,通过空间注意力增强其局部细节并抑制冗余语义信息。
进一步地,本实施例中,所述步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示的步骤还包括:
通过点乘法将所述空间域特征和所述频域特征进行融合,其中,三个反向特征可以写成:
Msf=Conv1×1(Conv1×1(Xs)·Conv1×1(Yf));
其中,X′s,Y′f和Msf表示三个反向特征,Xs和Yf分别表示空间域特征和频域特征,FC表示两个线性层,GN表示群范数,sigmoid表示激活函数。
将三个反向特征添加到最终的注意力模块中,以获得所述空间域特征和所述频域特征的统一表示Ai,其中,统一表示Ai可以写成:
Ai=atten(Conv1×1(X′s+Y′f+Msf));
其中,atten表示普通注意力模块。
进一步地,本实施例中,所述将三个反向特征添加到最终的注意力模块中,以获得所述空间域特征和所述频域特征的统一表示Ai的步骤之后还包括:
借助特征金字塔PAFPN将所述空间域特征和所述频域特征的统一表示Ai融合得到遥感图像以进一步丰富语义信息;
将所述空间域特征和所述频域特征的统一表示Ai输入检测头得到最后的检测结果。其中,本实施例采用的是Faster-rcnn的检测头。
本发明无人机图像处理方法的有益效果是:本发明通过上述技术方案,采用自适应的双分支网络,可以更好地应对遥感图像小目标检测的挑战,减少缺乏足够空间域的信息,增强语义信息的表示。另外,本发明通过一种融合机制,结合图像增强网络实现语义增强,挖掘空间和频域元素的联合表示,从而提高了小目标检测的精度。
为实现上述目的,本发明还提出一种无人机图像处理系统,所述系统包括存储器、处理器以及存储在所述处理器上的无人机图像处理程序,所述无人机图像处理程序被所述处理器运行时执行如上任一实施例所述的方法的步骤,这里不再赘述。
为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有无人机图像处理程序,所述无人机图像处理程序被处理器运行时执行如权利要求1至8上任一实施例所述的方法的步骤,这里不再赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种无人机图像处理方法,其特征在于,所述方法包括以下步骤:
步骤S10,获取无人机拍摄到的遥感图像数据,作为输入图像;
步骤S20,基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征,其中,所述双分支网络包括空间域分支和频域分支;
步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示。
2.根据权利要求1所述的无人机图像处理方法,其特征在于,所述基于双分支网络对所述图像进行处理,得到所述图像的空间域特征和频域特征的步骤包括:
将所述图像从空间域移动到频域,采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征。
3.根据权利要求2所述的无人机图像处理方法,其特征在于,所述采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征的步骤中所采用的公式为:
其中,表示二维离散余弦变换的结果,C(u)是一个与变量u相关的系数,用于调整变换的幅度,C(u)是一个与变量v相关的系数,用于调整变换的幅度,f(i,j)表示信号在空间域中的取样值;
表示两个余弦函数的乘积,表示了两个余弦函数在给定的频率和位置上的取值。
4.根据权利要求2所述的无人机图像处理方法,其特征在于,所述将所述图像从空间域移动到频域,采用二维离散余弦变换对所述图像进行频域转换,得到所述图像的频域特征的步骤之后还包括:
基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰;
所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤包括:
对所述图像进行下采样生成多尺度图像xf={x1,x2,...,xn},其中,n是指4;
采用特征增强模块构建多尺度特征图,其中,所述特征增强模块的一部分写成:
其中,表示输入图像,/>是最终的增强图像,GELU代表GELU激活函数。
5.根据权利要求4所述的无人机图像处理方法,其特征在于,所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤还包括:
将特和传递给前馈网络FFN以增强信道信息,其中,前馈网络FFN可以写成:
其中,DW-Conv3x3表示内核大小为3x3的深度卷积层。
6.根据权利要求5所述的无人机图像处理方法,其特征在于,所述步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示的步骤包括:
基于注意力机制将所述图像的空间域特征和频域特征进行融合,其中,所述空间域特征通过通道注意力自动捕获重要的区域特征,所述频域特征通过空间注意力增强其局部细节并抑制冗余语义信息。
7.根据权利要求6所述的无人机图像处理方法,其特征在于,所述步骤S30,将所述图像的空间域特征和频域特征进行融合,得到所述图像的空间域特征和频域特征的统一表示的步骤还包括:
通过点乘法将所述空间域特征和所述频域特征进行融合,其中,三个反向特征可以写成:
Msf=Conv1×1(Conv1×1(Xs)·Conv1×1(Yf));
其中,X′s,Y′f和Msf表示三个反向特征,Xs和Yf分别表示空间域特征和频域特征,FC表示两个线性层,GN表示群范数,sigmoid表示激活函数;
将三个反向特征添加到最终的注意力模块中,以获得所述空间域特征和所述频域特征的统一表示Ai,其中,统一表示Ai可以写成:
Ai=atten(Conv1×1(X′s+Y′f+Msf));
其中,atten表示普通注意力模块。
8.根据权利要求7所述的无人机图像处理方法,其特征在于,所述将三个反向特征添加到最终的注意力模块中,以获得所述空间域特征和所述频域特征的统一表示Ai的步骤之后还包括:
借助特征金字塔PAFPN将所述空间域特征和所述频域特征的统一表示Ai融合得到遥感图像以进一步丰富语义信息;
将所述空间域特征和所述频域特征的统一表示Ai输入检测头得到最后的检测结果。
9.一种无人机图像处理系统,其特征在于,所述系统包括存储器、处理器以及存储在所述处理器上的无人机图像处理程序,所述无人机图像处理程序被所述处理器运行时执行如权利要求1至8任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有无人机图像处理程序,所述无人机图像处理程序被处理器运行时执行如权利要求1至8任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310835602.8A CN116977876A (zh) | 2023-07-07 | 2023-07-07 | 一种无人机图像处理方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310835602.8A CN116977876A (zh) | 2023-07-07 | 2023-07-07 | 一种无人机图像处理方法、系统及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116977876A true CN116977876A (zh) | 2023-10-31 |
Family
ID=88474141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310835602.8A Pending CN116977876A (zh) | 2023-07-07 | 2023-07-07 | 一种无人机图像处理方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116977876A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576467A (zh) * | 2023-11-22 | 2024-02-20 | 安徽大学 | 一种融合频率域和空间域信息的农作物病害图像识别方法 |
-
2023
- 2023-07-07 CN CN202310835602.8A patent/CN116977876A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576467A (zh) * | 2023-11-22 | 2024-02-20 | 安徽大学 | 一种融合频率域和空间域信息的农作物病害图像识别方法 |
CN117576467B (zh) * | 2023-11-22 | 2024-04-26 | 安徽大学 | 一种融合频率域和空间域信息的农作物病害图像识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111445418B (zh) | 图像去雾处理方法、装置及计算机设备 | |
US20230045519A1 (en) | Target Detection Method and Apparatus | |
US20190311223A1 (en) | Image processing methods and apparatus, and electronic devices | |
Zhang et al. | One-two-one networks for compression artifacts reduction in remote sensing | |
CN114972107B (zh) | 基于多尺度堆叠式注意力网络的低照度图像增强方法 | |
Teng et al. | Underwater target recognition methods based on the framework of deep learning: A survey | |
WO2024060321A1 (zh) | 一种用于增强行人局部特征的联合建模方法和装置 | |
CN114936979B (zh) | 一种模型训练方法、图像去噪方法、装置、设备及存储介质 | |
CN116977876A (zh) | 一种无人机图像处理方法、系统及介质 | |
US11676361B2 (en) | Computer-readable recording medium having stored therein training program, training method, and information processing apparatus | |
CN111696038A (zh) | 图像超分辨率方法、装置、设备及计算机可读存储介质 | |
CN114926734B (zh) | 基于特征聚合和注意融合的固体废弃物检测装置及方法 | |
CN113592940A (zh) | 基于图像确定目标物位置的方法及装置 | |
CN115965559A (zh) | 面向森林场景的一体化航拍图像增强方法 | |
CN114387977A (zh) | 基于双域深度特征和注意力机制的语音裁剪痕迹定位方法 | |
Hua et al. | Dynamic scene deblurring with continuous cross-layer attention transmission | |
Wang et al. | Afdn: Attention-based feedback dehazing network for UAV remote sensing image haze removal | |
Shi et al. | A lightweight image splicing tampering localization method based on MobileNetV2 and SRM | |
CN113392728A (zh) | 一种基于ssa锐化注意机制的目标检测方法 | |
CN110717441B (zh) | 视频目标检测方法、装置、设备及介质 | |
CN115273013B (zh) | 车道线检测方法、系统、计算机及可读存储介质 | |
CN116385546A (zh) | 一种同时分割和检测抓取位姿的多模态特征融合方法 | |
US20240221181A1 (en) | Image processing system | |
CN114241204A (zh) | 图像识别方法、装置、设备、介质及计算机产品 | |
CN113963289A (zh) | 目标检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |