CN116452820B - 环境污染等级确定方法及装置 - Google Patents
环境污染等级确定方法及装置 Download PDFInfo
- Publication number
- CN116452820B CN116452820B CN202310720962.3A CN202310720962A CN116452820B CN 116452820 B CN116452820 B CN 116452820B CN 202310720962 A CN202310720962 A CN 202310720962A CN 116452820 B CN116452820 B CN 116452820B
- Authority
- CN
- China
- Prior art keywords
- feature
- fusion
- channel
- attention
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003912 environmental pollution Methods 0.000 title claims abstract description 32
- 230000004927 fusion Effects 0.000 claims abstract description 75
- 238000000605 extraction Methods 0.000 claims abstract description 45
- 230000007246 mechanism Effects 0.000 claims abstract description 23
- 238000007477 logistic regression Methods 0.000 claims abstract description 21
- 238000010586 diagram Methods 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 6
- 238000002372 labelling Methods 0.000 abstract description 5
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 abstract description 3
- 108091006146 Channels Proteins 0.000 description 42
- 238000012549 training Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000011176 pooling Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003900 soil pollution Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/20—Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种环境污染等级确定方法及装置,涉及图像数据处理技术领域,具体涉及环境检测技术领域,用于解决特征提取能力和多尺度目标的处理能力不足、计算效率不高及需要大量标注数据的支持等问题,包括:对地面的空间信息进行探测和测量来获取地面遥感图像;对遥感图像进行卷积运算,得到多个特征图;采用通道融合和空间融合对多个特征图进行特征融合,得到第一特征;基于注意力机制对多个第一特征图进行特征提取,得到第二特征;对第一特征和第二特征进行融合,得到第三特征;将第三特征输入基于梯度增强的逻辑回归分类器,输出空间信息表征的空间的环境污染等级。
Description
技术领域
本发明涉及图像数据处理技术领域,具体涉及环境检测技术领域,尤其涉及一种环境污染等级确定方法及装置。
背景技术
在现代化进程中,工业化、城市化等人类活动不断增加,环境污染问题已成为全球性的关注焦点。环境污染的种类繁多,包括大气污染、水污染、土壤污染等。对于环境污染问题,传统的评估方法需要进行大量的实地调查和采样分析,费时费力,成本高昂。同时,传统方法只能针对局部污染源进行评估,对于区域性污染难以全面反映。因此,发展一种能够高效、全面地对环境污染进行评估的方法十分必要。
遥感技术和地理信息系统技术的发展为环境污染等级分类提供了新的思路和手段。通过获取遥感图像和地理信息系统数据,结合环境污染源的位置和类型,可以通过地物信息反演的方法对环境污染等级进行分类,实现全面、快速地评估环境污染情况,为环境保护和治理提供科学依据。
然而,现有的技术仍然存在一些问题难以解决,包括:在特征提取上存在一定的局限性,特征提取能力不足,无法很好地捕捉目标物体的细节和多样性,导致检测精度较低;在处理多尺度目标时存在一定的困难,无法很好地捕捉不同尺度的特征信息;需要大量高质量的标注数据进行训练,但这种数据往往难以获取,导致模型的应用范围受到限制;在计算效率上存在一定的问题,导致模型在实际应用中无法满足实时性的要求;对于遮挡、光照变化等环境因素的鲁棒性较差,无法很好地应对这些复杂的场景。
发明内容
针对上述技术问题,本发明提供一种环境污染等级确定方法及装置,用于至少部分解决上述技术问题。
基于此,本发明第一方面提供一种环境污染等级确定方法,包括:对地面的空间信息进行探测和测量来获取地面遥感图像;对遥感图像进行卷积运算,得到多个特征图;采用通道融合和空间融合对多个特征图进行特征融合,得到第一特征;基于注意力机制对多个特征图进行特征提取,得到第二特征;对第一特征和第二特征进行融合,得到第三特征;将第三特征输入基于梯度增强的逻辑回归分类器,输出空间信息表征的空间的环境污染等级。
根据本发明的实施例,采用通道融合和空间融合对多个特征图进行特征融合包括:采用通道融合对多个特征图进行特征融合,得到通道特征图;采用空间融合对多个特征图进行特征融合,得到空间特征图;基于自注意力机制,根据通道特征图和空间特征图计算自注意力权重;基于自注意力权重对通道特征图和多个特征图进行加权平均,得到加权特征图;根据加权特征图确定第一特征。
根据本发明的实施例,根据加权特征图确定第一特征包括:对加权特征图依次进行非线性激活、下采样、批量归一化及动态感知采样,得到第一特征。
根据本发明的实施例,动态感知采样的位置和大小根据目标物体的大小和位置的动态变化而不断调整。
根据本发明的实施例,基于自注意力机制,根据通道特征图和空间特征图计算自注意力权重包括:根据通道特征图在位置为(i,j)处第k个特征图的值和空间特征图在位置为(i,j)处第k个特征图的值,计算位置(i,j)对于第k个通道的自注意力权重。
根据本发明的实施例,基于注意力机制对多个特征图进行特征提取,得到第二特征包括:计算不同特征图的通道注意力权重和空间注意力权重;基于通道注意力权重和空间注意力权重对多个特征图进行加权融合,得到注意力增强特征图;采用不同大小的卷积核对注意力增强特征图进行卷积操作,得到不同尺度的特征图;对不同尺度的特征图进行拼接,得到第二特征。
根据本发明的实施例,在采用通道融合和空间融合对多个特征图进行特征融合以及基于注意力机制对多个特征图进行特征提取的过程中,采用像素级的标签。
根据本发明的实施例,采用自监督学习技术对像素级的标签进行训练。
根据本发明的实施例,采用最小化逻辑回归损失函数来学习基于梯度增强的逻辑回归分类器的模型参数。
本发明实施例的第二方面提供一种环境污染等级确定装置,包括:获取模块,用于对地面的空间信息进行探测和测量来获取地面遥感图像;卷积模块,用于对遥感图像进行卷积运算,得到多个特征图;第一特征提取模块,用于采用通道融合和空间融合对多个特征图进行特征融合,得到第一特征;第二特征提取模块,用于基于注意力机制对多个特征图进行特征提取,得到第二特征;融合模块,用于对第一特征和第二特征进行融合,得到第三特征;分类模块,用于将第三特征输入基于梯度增强的逻辑回归分类器,输出空间信息表征的空间的环境污染等级。
根据本发明实施例提供的环境污染等级确定方法及装置,至少包括以下有益效果:
采用了两个特征提取分支,增加了特征提取的多样性和丰富性。引入了通道融合和空间融合两种特征融合方式,能够更好地提取不同尺度的特征信息。基于梯度增强的逻辑回归分类器,将梯度增强应用于逻辑回归分类器中,提高了环境风险等级的确定精度。
引入了自注意力机制,能够自适应地计算权重,学习每个位置的重要性,进一步提高了特征提取的效果。采用了多个尺寸的卷积核,能够更好地捕捉不同尺度的特征信息。
结合卷积神经网络和动态感知采样,能够根据目标物体的大小、位置等动态变化而不断调整采样的位置和大小,提高了模型对不同尺寸、不同形状目标的特征提取能力。
在第二个特征提取分支中,使用了注意力增强层来自适应地调整特征图的权重,以便更加关注重要的特征图,从而提高特征提取的效果。使用不同大小的卷积核对输入数据进行卷积操作,得到不同尺度的特征图,然后将这些特征图进行拼接,得到多尺度特征图,以提高模型对不同尺度目标的特征提取能力。
在特征提取模型训练方式中,使用像素级别的标签代替物体级别的标签,使用自监督学习技术对这些像素级别的标签进行训练,从而实现对物体级别标签的预测。这种方法可以避免需要大规模、高质量的标注数据进行训练,提高了模型的应用范围。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其他目的、特征图像和优点将更为清楚,在附图中:
图1示意性示出了本发明实施例提供的环境污染等级确定方法流程图。
图2示意性示出了本发明实施例提供的环境污染等级确定装置的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本发明。在此使用的术语“包括”、“包含”等表明了所述特征图像、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征图像、步骤、操作或部件。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或可以互相通讯;可以是直接连接,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要理解的是,术语“纵向”、“长度”、“周向”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的子系统或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
贯穿附图,相同的元素由相同或相近的附图标记来表示。可能导致本发明的理解造成混淆时,将省略常规结构或构造。并且图中各部件的形状、尺寸、位置关系不反映真实大小、比例和实际位置关系。另外,在本发明中,不应将位于括号之间的任何参考符号构造成对本发明的限制。
类似地,为了精简本发明并帮助理解各个公开方面中的一个或多个,在上面对本发明示例性实施例的描述中,本发明的各个特征图像有时被一起分到单个实施例、图或者对其描述中。参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征图像、结构、材料或者特点包含于本发明的至少一个实施例或示例中。本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征图像、结构、材料或者特点可以在任何的一个或者多个实施例或示例中以合适的方式结合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征图像的数量。因此,限定有“第一”、“第二”的特征图像可以明示或者隐含地包括一个或者更多个该特征图像。在本发明的描述中,“多个”的含义是至少两个,例如两个、三个等,除非另有明确具体的限定。
图1示意性示出了本发明实施例提供的环境污染等级确定方法流程图。
如图1所示,该环境污染等级确定方法包括操作S110~操作S160。
在操作S110,对地面的空间信息进行探测和测量来获取地面遥感图像。
在本发明的实施例中,遥感图像是通过对地面的空间信息进行远距离探测和测量所采集的数据,遥感图像来源广泛、分辨率高,可以有效地获取大范围的地物信息,包括地表覆盖、土地利用、植被覆盖等。
在操作S120,对遥感图像进行卷积运算,得到多个特征图。
在本发明的实施例中,将原始遥感图像输入到输入层。输入层仅用于输入数据,假设输入数据为大小为W×H×C的遥感图像数据,其中,W为图像宽度,H为图像高度,C为通道数。再将遥感图像进一步输入到卷积层。在卷积层中,使用大小为F×F×Din×Dout的卷积核,对输入数据进行卷积运算,得到Dout个特征图,每个特征图的大小为(W-F+1)×(H-F+1)。卷积操作可以用下式表示:
其中,y i,j,k 表示卷积层输出的特征图中第k个特征图在位置(i,j)处的值,x i+u,j+v,c 表示输入数据中在位置(i+u,j+v)处通道c的像素值,w u,v,c,k 表示卷积核在位置(u,v)处通道c和第k个特征图的权重,b k 表示第k个特征图的偏置项。
卷积层的输出为多幅特征图,特征图的数量取决于卷积核的个数。例如,采用3个卷积核,卷积核的尺寸分别为3×3、5×5、7×7。
在操作S130,采用通道融合和空间融合对多个特征图进行特征融合,得到第一特征。
在本发明的实施例中,采用通道融合和空间融合对多个特征图进行特征融合包括:采用通道融合对多个特征图进行特征融合,得到通道特征图。采用空间融合对多个特征图进行特征融合,得到空间特征图。基于自注意力机制,根据通道特征图和空间特征图计算自注意力权重。基于自注意力权重对通道特征图和多个特征图进行加权平均,得到加权特征图。根据加权特征图确定第一特征。
示例性地,将卷积层的各特征图输入到融合层。特征融合层可以将多个特征图进行融合,以提取更加丰富的特征。具体而言,采用了两种不同的特征融合方式:通道融合和空间融合。
通道融合可以用下式表示:
其中,Ay i,j,k 表示通道融合后的特征图在位置(i,j)处第k个特征图的值,Ax i,j,k 表示融合层的输入数据在位置(i,j)处第l个特征图的值,Aw k,l 为通道融合权重。
空间融合可以用下式表示:
其中,By i,j,k 表示空间融合后的特征图在位置(i,j)处第k个特征图的值,Bx i+u,j+v,k 表示融合层的输入数据在位置(i+u,j+v)处第k个特征图的值,Bw u,v 为空间融合权重。
为了进一步提高特征融合的效果,本发明采用了自注意力机制。自注意力机制可以通过自适应地计算权重,自动地学习每个位置的重要性,并对特征图进行加权平均。自注意力机制可以根据通道特征图在位置为(i,j)处第k个特征图的值和空间特征图在位置为(i,j)处第k个特征图的值,计算位置(i,j)对于第k个通道的自注意力权重,用下式表示:
其中,Dα i,j,k 表示第位置(i,j)对于第l个通道的自注意力权重,Dα i,j,k 由Ay i,j,k 的值与By i,j,k 的值相乘得到,x i,j,k 表示第位置(i,j)对于第l个通道的特征值,Ay i,j,k 表示加权后的特征图在位置(i,j)处第k个特征图的值。举例说明,Ay i,j,5表示融合后的特征图在位置(i,j)处第5个特征图的值为3,By(i,j,5)表示融合后的特征图在位置(i,j)处第5个特征图的值为5,则Cα(i,j,l)表示第位置(i,j)对于第l个通道的自注意力权重为3×5=15。在这里,l代表的通道数与上述得到的k代表的特征图数具有同等作用,即有几个特征图,就有几个通道。
进一步地,根据加权特征图确定第一特征包括:对加权特征图依次进行非线性激活、下采样、批量归一化及动态感知采样,得到第一特征。
示例性地,首先,将融合后的特征输入到非线性激活层。非线性激活层用于将卷积层输出的特征图进行非线性激活,采用的函数为ReLU激活函数,以增强模型的非线性表达能力。ReLU函数可以用下式表示:
接下来,将非线性激活层输出的特征输入到池化层。在池化层中,对卷积层的输出进行下采样,得到更小的特征图,同时保留图像的主要特征。一般使用最大池化或平均池化操作,本发明采用最大池化。最大池化可以用下式表示:
其中,Ey i,j,k 表示池化层输出的特征图中第k个特征图在位置(i,j)处的值,x i×S+u,j×S+v,k 表示输入数据中在位置(i×S+u,j×S+v)处第k个特征图的像素值,P为池化区域的大小,S为池化的步长。
接下来,将池化层输出的特征输入到批量归一化层。为了加速训练和提高泛化能力,本发明在卷积层和激活函数之间加入批量归一化。批量归一化可以将每个批次中的特征图进行归一化处理,以减小内部协方差偏移,增强模型的泛化能力。批量归一化可以用下式表示:
其中,表示归一化后的第k个特征图,x k 表示第k个特征图,μ B 表示批次中第k个特征图的均值,/>表示批次中第k个特征图的方差,ϵ为一个极小值,以避免分母为0。
将批量归一化层的输出输入到Dropout层。为了防止过拟合,本发明在卷积层和全连接层之间加入Dropout层。Dropout层可以随机地将一定比例的神经元输出设为0,以减小神经元之间的依赖关系,增强模型的泛化能力。将Dropout层的输出输入到动态感知采样层。具体而言,使用动态感知采样层对特征图进行采样,采样的位置和大小根据目标物体的大小、位置等动态变化而不断调整。在动态感知采样层中,使用可学习的采样位置和大小参数,采样过程可以用下式表示:
其中,s i,j 表示采样的位置和大小,w s 和b s 为待学习的权重和偏置项,F(⋅)为可微的采样函数。通过动态感知采样,能够提高模型对不同尺寸、不同形状目标的特征提取能力。
在操作S140,基于注意力机制对多个特征图进行特征提取,得到第二特征。
在本发明的实施例中,提取第二特征可以包括:计算不同特征图的通道注意力权重和空间注意力权重。基于通道注意力权重和空间注意力权重对多个特征图进行加权融合,得到注意力增强特征图。采用不同大小的卷积核对注意力增强特征图进行卷积操作,得到不同尺度的特征图。对不同尺度的特征图进行拼接,得到第二特征。
示例性地,第二特征提取分支与第以特征提取分支具备相同的卷积层结构,此处不再赘述。将卷积层的输出特征图输入到注意力增强层。在特征提取过程中,不同的特征图具有不同的重要性,一些重要的特征图需要更多的关注。因此,注意力增强层使用注意力机制来自适应地调整特征图的权重。
具体而言,采用通道注意力和空间注意力相结合的方式。通道注意力可以用下式表示:
其中,a k 为第k个通道的权重,C为通道数,H和W为输入数据的高度和宽度,x(i,j,k)为输入数据在位置(i,j)处第k个通道的值,Fy(i,j,k)为加权后的输出值。
空间注意力可以用下式表示:
其中,a(i,j)为位置(i,j)处的权重,w 1和b 1为待学习的参数。
接下来,使用不同大小的卷积核对输入数据进行卷积操作,得到不同尺度的特征图,然后将这些特征图进行拼接,得到第二特征。在拼接过程中,使用特征融合层来进一步融合特征,可以用下式表示:
其中,f 1、f 2和f 3分别表示不同尺度的特征图,W f1、W f2和W f3为待学习的权重,b f 为偏置项,σ(⋅)为激活函数。
通过多尺度特征提取,可以提高模型对不同尺度目标的特征提取能力。
需要说明的是,上述特征提取模型也即第一特征提取分支和第二特征提取分支特征提取的过程中,采用像素级的标签。
具体而言,传统的深度学习算法需要大量标注数据进行训练,而在实际应用中,获取大规模、高质量的标注数据非常困难,这限制了深度学习算法的应用范围。为了解决这个问题,本发明引入了弱监督学习技术。
采用像素级别的标签代替物体级别的标签,这些标签可以通过简单的手工规则、图像处理算法、先验知识等方式得到。然后,使用自监督学习技术对这些像素级别的标签进行训练,从而实现对物体级别标签的预测。
自监督学习中,使用无监督的学习策略,通过最大化自身的信息熵来训练模型。具体而言,引入了无标签数据,通过模型自身的预测结果来生成伪标签,然后将这些伪标签与像素级别的标签进行比较,计算交叉熵损失,并通过反向传播算法更新模型参数。具体的损失函数可以用下式表示:
其中,y i 表示真实的标签值,表示模型预测的标签值,n表示样本数。通过弱监督学习,能够利用更少的标注数据进行模型训练,提高算法的实际应用性能。
在操作S150,对第一特征和第二特征进行融合,得到第三特征。
在本发明的实施例中,将上述两个分支提取得到的特征进行融合,融合方式为采用神经网络进行融合。所述神经网络为2层结构,其中第1层为输入层,将2个分支提取得到的特征输入至特征融合神经网络;第2层为输出层,输出融合后的特征。
在操作S160,将第三特征输入基于梯度增强的逻辑回归分类器,输出空间信息表征的空间的环境污染等级。
本发明的实施例提出一种基于梯度增强的逻辑回归分类器,该分类器是一种基于梯度增强思想的逻辑回归分类器,结合了逻辑回归和梯度增强的优点,能够在处理高维数据和大规模数据时具有较高的准确性和效率。该算法的创新性改进是将梯度增强应用于逻辑回归分类器中,采用一种新的方式来提高分类器的精度。
假设该算法的输入是一个包含N个样本的特征提取后的数据集,每个样本包含D个特征和一个二进制分类标签。定义逻辑回归模型如下:
其中,表示输入特征向量,/>表示逻辑回归模型的参数。本发明的目标是通过最小化逻辑回归损失函数来学习模型参数w:
其中y i 表示第i个样本的分类标签。为了优化逻辑回归损失函数,本发明采用梯度下降算法。具体来说,计算损失函数关于参数w的梯度,然后更新参数:
其中t表示迭代次数,η表示学习率。通过反向传播来计算梯度。
综上所述,本发明的实施例提供的环境污染等级确定方法具有以下技术优点:基于梯度增强的逻辑回归分类器能够提高分类器的精度。采用了两个特征提取分支,增加了特征提取的多样性和丰富性。引入了通道融合和空间融合两种特征融合方式,能够更好地提取不同尺度的特征信息。引入了自注意力机制,能够自适应地计算权重,学习每个位置的重要性,进一步提高了特征提取的效果。采用了多个尺寸的卷积核,能够更好地捕捉不同尺度的特征信息。结合卷积神经网络和动态感知采样,能够根据目标物体的大小、位置等动态变化而不断调整采样的位置和大小,提高了模型对不同尺寸、不同形状目标的特征提取能力。使用注意力增强层和不同大小的卷积核对输入数据进行卷积操作,得到不同尺度的特征图,以提高模型对不同尺度目标的特征提取能力。采用自监督学习技术进行训练,避免需要大规模、高质量的标注数据进行训练,提高了模型的应用范围。
图2示意性示出了本发明实施例提供的环境污染等级确定装置的框图。
如图2所示,该环境污染等级确定装置200包括:获取模块210、卷积模块220、第一特征提取模块230、第二特征提取模块240、融合模块250及分类模块260。
获取模块210,用于对地面的空间信息进行探测和测量来获取地面遥感图像。
卷积模块220,用于对遥感图像进行卷积运算,得到多个特征图。
第一特征提取模块230,用于采用通道融合和空间融合对多个特征图进行特征融合,得到第一特征。
第二特征提取模块240,用于基于注意力机制对多个特征图进行特征提取,得到第二特征。
融合模块250,用于对第一特征和第二特征进行融合,得到第三特征;
分类模块260,用于将第三特征输入基于梯度增强的逻辑回归分类器,输出空间信息表征的空间的环境污染等级。
需要说明的是,装置实施例部分的具体实施细节及带来的技术效果与方法实施例不等对应,此处不再赘述。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种环境污染等级确定方法,其特征在于,包括:
对地面的空间信息进行探测和测量来获取地面遥感图像;
对所述遥感图像进行卷积运算,得到多个特征图;
采用通道融合和空间融合对所述多个特征图进行特征融合,得到第一特征,包括:采用通道融合对所述多个特征图进行特征融合,得到通道特征图;采用空间融合对所述多个特征图进行特征融合,得到空间特征图;基于自注意力机制,根据所述通道特征图和所述空间特征图计算自注意力权重;基于所述自注意力权重对所述通道特征图和所述多个特征图进行加权平均,得到加权特征图;根据所述加权特征图确定所述第一特征;
基于注意力机制对所述多个特征图进行特征提取,得到第二特征,包括:计算不同所述特征图的通道注意力权重和空间注意力权重;基于所述通道注意力权重和空间注意力权重对所述多个特征图进行加权融合,得到注意力增强特征图;采用不同大小的卷积核对注意力增强特征图进行卷积操作,得到不同尺度的特征图;对所述不同尺度的特征图进行拼接,得到所述第二特征;
对所述第一特征和所述第二特征进行融合,得到第三特征;
将所述第三特征输入基于梯度增强的逻辑回归分类器,输出所述空间信息表征的空间的环境污染等级。
2.根据权利要求1所述的环境污染等级确定方法,其特征在于,对所述加权特征图依次进行非线性激活、下采样、批量归一化及动态感知采样,得到所述第一特征。
3.根据权利要求2所述的环境污染等级确定方法,其特征在于,所述动态感知采样的位置和大小根据目标物体的大小和位置的动态变化而不断调整。
4.根据权利要求1所述的环境污染等级确定方法,其特征在于,所述基于自注意力机制,根据所述通道特征图和所述空间特征图计算自注意力权重包括:
根据所述通道特征图在位置为(i,j)处第k个特征图的值和所述空间特征图在位置为(i,j)处第k个特征图的值,计算位置(i,j)对于第k个通道的自注意力权重。
5.根据权利要求1所述的环境污染等级确定方法,其特征在于,在所述采用通道融合和空间融合对所述多个特征图进行特征融合以及所述基于注意力机制对所述多个特征图进行特征提取的过程中,采用像素级的标签。
6.根据权利要求5所述的环境污染等级确定方法,其特征在于,采用自监督学习技术对所述像素级的标签进行训练。
7.根据权利要求1所述的环境污染等级确定方法,其特征在于,采用最小化逻辑回归损失函数来学习所述基于梯度增强的逻辑回归分类器的模型参数。
8.一种环境污染等级确定装置,其特征在于,包括:
获取模块,用于对地面的空间信息进行探测和测量来获取地面遥感图像;
卷积模块,用于对所述遥感图像进行卷积运算,得到多个特征图;
第一特征提取模块,用于采用通道融合和空间融合对所述多个特征图进行特征融合,得到第一特征,包括:采用通道融合对所述多个特征图进行特征融合,得到通道特征图;采用空间融合对所述多个特征图进行特征融合,得到空间特征图;基于自注意力机制,根据所述通道特征图和所述空间特征图计算自注意力权重;基于所述自注意力权重对所述通道特征图和所述多个特征图进行加权平均,得到加权特征图;根据所述加权特征图确定所述第一特征;
第一特征提取模块,用于基于注意力机制对所述多个特征图进行特征提取,得到第二特征,包括:计算不同所述特征图的通道注意力权重和空间注意力权重;基于所述通道注意力权重和空间注意力权重对所述多个特征图进行加权融合,得到注意力增强特征图;采用不同大小的卷积核对注意力增强特征图进行卷积操作,得到不同尺度的特征图;对所述不同尺度的特征图进行拼接,得到所述第二特征;
融合模块,用于对所述第一特征和所述第二特征进行融合,得到第三特征;
分类模块,用于将所述第三特征输入基于梯度增强的逻辑回归分类器,输出所述空间信息表征的空间的环境污染等级。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310720962.3A CN116452820B (zh) | 2023-06-19 | 2023-06-19 | 环境污染等级确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310720962.3A CN116452820B (zh) | 2023-06-19 | 2023-06-19 | 环境污染等级确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116452820A CN116452820A (zh) | 2023-07-18 |
CN116452820B true CN116452820B (zh) | 2023-09-05 |
Family
ID=87130617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310720962.3A Active CN116452820B (zh) | 2023-06-19 | 2023-06-19 | 环境污染等级确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116452820B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105388826A (zh) * | 2015-12-11 | 2016-03-09 | 中国环境科学研究院 | 一种混合型稀土矿区水环境质量监控预警系统的建立方法 |
KR20210075751A (ko) * | 2019-12-13 | 2021-06-23 | (주)올포랜드 | 센싱 데이터 기반 도시상태 시각화 방법 |
WO2022073452A1 (zh) * | 2020-10-07 | 2022-04-14 | 武汉大学 | 一种基于自注意力上下文网络的高光谱遥感图像分类方法 |
CN114943900A (zh) * | 2022-05-13 | 2022-08-26 | 南方海洋科学与工程广东省实验室(广州) | 基于深度学习的海洋环境质量等级评价方法、装置及介质 |
CN115497005A (zh) * | 2022-09-05 | 2022-12-20 | 重庆邮电大学 | 一种融合特征转移与注意力机制的yolov4遥感目标检测方法 |
-
2023
- 2023-06-19 CN CN202310720962.3A patent/CN116452820B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105388826A (zh) * | 2015-12-11 | 2016-03-09 | 中国环境科学研究院 | 一种混合型稀土矿区水环境质量监控预警系统的建立方法 |
KR20210075751A (ko) * | 2019-12-13 | 2021-06-23 | (주)올포랜드 | 센싱 데이터 기반 도시상태 시각화 방법 |
WO2022073452A1 (zh) * | 2020-10-07 | 2022-04-14 | 武汉大学 | 一种基于自注意力上下文网络的高光谱遥感图像分类方法 |
CN114943900A (zh) * | 2022-05-13 | 2022-08-26 | 南方海洋科学与工程广东省实验室(广州) | 基于深度学习的海洋环境质量等级评价方法、装置及介质 |
CN115497005A (zh) * | 2022-09-05 | 2022-12-20 | 重庆邮电大学 | 一种融合特征转移与注意力机制的yolov4遥感目标检测方法 |
Non-Patent Citations (1)
Title |
---|
基于无线传感器网络的城市大气环境污染遥感监测研究;刘晓燕 等;《环境科学与管理》;第46卷(第12期);第133-137页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116452820A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A multi-scale cucumber disease detection method in natural scenes based on YOLOv5 | |
CN107491734B (zh) | 基于多核融合与空间Wishart LapSVM的半监督极化SAR图像分类方法 | |
CN106295124A (zh) | 利用多种图像检测技术综合分析基因子图相似概率量的方法 | |
CN111598167B (zh) | 基于图学习的小样本图像识别方法及系统 | |
CN113344045B (zh) | 一种结合hog特征提高sar船只分类精度的方法 | |
CN112598031A (zh) | 一种蔬菜病害检测方法及系统 | |
CN112270285B (zh) | 一种基于稀疏表示和胶囊网络的sar图像变化检测方法 | |
CN112633257A (zh) | 基于改良卷积神经网络的马铃薯病害识别方法 | |
CN111639697B (zh) | 基于非重复采样与原型网络的高光谱图像分类方法 | |
CN114926693A (zh) | 基于加权距离的sar图像小样本识别方法及装置 | |
CN114842238A (zh) | 一种嵌入式乳腺超声影像的识别方法 | |
Liu et al. | A novel deep framework for change detection of multi-source heterogeneous images | |
Narmatha et al. | Skin cancer detection from dermoscopic images using Deep Siamese domain adaptation convolutional Neural Network optimized with Honey Badger Algorithm | |
Liu et al. | Research on cassava disease classification using the multi-scale fusion model based on EfficientNet and attention mechanism | |
Cao et al. | Universal high spatial resolution hyperspectral imaging using hybrid-resolution image fusion | |
CN107292268A (zh) | 快速脊波反卷积结构学习模型的sar图像语义分割方法 | |
Padhy et al. | Image classification in artificial neural network using fractal dimension | |
CN116863341B (zh) | 基于时间序列卫星遥感影像的作物分类和识别方法和系统 | |
CN108960005B (zh) | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 | |
CN113239895A (zh) | 基于注意力机制的胶囊网络的sar图像变化检测方法 | |
CN112465821A (zh) | 一种基于边界关键点感知的多尺度害虫图像检测方法 | |
CN110222793B (zh) | 基于多视角主动学习的在线半监督分类方法及系统 | |
Dey et al. | A robust FLIR target detection employing an auto-convergent pulse coupled neural network | |
CN116452820B (zh) | 环境污染等级确定方法及装置 | |
CN116563603A (zh) | 基于全局-局部能量协同表征的小样本开集识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |