CN117079077A - 一种适用于电力图像样本预处理的方法及系统 - Google Patents
一种适用于电力图像样本预处理的方法及系统 Download PDFInfo
- Publication number
- CN117079077A CN117079077A CN202311101324.XA CN202311101324A CN117079077A CN 117079077 A CN117079077 A CN 117079077A CN 202311101324 A CN202311101324 A CN 202311101324A CN 117079077 A CN117079077 A CN 117079077A
- Authority
- CN
- China
- Prior art keywords
- image
- pairs
- feature
- loss function
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000007781 pre-processing Methods 0.000 title claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 40
- 230000011218 segmentation Effects 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000013434 data augmentation Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 42
- 238000004590 computer program Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 230000003416 augmentation Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 abstract description 12
- 238000004891 communication Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种适用于电力图像样本预处理的方法及系统包括,获取若干张带标注的电力场景图像,通过颜色增强对图像进行数据增广;把图像分为原始图像、颜色增强后的图像和随机图像,创建图像对;并将图像对送入特征提取网络中进行提取,得到图像特征对;将图像特征对作为投影头的输入,投影到另一个空间获得图像的高阶表示;通过图像的高阶表示,计算得到像素级的对比损失函数;遍历所有的图像对,利用对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型;本发明通过微调预训练模型不仅解决了电力场景下图像分割数据集规模小的问题,还能加快训练速度,并且相比于在单一图像分割数据集训练能获得更好的性能。
Description
技术领域
本发明涉及视觉处理技术领域,尤其涉及一种适用于电力图像样本预处理的方法及系统。
背景技术
在电力场景下的图像分割任务中,已经有许多基于深度学习的方法通过使用大量的像素级标注来提高其模型性能。然而,收集大量标注是非常困难的,因此一些现有的工作在大型数据集上进行预训练,从而在进行图像分割任务时,避免了从头构建模型,通过直接使用预训练模型节约了大量的时间资源和计算资源。
目前,主流的图像分割的预训练技术大部分都是有监督学习方法,这类方法依赖人工标注的电力场景标签,其标注成本高,且数据本身提供的信息比稀疏的标签更丰富,使用有监督学习方法预训练模型不能包含全面的数据特征。因此,鉴于上述问题,提出了基于对比学习的预训练策略。
其中,对比学习是一种自监督学习方法,在标签有限情况下,能同时使用标记数据和未标记的数据,通过对比度损失对模型的特征提取器进行预训练,然后对整个网络进行微调。因此,将简单有效的基于对比学习的预训练策略应用于电力场景下的图像分割任务具有较大的性能增益,在标记数据有限的情况下也能高效的训练网络,提升图像分割模型的性能。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。因此,本发明提供了一种适用于电力图像样本预处理的方法,用来解决实际问题中,电力场景标签的标注成本高和使用已有监督学习方法的预训练模型不能包含全面的数据特征的问题。
为解决上述技术问题,本发明提供如下技术方案:一种适用于电力图像样本预处理的方法,包括:
获取若干张带标注的电力场景图像,通过颜色增强操作对所述图像进行数据增广;
把所述图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将所述图像对送入特征提取网络中进行提取,得到图像特征对;
将所述图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过所述图像的高阶表示,计算得到像素级的对比损失函数;
遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型。
作为本发明所述的适用于电力图像样本预处理的方法的一种优选方案,其中:所述通过颜色增强操作对所述图像进行数据增广,包括:对图像进行图像亮度变换、饱和度变换和对比度变换。
作为本发明所述的适用于电力图像样本预处理的方法的一种优选方案,其中:把所述图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对,包括:
每一个图像对中都包含,一张原始图像和一张原始图像经过颜色增强操作后的图像以及一张随机的额外图像;
其中,一对图像对可表示为I表示原始图像,/>表示颜色增强的图像,J表示一张随机图像。
作为本发明所述的适用于电力图像样本预处理的方法的一种优选方案,其中:将所述图像对送入特征提取网络中进行提取,得到图像特征对,包括:
所述特征提取网络可以为任意特征提取器,图像对通过特征提取网络获得图像的特征对
其中,特征提取器表示为f(·)。
作为本发明所述的适用于电力图像样本预处理的方法的一种优选方案,其中:将所述图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示,包括:
所述投影头由全连接层g(·)构成,图像特征对经全连接层的映射得到图像的高阶表示对
作为本发明所述的适用于电力图像样本预处理的方法的一种优选方案,其中:通过所述图像的高阶表示,计算得到像素级的对比损失函数,包括:所述像素级的对比损失函数由图像内的对比损失函数和跨图像的对比损失函数组成。
作为本发明所述的适用于电力图像样本预处理的方法的一种优选方案,其中:遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型,包括:
图像内的对比损失函数Lwithin以原始图像及增强操作过后图像内具有相同标签的像素为正对,具有不同标签的像素为负对;在特征空间中拉进正对间的距离,推远负对间的距离;
跨图像的对比损失函数Lcross以原始图像及额外图像内具有相同标签的像素为正像素对;
由于正像素对来自于完全不同的图像,将其定义为有挑战的正像素对;同时,不使用原始图像和额外图像内具有不同标签的像素构成的负像素对;
得到对比预训练的像素级的对比损失函数,表达式为:
Loss=(Lwithin+Lcross)
将预训练模型中的投影头部分替换成实际需要的分割模型,构成完整语义分割网络;同时,在对应的语义分割数据集上,利用预训练好的特征提取器对图像进行特征提取,利用分割模型对图像进行分割预测,使用像素级的交叉熵作为损失函数对语义分割网络进行微调,得到数据集的分割模型。
一种适用于电力图像样本预处理的系统,包括:
图像输入模块,获取若干张带标注的电力场景图像,通过颜色增强操作对所述图像进行数据增广;
图像创建与提取模块,把图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将图像对送入特征提取网络中进行提取,得到图像特征对;
图像处理模块,将图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过图像的高阶表示,计算得到像素级的对比损失函数;
模型生成模块,遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述处理器执行所述计算机程序时实现上述方法的任一步骤。
一种计算机可读存储介质,其上存储有计算机程序,其中:所述计算机程序被处理器执行时实现上述方法的任一步骤。
与现有技术相比,发明有益效果为:本发明获取若干张带标注的电力场景图像,通过颜色增强操作对图像进行数据增广;把图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将图像对送入特征提取网络中进行提取,得到图像特征对;将图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过图像的高阶表示,计算得到像素级的对比损失函数;遍历所有的图像对,利用对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型;本发明通过微调预训练模型不仅解决了电力场景下图像分割数据集规模小的问题,还能加快训练速度,并且相比于在单一图像分割数据集训练能获得更好的性能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例所述的适用于电力图像样本预处理的方法的总体流程图;
图2为本发明一个实施例所述的适用于电力图像样本预处理的方法最终的图像分割模型的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明第一个实施例,该实施例提供了一种适用于电力图像样本预处理的方法,包括:
S1、获取若干张带标注的电力场景图像,通过颜色增强操作对图像进行数据增广;
进一步的,颜色增强操作包括,对图像进行图像亮度变换、饱和度变换和对比度变换;
S2、把图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将图像对送入特征提取网络中进行提取,得到图像特征对;
进一步的,每一个图像对中都包含,一张原始图像和一张原始图像经过颜色增强操作后的图像以及一张随机的额外图像;
其中,一对图像对可表示为I表示原始图像,/>表示颜色增强的图像,J表示一张随机图像;
更进一步的,特征提取网络可以为任意特征提取器,图像对通过特征提取网络获得图像的特征对
其中,特征提取器表示为f(·);
S3、将图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过图像的高阶表示,计算得到像素级的对比损失函数;
进一步的,投影头由全连接层g(·)构成,图像特征对经全连接层的映射得到图像的高阶表示对
应当说明的是,获得得到图像的高阶表示对的操作公式,表示为:
zI=g(hI)
zJ=g(hJ)
更进一步的,像素级的对比损失函数由图像内的对比损失函数和跨图像的对比损失函数组成;
S4、遍历所有的图像对,利用对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型;
进一步的,图像内的对比损失函数Lwithin以原始图像及增强操作过后图像内具有相同标签的像素为正对,具有不同标签的像素为负对;在特征空间中拉进正对间的距离,推远负对间的距离;具体操作定义公式为:
其中,表示图像A中像素点p的高阶特征值,/>表示图像A中像素点p的标签;
更进一步的,图像内的对比损失函数表示为:
其中,NI为图像I的像素个数,为图像/>中标签为/>的像素个数;
应当说明的是,在特征空间中拉进正对间的距离,推远负对间的距离操作使得特征提取网络可以更准确地提取图像特征;
进一步的,跨图像的对比损失函数Lcross以原始图像及额外图像内具有相同标签的像素为正像素对;
由于正像素对来自于完全不同的图像,将其定义为有挑战的正像素对;同时,不使用原始图像和额外图像内具有不同标签的像素构成的负像素对;
更进一步的,跨图像的对比损失函数表示为:
得到对比预训练的像素级的对比损失函数,表达式为:
Loss=(Lwithin+Lcross)
进一步的,本实施例还提供一种适用于电力图像样本预处理的系统,包括:
图像输入模块,获取若干张带标注的电力场景图像,通过颜色增强操作对所述图像进行数据增广;
图像创建与提取模块,把图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将图像对送入特征提取网络中进行提取,得到图像特征对;
图像处理模块,将图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过图像的高阶表示,计算得到像素级的对比损失函数;
模型生成模块,遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型。
本实施例还提供一种计算机设备,适用于适用于电力图像样本预处理的方法的情况,包括:
存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的适用于电力图像样本预处理的方法。
该计算机设备可以是终端,该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的适用于电力图像样本预处理的方法。
本实施例提出的存储介质与上述实施例提出的数据存储方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
实施例2
参照图2,为本发明第二个实施例,该实施例提供了一种适用于电力图像样本预处理的方法,包括:
利用本发明方法得到的预训练模型,其中预训练模型中的带标注的电力场景图像为100张;
通过明确具体的电力场景图像的分割任务后,将预训练模型中的投影头部分替换成实际需要的分割模型,构成完整语义分割网络;
同时,在对应的语义分割数据集上,利用预训练好的特征提取器对图像进行特征提取,利用分割模型对图像进行分割预测,使用像素级的交叉熵作为损失函数对语义分割网络进行微调,得到数据集的分割模型;
其中,像素级的交叉熵表示为:
其中,N为参与微调的图像样本总数,为符号函数;如果图像中i的像素q的真实类别等于预测类别c则取1,否则取0;/>图像中i的像素q属于类别c的预测概率;
综上,本发明所提出的利用预训练模型进行微调的方法,可以运用于规模较小的数据集,同时可以极大地减少训练时间并且相比于在单一图像分割数据集训练能获得更好的性能。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种适用于电力图像样本预处理的方法,其特征在于,包括:
获取若干张带标注的电力场景图像,通过颜色增强操作对所述图像进行数据增广;
把所述图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将所述图像对送入特征提取网络中进行提取,得到图像特征对;
将所述图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过所述图像的高阶表示,计算得到像素级的对比损失函数;
遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型。
2.如权利要求1所述的适用于电力图像样本预处理的方法,其特征在于,所述通过颜色增强操作对所述图像进行数据增广,包括:对图像进行图像亮度变换、饱和度变换和对比度变换。
3.如权利要求2所述的适用于电力图像样本预处理的方法,其特征在于,把所述图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对,包括:
每一个图像对中都包含,一张原始图像和一张原始图像经过颜色增强操作后的图像以及一张随机的额外图像;
其中,一对图像对可表示为I表示原始图像,/>表示颜色增强的图像,J表示一张随机图像。
4.如权利要求2或3所述的适用于电力图像样本预处理的方法,其特征在于,将所述图像对送入特征提取网络中进行提取,得到图像特征对,包括:
所述特征提取网络可以为任意特征提取器,图像对通过特征提取网络获得图像的特征对
其中,特征提取器表示为f(·)。
5.如权利要求4所述的适用于电力图像样本预处理的方法,其特征在于,将所述图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示,包括:
所述投影头由全连接层g(·)构成,图像特征对经全连接层的映射得到图像的高阶表示对
6.如权利要求5所述的适用于电力图像样本预处理的方法,其特征在于,通过所述图像的高阶表示,计算得到像素级的对比损失函数,包括:所述像素级的对比损失函数由图像内的对比损失函数和跨图像的对比损失函数组成。
7.如权利要求3~6任一所述的适用于电力图像样本预处理的方法,其特征在于,遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型,包括:
图像内的对比损失函数Lwithin以原始图像及增强操作过后图像内具有相同标签的像素为正对,具有不同标签的像素为负对;在特征空间中拉进正对间的距离,推远负对间的距离;
跨图像的对比损失函数Lcross以原始图像及额外图像内具有相同标签的像素为正像素对;
由于正像素对来自于完全不同的图像,将其定义为有挑战的正像素对;同时,不使用原始图像和额外图像内具有不同标签的像素构成的负像素对;
得到对比预训练的像素级的对比损失函数,表达式为:
Loss=(Lwithin+Lcross)
将预训练模型中的投影头部分替换成实际需要的分割模型,构成完整语义分割网络;同时,在对应的语义分割数据集上,利用预训练好的特征提取器对图像进行特征提取,利用分割模型对图像进行分割预测,使用像素级的交叉熵作为损失函数对语义分割网络进行微调,得到数据集的分割模型。
8.一种适用于电力图像样本预处理的系统,包括:
图像输入模块,获取若干张带标注的电力场景图像,通过颜色增强操作对所述图像进行数据增广;
图像创建与提取模块,把图像分为原始图像、颜色增强操作后的图像和随机图像,创建图像对;并将图像对送入特征提取网络中进行提取,得到图像特征对;
图像处理模块,将图像特征对作为投影头的输入,同时投影到另一个空间获得图像的高阶表示;通过图像的高阶表示,计算得到像素级的对比损失函数;
模型生成模块,遍历所有的图像对,利用所述对比损失函数对特征提取网络进行参数更新,得到适用于电力场景语义分割的预训练模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311101324.XA CN117079077A (zh) | 2023-08-30 | 2023-08-30 | 一种适用于电力图像样本预处理的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311101324.XA CN117079077A (zh) | 2023-08-30 | 2023-08-30 | 一种适用于电力图像样本预处理的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117079077A true CN117079077A (zh) | 2023-11-17 |
Family
ID=88711400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311101324.XA Pending CN117079077A (zh) | 2023-08-30 | 2023-08-30 | 一种适用于电力图像样本预处理的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117079077A (zh) |
-
2023
- 2023-08-30 CN CN202311101324.XA patent/CN117079077A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10970830B2 (en) | Image style conversion method, apparatus and device | |
US11537873B2 (en) | Processing method and system for convolutional neural network, and storage medium | |
CN107239801B (zh) | 视频属性表示学习方法及视频文字描述自动生成方法 | |
JP2021502644A (ja) | 画像処理方法、処理装置及び処理デバイス | |
EP3998583A2 (en) | Method and apparatus of training cycle generative networks model, and method and apparatus of building character library | |
US11641446B2 (en) | Method for video frame interpolation, and electronic device | |
US20130027419A1 (en) | Image processing device and method | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
CN108898092A (zh) | 基于全卷积神经网络的多光谱遥感影像路网提取方法 | |
CN116229056A (zh) | 基于双分支特征融合的语义分割方法、装置、设备 | |
CN111275034A (zh) | 从图像中提取文本区域的方法、装置、设备和存储介质 | |
CN112163577A (zh) | 游戏画面中的文字识别方法、装置、电子设备和存储介质 | |
CN114511041A (zh) | 模型训练方法、图像处理方法、装置、设备和存储介质 | |
CN114092759A (zh) | 图像识别模型的训练方法、装置、电子设备及存储介质 | |
CN113989556A (zh) | 一种小样本医学影像分类方法和系统 | |
CN112037239A (zh) | 基于多层次显式关系选择的文本指导图像分割方法 | |
US20210374490A1 (en) | Method and apparatus of processing image, device and medium | |
CN111144407A (zh) | 一种目标检测方法、系统、装置及可读存储介质 | |
CN117746125A (zh) | 图像处理模型的训练方法、装置及电子设备 | |
CN117079077A (zh) | 一种适用于电力图像样本预处理的方法及系统 | |
CN116363429A (zh) | 图像识别模型的训练方法、图像识别方法、装置及设备 | |
CN116777732A (zh) | 基于随机噪声的图像生成方法、装置、设备及存储介质 | |
CN113038184B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113610016B (zh) | 视频帧特征提取模型的训练方法、系统、设备及存储介质 | |
CN112560848B (zh) | 兴趣点poi预训练模型的训练方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |