CN116993989A - 一种弱监督分割网络区域扩张参数自适应生成方法和系统 - Google Patents
一种弱监督分割网络区域扩张参数自适应生成方法和系统 Download PDFInfo
- Publication number
- CN116993989A CN116993989A CN202311248452.7A CN202311248452A CN116993989A CN 116993989 A CN116993989 A CN 116993989A CN 202311248452 A CN202311248452 A CN 202311248452A CN 116993989 A CN116993989 A CN 116993989A
- Authority
- CN
- China
- Prior art keywords
- image
- adaptive
- classification score
- image set
- supervised
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000003044 adaptive effect Effects 0.000 claims abstract description 33
- 238000011176 pooling Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000010606 normalization Methods 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 238000002372 labelling Methods 0.000 claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims description 31
- 230000004913 activation Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 10
- 238000003709 image segmentation Methods 0.000 description 6
- 239000012212 insulator Substances 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
一种弱监督分割网络区域扩张参数自适应生成方法和系统。该方法包括,获取待分割的图像集,对图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注;将训练图像集中的每个图像输入SECNet的区域扩张分支,得到原始像素级分类分数,同时将每个图像输入全局自适应池化层,输出与每个图像对应的动态权重,并对动态权重进行归一化处理;根据原始像素级分类分数与归一化处理后的动态权重,生成自适应图像级分类分数。本发明的方案在网络训练过程中动态学习权重参数,避免了通过人工对参数进行调整,增强了模型自适应性。
Description
技术领域
本发明属于深度学习领域,特别涉及一种弱监督分割网络区域扩张参数自适应生成方法和系统。
背景技术
是弱监督图像分割的代表性算法,通过种子选取、区域扩张与扩张抑制三个原则构建。基于CAM的种子选取部分是将图像的类标签通过CAM生成的热力图根据置信度转换为像素级伪标签,然后用于后续的分割网络的训练。而语义分割主干网络通过所得到的伪标签进行训练,预测图片中物体的轮廓。/>的损失函数是联合损失函数,综合考虑生成的种子线索,扩张损失和限制损失。基于种子线索的弱监督分割模型如图1所示。
中区域扩张分支的作用就是为了恢复和扩张种子线索中缺失的目标位置,为了充分利用种子线索的信息,区域扩张分支使用一个图像级的分割损失来进行训练。对于弱监督图像语义分割来说,如何将像素级的预测分类分数转换成图像级的分类分数是一个比较重要的问题,目前常用的方式为全局最大池化和全局平均池化。/>在扩张分支中定义了全局加权池化(Global Weighted Ranking Pooling,/>)的方式,/>算法流程如下:
假设输入图像的像素点集合,根据激活值大小进行排序,满足,选取权重参数/>,其中/>,则利用/>方法可以得到类别概率为/>,计算方法如下所示:
其中,表示对第c类的激活值,/>。当选取/>,此时等价于全局平均池化,当选取/>,此时/>等价于全局最大池化。
中针对权重参数/>需要根据不同的类进行设定,需要综合考虑目标区域的尺寸、边缘和形状等先验信息,需要针对不同的权重参数/>进行实验,然后选取最合适的取值。/>最终的扩张损失函数如下式所示:
第一项表示出现在图像中的对象类别,第二项表示没有出现在图像中的对象类别,第三项表示背景区域。T为分类类别的一个子集,表示当前处理该图片所包含的类别集合。为该图像中出现过的所有类别的权重值,/>为未在该图像中出现过的类别的权重值。/>为背景类别的权重值。/>为除背景之外的所有分类的集合。
全局池化的方式本质上是将图像像素级的分类分数转换为图像级的分类分数。通过使用/>确实可以提升弱监督图像分割的结果。然而/>的缺点在于,多个参数需要具体针对数据集进行大量的实验,需要人工手动进行调整,不能自适应地针对数据集中的不同数据进行动态生成,对不同数据集的适应性较弱。
发明内容
为了解决现有技术中存在的不足,本发明提供了一种弱监督分割网络区域扩张参数自适应生成方法和系统,以解决自适应地针对数据集中的不同数据动态生成全局池化方法的扩张参数的问题。
为解决上述技术问题,本发明采用如下的技术方案。
本发明首先公开了一种弱监督分割网络区域扩张参数自适应生成方法,该方法包括以下步骤:
步骤S1:获取待分割的图像集,对所述图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注;
步骤S2:将所述训练图像集中的每个图像输入的区域扩张分支,得到原始像素级分类分数,同时将所述每个图像输入全局自适应池化层,输出与每个图像对应的动态权重,并对所述动态权重进行归一化处理;
步骤S3:根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数。
本发明进一步采用以下优选方案:
所述步骤S1中,对所述图像集的所有图像进行预处理,进一步包括:
将图像尺度进行归一化,并对归一化后的图像进行图像去噪、图像增强操作。
所述区域扩张分支和所述全局自适应池化层均连接到语义分割分支中的图像特征末端。
所述步骤S2中,对所述动态权重进行归一化处理,进一步包括:
利用激活函数对每个通道上的权重值进行映射,然后通过/>函数将激活函数映射后的权重值转换为[0,1]范围的值,以使每个类别通道中所有的像素的权重累加和为1。
所述步骤S3中,根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数,进一步包括:
将所述原始像素级分类分数与所述动态权重进行逐像素相乘并求和,得到所述自适应图像级分类分数。
本发明同时公开了一种利用前述弱监督分割网络区域扩张参数自适应生成方法的弱监督分割网络区域扩张参数自适应生成系统,包括图像预处理模块、分类分数和权重计算模块和自适应参数生成模块;
所述图像预处理模块,用于获取待分割的图像集,对所述图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注;
所述分类分数和权重计算模块,用于将所述训练图像集中的每个图像输入SECNet的区域扩张分支,得到原始像素级分类分数,同时将所述每个图像输入全局自适应池化层,输出与每个图像对应的动态权重,并对所述动态权重进行归一化处理;
所述自适应参数生成模块,用于根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数。
相应地,本申请还公开了一种终端,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据前述弱监督分割网络区域扩张参数自适应生成方法的步骤。
相应地,本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述弱监督分割网络区域扩张参数自适应生成方法的步骤。
本发明的有益效果在于,与现有技术相比,本发明提供了一种弱监督分割网络区域扩张参数自适应生成方法和系统,通过上述全局自适应池化运算,不同图像可以根据其对应的尺寸大小、边缘形状等信息动态生成对应的权重信息,不再需要手工进行调节设置权重参数,提高了模型对不同数据集的适应性。
附图说明
图1 是现有技术中的SECNet弱监督语义分割网络结构示意图。
图2是本发明中的弱监督分割网络区域扩张参数自适应生成方法的流程图。
图3是本发明中的自适应动态参数生成网络结构示意图。
图4是本发明的图像分割模型与传统模型在分割结果图像与标签图像上的对比效果图。
图5是本发明中的弱监督分割网络区域扩张参数自适应生成系统的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。
本申请所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有作出创造性劳动前提下所获得的有所其它实施例,都属于本发明的保护范围。
针对现有技术的不足,本发明提出了一种弱监督分割网络区域扩张参数自适应生成方法和系统,采用全局自适应池化(Global Self-adaptive Pooling,)的方案,可以在网络训练过程中动态学习权重参数,从而解决/>全局池化方法中参数手工设定的问题。
参见图1所示,本发明公开的弱监督分割网络区域扩张参数自适应生成方法,包括以下步骤:
步骤S1:获取待分割的图像集,对所述图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注。
以绝缘子数据集为例,在一个具体实施例中,所使用的数据来自于工业绝缘子数据集,包含了100张有绝缘子的图片以及100张无绝缘子的图片,以图像级分类标签通过基于以下参数自适应方案改进的SECNet弱监督图像分割网络得到像素级的分割结果。
作为本发明的优选实施例,可以通过将图像尺度归一化为分辨率512×512、并依次进行图像去噪、图像增强等预处理。在上述绝缘子数据集中,训练集可以包括180张图片,用于网络的训练,测试集可以包括20张图片,用于测试网络训练的效果。
步骤S2:将所述训练图像集中的每个图像输入的区域扩张结构中的语义分割分支,得到像素级分类分数。/>语义分割分支中的图像特征末端引出两个分支,其中一个与/>语义分割分支保持相同的结构,另一个分支为动态权重分支,针对图像特征中的每一个像素预测其对应的权重,并对所述动态权重进行归一化处理。
如图3所示,保持的语义分割分支/>不变。在原有/>的区域扩张结构中的特征卷积层的末端引入动态权重分支/>,得到自适应动态参数生成网络。
假设前景类别共有类,语义分割分支/>通过使用1 × 1的卷积层得到含有(背景类)个通道的像素级分类分数。动态权重分支/>也通过1 × 1的卷积层,得到含有/>(背景类)个通道的权重值。
针对上述归一化处理,在具体的实施例中,可以利用激活函数对每个通道上的权重值进行映射,然后通过/>函数将激活函数映射后的权重值转换为[0,1]范围的值,以使每个类别通道中所有的像素的权重累加和为1。
步骤S3:根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数。
利用动态权重分支得到的权重,对区域扩张分支/>得到的像素级的分类分数进行加权求和,即可得到最终图像级的预测分数,用于扩张损失函数的计算。
可以看出,与现有技术相比,本发明提供了一种弱监督分割网络区域扩张参数自适应生成方法和系统,通过上述全局自适应池化运算,不同图像可以根据其对应的尺寸大小、边缘形状等信息动态生成对应的权重信息,不再需要手工进行调节设置权重参数,提高了模型对不同数据集的适应性。
如下表1是本发明的改进模型(GSP)与SECNet基础模型以及全监督分割模型(U-Net)之间分割指标的对比结果。为了更加直观地展示自适应生成权重参数和传统人工指定权重参数分割性能的对比,本发明进行了多组对比实验,分别为基于原始的、增加了自适应参数机制的/>以及全监督模型(U-Net)下的实验结果。其中Sup代表方法分类,即全监督或者无监督方法。mIOU为平均交并比,表示分割的真实值与预测值两个集合的交集与两个集合的并集之比。Dice为分割的真实值与预测值两个集合的交集与两个集合的和之比。
图4是本发明的图像分割模型与传统模型在分割结果图像与标签图像上的对比效果图。(a)列表示待分割的绝缘子图片,(b)列为原始的无监督分割结果。(c)列为增加了自适应参数生成方法的无监督结果。(d)列为全监督分割方法U-Net的分割结果。(e)列为粗略人工标记的分割结果。从图4中的(b)(c)列对比可以发现,当模型采用本发明的自适应生成参数的方法GSP时,模型会根据目标图像的尺寸、边缘信息等动态学习权重参数,不需要手工设置参数,此时模型分割图像的mIoU为0.6129,如表1所示,得到的分割结果和手工标注的结果重合度较高,图像分割的精度较高,增强了弱监督模型分割性能。
表1
本发明可以是系统、方法和/或计算机程序产品。参见图5,本发明同时公开了一种基于前述的弱监督分割网络区域扩张参数自适应生成方法的弱监督分割网络区域扩张参数自适应生成系统,包括图像预处理模块1、分类分数和权重计算模块2和自适应参数生成模块3。
所述图像预处理模块1,用于获取待分割的图像集,对所述图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注;
所述分类分数和权重计算模块2,用于将所述训练图像集中的每个图像输入SECNet的区域扩张分支,得到原始像素级分类分数,同时将所述每个图像输入全局自适应池化层,输出与每个图像对应的动态权重,并对所述动态权重进行归一化处理;
所述自适应参数生成模块3,用于根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数。
基于本发明的精神,本领域技术人员能够容易想到基于前述弱监督分割网络区域扩张参数自适应生成方法可以得到一种计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。即本申请还包括一种终端,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据前述弱监督分割网络区域扩张参数自适应生成方法的步骤。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是-但不限于-电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++等,以及常规的过程式编程语言-诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (12)
1.一种弱监督分割网络区域扩张参数自适应生成方法,其特征在于,包括以下步骤:
步骤S1:获取待分割的图像集,对所述图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注;
步骤S2:将所述训练图像集中的每个图像输入 的区域扩张分支,得到原始像素级分类分数,同时将所述每个图像输入全局自适应池化层,输出与每个图像对应的动态权重,并对所述动态权重进行归一化处理;
步骤S3:根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数。
2.根据权利要求1所述的弱监督分割网络区域扩张参数自适应生成方法,其特征在于,所述步骤S1中,对所述图像集的所有图像进行预处理,进一步包括:
将图像尺度进行归一化,并对归一化后的图像进行图像去噪、图像增强操作。
3.根据权利要求2所述的弱监督分割网络区域扩张参数自适应生成方法,其特征在于:
所述区域扩张分支和所述全局自适应池化层均连接到语义分割分支中的图像特征末端。
4.根据权利要求3所述的弱监督分割网络区域扩张参数自适应生成方法,其特征在于,所述步骤S2中,对所述动态权重进行归一化处理,进一步包括:
利用激活函数对每个通道上的权重值进行映射,然后通过/>函数将激活函数映射后的权重值转换为[0,1]范围的值,以使每个类别通道中所有的像素的权重累加和为1。
5.根据权利要求4所述的弱监督分割网络区域扩张参数自适应生成方法,其特征在于,所述步骤S3中,根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数,进一步包括:
将所述原始像素级分类分数与所述动态权重进行逐像素相乘并求和,得到所述自适应图像级分类分数。
6.一种利用权利要求1-5任一项权利要求所述的弱监督分割网络区域扩张参数自适应生成方法的弱监督分割网络区域扩张参数自适应生成系统,包括图像预处理模块、分类分数和权重计算模块和自适应参数生成模块;
所述图像预处理模块,用于获取待分割的图像集,对所述图像集的所有图像进行预处理,并按照预设比例将预处理后的工业图像集划分为训练图像集和测试图像集,并对每个图像的类别标签进行标注;
所述分类分数和权重计算模块,用于将所述训练图像集中的每个图像输入SECNet的区域扩张分支,得到原始像素级分类分数,同时将所述每个图像输入全局自适应池化层,输出与每个图像对应的动态权重,并对所述动态权重进行归一化处理;
所述自适应参数生成模块,用于根据所述原始像素级分类分数与归一化处理后的所述动态权重,生成自适应图像级分类分数。
7.根据权利要求6所述的弱监督分割网络区域扩张参数自适应生成系统,其特征在于,所述图像预处理模块进一步用于:
将图像尺度进行归一化,并对归一化后的图像进行图像去噪、图像增强操作。
8.根据权利要求7所述的弱监督分割网络区域扩张参数自适应生成系统,其特征在于:
所述区域扩张分支和所述全局自适应池化层均连接到语义分割分支中的图像特征末端。
9.根据权利要求8所述的弱监督分割网络区域扩张参数自适应生成系统,其特征在于,所述分类分数和权重计算模块,进一步用于:
利用激活函数对每个通道上的权重值进行映射,然后通过/>函数将激活函数映射后的权重值转换为[0,1]范围的值,以使每个类别通道中所有的像素的权重累加和为1。
10.根据权利要求9所述的弱监督分割网络区域扩张参数自适应生成系统,其特征在于,所述自适应参数生成模块,进一步用于:
将所述原始像素级分类分数与所述动态权重进行逐像素相乘并求和,得到所述自适应图像级分类分数。
11.一种用于执行根据权利要求1-5任一项所述的弱监督分割网络区域扩张参数自适应生成方法的终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-5任一项所述的弱监督分割网络区域扩张参数自适应生成方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述的弱监督分割网络区域扩张参数自适应生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311248452.7A CN116993989A (zh) | 2023-09-26 | 2023-09-26 | 一种弱监督分割网络区域扩张参数自适应生成方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311248452.7A CN116993989A (zh) | 2023-09-26 | 2023-09-26 | 一种弱监督分割网络区域扩张参数自适应生成方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116993989A true CN116993989A (zh) | 2023-11-03 |
Family
ID=88532511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311248452.7A Pending CN116993989A (zh) | 2023-09-26 | 2023-09-26 | 一种弱监督分割网络区域扩张参数自适应生成方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116993989A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275688A (zh) * | 2020-01-19 | 2020-06-12 | 合肥工业大学 | 基于注意力机制的上下文特征融合筛选的小目标检测方法 |
-
2023
- 2023-09-26 CN CN202311248452.7A patent/CN116993989A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275688A (zh) * | 2020-01-19 | 2020-06-12 | 合肥工业大学 | 基于注意力机制的上下文特征融合筛选的小目标检测方法 |
Non-Patent Citations (2)
Title |
---|
ALEXANDER KOLESNIKOV 等: "Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation", 《ARXIV:1603.06098V3》, pages 1 - 20 * |
张涵: "基于自适应池化的弱监督语义分割", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 1823 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10740640B2 (en) | Image processing method and processing device | |
CN111104962B (zh) | 图像的语义分割方法、装置、电子设备及可读存储介质 | |
CN111563502B (zh) | 图像的文本识别方法、装置、电子设备及计算机存储介质 | |
CN111488826B (zh) | 一种文本识别方法、装置、电子设备和存储介质 | |
CN114155543B (zh) | 神经网络训练方法、文档图像理解方法、装置和设备 | |
EP3926531A1 (en) | Method and system for visio-linguistic understanding using contextual language model reasoners | |
EP3872652B1 (en) | Method and apparatus for processing video, electronic device, medium and product | |
CN113360699B (zh) | 模型训练方法和装置、图像问答方法和装置 | |
CN115063875B (zh) | 模型训练方法、图像处理方法、装置和电子设备 | |
CN110162657B (zh) | 一种基于高层语义特征和颜色特征的图像检索方法及系统 | |
US20220292805A1 (en) | Image processing method and apparatus, and device, storage medium, and image segmentation method | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
JP2023531350A (ja) | サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 | |
CN116152833B (zh) | 基于图像的表格还原模型的训练方法及表格还原方法 | |
CN113674288A (zh) | 一种非小细胞肺癌数字病理图像组织自动分割方法 | |
JP2022110132A (ja) | 陳列シーン認識方法、モデルトレーニング方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN113920296B (zh) | 一种基于对比学习的文本识别方法与系统 | |
CN113468330A (zh) | 信息获取方法、装置、设备及介质 | |
CN113537192A (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN113239883A (zh) | 分类模型的训练方法、装置、电子设备以及存储介质 | |
CN113516697A (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN111126372B (zh) | 视频中logo区域的标记方法、装置及电子设备 | |
CN115565186B (zh) | 文字识别模型的训练方法、装置、电子设备和存储介质 | |
CN108664948B (zh) | 用于生成信息的方法和装置 | |
CN115345895B (zh) | 用于视觉检测的图像分割方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |