CN111666949A - 一种基于迭代分割的图像语义分割方法 - Google Patents
一种基于迭代分割的图像语义分割方法 Download PDFInfo
- Publication number
- CN111666949A CN111666949A CN202010546056.2A CN202010546056A CN111666949A CN 111666949 A CN111666949 A CN 111666949A CN 202010546056 A CN202010546056 A CN 202010546056A CN 111666949 A CN111666949 A CN 111666949A
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- convolutional neural
- sample
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 81
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012795 verification Methods 0.000 claims abstract description 10
- 230000002708 enhancing effect Effects 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 5
- 238000003709 image segmentation Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 abstract description 4
- 238000013507 mapping Methods 0.000 description 5
- 238000005096 rolling process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于迭代分割的图像语义分割方法,包括:图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,如此反复得到最终的卷积神经网络,根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果;本发明后续的样本图像是由最初的增强样本图像分割而成的,由于其经过多次分割,数量会逐渐庞大,并且先训练后验证,再训练再验证,如此反复得到最终的卷积神经网络,训练数据和验证数据之间相当于存在母体和子体关系,既不会产生因训练数据差异较大导致的精度降低问题,而且还由于训练数据之间的漂移较小,有助于提升精度。
Description
技术领域
本发明涉及一种基于迭代分割的图像语义分割方法,应用于静态2D图像、视频甚至3D数据、体数据的图像语义分割,属于图像处理技术领域。
背景技术
图像语义分割是从像素水平上,理解、识别图片的内容,其目的是建立每个像素和语义类别之间的一一映射关系,根据语义信息进行分割,其被广泛应用于场景理解、自动驾驶、医学影像分析、机器人视觉等领域。图像语义分割是图像理解的基石,其分割结果的好坏将直接影响对后续图像内容的处理,因此,对图像语义分割技术的研究具有非常重要的现实意义。
现有技术中,利用卷积神经网络进行语义分割是常用的技术手段,而卷积神经网络的建立在整个过程中非常重要。语义分割(应用于静态2D图像、视频甚至3D数据、体数据)是计算机视觉的关键问题之一。在宏观意义上来说,语义分割是为场景理解铺平了道路的一种高层任务。作为计算机视觉的核心问题,场景理解的重要性越来越突出,因为现实中越来越多的应用场景需要从影像中推理出相关的知识或语义(即由具体到抽象的过程)。这些应用包括自动驾驶,人机交互,计算摄影学,图像搜索引擎,增强现实等。应用各种传统的计算机视觉和机器学习技术,这些问题已经得到了解决。虽然这些方法很流行,但深度学习革命让相关领域发生了翻天覆地的变化,因此,包括语义分割在内的许多计算机视觉问题都开始使用深度架构来解决,通常是卷积神经网络CNN,而CNN在准确率甚至效率上都远远超过了传统方法。
但是现有技术训练卷积神经网络的进行图像语义分割的手段较为单一,由于图像样本数据之间关联性不强,漂移量大,导致最终的卷积神经网络进行图像语义分割的精度不高,误差较大。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明提供一种基于迭代分割的图像语义分割方法。
技术方案:一种基于迭代分割的图像语义分割方法,包括如下内容:
图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,每次分割后的数量均为前一次分割的倍数,以N1、N2,…,Ni表示,其中,Ni代表经过第i-1次分割后的增强样本图像数量;
卷积神经网络的训练,以分割后数量为N1的增强样本图像作为初始训练样本训练卷积神经网络,以N2为初始验证样本对卷积神经网络进行验证,对卷积神经网络的参数进行更新,再以N3对卷积神经网络进行再次训练,以N4对卷积神经网络进行验证,对卷积神经网络的参数进行更新,如此反复得到最终的卷积神经网络;
根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果。
对样本图像的图像预处理包括图像尺寸变换、图像质量检测和图像颜色校正,其中,所述图像尺寸变换用于改变图像尺寸,将样本图像修改成设定尺寸;所述图像质量检测用于判定图像质量是否满足训练需求,且在图像质量不满足训练需求时重新更换样本图像;所述图像颜色校正用于还原样本图像在标准光源下的真实色彩。
图像质量是否满足训练需求,指的是图像的像素、边缘轮廓模糊等是否满足训练需求。例如在图像的像素较低时,需要重新更换样本图像。
所述图像预处理中,输入的样本图像为图片或视频。
关于增强样本图像分割所得的数量为N1、N2,…的增强样本图像,数量为Ni的增强样本图像中,对仅包含背景的增强样本图像进行剔除。
所述卷积神经网络,包括5层卷积层、5层最大池化层和2层全连层。
所述卷积神经网络的训练中,选定其中一个增强样本图像,分别输入至以当前增强样本图像训练所得的当前卷积神经网络模型和前一次卷积神经网络模型中,以两者输出的结果确定损失函数,当损失函数的值超出预设阈值时,更新当前卷积神经网络模型的模型参数。
卷积神经网络的训练中,当选择的增强样本图像数量为多个时,通过加权的方式来确定最终的损失函数。图像中需要标注特征来进行图像分类和识别时,选择样本数量不足且样本识别效率较低,会选择多个增强样本进行训练。
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有实现基于迭代分割的图像语义分割方法的计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于迭代分割的图像语义分割方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现基于迭代分割的基于迭代分割的图像语义分割方法的计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述语义分割方法的步骤。
有益效果:与现有技术相比,本发明提供的基于迭代分割的图像语义分割方法中,后续的样本图像是由最初的增强样本图像分割而成的,由于其经过多次分割,数量会逐渐庞大,并且先训练后验证,再训练再验证,如此反复得到最终的卷积神经网络,训练数据和验证数据之间相当于存在母体和子体关系,既不会产生因训练数据差异较大导致的精度降低问题,而且还由于训练数据之间的漂移较小,有助于提升精度。
附图说明
图1是本发明实施例方法的流程图;
图2是本发明实施例方法中卷积神经网络模型的示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,基于迭代分割的图像语义分割方法,包括以下内容:
图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,每次分割后的数量均为前一次分割的倍数,以N1、N2,…,Ni表示,其中,Ni代表经过第i-1次分割后的增强样本图像数量;
卷积神经网络的训练,以分割后数量为N1的增强样本图像作为初始训练样本训练卷积神经网络,以N2为初始验证样本对卷积神经网络进行验证,对卷积神经网络的参数进行更新,再以N3对卷积神经网络进行再次训练,以N4对卷积神经网络进行验证,对卷积神经网络的参数进行更新,如此反复得到最终的卷积神经网络;
根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果。
本实施例中,N1、N2,…,Ni所代表的不同数量的增强样本图像是由最初的增强样本图像分割而成的,由于其经过多次分割,数量会逐渐庞大,卷积神经网络在训练时以N1作为初始训练样本训练卷积神经网络,以N2为初始验证样本对卷积神经网络进行验证,对卷积神经网络的参数进行更新,再以N3对卷积神经网络进行再次训练,以N4对卷积神经网络进行验证,如此反复得到最终的卷积神经网络,N1和N2、N3和N4之间相当于存在母体和子体关系,既不会产生因训练数据差异较大导致的精度降低问题,而且还由于训练数据之间的漂移较小,有助于提升精度。
本实施例中,所谓图像增强是指有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。
本实施例的一种情况中,图像增强模型可以依据下述方法进行建立:
对于图像每个颜色通道,根据目标图像中各个像素的颜色通道的灰度值确定出取值不同的第一灰度值和第二灰度值;利用第一灰度值和第二灰度值设置与颜色通道对应的映射函数;利用映射函数对目标图像中各个像素的颜色通道的灰度值进行调整,调整后的目标图像的颜色通道的灰度值的方差大于调整前的目标图像的颜色通道的灰度值的方差;通过对每个颜色通道进行单独处理,生成与每个颜色通道所对应的映射函数,利用该映射函数对目标图像中各个像素的该颜色通道的灰度值进行调整,使得调整后的该颜色通道的灰度值的方差大于调整前的该颜色通道的灰度值的方差,增强了目标图像的对比度,解决了相关技术中图像增强效果差的技术问题,提高了图像增强效果。此处,图像增强模型的建立方法属于现有技术,其已经在CN105957037B一种图像增强方法及装置中公开,本实施例不对其进行具体的叙述。
对样本图像的图像预处理还包括图像尺寸变换、图像质量检测和图像颜色校正。
本实施例中,图像尺寸变换用于改变图像尺寸,具体可以为裁剪、缩放和填充,例如为了便于后续样本图像的分割,将样本图像裁修改成设定尺寸,具体采用裁剪、缩放和填充哪种手段,本实施例不进行具体的限定。
图像质量检测用于判定图像的质量,如像素等是否满足训练需求,例如在图像的像素较低不满足设定值时,需要重新更换样本图像。
图像颜色校正用于还原样本图像在标准光源下的真实色彩,减小拍摄或截取时环境光的不利影响。色彩还原的技术手段可以有多种:如基于线性回归的算法、基于统计学的算法、基于神经网络的图像转换算法;也可以从以上算法中选择一种或多种按一定组合顺序使用,具体方式可以根据实际情况进行设计,本实施例不加以限制。
图像预处理中,输入的样本图像为图片或视频。
样本图像的获取可以为图片形式,也可以从视频中进行截取,在本实施例中不进行具体的限制。
关于增强样本图像分割所得的数量为N1、N2,…的增强样本图像,数量为Ni的增强样本图像中,对仅包含背景的增强样本图像进行剔除,由于将样本图像分割成小块后,部分样本图像中可能仅仅包含有背景,虽然背景中也具有像素,但是该像素的对应关系单一,因此,本实施例中对仅包含背景的增强样本图像进行剔除。
如图2所示,卷积神经网络模型包括5层卷积层、5层最大池化层和2层全连层。其依次为:第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第五卷积层、第五最大池化层、第一全连层、第二全连层。
卷积层中卷积核的大小为3×3,步长为1。第一层的卷积核数量为64,其余卷积层的卷积核数量为128。最大池化层均采用max-pooling,大小为2×2,每次池化以2为步长,以减少对较低维度的响应,在卷积层和全连接层中都用ReLU来加快收敛速度。
卷积神经网络的训练中,选定其中一个增强样本图像,分别并输入至以当前增强样本图像训练所得的当前卷积神经网络模型和前一次卷积神经网络模型中,以两者输出的结果确定损失函数,当损失函数的值超出预设阈值时,更新当前卷积神经网络模型的模型参数。
假设增强样本图像从数量为N2的增强样本图像中获取,则以数量为N2的增强样本图像训练得到的卷积神经网络模型为M2,前一次所得的卷积神经网络模型为M1,即数量为N2的增强样本图像未分割前训练的卷积神经网络模型,将从数量为N2的增强样本图像中获取的增强样本图像分别输入值卷积神经网络模型M1和M2中,分别得到R1和R2,根据R1和R2的差异,定义损失函数Loss1,当损失函数的值超出预设阈值时,更新当前卷积神经网络模型的模型参数。由于增强样本图像为多个,当选择确定的增强样本图像数量为多个时,通过加权的方式来确定最终的损失函数。
即Loss=x1Loss1+x2Loss2+…+xnLossn,式中x1,x2,…,xn为系数,可以依据经验确定,且x1,x2,…,xn之和为1,Loss1,Loss2,...,Lossn分为每次所得的损失函数。
本发明实施例还提供了一种计算机设备,包括存储器和处理器,存储器中存储有实现基于迭代分割的图像语义分割方法的计算机程序,计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,每次分割后的数量均为前一次分割的倍数,以N1、N2,…,Ni表示,其中,Ni代表经过第i-1次分割后的增强样本图像数量;
卷积神经网络的训练,以分割后数量为N1的增强样本图像作为初始训练样本训练卷积神经网络,以N2为初始验证样本对卷积神经网络进行验证,对卷积神经网络的参数进行更新,再以N3对卷积神经网络进行再次训练,以N4对卷积神经网络进行验证,对卷积神经网络的参数进行更新,如此反复得到最终的卷积神经网络;
根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,每次分割后的数量均为前一次分割的倍数,以N1、N2,…,Ni表示,其中,Ni代表经过第i-1次分割后的增强样本图像数量;
卷积神经网络的训练,以分割后数量为N1的增强样本图像作为初始训练样本训练卷积神经网络,以N2为初始验证样本对卷积神经网络进行验证,对卷积神经网络的参数进行更新,再以N3对卷积神经网络进行再次训练,以N4对卷积神经网络进行验证,对卷积神经网络的参数进行更新,如此反复得到最终的卷积神经网络;
根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本发明上述实施例提供了基于迭代分割的图像语义分割方法,并基于该语义分割方法提出了一种计算机设备和计算机可读存储介质,后续的样本图像是由最初的增强样本图像分割而成的,由于其经过多次分割,数量会逐渐庞大,并且先训练后验证,再训练再验证,如此反复得到最终的卷积神经网络,训练数据和验证数据之间相当于存在母体和子体关系,既不会产生因训练数据差异较大导致的精度降低问题,而且还由于训练数据之间的漂移较小,有助于提升精度。
Claims (9)
1.一种基于迭代分割的图像语义分割方法,其特征在于,包括如下内容:
图像预处理,通过图像增强模型对输入的样本图像进行增强,得到增强样本图像,然后对所述增强样本图像进行若干次分割,每次分割后的数量均为前一次分割的倍数,以N1、N2,…,Ni表示,其中,Ni代表经过第i-1次分割后的增强样本图像数量;
卷积神经网络的训练,以分割后数量为N1的增强样本图像作为初始训练样本训练卷积神经网络,以N2为初始验证样本对卷积神经网络进行验证,对卷积神经网络的参数进行更新,再以N3对卷积神经网络进行再次训练,以N4对卷积神经网络进行验证,对卷积神经网络的参数进行更新,如此反复得到最终的卷积神经网络;
根据最终的卷积神经网络对图像进行语义分割,输出语义分割结果。
2.根据权利要求1所述的基于迭代分割的图像语义分割方法,其特征在于,对样本图像的图像预处理包括图像尺寸变换、图像质量检测和图像颜色校正,其中,所述图像尺寸变换用于改变图像尺寸,将样本图像修改成设定尺寸;所述图像质量检测用于判定图像质量是否满足训练需求,且在图像质量不满足训练需求时重新更换样本图像;所述图像颜色校正用于还原样本图像在标准光源下的真实色彩。
3.根据权利要求1所述的基于迭代分割的图像语义分割方法,其特征在于,所述图像预处理中,输入的样本图像为图片或视频。
4.根据权利要求1所述的基于迭代分割的图像语义分割方法,其特征在于,关于增强样本图像分割所得的数量为N1、N2,…的增强样本图像,数量为Ni的增强样本图像中,对仅包含背景的增强样本图像进行剔除。
5.根据权利要求1所述的基于迭代分割的图像语义分割方法,其特征在于,所述卷积神经网络,包括5层卷积层、5层最大池化层和2层全连层。
6.根据权利要求1所述的基于迭代分割的图像语义分割方法,其特征在于,所述卷积神经网络的训练中,选定其中一个增强样本图像,分别输入至以当前增强样本图像训练所得的当前卷积神经网络模型和前一次卷积神经网络模型中,以两者输出的结果确定损失函数,当损失函数的值超出预设阈值时,更新当前卷积神经网络模型的模型参数。
7.根据权利要求6所述的基于迭代分割的图像语义分割方法,其特征在于,卷积神经网络的训练中,当选择的增强样本图像数量为多个时,通过加权的方式来确定最终的损失函数。
8.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有实现基于迭代分割的图像语义分割方法的计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于迭代分割的图像语义分割方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现基于迭代分割的基于迭代分割的图像语义分割方法的计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述语义分割方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010546056.2A CN111666949B (zh) | 2020-06-16 | 2020-06-16 | 一种基于迭代分割的图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010546056.2A CN111666949B (zh) | 2020-06-16 | 2020-06-16 | 一种基于迭代分割的图像语义分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666949A true CN111666949A (zh) | 2020-09-15 |
CN111666949B CN111666949B (zh) | 2023-06-20 |
Family
ID=72387928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010546056.2A Active CN111666949B (zh) | 2020-06-16 | 2020-06-16 | 一种基于迭代分割的图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666949B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381832A (zh) * | 2020-12-04 | 2021-02-19 | 江苏科技大学 | 一种基于优化卷积神经网络的图像语义分割方法 |
CN113837279A (zh) * | 2021-09-24 | 2021-12-24 | 苏州浪潮智能科技有限公司 | 一种数据增强方法、系统、设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610141A (zh) * | 2017-09-05 | 2018-01-19 | 华南理工大学 | 一种基于深度学习的遥感图像语义分割方法 |
CN109360210A (zh) * | 2018-10-16 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及存储介质 |
CN110287932A (zh) * | 2019-07-02 | 2019-09-27 | 中国科学院遥感与数字地球研究所 | 基于深度学习图像语义分割的道路阻断信息提取 |
CN111210435A (zh) * | 2019-12-24 | 2020-05-29 | 重庆邮电大学 | 一种基于局部和全局特征增强模块的图像语义分割方法 |
CN111259898A (zh) * | 2020-01-08 | 2020-06-09 | 西安电子科技大学 | 基于无人机航拍图像的农作物分割方法 |
-
2020
- 2020-06-16 CN CN202010546056.2A patent/CN111666949B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610141A (zh) * | 2017-09-05 | 2018-01-19 | 华南理工大学 | 一种基于深度学习的遥感图像语义分割方法 |
CN109360210A (zh) * | 2018-10-16 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及存储介质 |
CN110287932A (zh) * | 2019-07-02 | 2019-09-27 | 中国科学院遥感与数字地球研究所 | 基于深度学习图像语义分割的道路阻断信息提取 |
CN111210435A (zh) * | 2019-12-24 | 2020-05-29 | 重庆邮电大学 | 一种基于局部和全局特征增强模块的图像语义分割方法 |
CN111259898A (zh) * | 2020-01-08 | 2020-06-09 | 西安电子科技大学 | 基于无人机航拍图像的农作物分割方法 |
Non-Patent Citations (1)
Title |
---|
胡伟等: "树形结构卷积神经网络优化的城区遥感图像语义分割", 《中国图象图形学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381832A (zh) * | 2020-12-04 | 2021-02-19 | 江苏科技大学 | 一种基于优化卷积神经网络的图像语义分割方法 |
CN113837279A (zh) * | 2021-09-24 | 2021-12-24 | 苏州浪潮智能科技有限公司 | 一种数据增强方法、系统、设备及计算机可读存储介质 |
CN113837279B (zh) * | 2021-09-24 | 2023-08-08 | 苏州浪潮智能科技有限公司 | 一种数据增强方法、系统、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111666949B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107945185B (zh) | 基于宽残差金字塔池化网络的图像分割方法及系统 | |
WO2020238560A1 (zh) | 视频目标跟踪方法、装置、计算机设备及存储介质 | |
CN109753913B (zh) | 计算高效的多模式视频语义分割方法 | |
CN109241982B (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
WO2020228446A1 (zh) | 模型训练方法、装置、终端及存储介质 | |
WO2021179471A1 (zh) | 一种人脸模糊度检测方法、装置、计算机设备及存储介质 | |
CN111696110B (zh) | 场景分割方法及系统 | |
CN111882620B (zh) | 一种基于多尺度信息道路可行驶区域分割方法 | |
CN112233129B (zh) | 基于深度学习的并行多尺度注意力机制语义分割方法及装置 | |
CN111768415A (zh) | 一种无量化池化的图像实例分割方法 | |
WO2023206944A1 (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
CN113066089B (zh) | 一种基于注意力引导机制的实时图像语义分割方法 | |
US12112528B2 (en) | Method and apparatus for processing images, device and storage medium | |
CN113436220B (zh) | 一种基于深度图分割的图像背景估计方法 | |
CN111666949A (zh) | 一种基于迭代分割的图像语义分割方法 | |
CN115410030A (zh) | 目标检测方法、装置、计算机设备及存储介质 | |
CN116993975A (zh) | 基于深度学习无监督领域适应的全景相机语义分割方法 | |
CN117689928A (zh) | 一种改进yolov5的无人机检测方法 | |
CN116091823A (zh) | 一种基于快速分组残差模块的单特征无锚框目标检测方法 | |
CN110633706B (zh) | 一种基于金字塔网络的语义分割方法 | |
WO2022120996A1 (zh) | 视觉位置识别方法及装置、计算机设备及可读存储介质 | |
CN113313162A (zh) | 一种多尺度特征融合目标检测的方法及系统 | |
CN117593264A (zh) | 一种改进的联合YOLOv5和知识蒸馏的汽车发动机缸孔内壁检测方法 | |
CN112465847A (zh) | 一种基于预测清晰边界的边缘检测方法、装置及设备 | |
CN109255794B (zh) | 一种标准件深度全卷积特征边缘检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |