CN111915615A - 图像分割方法、装置、电子设备及计算机可读存储介质 - Google Patents
图像分割方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111915615A CN111915615A CN202010946576.2A CN202010946576A CN111915615A CN 111915615 A CN111915615 A CN 111915615A CN 202010946576 A CN202010946576 A CN 202010946576A CN 111915615 A CN111915615 A CN 111915615A
- Authority
- CN
- China
- Prior art keywords
- image
- image segmentation
- convolution
- segmented
- segmentation model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003709 image segmentation Methods 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000011218 segmentation Effects 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 238000005070 sampling Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 40
- 238000012360 testing method Methods 0.000 claims description 25
- 238000010586 diagram Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 2
- 210000001525 retina Anatomy 0.000 description 10
- 239000011800 void material Substances 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012806 monitoring device Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及物联网技术,揭露了一种图像分割方法,包括:利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;将所述特征图进行拼接并执行上采样操作,得到复原图像;利用图像分割算法对所述复原图像进行像素分割,得到分割图像。本发明还提出一种图像分割方法、装置、电子设备以及计算机可读存储介质。本发明可以解决传统分割网络的分割结果精确性不高的问题。
Description
技术领域
本发明涉及物联网领域,尤其涉及一种图像分割方法、装置、电子设备及计算机可读存储介质。
背景技术
5G为物联网(The Internet of Things,简称IOT)拓宽了应用场景,让物联网能够应用于各个垂直行业,从而促进万物互联时代的到来。在物联网的很多实际应用场景中,各种智能家居机器人可以像人一样自主行走,而自主行走需要智能家居机器人具备场景识别的能力。
在训练人工智能模型进行场景识别的过程中,如何对场景图像中的像素进行分割对于场景识别的精确性至关重要。现有的图像分割多采用基于深度学习的语义分割解决方案,例如,FCN(用于语义分割的全卷积神经网络)、U-Net(用于生物医学图像的语义分割卷积神经网络)等。但发明人发现,FCN和U-NET采用与分类网络相同的结构,分类网络只关注像素的类别,对像素位置并不关心,不利于像素的定位,且分类网络的特征提取方式大大削弱了图像特征的多样性,使得分割网络的分割结果的精确性不能满足需求。
发明内容
本发明提供一种图像分割方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决传统分割网络的分割结果精确性不高的问题。
为实现上述目的,本发明提供的一种图像分割方法,包括:
利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;
将所述特征图进行拼接并执行上采样操作,得到复原图像;
利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
进一步地,为实现上述目的,本发明还提供一种图像分割装置,所述装置包括:
特征提取模块,用于利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;
上采样模块,用于将所述特征图进行拼接并执行上采样操作,得到复原图像;
图像分割模块,用于利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
进一步地,为实现上述目的,本发明还提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述图像分割方法。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述述图像分割方法。
本发明实施例通过预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型来模拟多个生物视网膜成像的效果,多个尺度的常规卷积对于多尺度目标的识别具有良好的适应性,从而保留了图像特征的多样性,空洞卷积的引入实现了在高分辨率特征图下保持大感受野信息的目标,不仅有利于像素的分类而且有利于像素的定位,提高了图像分割的精确度。
可选地,所述图像分割模型中每一个尺度的卷积核并行连接多个空洞率的空洞卷积,且空洞卷积的空洞率随着所连接的卷积核尺度的增大而增大。
可选地,所述利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图,包括:利用所述多个尺度的卷积核对待分割图像中的同一特征进行特征提取,得到每个尺度的卷积核输出的第一特征图;利用每个尺度的卷积核连接的空洞卷积对该尺度的卷积核输出的第一特征图进行卷积操作,得到所述特征图。本发明实施例对同一特征利用多个尺度的卷积核进行特征提取,每一个尺度的卷积核并行连接多个空洞率的空洞卷积,不同空洞率的空洞卷积模拟了不同视网膜的不同离心率;多尺度卷积核和多个空洞率的空洞卷积提高了对多尺度目标进行识别的适应性。
可选地,所述将所述特征图进行拼接并执行上采样操作,得到复原图像,包括:将所述特征图进行拼接,得到拼接图;将所述拼接图进行第一阈值倍数的上采样,得到中间特征图;将所述中间特征图进行第二阈值倍数的上采样,得到原图尺寸的复原图像。本发明实施例采用逐步上采样的方法将特征图还原为原图尺寸的复原图像,避免特征图直接上采样到原图尺寸而导致的分割结果粗糙的问题,改善了图像分割的精确度,提高了图像分割模型的分割性能。
可选地,所述利用图像分割算法对所述复原图像进行像素分割,得到分割图像,包括:将所述复原图像进行灰度值转化,得到灰度图像;按照所述灰度图像中每个像素的灰度值将像素进行聚类;根据聚类的结果将所述灰度图像中的像素进行分割,得到分割图像。
可选地,所述利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图之前,所述方法还包括:采集场景图像集,对所述场景图像集进行异常数据剔除,得到去异常图像集;利用标注工具对所述去异常图像集进行数据标注,得到标注图像集,将所述标注图像集按照预设比例划分为训练图像集和测试图像集;利用所述训练图像集对所述图像分割模型进行预设次数的迭代训练;利用所述测试图像集对迭代后的图像分割模型进行性能指标测试;当所述性能指标达到预设区间阈值内时,得到训练完成的图像分割模型。
可选地,所述利用所述训练图像集对所述图像分割模型进行预设次数的迭代训练,包括:将所述训练图像集输入至所述图像分割模型进行迭代,得到模型的输出结果;利用损数计算图像分割模型的输出结果与所述训练图像集中标签的的差异值;当所述差异值大于或等于预设差异阈值时,利用梯度下降算法对所述图像分割模型的超参数进行更新;当所述图像分割模型的迭代次数达到所述预设次数或所述差异值小于预设差异阈值时,得到迭代后的图像分割模型。
本发明实施例对场景图像集进行异常数据剔除,保证训练数据与测试数据的质量,提高图像分割模型的精确度;将场景图像集按照比例划分为训练图像集和测试图像集,保证训练图像集和测试图像集的同源性,提高了图像分割模型的性能指标的真实性。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1为本发明第一实施例提供的图像分割方法的实施流程图;
图2为本发明第一实施例提供的图像分割模型的感受野分支的结构示意图;
图3为本发明第一实施例提供的对待分割图像进行特征提取的实施流程图;
图4为本发明第一实施例提供的将特征图进行拼接并执行上采样操作的实施流程图;
图5为本发明第一实施例提供的对复原图像进行像素分割的实施流程图;
图6为本发明第一实施例提供的图像分割模型的训练过程的实施流程图;
图7为本发明第二实施例提供的图像分割装置的模块示意图;
图8为本发明第三实施例提供的实现图像分割方法的电子设备的内部结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明实施方式涉及一种图像分割方法,本实施方式核心在于模拟多个生物视网膜成像的效果,在对图像进行特征提取时,扩大感受野范围的同时保留特征图中的高分辨率信息,提高图像分割的精确度。
下面对本实施方式的图像分割方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
参阅图1所示,为本发明第一实施例提供的图像分割方法的实施流程图,包括:
S1、利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图。
经研究发现生物视网膜成像产生的生物视觉是由不同视网膜的群感受野集合而成的,随着离心率的增大,感受野尺度越大,在相同离心率下,不同视网膜的感受野是不同的。本发明实施例利用卷积核尺度代表感受野的大小,因此利用不同尺度的卷积核(也称常规卷积核)可以模拟生物的不同视网膜,并进一步利用不同空洞率的空洞卷积来模拟不同视网膜受离心率的影响,增大特征提取过程中感受野的尺度,进而实现提高特征提取的精度。
详细地,本发明实施例中,所述图像分割模型中每一个尺度的卷积核并行连接多个空洞率的空洞卷积,且空洞卷积的空洞率随着所连接的卷积核尺度的增大而增大。
本发明其中一个实施例中,所述图像分割模型包括三种不同尺度的感受野分支,三个分支都是由一个常规卷积和多个空洞卷积组成。例如,参阅图2所示,所述三个分支包括:1x1的常规卷积分支,3x3的常规卷积分支和5x5的常规卷积分支;其中,所述1x1的常规卷积分支连接着空洞率为1和空洞率为2的3x3空洞卷积;所述3x3的常规卷积分支连接着空洞率为3和空洞率为4的3x3空洞卷积;所述5x5的常规卷积分支连接着空洞率为5和空洞率为6的3x3空洞卷积。本发明实施例中,每个分支的常规卷积核的尺度不同,空洞卷积的空洞率随着常规卷积核尺度增大而逐渐增大,达到了模拟生物神经学成像的特点。此外,空洞卷积的引入还实现了在高分辨率特征图下保持大感受野信息的目标,利于像素的分类和定位,多个尺度的常规卷积对于多尺度目标的识别具有良好的适应性:小尺度常规卷积用于提取小尺度目标特征,中间尺度常规卷积用于提取中间尺度目标特征,大尺度常规卷积用于提取大尺度目标特征。
进一步地,参阅图3所示,本发明较佳实施例中,所述S1包括:
S10、利用所述多个尺度的卷积核对待分割图像中的同一特征进行特征提取,得到每个尺度的卷积核输出的常规特征图;
S11、利用每个尺度的卷积核连接的空洞卷积对该尺度的卷积核输出的特征图进行卷积操作,得到所述特征图。
例如,参阅上述的图2所示,本发明实施例中,所述多个尺度的卷积核包括三个常规卷积核,尺寸分别为1x1、3x3、5x5。进一步地,本发明实施例在每个常规卷积核后增加两个空洞卷积,分别为1x1的常规卷积核后增加空洞率为1及2的空洞卷积;3x3的常规卷积核后增加空洞率为3及4的空洞卷积;5x5的常规卷积核后增加空洞率为5及6的空洞卷积。
详细地,本发明实施例首先利用1x1的常规卷积核提取待分割图像中的其中一个特征A,输出对应的特征图P1,并利用空洞率为1及2的空洞卷积对所述特征图P1进行卷积操作,输出特征图P1’及P1”;进一步地,再利用3x3的常规卷积核提取待分割图像中的特征A,输出对应的特征图P2,并利用空洞率为3及4的空洞卷积对所述特征图P2进行卷积操作,输出特征图P2’及P2”;再利用5x5的常规卷积核提取待分割图像中的特征A,输出对应的特征图P3,并利用空洞率为5及6的空洞卷积对所述特征图P3进行卷积操作,输出特征图P3’及P3”。本发明重复上述步骤直到提取了待分割图像中的所有特征,并集合所述空洞卷积输出的所有特征图,得到最终的特征图。
S2、将所述特征图进行拼接并执行上采样操作,得到复原图像。
本发明实施例中将特征图进行拼接,保证提取到的所有特征不被丢失,进一步对拼接完成的特征图进行上采样,获取与原图尺寸一致的复原图,恢复图像中像素的位置信息,提高进行图像分割时的精确度。
详细地,参阅图4所示,本发明实施例中,所述S2包括:
S20、将所述特征图进行拼接,得到拼接图;
S21、将所述拼接图进行第一阈值倍数的上采样,得到中间特征图;
S22、将所述中间特征图进行第二阈值倍数的上采样,得到原图尺寸的复原图像。
其中,所述原图尺寸是输入至所述图像分割模型进行特征提取之前的图形尺寸。本发明优选实施例中,所述第一阈值倍数可以设置为n倍,所述第二阈值倍数可以设置为2n倍。
例如,当所述拼接图为原图尺寸的八分之一时,如果对所述拼接图直接上采样8倍至原始图片尺度,会导致上采样后的特征图在物体边界的分割结果过于粗糙,因此本发明其中一个实施例先将所述拼接图上采样2倍至中间特征图,再由所述中间特征图上采样4倍至原图尺寸,可以实现原图尺寸的特征图保持较高分辨率的情况下,增加了特征的感受野,即保留了图像中的位置信息,同时分类信息没有减少,有助于改善图像分割模型进行语义分割的性能。
S3、利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
本发明实施例中,所述分割算法包括但不限于基于阈值的分割算法、基于边缘的分割算法、基于区域的分割算法、基于聚类的分割算法,其中,本发明较佳实施例可以采用基于聚类的分割算法。
详细地,参阅图5所示,所述S3包括:
S30、将所述复原图像进行灰度值转化,得到灰度图像;
S31、按照所述灰度图像中每个像素的灰度值将像素进行聚类;
S32、根据聚类的结果将所述灰度图像中的像素进行分割,得到分割图像。
本发明实施例利用图像分割算法对复原图像中的像素进行聚类,根据聚类的结果将所述灰度图像中的像素进行分割,得到分割图像,提高了由复原图像获取图像分割结果的精确性。
本发明实施例通过预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型来模拟多个生物视网膜成像的效果,在对图像进行特征提取时,尺度较小的卷积核可以保留特征图中更高分辨率的信息,空洞卷积可以扩大卷积时的感受野范围,因此本发明实施例可实现扩大了感受野范围的同时保留了特征图中的高分辨率信息,提高图像分割的精确度。
应该了解,所述图像分割模型是一种深度学习模型,为了使所述图像分割模型在特征提取时具有更精确的效果,在上述的S1之前,本发明实施例还包括对所述图像分割模型的训练。
详细地,参阅图6所示,所述图像分割模型的训练过程如下:
S100、采集识别场景图像集,对所述识别场景图像集进行异常数据剔除,得到去异常图像集。
本发明实施例中,所述场景图像集可由任何摄像头和/或类似监控设备采集得到。进一步地,所述识别场景图像集可以包括来自2000个家庭场景24小时内的图片,其中,06:00-24:00之间,所述摄像头和/或类似监控设备每两个小时采集一张,00:00-06:00之间,摄像头和/或类似监控设备每3个小时采集一张,每个时间点从两个不同角度采集,共采集48000张识别场景图片。
本发明实施例对所述识别场景图像集进行统一定时采集,可保证采集到的所述识别场景图像集的真实性与连续性,提高了图像质量,以达到利用所述识别场景图像集训练出更加精确的图像分割模型的目的。
进一步地,所述异常数据剔除包括删除所述场景识别图像集中相似图像和模糊图像。
本发明实施例对所述识别场景图像集进行异常数据剔除,可去除所述场景识别图像集中的相似图像和模糊图像,以达到减少场景识别图像的冗余,提高场景识别图像的质量的效果。
S200、利用标注工具对去异常图像集进行数据标注,得到标注图像集,将所述标注图像集按照预设比例划分为训练图像集和测试图像集。
较佳地,本发明实施例利用Labelme工具对所述去异常图像集中的图像进行数据标注,得到标注图像集。
所述Labelme工具是一种可在线进行图像标注的标注工具。与传统图像标注工具相比,可随时利用线上资源进行图像标注,而不需要引入额外的内存服务器来安装或复制大量标签数据集,避免了额外资源的占用。
进一步地,本发明实施例将所述标注图像集按照预设比例划分为训练图像集和测试图像集,例如,将采集到的48000张识别场景图片按照4:1进行划分,得到38400张训练图像,汇集为所述训练图像集,得到9600张测试图像,汇集为所述测试图像集。
本发明实施例对场景图像集进行异常数据剔除,保证训练数据与测试数据的质量,提高图像分割模型的精确度;将场景图像集按照比例划分为训练图像集和测试图像集,保证训练图像集和测试图像集的同源性,提高了图像分割模型的性能指标的真实性。
S300、利用所述训练图像集对所述图像分割模型进行预设次数的迭代训练;
本发明施例中,所述利用所述训练图像集对所述图像分割模型进行预设次数的迭代训练,包括:
将所述训练图像集输入至所述图像分割模型进行迭代,得到模型的输出结果;
利用损失函数计算图像分割模型的输出结果与所述训练图像集中标签的的差异值;
当所述差异值大于或等于预设差异阈值时,利用梯度下降算法对所述图像分割模型的超参数进行更新;
当所述图像分割模型的迭代次数达到所述预设次数或所述差异值小于预设差异阈值时,得到迭代后的图像分割模型。
本发明施例中,每一次迭代后,利用损失函数计算图像分割模型的输出结果与所述训练图像集中标签的差异值,进而根据差异值对图像分割模型的超参数进行更新。其中,所述超参数可以包括,如学习率、学习率衰减规律、优化方法选择、损失函数选取等,对所述超参数更新的目的在于选择一组合适的参数使所述图像分割模型的性能达到最优。
进一步地,所述梯度下降算法包括,但不限于,批量梯度下降算法、随机梯度下降算法、小批量梯度下降算法。
较佳地,本发明实施例可以利用小批量梯度下降算法对所述超参数进行更新。所述小批量梯度下降算法可以减少超参数更新时的变化,能够提高超参数收敛时的稳定性。
S400、利用所述测试图像集对迭代后的图像分割模型进行性能指标测试;
具体地,本发明实施例中,所述测试图像集中包含多张带有标签的图像,用于测试所述迭代后的图像分割模型。
本发明实施例利用所述测试图像集测试训练后的图像分割模型的性能指标,即将所述测试图像集输入至所述训练后的图像分割模型,根据所述图像分割模型对所述测试图像集输出的结果分析所述图像分割模型的准确率、精确率、召回率和\或平均正确率等性能指标。
S500、当所述性能指标达到预设区间阈值内时,得到训练完成的图像分割模型。
当所述性能指标未达到所述指标阈值区间时,本发明实施例继续对所述图像分割模型进行迭代训练;当所述性能指标达到所述指标阈值区间时,确定所述场景语义分割网络模型为最终的图像分割模型。
如图7所示,是本发明第二实施例提供的图像分割方法装置的模块示意图。
本发明实施例所述图像分割方法装置100可以安装于电子设备中。根据实现的功能,所述图像分割方法装置100可以包括特征提取模块101、上采样模块102和图像分割模块103。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述特征提取模块101,用于利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;
所述上采样模块102,用于将所述特征图进行拼接并执行上采样操作,得到复原图像;
所述图像分割模块103,用于利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
本发明实施例所提供的图像分割方法装置100中的模块能够在使用时模拟多个生物视网膜成像的效果,在对图像进行特征提取时,扩大感受野范围的同时保留特征图中的高分辨率信息,提高图像分割的精确度,其在具体运行时采用上述的图2至图6对应的方法实施例一样的技术手段,并产生一样的技术效果,这里不再赘述。
如图8所示,是本发明第三实施例提供的实现图像分割方法的电子设备的结构示意图。
所述电子设备1可以是一台服务器,并包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如图像分割方法程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如图像分割方法程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行图像分割方法程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图8示出了具有部件的电子设备,本领域技术人员可以理解的是,图6出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的图像分割方法程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;
将所述特征图进行拼接并执行上采样操作,得到复原图像;
利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种图像分割方法,其特征在于,所述方法包括:
利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;
将所述特征图进行拼接并执行上采样操作,得到复原图像;
利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
2.如权利要求1所述的图像分割方法,其特征在于,所述图像分割模型中每一个尺度的卷积核并行连接多个空洞率的空洞卷积,且空洞卷积的空洞率随着所连接的卷积核尺度的增大而增大。
3.如权利要求2所述的图像分割方法,其特征在于,所述利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图,包括:
利用所述多个尺度的卷积核对待分割图像中的同一特征进行特征提取,得到每个尺度的卷积核输出的第一特征图;
利用每个尺度的卷积核连接的空洞卷积对该尺度的卷积核输出的第一特征图进行卷积操作,得到特征图。
4.如权利要求1所述的图像分割方法,其特征在于,所述将所述特征图进行拼接并执行上采样操作,得到复原图像,包括:
将所述特征图进行拼接,得到拼接图;
将所述拼接图进行第一阈值倍数的上采样,得到中间特征图;
将所述中间特征图进行第二阈值倍数的上采样,得到原图尺寸的复原图像。
5.如权利要求1至4中任一项所述的图像分割方法,其特征在于,所述利用图像分割算法对所述复原图像进行像素分割,得到分割图像,包括:
将所述复原图像进行灰度值转化,得到灰度图像;
按照所述灰度图像中每个像素的灰度值将像素进行聚类;
根据聚类的结果将所述灰度图像中的像素进行分割,得到分割图像。
6.如权利要求1至4中任一项所述的图像分割方法,其特征在于,所述利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图之前,所述方法还包括:
采集场景图像集,对所述场景图像集进行异常数据剔除,得到去异常图像集;
利用标注工具对所述去异常图像集进行数据标注,得到标注图像集,将所述标注图像集按照预设比例划分为训练图像集和测试图像集;
利用所述训练图像集对所述图像分割模型进行预设次数的迭代训练;
利用所述测试图像集对迭代后的图像分割模型进行性能指标测试;
当所述性能指标达到预设区间阈值内时,得到训练完成的图像分割模型。
7.如权利要求6所述的图像分割方法,其特征在于,所述利用所述训练图像集对所述图像分割模型进行预设次数的迭代训练,包括:
将所述训练图像集输入至所述图像分割模型进行迭代,得到模型的输出结果;
利用损失函数计算图像分割模型的输出结果与所述训练图像集中标签的差异值;
当所述差异值大于或等于预设差异阈值时,利用梯度下降算法对所述图像分割模型的超参数进行更新;
当所述图像分割模型的迭代次数达到所述预设次数或所述差异值小于预设差异阈值时,得到迭代后的图像分割模型。
8.一种图像分割方法装置,其特征在于,所述装置包括:
特征提取模块,用于利用预先构建的包括多个尺度的卷积核和多个空洞率的空洞卷积的图像分割模型,对待分割图像进行特征提取,得到特征图;
上采样模块,用于将所述特征图进行拼接并执行上采样操作,得到复原图像;
图像分割模块,用于利用图像分割算法对所述复原图像进行像素分割,得到分割图像。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的图像分割方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的图像分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010946576.2A CN111915615A (zh) | 2020-09-10 | 2020-09-10 | 图像分割方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010946576.2A CN111915615A (zh) | 2020-09-10 | 2020-09-10 | 图像分割方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111915615A true CN111915615A (zh) | 2020-11-10 |
Family
ID=73266872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010946576.2A Pending CN111915615A (zh) | 2020-09-10 | 2020-09-10 | 图像分割方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111915615A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984105A (zh) * | 2022-12-07 | 2023-04-18 | 深圳大学 | 空洞卷积优化方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636807A (zh) * | 2018-11-27 | 2019-04-16 | 宿州新材云计算服务有限公司 | 一种图像分割与像素复原的葡萄病害叶片分割法 |
CN110020676A (zh) * | 2019-03-18 | 2019-07-16 | 华南理工大学 | 基于多感受野深度特征的文本检测方法、系统、设备及介质 |
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
KR20190119261A (ko) * | 2018-04-12 | 2019-10-22 | 가천대학교 산학협력단 | 멀티 스케일 이미지와 멀티 스케일 확장된 컨볼루션 기반의 완전 컨볼루션 뉴럴 네트워크를 이용한 시맨틱 이미지 세그먼테이션 장치 및 그 방법 |
CN110826596A (zh) * | 2019-10-09 | 2020-02-21 | 天津大学 | 一种基于多尺度可变形卷积的语义分割方法 |
CN110910405A (zh) * | 2019-11-20 | 2020-03-24 | 湖南师范大学 | 基于多尺度空洞卷积神经网络的脑肿瘤分割方法及系统 |
AU2020100274A4 (en) * | 2020-02-25 | 2020-03-26 | Huang, Shuying DR | A Multi-Scale Feature Fusion Network based on GANs for Haze Removal |
-
2020
- 2020-09-10 CN CN202010946576.2A patent/CN111915615A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
KR20190119261A (ko) * | 2018-04-12 | 2019-10-22 | 가천대학교 산학협력단 | 멀티 스케일 이미지와 멀티 스케일 확장된 컨볼루션 기반의 완전 컨볼루션 뉴럴 네트워크를 이용한 시맨틱 이미지 세그먼테이션 장치 및 그 방법 |
CN109636807A (zh) * | 2018-11-27 | 2019-04-16 | 宿州新材云计算服务有限公司 | 一种图像分割与像素复原的葡萄病害叶片分割法 |
CN110020676A (zh) * | 2019-03-18 | 2019-07-16 | 华南理工大学 | 基于多感受野深度特征的文本检测方法、系统、设备及介质 |
CN110826596A (zh) * | 2019-10-09 | 2020-02-21 | 天津大学 | 一种基于多尺度可变形卷积的语义分割方法 |
CN110910405A (zh) * | 2019-11-20 | 2020-03-24 | 湖南师范大学 | 基于多尺度空洞卷积神经网络的脑肿瘤分割方法及系统 |
AU2020100274A4 (en) * | 2020-02-25 | 2020-03-26 | Huang, Shuying DR | A Multi-Scale Feature Fusion Network based on GANs for Haze Removal |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984105A (zh) * | 2022-12-07 | 2023-04-18 | 深圳大学 | 空洞卷积优化方法、装置、计算机设备及存储介质 |
CN115984105B (zh) * | 2022-12-07 | 2023-08-01 | 深圳大学 | 空洞卷积优化方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111932482B (zh) | 图像中目标物的检测方法、装置、电子设备及存储介质 | |
CN112446919B (zh) | 物体位姿估计方法、装置、电子设备及计算机存储介质 | |
CN113283446B (zh) | 图像中目标物识别方法、装置、电子设备及存储介质 | |
CN112465060A (zh) | 图像中目标物检测方法、装置、电子设备及可读存储介质 | |
CN111932547B (zh) | 图像中目标物的分割方法、装置、电子设备及存储介质 | |
CN113065609B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
CN111310671B (zh) | 基于深度学习的加热炉底部积水坑异常识别方法、系统及设备 | |
CN111639704A (zh) | 目标识别方法、装置及计算机可读存储介质 | |
CN111414916A (zh) | 图像中文本内容提取生成方法、装置及可读存储介质 | |
CN108615401B (zh) | 基于深度学习的室内非均匀光线车位状况识别方法 | |
CN112016617A (zh) | 细粒度分类方法、装置及计算机可读存储介质 | |
CN114066664A (zh) | 基于行为画像的风险等级评估方法、装置、设备及介质 | |
CN111915615A (zh) | 图像分割方法、装置、电子设备及计算机可读存储介质 | |
CN111210398A (zh) | 基于多尺度池化的白细胞识别系统 | |
CN111445446B (zh) | 一种基于改进的U-net的混凝土表面裂缝检测方法 | |
CN117455762A (zh) | 基于全景行车记录仪的记录画面分辨率提升方法及系统 | |
CN111862034A (zh) | 图像检测方法、装置、电子设备及介质 | |
CN112580505A (zh) | 网点开关门状态识别方法、装置、电子设备及存储介质 | |
CN111931680A (zh) | 一种基于多尺度的车辆重识别方法及系统 | |
CN112561893A (zh) | 图片匹配方法、装置、电子设备及存储介质 | |
CN111652226B (zh) | 基于图片的目标识别方法、装置及可读存储介质 | |
CN114359645B (zh) | 基于特征区域的图像拓展方法、装置、设备及存储介质 | |
CN112633127B (zh) | 基于图像识别的公交车道检测方法、装置及介质 | |
CN113298159B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN112270245B (zh) | 行车违法检测方法、装置、设备及计算机介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |