CN109359654B

CN109359654B - 基于频率调谐全局显著度和深度学习的图像分割方法及系统

Info

Publication number: CN109359654B
Application number: CN201811087057.4A
Authority: CN
Inventors: 王瑜; 马泽源
Original assignee: Beijing Technology and Business University
Current assignee: Beijing Technology and Business University
Priority date: 2018-09-18
Filing date: 2018-09-18
Publication date: 2021-02-12
Anticipated expiration: 2038-09-18
Also published as: CN109359654A

Abstract

本发明提出了一种基于频率调谐全局显著度和深度学习的图像分割方法及系统，其中，该方法包括以下步骤：读取目标图像，并通过高斯核滤波使目标图像平滑，以获取平滑图像的显著度；根据平滑图像的显著度建立显著度增强公式，并根据显著度增强公式对目标图像进行显著度增强；将显著度增强后的目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。该方法得到的图像显著度增强视觉效果更加醒目，对于图像处理分析效果也有很大提高，分割区域边缘清晰，从而有效地区分出了图像中的不同物体。

Description

基于频率调谐全局显著度和深度学习的图像分割方法及系统

技术领域

本发明涉及图像处理和计算机视觉技术领域，特别涉及一种基于频率调谐全局显著度和深度学习的图像分割方法及系统。

背景技术

图像分割是图像识别和计算机视觉领域中至关重要的部分，进行分割的依据包括图像中像素的亮度及颜色，由计算机自动处理分割时，将会遇到各种困难，例如，光照不均匀、噪声的影响、图像中存在不清晰部分，以及阴影等，这些困难常常造成分割错误。因此图像分割是需要不断研究的技术之一。人们希望引入一些人为的知识导向和人工智能的方法，用于纠正某些分割中的错误，这是很有前途的方法，但是同时又增加了解决问题的复杂性。

图像显著性是图像中重要的视觉特征，体现了人眼对图像的某些区域的重视程度，近年来产生了大量的显著性映射方法，图像显著性也广泛应用于图像压缩、编码、图像边缘和区域加强、显著性目标分割和提取等任务。对于一幅图像来说，用户只对图像中的部分区域感兴趣，这部分感兴趣的区域代表了用户的查询意图，而多数剩余的不感兴趣区域则与用户查询意图无关。显著区域是图像中最能引起用户兴趣、最能表现图像内容的区域。

图像分割，是通过一定手段对原图像不同物体进行区分。然而，由于使用神经网络对图像分割经常受噪声等不同因素的影响，且消耗时间较多，因此利用神经网络来对图像分割是一个病态问题，为此，分割前对图像进行显著度增强是一种很好的预处理方法的。传统的显著度增强要么通过傅里叶变换计算得到，要么通过拉普拉斯变换计算获得。但是，这些方法得到的显著度增强很容易受到噪声的干扰，且只能对简单图像进行显著度增强，一旦面对复杂图像就会出现大规模失真，对图像分割的结果影响极大。同其他的显著度增强方法相比，频率调谐全局显著度增强方法有一个明显的优势，就是可以在增强图像的同时，使其尽可能保存原图像的实际情况，进而获得更好的图像分割结果。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种基于频率调谐全局显著度和深度学习的图像分割方法，该方法最终得到的图像显著度增强视觉效果更加醒目，对于图像处理分析效果也有很大提高，分割区域边缘清晰，从而有效地区分出了图像中的不同物体。

本发明的另一个目的在于提出一种基于频率调谐全局显著度和深度学习的图像分割系统。

为达到上述目的，本发明一方面提出了基于频率调谐全局显著度和深度学习的图像分割方法，包括以下步骤：读取目标图像，并通过高斯核滤波使所述目标图像平滑，以获取平滑图像的显著度；根据所述平滑图像的显著度建立显著度增强公式，并根据所述显著度增强公式对所述目标图像进行显著度增强；将显著度增强后的所述目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。

本发明实施例的基于频率调谐全局显著度和深度学习的图像分割方法，通过根据计算的显著度，设计显著度增强准则，对图像进行显著度增强，有效克服了传统显著度增强方法易受噪声影响及图像容易失真等问题，具有更好的增强效果，有效地保持了图像的纹理细节信息，也使得增强图像在分割时可以得到更好的结果。

另外，根据本发明上述实施例的基于频率调谐全局显著度和深度学习的图像分割方法还可以具有以下附加的技术特征：

进一步地，在本发明的一个实施例中，所述获取平滑图像的显著度，进一步包括：获取所述平滑图像的全局像素点均值；获取所述全局像素点均值与各个像素点的像素值之间的差值，以得到所述平滑图像的显著度。

进一步地，在本发明的一个实施例中，所述宽残差金字塔式池化网络包括：宽残差网络模块、分层结构的金字塔池化模块和尺寸恢复模块。

进一步地，在本发明的一个实施例中，所述宽残差网络模块中，残差网络由残差块堆叠组成，所述残差网络使用残差函数，公式如下：

x_l+1＝x_l+F(x_l,W_l)

其中，x_l表示网络第l个残差块的输入，x_l+1表示网络第l个残差块的输出，F(·)表示残差函数，W_l表示残差块的参数。

进一步地，在本发明的一个实施例中，所述分层结构的金字塔池化模块包括第一至第三池化核，且所述第一至第三池化核的大小各不相同，所述第一至第三池化核分别构成第一至第三池化通路，以将所述第一至第三池化通路获得的不同尺度全局上下文先验信息与池化模块的输入特征图相融合。

为达到上述目的，本发明另一方面提出了一种基于频率调谐全局显著度和深度学习的图像分割系统，包括：获取模块，用于读取目标图像，并通过高斯核滤波使所述目标图像平滑，以获取平滑图像的显著度；增强模块，用于根据所述平滑图像的显著度建立显著度增强公式，并根据所述显著度增强公式对所述目标图像进行显著度增强；分割模块，用于将显著度增强后的所述目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。

本发明实施例的基于频率调谐全局显著度和深度学习的图像分割系统，通过根据计算的显著度，设计显著度增强准则，对图像进行显著度增强，有效克服了传统显著度增强方法易受噪声影响及图像容易失真等问题，具有更好的增强效果，有效地保持了图像的纹理细节信息，也使得增强图像在分割时可以得到更好的结果。

另外，根据本发明上述实施例的基于频率调谐全局显著度和深度学习的图像分割系统还可以具有以下附加的技术特征：

进一步地，在本发明的一个实施例中，所述获取平滑图像的显著度，进一步包括：第一获取单元，用于获取所述平滑图像的全局像素点均值；第二获取单元，用于获取所述全局像素点均值与各个像素点的像素值之间的差值，以得到所述平滑图像的显著度。

x_l+1＝x_l+F(x_l,W_l)

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明实施例的基于频率调谐全局显著度和深度学习的图像分割方法流程图；

图2为根据本发明实施例的基于频率调谐全局显著度增强的结果的ROC曲线图；

图3为根据本发明实施例的于频率调谐全局显著度和深度学习的图像分割方法的具体实施流程图；

图4为根据本发明的具体图像增强实施例，其中，(a)为原始图像，(b)为全局显著度增强后的结果；

图5为根据本发明实施例的基于频率调谐全局显著度和深度学习的图像分割系统结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参照附图描述根据本发明实施例提出的基于频率调谐全局显著度和深度学习的图像分割方法及系统，首先将参照附图描述根据本发明实施例提出的基于频率调谐全局显著度和深度学习的图像分割方法。

图1是本发明一个实施例的基于频率调谐全局显著度和深度学习的图像分割方法流程图。

如图1所示，该基于频率调谐全局显著度和深度学习的图像分割方法包括以下步骤：

在步骤S101中，读取目标图像，并通过高斯核滤波使目标图像平滑，以获取平滑图像的显著度。

进一步地，在本发明的一个实施例中，获取平滑图像的显著度，进一步包括：

获取平滑图像的全局像素点均值；

获取全局像素点均值与各个像素点的像素值之间的差值，以得到平滑图像的显著度。

在步骤S102中，根据平滑图像的显著度建立显著度增强公式，并根据显著度增强公式对目标图像进行显著度增强。

举例而言，显著度增强公式为：如果某像素点像素值大于等于全局像素平均值的1.4倍，则将其像素值扩大为原来的1.5倍；如果像素值介于全局像素平均值的1.3倍到1.4倍之间，则将其像素值扩大为原来的1.2倍；如果像素值介于全局像素平均值的1.1倍到1.3倍之间，则令其像素值不变；如果像素值介于全局像素平均值的0.8倍到1.1倍之间，则将其像素值减少0.2倍的全局像素平均值；如果像素值介于全局像素平均值的0.5倍到0.8倍之间，则将其像素值减少0.25倍的全局像素平均值；如果像素值介于全局像素平均值的0.3倍到0.5倍之间，则将其像素值减少0.15倍的全局像素平均值；如果像素值小于全局像素平均值的0.3倍，则令其像素值不变。然后将经过显著度增强的图像进行检验。如图2所示，使用ImgSal数据库及配套的标签图像来进行ROC检验，数据库中有235张照片和已经有人工标注好的对照图像，将235幅图像进行增强，然后与对照图像进行比较，得到ROC曲线。

在步骤S103中，如图3所示，将显著度增强后的目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。

需要说明的是，根据显著度增强公式得到的增强图像进行数据扩展，从而来扩大数据量。其中，进行数据扩展具体的方法如下：

(1)50％的概率水平翻转，50％的概率垂直翻转；(2)旋转20％；(3)在水平和垂直方向上平移10％；(4)20％在水平方向上剪切；(5)放大缩小10％；(6)改变亮度；(7)弹性畸变。

进一步地，在本发明的一个实施例中，宽残差金字塔式池化网络包括：宽残差网络模块、分层结构的金字塔池化模块和尺寸恢复模块。

进一步地，在本发明的一个实施例中，宽残差网络模块中，残差网络由残差块堆叠组成，残差网络使用残差函数，公式如下：

x_l+1＝x_l+F(x_l,W_l)

进一步地，在本发明的一个实施例中，分层结构的金字塔池化模块包括第一至第三池化核，且第一至第三池化核的大小各不相同，第一至第三池化核分别构成第一至第三池化通路，以将第一至第三池化通路获得的不同尺度全局上下文先验信息与池化模块的输入特征图相融合。

具体地，若分层结构的金字塔池化模块包含4×4，2×2，1×1大小的三个池化核，即构成三个池化道路。对于池化核为4×4的池化通路，池化过后，特征图的尺寸大小为该模块原始输入特征图的尺寸大小的1/4，然后通过两个依次连接的2个3×3卷积层，和1个3×3反卷积层结构恢复图像的原始大小。同样，在池化核为2×2的通路上，池化过后是2个3×3卷积层，和1个3×3反卷积层结构，池化核为1×1的通路上，池化过后只有两个卷积核为3×3的卷积层，且在该模块中，每个卷积层和反卷积层输出的特征图个数均为128。最后，将池化模块三个通路获得的不同尺度全局上下文先验信息与池化模块的输入特征图相融合。其中，尺寸恢复模块包含两个结构，每个结构由2个3×3卷积层和1个3×3反卷积层组成，且每个卷积层和反卷积层输出的特征图个数均为64。尺寸恢复模块主要功能是将特征图的尺寸恢复至模型原始输入的大小。

如图4所示，本发明实施例的基于频率调谐全局显著度和深度学习的图像分割方法及系统具有如下优点：

第一、利用频率调谐，克服原有显著度增强方法容易受噪声影响的缺陷，以便获得具有最佳对比度和清晰度的增强效果。

第二、能够保持原图像的特征是频率调谐全局显著度图像增强技术最有价值的优势，尤其在复杂图像的实际应用中更是如此。

第三、使用宽残差金字塔式池化网络进行图像分割可以得到很好的分割结果，不仅可以减小误差，而且可以很大程度上减小运行时间。

根据本发明实施例提出的基于频率调谐全局显著度和深度学习的图像分割方法，通过根据计算的显著度，设计显著度增强准则，对图像进行显著度增强，有效克服了传统显著度增强方法易受噪声影响及图像容易失真等问题，具有更好的增强效果，有效地保持了图像的纹理细节信息，也使得增强图像在分割时可以得到更好的结果。

其次参照附图描述根据本发明实施例提出的基于频率调谐全局显著度和深度学习的图像分割系统。

图5是本发明一个实施例的基于频率调谐全局显著度和深度学习的图像分割系统结构示意图。

如图5所示，该基于频率调谐全局显著度和深度学习的图像分割系统10包括：获取模块100，增强模块200和分割模块300。

其中，获取模块100用于读取目标图像，并通过高斯核滤波使目标图像平滑，以获取平滑图像的显著度。增强模块200用于根据平滑图像的显著度建立显著度增强公式，并根据显著度增强公式对目标图像进行显著度增强。分割模块300用于将显著度增强后的目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。本发明实施例系统10最终得到的图像显著度增强视觉效果更加醒目，对于图像处理分析效果也有很大提高，分割区域边缘清晰，从而有效地区分出了图像中的不同物体。

进一步地，在本发明的一个实施例中，获取平滑图像的显著度，进一步包括：第一获取单元，用于获取平滑图像的全局像素点均值；第二获取单元，用于获取全局像素点均值与各个像素点的像素值之间的差值，以得到平滑图像的显著度。

x_l+1＝x_l+F(x_l,W_l)

需要说明的是，前述对基于频率调谐全局显著度和深度学习的图像分割方法实施例的解释说明也适用于该系统，此处不再赘述。

根据本发明实施例提出的基于频率调谐全局显著度和深度学习的图像分割系统，通过根据计算的显著度，设计显著度增强准则，对图像进行显著度增强，有效克服了传统显著度增强方法易受噪声影响及图像容易失真等问题，具有更好的增强效果，有效地保持了图像的纹理细节信息，也使得增强图像在分割时可以得到更好的结果。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于频率调谐全局显著度和深度学习的图像分割方法，其特征在于，包括以下步骤：

读取目标图像，并通过高斯核滤波使所述目标图像平滑，以获取平滑图像的显著度，其中，所述获取平滑图像的显著度，进一步包括：

获取所述平滑图像的全局像素点均值；

获取所述全局像素点均值与各个像素点的像素值之间的差值，以得到所述平滑图像的显著度；

根据所述平滑图像的显著度建立显著度增强公式，并根据所述显著度增强公式对所述目标图像进行显著度增强，其中，所述显著度增强公式为：如果某像素点像素值大于等于全局像素平均值的1.4倍，则将其像素值扩大为原来的1.5倍；如果像素值介于全局像素平均值的1.3倍到1.4倍之间，则将其像素值扩大为原来的1.2倍；如果像素值介于全局像素平均值的1.1倍到1.3倍之间，则令其像素值不变；如果像素值介于全局像素平均值的0.8倍到1.1倍之间，则将其像素值减少0.2倍的全局像素平均值；如果像素值介于全局像素平均值的0.5倍到0.8倍之间，则将其像素值减少0.25倍的全局像素平均值；如果像素值介于全局像素平均值的0.3倍到0.5倍之间，则将其像素值减少0.15倍的全局像素平均值；如果像素值小于全局像素平均值的0.3倍，则令其像素值不变；以及

将显著度增强后的所述目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。

2.根据权利要求1所述的基于频率调谐全局显著度和深度学习的图像分割方法，其特征在于，所述宽残差金字塔式池化网络包括：宽残差网络模块、分层结构的金字塔池化模块和尺寸恢复模块。

3.根据权利要求2所述的基于频率调谐全局显著度和深度学习的图像分割方法，其特征在于，所述宽残差网络模块中，残差网络由残差块堆叠组成，所述残差网络使用残差函数，公式如下：

x_l+1＝x_l+F(x_l,W_l)

4.根据权利要求2所述的基于频率调谐全局显著度和深度学习的图像分割方法，其特征在于，所述分层结构的金字塔池化模块包括第一至第三池化核，且所述第一至第三池化核的大小各不相同，所述第一至第三池化核分别构成第一至第三池化通路，以将所述第一至第三池化通路获得的不同尺度全局上下文先验信息与池化模块的输入特征图相融合。

5.一种基于频率调谐全局显著度和深度学习的图像分割系统，其特征在于，包括：

获取模块，用于读取目标图像，并通过高斯核滤波使所述目标图像平滑，以获取平滑图像的显著度，其中，所述获取平滑图像的显著度，进一步包括：

第一获取单元，用于获取所述平滑图像的全局像素点均值；

第二获取单元，用于获取所述全局像素点均值与各个像素点的像素值之间的差值，以得到所述平滑图像的显著度；

增强模块，用于根据所述平滑图像的显著度建立显著度增强公式，并根据所述显著度增强公式对所述目标图像进行显著度增强，其中，所述显著度增强公式为：如果某像素点像素值大于等于全局像素平均值的1.4倍，则将其像素值扩大为原来的1.5倍；如果像素值介于全局像素平均值的1.3倍到1.4倍之间，则将其像素值扩大为原来的1.2倍；如果像素值介于全局像素平均值的1.1倍到1.3倍之间，则令其像素值不变；如果像素值介于全局像素平均值的0.8倍到1.1倍之间，则将其像素值减少0.2倍的全局像素平均值；如果像素值介于全局像素平均值的0.5倍到0.8倍之间，则将其像素值减少0.25倍的全局像素平均值；如果像素值介于全局像素平均值的0.3倍到0.5倍之间，则将其像素值减少0.15倍的全局像素平均值；如果像素值小于全局像素平均值的0.3倍，则令其像素值不变；以及

分割模块，用于将显著度增强后的所述目标图像进行数据扩展，并通过宽残差金字塔式池化网络深度学习方法分割增强后的图像，以获取分割结果。

6.根据权利要求5所述的基于频率调谐全局显著度和深度学习的图像分割系统，其特征在于，所述宽残差金字塔式池化网络包括：宽残差网络模块、分层结构的金字塔池化模块和尺寸恢复模块。

7.根据权利要求6所述的基于频率调谐全局显著度和深度学习的图像分割系统，其特征在于，所述宽残差网络模块中，残差网络由残差块堆叠组成，所述残差网络使用残差函数，公式如下：

x_l+1＝x_l+F(x_l,W_l)

8.根据权利要求6所述的基于频率调谐全局显著度和深度学习的图像分割系统，其特征在于，所述分层结构的金字塔池化模块包括第一至第三池化核，且所述第一至第三池化核的大小各不相同，所述第一至第三池化核分别构成第一至第三池化通路，以将所述第一至第三池化通路获得的不同尺度全局上下文先验信息与池化模块的输入特征图相融合。