CN112560864A

CN112560864A - 图像语义分割方法、装置及图像语义分割模型的训练方法

Info

Publication number: CN112560864A
Application number: CN202011527897.5A
Authority: CN
Inventors: 张飞; 孙腾腾; 康健; 王建峰; 梁波
Original assignee: Suzhou Chaoyun Life Intelligence Industry Research Institute Co ltd
Current assignee: Suzhou Chaoyun Life Intelligence Industry Research Institute Co ltd
Priority date: 2020-12-22
Filing date: 2020-12-22
Publication date: 2021-03-26
Anticipated expiration: 2040-12-22
Also published as: CN112560864B

Abstract

本申请涉及一种图像语义分割方法、装置及图像语义分割模型的训练方法。所述方法包括：通过将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征，并对每个通道提取的图像特征进行第一融合处理，得到第一融合特征，基于第一融合特征进行上采样，并与相同尺寸的图像特征进行第二融合处理，得到待分割图像的语义分割结果。其通过采用多通道特征提取网络进行特征提取，从而提高了对待分割图像细节特征信息的提取，通过应用跳转连接的方式对提取的特征进行特征融合，从而提高了对边界信息的识别准确度。

Description

图像语义分割方法、装置及图像语义分割模型的训练方法

技术领域

本申请涉及图像识别技术领域，特别是涉及一种基于特征融合的图像语义分割方法、装置及图像语义分割模型的训练方法。

背景技术

图像语义分割是将图像中每个像素都标注上其对应的类别，并将属于同一类别的像素归为一类。换句话说，图像语义分割就是从像素级别理解图像信息。在深度学习应用之前，一般采用纹理基元森林和随机森林等方法构建实现图像语义分割的分类器。随着深度学习的广泛应用，基于卷积神经网络的图像语义分割算法得到了快速的发展。在深度学习应用于图像语义分割之初，切块分类算法(patch classification)依据每个像素周围的图块，对该像素进行区别实现图像的语义分割。应用图块最主要的原因是分类网络(classification networks)通常应用全连接层，因此要求一个固定的图像尺寸。

而目前主流的基于深度学习的图像分割算法多是基于全卷积网络(Fullconvolution network，简称FCN)演变而来。由于FCN没有全连接层，因此，可以实现任意尺寸图像的输入。但是，由于卷积中的边框信息填充及边界区域像素特征的较弱判别性，从而导致应用FCN进行图像语义分割容易出现边界误检的问题。

发明内容

基于此，有必要针对上述图像语义分割容易出现边界误检的问题，提供一种能够减少边界信息误检的基于特征融合的图像语义分割方法、装置及图像语义分割模型的训练方法。

一种图像语义分割方法，所述方法包括：

将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征；

对所述每个通道提取的图像特征进行第一融合处理，得到第一融合特征；

基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的图像特征进行第二融合处理，得到所述待分割图像的语义分割结果。

在其中一个实施例中，所述多通道特提取网络包括并行的对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道；所述将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征，包括：通过所述对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像的全局特征；通过所述第一非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的纵向特征以及所述待分割图像左右两边的第一边界特征；通过所述第二非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的横向特征以及所述待分割图像上下两边的第二边界特征。

在其中一个实施例中，所述对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道分别包括若干个卷积层，所述对称卷积核通道中每层卷积核的大小为5×5，所述第一非对称卷积核通道中每层卷积核的大小为1×5，所述第二非对称卷积核通道中每层卷积核的大小为5×1。

在其中一个实施例中，所述对所述每个通道提取的图像特征进行第一融合处理，得到第一融合特征，包括：对所述对称卷积核通道提取的全局特征、所述第一非对称卷积核通道提取的纵向特征和第一边界特征以及所述第二非对称卷积核通道提取的横向特征和第二边界特征进行第一融合处理，得到所述第一融合特征。

在其中一个实施例中，所述基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的图像特征进行第二融合处理，得到所述待分割图像的语义分割结果，包括：对所述第一融合特征进行上采样，得到对应的上采样图像特征；根据所述上采样图像特征的尺寸，基于跳转连接将所述上采样图像特征与相同尺寸的所述图像特征进行第二融合处理，得到第二融合特征；对所述第二融合特征进行卷积降维处理，得到所述待分割图像的语义分割结果。

一种图像语义分割模型的训练方法，包括：

获取训练样本图像集，所述训练样本图像集中包括若干个样本图像，所述样本图像中具有样本分割区域及对应的样本类别信息；

将所述样本图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的样本图像特征；

对所述每个通道提取的样本图像特征进行第一融合处理，得到第一融合特征；

基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的样本图像特征进行第二融合处理，得到所述样本图像的语义分割结果，所述语义分割结果包括基于语义识别得到的所述样本图像的特征区域和对应的类别信息；

根据所述样本图像中的样本分割区域及对应的样本类别信息以及所述样本图像的特征区域和对应的类别信息计算损失值；

根据所述损失值反向传播，得到所述图像语义分割模型的模型文件。

在其中一个实施例中，所述获取训练样本图像集，包括：获取多个原始样本图像；对多个原始样本图像进行模糊处理或添加噪声参数，得到对应的处理后的样本图像；基于所述多个原始样本图像和对应的处理后的样本图像，生成训练样本图像集。

一种图像语义分割装置，所述装置包括：

特征提取模块，用于将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征；

特征融合模块，用于对所述每个通道提取的图像特征进行第一融合处理，得到第一融合特征；

结果确定模块，用于基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的图像特征进行第二融合处理，得到所述待分割图像的语义分割结果。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上所述方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述方法的步骤。

上述图像语义分割方法、装置及图像语义分割模型的训练方法，通过将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征，并对每个通道提取的图像特征进行第一融合处理，得到第一融合特征，基于第一融合特征进行上采样，并与相同尺寸的图像特征进行第二融合处理，得到待分割图像的语义分割结果。其通过采用多通道特征提取网络进行特征提取，从而提高了对待分割图像细节特征信息的提取，通过应用跳转连接的方式对提取的特征进行特征融合，从而提高了对边界信息的识别准确度。

附图说明

图1为一个实施例中图像语义分割方法的流程示意图；

图2为一个实施例中网络结构示意图；

图3为一个实施例中进行特征提取步骤的流程示意图；

图4为一个实施例中进行特征融合步骤的流程示意图；

图5为一个实施例中图像语义分割模型的训练方法的流程示意图；

图6为一个实施例中获取训练样本图像集步骤的流程示意图；

图7为一个实施例中图像语义分割装置的结构框图；

图8为一个实施例中计算机设备的内部结构图；

图9为另一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，提供了一种图像语义分割方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

步骤102，将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征。

其中，待分割图像是指待进行图像语义识别的图像。多通道特征提取网络是指用于进行特征提取且具有多个特征提取通道的卷积神经网络，其中，多个特征提取通道之间相互独立，分别用于提取待分割图像的浅层细粒度特征和深层粗糙特征。在本实施例中，当要对待分割图像进行图像语义识别时，则将待分割图像输入多通道特征提取网络中，由特征提取网络的每个通道分别对输入的待分割图像进行特征提取，从而得到特征提取网络每个通道提取的图像特征。

步骤104，对每个通道提取的图像特征进行第一融合处理，得到第一融合特征。

其中，第一融合处理是对图像特征在通道上的堆叠，以确保各个通道上图像特征信息的完整性和独立性。具体地，通过对每个通道提取的图像特征进行第一融合处理，即对每个通道提取的图像特征进行通道上的堆叠，在本实施例中，堆叠是指将多个通道提取的图像特征进行叠加，从而得到叠加也即融合后的第一融合特征。

步骤106，基于第一融合特征进行上采样，并与相同尺寸的图像特征进行第二融合处理，得到待分割图像的语义分割结果。

其中，上采样是在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素以放大图像的过程。语义分割结果是对待分割图像进行语义识别后得到的待分割图像的特征区域以及该特征区域对应的类别信息。在本实施例中，通过对第一融合特征进行上采样，即扩大第一融合特征的尺寸，进而将扩大尺寸后的第一融合特征即上采样结果与上述步骤102中每个通道提取的图像特征中相同尺寸的图像特征进行第二融合处理，即通过跳转连接，以确保网络浅层的细(fine-grain)粒度信息以及深层的粗糙(coarse)信息的相结合，从而实现精准的分割任务，并输出待分割图像的语义分割结果。

上述图像语义分割方法，通过将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征，并对每个通道提取的图像特征进行第一融合处理，得到第一融合特征，基于第一融合特征进行上采样，并与相同尺寸的图像特征进行第二融合处理，得到待分割图像的语义分割结果。其通过采用多通道特征提取网络进行特征提取，从而提高了对待分割图像细节特征信息的提取，通过应用跳转连接的方式对提取的特征进行特征融合，从而提高了对边界信息的识别准确度。

在一个实施例中，如图2所示，多通道特提取网络20包括并行的第一非对称卷积核通道21、对称卷积核通道22和第二非对称卷积核通道23。其中，第一非对称卷积核通道21、对称卷积核通道22和第二非对称卷积核通道23分别包括若干个卷积层。例如，第一非对称卷积核通道21中由上至下包括x11、x12、x13、x14以及x15共5层卷积核，对称卷积核通道22中由上至下包括x21、x22、x23、x24以及x25共5层卷积核，第二非对称卷积核通道23中由上至下包括x31、x32、x33、x34以及x35共5层卷积核。则在进行特征提取时，每个通道由上至下分别进行5次降采样操作，具体地，对称卷积核通道22中每层卷积核的大小为5×5，第一非对称卷积核通道21中每层卷积核的大小为1×5，第二非对称卷积核通道中每层卷积核的大小为5×1。在本实施例中，借鉴了Unet网络中的编码-解码(encoder-decoder)结构及跳转连接(skip connection)结构，通过多通道特征提取网络进行特征提取，其中多通道特征提取网络可以采用多种滤波器同时提取图像特征，从而从多个方面更加全面地提取图像信息。通过采用第一非对称卷积核通道以及第二非对称卷积核通道进行特征提取，不仅可以提取图像中关键的细节信息还可以较为完整的提取边界信息。

在一个实施例中，如图3所示，在步骤102中，将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征，具体包括：

步骤302，通过对称卷积核通道对待分割图像进行特征提取，得到待分割图像的全局特征。

由于对称卷积核通道22中由上至下包括x21、x22、x23、x24以及x25共5层卷积核，而每一层卷积核又包括卷积池化过程，其卷积过程中卷积核的大小为5×5，因此，在对待分割图像进行特征提取时，可以提取到待分割图像的全局特征。另外，通过由上至下的5次下采样特征提取，可以提取到更加深层次的全局图像特征。

步骤304，通过第一非对称卷积核通道对待分割图像进行特征提取，得到待分割图像中的纵向特征以及待分割图像左右两边的第一边界特征。

由于第一非对称卷积核通道21中由上至下包括x11、x12、x13、x14以及x15共5层卷积核，其每一层卷积核同样包括卷积池化过程，其卷积过程中卷积核的大小为1×5，因此，在对待分割图像进行特征提取时，不仅可以提取到待分割图像中的纵向特征，还可以提取到待分割图像左右两边的第一边界特征，其中，纵向特征包括图像中的纵向线条、纵向纹理以及图像的纵向整体状态，例如图像中细长物体的整体状态。另外，通过由上至下的5次下采样特征提取，可以提取到更加深层次的图像特征。

步骤306，通过第二非对称卷积核通道对待分割图像进行特征提取，得到待分割图像中的横向特征以及待分割图像上下两边的第二边界特征。

由于第二非对称卷积核通道23中由上至下包括x31、x32、x33、x34以及x35共5层卷积核，其每一层卷积核也同样包括卷积池化过程，其卷积过程中卷积核的大小为5×1，因此，在对待分割图像进行特征提取时，不仅可以提取到待分割图像中的横向特征，还可以提取到待分割图像上下两边的第二边界特征，其中，横向特征包括图像中的横向线条、横向纹理以及图像的横向整体状态。另外，通过由上至下的5次下采样特征提取，可以提取到更加深层次的图像特征。

上述实施例中，通过对称卷积核通道对待分割图像进行特征提取，得到待分割图像的全局特征，通过第一非对称卷积核通道对待分割图像进行特征提取，得到待分割图像中的纵向特征以及待分割图像左右两边的第一边界特征，通过第二非对称卷积核通道对待分割图像进行特征提取，得到待分割图像中的横向特征以及待分割图像上下两边的第二边界特征。通过基于不同维度对图像进行特征提取，从而能够实现对待分割图像细节特征信息的提取。

在一个实施例中，对每个通道提取的图像特征进行第一融合处理，得到第一融合特征，具体包括：通过对上述得到的对称卷积核通道提取的全局特征、第一非对称卷积核通道提取的纵向特征和第一边界特征以及第二非对称卷积核通道提取的横向特征和第二边界特征，在通道上进行特征的堆叠融合，以确保各个通道上图像特征信息的完整性和独立性，从而得到进行第一融合处理的第一融合特征。

在一个实施例中，如图4所示，在步骤106中，基于第一融合特征进行上采样，并与相同尺寸的图像特征进行第二融合处理，得到待分割图像的语义分割结果，具体包括如下步骤：

步骤402，对第一融合特征进行上采样，得到对应的上采样图像特征。

具体地，通过对第一融合特征进行上采样，即扩大第一融合特征的尺寸，从而得到第一融合特征对应的上采样图像特征。

步骤404，根据上采样图像特征的尺寸，基于跳转连接将上采样图像特征与相同尺寸的图像特征进行第二融合处理，得到第二融合特征。

在本实施例中，基于上采样图像特征的尺寸，通过跳转连接将上采样图像特征与上述由多通道特征提取网络提取的各通道的图像特征中相同尺寸的图像特征进行第二特征融合，得到第二融合特征。使得特征尺寸还原待分割图像的图像尺寸，并确保网络浅层的细粒度信息以及深层的粗糙信息的相结合。

步骤406，对第二融合特征进行卷积降维处理，得到待分割图像的语义分割结果。

其中，卷积降维处理可以通过卷积实现，即通过对第二融合特征进行1×1的卷积操作，从而得到待分割图像的语义分割结果。

进一步地，如图2所示，第一融合处理以及第二融合处理的过程可由图2中的特征融合模块24实现。具体地，特征融合模块24的输入为特征提取网络的三个通道，即第一非对称卷积核通道21、对称卷积核通道22和第二非对称卷积核通道23的输出，特征融合模块24首先将上述三个通道输入的特征进行特征融合(concat操作)，以进行特征在通道上的堆叠，确保各特征信息的完整性和独立性。然后进行上采样操作，上采样操作使用了反卷积，使特征尺寸扩大至2倍。重复以上操作进行4次上采样，并实现与特征提取阶段同尺寸特征的融合，使特征尺寸还原输入的待分割图像的尺寸。在完成上采样的一系列操作后，进行1x1的卷积操作实现降维，从而输出通道数为语义分割类别数，即输出对待分割图像的语义分割结果。

在一个实施例中，如图5所示，本申请还提供了一种图像语义分割模型的训练方法，包括：

步骤502，获取训练样本图像集。

其中，训练样本图像集中包括若干个样本图像，每一个样本图像中则具有样本分割区域及对应的样本类别信息。具体地，样本分割区域及对应的样本类别信息是用于模型进行语义学习的标签信息。

步骤504，将样本图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的样本图像特征。

其中，多通道特征提取网络可以采用如图2中所示的多通道特提取网络20，本实施例中不再对此进行赘述。具体地，当要对图像语义分割模型进行训练时，则将样本图像输入多通道特征提取网络中，由特征提取网络的每个通道分别对输入的样本图像进行特征提取，从而得到特征提取网络每个通道提取的样本图像特征。

步骤506，对每个通道提取的样本图像特征进行第一融合处理，得到第一融合特征。

其中，第一融合处理是对样本图像特征在通道上的堆叠，以确保各个通道上样本图像特征信息的完整性和独立性。具体地，通过对每个通道提取的样本图像特征进行第一融合处理，即对每个通道提取的样本图像特征进行通道上的堆叠，从而得到堆叠也即融合后的第一融合特征。

步骤508，基于第一融合特征进行上采样，并与相同尺寸的样本图像特征进行第二融合处理，得到样本图像的语义分割结果。

其中，语义分割结果包括基于语义识别得到的样本图像的特征区域和对应于该特征区域的类别信息。在本实施例中，通过对上述第一融合特征进行上采样，即扩大第一融合特征的尺寸，进而将扩大尺寸后的第一融合特征与上述步骤504中每个通道提取的样本图像特征中相同尺寸的样本图像特征进行第二融合处理，即通过跳转连接，以确保网络浅层的细(fine-grain)粒度信息以及深层的粗糙(coarse)信息的相结合，从而实现精准的分割任务，并输出样本图像的语义分割结果。

步骤510，根据样本图像中的样本分割区域及对应的样本类别信息以及样本图像的特征区域和对应的类别信息计算损失值。

具体地，通过将基于语义识别得到的样本图像的特征区域和对应于该特征区域的类别信息与样本图像中的真实标签数据(即样本图像的样本分割区域及对应于样本分割区域的样本类别信息)进行比对，从而得到两者之间的差异值也即损失值。

步骤512，根据损失值反向传播，得到图像语义分割模型的模型文件。

具体地，通过将损失值进行反向传播，以调整模型的网络参数，从而使得模型学习到的信息更加全面完整。当损失值趋于收敛或者稳定时，则停止模型训练。训练完成后，将训练过程中的网络结构及网络参数进行保存，从而生成图像语义分割模型的模型文件。其中，模型文件中的网络参数包括各层结构的参数数量及参数值。

上述图像语义分割模型的训练方法，通过获取训练样本图像集，将样本图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的样本图像特征，通过对每个通道提取的样本图像特征进行第一融合处理，得到第一融合特征，基于第一融合特征进行上采样，并与相同尺寸的样本图像特征进行第二融合处理，得到样本图像的语义分割结果，进而根据样本图像中的样本分割区域及对应的样本类别信息以及样本图像的特征区域和对应的类别信息计算损失值，根据损失值反向传播，从而得到图像语义分割模型的模型文件。从而在应用该模型文件进行图像语义分割时，不仅可以提取图像中关键的细节信息还可以较为完整的提取边界信息，从而提高了对边界信息的识别准确度，避免了对边界信息及细节信息误检、漏检的问题。

在一个实施例中，如图6所示，上述步骤502中，获取训练样本图像集，具体包括如下步骤：

步骤602，获取多个原始样本图像。

其中，原始样本图像是指未经过处理的原图像，具体地，可以是未经过处理的表格文档图像。在本实施例中，当要对模型进行训练时，则首先需要获取对模型进行训练的原始样本图像。

步骤604，对多个原始样本图像进行模糊处理或添加噪声参数，得到对应的处理后的样本图像。

其中，模糊处理可以采用滤波方式实现，即对原始样本图像采用不同的滤波方式进行滤波处理，以对图像进行不同程度的模糊，从而对模型训练时可以增加模型的鲁棒性。添加噪声参数是指对图像添加不同的干扰参数，以增加图像的泛化性，从而使得训练后的模型具有抗噪性。

步骤606，基于多个原始样本图像和对应的处理后的样本图像，生成训练样本图像集。

具体地，在本实施例中，将上述处理后的样本图像以及上述获取的多个原始样本图像共同作为训练样本图像集，通过该训练样本图像集对模型进行训练，从而使得模型在完成对训练样本图像集的学习后具有较强的鲁棒性及抗噪性。

应该理解的是，虽然图1-图6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-图6中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图7所示，提供了一种图像语义分割装置，包括：特征提取模块701、特征融合模块702和结果确定模块703，其中：

特征提取模块701，用于将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征；

特征融合模块702，用于对所述每个通道提取的图像特征进行第一融合处理，得到第一融合特征；

结果确定模块703，用于基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的图像特征进行第二融合处理，得到所述待分割图像的语义分割结果。

在一个实施例中，所述多通道特提取网络包括并行的对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道；所述特征提取模块具体用于：通过所述对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像的全局特征；通过所述第一非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的纵向特征以及所述待分割图像左右两边的第一边界特征；通过所述第二非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的横向特征以及所述待分割图像上下两边的第二边界特征。

在一个实施例中，所述对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道分别包括若干个卷积层，所述对称卷积核通道中每层卷积核的大小为5×5，所述第一非对称卷积核通道中每层卷积核的大小为1×5，所述第二非对称卷积核通道中每层卷积核的大小为5×1。

在一个实施例中，所述特征融合模块具体用于：对所述对称卷积核通道提取的全局特征、所述第一非对称卷积核通道提取的纵向特征和第一边界特征以及所述第二非对称卷积核通道提取的横向特征和第二边界特征进行第一融合处理，得到所述第一融合特征。

在一个实施例中，所述结果确定模块具体用于：对所述第一融合特征进行上采样，得到对应的上采样图像特征；根据所述上采样图像特征的尺寸，基于跳转连接将所述上采样图像特征与相同尺寸的所述图像特征进行第二融合处理，得到第二融合特征；对所述第二融合特征进行卷积降维处理，得到所述待分割图像的语义分割结果。

关于图像语义分割装置的具体限定可以参见上文中对于图像语义分割方法的限定，在此不再赘述。上述图像语义分割装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待分割图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像语义分割方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图像语义分割方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图8及图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

在一个实施例中，所述多通道特提取网络包括并行的对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道；处理器执行计算机程序时还实现以下步骤：通过所述对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像的全局特征；通过所述第一非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的纵向特征以及所述待分割图像左右两边的第一边界特征；通过所述第二非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的横向特征以及所述待分割图像上下两边的第二边界特征。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对所述对称卷积核通道提取的全局特征、所述第一非对称卷积核通道提取的纵向特征和第一边界特征以及所述第二非对称卷积核通道提取的横向特征和第二边界特征进行第一融合处理，得到所述第一融合特征。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对所述第一融合特征进行上采样，得到对应的上采样图像特征；根据所述上采样图像特征的尺寸，基于跳转连接将所述上采样图像特征与相同尺寸的所述图像特征进行第二融合处理，得到第二融合特征；对所述第二融合特征进行卷积降维处理，得到所述待分割图像的语义分割结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取训练样本图像集，所述训练样本图像集中包括若干个样本图像，所述样本图像中具有样本分割区域及对应的样本类别信息；将所述样本图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的样本图像特征；对所述每个通道提取的样本图像特征进行第一融合处理，得到第一融合特征；基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的样本图像特征进行第二融合处理，得到所述样本图像的语义分割结果，所述语义分割结果包括基于语义识别得到的所述样本图像的特征区域和对应的类别信息；根据所述样本图像中的样本分割区域及对应的样本类别信息以及所述样本图像的特征区域和对应的类别信息计算损失值；根据所述损失值反向传播，得到所述图像语义分割模型的模型文件。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取多个原始样本图像；对多个原始样本图像进行模糊处理或添加噪声参数，得到对应的处理后的样本图像；基于所述多个原始样本图像和对应的处理后的样本图像，生成训练样本图像集。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

在一个实施例中，所述多通道特提取网络包括并行的对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道；计算机程序被处理器执行时还实现以下步骤：通过所述对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像的全局特征；通过所述第一非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的纵向特征以及所述待分割图像左右两边的第一边界特征；通过所述第二非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的横向特征以及所述待分割图像上下两边的第二边界特征。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对所述对称卷积核通道提取的全局特征、所述第一非对称卷积核通道提取的纵向特征和第一边界特征以及所述第二非对称卷积核通道提取的横向特征和第二边界特征进行第一融合处理，得到所述第一融合特征。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对所述第一融合特征进行上采样，得到对应的上采样图像特征；根据所述上采样图像特征的尺寸，基于跳转连接将所述上采样图像特征与相同尺寸的所述图像特征进行第二融合处理，得到第二融合特征；对所述第二融合特征进行卷积降维处理，得到所述待分割图像的语义分割结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取训练样本图像集，所述训练样本图像集中包括若干个样本图像，所述样本图像中具有样本分割区域及对应的样本类别信息；将所述样本图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的样本图像特征；对所述每个通道提取的样本图像特征进行第一融合处理，得到第一融合特征；基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的样本图像特征进行第二融合处理，得到所述样本图像的语义分割结果，所述语义分割结果包括基于语义识别得到的所述样本图像的特征区域和对应的类别信息；根据所述样本图像中的样本分割区域及对应的样本类别信息以及所述样本图像的特征区域和对应的类别信息计算损失值；根据所述损失值反向传播，得到所述图像语义分割模型的模型文件。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取多个原始样本图像；对多个原始样本图像进行模糊处理或添加噪声参数，得到对应的处理后的样本图像；基于所述多个原始样本图像和对应的处理后的样本图像，生成训练样本图像集。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种图像语义分割方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述多通道特提取网络包括并行的对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道；所述将待分割图像输入多通道特征提取网络进行特征提取，得到特征提取网络每个通道提取的图像特征，包括：

通过所述对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像的全局特征；

通过所述第一非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的纵向特征以及所述待分割图像左右两边的第一边界特征；

通过所述第二非对称卷积核通道对所述待分割图像进行特征提取，得到所述待分割图像中的横向特征以及所述待分割图像上下两边的第二边界特征。

3.根据权利要求2所述的方法，其特征在于，所述对称卷积核通道、第一非对称卷积核通道和第二非对称卷积核通道分别包括若干个卷积层，所述对称卷积核通道中每层卷积核的大小为5×5，所述第一非对称卷积核通道中每层卷积核的大小为1×5，所述第二非对称卷积核通道中每层卷积核的大小为5×1。

4.根据权利要求2所述的方法，其特征在于，所述对所述每个通道提取的图像特征进行第一融合处理，得到第一融合特征，包括：

对所述对称卷积核通道提取的全局特征、所述第一非对称卷积核通道提取的纵向特征和第一边界特征以及所述第二非对称卷积核通道提取的横向特征和第二边界特征进行第一融合处理，得到所述第一融合特征。

5.根据权利要求1所述的方法，其特征在于，所述基于所述第一融合特征进行上采样，将上采样结果与相同尺寸的图像特征进行第二融合处理，得到所述待分割图像的语义分割结果，包括：

对所述第一融合特征进行上采样，得到对应的上采样图像特征；

根据所述上采样图像特征的尺寸，基于跳转连接将所述上采样图像特征与相同尺寸的所述图像特征进行第二融合处理，得到第二融合特征；

对所述第二融合特征进行卷积降维处理，得到所述待分割图像的语义分割结果。

6.一种图像语义分割模型的训练方法，其特征在于，所述方法包括：

7.根据权利要求6所述的方法，其特征在于，所述获取训练样本图像集，包括：

获取多个原始样本图像；

对多个原始样本图像进行模糊处理或添加噪声参数，得到对应的处理后的样本图像；

基于所述多个原始样本图像和对应的处理后的样本图像，生成训练样本图像集。

8.一种图像语义分割装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。