WO2019136760A1

WO2019136760A1 - 图像语义分割方法、可编程逻辑电路、系统及电子设备

Info

Publication number: WO2019136760A1
Application number: PCT/CN2018/072674
Authority: WO
Inventors: 肖梦秋
Original assignee: 深圳鲲云信息科技有限公司
Priority date: 2018-01-15
Filing date: 2018-01-15
Publication date: 2019-07-18
Also published as: CN109564684B; CN109564684A; US20210082119A1; US11636665B2

Abstract

一种图像语义分割方法、可编程逻辑电路、系统及电子设备。可编程逻辑电路包括卷积处理模块和反卷积处理模块。卷积处理模块接收图像后对其进行卷积运算处理，以生成图像的各个特征图块的特征数据；反卷积处理模块对各特征数据进行反卷积运算处理，以分别得到与各特征数据的特征图块同尺寸的图块区域；判断各特征数据与各预设语义类别的近似程度，并将各特征数据归为与其近似程度最高的预设语义类别中；其中，各预设语义类别关联有与其一一对应的各填充色彩；用各特征数据所在的预设语义类别所关联的色彩为对应的各图块区域进行色彩填充以实现对图像的语义分割。该方法通过硬件电路实现图像语义分割，极大程度上提高了数据处理速度。

Description

图像语义分割方法、可编程逻辑电路、系统及电子设备

技术领域

本发明涉及图像处理领域，特别是涉及图像语义分割方法、可编程逻辑电路、系统及电子设备。

背景技术

随着深度学习技术的发展，计算机对图像的语义分割能力逐步增强。利用基于深度学习的图像语义分割技术可以快速地对图像进行语义化分割，把图像中不同位置具有相同语义的像素点聚类成一个分类，并以相同的颜色进行标记。然而，现阶段的图像语义分割都是通过软件编程实现，处理速度有待提升。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供图像语义分割方法、可编程逻辑电路、系统及电子设备，通过可编程逻辑电路来实现图像语义分割，从而提高图像语义分割的处理速度。

为实现上述目的及其他相关目的，本发明提供一种图像语义分割方法，所述方法应用于可编程逻辑电路；所述可编程逻辑电路包括：卷积处理模块、及反卷积处理模块；所述方法包括：所述卷积处理模块接收需要进行语义分割的图像，并对所述图像进行卷积运算处理，以生成所述图像的各个特征图块的特征数据；所述反卷积处理模块对各所述特征数据进行反卷积运算处理，以分别得到与各所述特征数据的特征图块同尺寸的图块区域；判断各所述特征数据与各预设语义类别的近似程度，并将各所述特征数据归为与其近似程度最高的预设语义类别中；其中，各所述预设语义类别关联有与其一一对应的各填充色彩；用各所述特征数据所在的预设语义类别所关联的色彩为对应的各所述图块区域进行色彩填充以实现对所述图像的语义分割。

于本发明一实施例中，所述可编程逻辑电路还包括：共享缓存模块，电性连接于所述卷积处理模块及所述反卷积处理模块；所述方法还包括：所述卷积处理模块及所述反卷积处理模块通过所述共享缓存模块分时复用地发送或接收数据。

于本发明一实施例中，所述方法还包括：所述卷积处理模块在前一次对所述图像进行卷积运算处理的基础上再进行卷积运算处理，从而通过卷积层数的增加减少所述特征数据的数量。

于本发明一实施例中，所述方法还包括：所述反卷积处理模块在前一次对所述图像进行反卷积运算处理的基础上再进行反卷积运算处理，直至所有经卷积运算处理的图层逐一得到尺寸还原。

为实现上述目的及其他相关目的，本发明提供一种可编程逻辑电路，包括：卷积处理模块、及反卷积处理模块；所述卷积处理模块，用于接收需要进行语义分割的图像，并对所述图像进行卷积运算处理，以生成所述图像的各个特征图块的特征数据；所述反卷积处理模块，用于对各所述特征数据进行反卷积运算处理，以分别得到与各所述特征数据的特征图块同尺寸的图块区域；判断各所述特征数据与各预设语义类别的近似程度，并将各所述特征数据归为与其近似程度最高的预设语义类别中；其中，各所述预设语义类别关联有与其一一对应的各填充色彩；用各所述特征数据所在的预设语义类别所关联的色彩为对应的各所述图块区域进行色彩填充以实现对所述图像的语义分割。

于本发明一实施例中，所述可编程逻辑电路还包括：共享缓存模块，电性连接于所述卷积处理模块及所述反卷积处理模块，以供所述卷积处理模块及所述反卷积处理模块分时复用地发送或接收数据。

于本发明一实施例中，所述卷积处理模块还用于：在前一次对所述图像进行卷积运算处理的基础上再进行卷积运算处理，从而通过卷积层数的增加减少所述特征数据的数量。

于本发明一实施例中，所述反卷积处理模块还用于：在前一次对所述图像进行反卷积运算处理的基础上再进行反卷积运算处理，直至所有经卷积运算处理的图层逐一得到尺寸还原。

为实现上述目的及其他相关目的，本发明提供一种图像语义分割系统，包括：如上任一所述的可编程逻辑电路、中央处理器、及与所述中央处理器电性连接的内存；所述卷积处理模块电性连接所述中央处理器及所述内存；所述反卷积处理模块电性连接所述中央处理器及所述内存；在所述可编程逻辑电路还包括所述共享缓存模块的情况下，所述共享缓存模块还电性连接所述内存。

为实现上述目的及其他相关目的，本发明提供一种电子设备，包括：如上任一所述的图像语义分割系统。

如上所述，本发明的图像语义分割方法、可编程逻辑电路、系统及电子设备，通硬件电路实现了图像语义分割处理，极大程度上提高了图像语义分割处理的速度。

附图说明

图1显示为本发明一实施例中的图像语义分割系统的架构示意图。

图2A和图2B分别显示为仿真原始图及其经本发明的图像语义分割系统处理后的效果图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

本发明提供能够实现图像语义分割任务的可编程逻辑电路(FPGA电路)、包含该可编程逻辑电路的图像语义分割系统，以及包含该图像语义分割系统的电子设备，除此之外，还提供应用于该可编程逻辑电路的图像语义分割方法。相比于现有通过软件实现图像语义分割的方式，本发明通过采用硬件电路大大提高了图像语义分割的处理速度。

图1显示了一种图像语义分割系统的架构示意图。在该图像语义分割系统中包括：可编程逻辑电路，以及连接于该可编程逻辑电路之外的中央处理器(ARM CPU)、内存(DDR)。详细的，该可编程逻辑电路主要包括卷积处理模块及反卷积处理模块，无论是卷积处理模块还是反卷积处理模块都会电性连接于中央处理器及内存之间，当然，中央处理器与内存也是电性连接的，从而实现对内存的调用。

在图1所示的实施例中，卷积处理模块和反卷积处理模块通过总线桥接(AXI4-Lite Bridge)和互连(Interconnect 0)来实现与中央处理器的最终连接；卷积处理模块和反卷积处理模块先电性连接各自的直接内存存取模块(DMA 0和DMA 1)再通过互连(Interconnect 1)来实现与内存的最终连接。在另一种实施例中，卷积处理模块和反卷积处理模块之间还电性连接有共享缓存模块，从而有利于二者分时复用地发送或接受数据。

需要说明的是，本发明的图像语义分割系统，其卷积处理模块和反卷积处理模块与中央处理器和内存的电性连接并不受限于本实施例，本领域技术人员完全可以根据实际应用场景进行选择或变换。

所述卷积处理模块的电路结构例如包括：参数缓存器、输入缓存器、卷积运算电路及输出缓存器，其中，参数缓存器、输出缓存器分别连接卷积运算电路。所述卷积处理模块电性连接至外部存储器，所述外部存储器存储有待处理数据及权重参数。

所述参数缓存器用于接收并输出权重参数；所述输入缓存器包括：多个相连的行缓存器，用于接收并输出待处理数据；其中，各所述行缓存器每输出一位数据则集合形成一列数据输出；所述卷积运算电路用于从所述输入缓存器接收所述待处理数据、从所述参数缓存器接收权重参数，据以进行卷积运算并输出卷积运算结果；所述输出缓存器用于接收所述卷积运算结果并将该卷积运算结果向所述外部存储器输出。

所述卷积运算电路包括：多个并行运行的卷积核、加法器树。每一个所述卷积核包含用于进行卷积运算的乘法器；加法器树用于对多个所述乘法器的输出结果进行累加；每一个所述卷积器输入K×K矩阵形式的像素数据，根据输入的像素数据和所述权重参数经过卷积运算逐位输出像素数据。所述卷积器还包括池化运算电路，连接于所述输出缓存器和所述外部存储器之间，用于对所述卷积运算结果进行池化后向外部存储器输出。

本实施例的卷积处理模块在接收到需要进行语义分割的图像后，对所述图像进行卷积运算处理，从而得到所述图像的各个特征图块的特征数据。详细而言，卷积处理模块通过预设卷积核(如3×3滤波器矩阵)遍历所述图像，从而对于图像的每一个像素点，都能计算出它的邻域像素和滤波器矩阵的对应元素的乘积，然后将这些乘积值相加，作为该像素位置的值。为了方便说明，本发明将像素点及其邻域像素的集合称为特征图块，且将计算得到的该像素位置的值称为特征数据。

本实施例的反卷积处理模块对各所述特征数据进行反卷积运算处理，以分别得到与各所述特征数据的特征图块同尺寸的图块区域。承接前述，也即是将卷积过程中经“多合一”的图块区域再还原回去。对于还原后的图块区域，我们需要依照其语义类别为其填充色彩，从而让人们能够直观地辨识其语义。

所述反卷积处理模块的电路结构例如包括：参数缓存器、输入缓存器、反卷积运算电路及输出缓存器，其中，参数缓存器、输出缓存器分别连接反卷积运算电路。所述反卷积处理模块电性连接至外部存储器，所述外部存储器存储有待处理数据及权重参数。

所述参数缓存器用于接收并输出所述权重参数；所述输入缓存器包括：多个相连的行缓存器，用于接收并输出所述待处理数据；其中，各所述行缓存器每输出一位数据则集合形成一列数据输出；所述反卷积运算电路用于从所述输入缓存器接收所述待处理数据、从所述参数缓存器接收权重参数，据以进行反卷积运算并输出反卷积运算结果；所述输出缓存器用于接收所述反卷积运算结果并将该反卷积运算结果向所述外部存储器输出。

所述反卷积运算电路包括：多个并行运行的反卷积核、加法器树。每一个所述反卷积核包含用于进行反卷积运算的乘法器；加法器树用于对多个所述乘法器的输出结果进行累加；每一个所述反卷积器输入K×K矩阵形式的像素数据，根据输入的像素数据和所述权重参数经过反卷积运算逐位输出像素数据。所述反卷积器还包括池化运算电路，连接于所述输出缓存器和所述外部存储器之间，用于对所述反卷积运算结果进行池化后向外部存储器输出。

以下将详细说明本实施例的反卷积处理模块如何判断还原后的图块区域属于何种语义类别，以及为其填充何种色彩。

首先，分别判断各所述特征数据与各预设语义类别的近似程度，从而将各所述特征数据归为与其近似程度最高的预设语义类别中。举例来说，预先定义的语义类别有：房屋类、道路类、植被类，每个类别设置有一个数值范围，将每个特征数据分别与这些范围值进行比对，其与哪个数值范围越接近，就将其归入哪个类别其中。其次，每个预设语义类别都关联有与其一一对应的填充色彩，例如：房屋类对应蓝色、道路类对应灰色、植被类对应绿色等。当特征数据的语义类别确定后，以该特征数据所还原出的图块区域应当填充何种色彩也就被确定，例如：向归为房屋类的特征数据所还原出的图块区域填充蓝色，向归为道路类的特征数据所还原出的图块区域填充灰色，向归为植被类的特征数据所还原出的图块区域填充绿色。

图2a显示了某个街道场景下的俯视视角照片，该照片中包括了房屋、道路、植被等多种对象，图2b则是通过本发明提出的图像语义分割系统而实现的语义分割效果图，其通过不同的色彩将街道图片中的不同对象区分开来。

由上述实施例可见，一张图像在经过卷积核遍历后会产生大量的特征数据，从而提高了语义类别判断的工作量。在另一实施例中，所述卷积处理模块会对图像进行多次卷积处理，也即在前一次对图像进行卷积运算处理的基础上再进行卷积运算处理，依次循环，从而通过卷积层数的增加来减少特征数据的数量。对应的，在还原图块区域时，所述反卷积处理模块也需在前一次对图像进行反卷积运算处理的基础上再进行反卷积运算处理，直至所有经卷积运算处理的图层逐一得到尺寸还原。

需要说明的是，凡是包含前述任一实施例的图像语义分割系统的电子设备，也应在本发明所要保护的范围之内，由于篇幅所限，在此不一一列举。

与上述系统实施例相对应的，本发明还提供图像语义分割方法，该方法由前述任一实施例中的可编程逻辑电路执行。由于前述实施例中的技术特征也能应用于本方法实施例，因而不再重复赘述。本实施例的图像语义分割方法主要包括如下步骤：

首先，所述卷积处理模块接收需要进行语义分割的图像，并对所述图像进行卷积运算处理，以生成所述图像的各个特征图块的特征数据。

其次，所述反卷积处理模块对各所述特征数据进行反卷积运算处理，以分别得到与各所述特征数据的特征图块同尺寸的图块区域；判断各所述特征数据与各预设语义类别的近似程度，并将各所述特征数据归为与其近似程度最高的预设语义类别中；其中，各所述预设语义类别关联有与其一一对应的各填充色彩。

再次，用各所述特征数据所在的预设语义类别所关联的色彩为对应的各所述图块区域进行色彩填充以实现对所述图像的语义分割。

对于包括共享缓存模块的可编程逻辑电路，所述卷积处理模块及所述反卷积处理模块通过所述共享缓存模块分时复用地发送或接收数据。

在另一实施例中，所述卷积处理模块会对图像进行多次卷积处理，也即在前一次对图像进行卷积运算处理的基础上再进行卷积运算处理，依次循环，从而通过卷积层数的增加来减少特征数据的数量。对应的，在还原图块区域时，所述反卷积处理模块也需在前一次对图像进行反卷积运算处理的基础上再进行反卷积运算处理，直至所有经卷积运算处理的图层逐一得到尺寸还原。

需要说明的是，本发明的保护范围不限于本实施例列举的图像语义分割方法的步骤执行顺序，凡是根据实际需要进行灵活地顺序调整、步骤更替、删减、增加等做的变形，都包括在本发明的保护范围内。

综上所述，本发明的图像语义分割方法、可编程逻辑电路、系统及电子设备，通过硬件电路实现了图像语义分割处理，提高了图像处理速度，有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

一种图像语义分割方法，其特征在于，所述方法应用于可编程逻辑电路；所述可编程逻辑电路包括：卷积处理模块、及与其电性连接的反卷积处理模块；所述方法包括：

所述卷积处理模块接收需要进行语义分割的图像，并对所述图像进行卷积运算处理，以生成所述图像的各个特征图块的特征数据；

所述反卷积处理模块对各所述特征数据进行反卷积运算处理，以分别得到与各所述特征数据的特征图块同尺寸的图块区域；判断各所述特征数据与各预设语义类别的近似程度，并将各所述特征数据归为与其近似程度最高的预设语义类别中；其中，各所述预设语义类别关联有与其一一对应的各填充色彩；用各所述特征数据所在的预设语义类别所关联的色彩为对应的各所述图块区域进行色彩填充以实现对所述图像的语义分割。
根据权利要求1所述的方法，其特征在于，所述可编程逻辑电路还包括：共享缓存模块，电性连接于所述卷积处理模块及所述反卷积处理模块；所述方法还包括：所述卷积处理模块及所述反卷积处理模块通过所述共享缓存模块分时复用地发送或接收数据。
根据权利要求1所述的方法，其特征在于，还包括：所述卷积处理模块在前一次对所述图像进行卷积运算处理的基础上再进行卷积运算处理，从而通过卷积层数的增加减少所述特征数据的数量。
根据权利要求3所述的方法，其特征在于，还包括：所述反卷积处理模块在前一次对所述图像进行反卷积运算处理的基础上再进行反卷积运算处理，直至所有经卷积运算处理的图层逐一得到尺寸还原。
一种可编程逻辑电路，其特征在于，包括：卷积处理模块、及与其电性连接的反卷积处理模块；其中，

所述卷积处理模块，用于接收需要进行语义分割的图像，并对所述图像进行卷积运算处理，以生成所述图像的各个特征图块的特征数据；

所述反卷积处理模块，用于对各所述特征数据进行反卷积运算处理，以分别得到与各所述特征数据的特征图块同尺寸的图块区域；判断各所述特征数据与各预设语义类别的近似程度，并将各所述特征数据归为与其近似程度最高的预设语义类别中；其中，各所述预设语义类别关联有与其一一对应的各填充色彩；用各所述特征数据所在的预设语义类别所关联的色彩为对应的各所述图块区域进行色彩填充以实现对所述图像的语义分割。
根据权利要求5所述的可编程逻辑电路，其特征在于，还包括：共享缓存模块，电性连接于所述卷积处理模块及所述反卷积处理模块，以供所述卷积处理模块及所述反卷积处理模块分时复用地发送或接收数据。
根据权利要求5所述的可编程逻辑电路，其特征在于，所述卷积处理模块还用于：在前一次对所述图像进行卷积运算处理的基础上再进行卷积运算处理，从而通过卷积层数的增加减少所述特征数据的数量。
根据权利要求7所述的可编程逻辑电路，其特征在于，所述反卷积处理模块还用于：在前一次对所述图像进行反卷积运算处理的基础上再进行反卷积运算处理，直至所有经卷积运算处理的图层逐一得到尺寸还原。
一种图像语义分割系统，其特征在于，包括：中央处理器、及与其电性连接的内存，以及如权利要求5至8中任一所述的可编程逻辑电路；其中，所述卷积处理模块电性连接所述中央处理器及所述内存；所述反卷积处理模块电性连接所述中央处理器及所述内存；在所述可编程逻辑电路还包括所述共享缓存模块的情况下，所述共享缓存模块还电性连接所述内存。
一种电子设备，其特征在于，包括：如权利要求9所述的图像语义分割系统。