CN111260724A

CN111260724A - 一种基于周期b样条的实例分割方法

Info

Publication number: CN111260724A
Application number: CN202010014819.9A
Authority: CN
Inventors: 马力; 欧阳能良; 王艳芳; 苏韶生; 汪方军
Original assignee: Individual
Current assignee: Zhongshan Yangshi Technology Co ltd
Priority date: 2020-01-07
Filing date: 2020-01-07
Publication date: 2020-06-09
Anticipated expiration: 2040-01-07
Also published as: CN111260724B

Abstract

本发明公开了一种基于周期B样条的实例分割方法，通过采集图片的物体轮廓坐标点反向求得周期B样条控制点，以周期B样条控制点结合神经网络回归获得各个周期B样条控制点的长度表示和角度表示，建立高斯热图、损失函数和目标构建式进行神经网络训练，获得周期B样条控制点的笛卡尔坐标，通过对物体轮廓进行周期B样条建模达到矢量化目的，再通过神经网络回归周期B样条控制点信息，从而在无需人工干预情况下快速准确地得到物体轮廓的矢量化表示。

Description

一种基于周期B样条的实例分割方法

技术领域

本发明涉及一种实例分割技术，特别是一种基于周期B样条的实例分割方法。

背景技术

实例分割是计算机视觉基础任务之一，它不仅能精确地对物体进行分类，还需要给出物体的位置掩码，近些年来，随着深度学习在计算机视觉中的应用，基于卷积神经网络的实例分割方法在相关数据集上的准确率越来越高，但同时，随之而来的是模型结构越来越复杂，速度和内存占用不能满足实际的应用需求，现有的实例分割方法主要分为三类：基于检测、基于分割和基于轮廓的，基于检测的实例分割方法先利用检测器检测物体的包围框，再于包围框中预测物体的掩码，基于分割的实例分割方法则相反，它是先产生整幅图像的像素级掩码，然后再确定每个物体，相比于像素级表示方法，基于轮廓的表示方法更简洁和高效，但是，利用现有的基于轮廓表示方法得到的轮廓不是矢量化的，从而不能应用于图像编辑算法中，用以操纵轮廓变换。

发明内容

为了克服现有技术的不足，本发明提供一种在不增加模型复杂性的情况下得到物体轮廓矢量化表示的基于周期B样条的实例分割方法。

本发明解决其技术问题所采用的技术方案是：

一种基于周期B样条的实例分割方法，通过采集图片的物体轮廓坐标点反向求得周期B样条控制点，以周期B样条控制点结合神经网络回归获得各个周期B样条控制点的长度表示和角度表示，建立高斯热图、损失函数和目标构建式进行神经网络训练，获得周期B样条控制点的笛卡尔坐标。

所述物体轮廓坐标点反向求得周期B样条控制点方法包括设立控制点C和控制点节点向量U，并建立B样条基函数B_i，t(u)，在确定B样条基函数的次数和周期性后建立B样条曲线，对物体轮廓点进行参数化后求得控制点C的矢量化表示。

所述B样条基函数B_i，t(u)公式为：

设n+1个控制点C＝C_i(i＝0，1，2，...，n)节点向量U＝(u_0，11₁，...，u_m}和B样条基函数次数t。

B样条曲线为：

物体矢量化公式为：

其中，n表示从轮廓上采样的点数，q_k为第k个轮廓点的坐标，t_k为q_k参数。

所述参数化包括累积弦长参数化和均匀参数化。

所述均匀参数化公式为：t₀＝0，t_n＝1，t_k＝k/n，k＝1，2，…，n。

所述累积弦长参数化公式为：

所述神经网络回归包括分类损失和回归损失。

所述分类损失为：

其中，α和β为损失函数的超参数。N为图像的中心点数目。

所述高斯热图构建方法包括设控制点个数为m+3＝n+1、网络的下采样率为R、中心点坐标

以及最终特征图位置

后，通过高斯核构建以

为中心高斯分布的物体检测高斯热图。

所述高斯核公式为

所述回归损失为：

其中，λ₁和λ₂是超参数，ρ_j和a_j分别为点在极坐标系下的长度表示和角度表示。

损失函数为：L＝L_cls+L_reg。

所述目标构建式为：

其中，θ_j＝arctan2(y_j，x_j)。

所述周期B样条控制点的笛卡尔坐标公式为：

控制点在极坐标系下的长度和角度公式为：

其中，

和

为预测的点的横坐标和纵坐标，(o₁，o₂)为神经网络的输出角度相关信息，t_j为先验角度，ρ_j为神经网络的输出长度相关信息，

和

为预测的角度和长度，j为点的序号。

本发明的有益效果是：本发明为得到物体的矢量化表示，用周期B样条来对物体轮廓进行建模，通过将笛卡尔坐标系下的控制点坐标转换到极坐标系下，降低了神经网络回归的难度，在满足性能和效果的前提下，通过周期B样条对物体轮廓进行建模，从而将像素分类问题转变为控制点回归问题，主要的效果体现在引入周期B样条在保持物体轮廓建模的准确性的同时，降低网络需要回归的点数，并为拟合物体轮廓的多样性提供了足够的灵活度，对物体轮廓曲线做出更精细的调节。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明的流程图；

图2是周期B曲线的拟合示例图；

图3是高斯热示例图；

图4是物体控制点的坐标处理示意流程图；

图5是本发明的实例分割结果图之一；

图6是本发明的实例分割结果图之二。

具体实施方式

参照图1，一种基于周期B样条的实例分割方法，通过采集图片的物体轮廓坐标点反向求得周期B样条控制点，以周期B样条控制点结合神经网络回归获得各个周期B样条控制点的长度表示和角度表示，建立高斯热图、损失函数和目标构建式进行神经网络训练，获得周期B样条控制点的笛卡尔坐标，通过对物体轮廓进行周期B样条建模达到矢量化目的，再通过神经网络回归周期B样条控制点信息，从而在无需人工干预情况下快速准确地得到物体轮廓的矢量化表示；采集图片的例图源自于COCO(Common Objects in Context)数据集，是微软团队提供的一个可以用来进行图像识别、分割和图像语义的数据集，一共有25G左右的图片和600M左右的标签文件，COCO数据集共有小类80个，提供了118287张训练图片，5000张验证图片，以及超过40670张测试图片，COCO分割标签有两种表示形式：polygons和RLE(run-length encoding)，单个对象可能需要多个polygon来表示，比如这个对象在图像中被遮挡；对于密集物体，分割标签使用RLE格式；RLE是对二值mask图像的一种编码方式

在本实施例中对COCO标签处理方式：其一，对于polygons格式的标注，直接将多边形的顶点作为周期B样条拟合的型值点；其二，对于RLE格式的标注，利用matlab中的函数bwboundaries函数求出物体轮廓坐标点，将轮廓点作为拟合的型值点；其三，对于不同的物体，为了得到相同数目的控制点，先用COCO提供的标注得到B样条曲线，此得到节点向量和控制顶点组，再在这个节点向量上等间距取若干点(或者其他方式选取)，通过原先求得的B样条曲线来得到这些新的节点处的函数值，来作为新的型值点，然后再对这些型值点进行拟合，这样，对于不同的物体，能够保证节点向量相同，只有控制顶点坐标会改变，使得应用网络训练成为可能。

参照图2，所述物体轮廓坐标点反向求得周期B样条控制点方法包括设立控制点C和控制点节点向量U，并建立B样条基函数B_i，t(u)，在确定B样条基函数的次数和周期性后建立B样条曲线，对物体轮廓点进行参数化后求得控制点C的矢量化表示。

所述B样条基函数B_i，t(u)公式为：

设n+1个控制点C＝c_i(i＝0，1，2，...，n)、节点向量U＝{u₀,u₁，...，u_m}和B样条基函数次数t，ci是C的每个分量，

以3次周期B样条为例，假设节点向量为：

U＝{u_-3，u_-2U_-1，u₀，u₁，...，u_m，u_m+1，u_m+2，u_m+3}，控制点为C＝{C₀，C_1，C₂，...，c_m+2}；若节点向量中节点均匀或等距分布，节点向量定义了均匀的B样条基；令Δu_i＝u_i+1-u_i，若有

和控制点c₀＝C_m，C₁＝C_m+1，C₂＝C_m+2，则B样条具有周期性，样条上的点表示为

B样条曲线为：

物体矢量化公式为：

其中，n表示从轮廓上采样的点数，q_k为第k个轮廓点的坐标，t_k为q_k参数化形式，即

所述参数化包括累积弦长参数化和均匀参数化。

所述累积弦长参数化公式为：

所述神经网络回归包括分类损失和回归损失。

所述分类损失为：

其中，α和β为损失函数的超参数，一般设置为α＝2,β＝4。N为图像的中心点数目。x、y和c表示的是高斯热图在坐标(x,y,c)处的位置；

为网络预测的高斯热图，是网络预测的一个三维张量，作为分类损失的参数。

所述高斯热图构建方法包括设控制点个数为m+3、网络的下采样率为R，对m+3个控制点的坐标取平均，得到一个中心点，再将各个控制点坐标减去这个中心点坐标，得到m+3个向量，对于每个中心点坐标

计算出最终特征图位置

后，通过高斯核构建以

为中心高斯分布的物体检测高斯热图(参照图3)，最后预测的时候，取一定范围内(3×3)值最大的点作为中心点。

所述高斯核公式为

所述回归损失为：

其中，λ₁和λ₂是超参数，一般设置为λ₁＝0.5，λ₂＝1，ρ_j和a_j分别为点在极坐标系下的长度表示和角度表示，σ＝2。在实施例中采用基架网络，回归出物体的控制点坐标信息，基架网络可以是ResNet-18，DLA-34或者其他先进的模型结构。

损失函数为：L＝L_cls+L_reg。

控制点检测依赖于点周围的局部信息，它所在位置的特征是相似的，因此将控制点回归拆分成长度回归和角度回归，并给予角度以先验。

参照图4，轮廓点大致均匀分布在物体四周，以每个物体的中心点建立极坐标系，求控制点极坐标系下的长度和角度。每个控制点向量(x_j，y_j)都有其角度先验t_j，轮廓点的实际角度为θ_j，则目标构建式为：

a_j＝(o₁，o₂)＝(sin(θ_j-t_j)，cos(＝θ_j-t_j))。

其中，θ_j＝arctan2(y_j，x_j)。

所述周期B样条控制点的笛卡尔坐标公式为：

训练得出o₁，o₂和ρ_j后，得到物体控制点在极坐标系下的长度和角，结果的例如图5，控制点在极坐标系下的长度和角度公式为：

其中，

和

为预测的点的横坐标和纵坐标，(o₁，o₂)为神经网络的输出角度相关信息，t_j为先验角度，是预先选取的固定角度，对于m+3个向量，有m+3个角度先验，分别为t_j＝j/2π,j＝0,1,…,m+2，ρ_j为神经网络的输出长度相关信息，

和

为预测的角度和长度，j为点的序号。

本发明为了得到物体的矢量化表示，用周期B样条来对物体轮廓进行建模，通过将笛卡尔坐标系下的控制点坐标转换到极坐标系下，降低了神经网络回归的难度，在满足性能和效果的前提下，通过周期B样条对物体轮廓进行建模，从而将像素分类问题转变为控制点回归问题，主要的效果体现在引入周期B样条在保持物体轮廓建模的准确性的同时，降低网络需要回归的点数，并为拟合物体轮廓的多样性提供了足够的灵活度，对物体轮廓曲线做出更精细的调节。

以上的实施方式不能限定本发明创造的保护范围，专业技术领域的人员在不脱离本发明创造整体构思的情况下，所做的均等修饰与变化，均仍属于本发明创造涵盖的范围之内。