CN108898610A

CN108898610A - 一种基于mask-RCNN的物体轮廓提取方法

Info

Publication number: CN108898610A
Application number: CN201810810429.5A
Authority: CN
Inventors: 张汝民; 刘致励; 崔巍魏; 陈建文; 王文; 王文一; 曾辽原
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2018-07-20
Filing date: 2018-07-20
Publication date: 2018-11-27
Anticipated expiration: 2038-07-20
Also published as: CN108898610B

Abstract

本发明公开了一种基于mask‑RCNN的物体轮廓提取方法，首先通过训练获得一个mask‑RCNN模型，将待提取物体轮廓的RGB图像输入mask‑RCNN模型进行语义分割，通过mask‑RCNN网络处理得到RGB图像对应的二值掩膜图像，将RGB图像和对应的二值掩膜图像输入轮廓细化模块，提出了一种轮廓特征描述方式，准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask‑RCNN获得的二值掩膜图像轮廓进行自适应修正，最终实现图像质量不高如分辨率较低、目标模糊以及较低时间和空间复杂度情况下，图像实例轮廓的实时精确提取。

Description

一种基于mask-RCNN的物体轮廓提取方法

技术领域

本发明属于计算机视觉的图像物体检测与分割技术领域，具体涉及一种基于mask-RCNN的物体轮廓提取方法。

背景技术

图像检测与分割前瞻性论著包括Girshick等人提出的R-CNN(Regions with CNNfeatures)深度卷积神经网络的研究。Kaiming等人提出了SPP-Net模型解决上述问题，处理速度比R-CNN快30～170倍。为了进一步减小实例分割算法在时间和空间上的复杂度，Girshick提出了Fast-RCNN模型将特征提取和分类融合进一个分类框架，提高了训练模型的速度和目标检测的准确率。Kaiming等人通过在Faster-RCNN的基础上添加一个分支网络，在实现目标检测的同时，完成目标像素分割。

最初由Facebook AI研究院的Girshick等提出的R-CNN算法，是一种基于卷积神经网络的目标检测模型。其主要思想是首先使用选择搜索算法，在图像中提取若干个候选目标矩形区域，用深度卷积网络提取目标特征，最后用支持向量机训练一个分类器，对候选目标区域进行分类。其中提取特征的深度卷积网络包含5个卷积层、2个全连接层。这个目标检测框架在PASCAL VOC 2010数据库上检测的平均准确率达到62.9％。但R-CNN模型的缺陷主要有三点：①每幅图片要经过2 000次的深度卷积网络的运算，影响了目标检测的速度；②提取的候选目标区域必须要进行缩放到固定大小，这是与人脑处理图像的过程不符，人脑处理不同尺寸的图像并不需要缩放或裁剪到固定大小。

Kaiming等人的文章在R-CNN的基础上做了实质性的改进，提出了SPP-Net模型。取消了图像归一化过程，解决图像变形导致的信息丢失以及存储问题；采用空间金字塔池化(SpatialPyramid Pooling)替换了全连接层之前的最后一个池化层，最后使用支持向量机进行分类。空间金字塔池化的作用是对于不同大小的图像可以提取固定大小的特征向量，使得不同图片产生的特征图可与全连接层匹配。

Girshick提出了Fast-RCNN模型将特征提取和分类融合进一个分类框架，节省训练模型所需的时间和存储空间。在用深度卷积网络计算得到特征图后，用感兴趣区域RoI(Region of Interesting)投影的方式找到原图中候选目标区域在特征图上的对应区域，再用感兴趣区域(RoI)池化的方式获得固定尺寸的候选目标区域特征图，特征图经过全连接层的运算后，分别输入到一个分类器和一个回归器中。Fast-RCNN模型是一个整体，只需要一次训练过程就可以训练好网络的全部参数，因此大大提高了训练时间并且提升了目标检测的正确率。Fast-RCNN模型的训练比R-CNN模型快了9倍，比SPP-Net模型快了3倍。PASCAL VOC2007数据库上检测的平均准确率达到70％，明显优于R-CNN和SPP-Net模型。Faster R-CNN可看做“区域生成网络RPNs+Fast R-CNN”的系统，用区域生成网络代替FastR-CNN中的选择搜索方法。提高了检测精度和速度，真正实现端到端的目标检测框架，生成建议框仅需约10ms。

以上列举了一些国内外对目标检测和分割问题的研究，在缩减计算和存储复杂度方面，仍有进步的空间，由于图像模糊、分辨率低等因素导致的实例轮廓检测不精确和分割不完整的问题依然存在。一个更全面，同时保证速度快、存储少、精确度高的动态分割方法是今后研究发展的目标。

发明内容

本发明的目的在于：解决现有图像轮廓检测分割和提取存在由于图像模糊、分辨率低等因素导致的实例轮廓检测不精确和分割不完整的问题，提出一种基于mask-RCNN的物体轮廓提取方法，首先通过训练获得一个mask-RCNN实例分割模型，提出一种轮廓特征描述方式，准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的实例轮廓进行自适应修正，最终实现图像质量不高如分辨率较低、目标模糊以及较低时间和空间复杂度情况下，图像实例轮廓的实时精确提取。

本发明采用的技术方案如下：

一种基于mask-RCNN的物体轮廓提取方法，方法包括如下步骤：

步骤1、输入图片样本生成具有提取图像二值掩膜功能的mask-RCNN模型，将待提取物体轮廓的RGB图像输入生成的mask-RCNN模型进行语义分割，得到RGB图像对应的二值掩膜图像；

步骤2、结合RGB图像将其对应的二值掩膜图像进行轮廓细化步骤：采用轮廓修正算法对二值掩膜图像的轮廓进行细粒度的修正，先提取RGB图像和对应的二值掩膜图像的目标轮廓，再构建轮廓特征描述，包括轮廓角度信息特征向量和轮廓重心，基于计算出的目标轮廓特征描述，将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像轮廓进行轮廓融合，在二值掩膜图像上得到精细的轮廓形状和位置。

进一步，所述步骤2详细步骤如下：

步骤2.1、对RGB图像和二值掩膜图像进行图像的目标边缘检测，检测出RGB图像和二值掩膜图像的目标物体边缘；

步骤2.2、进行轮廓计算，对得到的RGB图像和二值掩膜图像的目标物体边缘建立层级关系，取第二层结果为目标轮廓；

步骤2.3、进行轮廓融合，先构建轮廓特征描述，包括轮廓角度信息特征向量和轮廓重心，基于计算出的目标轮廓特征描述，将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像进行轮廓融合，在二值掩膜图像上得到精细的轮廓形状和位置。

进一步，所述步骤2中mask-RCNN模型包括部件为：ROI对齐、卷积层和分类器。

进一步，所述步骤2中还包括对进行轮廓融合后的二值掩膜图像执行边缘内填充操作步骤。

进一步，所述边缘内填充操作步骤采用膨胀腐蚀操作方法，操作时用闭运算公式计算，先进行膨胀操作，再进行腐蚀操作，公式如下：

为膨胀操作，过程为：1)用结构元素B扫描图像A中的每一个像素；2)用结构元素与其覆盖的二值图像做“与”操作；3)操作结果如果都为0，结果图像的该像素为0，否则为1；

为腐蚀操作，过程为：1)用结构单元B扫描图像A的每一个像素；2)用结构元素与其覆盖的二值图像做“与”操作；3)操作结果如果都为1，结果图像的该像素为1，否则为0。

进一步，所述步骤1中图片样本包括各类可见物体训练样本，包含动物、植物、矿物、食物及生活中可见物品。

进一步，所述步骤2.1的目标边缘检测采用Canny边缘检测算法，算法步骤如下：

步骤2.1.1、将图像转换为灰度图，转换公式为：

gray＝0.299R+0.587G+0.114B (2-1)；

步骤2.1.2、设置高斯方差σ与窗口大小KernelWidth，生成高斯卷积核算子，对灰度图进行高斯卷积模糊；

步骤2.1.3、计算步骤2.1.2所得图像的图像梯度，由x和y方向的梯度计算图像某像素点的梯度幅值和角度，公式如下：

其中，G_x(x，y)为图像在x方向的梯度，G_y(x，y)为图像在y方向的梯度，S为图像在某点的像素值，θ(x，y)为像素点的角度；

步骤2.1.4、基于步骤2.1.3所得像素点的梯度幅值和角度，对步骤2.1.2所得图像进行非最大信号压制处理；

步骤2.1.5、对步骤2.1.4所得图像进行双阈值边缘连接处理；

步骤2.1.6、对步骤2.1.5所得图像进行二值化并输出结果。

进一步，所述步骤2中构建的轮廓角度信息特征向量为为轮廓上每个点x_i(1≤i≤n)与坐标原点的夹角，计算公式如下：

其中，p为图像上两点分别与相机光心连接所形成的夹角，d₁为连接光心与图像上一点x1的直线的方向，d₂为连接光心与图像上一点x2的直线的方向，T上标表示矩阵的转置，K为相机内置参数；

构建的轮廓重心为(c_x，c_y)，计算公式如下：

其中，n为这条轮廓上像素值的个数，i为像素的x坐标，j为像素的y坐标，g(i，j)为在点(i，j)位置上像素的大小，p与q为像素在x，y方向的矩的阶数，m_pq为中心距，(p+q)为中心距阶数，c_x、c_y为x轴和y轴方向上的重心坐标值。

进一步，所述步骤2中将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓的具体过程为：

计算RGB图像上目标轮廓的角度特征向量V＝(ρ₁，ρ₂，...，ρ_n)、目标重心和掩膜重心，连接目标重心和掩膜重心，判断连线与二值掩膜图像的目标轮廓是否有交点，保留没有交点的目标轮廓和重心与交点距离小于阈值γ的目标轮廓；

再以保留的目标轮廓的重心为一个端点，计算二值掩膜图像目标轮廓上各个点到该点的距离，对计算结果进行从小到大的排序，取前n个距离目标轮廓重心较小的点，并根据构建的轮廓角度信息特征向量计算该n个点组成的轮廓的特征描述U＝(δ₁，δ₂，...，δ_n)，计算向量U与V的余弦距离：

其中U为通过上一段描述方法构成的向量，是二值掩膜图像轮廓上截取了一段构成的向量，V为RGB图像上的目标轮廓构成的向量；

当cosψ小于阈值a时，则保留目标轮廓，否则，剔除该目标轮廓。

进一步，所述步骤2中保留的目标轮廓与二值掩膜图像进行轮廓融合的过程为：将保留的目标轮廓中所有边缘的所有点与二值掩膜图像上相同位置的点对应，如果对应的二值掩膜图像上点的像素为1，那么二值掩膜图像上该点像素值不变，依然为1，如果对应的二值掩膜图像上点的像素为0，那么二值掩膜图像上该点像素值置为1。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1、本发明中，首先通过训练获得一个mask-RCNN实例分割模型，考虑了实际情况中硬件设备计算能力不足、存储空间等因素的影响，使用mask R-CNN网络结构加速实例分割任务进程，提出一种轮廓特征描述方式，准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的实例轮廓进行自适应修正，最终实现较低时间和空间复杂度情况下，图像实例轮廓的实时精确提取，同时mask R-CNN与轮廓修正算法相结合，提高了系统鲁棒性，在图像质量不高如分辨率较低、目标模糊时训练好的系统始终可以检测出图像中实例的轮廓；

2、本发明中，对于轮廓融合后的二值掩膜图像执行边缘内填充操作步骤，采用膨胀腐蚀操作方法，操作时用闭运算公式计算，先进行膨胀操作，再进行腐蚀操作，能够去掉目标内的孔，连接邻近物体和平滑边界，将轮廓反映射和闭运算操作相结合，得到修正后的二值掩膜轮廓，该方法对mask R-CNN模型输出的轮廓进行了有效修正，进一步提高了实例分割的准确度；

3、本发明中，图片样本包括各类可见物体训练样本，包含动物、植物、矿物、食物及生活中可见物品，用内容丰富的图像对模型进行训练，使得该模块在不同种类的物体检测中具有较广的普适性；

4、本发明中，目标边缘检测的Canny边缘检测算法中，图像进行高斯模糊能够整体降低图像噪声，更准确计算图像梯度及边缘，通过非最大信号压制处理边缘像素进一步减少，能够实现边缘细化；

5、本发明中，构建轮廓角度信息特征向量为轮廓重心为(c_x，c_y)，能够准确表征物体轮廓的方向和角度信息，对轮廓修正的准确性提供了极大的帮助。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明方法框图；

图2为本发明mask-RCNN模型示意图；

图3为本发明轮廓细化模块原理图；

图4为本发明边缘层级关系图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明，即所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

一种基于mask-RCNN的物体轮廓提取方法，本发明方法可以看做一个整体，也可以将本方法整体分为三个模块，分别是网络训练模块、语义分割模块和轮廓细化模块，方法框图如图1所示，本发明先在网络训练模块中获得mask-RCNN模型，再在语义分割模块进行图像的语义分割，最后在轮廓细化模块中进行图像轮廓细化，得到精细的轮廓形状和位置。首先通过训练获得一个mask-RCNN实例分割模型，考虑了实际情况中硬件设备计算能力不足、存储空间等因素的影响，使用mask R-CNN网络结构加速了图像实例分割任务进程，提出一种轮廓特征描述方式，准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的实例轮廓进行自适应修正，最终实现较低时间和空间复杂度情况下，图像实例轮廓的实时精确提取，同时mask R-CNN与轮廓修正算法相结合，提高了系统鲁棒性，在图像质量不高如分辨率较低、目标模糊时训练好的系统始终可以检测出图像中实例的轮廓。本发明方法包括如下步骤：

步骤1、输入图片样本生成具有提取图像二值掩膜功能的mask-RCNN模型，将待提取物体轮廓的RGB图像输入生成的mask-RCNN模型进行语义分割，得到RGB图像对应的二值掩膜图像。mask-RCNN模型的作用是在像素级场景中识别不同目标，具体来说，对输入的任意一张RGB图像，经过mask-RCNN模型语义分割模块的处理，得到图像中物体的不同类别和轮廓信息。mask-RCNN模型包括部件为：ROI对齐、卷积层和分类器，模型示意图如图2所示。

进一步，所述步骤1中图片样本包括各类可见物体训练样本，包含动物、植物、矿物、食物及生活中可见物品。用内容丰富的图像对模型进行训练，得到一个可语义识别与分割RGB图像中各类物体的深度学习模型，使得该网络训练模块在不同种类的物体检测中具有较广的普适性，根据不同的训练样本可以得到不同的模型。

步骤2、结合RGB图像将其对应的二值掩膜图像进行轮廓细化步骤：采用轮廓修正算法对二值掩膜图像的轮廓进行细粒度的修正，在二值掩膜图像上得到精细的轮廓形状和位置，轮廓细化模块原理图如图3所示，步骤如下：

步骤2.1、对RGB图像和二值掩膜图像进行图像的目标边缘检测，检测出RGB图像和二值掩膜图像的目标物体边缘。

步骤2.1.1、将图像转换为灰度图，转换公式为：

gray＝0.299R+0.587G+0.114B (2-1)；

步骤2.1.2、设置高斯方差σ与窗口大小KernelWidth，生成高斯卷积核算子，对灰度图进行高斯卷积模糊，高斯模糊能够整体降低图像噪声，更准确计算图像梯度及边缘。

其中，G_x(x，y)为图像在x方向的梯度，G_y(x，y)为图像在y方向的梯度，S为图像在某点的像素值，θ(x，y)为像素点的角度。

步骤2.1.4、基于步骤2.1.3所得像素点的梯度幅值和角度，对步骤2.1.2所得图像进行非最大信号压制处理，通过该步处理边缘像素进一步减少，实现边缘细化。主要思想为：假设3x3的像素区域，中心像素P(x，y)根据上一步中计算得到边缘角度，可以将角度分为四个离散值0°、45°、90°和135°，得到角度之后，比较中心像素角度上相邻两个像素，如果中心像素小于其中任意一个，则舍弃该边缘像素点，否则保留。

步骤2.1.5、对步骤2.1.4所得图像进行双阈值边缘连接处理。过程为：选取高阈值TH和低阈值TL，取出非极大值抑制后的图像中的最大梯度幅值，重新定义高低阈值。将小于TL的点抛弃，赋0；将大于TH的点立即标记(这些点就是边缘点)，赋1；将大于TL，小于TH的点使用8连通区域确定(只有与TH像素连接时才会被接受，成为边缘点)，赋1。

步骤2.1.6、对步骤2.1.5所得图像进行二值化并输出结果。

步骤2.2、进行轮廓计算，对得到的RGB图像和二值掩膜图像的目标物体边缘建立层级关系，取第二层结果为目标轮廓。边缘层级关系图如图4所示。

步骤2.3、进行轮廓融合，先构建轮廓特征描述，包括轮廓角度信息特征向量和轮廓重心，基于计算出的目标轮廓特征描述，将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像轮廓进行轮廓融合，在二值掩膜图像上得到精细的轮廓形状和位置。

进一步，所述步骤2.3中构建的轮廓角度信息特征向量为为轮廓上每个点x_i(1≤i≤n)与坐标原点的夹角，计算公式如下：

构建的轮廓重心为(c_x，c_y)，计算公式如下：

进一步，所述步骤2.3中将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓的具体过程为：

计算RGB图像上目标轮廓的角度特征向量V＝(ρ₁，ρ₂，...，ρ_n)、目标重心和掩膜重心，连接目标重心和掩膜重心，判断连线与二值掩膜图像的目标轮廓是否有交点，保留没有交点的目标轮廓和重心与交点距离小于阈值γ的目标轮廓，此处阈值γ是通过大量实验获取的参数，是一个经验值；

当cosψ小于阈值a时，则保留目标轮廓，否则，剔除该目标轮廓，此处阈值a是通过大量实验获取的参数，是一个经验值。

进一步，所述步骤2.3中保留的目标轮廓与二值掩膜图像进行轮廓融合的过程为：将保留的目标轮廓中所有边缘的所有点与二值掩膜图像上相同位置的点对应，如果对应的二值掩膜图像上点的像素为1，那么二值掩膜图像上该点像素值不变，依然为1，如果对应的二值掩膜图像上点的像素为0，那么二值掩膜图像上该点像素值置为1。

进一步，所述步骤2中还包括对于步骤2.3进行轮廓融合后的二值掩膜图像执行边缘内填充操作步骤。

对于轮廓融合后的二值掩膜图像执行边缘内填充操作步骤，采用膨胀腐蚀操作方法，操作时用闭运算公式计算，先进行膨胀操作，再进行腐蚀操作，能够去掉目标内的孔，连接邻近物体和平滑边界，将轮廓反映射和闭运算操作相结合，得到修正后的二值掩膜轮廓，该方法对maskR-CNN模型输出的轮廓进行了有效修正，提高了实例分割的准确度。

以下结合实施例对本发明的特征和性能作进一步的详细描述。

实施例1

本发明较佳实施例提供的一种基于mask-RCNN的物体轮廓提取方法，过程为：

对待提取物体轮廓的RGB图进行复制，得到图像IM1和图像IM2，IM1与IM2完全相同。

第一步：使用获取的ImageNet训练样本预训练得到mask-RCNN模型，将IM1输入得到的mask-RCNN模型进行语义分割，可以获得场景中各个物体的二值掩膜图像。假设当前得到物体A的掩膜图像K1，掩膜图像K1与IM1图像同等大小，物体A所在的区域标记为1，而掩膜图像的其他区域标记为0。由于实际操作中得到的掩膜图像的物体A的区域与原RGB图像的物体A区域不能完全重合，边缘粗糙，因此接下来在轮廓细化模块中进行进一步的边缘细化操作。

第二步、采用Canny边缘检测算法对IM2进行边缘检测，得到边缘检测图像E1，使用Canny边缘检测算法对K1进行边缘检测，得到边缘检测图像E2。

第三步、进行轮廓计算，检测图像目标边缘，对所有边缘建立层级关系，取第二层结果为目标轮廓，由于在实际操作中RGB图像噪声比较多，纹理复杂，因此根据上述操作只能得到所有物体的最外部轮廓片段列表，假设对E1操作得到L1＝{e_1，e_2，e_3，e_4}；使用上述计算轮廓模块对E2进行检测与组织，由于在实际操作中得到的物体掩膜图像比较完整，因此可以得到物体A的大致轮廓L2。

第四步、计算轮廓角度信息特征向量轮廓重心(c_x，c_y)和轮廓方向θ，基于计算的轮廓特征描述，将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓。L1中的e₁，假设e₁由n个点构成，对构成e₁的每个点(x_i，y_i)(0＜i≤n，i∈R)，计算得到其轮廓角度信息特征向量F1，与其重心坐标M1(mx1，my1)；同时计算L2的重心坐标M2(mx2，my2)。连结M1与M2，如果没有交点或者M1与交点距离小于阈值γ，说明M1在轮廓L2内，继续计算M1到L2上各点(x′_i，y′_i)的距离d_j，假设L2上的点为t个，那么0＜j≤t，j∈R，对d₁到d_t进行从小到大排序，根据这个距离对应的L2上的点，取其前n个距离M1最近的点，构成列表{p₁，p₂，p₃，…，p_n}，根据轮廓特征描述进行L2轮廓特征计算，得到轮廓角度信息特征向量F2，计算F1与F2的余弦距离，具体计算公式为：

当小于阈值a时，可以判断e₁是属于物体A的轮廓。

第五步、根据第四步保留的L1中的轮廓，假设是L′＝{e₁，e₂，e₃}，与掩膜图像K1进行轮廓融合。具体操作为，如e₁上的每个点坐标(x_i，y_i)，对应于K1上相同位置的像素，如果其像素值为1，那么该点像素值不变，仍为1，如果像素值为0，则该点像素值置为1。对于L′中的所有边缘的所有点执行如上操作。

第六步、对于第五步得到的掩膜图像，执行边缘内填充操作，这里采用膨胀腐蚀操作，进行闭运算，具体操作为：

闭运算有去掉目标内的孔，连接邻近物体和平滑边界的作用。先进行膨胀操作，再进行腐蚀操作。

为膨胀操作，过程为：

1)用结构元素B扫描图像A中的每一个像素。

2)用结构元素与其覆盖的二值图像做“与”操作。

3)操作结果如果都为0，结果图像的该像素为0，否则为1。

为腐蚀操作，过程为：

1)用结构单元B扫描图像A的每一个像素。

2)用结构元素与其覆盖的二值图像做“与”操作。

3)操作结果如果都为1，结果图像的该像素为1，否则为0。

通过上述所有步骤后，得到细化后的精细的物体轮廓。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于mask-RCNN的物体轮廓提取方法，其特征在于：方法包括如下步骤：

2.根据权利要求1所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2详细步骤如下：

3.根据权利要求1所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2中mask-RCNN模型包括部件为：ROI对齐、卷积层和分类器。

4.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2中还包括对进行轮廓融合后的二值掩膜图像执行边缘内填充操作步骤。

5.根据权利要求4所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述边缘内填充操作步骤采用膨胀腐蚀操作方法，操作时用闭运算公式计算，先进行膨胀操作，再进行腐蚀操作，公式如下：

6.根据权利要求1所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤1中图片样本包括各类可见物体训练样本，包含动物、植物、矿物、食物及生活中可见物品。

7.根据权利要求2所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2.1的目标边缘检测采用Canny边缘检测算法，算法步骤如下：

步骤2.1.1、将图像转换为灰度图，转换公式为：

gray＝0.299R+0.587G+0.114B (2-1)；

步骤2.1.5、对步骤2.1.4所得图像进行双阈值边缘连接处理；

步骤2.1.6、对步骤2.1.5所得图像进行二值化并输出结果。

8.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2中构建的轮廓角度信息特征向量为为轮廓上每个点x_i(1≤i≤n)与坐标原点的夹角，计算公式如下：

构建的轮廓重心为(c_x，c_y)，计算公式如下：

9.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2中将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配，筛选需要保留的RGB图像目标轮廓的具体过程为：

计算RGB图像上目标轮廓的角度特征向量V＝(ρ₁，ρ₂，…，ρ_n)、目标重心和掩膜重心，连接目标重心和掩膜重心，判断连线与二值掩膜图像的目标轮廓是否有交点，保留没有交点的目标轮廓和重心与交点距离小于阈值γ的目标轮廓；

再以保留的目标轮廓的重心为一个端点，计算二值掩膜图像目标轮廓上各个点到该点的距离，对计算结果进行从小到大的排序，取前n个距离目标轮廓重心较小的点，并根据构建的轮廓角度信息特征向量计算该n个点组成的轮廓的特征描述U＝(δ₁，δ₂，…，δ_n)，计算向量U与V的余弦距离：

10.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法，其特征在于：所述步骤2中保留的目标轮廓与二值掩膜图像进行轮廓融合的过程为：将保留的目标轮廓中所有边缘的所有点与二值掩膜图像上相同位置的点对应，如果对应的二值掩膜图像上点的像素为1，那么二值掩膜图像上该点像素值不变，依然为1，如果对应的二值掩膜图像上点的像素为0，那么二值掩膜图像上该点像素值置为1。