CN102521831A

CN102521831A - 基于多尺度分形维和神经网络的机器人视觉图像分割方法

Info

Publication number: CN102521831A
Application number: CN2011103940960A
Authority: CN
Inventors: 胡凯; 杨乐; 刘太磊; 曹晶晶; 王平; 谈玲
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2011-12-02
Filing date: 2011-12-02
Publication date: 2012-06-27

Abstract

本发明公开一种基于多尺度分形维和神经网络的机器人视觉图像分割方法，本发明属于机器人视觉技术领域。该方法采用了图像小波变换和分形维数相结合的方式进行图像分割，并且使用了神经网络的方法区分出所提取特征所属的图像区域，能够实现快速的图像分割。本发明方法利用自然界中不同物体表面纹理分形维数不同的特性，能够有效的分割出天空，树木，道路三个不同的区域。另外，在已有神经网络训练结果的基础上进行图像区域分割可以提高分割的速度，适用于运动过程中的机器人视觉系统。

Description

基于多尺度分形维和神经网络的机器人视觉图像分割方法

技术领域

本发明属于机器人视觉领域，具体涉及一种基于多尺度分形维数和神经网络的图像分割方法。

背景技术

图像分割被广泛应用于图像处理相关的各个领域，其中包括遥感图像、医学图像、交通图像等等。由于图像分割技术在图像处理过程中占有重要的地位，多年来一直受到研究人员的高度重视，至今已提出上千种分割算法。目前，使用比较广泛的分割算法包括基于阈值的分割方法、基于边缘的分割方法、基于区域的分割方法等等。其中，对于基于阈值的分割方法，其关键问题是确定一个最优阈值，但是当图像的灰度差异不明显或不同目标的灰度范围有重叠时，不能够确定一个精确地阈值，在实际应用中，该方法通常与其他方法结合使用。基于边缘的分割方法是利用不同区域间像素灰度不连续的特点检测出区域间的边缘，从而实现图像分割，其难点在于边缘检测时抗噪性和检测精度之间的矛盾。若提高检测精度，则噪声产生的伪边缘会导致不合理的轮廓；若提高抗噪性，则会产生轮廓漏检和位置偏差。基于区域的分割方法的实质是把某种相似性质的像素连通，从而构成最终的分割区域，该方法往往会造成图像的过度分割。图像分割算法近几年的发展趋势是多种特征融合的图像分割方法，除了利用图像的颜色特征外，还可以利用图像的梯度特征，几何空间特征，变换特征及统计特征等高层次特征，对每个待分割的像素，获得其对应的特征量，再进行特征的分类。通过多种特征的融合，图像像素能够被全面描述，从而得到很好的结果。

发明内容

本发明的目的是提出一种能够运用于机器人运动导航系统中快速实时的图像分割方法，该方法采用了图像小波变换和分形维数相结合的方式进行图像分割，并且使用了神经网络的方法区分出所提取特征所属的图像区域，能够实现快速的图像分割。

本发明具体采用如下技术方案：

一种基于多尺度分形维和神经网络的机器人视觉图像分割方法，其特征在于包括如下步骤：

步骤一、分别拍摄天空、道路、树木的图像，并对图像进行一系列的预处理，形成一个图片训练库，所述预处理包括：灰度化、直方图均衡化、调整图像尺寸为统一尺寸大小；

步骤二、对图片训练库中每张图像分别进行小波变换，得到每张图像的一幅低频近似图像和m幅高频细节图像，m为正整数；

步骤三、对图片训练库中每张图像经步骤二得到的m+1幅图像分别计算差分盒子维数，得到图片训练库中每张图像对应的m+1维分形特征向量；

步骤四、将图片训练库中每张图像对应的m+1维分形向量分别作为神经网络的输入，输出为01，10，11，分别对应天空、道路和树木，训练神经网络；

步骤五、将要进行图像分割的图片经过步骤一中的预处理，然后使用大小为w，像素点(x.y)为中心的窗口对整幅图像进行扫描，w取任意大于2的正整数，每个窗口均用步骤三中的方法计算出分形维数，作为像素点(x.y)的分形维特征，将上述分形维特征作为步骤四中经过训练的神经网络的输入，得到该像素所属类别；

步骤六、将步骤五中已归类完的三个区域用三个不同的灰度值显示出来，对图像中存在的一些由于归类错误而产生的杂小区域，使用数学形态学的方法将其去除。

本发明所具有的有益效果为：利用自然界中不同物体表面纹理分形维数不同的特性，能够有效的分割出天空，树木，道路三个不同的区域。另外，在已有神经网络训练结果的基础上进行图像区域分割可以提高分割的速度，适用于运动过程中的机器人视觉系统。

附图说明

图1为本发明图像分割方法流程图；

图2为本发明中计算差分盒子维数的示意图；

其中，1表示图像灰度曲面，2表示边长为r的立方体；

图3本发明统计图片库中图像；

图4小波变换结果，其中(a)为低频相似细节，(b)(c)(d)为高频细节；

图5本发明实验结果，其中(a)为原图，(b)为分割结果，(c)为平滑后结果。

具体实施方式

下面结合附图和具体例对本发明作进一步详细的描述。

如图1所示，本发明基于多尺度分形维和神经网络的机器人视觉图像分割方法包括如下步骤：

步骤(1)、拍摄天空、道路、树木的图像各1000张(每种图像数量以上千张为宜，本具体实施例取1000张)，并对其进行一系列的预处理，形成一个图片训练库(如图3所示)，

预处理包括：灰度化、直方图均衡化、调整图像尺寸为统一尺寸大小(长宽均为2^t，方便后续计算)。

步骤(2)、对图片训练库中每张图像分别进行小波变换，得到每张图像的一幅低频近似图像和m幅高频细节图像，m为正整数，本具体实施例中m＝3；

设经过步骤(1)调整后，图像的尺寸为M×N(M，N分别为图像在小波变换前的长宽尺寸，其中M＝2^t，N＝2^t，t为自然数)，对其进行一次小波变换，得到一幅低频相似图像和3副高频细节图像(如图4所示，其中(a)为低频相似图像，(b)(c)(d)为高频细节图像)，图像大小均为M1×N1(M1，N1分别为图像在小波变换后的长宽尺寸，其中M1＝2^t-1，N1＝2^t-1，k为自然数，即经过小波变换后图像的长宽尺寸均变为原图像的

)。

步骤(3)、对图片训练库中每张图像经步骤(2)得到的4幅图像分别计算差分盒子维数，得到图片训练库中每张图像对应的四维分形特征向量；

如图2，计算差分盒子维数的方法为：

设图片训练库中第p(p表示图像序号，p＝1，...，3000)张图像经步骤(2)得到的4幅图像中任一图像像素点(x，y)处的图像灰度值为z(x，y)，将z(x，y)作为Z坐标值，则(x，y，z(x，y))成为三维空间一个空间点。将灰度图像所有的像素都如此处理成为空间点，就构成一个三维空间中的曲面。将M1×N1大小的图像分割成大小为r×r的子块(M1/2\r＞1，r为整数)，则xy平面被分割成许多r×r的网格。在每个网格上是一列r×r×r的正方体盒子。设图像灰度在第(i，j)网格中的最小值和最大值分别落在从下往上数第k和第l个盒子中，则：

n_r(i，j)＝l-k+1

式中n_r(i.j)是覆盖第(i.j)网格中的图像所需要的盒子数，将上式改为易于用图像灰度值计算的形式如下：

n_r(i，j)＝int[(max I_k-min I_k)/r]+1

其中，I_k(k＝1，2，…，n)表示r×r单位面积内n个像素灰度值的大小。

覆盖整个图像所需的盒子数为：

N_{r} = \underset{i, j}{Σ} n_{r} (i, j)

由盒子分形维数的计算公式为：

D = \lim_{r &RightArrow; 0} (\log (N_{r}) / \log (1 / r))

式中D为分形维数，N_r为盒子数，r为步长(立方体的边长)。针对不同的r(本发明r分别取3～48)，计算相应的N_r，最后应用最小二乘法，即可求得分形维数D。

最后得到步骤(2)中四幅图像的分形维数分别为D1_p，D2_p，D3_p，D4_p。则图片训练库中第p张图像对应的四维分形特征向量为F_p＝[D1_p，D2_p，D3_p，D4_p]，由此可得到图片训练库中每张图像分别对应的四维分形特征向量。

步骤(4)、将上一步骤中得到的图片训练库中每张图像的四维分形特征向量作为神经网络的输入，输出为01，10，11(分别对应天空、道路、树木)，训练神经网络。

本具体实施例中神经网络为BP神经网络。

步骤(5)、将要进行图像分割的图片经过步骤(1)的预处理，再使用大小为w(w表示窗口大小，为大于2的正整数，通常取3～11)，像素点(x.y)为中心的窗口扫描，每个窗口均用步骤(3)中的方法计算出分形维数，作为像素点(x.y)的分形维特征。将上述分形维特征作为步骤(4)中经过训练的神经网络的输入，得到该像素所属类别。

步骤(6)、将步骤(5)中已归类完的三个区域用三个不同的灰度值显示出来，此时，图像中可能会存在一些由于归类错误而产生杂小区域，针对这些区域，本发明使用了数学形态学的方法将其去除。所述数学形态学方法包括膨胀，腐蚀，开运算和闭运算，结果如图5所示，其中(a)为原图，(b)为分割结果，(c)为平滑后结果。

Claims

1.一种基于多尺度分形维和神经网络的机器人视觉图像分割方法，其特征在于包括如下步骤：

2.如权利要求1所述的基于多尺度分形维和神经网络的机器人视觉图像分割方法，其特征在于所述步骤三的具体方法是：

设经过步骤一调整后，图像的尺寸为M×N，为计算方便，取M＝2^t，N＝2^t，t为自然数，则经过小波变换后，得到的m+1幅图像的大小均为M1×N1，其中M1＝2^t-1，N1＝2^t-1；

设图片训练库中第p张图像经步骤二得到的m+1幅图像中任一图像像素点(x，y)处的图像灰度值为z(x，y)，p代表图片训练库中图像的序号，将z(x，y)作为Z坐标值，则(x，y，z(x，y))成为三维空间一个空间点，将灰度图像所有的像素都如此处理成为空间点，就构成一个三维空间中的曲面，将M1×N1大小的图像分割成大小为r×r的子块，M1/2\r＞1，r为整数，则xy平面被分割成许多r×r的网格，在每个网格上是一列r×r×r的正方体盒子，设图像灰度在第(i，j)网格中的最小值和最大值分别落在从下往上数第k和第l个盒子中，则：

n_r(i，j)＝l-k+1

n_r(i，j)＝int[(max I_k-min I_k)/r]+1

其中，I_k，k＝1，2，…，n，表示r×r单位面积内n个像素灰度值的大小；

那么，覆盖整个图像所需的盒子数为：

N_{r} = \underset{i, j}{Σ} n_{r} (i, j)

由盒子分形维数的计算公式为：

D = \lim_{r &RightArrow; 0} (\log (N_{r}) / \log (1 / r))

式中D为分形维数，N_r为盒子数，r为步长，针对不同的r，计算相应的N_r，最后应用最小二乘法，求得分形维数D；

按上述方法求得m+1幅图像的分形维数分别为D1_p，D2_p，…Dm_p，Dm+1_p，则图片训练库中第p张图像对应的m+1维分形特征向量为[D1_p，D2_p，…Dm_p，Dm+1_p]，由此得到图片训练库中每张图像对应的m+1维分形特征向量。