CN102521831A - 基于多尺度分形维和神经网络的机器人视觉图像分割方法 - Google Patents
基于多尺度分形维和神经网络的机器人视觉图像分割方法 Download PDFInfo
- Publication number
- CN102521831A CN102521831A CN2011103940960A CN201110394096A CN102521831A CN 102521831 A CN102521831 A CN 102521831A CN 2011103940960 A CN2011103940960 A CN 2011103940960A CN 201110394096 A CN201110394096 A CN 201110394096A CN 102521831 A CN102521831 A CN 102521831A
- Authority
- CN
- China
- Prior art keywords
- image
- fractal dimension
- neural network
- dimension
- fractal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种基于多尺度分形维和神经网络的机器人视觉图像分割方法,本发明属于机器人视觉技术领域。该方法采用了图像小波变换和分形维数相结合的方式进行图像分割,并且使用了神经网络的方法区分出所提取特征所属的图像区域,能够实现快速的图像分割。本发明方法利用自然界中不同物体表面纹理分形维数不同的特性,能够有效的分割出天空,树木,道路三个不同的区域。另外,在已有神经网络训练结果的基础上进行图像区域分割可以提高分割的速度,适用于运动过程中的机器人视觉系统。
Description
技术领域
本发明属于机器人视觉领域,具体涉及一种基于多尺度分形维数和神经网络的图像分割方法。
背景技术
图像分割被广泛应用于图像处理相关的各个领域,其中包括遥感图像、医学图像、交通图像等等。由于图像分割技术在图像处理过程中占有重要的地位,多年来一直受到研究人员的高度重视,至今已提出上千种分割算法。目前,使用比较广泛的分割算法包括基于阈值的分割方法、基于边缘的分割方法、基于区域的分割方法等等。其中,对于基于阈值的分割方法,其关键问题是确定一个最优阈值,但是当图像的灰度差异不明显或不同目标的灰度范围有重叠时,不能够确定一个精确地阈值,在实际应用中,该方法通常与其他方法结合使用。基于边缘的分割方法是利用不同区域间像素灰度不连续的特点检测出区域间的边缘,从而实现图像分割,其难点在于边缘检测时抗噪性和检测精度之间的矛盾。若提高检测精度,则噪声产生的伪边缘会导致不合理的轮廓;若提高抗噪性,则会产生轮廓漏检和位置偏差。基于区域的分割方法的实质是把某种相似性质的像素连通,从而构成最终的分割区域,该方法往往会造成图像的过度分割。图像分割算法近几年的发展趋势是多种特征融合的图像分割方法,除了利用图像的颜色特征外,还可以利用图像的梯度特征,几何空间特征,变换特征及统计特征等高层次特征,对每个待分割的像素,获得其对应的特征量,再进行特征的分类。通过多种特征的融合,图像像素能够被全面描述,从而得到很好的结果。
发明内容
本发明的目的是提出一种能够运用于机器人运动导航系统中快速实时的图像分割方法,该方法采用了图像小波变换和分形维数相结合的方式进行图像分割,并且使用了神经网络的方法区分出所提取特征所属的图像区域,能够实现快速的图像分割。
本发明具体采用如下技术方案:
一种基于多尺度分形维和神经网络的机器人视觉图像分割方法,其特征在于包括如下步骤:
步骤一、分别拍摄天空、道路、树木的图像,并对图像进行一系列的预处理,形成一个图片训练库,所述预处理包括:灰度化、直方图均衡化、调整图像尺寸为统一尺寸大小;
步骤二、对图片训练库中每张图像分别进行小波变换,得到每张图像的一幅低频近似图像和m幅高频细节图像,m为正整数;
步骤三、对图片训练库中每张图像经步骤二得到的m+1幅图像分别计算差分盒子维数,得到图片训练库中每张图像对应的m+1维分形特征向量;
步骤四、将图片训练库中每张图像对应的m+1维分形向量分别作为神经网络的输入,输出为01,10,11,分别对应天空、道路和树木,训练神经网络;
步骤五、将要进行图像分割的图片经过步骤一中的预处理,然后使用大小为w,像素点(x.y)为中心的窗口对整幅图像进行扫描,w取任意大于2的正整数,每个窗口均用步骤三中的方法计算出分形维数,作为像素点(x.y)的分形维特征,将上述分形维特征作为步骤四中经过训练的神经网络的输入,得到该像素所属类别;
步骤六、将步骤五中已归类完的三个区域用三个不同的灰度值显示出来,对图像中存在的一些由于归类错误而产生的杂小区域,使用数学形态学的方法将其去除。
本发明所具有的有益效果为:利用自然界中不同物体表面纹理分形维数不同的特性,能够有效的分割出天空,树木,道路三个不同的区域。另外,在已有神经网络训练结果的基础上进行图像区域分割可以提高分割的速度,适用于运动过程中的机器人视觉系统。
附图说明
图1为本发明图像分割方法流程图;
图2为本发明中计算差分盒子维数的示意图;
其中,1表示图像灰度曲面,2表示边长为r的立方体;
图3本发明统计图片库中图像;
图4小波变换结果,其中(a)为低频相似细节,(b)(c)(d)为高频细节;
图5本发明实验结果,其中(a)为原图,(b)为分割结果,(c)为平滑后结果。
具体实施方式
下面结合附图和具体例对本发明作进一步详细的描述。
如图1所示,本发明基于多尺度分形维和神经网络的机器人视觉图像分割方法包括如下步骤:
步骤(1)、拍摄天空、道路、树木的图像各1000张(每种图像数量以上千张为宜,本具体实施例取1000张),并对其进行一系列的预处理,形成一个图片训练库(如图3所示),
预处理包括:灰度化、直方图均衡化、调整图像尺寸为统一尺寸大小(长宽均为2t,方便后续计算)。
步骤(2)、对图片训练库中每张图像分别进行小波变换,得到每张图像的一幅低频近似图像和m幅高频细节图像,m为正整数,本具体实施例中m=3;
设经过步骤(1)调整后,图像的尺寸为M×N(M,N分别为图像在小波变换前的长宽尺寸,其中M=2t,N=2t,t为自然数),对其进行一次小波变换,得到一幅低频相似图像和3副高频细节图像(如图4所示,其中(a)为低频相似图像,(b)(c)(d)为高频细节图像),图像大小均为M1×N1(M1,N1分别为图像在小波变换后的长宽尺寸,其中M1=2t-1,N1=2t-1,k为自然数,即经过小波变换后图像的长宽尺寸均变为原图像的)。
步骤(3)、对图片训练库中每张图像经步骤(2)得到的4幅图像分别计算差分盒子维数,得到图片训练库中每张图像对应的四维分形特征向量;
如图2,计算差分盒子维数的方法为:
设图片训练库中第p(p表示图像序号,p=1,...,3000)张图像经步骤(2)得到的4幅图像中任一图像像素点(x,y)处的图像灰度值为z(x,y),将z(x,y)作为Z坐标值,则(x,y,z(x,y))成为三维空间一个空间点。将灰度图像所有的像素都如此处理成为空间点,就构成一个三维空间中的曲面。将M1×N1大小的图像分割成大小为r×r的子块(M1/2\r>1,r为整数),则xy平面被分割成许多r×r的网格。在每个网格上是一列r×r×r的正方体盒子。设图像灰度在第(i,j)网格中的最小值和最大值分别落在从下往上数第k和第l个盒子中,则:
nr(i,j)=l-k+1
式中nr(i.j)是覆盖第(i.j)网格中的图像所需要的盒子数,将上式改为易于用图像灰度值计算的形式如下:
nr(i,j)=int[(max Ik-min Ik)/r]+1
其中,Ik(k=1,2,…,n)表示r×r单位面积内n个像素灰度值的大小。
覆盖整个图像所需的盒子数为:
由盒子分形维数的计算公式为:
式中D为分形维数,Nr为盒子数,r为步长(立方体的边长)。针对不同的r(本发明r分别取3~48),计算相应的Nr,最后应用最小二乘法,即可求得分形维数D。
最后得到步骤(2)中四幅图像的分形维数分别为D1p,D2p,D3p,D4p。则图片训练库中第p张图像对应的四维分形特征向量为Fp=[D1p,D2p,D3p,D4p],由此可得到图片训练库中每张图像分别对应的四维分形特征向量。
步骤(4)、将上一步骤中得到的图片训练库中每张图像的四维分形特征向量作为神经网络的输入,输出为01,10,11(分别对应天空、道路、树木),训练神经网络。
本具体实施例中神经网络为BP神经网络。
步骤(5)、将要进行图像分割的图片经过步骤(1)的预处理,再使用大小为w(w表示窗口大小,为大于2的正整数,通常取3~11),像素点(x.y)为中心的窗口扫描,每个窗口均用步骤(3)中的方法计算出分形维数,作为像素点(x.y)的分形维特征。将上述分形维特征作为步骤(4)中经过训练的神经网络的输入,得到该像素所属类别。
步骤(6)、将步骤(5)中已归类完的三个区域用三个不同的灰度值显示出来,此时,图像中可能会存在一些由于归类错误而产生杂小区域,针对这些区域,本发明使用了数学形态学的方法将其去除。所述数学形态学方法包括膨胀,腐蚀,开运算和闭运算,结果如图5所示,其中(a)为原图,(b)为分割结果,(c)为平滑后结果。
Claims (2)
1.一种基于多尺度分形维和神经网络的机器人视觉图像分割方法,其特征在于包括如下步骤:
步骤一、分别拍摄天空、道路、树木的图像,并对图像进行一系列的预处理,形成一个图片训练库,所述预处理包括:灰度化、直方图均衡化、调整图像尺寸为统一尺寸大小;
步骤二、对图片训练库中每张图像分别进行小波变换,得到每张图像的一幅低频近似图像和m幅高频细节图像,m为正整数;
步骤三、对图片训练库中每张图像经步骤二得到的m+1幅图像分别计算差分盒子维数,得到图片训练库中每张图像对应的m+1维分形特征向量;
步骤四、将图片训练库中每张图像对应的m+1维分形向量分别作为神经网络的输入,输出为01,10,11,分别对应天空、道路和树木,训练神经网络;
步骤五、将要进行图像分割的图片经过步骤一中的预处理,然后使用大小为w,像素点(x.y)为中心的窗口对整幅图像进行扫描,w取任意大于2的正整数,每个窗口均用步骤三中的方法计算出分形维数,作为像素点(x.y)的分形维特征,将上述分形维特征作为步骤四中经过训练的神经网络的输入,得到该像素所属类别;
步骤六、将步骤五中已归类完的三个区域用三个不同的灰度值显示出来,对图像中存在的一些由于归类错误而产生的杂小区域,使用数学形态学的方法将其去除。
2.如权利要求1所述的基于多尺度分形维和神经网络的机器人视觉图像分割方法,其特征在于所述步骤三的具体方法是:
设经过步骤一调整后,图像的尺寸为M×N,为计算方便,取M=2t,N=2t,t为自然数,则经过小波变换后,得到的m+1幅图像的大小均为M1×N1,其中M1=2t-1,N1=2t-1;
设图片训练库中第p张图像经步骤二得到的m+1幅图像中任一图像像素点(x,y)处的图像灰度值为z(x,y),p代表图片训练库中图像的序号,将z(x,y)作为Z坐标值,则(x,y,z(x,y))成为三维空间一个空间点,将灰度图像所有的像素都如此处理成为空间点,就构成一个三维空间中的曲面,将M1×N1大小的图像分割成大小为r×r的子块,M1/2\r>1,r为整数,则xy平面被分割成许多r×r的网格,在每个网格上是一列r×r×r的正方体盒子,设图像灰度在第(i,j)网格中的最小值和最大值分别落在从下往上数第k和第l个盒子中,则:
nr(i,j)=l-k+1
式中nr(i.j)是覆盖第(i.j)网格中的图像所需要的盒子数,将上式改为易于用图像灰度值计算的形式如下:
nr(i,j)=int[(max Ik-min Ik)/r]+1
其中,Ik,k=1,2,…,n,表示r×r单位面积内n个像素灰度值的大小;
那么,覆盖整个图像所需的盒子数为:
由盒子分形维数的计算公式为:
式中D为分形维数,Nr为盒子数,r为步长,针对不同的r,计算相应的Nr,最后应用最小二乘法,求得分形维数D;
按上述方法求得m+1幅图像的分形维数分别为D1p,D2p,…Dmp,Dm+1p,则图片训练库中第p张图像对应的m+1维分形特征向量为[D1p,D2p,…Dmp,Dm+1p],由此得到图片训练库中每张图像对应的m+1维分形特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103940960A CN102521831A (zh) | 2011-12-02 | 2011-12-02 | 基于多尺度分形维和神经网络的机器人视觉图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103940960A CN102521831A (zh) | 2011-12-02 | 2011-12-02 | 基于多尺度分形维和神经网络的机器人视觉图像分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102521831A true CN102521831A (zh) | 2012-06-27 |
Family
ID=46292735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011103940960A Pending CN102521831A (zh) | 2011-12-02 | 2011-12-02 | 基于多尺度分形维和神经网络的机器人视觉图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521831A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103018181A (zh) * | 2012-12-14 | 2013-04-03 | 江苏大学 | 基于相关性分析和elm神经网络的软测量方法 |
CN103067710A (zh) * | 2012-12-28 | 2013-04-24 | 辽宁师范大学 | 基于三维小波变换的分布式超光谱图像编码及解码方法 |
CN103226028A (zh) * | 2013-05-02 | 2013-07-31 | 电子科技大学 | 一种相敏光时域反射仪扰动信号检测与识别方法 |
CN104574346A (zh) * | 2013-10-23 | 2015-04-29 | 核工业北京地质研究院 | 一种光学遥感图像分解算法 |
CN108038856A (zh) * | 2017-12-22 | 2018-05-15 | 杭州电子科技大学 | 基于改进多尺度分形增强的红外小目标检测方法 |
CN110400322A (zh) * | 2019-07-30 | 2019-11-01 | 江南大学 | 基于颜色和三维几何信息的水果点云分割方法 |
CN110648357A (zh) * | 2019-08-27 | 2020-01-03 | 电子科技大学 | 一种不规则多边形的最大内接矩形的快速近似求解方法 |
CN112975979A (zh) * | 2021-03-08 | 2021-06-18 | 三峡大学 | 基于人工智能的瓷砖美缝机器人及控制方法 |
CN113378860A (zh) * | 2021-06-30 | 2021-09-10 | 哈尔滨理工大学 | 一种基于分形维数的图像特征提取系统及方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520893A (zh) * | 2009-02-23 | 2009-09-02 | 暨南大学 | 一种婴幼儿脑医学计算机扫描图像的分析方法及实现系统 |
-
2011
- 2011-12-02 CN CN2011103940960A patent/CN102521831A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520893A (zh) * | 2009-02-23 | 2009-09-02 | 暨南大学 | 一种婴幼儿脑医学计算机扫描图像的分析方法及实现系统 |
Non-Patent Citations (2)
Title |
---|
李厚强等: "一种彩色纹理图像的分割方法", 《计算机学报》, vol. 24, no. 9, 30 September 2001 (2001-09-30), pages 965 - 971 * |
赵茂程等: "基于分形理论的树木图像分割方法", 《农业机械学报》, vol. 35, no. 2, 31 March 2004 (2004-03-31), pages 72 - 75 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103018181A (zh) * | 2012-12-14 | 2013-04-03 | 江苏大学 | 基于相关性分析和elm神经网络的软测量方法 |
CN103067710A (zh) * | 2012-12-28 | 2013-04-24 | 辽宁师范大学 | 基于三维小波变换的分布式超光谱图像编码及解码方法 |
CN103067710B (zh) * | 2012-12-28 | 2015-11-18 | 辽宁师范大学 | 基于三维小波变换的分布式超光谱图像编码及解码方法 |
CN103226028A (zh) * | 2013-05-02 | 2013-07-31 | 电子科技大学 | 一种相敏光时域反射仪扰动信号检测与识别方法 |
CN103226028B (zh) * | 2013-05-02 | 2015-07-01 | 电子科技大学 | 一种相敏光时域反射仪扰动信号检测与识别方法 |
CN104574346A (zh) * | 2013-10-23 | 2015-04-29 | 核工业北京地质研究院 | 一种光学遥感图像分解算法 |
CN108038856A (zh) * | 2017-12-22 | 2018-05-15 | 杭州电子科技大学 | 基于改进多尺度分形增强的红外小目标检测方法 |
CN108038856B (zh) * | 2017-12-22 | 2020-08-04 | 杭州电子科技大学 | 基于改进多尺度分形增强的红外小目标检测方法 |
CN110400322A (zh) * | 2019-07-30 | 2019-11-01 | 江南大学 | 基于颜色和三维几何信息的水果点云分割方法 |
CN110400322B (zh) * | 2019-07-30 | 2021-03-16 | 江南大学 | 基于颜色和三维几何信息的水果点云分割方法 |
CN110648357A (zh) * | 2019-08-27 | 2020-01-03 | 电子科技大学 | 一种不规则多边形的最大内接矩形的快速近似求解方法 |
CN110648357B (zh) * | 2019-08-27 | 2023-03-31 | 电子科技大学 | 一种不规则多边形的最大内接矩形的快速近似求解方法 |
CN112975979A (zh) * | 2021-03-08 | 2021-06-18 | 三峡大学 | 基于人工智能的瓷砖美缝机器人及控制方法 |
CN113378860A (zh) * | 2021-06-30 | 2021-09-10 | 哈尔滨理工大学 | 一种基于分形维数的图像特征提取系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102521831A (zh) | 基于多尺度分形维和神经网络的机器人视觉图像分割方法 | |
Zhang et al. | Efficient convolutions for real-time semantic segmentation of 3d point clouds | |
CN103871029B (zh) | 一种图像增强及分割方法 | |
CN101551905B (zh) | 基于模糊c均值聚类和空间信息的多尺度纹理图像分割方法 | |
CN113486764B (zh) | 一种基于改进的YOLOv3的坑洼检测方法 | |
CN103455991A (zh) | 一种多聚焦图像融合方法 | |
CN103208123A (zh) | 图像分割方法与系统 | |
CN104050681A (zh) | 一种基于视频图像的道路消失点检测方法 | |
CN104899883A (zh) | 一种深度图像场景的室内对象立方体检测方法 | |
CN103824309A (zh) | 一种城市建成区边界自动提取方法 | |
CN103400368A (zh) | 基于图论和超像素的并行快速sar图像分割方法 | |
CN103699900A (zh) | 卫星影像中建筑物水平矢量轮廓自动批量提取方法 | |
CN110648342A (zh) | 基于nsst显著性检测及图割的泡沫红外图像分割方法 | |
CN104835196B (zh) | 一种车载红外图像彩色化三维重建方法 | |
CN102831604A (zh) | 一种灰度图像的二维Renyi熵阈值分割方法 | |
CN102542571A (zh) | 一种运动目标检测方法及装置 | |
CN106991686A (zh) | 一种基于超像素光流场的水平集轮廓跟踪方法 | |
CN103714574A (zh) | 一种基于gpu加速的海中场景建模与实时交互绘制方法 | |
CN103955710A (zh) | 类地重力场环境下单目视觉空间识别方法 | |
CN102930294A (zh) | 基于混沌特征量视频运动模态分割和交通状况识别的方法 | |
CN108710862A (zh) | 一种高分辨率遥感影像水体提取方法 | |
CN102903121A (zh) | 基于运动目标跟踪的融合算法 | |
CN103886335A (zh) | 基于模糊粒子群和散射熵的极化sar图像分类方法 | |
Niknejad et al. | Occlusion handling using discriminative model of trained part templates and conditional random field | |
CN102411776A (zh) | 基于统计学和分形维数的机器人视觉图像分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120627 |