CN102222234A - 基于均值偏移和k均值聚类技术的图像对象提取方法 - Google Patents
基于均值偏移和k均值聚类技术的图像对象提取方法 Download PDFInfo
- Publication number
- CN102222234A CN102222234A CN 201110196454 CN201110196454A CN102222234A CN 102222234 A CN102222234 A CN 102222234A CN 201110196454 CN201110196454 CN 201110196454 CN 201110196454 A CN201110196454 A CN 201110196454A CN 102222234 A CN102222234 A CN 102222234A
- Authority
- CN
- China
- Prior art keywords
- image
- cluster
- algorithm
- pixel
- mean shift
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
基于均值偏移和K均值聚类技术的图像对象提取方法,先使用均值偏移进行图像平滑,先应用meanshift算法进行图像平滑消除细节信息,在进行过meanshift平滑操作后,图像的细节部分将被忽略,从而将均值偏移的结果按照其颜色信息进行进一步聚类;在这一步骤中,要求聚类过程具有较高的效率并且能够满足一定的精度要求;运用k均值聚类算法对图像进行分割;K均值聚类的算法如下:应用K-means算法进行颜色聚类以提取图像中的对象信息,均值偏移和K均值聚类算法相结合,结合二者的优点,并规避了二者的缺点。算法的时间短且效率高。从而得到拥有较好结果的图像对象提取结果。
Description
技术领域
本发明涉及利用图像语义处理图像的方法。
背景技术
随着信息时代的飞速发展,基于内容的图像检索技术(CBIR)的研究成果已经转化为应用技术,而且日益增长的应用需求反过来推动其研究向更高层次发展。CBIR的基本思路是从图像中提取底层的视觉特征——颜色,纹理,形状等,然后基于这些特征将用户查询的图像与数据库中的图像进行相似度的衡量,其中图像的相似性判断建立在视觉特征的相似性上。
然而计算机自动提取的图像视觉特性与人所理解的图像内容存在很大的不同。人们判断图像的相似性并非建立在图像的颜色、形状等特性上,而是主要根据图像的内容含义来判断图像是否符合自己的需要。因此传统的CBIR(基于内容的图像检索)系统的检索结果往往不尽如人意。这就需要一些高层次的概念,这些概念包含了人对图像所描述的对象、事件以及所表达的感情等内容的理解,这就是图像所具有的语义特征,即图像的高层语义知识。当这些高层语义知识被提取出来后,才能给包括图像检索在内的一系列应用提供更加令人满意的结果。
现有的检索领域,与图像检索领域相对应的文本检索领域已经发展发展得相当成熟,而对图像的语义的提取,便是将图像信息转化为与语义相关的文本信息,从而将文本到图像的检索转化为文本到文本的检索,能够大大地提高图像检索的准确率。
图像语义的提取,其前提是提取图像中的对象。即将图像中各个具有特定特征的区域划分并提取出来的过程,现有的图像对象提取方法大致分为三类:基于区域的方法,基于网格的方法,基于轮廓的方法。基于区域的方法适用于大规模颜色相近的区域,而对具有复杂内部细节的对象无法有效识别。基于网格的方法适用于具有规则形状的对象,而对其他形状的对象无法有效识别。本发明的基本思路是基于区域分割的图像对象提取算法。
均值偏移(Mean Shift)算法是一种特征空间聚类算法,它的一个突出优点是不须人为地设置过多的参数,从而得到较为客观的图像分割结果。均值偏移算法的实质对图像进行平滑处理,消除图像对象内部的细节,从而得到图像的对象信息。
K均值聚类(K-Means)算法是另一种广泛使用的聚类分析方法。K均值聚类算法用于图像分割具有直观、快速、易于实现的特点。然而K均值聚类算法的问题是需要确定聚类数目,并且初始聚类中心的选择对分类结果具有较大的影响。同时,K均值聚类仅仅使用了图像的颜色信息而没有利用空间信息,因而图像中的细节信息会对聚类的结果产生较大的影响,从而使得K均值聚类往往无法得到需要的结果。
发明内容
本发明目的是:以基于区域的方法为基础,将均值偏移和K均值聚类算法相结合,结合二者的优点,并规避了二者的缺点。从而得到拥有较好结果的图像对象提取结果,亦即提高识别的准确度。
本发明的技术方案是:基于均值偏移和K均值聚类技术的图像对象提取方法, 使用均值偏移进行图像平滑:
均值偏移算法是一种不用直接计算梯度找到模式点的算法,在图像平滑过程中,就是要找到不同色彩的聚类点; 图像中的每一个像素经过色彩空间转换表达了一个像素的空间信息和色彩信息,其中,空间位置和色彩均相近的像素,在五维色彩空间中也相近; 因而,在五维空间中进行聚类,得到的结果重新映射到图像中,即可得到达到所需要的效果。
对于任何需要处理的图像对象,1)先应用meanshift算法进行图像平滑消除细节信息,分别用xi和zi(i=1, …, n)表示原始和平滑后的图像像素点,利用meanshift算法对图像进行平滑处理;对于每一个像素点:
1-1)初始化j=1,且使yj+1=xi,像素点的空间;
1-2)在以yj为中心的超球体中计算实现窗口中心的偏移,直到满足收敛条件;
这里的超球体是指经过色彩空间的转化可以在5维特征空间中获得的很多点, 每个点对应图像中的一个像素, 表达了该像素所有的信息,亦即空间位置和色彩信息;
1-3)给zi赋值,将收敛的色彩赋给当前像素zi=(xi,yconv);
这里是均值偏移算法的固定步骤,yconv是坐标点,就是当前像素Zi的坐标。
2)k均值聚类
在进行过meanshift平滑操作后,图像的细节部分将被忽略,从而将均值偏移的结果按照其颜色信息进行进一步聚类; 在这一步骤中,要求聚类过程具有较高的效率并且能够满足一定的精度要求; 运用k均值聚类算法对图像进行分割;
K均值聚类的算法如下:应用K-means算法进行颜色聚类以提取图像中的对象信息,
2-1) 对于大小为m x n的图像,构建大小为(m x n) * 3的矩阵,其中每一行为对应像素点三个通道的颜色信息;
2-2) 从m x n个数据对象中随机选取K个对象作为初始聚类中心;
2-3) 根据每个聚类对象的均值(中心为对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应的对象进行划分;
2-4) 重新计算每一个有变化的聚类的均值;
2-5) 迭代运行2-3)和2-4)直到每个聚类的变化程度满足收敛条件。
对于K均值聚类的结果,将m x n个输入硬划分为K个不同的聚类,使得其结果满足条件:相同聚类中的对象相似度较高;不同聚类中的对象相似度较低。从直观上而言:各个聚类本身尽可能的紧凑,而各个聚类之间尽可能地分开。
通过对均值偏移和k均值聚合算法的结合使用,结合了各自的优点,规避了各自的缺点,能够在较短时间内对图像中对象提取得到较好的效果。实验结果表明,对于对比度较高和较低的对象均能够得到较好的提取效果,得到与人眼相近的效果。
均值偏移(Mean Shift)算法是一种特征空间聚类算法,它的一个突出优点是不须人为地设置过多的参数,从而得到较为客观的图像分割结果。均值偏移算法的实质对图像进行平滑处理,消除图像对象内部的细节,从而得到图像的对象信息。
K均值聚类(K-Means)算法是另一种广泛使用的聚类分析方法。K均值聚类算法用于图像分割具有直观、快速、易于实现的特点。然而K均值聚类算法的问题是需要确定聚类数目,并且初始聚类中心的选择对分类结果具有较大的影响。同时,K均值聚类仅仅使用了图像的颜色信息而没有利用空间信息,因而图像中的细节信息会对聚类的结果产生较大的影响,从而使得K均值聚类往往无法得到需要的结果。
本发明的有益效果是:当一图为原始图片(400x300),则单纯利用meanshift算法进行对象提取的结果,可以看出,对于对比度较高的对象可以得到较好的效果,而对于对比度较低的对象,由于meanshift本身属于软聚类,因此算法的结果和原图并未有太大的区别,然而对于测试图片,无论效果如何,均需花费8s左右的时间。如果为单纯利用k-means算法进行图像提取的结果,可见对于对比度较低的图片能够得到较好的效果,而对于对比度较高的对象,由于细节信息过多,反而没有很好的效果。
如果算法首先用meanshift算法消除了对象的细节信息,然后利用k-means算法进行进一步的操作,由结果可以看出,两种算法的结合使用弥补了对方不适用的范围,能够得到较好的效果,同时由于meanshift算法仅仅用了较小的参数进行了滤波操作,整个算法的时间在1s以下。
本发明将均值偏移和K均值聚类算法相结合,结合二者的优点,并规避了二者的缺点。算法的时间短且效率高。从而得到拥有较好结果的图像对象提取结果。
附图说明
图1是本发明的处理流程图。
具体实施方式
1、 颜色空间的选择
为了使得算法的结果和人眼视觉分析的结果尽量一致,本发明采用CIE提出的LUV均匀彩色模型。在该色彩空间中,L分量表示颜色的亮度,而U分量和V分量均表示颜色的色差。
2、 应用meanshift算法进行图像平滑消除细节信息分别用xi和zi(i=1, …, n)表示原始和平滑后的图像,利用meanshift算法对图像进行平滑处理。对于每一个像素点:
1)初始化j=1,且使yj,1=xi
2)在以yj为中心的超球体中计算实现窗口中心的偏移,直到满足收敛条件
3)给zi赋值,将收敛的色彩赋给当前像素zi=(xi,yconv)
3、 应用K-means算法进行颜色聚类以提取图像中的对象信息
1) 对于大小为m x n的图像,构建大小为(m x n) * 3的矩阵,其中每一行为对应像素点三个通道的颜色信息。
2) 从m x n个数据对象中随机选取K个对象作为初始聚类中心
3) 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应的对象进行划分
4) 重新计算每一个有变化的聚类的均值
5) 迭代运行3)和4)直到每个聚类的变化程度满足收敛条件
Claims (2)
1.基于均值偏移和K均值聚类技术的图像对象提取方法,其特征是先使用均值偏移进行图像平滑:
1)先应用meanshift算法进行图像平滑消除细节信息,分别用xi和zi(i=1, …, n)表示原始和平滑后的图像像素点,利用meanshift算法对图像进行平滑处理;对于每一个像素点:
1-1)初始化j=1,且使yj+1=xi,像素点的空间;
1-2)在以yj为中心的超球体中计算 实现窗口中心的偏移,直到满足收敛条件;这里的超球体是指经过色彩空间的转化可以在5维特征空间中获得的很多点, 每个点对应图像中的一个像素, 表达了该像素所有的信息,亦即空间位置和色彩信息;
1-3)给zi赋值,将收敛的色彩赋给当前像素zi=(xi,yconv);
这里是均值偏移算法的固定步骤,yconv是坐标点,就是当前像素Zi的坐标;
2)k均值聚类
在进行过meanshift平滑操作后,图像的细节部分将被忽略,从而将均值偏移的结果按照其颜色信息进行进一步聚类; 在这一步骤中,要求聚类过程具有较高的效率并且能够满足一定的精度要求; 运用k均值聚类算法对图像进行分割;
K均值聚类的算法如下:应用K-means算法进行颜色聚类以提取图像中的对象信息,
2-1) 对于大小为m x n的图像,构建大小为(m x n) * 3的矩阵,其中每一行为对应像素点三个通道的颜色信息;
2-2) 从m x n个数据对象中随机选取K个对象作为初始聚类中心;
2-3) 根据每个聚类对象的均值(中心为对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应的对象进行划分;
2-4) 重新计算每一个有变化的聚类的均值;
2-5) 迭代运行2-3)和2-4)直到每个聚类的变化程度满足收敛条件。
2.基于均值偏移和K均值聚类技术的图像对象提取方法,其特征是对于任何需要处理的图像对象;
1)先应用meanshift算法进行图像平滑消除细节信息,分别用xi和zi(i=1, …, n)表示原始和平滑后的图像像素点,利用meanshift算法对图像进行平滑处理;对于每一个像素点:
1-1)初始化j=1,且使yj+1=xi,像素点的空间;
1-2)在以yj为中心的超球体中计算实现窗口中心的偏移,直到满足收敛条件;
这里的超球体是指经过色彩空间的转化可以在5维特征空间中获得的很多点, 每个点对应图像中的一个像素, 表达了该像素所有的信息,亦即空间位置和色彩信息;
1-3)给zi赋值,将收敛的色彩赋给当前像素zi=(xi,yconv)
这里是均值偏移算法的固定步骤,yconv是坐标点,就是当前像素Zi的坐标;
2)应用K-means算法进行颜色聚类以提取图像中的对象信息,
2-1) 对于大小为m x n的图像,构建大小为(m x n) * 3的矩阵,其中每一行为对应像素点三个通道的颜色信息;
2-2) 从m x n个数据对象中随机选取K个对象作为初始聚类中心;
2-3) 根据每个聚类对象的均值(中心为对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应的对象进行划分;
2-4) 重新计算每一个有变化的聚类的均值;
2-5) 迭代运行2-3)和2-4)直到每个聚类的变化程度满足收敛条件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110196454 CN102222234A (zh) | 2011-07-14 | 2011-07-14 | 基于均值偏移和k均值聚类技术的图像对象提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110196454 CN102222234A (zh) | 2011-07-14 | 2011-07-14 | 基于均值偏移和k均值聚类技术的图像对象提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102222234A true CN102222234A (zh) | 2011-10-19 |
Family
ID=44778782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110196454 Pending CN102222234A (zh) | 2011-07-14 | 2011-07-14 | 基于均值偏移和k均值聚类技术的图像对象提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102222234A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855624A (zh) * | 2012-07-23 | 2013-01-02 | 武汉大学 | 一种基于广义数据场和Ncut算法的图像分割方法 |
CN103292741A (zh) * | 2013-05-29 | 2013-09-11 | 哈尔滨工程大学 | 一种基于k均值颜色聚类的物体表面三维轮廓的结构光视觉测量方法 |
CN103514596A (zh) * | 2012-06-30 | 2014-01-15 | 北京新媒传信科技有限公司 | 一种图像处理的方法和装置 |
CN104077605A (zh) * | 2014-07-18 | 2014-10-01 | 北京航空航天大学 | 一种基于颜色拓扑结构的行人搜索识别方法 |
CN105675821A (zh) * | 2016-02-21 | 2016-06-15 | 南京农业大学 | 一种作物氮素营养无损诊断的图像评价指标的建立方法 |
CN106568782A (zh) * | 2016-11-05 | 2017-04-19 | 上海大学 | 一种基于机器视觉对彩色瓶盖图像颜色量化的方法 |
CN108596920A (zh) * | 2018-05-02 | 2018-09-28 | 北京环境特性研究所 | 一种基于彩色图像的目标分割方法及装置 |
CN109146850A (zh) * | 2018-07-26 | 2019-01-04 | 上海电气集团股份有限公司 | 一种多色球形目标检测定位方法及执行该方法的存储介质 |
WO2022166380A1 (zh) * | 2021-02-05 | 2022-08-11 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
-
2011
- 2011-07-14 CN CN 201110196454 patent/CN102222234A/zh active Pending
Non-Patent Citations (2)
Title |
---|
《微计算机信息》 20091231 陈孝玉 等 基于连通域的图像文本自动定位 第123-124页 1,2 第25卷, 第10-1期 * |
《郑州轻工业学院学报(自然科学版)》 20051130 陈焕 等 基于内容的多媒体数据库索引算法研究 第43页 1,2 第20卷, 第4期 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514596A (zh) * | 2012-06-30 | 2014-01-15 | 北京新媒传信科技有限公司 | 一种图像处理的方法和装置 |
CN102855624A (zh) * | 2012-07-23 | 2013-01-02 | 武汉大学 | 一种基于广义数据场和Ncut算法的图像分割方法 |
CN103292741A (zh) * | 2013-05-29 | 2013-09-11 | 哈尔滨工程大学 | 一种基于k均值颜色聚类的物体表面三维轮廓的结构光视觉测量方法 |
CN103292741B (zh) * | 2013-05-29 | 2015-12-23 | 哈尔滨工程大学 | 一种基于k均值颜色聚类的物体表面三维轮廓的结构光视觉测量方法 |
CN104077605B (zh) * | 2014-07-18 | 2017-08-29 | 北京航空航天大学 | 一种基于颜色拓扑结构的行人搜索识别方法 |
CN104077605A (zh) * | 2014-07-18 | 2014-10-01 | 北京航空航天大学 | 一种基于颜色拓扑结构的行人搜索识别方法 |
CN105675821B (zh) * | 2016-02-21 | 2018-11-02 | 南京农业大学 | 一种作物氮素营养无损诊断的图像评价指标的建立方法 |
CN105675821A (zh) * | 2016-02-21 | 2016-06-15 | 南京农业大学 | 一种作物氮素营养无损诊断的图像评价指标的建立方法 |
CN106568782A (zh) * | 2016-11-05 | 2017-04-19 | 上海大学 | 一种基于机器视觉对彩色瓶盖图像颜色量化的方法 |
CN108596920A (zh) * | 2018-05-02 | 2018-09-28 | 北京环境特性研究所 | 一种基于彩色图像的目标分割方法及装置 |
CN109146850A (zh) * | 2018-07-26 | 2019-01-04 | 上海电气集团股份有限公司 | 一种多色球形目标检测定位方法及执行该方法的存储介质 |
CN109146850B (zh) * | 2018-07-26 | 2022-02-18 | 上海电气集团股份有限公司 | 一种多色球形目标检测定位方法及执行该方法的存储介质 |
WO2022166380A1 (zh) * | 2021-02-05 | 2022-08-11 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102222234A (zh) | 基于均值偏移和k均值聚类技术的图像对象提取方法 | |
CN108182441B (zh) | 平行多通道卷积神经网络、构建方法及图像特征提取方法 | |
Zhang et al. | Pedestrian detection method based on Faster R-CNN | |
Li et al. | SHREC’13 track: large scale sketch-based 3D shape retrieval | |
CN106447676B (zh) | 一种基于快速密度聚类算法的图像分割方法 | |
CN101551823B (zh) | 一种综合多特征图像检索方法 | |
CN102073748B (zh) | 一种基于视觉关键词的遥感影像语义检索方法 | |
CN106327506B (zh) | 一种基于概率分区合并的三维模型分割方法 | |
CN108960288B (zh) | 基于卷积神经网络的三维模型分类方法及系统 | |
CN103824059A (zh) | 一种基于视频图像序列的人脸表情识别方法 | |
CN101706780A (zh) | 一种基于视觉注意力模型的图像语义检索方法 | |
CN102663723B (zh) | 一种基于颜色样本与电场模型的图像分割方法 | |
CN104182765A (zh) | 一种互联网图像驱动的三维模型最优视图自动选择方法 | |
CN103377376A (zh) | 图像分类的方法和系统、图像检索的方法和系统 | |
CN106250431B (zh) | 一种基于分类服装的颜色特征提取方法及服装检索系统 | |
CN103440035A (zh) | 一种三维空间中的手势识别系统及其识别方法 | |
CN108009286A (zh) | 一种基于深度学习的草图检索方法 | |
CN103336835B (zh) | 基于权值color‑sift特征字典的图像检索方法 | |
CN106126585A (zh) | 基于质量分级与感知哈希特征组合的无人机图像检索方法 | |
CN103049513A (zh) | 一种服饰鞋包类商品图像多视觉特征融合方法 | |
CN104951770A (zh) | 人脸图像数据库的构建方法、应用方法及相应装置 | |
CN102509119B (zh) | 一种基于分类器的图像场景分层与对象遮挡处理方法 | |
Saad et al. | Image retrieval based on integration between YC b C r color histogram and shape feature | |
CN105608443B (zh) | 一种多特征描述及局部决策加权的人脸识别方法 | |
CN113392244A (zh) | 一种基于深度度量学习的三维模型检索方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20111019 |