CN102496146B - 一种基于视觉共生的图像分割方法 - Google Patents

一种基于视觉共生的图像分割方法 Download PDF

Info

Publication number
CN102496146B
CN102496146B CN201110382744.0A CN201110382744A CN102496146B CN 102496146 B CN102496146 B CN 102496146B CN 201110382744 A CN201110382744 A CN 201110382744A CN 102496146 B CN102496146 B CN 102496146B
Authority
CN
China
Prior art keywords
image
pixel
probability
visual
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110382744.0A
Other languages
English (en)
Other versions
CN102496146A (zh
Inventor
李宁
郭乔进
丁轶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201110382744.0A priority Critical patent/CN102496146B/zh
Publication of CN102496146A publication Critical patent/CN102496146A/zh
Application granted granted Critical
Publication of CN102496146B publication Critical patent/CN102496146B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于视觉共生的图像分割方法,该方法包括像素特征提取、视觉共生关系的提取和基于视觉共生的图像分割三部分组成,其中像素特征的提取包括颜色空间的转换、特征量化等步骤,然后利用主题模型来提取各像素之间的视觉共生关系,最后进行图像的分割。本发明的优点是分割准确率高,能够充分有效的利用图像中不同物体的视觉相似性和差异性进行有效的物体的分割。

Description

一种基于视觉共生的图像分割方法
技术领域
本发明涉及一种彩色图像的分割算法,尤其涉及一种基于图像内部视觉共生的图像分割方法,属于图像处理技术领域。
背景技术
图像分割是图像处理、机器视觉、图像检索等领域中的一个重要研究课题。图像分割通过将图像中的不同物体,如前景和背景区域等分割为不同的区域,对图像的后续处理,如特征提取和分类等,都具有非常重要的作用。
图像分割大致可以分为自动和半自动两种方法。图像的自动分割包括常见的边缘检测、聚类、形态学方法、区域增长等。半自动的分割方法通常需要人为的干预,其结果通常也会好于自动分割算法,常见的方法有动态边界等。然而大多数图像分割方法都是通过图像中各个相邻像素之间的相似性来将整个图像分割为若干不相交的区域,每个不同的区域对应一个不同的类别。然而,在很多情况下,图像中的前景物体会出现被遮挡等情况,从而其区域出现一定的非连续性,传统的图像分割方法在这种情况下,会将对应的物体分割为不同的区域,然而该图像分割方法无法有效处理局部遮挡物体的分割的不足问题。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明通过考虑图像中不同区域的视觉共生关系,将非连续的同类区域分割为同一类别,提供一种提高图像分割的准确性和有效性的基于视觉共生的图像分割方法。
技术方案:一种基于视觉共生的图像分割方法,包括如下步骤:
(1)针对一幅彩色图像I,将其从RGB空间转换为CIE-LAB空间;
(2)对图像中每个像素的3×3邻域提取局部颜色直方图特征Hi
(3)利用Kmeans对所有的颜色直方图进行聚类,得到K个聚类中心,构成词汇表V;
(4)利用词汇表V对每个颜色直方图Hi进行量化,从而得到每个像素的视觉关键词Wi
(5)将图像均匀分为D个R×R的矩形区域,每两个相邻的矩形区域重叠
Figure BDA0000113013730000021
(6)根据每个矩形区域的视觉关键词直方图Hd,d=1,...,D,建立文集C;
(7)根据先验知识人工的确定分割区域的数量为K,根据文集C,训练一个主题数量为K隐含狄利克雷分配,从而获得每个区域中各像素属于不同主题的概率
Figure BDA0000113013730000022
(8)图像中每个像素属于各个主题的概率
Figure BDA0000113013730000023
为包含其的所有对应区域中获得的概率的均值;
(9)根据概率值
Figure BDA0000113013730000025
将图像分割为K个不同类别。
本发明方法包括图像中每个像素的视觉关键词的提取与构造、主题模型的训练以及基于主题概率的图像分割三部分,其中步骤(1)至(4)描述了图像中每个像素的颜色直方图特征的提取以及视觉关键词的构造过程,步骤(5)至(7)描述了主题模型的训练数据的构造以及概率输出,步骤(8)至(9)描述了如何基于主题模型的概率输出进行图像的分割。
有益效果:本发明的方法与现有技术相比,其显著优点是:能够有效解决传统图像分割方法无法有效针对图像中非连续性区域进行分割的问题,通过使用图像中的视觉共生关系,将图像中非连续的同类区域分类为相同类别,为后续的处理,如特征提取、分类、检索等流程提供了更好的分割结果,从而提高图像分割的准确性和有效性。
附图说明
图1为本发明实施例的图像中视觉共生的描述示意图;
图2为本发明实施例中使用的基于隐含狄利克雷分配的分类器示意图;
图3是本发明实施例的工作流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,在不同的图像之间,相同类别存在着具有相似视觉特征的区域,这种性质叫做视觉共生,而在同一个图像的内部,这种视觉共生关系会更加明显,因为在同一幅图像不存在尺度、光照、旋转等因素的影响,同一类别的区域之间的视觉相似性会更加的突出,即使同一类别的物体在图像中非连续性的分布,利用这一特性也能有效的将其分类为同一类别。图2中描述了本发明实施例中使用的基于隐含狄利克雷分配的分类器,通过利用隐含狄利克雷分配来对图像中的视觉共生关系进行建模和分类。图3描述了本发明实施例的具体工作流程,包括图像中每个像素的视觉关键词的提取与构造、主题模型的训练以及基于主题概率的图像分割三部分。
本发明实施例方法流程如图3所示,下面详细说明:
基于视觉共生的图像分割方法包括下列步骤:
步骤(1):针对一幅彩色图像I,将其从RGB空间转换为CIE-LAB空间,RGB颜色空间是一种常用的颜色空间,然而,基于RGB颜色空间的欧氏距离度量并不能很好的描述不同颜色在人眼中的视觉相似性,而使用CIE-LAB颜色空间则可以避免这类问题,视觉相似的颜色之间具有较小的欧式距离。
步骤(2):对图像中每个像素的3×3邻域提取局部颜色直方图特征Hi。为了描述图像中每个像素的特征,因此本实施例提取每个像素周围3×3邻域的27维颜色直方图。
步骤(3):利用Kmeans对所有的颜色直方图进行聚类,得到K个聚类中心,构成词汇表V。针对当前图像中所有像素的27维的颜色直方图,利用Kmeans进行聚类,得到K个聚类中心(c1,c2,...,cK),构成视觉词汇表V={c1,c2,...,cK}。
步骤(4):利用词汇表V对每个颜色直方图Hi进行量化,针对每个像素的颜色直方图Hi在词汇表中选择欧式距离最小的视觉关键词
Figure BDA0000113013730000031
从而将原始图像转换为由每个像素的视觉关键词组成的图像,如图3中的第二步所示。
步骤(5):将图像均匀分为D个R×R的矩形区域,每两个相邻的矩形区域重叠
Figure BDA0000113013730000041
根据每个矩形区域的视觉关键词直方图Hd,d=1,...,D,建立文集C,用于训练后续的主题模型。如图2所示,文集C包含一系列区域,每个区域包含对应的每个像素的视觉关键词,从而构成一个视觉关键词的树状结构。
步骤(7):LDA是自然语言处理中的一种常用的主题模型,通过统计文档中的关键词出现频率等信息来得到不同关键词在不同文档中的主题信息P(wn|zk,d)。在利用LDA来处理图像数据时,首先需要将图像进行分块,然后对每个分块区域提取特征,并量化为若干关键词。这里假设词汇表中共有N个关键词wn,n=1,...,N表示第k个主题,K为主题的数量,d=1,...,D代表D个文档。LDA的概率图结构如图1所示,其中α为K维向量,P(θ|α)满足Dirichlet分布,P(z|θ)满足多项式分布,βkn=P(w=n|z=k)。P(wn|zk,d)表示在文档d中,对应主题zk的关键词为wn的概率。根据先验知识人工的确定分割区域的数量为K,根据文集C,训练一个主题数量为K隐含狄利克雷分配,从而获得每个区域中各像素属于不同主题的概率
Figure BDA0000113013730000042
步骤(8):图像中每个像素属于各个主题的概率
Figure BDA0000113013730000043
为包含其的所有对应区域中获得的概率
Figure BDA0000113013730000044
的均值,
Figure BDA0000113013730000045
步骤(9):根据概率值
Figure BDA0000113013730000046
将图像分割为K个不同类别,描述了每个像素属于各个主题的概率。将每个像素分类为概率最大的类别,从而将图像中的每个像素分类为K个不同类别。

Claims (1)

1.一种基于视觉共生的图像分割方法,其特征在于,包括如下步骤:
(1)针对一幅彩色图像I,将其从RGB空间转换为CIE-LAB空间;
(2)对图像中每个像素的3×3邻域提取局部颜色直方图特征Hi
(3)利用Kmeans对所有的颜色直方图进行聚类,得到K个聚类中心(c1,c2,...,cK),构成词汇表V;
(4)利用词汇表V对每个颜色直方图Hi进行量化,针对每个像素的颜色直方图Hi在词汇表中选择欧式距离最小的视觉关键词
Figure FDA0000380169730000018
从而得到每个像素的视觉关键词Wi
(5)将图像均匀分为D个R×R的矩形区域,每两个相邻的矩形区域重叠
Figure FDA0000380169730000011
(6)根据每个矩形区域的视觉关键词Wi的直方图Hd,d=1,...,D,建立文集C;
(7)根据先验知识人工的确定分割区域的数量为K,根据文集C,训练一个主题数量为K隐含狄利克雷分配,从而获得每个区域中各像素属于不同主题的概率
Figure FDA0000380169730000012
(8)图像中每个像素属于各个主题的概率
Figure FDA0000380169730000013
为包含其的所有对应区域中获得的概率
Figure FDA0000380169730000014
的均值,即
Figure FDA0000380169730000015
(9)根据概率值
Figure FDA0000380169730000016
将图像分割为K个不同类别,
Figure FDA0000380169730000017
描述了每个像素属于各个主题的概率,将每个像素分类为概率最大的类别,从而将图像中的每个像素分类为K个不同类别;
步骤(1)到(4)将每个像素通过“颜色空间转换,3×3特征提取,特征量化”三步将每个像素描述为视觉关键词;然后根据步骤(5)到(8)通过利用LDA模型对像素和区域进行建模,从而得到每个像素的主题概率;最后利用主题概率将图像分割为多个不连续的图像区域。
CN201110382744.0A 2011-11-28 2011-11-28 一种基于视觉共生的图像分割方法 Expired - Fee Related CN102496146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110382744.0A CN102496146B (zh) 2011-11-28 2011-11-28 一种基于视觉共生的图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110382744.0A CN102496146B (zh) 2011-11-28 2011-11-28 一种基于视觉共生的图像分割方法

Publications (2)

Publication Number Publication Date
CN102496146A CN102496146A (zh) 2012-06-13
CN102496146B true CN102496146B (zh) 2014-03-05

Family

ID=46187968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110382744.0A Expired - Fee Related CN102496146B (zh) 2011-11-28 2011-11-28 一种基于视觉共生的图像分割方法

Country Status (1)

Country Link
CN (1) CN102496146B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799614B (zh) * 2012-06-14 2015-01-07 北京大学 基于视觉词语空间共生性的图像检索方法
GB2525766B (en) * 2012-12-04 2019-09-18 Intel Corp Distributed graphics processing
CN103903257B (zh) * 2014-02-27 2017-01-18 西安电子科技大学 基于几何块间隔共生特征和语义信息的图像分割方法
CN106709921B (zh) * 2016-12-29 2020-06-09 华侨大学 一种基于空间Dirichlet混合模型的彩色图像分割方法
CN108764262B (zh) * 2018-05-31 2021-09-28 苏州大学 一种共生图像模式挖掘方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1367468A (zh) * 2002-03-25 2002-09-04 北京工业大学 基于k-均值聚类及信息融合的角膜病灶图像分割方法
US6721448B2 (en) * 2001-02-20 2004-04-13 International Business Machines Corporation Color clustering and segmentation using sigma filtering
CN1920820A (zh) * 2006-09-14 2007-02-28 浙江大学 基于标注重要性次序的图像语义自动标注方法
US7260259B2 (en) * 2002-01-08 2007-08-21 Siemens Medical Solutions Usa, Inc. Image segmentation using statistical clustering with saddle point detection
CN101216886A (zh) * 2008-01-11 2008-07-09 北京航空航天大学 一种基于谱分割理论的镜头聚类方法
CN101425182A (zh) * 2008-11-28 2009-05-06 华中科技大学 一种图像对象分割方法
CN101582080A (zh) * 2009-06-22 2009-11-18 浙江大学 一种基于图像和文本相关性挖掘的Web图像聚类方法
CN101661559A (zh) * 2009-09-16 2010-03-03 中国科学院计算技术研究所 一种数字图像训练和检测方法
CN101685464A (zh) * 2009-06-18 2010-03-31 浙江大学 基于社群潜在主题挖掘的自动图像标注的方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721448B2 (en) * 2001-02-20 2004-04-13 International Business Machines Corporation Color clustering and segmentation using sigma filtering
US7260259B2 (en) * 2002-01-08 2007-08-21 Siemens Medical Solutions Usa, Inc. Image segmentation using statistical clustering with saddle point detection
CN1367468A (zh) * 2002-03-25 2002-09-04 北京工业大学 基于k-均值聚类及信息融合的角膜病灶图像分割方法
CN1920820A (zh) * 2006-09-14 2007-02-28 浙江大学 基于标注重要性次序的图像语义自动标注方法
CN101216886A (zh) * 2008-01-11 2008-07-09 北京航空航天大学 一种基于谱分割理论的镜头聚类方法
CN101425182A (zh) * 2008-11-28 2009-05-06 华中科技大学 一种图像对象分割方法
CN101685464A (zh) * 2009-06-18 2010-03-31 浙江大学 基于社群潜在主题挖掘的自动图像标注的方法
CN101582080A (zh) * 2009-06-22 2009-11-18 浙江大学 一种基于图像和文本相关性挖掘的Web图像聚类方法
CN101661559A (zh) * 2009-09-16 2010-03-03 中国科学院计算技术研究所 一种数字图像训练和检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于上下文信息的乳腺肿块ROI检测方法;郭乔进, 丁轶, 李宁;《山东大学学报(理学版)》;20100731;第45卷(第7期);第72-74页 *
郭乔进, 丁轶, 李宁.一种基于上下文信息的乳腺肿块ROI检测方法.《山东大学学报(理学版)》.2010,第45卷(第7期),第72-74页.

Also Published As

Publication number Publication date
CN102496146A (zh) 2012-06-13

Similar Documents

Publication Publication Date Title
CN102968782B (zh) 一种彩色图像中显著对象的自动抠取方法
CN104134219A (zh) 基于直方图的彩色图像分割算法
CN102663382B (zh) 基于子网格特征自适应加权的视频图像文字识别方法
CN102496146B (zh) 一种基于视觉共生的图像分割方法
CN101923653B (zh) 一种基于多层次内容描述的图像分类方法
CN102496023B (zh) 像素层面的感兴趣区域提取方法
CN103914683A (zh) 基于人脸图像的性别识别方法及系统
CN104361336A (zh) 一种水下视频图像的文字识别方法
Niu et al. Image segmentation algorithm for disease detection of wheat leaves
CN103295013A (zh) 一种基于成对区域的单幅图像阴影检测方法
Lin et al. Image segmentation using the k-means algorithm for texture features
CN102136074B (zh) 一种基于mmi的木材图像纹理分析与识别方法
CN106127817A (zh) 一种基于通道的图像二值化方法
Wang et al. Unsupervised segmentation of greenhouse plant images based on modified Latent Dirichlet Allocation
CN111368865B (zh) 遥感影像储油罐检测方法、装置、可读存储介质及设备
CN112446417B (zh) 基于多层超像素分割的纺锤形果实图像分割方法及系统
CN106780535A (zh) 一种灰度图像处理方法
CN106408029B (zh) 一种基于结构差分直方图的图像纹理分类方法
CN109460763B (zh) 一种基于多层次文本组件定位与生长的文本区域提取方法
Gupta et al. A learning-based approach for automatic image and video colorization
CN106066887A (zh) 一种广告序列图像快速检索和分析方法
CN106611418A (zh) 一种图像分割算法
Kabir et al. Discriminant feature extraction using disease segmentation for automatic leaf disease diagnosis
Dimiccoli et al. Hierarchical region-based representation for segmentation and filtering with depth in single images
CN110276260B (zh) 一种基于深度摄像头的商品检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140305

Termination date: 20161128

CF01 Termination of patent right due to non-payment of annual fee