CN102542050B - 基于支持向量机的图像反馈方法及系统 - Google Patents
基于支持向量机的图像反馈方法及系统 Download PDFInfo
- Publication number
- CN102542050B CN102542050B CN201110449087.7A CN201110449087A CN102542050B CN 102542050 B CN102542050 B CN 102542050B CN 201110449087 A CN201110449087 A CN 201110449087A CN 102542050 B CN102542050 B CN 102542050B
- Authority
- CN
- China
- Prior art keywords
- image
- positive example
- counter
- negative data
- example image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一基于支持向量机的图像反馈方法及系统。方法包括:提取图像库中每幅图像的底层视觉特征,将提取的底层视觉特征放入特征库;调取用户在图像库中选取的示例图像,利用特征库查找图像库中与该示例图像最相似的N幅图像;将N幅图像标记为正例图像和反例图像,形成正例图像集和反例图像集;对正例图像集和反例图像集进行扩展和更新后,将正例图像集和反例图像集中的图像放入支持向量机中进行训练,输出训练结果。该方法在基于传统支持向量机反馈方法的基础上,对样本进行扩展和更新并使用数据降维的理论对样本进行处理。解决了传统支持向量机由于训练样本少造成不稳定的问题、正例样本远远少于反例样本造成分类器最优超平面偏移的问题。
Description
技术领域
本发明属于图像检索领域,特别是一基于支持向量机的图像反馈方法及系统。
背景技术
为了能够从大量的图像数据中快速、准确地找到用户所需内容,基于内容的图像检索技术得到了广泛关注,成为信息检索领域的研究热点,并已成为国际学术界研究的一个热点。所谓基于内容的图像检索,就是根据图像的颜色、纹理、形状等特征,按照某种相似度计算方法,从图像库中找出与用户事先想要查询的图像最相似的若干幅图像。由于图像底层视觉特征与图像高级语义之间存在代沟,因此人们提出了基于反馈的图像检索方法来解决这一问题。
一般情况下,图像特征用高维向量表示,一幅图像可以看作高维空间中的一个点,相似图像检索则可以转化成寻找高维特征空间中与指定点距离最近的一组点的问题。
现有的图像检索方式普遍采用基于支持向量机的图像反馈方法,但由于被标记的训练样本数量很少,造成的支持向量机的分类器的超平面偏移,以致分类效果不佳。
发明内容
针对现有基于支持向量机的图像反馈方法在图像检索中存在的问题,本发明提出了一基于支持向量机的图像反馈方法及系统。本发明采用的技术手段如下:
一种基于支持向量机的图像反馈方法,其特征在于包括以下步骤:
S1:提取图像库中每幅图像的底层视觉特征,并将提取的底层视觉特征放入特征库;
S2:调取用户在图像库中选取的示例图像,利用特征库查找图像库中与该示例图像最相似的N幅图像;
S3:将N幅图像标记为正例图像和反例图像,形成正例图像集和反例图像集;
S4:对正例图像集和反例图像集进行扩展和更新后,将正例图像集和反例图像集中的图像放入支持向量机中进行训练,输出训练结果。
本发明的基于支持向量机的图像反馈方法在基于传统支持向量机反馈方法的基础上,对样本进行扩展和更新并使用数据降维的理论对样本进行处理。该方法不仅解决了传统支持向量机由于训练样本少造成不稳定的问题、正例样本远远少于反例样本造成分类器最优超平面偏移的问题,而且也解决了目标类图像与其他类图像难以区分以及图像特征的维数过大而造成的维数灾难问题。本发明有效改进了支持向量机存在的缺陷,显著提高了分类器的性能,对基于相关反馈的图像检索研究与应用有很好的参考和实用价值。
附图说明
图1为本发明的基于支持向量机的图像反馈方法的流程图。
图2为本发明的基于支持向量机的图像反馈系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
如图1所示,本发明的基于支持向量机的图像反馈方法包括以下步骤:
步骤S1:提取图像库中每幅图像的底层视觉特征,并将提取的底层视觉特征放入特征库。
当底层视觉特征是颜色特征时,该步骤又包括以下步骤:将RGB颜色空间转换到HSV空间;将HSV颜色空间量化成64份;统计落在每一份颜色空间中像素点的个数作为颜色特征。
当底层视觉特征是纹理特征时,该步骤又包括以下步骤:对图像进行3级小波变换;计算每级变换后的3个子带的均值和方差作为纹理特征。
当底层视觉特征是形状特征时,该步骤又包括以下步骤:用Sobel算子提取图像边缘点;统计图像边缘点在水平、45度、垂直、135度方向的像素点个数作为形状特征。
步骤S2:调取用户在图像库中选取的示例图像,利用特征库查找图像库中与该示例图像最相似的N幅图像。
利用特征库查找图像库中与该示例图像最相似的N幅图像的步骤又包括以下步骤:计算示例图像的底层视觉特征;应用欧式距离算法计算示例图像的底层视觉特征与图像库中每一图像的相似度;将全部相似度由高到低排序,并将排序在前的N幅图像作为与该示例图像最相似的N幅图像。
应用欧式距离算法计算示例图像的底层视觉特征与图像库中每一图像的相似度又可以表示为:
Si,j=exp(-|xi-xj|2)
其中,Si,j是示例图像xi与图像库中每一图像xj的相似度。
步骤S3:将N幅图像标记为正例图像和反例图像,形成正例图像集和反例图像集。
该步骤又包括以下步骤:将N幅图像中与示例图像属于同一语义类的图像标记为正例图像,将N幅图像中与示例图像不属于同一语义类的图像标记为反例图像。
步骤S4:对正例图像集和反例图像集进行扩展和更新后,将正例图像集和反例图像集中的图像放入支持向量机中进行训练,输出训练结果。
对正例图像集和反例图像集进行扩展的步骤又包括以下步骤:从图像库中未标记的图像中,选取相似度排序在前的若干幅图像作为正例图像加入正例图像集;从图像库中未标记的图像中,选取相似度排序在后的若干幅图像作为反例图像加入反例图像集,从而增加了总的训练样本图像的数量。
对正例图像集进行更新的步骤又包括以下步骤:根据正例图像贡献值公式计算正例图像集中每一正例图像的贡献值,以及图像库中每一未标记图像的贡献值;用未标记图像中具有最大贡献值的未标记图像替换正例图像集中具有最小贡献值的正例图像。其中的正例图像贡献值公式可以表示为:
其中,λ为权重值,t(v)是针对步骤S1提取的底层视觉特征使用K-Means算法做自然聚类得到的聚类结果计算得到的图像的典型性值,τ(v)是图像集中每一未标记图像和正例图像集中每一正例图像分别与示例图像的相似度的排序,ΔFp(v)是正例图像集中每一正例图像和图像库中每一未标记图像的贡献值。
对反例图像集进行更新的步骤又包括以下步骤:根据反例图像贡献值公式计算反例图像集中每一反例图像的贡献值,以及图像库中每一未标记图像的贡献值;用未标记图像中具有最大贡献值的未标记图像替换反例图像集中具有最小贡献值的反例图像。其中的反例图像的贡献值公式可以表示为:
其中,λ为权重值,t(v)是针对步骤S1提取的底层视觉特征使用K-Means算法做自然聚类得到的聚类结果计算得到的图像的典型性值,τ(v)是图像集中每一未标记图像和反例图像集中每一反例图像分别与示例图像的相似度的排序,ΔFm(v)是反例图像集中每一反例图像和图像库中每一未标记图像的贡献值。
在步骤S4之后,还可以包括以下步骤:对图像库中的图像按照与示例图像的相似度进行重排序,使得正例样本靠前,排序后得到图像特征矩阵X;减小正例样本集中正例样本的类内距离;增大反例样本集中反例样本的类内距离;得到一映射矩阵,利用该映射矩阵将图像库中的高维图像特征映射到低维空间。
减小正例样本集中正例样本的类内距离的步骤可以表示为:
是正例样本集中选定的正例样本,是正例样本集中除选定的正例样本之外的任一正例样本,wi,j是正例样本集中除选定的正例样本之外的任一正例样本相对选定的正例样本的权重,是误差值。
增大反例样本集中反例样本的类内距离的步骤可以表示为:
是反例样本集中选定的反例样本,是反例样本集中除选定的反例样本之外的任一反例样本,hi,j是反例样本集中除选定的反例样本之外的任一反例样本相对选定的反例样本的权重。
得到一映射矩阵的步骤可以表示为:利用wi,j和hi,j构成一矩阵M1;利用公式 求得映射矩阵U。
利用该映射矩阵将图像库中的高维图像特征映射到低维空间的步骤可以表示为:
Y=UTX∈RL×n
其中,Y是低维空间图像特征矩阵。
如图2所示,本发明的基于支持向量机的图像反馈系统包括:提取单元1,用于提取图像库中每幅图像的底层视觉特征,并将提取的底层视觉特征放入特征库;预处理单元2,用于对提取的底层视觉特征使用K-Means算法做自然聚类得到的聚类结果计算得到的图像的典型性值;检索单元3,用于调取用户在图像库中选取的示例图像,利用特征库查找图像库中与该示例图像最相似的N幅图像;标记单元4,用于将N幅图像标记为正例图像和反例图像,形成正例图像集和反例图像集;学习单元5,用于对正例图像集和反例图像集进行扩展和更新后,将正例图像集和反例图像集中的图像放入支持向量机中进行训练,输出训练结果。其中,提取单元1、检索单元3、标记单元4、学习单元5分别的执行步骤如上所述。
本发明的基于支持向量机的图像反馈方法在基于传统支持向量机反馈方法的基础上,对样本进行扩展和更新并使用数据降维的理论对样本进行处理。该方法不仅解决了传统支持向量机由于训练样本少造成不稳定的问题、正例样本远远少于反例样本造成分类器最优超平面偏移的问题,而且也解决了目标类图像与其他类图像难以区分以及图像特征的维数过大而造成的维数灾难问题。本发明有效改进了支持向量机存在的缺陷,显著提高了分类器的性能,对基于相关反馈的图像检索研究与应用有很好的参考和实用价值。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种基于支持向量机的图像反馈方法,其特征在于包括以下步骤:
S1:提取图像库中每幅图像的底层视觉特征,并将提取的底层视觉特征放入特征库;
S2:调取用户在图像库中选取的示例图像,利用特征库查找图像库中与该示例图像最相似的N幅图像;
S3:将N幅图像标记为正例图像和反例图像,形成正例图像集和反例图像集;
S4:对正例图像集和反例图像集进行扩展和更新后,将正例图像集和反例图像集中的图像放入支持向量机中进行训练,输出训练结果;
在步骤S4之后还包括以下步骤:对图像库中的图像按照与示例图像的相似度进行重排序,使得正例样本靠前,排序后得到图像特征矩阵X;减小正例样本集中正例样本的类内距离;增大反例样本集中反例样本的类内距离;得到一映射矩阵,利用该映射矩阵将图像库中的高维图像特征映射到低维空间;
减小正例样本集中正例样本的类内距离的步骤表示为: 是正例样本集中选定的正例样本,是正例样本集中除选定的正例样本之外的任一正例样本,wi,j是正例样本集中除选定的正例样本之外的任一正例样本相对选定的正例样本的权重,是误差值;
增大反例样本集中反例样本的类内距离的步骤表示为: 是反例样本集中选定的反例样本,是反例样本集中除选定的反例样本之外的任一反例样本,hi,j是反例样本集中除选定的反例样本之外的任一反例样本相对选定的反例样本的权重;
得到一映射矩阵的步骤可以表示为:利用wi,j和hi,j构成一矩阵M1;利用公式 求得映射矩阵U;
利用该映射矩阵将图像库中的高维图像特征映射到低维空间的步骤可以表示为:Y=UTX∈RL×n,其中,Y是低维空间图像特征矩阵。
2.根据权利要求1所述的方法,其特征在于当底层视觉特征是颜色特征时,步骤S1又包括以下步骤:将RGB颜色空间转换到HSV空间;将HSV颜色空间量化成64份;统计落在每一份颜色空间中像素点的个数作为颜色特征;
当底层视觉特征是纹理特征时,步骤S1又包括以下步骤:对图像进行3级小波变换;计算每级变换后的3个子带的均值和方差作为纹理特征;
当底层视觉特征是形状特征时,步骤S1又包括以下步骤:用Sobel算子提取图像边缘点;统计图像边缘点在水平、45度、垂直、135度方向的像素点个数作为形状特征。
3.根据权利要求1所述的方法,其特征在于利用特征库查找图像库中与该示例图像最相似的N幅图像的步骤又包括以下步骤:
计算示例图像的底层视觉特征;
应用欧式距离算法计算示例图像的底层视觉特征与图像库中每一图像的相似度;
将全部相似度由高到低排序,并将排序在前的N幅图像作为与该示例图像最相似的N幅图像。
4.根据权利要求3所述的方法,其特征在于应用欧式距离算法计算示例图像的底层视觉特征与图像库中每一图像的相似度又可以表示为:
Si,j=exp(-|xi-xj|2)
其中,Si,j是示例图像xi与图像库中每一图像xj的相似度。
5.根据权利要求1所述的方法,其特征在于步骤S3包括以下步骤:将N幅图像中与示例图像属于同一语义类的图像标记为正例图像,将N幅图像中与示例图像不属于同一语义类的图像标记为反例图像。
6.根据权利要求1所述的方法,其特征在于对正例图像集和反例图像集进行扩展的步骤又包括以下步骤:
从图像库中未标记的图像中,选取相似度排序在前的若干幅图像作为正例图像加入正例图像集;
从图像库中未标记的图像中,选取相似度排序在后的若干幅图像作为反例图像加入反例图像集,从而增加了总的训练样本图像的数量。
7.根据权利要求1所述的方法,其特征在于对正例图像集进行更新的步骤又包括以下步骤:根据正例图像贡献值公式计算正例图像集中每一正例图像的贡献值,以及图像库中每一未标记图像的贡献值;用未标记图像中具有最大贡献值的未标记图像替换正例图像集中具有最小贡献值的正例图像;其中的正例图像贡献值公式可以表示为:
其中,λ为权重值,t(v)是针对步骤S1提取的底层视觉特征使用K-Means算法做自然聚类得到的聚类结果计算得到的图像的典型性值,τ(v)是图像集中每一未标记图像和正例图像集中每一正例图像分别与示例图像的相似度的排序,ΔFp(v)是正例图像集中每一正例图像和图像库中每一未标记图像的贡献值。
8.根据权利要求1所述的方法,其特征在于对反例图像集进行更新的步骤又包括以下步骤:根据反例图像贡献值公式计算反例图像集中每一反例图像的贡献值,以及图像库中每一未标记图像的贡献值;用未标记图像中具有最大贡献值的未标记图像替换反例图像集中具有最小贡献值的反例图像;其中的反例图像的贡献值公式可以表示为:
其中,λ为权重值,t(v)是针对步骤S1提取的底层视觉特征使用K-Means算法做自然聚类得到的聚类结果计算得到的图像的典型性值,τ(v)是图像集中每一未标记图像和反例图像集中每一反例图像分别与示例图像的相似度的排序,ΔFm(v)是反例图像集中每一反例图像和图像库中每一未标记图像的贡献值。
9.一种基于支持向量机的图像反馈系统,其特征在于包括:
提取单元,用于提取图像库中每幅图像的底层视觉特征,并将提取的底层视觉特征放入特征库;
预处理单元,用于对提取的底层视觉特征使用K-Means算法做自然聚类,并对做自然聚类得到的聚类结果计算得到图像的典型性值;
检索单元,用于调取用户在图像库中选取的示例图像,利用特征库查找图像库中与该示例图像最相似的N幅图像;
标记单元,用于将N幅图像标记为正例图像和反例图像,形成正例图像集和反例图像集;
学习单元,用于对正例图像集和反例图像集进行扩展和更新后,将正例图像集和反例图像集中的图像放入支持向量机中进行训练,输出训练结果,之后对图像库中的图像按照与示例图像的相似度进行重排序,使得正例样本靠前,排序后得到图像特征矩阵X,减小正例样本集中正例样本的类内距离,增大反例样本集中反例样本的类内距离,然后得到一映射矩阵,利用该映射矩阵将图像库中的高维图像特征映射到低维空间;
所述减小正例样本集中正例样本的类内距离的过程表示为 是正例样本集中选定的正例样本,是正例样本集中除选定的正例样本之外的任一正例样本,wi,j是正例样本集中除选定的正例样本之外的任一正例样本相对选定的正例样本的权重,是误差值;所述增大反例样本集中反例样本的类内距离的过程表示为 是反例样本集中选定的反例样本,是反例样本集中除选定的反例样本之外的任一反例样本,hi,j是反例样本集中除选定的反例样本之外的任一反例样本相对选定的反例样本的权重;
所述得到一映射矩阵的过程表示为利用wi,j和hi,j构成一矩阵M1;利用公式求得映射矩阵U;所述利用该映射矩阵将图像库中的高维图像特征映射到低维空间的过程表示为Y=UTX∈RL×n,其中,Y是低维空间图像特征矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110449087.7A CN102542050B (zh) | 2011-12-28 | 2011-12-28 | 基于支持向量机的图像反馈方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110449087.7A CN102542050B (zh) | 2011-12-28 | 2011-12-28 | 基于支持向量机的图像反馈方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102542050A CN102542050A (zh) | 2012-07-04 |
CN102542050B true CN102542050B (zh) | 2016-01-20 |
Family
ID=46348929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110449087.7A Expired - Fee Related CN102542050B (zh) | 2011-12-28 | 2011-12-28 | 基于支持向量机的图像反馈方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102542050B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530656B (zh) * | 2013-09-10 | 2017-01-11 | 浙江大学 | 基于隐结构学习的图像摘要生成方法 |
CN103714281B (zh) * | 2013-12-12 | 2017-03-29 | 深圳先进技术研究院 | 一种基于心电信号的身份识别方法 |
CN105701499B (zh) * | 2015-12-31 | 2019-06-18 | 中国科学院深圳先进技术研究院 | 一种用于脑部mri图像分类的图像处理方法 |
CN108121943B (zh) * | 2016-11-30 | 2022-05-06 | 阿里巴巴集团控股有限公司 | 基于图片的判别方法及装置和计算设备 |
CN109189959B (zh) * | 2018-09-06 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 一种构建图像数据库的方法及装置 |
CN111126504A (zh) * | 2019-12-27 | 2020-05-08 | 西北工业大学 | 多源不完备信息融合图像目标分类方法 |
CN116739106A (zh) * | 2023-05-22 | 2023-09-12 | 中国医学科学院医学信息研究所 | 一种图像数据集扩展方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295305A (zh) * | 2007-04-25 | 2008-10-29 | 富士通株式会社 | 图像检索装置 |
CN101853304A (zh) * | 2010-06-08 | 2010-10-06 | 河海大学 | 基于特征选择和半监督学习的遥感图像检索方法 |
CN102024030A (zh) * | 2010-11-30 | 2011-04-20 | 辽宁师范大学 | 基于最大期望参数估计的多分类器集成方法 |
CN102184186A (zh) * | 2011-04-12 | 2011-09-14 | 宋金龙 | 基于多特征自适应融合的图像检索方法 |
-
2011
- 2011-12-28 CN CN201110449087.7A patent/CN102542050B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295305A (zh) * | 2007-04-25 | 2008-10-29 | 富士通株式会社 | 图像检索装置 |
CN101853304A (zh) * | 2010-06-08 | 2010-10-06 | 河海大学 | 基于特征选择和半监督学习的遥感图像检索方法 |
CN102024030A (zh) * | 2010-11-30 | 2011-04-20 | 辽宁师范大学 | 基于最大期望参数估计的多分类器集成方法 |
CN102184186A (zh) * | 2011-04-12 | 2011-09-14 | 宋金龙 | 基于多特征自适应融合的图像检索方法 |
Non-Patent Citations (1)
Title |
---|
一种基于SVM的相关反馈图像检索算法;姜楠楠等;《微型电脑应用》;20080430;第24卷(第4期);第14页左栏第5段及第14页右栏第2和4段 * |
Also Published As
Publication number | Publication date |
---|---|
CN102542050A (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102542050B (zh) | 基于支持向量机的图像反馈方法及系统 | |
US10102443B1 (en) | Hierarchical conditional random field model for labeling and segmenting images | |
CN102024030A (zh) | 基于最大期望参数估计的多分类器集成方法 | |
Fergus et al. | Learning object categories from google's image search | |
CN102663015B (zh) | 基于特征袋模型和监督学习的视频语义标注方法 | |
Badrinarayanan et al. | Label propagation in video sequences | |
CN103886330B (zh) | 基于半监督svm集成学习的分类方法 | |
CN102903110B (zh) | 对具有深度图像信息的图像的分割方法 | |
CN102339306B (zh) | 基于草图的图像搜索 | |
CN102254303B (zh) | 遥感图像分割方法及遥感图像检索方法 | |
CN101923653B (zh) | 一种基于多层次内容描述的图像分类方法 | |
CN105389550A (zh) | 一种基于稀疏指引与显著驱动的遥感目标检测方法 | |
Schinas et al. | CERTH@ MediaEval 2012 Social Event Detection Task. | |
CN105808752A (zh) | 一种基于cca和2pknn的自动图像标注方法 | |
CN105740378B (zh) | 一种数字病理全切片图像检索方法 | |
CN106021406A (zh) | 一种数据驱动的迭代式图像在线标注方法 | |
CN105808665A (zh) | 一种新的基于手绘草图的图像检索方法 | |
CN103761503A (zh) | 用于相关反馈图像检索的自适应训练样本选取方法 | |
CN103514276B (zh) | 基于中心估计的图形目标检索定位方法 | |
CN102831161A (zh) | 用于图像检索的基于流形正则化的半监督排序学习方法 | |
CN104346456B (zh) | 基于空间依赖性度量的数字图像多语义标注方法 | |
Shyr et al. | Supervised hierarchical Pitman-Yor process for natural scene segmentation | |
Lu et al. | Image categorization via robust pLSA | |
Babbar et al. | Maximum-margin framework for training data synchronization in large-scale hierarchical classification | |
CN103049570A (zh) | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160120 Termination date: 20191228 |