CN103473275A - 一种采用多特征融合的图像自动标注方法和系统 - Google Patents
一种采用多特征融合的图像自动标注方法和系统 Download PDFInfo
- Publication number
- CN103473275A CN103473275A CN2013103743162A CN201310374316A CN103473275A CN 103473275 A CN103473275 A CN 103473275A CN 2013103743162 A CN2013103743162 A CN 2013103743162A CN 201310374316 A CN201310374316 A CN 201310374316A CN 103473275 A CN103473275 A CN 103473275A
- Authority
- CN
- China
- Prior art keywords
- image
- automatic
- annotation
- classification
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 20
- 238000002372 labelling Methods 0.000 title abstract description 12
- 238000003064 k means clustering Methods 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 20
- 238000013179 statistical model Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000013467 fragmentation Methods 0.000 claims description 2
- 238000006062 fragmentation reaction Methods 0.000 claims description 2
- 239000010902 straw Substances 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 238000013523 data management Methods 0.000 abstract description 5
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种采用多特征融合的图像自动标注方法和系统,标注方法是使用多种特征类型来表示图像内容,引入多特征表示的特征签名,结合K-Means聚类算法得到基于多特征融合的图像语义统计模型,用于对图像自动标注。其标注系统采用BS(Browser-Server)架构,系统框架包括统计模型构建部分和图像自动标注部分。该系统初始访问页面提供的功能有图像自动标注,同时支持本地文件上传和网络地址图片获取。该系统的数据管理页面提供数据管理功能,可以执行对数据库图像库的特征提取,建立统计模型。
Description
技术领域
本发明涉及图像自动标注领域,更具体地,涉及一种采用多特征融合的图像自动标注方法和系统。
背景技术
互联网和多媒体技术的快速发展,使得现今社会迈入了信息大爆炸时代,各种各样的网络应用和多媒体技术的快速发展得到了广泛的应用。同时,大量的多媒体数据日益成为各种信息的重要载体,其中图像数据日益成为继文本数据之后主要组成部分。图像数据的增多带来了管理和检索问题,如何在海量数据中获取所需的信息一直都是人们致力解决问题。为了解决大量图像数据的管理问题,需要为图像指定所属类别和标注信息,这些文本实际上相当于图像的高层语义信息。这些文本不仅提高了数据管理效率,而且能够推动基于内容的图像检索技术的发展。
因为数据量异常庞大,人工进行图像标注需要的时间和成本太高,如何实现图像的自动标注一直是研究的重点。
发明内容
为解决上述技术问题,本发明从图像的特征表示方面的特征点出发,提出了一种采用多特征融合的图像自动标注方法和系统,从而有效地解决了人工对图像标注带来的时间和成本问题。
本发明提供的技术解决方案:一种采用多特征融合的图像自动标注方法,使用多种特征类型来表示图像内容,引入多特征表示的特征签名,结合K-Means聚类算法得到基于多特征融合的图像语义统计模型,用于对图像自动标注。
一种采用多特征融合的图像自动标注系统,使用多特征融合的图像自动标注方法,对图像自动标注,系统采用BS架构,系统框架包括统计模型构建部分和图像自动标注部分,其中:
统计模型构建部分:所有的训练图像按照类别进行划分,通过特征提取模块提取所有图像的特征向量组成特征签名,对每一个类别的数据进行K-Means聚类运算得到原型并且进行相应的参数估计,这些原型和参数构成了各个类别的统计模型。
图像自动标注部分:图像自动标注部分采用分层的框架。输入查询图像(同时支持本地文件上传和网络地址图片获取)自动返回该图像的文字标注结果。
该系统初始访问页面提供的功能有图像自动标注,同时支持本地文件上传和网络地址图片获取。该系统的数据管理页面提供数据管理功能,可以执行对数据库图像库的特征提取,建立统计模型。
与现有技术相比,本发明的有效益效果是:本发明提出的图像自动标注框架能够很好的综合多特征类型的优点,提高图像自动标注的准确率。
附图说明
图1为本发明数据存储结构示意图。
图2为本发明类别原型提取流程图。
具体实施方式
下面结合附图对本发明做进一步的描述,但本发明的实施方式并不限于此。
采用多特征融合的图像自动标注的方法是使用多种特征类型来表示图像内容,引入多特征表示的特征签名,使用K-Means算法来提取每一个类别的原型,聚类过程中使用的距离度量是图像特征向量之间的相似度,具体流程:
1)选择一个特征类别k,根据总和距离最大的准则将n张图像初始化分为m子集S={s1,s2,...,sm},m<=n,子集中心为μl=(dl,1,dl,2,...,dl,D),l=1,2,…,m,其中di,j表示图像的特征向量;
2)选择图像Ii,i=1,2,…,n,分别计算与各子集中心的距离
如果将图像加入到对应的子集并重新计算中心,其中T1为新建中心阈值;否则创建新的子集并设置Ii为中心;
计算所有子集两两之间的距离D(sl,sr)=D(dl,k,dr,k),如果D(sl,sr)<T2,其中T2为合并中心阈值,则合并;
3)如果还有图像还未分类,则执行2);如果还有特征类别未遍历,则执行1)。
这样得到的每一个聚类中心就相当于该类别的原型。
结合K-Means聚类算法就可得到基于多特征融合的图像语义统计模型,接下来就是图像自动标注的过程:
图像标注部分采用分层结构;
第一步,提取输入的图像特征,构造图像特征签名;
第二步,第一层分类器处理,每一个分类器代表了一个类别的统计模型,计算输入的图像特征签名与按照特征类型分类的所有模型之间的相似度;
第三步,将所有分类器输出结果汇总到顶层分类器,这个分类器将根据所有类别的相似度大小算出相似度最高的k种类别,这k种类别对应的关键词就是图像自动标注的结果。
这样就可以实现对图像进行自动标注。
为了实现上述目的,本发明还提供了一种采用多特征融合的图像自动标注方法系统,该系统是基于BS(Browser-Server)架构,系统包括统计模型构建部分和图像自动标注部分两个部分,其中:
(1)统计模型构建部分包括数据库管理模块、特征提取模块、K-means聚类模块、参数估计模块、统计建模模块五个模块,其中:
数据库管理模块:系统使用Lucene进行数据引索,所有的图像特征签名使用文件分片进行存取,如图1所示。数据结构主要有三种类型,第一种是图像特征签名,第二种是原型(对训练数据进行聚合之后的结果),第三种是类别(图像自动标注和检索过程中需要使用的统计模型);
特征提取模块:系统使用多个特征向量组成图像的特征签名,为了能够全面表示图像的语义信息,主要使用了三种类型的特征:颜色、边缘和纹理;
K-means聚类模块:基于特征类型的K-means聚类算法,该模块的主要流程如图2,图中只展现了一个图像类别的其中一种特征类型的聚类流程,为了得到所有图像类别和所有特征向量类型的原型中心和特征权重,需要遍历所有的图像类别和所有的特征向量类型;
参数估计模块:包括两种类型参数:原型的先验概率和特征类型的相关权重。每一个原型的先验概率是直接计算该原型包含的成员数量在所有该类别的训练样本中占的比例;特征权重代表某一个特征类型对某一类别图像的重要程度,特征类型的相关权重是通过使用测试样本对模型进行试验,取其标注的准确率,再通过计算得到所有的特征权重;
统计建模模块:综合了K-means聚类模块和参数估计模块的结果,并利用所有的结果构建每一个类别的统计模型,这个统计模型可以应用于表示该类别图像的语义特征。
(2)图像自动标注部分采用分层的框架,图像自动标注部分的标注过程如本申请的方法中所述的标注过程一致。
以上所述的本发明的实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。
Claims (6)
1.一种采用多特征融合的图像自动标注方法,其特征在于,使用多种特征类型来表示图像内容,引入多特征表示的特征签名,结合K-Means聚类算法得到基于多特征融合的图像语义统计模型,用于对图像自动标注。
2.根据权利要求1所述的采用多特征融合的图像自动标注方法,其特征在于,使用K-Means算法来提取每一个类别的原型,聚类过程中使用的距离度量是图像特征向量之间的相似度,具体流程:
1)选择一个特征类别k,根据总和距离最大的准则将n张图像初始化分为m子集S={s1,s2,...,sm},m<=n;子集中心为μl=(dl,1,dl,2,...,dl,D),l=1,2,…,m,其中di,j表示图像的特征向量;
计算所有子集两两之间的距离D(sl,sr)=D(dl,k,dr,k),如果D(sl,sr)<T2,其中T2为合并中心阈值,则合并;
3)如果还有图像还未分类,则执行2);如果还有特征类别未遍历,则执行1)。
3.根据权利要求2所述的采用多特征融合的图像自动标注方法,其特征在于,所述图像自动标注采用分层的框架,图像自动标注部分的标注步骤包括:
第一步:提取图像特征,构造图像特征签名;
第二步:第一层分类器处理,每一个分类器代表了一个类别的统计模型,计算输入的图像特征签名与按照特征类型分类的所有模型之间的相似度;
第三步:将所有分类器输出结果汇总到顶层分类器,这个分类器将根据所有类别的相似度大小算出相似度最高的k种类别,这k种类别对应的关键词就是图像自动标注的结果。
4.一种采用多特征融合的图像自动标注系统,其特征在于,使用多特征融合的图像自动标注方法,对图像自动标注,系统采用BS架构,系统框架包括统计模型构建部分和图像自动标注部分,其中:
统计模型构建部分:所有的训练图像按照类别进行划分,通过特征提取模块提取所有图像的特征向量组成特征签名,对每一个类别的数据进行聚类运算得到原型并且进行相应的参数估计,这些原型和参数构成了各个类别的统计模型;
图像自动标注部分:输入查询图像,自动返回该图像的文字标注结果。
5.根据权利要求4所述的采用多特征融合的图像自动标注系统,其特征在于,统计模型构建部分包括数据库管理模块、特征提取模块、K-means聚类模块、参数估计模块、统计建模模块,其中:
数据库管理模块:系统使用Lucene进行数据引索,所有的图像特征签名使用文件分片进行存取;
特征提取模块:系统使用多个特征向量组成图像的特征签名;
K-means聚类模块:基于特征类型的K-means聚类算法;
参数估计模块:包括两种类型参数:原型的先验概率和特征类型的相关权重;
统计建模模块:综合了K-means聚类模块和参数估计模块的结果,并利用所有的结果构建每一个类别的统计模型,这个统计模型可以应用于表示该类别图像的语义特征。
6.根据权利要求5所述的采用多特征融合的图像自动标注系统,其特征在于,所述参数估计模块是每一个原型的先验概率是直接计算该原型包含的成员数量在所有该类别的训练样本中占的比例;特征权重代表某一个特征类型对某一类别图像的重要程度,特征类型的相关权重是通过使用测试样本对模型进行试验,取其标注的准确率,再通过计算得到所有的特征权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013103743162A CN103473275A (zh) | 2013-08-23 | 2013-08-23 | 一种采用多特征融合的图像自动标注方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013103743162A CN103473275A (zh) | 2013-08-23 | 2013-08-23 | 一种采用多特征融合的图像自动标注方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103473275A true CN103473275A (zh) | 2013-12-25 |
Family
ID=49798123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013103743162A Pending CN103473275A (zh) | 2013-08-23 | 2013-08-23 | 一种采用多特征融合的图像自动标注方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103473275A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484347A (zh) * | 2014-11-28 | 2015-04-01 | 浙江大学 | 一种基于地理信息的层次化视觉特征提取方法 |
CN105701502A (zh) * | 2016-01-06 | 2016-06-22 | 福州大学 | 一种基于蒙特卡罗数据均衡的图像自动标注方法 |
CN105809096A (zh) * | 2014-12-31 | 2016-07-27 | 中兴通讯股份有限公司 | 人物标注方法和终端 |
CN108595558A (zh) * | 2018-04-12 | 2018-09-28 | 福建工程学院 | 一种数据均衡策略和多特征融合的图像标注方法 |
CN109002843A (zh) * | 2018-06-28 | 2018-12-14 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN110222593A (zh) * | 2019-05-18 | 2019-09-10 | 四川弘和通讯有限公司 | 一种基于小规模神经网络的车辆实时检测方法 |
CN111753861A (zh) * | 2019-03-28 | 2020-10-09 | 香港纺织及成衣研发中心有限公司 | 主动学习自动图像标注系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101859320A (zh) * | 2010-05-13 | 2010-10-13 | 复旦大学 | 一种基于多特征签名的海量图像检索方法 |
CN102298605A (zh) * | 2011-06-01 | 2011-12-28 | 清华大学 | 基于有向图非等概率随机搜索的图像自动标注方法及装置 |
US8204842B1 (en) * | 2006-01-31 | 2012-06-19 | The Research Foundation Of State University Of New York | System and method for image annotation and multi-modal image retrieval using probabilistic semantic models comprising at least one joint probability distribution |
CN102542067A (zh) * | 2012-01-06 | 2012-07-04 | 上海交通大学 | 基于尺度学习和关联标号传播的自动图像语义标注方法 |
-
2013
- 2013-08-23 CN CN2013103743162A patent/CN103473275A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204842B1 (en) * | 2006-01-31 | 2012-06-19 | The Research Foundation Of State University Of New York | System and method for image annotation and multi-modal image retrieval using probabilistic semantic models comprising at least one joint probability distribution |
CN101859320A (zh) * | 2010-05-13 | 2010-10-13 | 复旦大学 | 一种基于多特征签名的海量图像检索方法 |
CN102298605A (zh) * | 2011-06-01 | 2011-12-28 | 清华大学 | 基于有向图非等概率随机搜索的图像自动标注方法及装置 |
CN102542067A (zh) * | 2012-01-06 | 2012-07-04 | 上海交通大学 | 基于尺度学习和关联标号传播的自动图像语义标注方法 |
Non-Patent Citations (2)
Title |
---|
吕明磊 等: "基于改进K-means算法的图像检索方法", 《计算机应用》, vol. 33, no. 1, 30 June 2013 (2013-06-30), pages 195 - 197 * |
罗晓燕 等: "基于MPEG-7和MM混合模型的图像自动标注算法", 《计算机工程与设计》, vol. 33, no. 12, 31 December 2012 (2012-12-31), pages 4707 - 4709 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484347A (zh) * | 2014-11-28 | 2015-04-01 | 浙江大学 | 一种基于地理信息的层次化视觉特征提取方法 |
CN104484347B (zh) * | 2014-11-28 | 2018-06-05 | 浙江大学 | 一种基于地理信息的层次化视觉特征提取方法 |
CN105809096A (zh) * | 2014-12-31 | 2016-07-27 | 中兴通讯股份有限公司 | 人物标注方法和终端 |
CN105701502A (zh) * | 2016-01-06 | 2016-06-22 | 福州大学 | 一种基于蒙特卡罗数据均衡的图像自动标注方法 |
CN105701502B (zh) * | 2016-01-06 | 2020-11-10 | 福州大学 | 一种基于蒙特卡罗数据均衡的图像自动标注方法 |
CN108595558A (zh) * | 2018-04-12 | 2018-09-28 | 福建工程学院 | 一种数据均衡策略和多特征融合的图像标注方法 |
CN108595558B (zh) * | 2018-04-12 | 2022-03-15 | 福建工程学院 | 一种数据均衡策略和多特征融合的图像标注方法 |
CN109002843A (zh) * | 2018-06-28 | 2018-12-14 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN111753861A (zh) * | 2019-03-28 | 2020-10-09 | 香港纺织及成衣研发中心有限公司 | 主动学习自动图像标注系统及方法 |
CN111753861B (zh) * | 2019-03-28 | 2024-04-30 | 香港纺织及成衣研发中心有限公司 | 主动学习自动图像标注系统及方法 |
CN110222593A (zh) * | 2019-05-18 | 2019-09-10 | 四川弘和通讯有限公司 | 一种基于小规模神经网络的车辆实时检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
CN103473275A (zh) | 一种采用多特征融合的图像自动标注方法和系统 | |
Hua et al. | Clickage: Towards bridging semantic and intent gaps via mining click logs of search engines | |
US8340405B2 (en) | Systems and methods for scalable media categorization | |
CN105210064B (zh) | 使用深度网络将资源分类 | |
CN104376105B (zh) | 一种社会媒体中图像低层视觉特征与文本描述信息的特征融合系统及方法 | |
CN103823838B (zh) | 一种多格式文档录入并比对的方法 | |
CN104156433B (zh) | 一种基于语义映射空间构建的图像检索方法 | |
CN105718532A (zh) | 一种基于多深度网络结构的跨媒体排序方法 | |
CN104346440A (zh) | 一种基于神经网络的跨媒体哈希索引方法 | |
CN104834693A (zh) | 基于深度搜索的视觉图像检索方法及系统 | |
CN107430604A (zh) | 图像内容的语义表示 | |
CN109918506A (zh) | 一种文本分类方法及装置 | |
CN104142995A (zh) | 基于视觉属性的社会事件识别方法 | |
CN104317838A (zh) | 一种基于耦合鉴别性字典的跨媒体哈希索引方法 | |
CN107392463A (zh) | 一种城市功能区识别方法、模块、装置及其存储装置 | |
CN104484347B (zh) | 一种基于地理信息的层次化视觉特征提取方法 | |
CN103942274B (zh) | 一种基于lda的生物医疗图像的标注系统及方法 | |
CN103617609A (zh) | 基于图论的k-means非线性流形聚类与代表点选取方法 | |
CN112036659A (zh) | 基于组合策略的社交网络媒体信息流行度预测方法 | |
CN114372532B (zh) | 标签标注质量的确定方法、装置、设备、介质及产品 | |
US20190034758A1 (en) | Systems and methods for clustering of near-duplicate images in very large image collections | |
CN103473308A (zh) | 基于最大间隔张量学习的高维多媒体数据分类方法 | |
CN114491071A (zh) | 一种基于跨媒体数据的食品安全知识图谱构建方法及系统 | |
CN113743079A (zh) | 一种基于共现实体交互图的文本相似度计算方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20131225 |