CN103489003A - 一种基于云计算的手机图像标注方法 - Google Patents
一种基于云计算的手机图像标注方法 Download PDFInfo
- Publication number
- CN103489003A CN103489003A CN201310455285.3A CN201310455285A CN103489003A CN 103489003 A CN103489003 A CN 103489003A CN 201310455285 A CN201310455285 A CN 201310455285A CN 103489003 A CN103489003 A CN 103489003A
- Authority
- CN
- China
- Prior art keywords
- regularization
- image
- vector machine
- support vector
- gloomy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于云计算的手机图像标注方法,该方法中的云端实现的所述训练海森正则化支持向量机的训练步骤如下:步骤1、假设有标注样本(x,y)∈Rn×{±1}分布为P,无标注样本的分布是P的边缘分布PX;如果边缘分布PX与条件分布P(y|x)相关,则PX有助于学习;基于假设相似的图像对xi和xj意味着相似的条件分布对P(y|xi)和P(y|xj);步骤2、利用海森正则化构造局部几何信息;步骤3、构造二分类的海森正则化支持向量机目标函数。该方案将压缩后的手机图像传输到云上,然后在云上通过海森正则化支持向量机实现图像的语义标注。利用本发明的提出的海森正则化支持向量机,可以减少模型训练对人工标注样本的依赖,具有提高了图像标注的准确度等优点。
Description
技术领域
本发明涉及一种模式识别与人工智能技术领域中的图像标注方法,特别涉及一种基于云计算的手机图像标注方法。
背景技术
带有数字摄像头的智能手机越来越流行,很容易产生大量的个人数字图像。虽然,在智能手机中流行利用时间和目录对图像进行管理,但是这使得在语义层面进行有效图片搜索非常不方便。因此,基于语义关键词进行图像标注的系统有利于个人照片管理。图像标注的目标是对每张图片分配几个关键词。这个是在图像处理、计算机视觉以及多媒体领域中的一个基础的研究问题。一般来说,它通过以下几个步骤来实现:对于给定一个训练集,我们首先提取能代表这些图像的视觉特征;然后,基于这些图像的一系列模型被训练出来用于后面的标注,每个模型对应于相应的特定关键词(或者概念)。然而,目前直接在手机上进行图像的自动标注存在以下问题:1)带标签的样本能有效改善图像标注模型的性能。然而,想要获得大量的带标注样本是很难的。2)移动终端计算资源非常有限,不可能对一个新获得的图像进行实时标注。除此以外,因为移动终端的小储存量,用户并不能获得大量的图像来构造一个可靠的学习模型。因此,寻找另外一个可行的方法来进行移动终端上的图像标注是非常必要的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于云计算的手机图像标注方法,该方法解决了手机进行图像自动标注的以下两个关键问题:1)模型训练中需要大量人工标注样本,而人工标注样本存在费时费力的情况;2)手机计算和存储资源非常有限。
本发明的目的通过下述技术方案实现:一种基于云计算的手机图像标注方法,具体实现方式:
1)在云端存储数量为l带标注的图像特征集其中标注为yi∈{+1,-1},和数量为u无标注的图像特征集2)在云端训练海森正则化支持向量机;3)利用压缩感知技术对移动图像进行压缩,并将压缩后的图像传输到云上;4)在云上利用压缩感知技术对压缩的图像进行解码;5)通过训练出来的海森正则化支持向量机进行图像标注;6)将标注的结果返回到移动终端设备。
所述基于云计算的手机图像标注方法中海森正则化支持向量机算法具体实现:
1)假设有标注样本(x,y)∈Rn×{±1}分布为P,无标注样本的分布是P的边缘分布PX。如果边缘分布PX与条件分布P(y|x)相关,则PX会有助于学习。这里基于假设相似的图像对xi和xj意味着相似的条件分布对P(y|xi)和P(y|xj)。
2)利用海森正则化构造局部几何信息具体步骤如下:
3)二分类的海森正则化支持向量机目标函数为
其中,L(xi,yi)为损失函数,即(1-yif(xi))+=max(0,1-yif(xi)),是f的再生核希尔伯特空间HK的范数,λK作为参数控制f映射到空间Rn中的复杂度,是包含边缘分布PX的本征几何信息的海森正则化项,λH作为参数控制在PX的紧支集(compact support)上的f的复杂度。
本发明相对于现有技术具有如下的优点及效果:
1、本发明的基于云计算的手机图像标注方法是利用海森流形正则化技术,获得大量无标注的样本流形信息以提高传统SVM分类器在少量标注样本的情况下的性能。
2、本发明利用云端实现大量复杂训练与测试计算,有助于极大减少算法对手机计算和存储的要求。
3、本发明提出的海森正则化支持向量机与广泛使用的支持向量机相比,可以减少模型训练对人工标注样本的依赖,并提高图像标注的准确度。
附图说明
图1是本发明实施例的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
为了清楚说明本发明对于图像标注的有效性,如图1所示,在本实施例中进行了图像标注试验,并与经典支持向量机(SVM)进行对比。其中试验数据选择常见的PASCAL VOC’7数据集,PASCAL VOC’07数据集一共有9,963张图像。数据集中包括有人、鸟、猫、牛、狗、马、羊、飞机、自行车、船、公共汽车、小汽车、摩托车、火车、瓶子、椅子、餐桌、盆栽、沙发和电视机/屏幕20个类别。在评估监督学习算法的性能时,我们不用无标注的数据。所有的图像提取常见的GIST特征作为图像表达。具体实施步骤如下:
步骤1:训练子集和测试子集分别包含了5,011和4,952张图像。我们将训练子集进一步分成了两个子集,4,500张图像用于训练,另外511张图像用于参数验证。我们进行10次随机的划分来对性能进行评估。在训练集(4,500张图像)中,我们分别用10%,的图像作为标注数据,剩下的作为无标注数据来进行半监督实验;
步骤2:在云端通过以下步骤训练海森正则化支持向量机:
步骤2.1利用海森正则化构造局部几何信息,具体步骤如下
步骤2.1.4:对所以图像的进行累加,然后获得海森正则化fTHf。
步骤2.2:海森正则化支持向量机目标函数为:
其中L(xi,yi)为损失函数,即(1-yif(xi))+=max(0,1-yif(xi)),是f的再生核希尔伯特空间HK的范数,λK作为参数控制f映射到空间Rn中的复杂度,是包含边缘分布PX的本征几何信息的海森正则化项,λH作为参数控制在PX的紧支集(compact support)上的f的复杂度。
步骤3:利用压缩感知技术对移动图像进行压缩,并将压缩后的图像传输到云上;
步骤4:在云上利用压缩感知技术对压缩的图像进行解码;
步骤5:通过训练出来的海森正则化支持向量机进行图像标注;
步骤6:将标注的结果返回到移动终端设备。
表1显示了提出海森正则化支持向量机与支持向量机(SVM)的标注结果对比。可以看出,在标注准确度上,本专利方法有明显优势。
表1为本专利方法与SVM在PASCAL VOC’7数据集的实验结果对比:
表1
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (3)
1.一种基于云计算的手机图像标注方法,包括以下步骤:
2)在云端训练海森正则化支持向量机;
3)利用压缩感知技术对移动图像进行压缩,并将压缩后的图像传输到云上;
4)在云上利用压缩感知技术对压缩的图像进行解码;
5)通过训练出来的海森正则化支持向量机进行图像标注;
6)将标注的结果返回到移动终端设备;
其特征在于,所述步骤2)中,云端实现的所述训练海森正则化支持向量机的训练步骤如下:
步骤1、假设有标注样本(x,y)∈Rn×{±1}分布为P,无标注样本的分布是P的边缘分布PX;如果边缘分布PX与条件分布P(y|x)相关,则PX有助于学习;基于假设相似的图像对xi和xj意味着相似的条件分布对P(y|xi)和P(y|xj);
步骤2、利用海森正则化构造局部几何信息;
步骤3、构造二分类的海森正则化支持向量机目标函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310455285.3A CN103489003B (zh) | 2013-09-29 | 2013-09-29 | 一种基于云计算的手机图像标注方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310455285.3A CN103489003B (zh) | 2013-09-29 | 2013-09-29 | 一种基于云计算的手机图像标注方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103489003A true CN103489003A (zh) | 2014-01-01 |
CN103489003B CN103489003B (zh) | 2017-04-19 |
Family
ID=49829210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310455285.3A Active CN103489003B (zh) | 2013-09-29 | 2013-09-29 | 一种基于云计算的手机图像标注方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103489003B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599932A (zh) * | 2016-12-23 | 2017-04-26 | 山东省科学院情报研究所 | 一种基于多视角谱聚类的图像识别方法 |
CN109416721A (zh) * | 2016-06-22 | 2019-03-01 | 微软技术许可有限责任公司 | 隐私保护机器学习 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101540048A (zh) * | 2009-04-21 | 2009-09-23 | 北京航空航天大学 | 一种基于支持向量机的图像质量评价方法 |
US20100113091A1 (en) * | 2008-10-31 | 2010-05-06 | Sharma Ravi K | Histogram methods and systems for object recognition |
CN102332162A (zh) * | 2011-09-19 | 2012-01-25 | 西安百利信息科技有限公司 | 基于人工神经网络的医学图像兴趣区自动识别和分级压缩方法 |
CN103150578A (zh) * | 2013-04-09 | 2013-06-12 | 山东师范大学 | 一种基于半监督学习的支持向量机分类器训练方法 |
-
2013
- 2013-09-29 CN CN201310455285.3A patent/CN103489003B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100113091A1 (en) * | 2008-10-31 | 2010-05-06 | Sharma Ravi K | Histogram methods and systems for object recognition |
CN101540048A (zh) * | 2009-04-21 | 2009-09-23 | 北京航空航天大学 | 一种基于支持向量机的图像质量评价方法 |
CN102332162A (zh) * | 2011-09-19 | 2012-01-25 | 西安百利信息科技有限公司 | 基于人工神经网络的医学图像兴趣区自动识别和分级压缩方法 |
CN103150578A (zh) * | 2013-04-09 | 2013-06-12 | 山东师范大学 | 一种基于半监督学习的支持向量机分类器训练方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109416721A (zh) * | 2016-06-22 | 2019-03-01 | 微软技术许可有限责任公司 | 隐私保护机器学习 |
CN106599932A (zh) * | 2016-12-23 | 2017-04-26 | 山东省科学院情报研究所 | 一种基于多视角谱聚类的图像识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103489003B (zh) | 2017-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shu et al. | Weakly-shared deep transfer networks for heterogeneous-domain knowledge propagation | |
Avila et al. | Pooling in image representation: The visual codeword point of view | |
Wang et al. | Multimodal graph-based reranking for web image search | |
CN109117781B (zh) | 多属性识别模型的建立方法、装置及多属性识别方法 | |
Wang et al. | Multi-manifold ranking: Using multiple features for better image retrieval | |
Bao et al. | Hidden-concept driven multilabel image annotation and label ranking | |
Zhang et al. | Random multi-graphs: a semi-supervised learning framework for classification of high dimensional data | |
CN110717401A (zh) | 年龄估计方法及装置、设备、存储介质 | |
Qayyum et al. | Designing deep CNN models based on sparse coding for aerial imagery: a deep-features reduction approach | |
Sun et al. | Scene categorization using deeply learned gaze shifting kernel | |
CN113704506A (zh) | 一种媒体内容排重方法和相关装置 | |
Liu et al. | Sparse autoencoder for social image understanding | |
Wang et al. | Learning to rank tags | |
Liu et al. | Joint graph learning and matching for semantic feature correspondence | |
Yang et al. | Place deduplication with embeddings | |
Li et al. | Augmenting bag-of-words: a robust contextual representation of spatiotemporal interest points for action recognition | |
CN114663766A (zh) | 基于多图像协同注意力机制的植物叶片识别系统及方法 | |
Li et al. | Image decomposition with multilabel context: Algorithms and applications | |
CN114519397A (zh) | 基于对比学习的实体链接模型的训练方法、装置、设备 | |
CN103489003A (zh) | 一种基于云计算的手机图像标注方法 | |
CN103324942A (zh) | 一种图像分类方法、装置及系统 | |
Wang et al. | Sparse representation of local spatial-temporal features with dimensionality reduction for motion recognition | |
Khan et al. | Tvgraz: Multi-modal learning of object categories by combining textual and visual features | |
CN104331717A (zh) | 一种整合特征字典结构与视觉特征编码的图像分类方法 | |
Pang et al. | Multimodal learning for multi-label image classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |