CN103489003A - 一种基于云计算的手机图像标注方法 - Google Patents

一种基于云计算的手机图像标注方法 Download PDF

Info

Publication number
CN103489003A
CN103489003A CN201310455285.3A CN201310455285A CN103489003A CN 103489003 A CN103489003 A CN 103489003A CN 201310455285 A CN201310455285 A CN 201310455285A CN 103489003 A CN103489003 A CN 103489003A
Authority
CN
China
Prior art keywords
regularization
image
vector machine
support vector
gloomy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310455285.3A
Other languages
English (en)
Other versions
CN103489003B (zh
Inventor
金连文
陶大鹏
黎小凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201310455285.3A priority Critical patent/CN103489003B/zh
Publication of CN103489003A publication Critical patent/CN103489003A/zh
Application granted granted Critical
Publication of CN103489003B publication Critical patent/CN103489003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于云计算的手机图像标注方法,该方法中的云端实现的所述训练海森正则化支持向量机的训练步骤如下:步骤1、假设有标注样本(x,y)∈Rn×{±1}分布为P,无标注样本的分布是P的边缘分布PX;如果边缘分布PX与条件分布P(y|x)相关,则PX有助于学习;基于假设相似的图像对xi和xj意味着相似的条件分布对P(y|xi)和P(y|xj);步骤2、利用海森正则化构造局部几何信息;步骤3、构造二分类的海森正则化支持向量机目标函数。该方案将压缩后的手机图像传输到云上,然后在云上通过海森正则化支持向量机实现图像的语义标注。利用本发明的提出的海森正则化支持向量机,可以减少模型训练对人工标注样本的依赖,具有提高了图像标注的准确度等优点。

Description

一种基于云计算的手机图像标注方法
技术领域
本发明涉及一种模式识别与人工智能技术领域中的图像标注方法,特别涉及一种基于云计算的手机图像标注方法。
背景技术
带有数字摄像头的智能手机越来越流行,很容易产生大量的个人数字图像。虽然,在智能手机中流行利用时间和目录对图像进行管理,但是这使得在语义层面进行有效图片搜索非常不方便。因此,基于语义关键词进行图像标注的系统有利于个人照片管理。图像标注的目标是对每张图片分配几个关键词。这个是在图像处理、计算机视觉以及多媒体领域中的一个基础的研究问题。一般来说,它通过以下几个步骤来实现:对于给定一个训练集,我们首先提取能代表这些图像的视觉特征;然后,基于这些图像的一系列模型被训练出来用于后面的标注,每个模型对应于相应的特定关键词(或者概念)。然而,目前直接在手机上进行图像的自动标注存在以下问题:1)带标签的样本能有效改善图像标注模型的性能。然而,想要获得大量的带标注样本是很难的。2)移动终端计算资源非常有限,不可能对一个新获得的图像进行实时标注。除此以外,因为移动终端的小储存量,用户并不能获得大量的图像来构造一个可靠的学习模型。因此,寻找另外一个可行的方法来进行移动终端上的图像标注是非常必要的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于云计算的手机图像标注方法,该方法解决了手机进行图像自动标注的以下两个关键问题:1)模型训练中需要大量人工标注样本,而人工标注样本存在费时费力的情况;2)手机计算和存储资源非常有限。
本发明的目的通过下述技术方案实现:一种基于云计算的手机图像标注方法,具体实现方式:
1)在云端存储数量为l带标注的图像特征集
Figure BDA0000389922150000021
其中标注为yi∈{+1,-1},和数量为u无标注的图像特征集
Figure BDA0000389922150000022
2)在云端训练海森正则化支持向量机;3)利用压缩感知技术对移动图像进行压缩,并将压缩后的图像传输到云上;4)在云上利用压缩感知技术对压缩的图像进行解码;5)通过训练出来的海森正则化支持向量机进行图像标注;6)将标注的结果返回到移动终端设备。
所述基于云计算的手机图像标注方法中海森正则化支持向量机算法具体实现:
1)假设有标注样本(x,y)∈Rn×{±1}分布为P,无标注样本的分布是P的边缘分布PX。如果边缘分布PX与条件分布P(y|x)相关,则PX会有助于学习。这里基于假设相似的图像对xi和xj意味着相似的条件分布对P(y|xi)和P(y|xj)。
2)利用海森正则化构造局部几何信息具体步骤如下:
步骤a:对应第j个无标注样本xj,找到其最近的k个近邻样本,组成邻域Np,从中取出xj后对该邻域进行中心化。此举将使得xj成为切向空间
Figure BDA0000389922150000024
的原点。
步骤b:用p点的邻域Np的相应的d个最大的特征值所对应的特征向量U来评价切向空间
Figure BDA0000389922150000025
正交坐标系。该步骤可以通过在
Figure BDA0000389922150000023
上进行特征值分解来实现,其中xi是邻域Np中的第i个样本。
步骤c:用施密特正交化去除矩阵Hj=[1,u1…um,u1u1…udud]中的d+1维零空间,得到矩阵
Figure BDA0000389922150000037
其Frobenius范数可以由
Figure BDA0000389922150000031
获得。
步骤d:对所以图像的
Figure BDA0000389922150000032
进行累加,然后获得海森正则化fTHf。
3)二分类的海森正则化支持向量机目标函数为
f * = arg min f ∈ H K 1 l Σ i = 1 l L ( x i , y i ) + λ K | | f | | K 2 + λ H | | f | | H 2 (1)
= arg min f ∈ H K 1 l Σ i = 1 l ( 1 - y i f ( x i ) ) + + λ K | | f | | K 2 + λ H | | f | | H 2 ,
其中,L(xi,yi)为损失函数,即(1-yif(xi))+=max(0,1-yif(xi)),
Figure BDA0000389922150000035
是f的再生核希尔伯特空间HK的范数,λK作为参数控制f映射到空间Rn中的复杂度,
Figure BDA0000389922150000036
是包含边缘分布PX的本征几何信息的海森正则化项,λH作为参数控制在PX的紧支集(compact support)上的f的复杂度。
本发明相对于现有技术具有如下的优点及效果:
1、本发明的基于云计算的手机图像标注方法是利用海森流形正则化技术,获得大量无标注的样本流形信息以提高传统SVM分类器在少量标注样本的情况下的性能。
2、本发明利用云端实现大量复杂训练与测试计算,有助于极大减少算法对手机计算和存储的要求。
3、本发明提出的海森正则化支持向量机与广泛使用的支持向量机相比,可以减少模型训练对人工标注样本的依赖,并提高图像标注的准确度。
附图说明
图1是本发明实施例的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
为了清楚说明本发明对于图像标注的有效性,如图1所示,在本实施例中进行了图像标注试验,并与经典支持向量机(SVM)进行对比。其中试验数据选择常见的PASCAL VOC’7数据集,PASCAL VOC’07数据集一共有9,963张图像。数据集中包括有人、鸟、猫、牛、狗、马、羊、飞机、自行车、船、公共汽车、小汽车、摩托车、火车、瓶子、椅子、餐桌、盆栽、沙发和电视机/屏幕20个类别。在评估监督学习算法的性能时,我们不用无标注的数据。所有的图像提取常见的GIST特征作为图像表达。具体实施步骤如下:
步骤1:训练子集和测试子集分别包含了5,011和4,952张图像。我们将训练子集进一步分成了两个子集,4,500张图像用于训练,另外511张图像用于参数验证。我们进行10次随机的划分来对性能进行评估。在训练集(4,500张图像)中,我们分别用10%,的图像作为标注数据,剩下的作为无标注数据来进行半监督实验;
步骤2:在云端通过以下步骤训练海森正则化支持向量机:
步骤2.1利用海森正则化构造局部几何信息,具体步骤如下
步骤2.1.1:对应第j个无标注样本xj,找到其最近的k个近邻样本,组成邻域Np,从中取出xj后对该邻域进行中心化。此举将使得xj成为切向空间
Figure BDA0000389922150000045
的原点。
步骤2.1.2:用p点的邻域Np的相应的d个最大的特征值所对应的特征向量U来评价切向空间
Figure BDA0000389922150000046
正交坐标系。该步骤可以通过在
Figure BDA0000389922150000041
上进行特征值分解来实现,其中xi是邻域Np中的第i个样本。
步骤2.1.3:用施密特正交化去除矩阵Hj=[1,u1…um,u1u1…udud]中的d+1维零空间,得到矩阵
Figure BDA0000389922150000042
其Frobenius范数可以由
Figure BDA0000389922150000043
获得。
步骤2.1.4:对所以图像的进行累加,然后获得海森正则化fTHf。
步骤2.2:海森正则化支持向量机目标函数为:
f * = arg min f ∈ H K 1 l Σ i = 1 l L ( x i , y i ) + λ K | | f | | K 2 + λ H | | f | | H 2 (1)
= arg min f ∈ H K 1 l Σ i = 1 l ( 1 - y i f ( x i ) ) + + λ K | | f | | K 2 + λ H | | f | | H 2 ,
其中L(xi,yi)为损失函数,即(1-yif(xi))+=max(0,1-yif(xi)),
Figure BDA0000389922150000053
是f的再生核希尔伯特空间HK的范数,λK作为参数控制f映射到空间Rn中的复杂度,
Figure BDA0000389922150000054
是包含边缘分布PX的本征几何信息的海森正则化项,λH作为参数控制在PX的紧支集(compact support)上的f的复杂度。
步骤3:利用压缩感知技术对移动图像进行压缩,并将压缩后的图像传输到云上;
步骤4:在云上利用压缩感知技术对压缩的图像进行解码;
步骤5:通过训练出来的海森正则化支持向量机进行图像标注;
步骤6:将标注的结果返回到移动终端设备。
表1显示了提出海森正则化支持向量机与支持向量机(SVM)的标注结果对比。可以看出,在标注准确度上,本专利方法有明显优势。
表1为本专利方法与SVM在PASCAL VOC’7数据集的实验结果对比:
Figure BDA0000389922150000055
表1
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (3)

1.一种基于云计算的手机图像标注方法,包括以下步骤:
1)在云端存储数量为l带标注的图像特征集
Figure FDA0000389922140000011
其中,标注为
Figure FDA0000389922140000012
和数量为u无标注的图像特征集
Figure FDA0000389922140000013
2)在云端训练海森正则化支持向量机;
3)利用压缩感知技术对移动图像进行压缩,并将压缩后的图像传输到云上;
4)在云上利用压缩感知技术对压缩的图像进行解码;
5)通过训练出来的海森正则化支持向量机进行图像标注;
6)将标注的结果返回到移动终端设备;
其特征在于,所述步骤2)中,云端实现的所述训练海森正则化支持向量机的训练步骤如下:
步骤1、假设有标注样本(x,y)∈Rn×{±1}分布为P,无标注样本的分布是P的边缘分布PX;如果边缘分布PX与条件分布P(y|x)相关,则PX有助于学习;基于假设相似的图像对xi和xj意味着相似的条件分布对P(y|xi)和P(y|xj);
步骤2、利用海森正则化构造局部几何信息;
步骤3、构造二分类的海森正则化支持向量机目标函数。
2.根据权利要求1所述的基于云计算的手机图像标注方法,其特征在于,所述步骤2包括如下步骤:
步骤a、对应第j个无标注样本xj,找到其最近的k个近邻样本,组成邻域Np,从中取出xj后对该邻域进行中心化,使xj成为切向空间
Figure FDA0000389922140000015
的原点;
步骤b、用p点的邻域Np的相应的d个最大的特征值所对应的特征向量U来评价切向空间
Figure FDA0000389922140000016
正交坐标系;该步骤通过在
Figure FDA0000389922140000014
上进行特征值分解来实现,其中xi是邻域Np中的第i个样本;
步骤c、用施密特正交化去除矩阵Hj=[1,u1…um,u1u1…udud]中的d+1维零空间,得到矩阵
Figure FDA0000389922140000025
其Frobenius范数由获得;
步骤d:对所以图像的
Figure FDA0000389922140000027
进行累加,以获得海森正则化fTHf。
3.根据权利要求1所述的基于云计算的手机图像标注方法,其特征在于,所述步骤3中,所述二分类的海森正则化支持向量机目标函数为:
f * = arg min f ∈ H K 1 l Σ i = 1 l L ( x i , y i ) + λ K | | f | | K 2 + λ H | | f | | H 2 (1)
= arg min f ∈ H K 1 l Σ i = 1 l ( 1 - y i f ( x i ) ) + + λ K | | f | | K 2 + λ H | | f | | H 2 ,
其中,L(xi,yi)为损失函数,即:(1-yif(xi))+=max(0,1-yif(xi)),
Figure FDA0000389922140000023
是f的再生核希尔伯特空间HK的范数,λK作为参数控制f映射到空间Rn中的复杂度,
Figure FDA0000389922140000024
是包含边缘分布PX的本征几何信息的海森正则化项,λH作为参数控制在PX的紧支集上的f的复杂度。
CN201310455285.3A 2013-09-29 2013-09-29 一种基于云计算的手机图像标注方法 Active CN103489003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310455285.3A CN103489003B (zh) 2013-09-29 2013-09-29 一种基于云计算的手机图像标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310455285.3A CN103489003B (zh) 2013-09-29 2013-09-29 一种基于云计算的手机图像标注方法

Publications (2)

Publication Number Publication Date
CN103489003A true CN103489003A (zh) 2014-01-01
CN103489003B CN103489003B (zh) 2017-04-19

Family

ID=49829210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310455285.3A Active CN103489003B (zh) 2013-09-29 2013-09-29 一种基于云计算的手机图像标注方法

Country Status (1)

Country Link
CN (1) CN103489003B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599932A (zh) * 2016-12-23 2017-04-26 山东省科学院情报研究所 一种基于多视角谱聚类的图像识别方法
CN109416721A (zh) * 2016-06-22 2019-03-01 微软技术许可有限责任公司 隐私保护机器学习

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540048A (zh) * 2009-04-21 2009-09-23 北京航空航天大学 一种基于支持向量机的图像质量评价方法
US20100113091A1 (en) * 2008-10-31 2010-05-06 Sharma Ravi K Histogram methods and systems for object recognition
CN102332162A (zh) * 2011-09-19 2012-01-25 西安百利信息科技有限公司 基于人工神经网络的医学图像兴趣区自动识别和分级压缩方法
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100113091A1 (en) * 2008-10-31 2010-05-06 Sharma Ravi K Histogram methods and systems for object recognition
CN101540048A (zh) * 2009-04-21 2009-09-23 北京航空航天大学 一种基于支持向量机的图像质量评价方法
CN102332162A (zh) * 2011-09-19 2012-01-25 西安百利信息科技有限公司 基于人工神经网络的医学图像兴趣区自动识别和分级压缩方法
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109416721A (zh) * 2016-06-22 2019-03-01 微软技术许可有限责任公司 隐私保护机器学习
CN106599932A (zh) * 2016-12-23 2017-04-26 山东省科学院情报研究所 一种基于多视角谱聚类的图像识别方法

Also Published As

Publication number Publication date
CN103489003B (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
Shu et al. Weakly-shared deep transfer networks for heterogeneous-domain knowledge propagation
Avila et al. Pooling in image representation: The visual codeword point of view
Wang et al. Multimodal graph-based reranking for web image search
CN109117781B (zh) 多属性识别模型的建立方法、装置及多属性识别方法
Wang et al. Multi-manifold ranking: Using multiple features for better image retrieval
Bao et al. Hidden-concept driven multilabel image annotation and label ranking
Zhang et al. Random multi-graphs: a semi-supervised learning framework for classification of high dimensional data
CN110717401A (zh) 年龄估计方法及装置、设备、存储介质
Qayyum et al. Designing deep CNN models based on sparse coding for aerial imagery: a deep-features reduction approach
Sun et al. Scene categorization using deeply learned gaze shifting kernel
CN113704506A (zh) 一种媒体内容排重方法和相关装置
Liu et al. Sparse autoencoder for social image understanding
Wang et al. Learning to rank tags
Liu et al. Joint graph learning and matching for semantic feature correspondence
Yang et al. Place deduplication with embeddings
Li et al. Augmenting bag-of-words: a robust contextual representation of spatiotemporal interest points for action recognition
CN114663766A (zh) 基于多图像协同注意力机制的植物叶片识别系统及方法
Li et al. Image decomposition with multilabel context: Algorithms and applications
CN114519397A (zh) 基于对比学习的实体链接模型的训练方法、装置、设备
CN103489003A (zh) 一种基于云计算的手机图像标注方法
CN103324942A (zh) 一种图像分类方法、装置及系统
Wang et al. Sparse representation of local spatial-temporal features with dimensionality reduction for motion recognition
Khan et al. Tvgraz: Multi-modal learning of object categories by combining textual and visual features
CN104331717A (zh) 一种整合特征字典结构与视觉特征编码的图像分类方法
Pang et al. Multimodal learning for multi-label image classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant