CN103488744A - 一种大数据图像分类方法 - Google Patents
一种大数据图像分类方法 Download PDFInfo
- Publication number
- CN103488744A CN103488744A CN201310432630.1A CN201310432630A CN103488744A CN 103488744 A CN103488744 A CN 103488744A CN 201310432630 A CN201310432630 A CN 201310432630A CN 103488744 A CN103488744 A CN 103488744A
- Authority
- CN
- China
- Prior art keywords
- sample
- formula
- data image
- sigma
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种大数据图像分类方法,包括如下步骤:1)收集图像样本作为训练集;2)寻找大数据图像分类最优的投影矩阵;3)对无标注数据进行投影;4)对投影后的样本采用最小距离分类器分类。利用本发明提出的方法能够有效利用样本分布的局部几何信息,并提取分类的鉴别信息,减少大数据图像分类对人工标注样本的依赖,有效减少训练过程中的存储成本,其分类准确度高于有代表性的基于线性判别分析的图像分类方法。
Description
技术领域
本发明涉及一种模式识别与人工智能技术领域中的图像分类技术,特别涉及一种大数据图像分类方法,该方法是一种监督学习图像分类的方法。
背景技术
随着移动互联网的迅速发展,带有数字摄像头智能手机、平板电脑越来越多的进入人们的生活,很容易产生大量的个人数字图像。虽然利用时间和目录对图像进行管理是一种常见的方法,但是缺乏语义层面对图片进行有效的管理。因此利用监督学习方法,通过学习人工标注数据,以获得图像分类模型,然后对没有标注的图像进行自动图像分类。由于图像通常的特征维数非常高,因此降维方法有助于识别性能的提高。
传统的全局线性降维的方法主要是基于线性的,其中线性判别分析被广泛地应用在模式分类问题上。线性判别分析法主要通过最大化类间距离的同时使类内样本间距离最小,从而实现不同类别之间的可分性。但是,大数据图像分类面临着类别数巨大,需要分类的样本数量巨大等困难。线性判别分析对于大数据而言,使用成本是比较高的,为了获得一定的分类性能,它需要人工大量的标注样本。这使得图像分类软件开发成本大量增加,需要人工大量的标注样本。
因此,寻找一个需要标注少量样本即可得到满足要求的自动图像分类方法是非常必要的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种大数据图像分类方法,该方法只需要少量人工标注样本。
本发明的目的通过下述技术方案实现:一种大数据图像分类方法,具体实现方式:
1)收集图像样本作为训练集X,即X=[x1,x2,…,xN]∈RD×N,样本维数为D,样本数量为N,每个样本有相应的类别标志Ci∈Z。
2)建立局部优化目标函数:
对每一个已标注的样本xi,我们可以找到类内样本的k1近邻和类间样本的k2近邻来形成一个局部块,即: 另外,我们定义Rij为第j个样本相对第i个样本里的位置顺序。我们希望每个局部块的新的低维空间表达,即: 满足类间样本距离足够大同时类内样本位置顺序信息尽可能的保留。
我们对类间样本距离建立(1)式:
我们对类内样本的位置顺序信息建立(2)式:
其中,(wi)j表示区别小距离和大距离之间的惩罚因子,当原始空间的距离小时,我们赋予低维子空间较大的权重,当距离大时,我们赋予较小的权重。
惩罚因子定义如下:
由于局部块Xi是近似线性的,由公式(1)(2)和一个权衡系数γ,可以得到局部优化的目标函数(4):
其中,γ∈[0,1]是一个用于整合类内样本和类间样本贡献值的权衡系数。
公式(4)可以进一步化为以下形式:
其中,tr()是迹算子
3)建立全局优化目标函数:
通过样本选择矩阵,低维空间块表达Yi的坐标是从全局坐标Y=UTX=[y1,y2,…yN]∈Rd×N中选择出来的,即
Yi=YSi, (5)
这里Si∈RN×(K+1)是选择矩阵。令Fi={i,i1,…iK}为索引集,则选择矩阵的定义如下:
根据公式(6),公式(5)可以写为:
通过对公式(8)的局部优化求和,我们可以得到整体调整公式(9):
因Y=UTX,而UTU=Id。Id是d×d的单位矩阵。因此公式(9)可以写成:
4)利用拉格朗日乘数法,我们可以将求公式(10)的问题转换为求广义特征值α问题。投影矩阵U由式子XLXTα=λXXTα的d个最小特征值对应的d个特征向量和得到。
5)通过对无标注数据集Xu进行投影,即Yu=UTXu,并对Yu采用最小距离分类器(Minimum Euclidean Distance Classifier,MEDC)分类,可以获得图像分类的结果。
本发明的工作原理:
本发明一种大数据图像分类方法,通过对的标注数据形成的块做局部近似线性的假设,并在块上设计不同类别间的样本距离足够大,相同类别的样本位置顺序信息尽可能的保留的目标函数,最后在所有块上目标函数的基础上建立全局优化目标函数,以此获得新的分类投影矩阵。
本发明相对于现有技术具有如下的优点及效果:
1、这样设计与传统的全局线性降维方法相比,能够充分利用样本分布的局部几何信息和样本的整体分布特性,因此可以有效提高图像分类的准确度。
2、本发明可以用少量样本获得很好的识别率,因此减少了大数据图像分类对人工标注样本的依赖。
3、相对于传统的全局线性降维方法,采用本发明可以有效减少训练过程中的存储成本。
附图说明
图1是本发明实施例的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
为了清楚说明本发明对于图像分类有效性,如图1所示,在本实施例中进行了手写数字图像分类试验,并与经典的线性判别分析(LDA)进行对比。试验数据选择常见的USPS数据集,该数据由0到9,总共10个类别,9298个样本,具体实施步骤如下:(将实施例与图1结合来具体阐述试验步骤以及列举试验结果):
步骤1:每个类别收集10个图像样本,总共100个样本作为训练集X,即X=[x1,x2,…,xN]∈RD×N,样本维数为D=256维,每个样本有相应的类别标志Ci∈Zn。剩下的样本作为测试数据集Xu。
2)建立局部优化目标函数:
另外,我们定义Rij为第j个样本相对第i个样本里的位置顺序。我们希望每个局部块的新的低维空间表达,即 满足类间样本距离足够大同时类内样本位置顺序信息尽可能的保留。
我们对类间样本距离建立(1)式:
我们对类内样本的位置顺序信息建立(2)式:
其中,(wi)j表示区别小距离和大距离之间的惩罚因子,当原始空间的距离小时,我们赋予低维子空间较大的权重,当距离大时,我们赋予较小的权重。
惩罚因子定义如下:
由于局部块Xi是近似线性的,由公式(1)(2)和一个权衡系数γ,可以列出如下局部优化的目标函数(4):
其中γ取0.3。
公式(4)可以进一步化为以下形式:
其中,tr()是迹算子,
3)建立全局优化目标函数:
通过样本选择矩阵,每个局部块的新的低维空间表达Yi的坐标是从训练集低维表达Y中选择出来的,(即Y=UTX=[y1,y2,…yN]∈Rd×N),可以用下式描述:
Yi=YSi, (14)
这里Si∈RN×(K+1)是选择矩阵。令Fi={i,i1,…iK}为指标集,则选择矩阵的定义如下:
根据公式(6),公式(5)可以写为:
通过对公式(8)的局部优化求和,我们可以得到整体调整公式(9):
令Y=UTX,而UTU=Id。Id是d×d的单位矩阵。因此公式(9)可以写成:
4)利用拉格朗日乘数法,我们可以将求公式(10)的问题转换为求广义特征值α问题。投影矩阵U由式子XLXTα=λXXTα的d=24个最小特征值对应的d=24个特征向量得到。
5)通过对测试数据Xu进行投影,即Yu=UTXu,并对Yu采用最小距离分类器(Minimum Euclidean Distance Classifier,MEDC)分类,可以获得图像分类的结果。
方法 | 线性判别分析(LDA) | 本专利方法 |
识别率 | 80.9% | 84.3% |
表1
表1为本发明与线性判别分析在USPS数据集上的实验结果,显示了本专利方法与基于线性判别分析(LDA)的分类结果对比。可以看出,在分类准确度上,本专利方法有明显优势。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (3)
1.一种大数据图像分类方法,包括以下步骤:
1)收集图像样本作为训练集X,即:X=[x1,x2,…,xN]∈RD×N,其中x1,x2,…,xN,代表样本,D为样本维数,N为样本数量,每个样本有相应的类标志Ci;
2)寻找大数据图像分类最优的投影矩阵U;
3)通过对无标注数据集Xu进行投影,并获得新的样本特征集Yu,即:Yu=UTXu;
4)对投影后样本特征集Yu采用最小距离分类器分类,获得图像分类的结果;
其特征在于,所述寻找大数据图像分类最优的投影矩阵,包括以下步骤:
步骤1、建立局部优化目标函数;
步骤2、建立全局优化目标函数;
步骤3、利用拉格朗日乘数法:将新的全局优化目标的问题转换为求广义特征值α问题,大数据图像分类最优的投影矩阵U由式子XLXTα=λXXTα的前d个最小特征值对应的d个特征向量得到。
定义Rij为第j个样本相对第i个样本里的位置顺序,设定每个局部块的新的低维空间表达,即: 满足不同类别样本距离足够大,同时同类样本位置顺序信息尽可能的保留;
对不同类别样本在新的投影空间的距离建立(1)式:
对同类样本在新的投影空间的位置顺序信息建立(2)式:
其中,(wi)j表示区别小距离和大距离之间的惩罚因子,当原始空间的距离小时,赋予低维子空间较大的权重,当距离大时,赋予较小的权重;
所述惩罚因子的定义如下:
其中,Nk1(xi)表示xi的k1个同类近邻样本集,||||为求2范数符号;
由于局部块Xi是近似线性的,利用公式(1)、公式(2)和权衡系数γ,得到局部优化的目标函数,所述目标函数的表达式如下:
其中,权衡系数γ∈[0,1],所述目标函数式(4)的意义是在局部块上,满足不同类别样本距离和足够大,同时同类样本位置顺序信息尽可能的保留;
对公式(4)进行进一步简化,得到公式(5):
其中,tr()是迹算子,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310432630.1A CN103488744B (zh) | 2013-09-22 | 2013-09-22 | 一种大数据图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310432630.1A CN103488744B (zh) | 2013-09-22 | 2013-09-22 | 一种大数据图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103488744A true CN103488744A (zh) | 2014-01-01 |
CN103488744B CN103488744B (zh) | 2016-10-05 |
Family
ID=49828970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310432630.1A Active CN103488744B (zh) | 2013-09-22 | 2013-09-22 | 一种大数据图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103488744B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104700833A (zh) * | 2014-12-29 | 2015-06-10 | 芜湖乐锐思信息咨询有限公司 | 一种大数据语音分类方法 |
CN106169095A (zh) * | 2016-06-24 | 2016-11-30 | 广州图普网络科技有限公司 | 主动学习大数据标注方法和系统 |
CN107958241A (zh) * | 2018-01-04 | 2018-04-24 | 苏州大学 | 单样本人脸识别方法、装置、设备及计算机可读存储介质 |
US10984251B2 (en) | 2019-03-19 | 2021-04-20 | Industrial Technology Research Institute | Person re-identification method, person re-identification system and image screening method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807258A (zh) * | 2010-01-08 | 2010-08-18 | 西安电子科技大学 | 基于核标度切维数约简的合成孔径雷达图像目标识别方法 |
CN101916376A (zh) * | 2010-07-06 | 2010-12-15 | 浙江大学 | 基于局部样条嵌入的正交半监督子空间图像分类方法 |
CN102208020A (zh) * | 2011-07-16 | 2011-10-05 | 西安电子科技大学 | 基于最优维数标度切判据的人脸识别方法 |
-
2013
- 2013-09-22 CN CN201310432630.1A patent/CN103488744B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807258A (zh) * | 2010-01-08 | 2010-08-18 | 西安电子科技大学 | 基于核标度切维数约简的合成孔径雷达图像目标识别方法 |
CN101916376A (zh) * | 2010-07-06 | 2010-12-15 | 浙江大学 | 基于局部样条嵌入的正交半监督子空间图像分类方法 |
CN102208020A (zh) * | 2011-07-16 | 2011-10-05 | 西安电子科技大学 | 基于最优维数标度切判据的人脸识别方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104700833A (zh) * | 2014-12-29 | 2015-06-10 | 芜湖乐锐思信息咨询有限公司 | 一种大数据语音分类方法 |
CN106169095A (zh) * | 2016-06-24 | 2016-11-30 | 广州图普网络科技有限公司 | 主动学习大数据标注方法和系统 |
CN106169095B (zh) * | 2016-06-24 | 2019-06-14 | 广州图普网络科技有限公司 | 主动学习大数据标注方法和系统 |
CN107958241A (zh) * | 2018-01-04 | 2018-04-24 | 苏州大学 | 单样本人脸识别方法、装置、设备及计算机可读存储介质 |
CN107958241B (zh) * | 2018-01-04 | 2021-09-21 | 苏州大学 | 单样本人脸识别方法、装置、设备及计算机可读存储介质 |
US10984251B2 (en) | 2019-03-19 | 2021-04-20 | Industrial Technology Research Institute | Person re-identification method, person re-identification system and image screening method |
Also Published As
Publication number | Publication date |
---|---|
CN103488744B (zh) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875674B (zh) | 一种基于多列融合卷积神经网络的驾驶员行为识别方法 | |
CN109558942B (zh) | 一种基于浅度学习的神经网络迁移方法 | |
CN102208034B (zh) | 基于半监督维数约减的高光谱图像分类方法 | |
CN109740686A (zh) | 一种基于区域池化和特征融合的深度学习图像多标记分类方法 | |
CN106815604A (zh) | 基于多层信息融合的注视点检测方法 | |
CN106095893A (zh) | 一种跨媒体检索方法 | |
CN114241273B (zh) | 基于Transformer网络和超球空间学习的多模态图像处理方法及系统 | |
CN102722713B (zh) | 一种基于李群结构数据的手写体数字识别方法及系统 | |
CN107563280A (zh) | 基于多模型的人脸识别方法和装置 | |
CN105389583A (zh) | 图像分类器的生成方法、图像分类方法和装置 | |
CN105389550A (zh) | 一种基于稀疏指引与显著驱动的遥感目标检测方法 | |
CN103500342B (zh) | 一种基于加速度计的人体行为识别方法 | |
CN106909946A (zh) | 一种多模态融合的商品分类系统 | |
CN105205449A (zh) | 基于深度学习的手语识别方法 | |
CN109002463A (zh) | 一种基于深度度量模型的文本检测方法 | |
CN102324038A (zh) | 一种基于数字图像的植物种类识别方法 | |
CN102855486A (zh) | 一种广义图像目标检测方法 | |
CN102122353A (zh) | 利用增量字典学习与稀疏表示进行图像分割的方法 | |
CN103617609B (zh) | 基于图论的k-means非线性流形聚类与代表点选取方法 | |
CN106097381A (zh) | 一种基于流形判别非负矩阵分解的目标跟踪方法 | |
CN103488744A (zh) | 一种大数据图像分类方法 | |
CN102902976A (zh) | 一种基于目标及其空间关系特性的图像场景分类方法 | |
CN103473308B (zh) | 基于最大间隔张量学习的高维多媒体数据分类方法 | |
CN105426924A (zh) | 一种基于图像中层特征的场景分类方法 | |
CN107103608A (zh) | 一种基于区域候选样本选择的显著性检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |