CN110399885A - 一种基于局部几何感知的图像目标分类方法 - Google Patents
一种基于局部几何感知的图像目标分类方法 Download PDFInfo
- Publication number
- CN110399885A CN110399885A CN201910628683.8A CN201910628683A CN110399885A CN 110399885 A CN110399885 A CN 110399885A CN 201910628683 A CN201910628683 A CN 201910628683A CN 110399885 A CN110399885 A CN 110399885A
- Authority
- CN
- China
- Prior art keywords
- image
- matrix
- vector data
- data point
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于局部几何感知的图像目标分类方法,其技术方案是:对于一幅图像预处理后的向量数据点xi,分别从所有幅图像预处理后的向量数据点构成矩阵数据X中,选择与一幅图像预处理后的向量数据点xi类别相同的3个近邻点建立流形局部特征平面,计算一幅图像预处理后的向量数据点xi在流形局部特征平面的投影,获得局部协方差矩阵,然后用对数欧式距离度量流形局部特征空间之间的多流形散度,通过最大化多流形散度来寻找低维投影矩阵A,以此实现图像目标的判别特征提取,最后采用最近邻分类器对图像目标特征进行分类。本发明通过最大化多流形散度来提取图像的分类特征,具有提高图像分类效果的特点。
Description
技术领域
本发明属于图像目标分类技术领域。特别是涉及一种基于局部几何感知的图像目标分类方法。
背景技术
图像目标分类是机器视觉的主要技术之一,是自动驾驶、人工智能等工程的基本技术,关系到许多机器学习行业的发展。近年来,基于视觉的自动化控制算法的需求量不断增加,并要求具有较高的分类性能。而在算法实现过程中,由于工程项目的实时性和硬件计算能力约束等原因,同时要求算法有较低的时间空间复杂度。
目前,较为流行的目标分类算法有流形算法、SVM算法、深度学习算法等。在上个世纪90年代末本世纪初,SVM使用的比较多,SVM是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是类间间隔最大化,最终转化为一个凸二次规划问题来求解。在此之后,基于深度神经网络的深度学习方法成为主流,该方法分类能力强、泛化能力好,但是结构复杂,计算量极大。难以使用在一般设备上。一种基于流形的方法,通过计算数据在流形上的距离,进行分类,具有重要的研究意义。
发明内容
本发明旨在克服现有技术不足,目的是提供一种能提高图像分类的效果的基于局部几何感知的图像目标分类方法。
为实现上述技术方案,本发明采用的技术方案是:
一种基于局部几何感知的图像目标分类方法,包括如下步骤:
S1、对采集的图像进行预处理,得到预处理后的图像向量数据矩阵X=[X1,X2,…,XC],其中:C是类别数,M是向量化后的特征维度,Nc是第c个类的图像类别数量,1≤c≤C;
S2、对于第c个类Xc中任一幅图像预处理后的向量数据点xi,选取与一幅图像预处理后的向量数据点xi欧氏距离最近的三个向量数据点xi1,xi2,xi3组成最近邻特征平面,获得任一幅图像预处理后的向量数据点xi在最近邻特征平面的投影以及表示最近邻特征平面投影的3维权重系数向量Wc,将权重系数向量Wc扩充到N维,其中具有近邻关系的向量点之间权重系数不变,其他为0;
S3、对图像向量数据矩阵X中其余类的数据点,重复上述步骤,得到所有类别的权重系数矩阵W=[W1,W2,…,WC]∈RN×N,其中N是所有预处理后的图像的总数目,
S4、基于计算出的权重系数矩阵W=[W1,W2,…,WC]∈RN×N,计算每个类的局部协方差矩阵,得到局部协方差矩阵C=[C1,C2,…,CC];
S5、基于所述局部协方差矩阵构建目标函数,通过最大化目标函数,得到低维投影矩阵;
S6、基于所述低维投影矩阵,对于一幅图像预处理后的向量数据点xi,计算其经过线性投影后的低维特征Yi;
S7、使用最近邻算法对所述低维特征Yi进行分类,从而完成图像目标的分类。
进一步的,根据权利要求1所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S1中对采集的图像进行预处理包括依次进行的灰度化处理、平滑处理、归一化处理和向量化处理。
进一步的,根据权利要求1所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S2中,权重系数向量W=[Wi1,Wi2,Wi3]的计算根据下式进行:
其中:
xi表示一幅图像预处理后的向量数据点,即Xc的第i列,
xi1,xi2,xi3分别表示与xi近邻的3幅图像预处理后的向量数据点,
Wi1,Wi2,Wi3分别表示第i幅图像的3个近邻点的权重系数,即Wc中的第i行的每一列,
T表示向量数据的转置;
进一步的,根据权利要求3所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S4中,第c个类的局部协方差矩阵表示为:
其中:I是与Wc维度相同的单位矩阵。
进一步的,根据权利要求4所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S5具体包括:
S51、施加一个微小的扰动使C′c成为正定矩阵:
其中:Ic是与维数相同的单位矩阵;δ表示扰动大小;
S52、使用log-Euclidean距离度量不同对称正定矩阵C′c之间的距离,建立如下目标函数:
其中,A∈Rd×N表示低维投影矩阵,d是降维后的空间维度,log(·)表示以e为底的矩阵对数运算;
进一步的,根据权利要求5所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S6中,经过线性投影后的低维特征Yi表示为:
Yi=ATXi。 (7)
由于采用上述技术方案,本发明的有益效果是:
本发明采用基于局部几何感知的方法,一方面选择与一幅图像预处理后的向量数据点Xi类别相同的3个近邻点建立流形局部特征空间,用log-Euclidean距离度量流形局部特征空间之间的多流形散度,最大化多流形散度来寻找低维投影矩阵A,另一方面,在保持流形局部结构不变的基础上,进一步缩小图像预处理后的向量数据点与流形局部空间的距离,以此实现图像的判别特征提取,实现图像的低维判别特征的有效提取,提高了图像分类的效果。
具体实施方式
下面结合具体实施方式对本发明作进一步的描述,并非对其保护范围的限制。
实施例1
一种基于局部几何感知的图像分类方法。本实施例所述方法的具体步骤是:
步骤一、对采集的图像进行进行的灰度化处理、平滑处理、归一化处理和向量化处理,得到预处理后的图像向量数据矩阵X=[X1,X2,…,XC],其中:C是类别数,M是向量化后的特征维度,Nc是第c个类的图像类别数量,1≤c≤C;
步骤二、对于第c个类Xc中任一幅图像预处理后的向量数据点xi,选取与一幅图像预处理后的向量数据点xi欧氏距离最近的三个向量数据点xi1,xi2,xi3组成最近邻特征平面,获得任一幅图像预处理后的向量数据点xi在最近邻特征平面的投影以及表示最近邻特征平面投影的3维权重系数向量Wc。权重系数向量W=[Wi1,Wi2,Wi3]的计算根据下式进行:
其中:
xi表示一幅图像预处理后的向量数据点,即Xc的第i列,
xi1,xi2,xi3分别表示与xi近邻的3幅图像预处理后的向量数据点,
Wi1,Wi2,Wi3分别表示第i幅图像的3个近邻点的权重系数,即Wc中的第i行的每一列,
T表示向量数据的转置;
然后将权重系数向量Wc扩充到N维,其中具有近邻关系的向量点之间权重系数不变,其他为0;
步骤三、对图像向量数据矩阵X中其余类的数据点,重复上述步骤,得到所有类别的权重系数矩阵W=[W1,W2,…,WC]∈RN×N,其中N是所有预处理后的图像的总数目,
步骤四、基于计算出的权重系数矩阵W=[W1,W2,…,WC]∈RN×N,计算每个类的局部协方差矩阵,得到局部协方差矩阵C=[C1,C2,…,CC],第c个类的局部协方差矩阵表示为:
其中:I是与Wc维度相同的单位矩阵。
步骤五、施加一个微小的扰动使C′c成为正定矩阵:
其中:Ic是与维数相同的单位矩阵;δ表示扰动大小;
使用log-Euclidean距离度量不同对称正定矩阵C′c之间的距离,建立如下目标函数:
其中,A∈Rd×N表示低维投影矩阵,d是降维后的空间维度,log(·)表示以e为底的矩阵对数运算;
最大化目标函数获得矩阵A。
步骤六、基于所述低维投影矩阵A,对于一幅图像预处理后的向量数据点xi,计算经过线性投影后的低维特征Yi:
Yi=ATXi。 (7)
步骤七、使用最近邻算法对所述低维特征Yi进行分类,从而完成图像目标的分类。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (6)
1.一种基于局部几何感知的图像目标分类方法,其特征在于,包括如下步骤:
S1、对采集的图像进行预处理,得到预处理后的图像向量数据矩阵X=[X1,X2,…,XC],其中:C是类别数,M是向量化后的特征维度,Nc是第c个类的图像类别数量,1≤c≤C;
S2、对于第c个类Xc中任一幅图像预处理后的向量数据点xi,选取与一幅图像预处理后的向量数据点xi欧氏距离最近的三个向量数据点xi1,xi2,xi3组成最近邻特征平面,获得任一幅图像预处理后的向量数据点xi在最近邻特征平面的投影以及表示最近邻特征平面投影的3维权重系数向量Wc,将权重系数向量Wc扩充到N维,其中具有近邻关系的向量点之间权重系数不变,其他为0;
S3、对图像向量数据矩阵X中其余类的数据点,重复上述步骤,得到所有类别的权重系数矩阵W=[W1,W2,…,WC]∈RN×N,其中N是所有预处理后的图像的总数目,
S4、基于计算出的权重系数矩阵W=[W1,W2,…,WC]∈RN×N,计算每个类的局部协方差矩阵,得到局部协方差矩阵C=[C1,C2,…,CC];
S5、基于所述局部协方差矩阵构建目标函数,通过最大化目标函数,得到低维投影矩阵;
S6、基于所述低维投影矩阵,对于一幅图像预处理后的向量数据点xi,计算其经过线性投影后的低维特征Yi;
S7、使用最近邻算法对所述低维特征Yi进行分类,从而完成图像目标的分类。
2.根据权利要求1所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S1中对采集的图像进行预处理包括依次进行的灰度化处理、平滑处理、归一化处理和向量化处理。
3.根据权利要求1所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S2中,权重系数向量W=[Wi1,Wi2,Wi3]的计算根据下式进行:
Xi,1,2,3=[(xi2-xi1),(xi3-xi1)]
Wi1=1-Wi2-Wi3 (1)
其中:
xi表示一幅图像预处理后的向量数据点,即Xc的第i列,
xi1,xi2,xi3分别表示与xi近邻的3幅图像预处理后的向量数据点,
Wi1,Wi2,Wi3分别表示第i幅图像的3个近邻点的权重系数,即Wc中的第i行的每一列,
T表示向量数据的转置。
4.根据权利要求3所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S4中,第c个类的局部协方差矩阵表示为:
其中:I是与Wc维度相同的单位矩阵。
5.根据权利要求4所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S5具体包括:
S51、施加一个微小的扰动使C′c成为正定矩阵:
其中:Ic是与维数相同的单位矩阵;δ表示扰动大小;
S52、使用log-Euclidean距离度量不同对称正定矩阵C′c之间的距离,建立如下目标函数:
s.t.ATA=I
其中,A∈Rd×N表示低维投影矩阵,d是降维后的空间维度,log(·)表示以e为底的矩阵对数运算。
6.根据权利要求5所述的基于局部几何感知的图像目标分类方法,其特征在于,步骤S6中,经过线性投影后的低维特征Yi表示为:
Yi=ATXi。 (7) 。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910628683.8A CN110399885B (zh) | 2019-07-12 | 2019-07-12 | 一种基于局部几何感知的图像目标分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910628683.8A CN110399885B (zh) | 2019-07-12 | 2019-07-12 | 一种基于局部几何感知的图像目标分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110399885A true CN110399885A (zh) | 2019-11-01 |
CN110399885B CN110399885B (zh) | 2022-05-27 |
Family
ID=68325369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910628683.8A Active CN110399885B (zh) | 2019-07-12 | 2019-07-12 | 一种基于局部几何感知的图像目标分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399885B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887509A (zh) * | 2021-10-25 | 2022-01-04 | 济南大学 | 一种基于图像集合的快速多模态视频人脸识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160051163A1 (en) * | 2013-04-14 | 2016-02-25 | B. G. Negev Technologies And Applications Ltd. At Ben-Gurion University | Classifying eeg signals in response to visual stimulus |
CN108805061A (zh) * | 2018-05-30 | 2018-11-13 | 西北工业大学 | 基于局部自适应判别分析的高光谱图像分类方法 |
CN109241870A (zh) * | 2018-08-16 | 2019-01-18 | 中国矿业大学(北京) | 基于步态识别的煤矿井下人员身份识别方法 |
-
2019
- 2019-07-12 CN CN201910628683.8A patent/CN110399885B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160051163A1 (en) * | 2013-04-14 | 2016-02-25 | B. G. Negev Technologies And Applications Ltd. At Ben-Gurion University | Classifying eeg signals in response to visual stimulus |
CN108805061A (zh) * | 2018-05-30 | 2018-11-13 | 西北工业大学 | 基于局部自适应判别分析的高光谱图像分类方法 |
CN109241870A (zh) * | 2018-08-16 | 2019-01-18 | 中国矿业大学(北京) | 基于步态识别的煤矿井下人员身份识别方法 |
Non-Patent Citations (1)
Title |
---|
BO LI等: "A global manifold margin learning method for data feature extraction and classification", 《ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887509A (zh) * | 2021-10-25 | 2022-01-04 | 济南大学 | 一种基于图像集合的快速多模态视频人脸识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110399885B (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xiao et al. | Dynamic weighted learning for unsupervised domain adaptation | |
CN110443281B (zh) | 基于hdbscan聚类的文本分类自适应过采样方法 | |
CN102024180B (zh) | 一种基于支持向量机的参数自适应的运动预测方法 | |
CN109871860A (zh) | 一种基于核主成分分析的日负荷曲线降维聚类方法 | |
CN107203785A (zh) | 多路径高斯核模糊c均值聚类算法 | |
CN102930300B (zh) | 一种飞机目标识别方法及系统 | |
CN103886330A (zh) | 基于半监督svm集成学习的分类方法 | |
CN108681744A (zh) | 一种基于数据划分的电力负荷曲线层次聚类方法 | |
CN110097060A (zh) | 一种面向树干图像的开集识别方法 | |
CN112186761B (zh) | 一种基于概率分布的风电功率场景生成方法及系统 | |
Schinas et al. | CERTH@ MediaEval 2012 Social Event Detection Task. | |
CN101561865A (zh) | 基于多参数谱特征的合成孔径雷达图像目标识别方法 | |
CN107316050A (zh) | 基于柯西损失函数的子空间自表达模型聚类方法 | |
CN104268507A (zh) | 一种基于rgb-d图像的手语字母识别方法 | |
CN111539482B (zh) | 基于rbf核函数的空间多维风电功率数据降维及重构方法 | |
CN110364264A (zh) | 基于子空间学习的医疗数据集特征降维方法 | |
Wang et al. | Big data analytics for price forecasting in smart grids | |
CN110399885A (zh) | 一种基于局部几何感知的图像目标分类方法 | |
CN110399814A (zh) | 一种基于局部线性表示领域适应度量的人脸识别方法 | |
CN109858667A (zh) | 一种基于雷电气候对负荷影响的短期负荷聚类方法 | |
CN108038518A (zh) | 一种基于气象数据的光伏发电功率确定方法及系统 | |
CN110852370A (zh) | 基于聚类算法的大工业用户细分方法 | |
Wu et al. | t-SNE based on Sobol sequence initialized exchange market algorithm | |
Wang et al. | Analysis of user’s power consumption behavior based on k-means | |
Li et al. | Research on smart grid big data’s curve mean clustering algorithm for edge-cloud collaborative application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |