CN106940785A - 一种基于核函数的有监督近邻保持嵌入方法 - Google Patents
一种基于核函数的有监督近邻保持嵌入方法 Download PDFInfo
- Publication number
- CN106940785A CN106940785A CN201710025699.0A CN201710025699A CN106940785A CN 106940785 A CN106940785 A CN 106940785A CN 201710025699 A CN201710025699 A CN 201710025699A CN 106940785 A CN106940785 A CN 106940785A
- Authority
- CN
- China
- Prior art keywords
- kernel function
- neighbour
- sample
- supervision
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于核函数的有监督近邻保持嵌入方法,本发明与判别近邻嵌入算法相比,本发明能处理数据样本分布不均衡问题,且识别率较高;通过核函数将训练和测试样例变换到非线性空间,然后利用已知训练样例的类别信息,学习训练得到降维特征矩阵,从而使得样本在判别子空间中具有更好的可分性。
Description
技术领域
本发明属于机器学习与模式识别领域,尤其涉及一种基于核函数的有监督近邻保持嵌入方法。
背景技术
人脸识别因在公安、系统档案、人机交互等方面的巨大应用前景而备受关注。人脸识别容易受到光照、表情、姿态等众多因素的影响,而且图像矢量空间的维数过高,识别的难度就越大。有效进行特征选择以及如何将高维特征空间投影到一个合适的低维子空间就成为人脸识别领域的重要问题。
邻域保持嵌入(Neighborhood Preserving Embedding,NPE)是局部线性嵌入的一种线性近似算法,具有保持数据流形上局部邻域结构信息的能力。邻域保持嵌入已经在人脸识别问题中受到了广泛的关注。但是,在人脸识别问题中,NPE是作为一种无监督的降维方法引入的,类似于其他的无监督降维算法如主成分分析(Principal ComponentAnalysis,PCA)、局部保持投影(Local Preserving Projection,LPP)、稀疏保持投影(Sparity Preserving Projection,SPP)等,它们没有利用已知样本数据的类别信息。本发明利用已知样本数据类别信息,并通过合适的核函数将原始数据映射到非线性空间,然后降维得到最佳子空间,提高分类效果。
发明内容
本发明所要解决的技术问题是在于克服上述已有技术的缺点,提出了一种基于核函数的有监督近邻保持嵌入方法,该方法的主要特点是先通过核函数将训练和测试样例变换到非线性空间,然后利用已知训练样例的类别信息,学习训练得到降维特征矩阵,从而使得样本在判别子空间中具有更好的可分性。
本发明为解决上述技术问题采用以下技术方案
一种基于核函数的有监督近邻保持嵌入方法,包含训练和分类;
所述训练具体包含如下步骤:
步骤1,核函数映射:
设已有原空间的训练样本集为其中,ci是xi的类别标签, c表示类别数,N表示训练样本的总个数,d表示训练样本的维数;核函数能够发掘非线性空间内在的几何结构,通过函数φ:∈Rd→F将原始d维数据映射到非线性特征空间;其中函数φ为K(xi,xj)=<φ(xi),φ(xj)>;
步骤2,训练数据预处理:
对核函数映射后的空间样本,根据距离和标签类别构造近邻重构权重矩阵和判别信息邻接矩阵;
步骤3,获取空间变换后的训练样本:
在学习到投影变换矩阵P后,首先获得原空间样本xi先映射到非线性空间φ(xi),然后得到低维表示PTφ(xi),令vi=PTφ(xi),则判别子空间的训练集表示为
所述分类具体包含如下步骤:
步骤4,对核函数映射后待测样本φ(x),先利用投影变换P把它映射到判别子空间中,得到判别子空间中的测试样本v=PTφ(x);
步骤5,利用最近邻分类器,对测试样本v在判别子空间中进行分类。
作为本发明一种基于核函数的有监督近邻保持嵌入方法的进一步优选方案,在步骤1中, N=105。
作为本发明一种基于核函数的有监督近邻保持嵌入方法的进一步优选方案,在步骤1中, d=1024。
作为本发明一种基于核函数的有监督近邻保持嵌入方法的进一步优选方案,在步骤1中, c=15。
作为本发明一种基于核函数的有监督近邻保持嵌入方法的进一步优选方案,在步骤2中,对已知训练样本,令knn(φ(xi))表示在F空间中xi的近邻集合,近邻重构权重系数矩阵W满足下面的要求:
作为本发明一种基于核函数的有监督近邻保持嵌入方法的进一步优选方案,在步骤2中,对已知训练样本,信息矩阵H的构造如下:
即在核函数映射的F空间中,对不同类数据,如果xj是xi的k个最近邻之一,xi是xj的 k个最近邻之一,那么Hij=1;对同类数据,如果xj是xi的k个最近邻之一,xi是xj的k个最近邻之一,则Hij=-1。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明与判别近邻嵌入算法相比,本发明能处理数据样本分布不均衡问题,且识别率较高;通过核函数将训练和测试样例变换到非线性空间,然后利用已知训练样例的类别信息,学习训练得到降维特征矩阵,从而使得样本在判别子空间中具有更好的可分性。
附图说明
图1是本发明的系统图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
如图1所示,一种基于核函数的有监督近邻保持嵌入方法,包含训练和分类;
所述训练具体包含如下步骤:
步骤1,核函数映射:
设已有原空间的训练样本集为其中,ci是xi的类别标签, c表示类别数,N表示训练样本的总个数,d表示训练样本的维数;核函数能够发掘非线性空间内在的几何结构,通过函数φ:∈Rd→F将原始d维数据映射到非线性特征空间;其中函数φ为K(xi,xj)=<φ(xi),φ(xj)>;
步骤2,训练数据预处理:
对核函数映射后的空间样本,根据距离和标签类别构造近邻重构权重矩阵和判别信息邻接矩阵;
步骤3,获取空间变换后的训练样本:
在学习到投影变换矩阵P后,首先获得原空间样本xi先映射到非线性空间φ(xi),然后得到低维表示PTφ(xi),令vi=PTφ(xi),则判别子空间的训练集表示为
所述分类具体包含如下步骤:
步骤4,对核函数映射后待测样本φ(x),先利用投影变换P把它映射到判别子空间中,得到判别子空间中的测试样本v=PTφ(x);
步骤5,利用最近邻分类器,对测试样本v在判别子空间中进行分类。
下面对本发明的实例作详细说明:本实例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实例。
(1)本发明在Yale人脸数据库中进行了测试。Yale人脸数据库包含15人的165张人脸图像,每人有11张图像,每张图像的表情和光照条件是:中央光照、眼睛/无眼睛、高兴、常态、左侧光照、右侧光照、悲伤、睡眠、惊讶和眨眼。从数据库中随机选择60%作为训练样本,余下的40%作为测试样本。具体实施步骤如下:
(2)训练模块
1)核函数映射
设已有原空间的训练样本集为ci是xi的类别标签,c表示类别数,N表示训练样本的总个数,d表示训练样本的维数。这里N=105,d=1024,c=15。利用函数φ:∈Rd→F将原始d维数据映射到非线性特征空间,其中φ函数取多项式核:K(xi,xj)=(x'i*xj)d,d=1。
2)训练数据预处理
对已知训练样本,令knn(φ(xi))表示在F空间中xi的近邻集合,近邻重构权重系数矩阵W 满足下面的要求:
对于非零的权系数要通过下面的重构损失函数最小化来求得:
约束条件为此时k值取5。
对已知训练样本,判别信息矩阵H的构造如下:
即在核函数映射的F空间中,对不同类数据,如果xj是xi的k个最近邻之一或者xi是xj的k个最近邻之一,那么Hij=1;对同类数据,如果xj是xi的k个最近邻之一或者xi是xj的k个最近邻之一,那么Hij=-1。
为了使得分布在不同子流形上的类内样本更加紧凑,类间样本彼此远离,基于核函数的有监督近邻保持嵌入算法等价于下面的优化过程:
3)获取空间变换后的训练样本
在学习到投影变换矩阵P后,可以获得原空间样本xi先映射到非线性空间φ(xi),然后得到低维表示PTφ(xi)。令vi=PTφ(xi),则判别子空间的训练集可以表示为 (2)分类模块
对核函数映射后待测样本φ(x),先利用投影变换P把它映射到判别子空间中,得到判别子空间中的测试样本v=PTφ(x)。然后利用最近邻分类器,对测试样本v在判别子空间中进行分类。也就是说,在判别子空间的训练样本中,找到和测试样本距离最近的样本,然后再把该样本的类别赋予测试样本v。这样就完成对x的分类。
选取待测样本60个,重复分类过程20次,表1给出在测试集上的估计性能。实验对比方法是近邻保持嵌入算法。通过实验结果我们可以看出本发明的识别效果明显优于近邻保持嵌入算法,并表现出了较强的稳定性,具有一定的优势。两种方法对人脸的分类性能(识别率%) 对比如表1所示:
表1
Claims (6)
1.一种基于核函数的有监督近邻保持嵌入方法,其特征在于:包含训练和分类;
所述训练具体包含如下步骤:
步骤1,核函数映射:
设已有原空间的训练样本集为xi∈Rd,Ci={1,2,...,c},其中,ci是xi的类别标签,c表示类别数,N表示训练样本的总个数,d表示训练样本的维数;核函数能够发掘非线性空间内在的几何结构,通过函数φ:∈Rd→F将原始d维数据映射到非线性特征空间;其中函数φ为K(xi,xj)=<φ(xi),φ(xj)>;
步骤2,训练数据预处理:
对核函数映射后的空间样本,根据距离和标签类别构造近邻重构权重矩阵和判别信息邻接矩阵;
步骤3,获取空间变换后的训练样本:
在学习到投影变换矩阵P后,首先获得原空间样本xi先映射到非线性空间φ(xi),然后得到低维表示PTφ(xi),令vi=PTφ(xi),则判别子空间的训练集表示为v∈Rr;
所述分类具体包含如下步骤:
步骤4,对核函数映射后待测样本φ(x),先利用投影变换P把它映射到判别子空间中,得到判别子空间中的测试样本v=PTφ(x);
步骤5,利用最近邻分类器,对测试样本v在判别子空间中进行分类。
2.根据权利要求1所述的一种基于核函数的有监督近邻保持嵌入方法,其特征在于:在步骤1中,N=105。
3.根据权利要求1所述的一种基于核函数的有监督近邻保持嵌入方法,其特征在于:在步骤1中,d=1024。
4.根据权利要求1所述的一种基于核函数的有监督近邻保持嵌入方法,其特征在于:在步骤1中,c=15。
5.根据权利要求1所述的一种基于核函数的有监督近邻保持嵌入方法,其特征在于:在步骤2中,对已知训练样本,令knn(φ(xi))表示在F空间中xi的近邻集合,近邻重构权重系数矩阵W满足下面的要求:
6.根据权利要求1所述的一种基于核函数的有监督近邻保持嵌入方法,其特征在于:在步骤2中,对已知训练样本,信息矩阵H的构造如下:
即在核函数映射的F空间中,对不同类数据,如果xj是xi的k个最近邻之一,xi是xj的k个最近邻之一,那么Hij=1;对同类数据,如果xj是xi的k个最近邻之一,xi是xj的k个最近邻之一,则Hij=-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710025699.0A CN106940785A (zh) | 2017-01-13 | 2017-01-13 | 一种基于核函数的有监督近邻保持嵌入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710025699.0A CN106940785A (zh) | 2017-01-13 | 2017-01-13 | 一种基于核函数的有监督近邻保持嵌入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106940785A true CN106940785A (zh) | 2017-07-11 |
Family
ID=59469439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710025699.0A Pending CN106940785A (zh) | 2017-01-13 | 2017-01-13 | 一种基于核函数的有监督近邻保持嵌入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106940785A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457975A (zh) * | 2018-05-07 | 2019-11-15 | 山东大学 | 一种基于宏信息知识迁移的微表情识别方法 |
CN112232438A (zh) * | 2020-11-05 | 2021-01-15 | 华东理工大学 | 面向高维图像表示多核子空间学习框架 |
-
2017
- 2017-01-13 CN CN201710025699.0A patent/CN106940785A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457975A (zh) * | 2018-05-07 | 2019-11-15 | 山东大学 | 一种基于宏信息知识迁移的微表情识别方法 |
CN110457975B (zh) * | 2018-05-07 | 2022-12-27 | 山东大学 | 一种基于宏信息知识迁移的微表情识别方法 |
CN112232438A (zh) * | 2020-11-05 | 2021-01-15 | 华东理工大学 | 面向高维图像表示多核子空间学习框架 |
CN112232438B (zh) * | 2020-11-05 | 2023-09-01 | 华东理工大学 | 面向高维图像表示多核子空间学习框架 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Freund et al. | Learning the structure of manifolds using random projections | |
Boughida et al. | A novel approach for facial expression recognition based on Gabor filters and genetic algorithm | |
Kang et al. | Learning with whom to share in multi-task feature learning | |
Zavaschi et al. | Fusion of feature sets and classifiers for facial expression recognition | |
Huang et al. | Simultaneous tensor subspace selection and clustering: the equivalence of high order svd and k-means clustering | |
CN106303233A (zh) | 一种基于表情融合的视频隐私保护方法 | |
Ghorpade et al. | Pattern recognition using neural networks | |
Aditya et al. | Batik classification using neural network with gray level co-occurence matrix and statistical color feature extraction | |
Chu et al. | Stacked Similarity-Aware Autoencoders. | |
CN107451545A (zh) | 基于软标签下多通道判别非负矩阵分解的人脸识别方法 | |
CN103927522B (zh) | 一种基于流形自适应核的人脸识别方法 | |
Suo et al. | Structured dictionary learning for classification | |
CN104616000A (zh) | 一种人脸识别方法和装置 | |
Sisodia et al. | ISVM for face recognition | |
CN109816030A (zh) | 一种基于受限玻尔兹曼机的图像分类方法及装置 | |
Love et al. | Topological deep learning | |
CN106940785A (zh) | 一种基于核函数的有监督近邻保持嵌入方法 | |
CN112800927B (zh) | 一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法 | |
Love et al. | Topological convolutional layers for deep learning | |
Ghojogh | Data Reduction Algorithms in Machine Learning and Data Science | |
Ghorpade et al. | Neural Networks for face recognition Using SOM | |
Salamh et al. | A Novel Feature Extraction Descriptor for Face Recognition | |
Wang et al. | Facial expression recognition based on tensor local linear discriminant analysis | |
Tian et al. | Self-supervised learning based on discriminative nonlinear features for image classification | |
Soyel et al. | Optimal feature selection for 3D facial expression recognition with geometrically localized facial features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170711 |
|
WD01 | Invention patent application deemed withdrawn after publication |