CN103886345A - 投影变换矩阵的获取方法及装置、样本分类方法及装置 - Google Patents

投影变换矩阵的获取方法及装置、样本分类方法及装置 Download PDF

Info

Publication number
CN103886345A
CN103886345A CN201410161914.6A CN201410161914A CN103886345A CN 103886345 A CN103886345 A CN 103886345A CN 201410161914 A CN201410161914 A CN 201410161914A CN 103886345 A CN103886345 A CN 103886345A
Authority
CN
China
Prior art keywords
sample
euclidean distance
matrix
classification
projective transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410161914.6A
Other languages
English (en)
Other versions
CN103886345B (zh
Inventor
张莉
包兴
赵梦梦
王邦军
何书萍
杨季文
李凡长
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University Of Technology Big Data Group Sichuan Co ltd
Sichuan Hagong Chuangxing Big Data Co ltd
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201410161914.6A priority Critical patent/CN103886345B/zh
Publication of CN103886345A publication Critical patent/CN103886345A/zh
Application granted granted Critical
Publication of CN103886345B publication Critical patent/CN103886345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种投影变换矩阵的获取方法及装置、样本分类方法及装置,本发明使用训练样本的类别标签构建类别矩阵,并根据类别矩阵加入计算投影变换矩阵中。本发明中由于类别标签能够准确的表示训练样本的类别,因此类别矩阵能够准确反应训练样本的类别。本发明取在欧氏距离和值最小的基础上,加入类别信息实现了有监督的学习,因此能够获得正确地投影变换矩阵,并很好地实现拉近同类之间距离,扩大异类之间距离的目的,进而使分类性能变好。

Description

投影变换矩阵的获取方法及装置、样本分类方法及装置
技术领域
本发明涉及人工智能领域,尤其涉及一种投影变换矩阵的获取方法及装置、样本分类方法及装置。
背景技术
在人工智能逐步发展的今天,经常需要计算机对待分类样本进行分类,即在训练样本及类别中确定待分类样本的类别,例如:根据多个已知人脸及与已知人脸一一对应的姓名,确定待分类人脸的姓名。
待分类样本和训练样本为真实世界物体的数据,一般采用矩阵的形式来表示,由于真实世界物体的维度较高,针对高维数据进行分类时经常会出现维数灾难问题,所以一般将数据映射到低维空间,以便降低数据的处理难度,现有技术中通常采用投影变换矩阵对样本数据进行降维处理。
为了能够准确的在训练样本中识别待分类样本的类别,我们希望训练样本中同类样本之间的距离更近,异类样本之间的距离更远,为了达到这一目的,我们希望训练样本进行降维处理的同时拉近同类样本之间的距离,扩大异类样本之间的距离,因此投影变换矩阵肩负着对数据进行降维处理、拉近同类样本之间距离和扩大异类样本之间的距离的三重任务。
为了获得投影变换矩阵,现有技术中通过如下实现方式实现:
在训练样本中随机选取一个样本A,计算样本A与其余各个样本的欧氏距离,若样本B与样本A之间的欧氏距离在预设范围内,则样本B与样本A为同类,若样本C与样本A之间的欧氏距离超出预设范围,则样本C与样本A为异类,通过此方法构建样本A的类内集合和类间集合,类内集合为与样本A同类的样本集合,类间集合为与样本A异类的样本集合,根据类内集合和类间集合经过进一步的矩阵处理得到投影变换矩阵,得到投影变换矩阵能够拉近类内集合中样本的距离,扩大类间集合中样本的距离。
但是,使用欧氏距离判断同类、异类的方式,容易出现分类错误的情况,即可能出现样本C与样本A之间的欧氏距离小于样本B与样本A之间的欧氏距离的情况,导致类内集合和类间集合的分类出现错误,进一步导致投影变换矩阵的失效,出现拉近异类之间的距离,扩大同类之间的距离的情况。因此本方法得到的投影变换矩阵是不正确的,不能很好的实现拉近同类之间距离,扩大异类之间距离的目的,进而导致分类性能变差。
发明内容
鉴于上述问题,本发明提供了一种投影变换矩阵的获取方法及装置、样本分类方法及装置,本发明考虑了样本本身的类别信息,能够获得准确地投影变换矩阵,使分类性能变好。
为了实现上述目的,本发明提供以下技术手段:
一种投影变换矩阵的获取方法,包括:
依据各个训练样本的类别标签构建类别矩阵;
将所述各个训练样本利用投影变换矩阵降维至判别子空间;
在所述判别子空间中计算所有样本的欧氏距离和值,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离,加上各个样本与其类别矩阵的欧氏距离之和;
对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
优选的,依据各个训练样本的类别标签构建类别矩阵包括:
所述类别矩阵的每一行对应一个训练样本,类别矩阵的每一列表示一个类别;
所述类别矩阵中各个样本行的类别标签列为1,其余都为0,由此构建类别矩阵。
优选的,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的第一欧氏距离;
计算各个样本与其类别矩阵的第二欧氏距离;
将所述第一欧氏距离与所述第二欧氏距离的之和作为所述欧氏距离和值。
优选的,欧氏距离和值的获取过程包括:
计算各个样本与其K个近邻样本的第三欧氏距离;
计算各个样本与其类别矩阵的第四欧氏距离;
获取所述第四欧氏距离与信任度系数的第一乘积;
将所述第三欧氏距离与所述第一乘积的和值作为所述欧氏距离和值。
优选的,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的第五欧氏距离;
计算各个样本与其类别矩阵的第六欧氏距离;
获取所述第六欧氏距离与信任度系数的第二乘积;
将所述第五欧氏距离与所述第二乘积的之和作为所述欧氏距离和值。
优选的,对各个样本的K个近邻样本进行重构包括:
利用重构权值矩阵对所述K个近邻样本进行重构。
优选的,所述重构权值矩阵的获取方法包括:
利用所述重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本的第七欧氏距离;
对所述第七欧氏距离取最小值获取重构权值矩阵。
优选的,重构权值矩阵的获取方法包括:
利用所述重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本的第八欧氏距离;
取所述重构权值矩阵的一范数;
取第八欧氏距离与一范数之和的最小值,获取重构权值矩阵。
优选的,在依据各个训练样本的类别标签构建类别矩阵之前还包括:
对所述各个训练样本进行预降维处理。
一种样本分类方法,包括:
将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
优选的,在将待分类样本利用所述投影变换矩阵降维至所述判别子空间之前还包括:
对所述待分类样本进行降维处理。
一种投影变换矩阵的获取装置,包括:
构建单元,用于依据各个训练样本的类别标签构建类别矩阵;
第一降维单元,用于将所述各个训练样本利用投影变换矩阵降维至判别子空间;
计算单元,用于在判别子空间计算所有样本的欧氏距离和值,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离,加上各个样本与其类别矩阵的欧氏距离之和;
获取单元,用于对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
一种样本分类装置,包括:
第二降维单元,用于将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
第三降维单元,用于将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
分类单元,用于在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
本发明提供了一种投影变换矩阵的获取方法,该方法中使用训练样本的类别标签构建类别矩阵,并根据类别矩阵加入计算投影变换矩阵中。本方法中由于类别标签能够准确的表示训练样本的类别,因此类别矩阵能够准确反应训练样本的类别。本方法中在计算各个样本与其K个近邻样本的欧氏距离和值的基础上,加上各个样本与类别矩阵的欧氏距离,取欧氏距离和值的最小值得到投影变换矩阵,欧氏距离和值越小表示K个近邻样本越接近同类样本,其值越大表示为异类样本。
本发明取在欧氏距离和值最小的基础上,加入类别信息实现了有监督的学习,因此本方法能够获得正确地投影变换矩阵,并很好地实现拉近同类之间距离,扩大异类之间距离的目的,进而使分类性能变好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的投影变换矩阵的获取方法的流程图;
图2为本发明实施例公开的又一投影变换矩阵的获取方法的流程图;
图3为本发明实施例公开的又一投影变换矩阵的获取方法的流程图;
图4为本发明实施例公开的又一投影变换矩阵的获取方法的流程图;
图5为本发明实施例公开的投影变换矩阵的获取方法中获取重构权值矩阵的流程图;
图6为本发明实施例公开的又一投影变换矩阵的获取方法中获取重构权值矩阵的流程图;
图7为本发明实施例公开的本发明实施例公开的样本分类方法的流程图;
图8为本发明实施例公开的投影变换矩阵的获取装置的结构示意图;
图9为本发明实施例公开的样本分类装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种投影变换矩阵的获取方法,如图1所示,该方法包括以下步骤:
S101:依据各个训练样本的类别标签构建类别矩阵;
训练样本集中包括多个训练样本,各个训练样本都有其对应的类别标签,提取类别标签将其转为与类别标签一一对应的类别信息,根据类别信息能够准确的判断各个训练样本所属类别。
类别矩阵的行为各个训练样本的数量,列为各个训练样本的类别信息的数量。优选的,依据各个训练样本的类别标签构建类别矩阵包括:所述类别矩阵的每一行对应一个训练样本,类别矩阵的每一列表示一个类别;各个样本行的类别标签列为1,其余都标0,由此构建类别矩阵。
S102:将所述各个训练样本利用投影变换矩阵降维至判别子空间;
投影变换矩阵的作用为将各个训练样本进行降维处理,且能够拉近同类样本之间的距离,扩大异类样本之间的距离,因此为了获取投影变换矩阵,本发明先虚拟一个投影变换矩阵,将各个训练样本利用投影变换矩阵降维至判别子空间中。在判别子空间中对投影变换矩阵进行计算。
S103:在判别子空间计算所有样本的欧氏距离和值,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离,加上各个样本与其类别矩阵的欧氏距离之和;
以判别子空间中的一个目标样本为例进行说明,在判别子空间中通过K近邻分类器获取目标样本的K个近邻样本,可以理解的是,K个近邻样本中有目标样本的同类样本,也有目标样本的异类样本。计算目标样本与K个近邻样本的欧氏距离,再计算目标样本与其类别矩阵的欧氏距离,取两者欧氏距离的和值,对各个样本都进行上述操作即可得到所有样本的欧氏距离和值。
S104:对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
投影变换矩阵的作用将目标样本与K个近邻样本的距离最小,并且在此基础之上,将K个近邻样本中与目标样本为同一类别的样本相互靠近,与目标样本非同一类别的样本拉远。
取欧氏距离和值最小值时对应的投影变换矩阵作为本发明所需的投影变换矩阵,欧氏距离和值最小即为各个样本与其K个近邻样本的距离之和最小,和各个样本与其类别矩阵的欧氏距离之和最小,其中各个样本与其类别矩阵的欧氏距离最小,表示各个样本的中同类样本相互靠近,异类样本相互拉远。
对欧氏距离和值取最小值后得到最终表达式,为了得到投影变换矩阵,需要对最终表达式进行特征分解,获得特征值及其对应的特征矢量,把特征值按照从大到小的顺序排列,取前r个最大特征值对应的特征向量,则投影变换矩阵。
本发明提供了一种投影变换矩阵的获取方法,该方法中使用训练样本的类别标签构建类别矩阵,并根据类别矩阵加入计算投影变换矩阵中。本方法中由于类别标签能够准确的表示训练样本的类别,因此类别矩阵能够准确反应训练样本的类别。本方法中在计算各个样本与其K个近邻样本的欧氏距离和值的基础上,加上各个样本与类别矩阵的欧氏距离,取欧氏距离和值的最小值得到投影变换矩阵,欧氏距离和值越小表示K个近邻样本越接近同类样本,其值越大表示为异类样本。
本发明取在欧氏距离和值最小的基础上,使各个样本与类别矩阵的距离越小,即使同类样本越来越近,因此本方法能够获得正确地投影变换矩阵,并很好地实现拉近同类之间距离,扩大异类之间距离的目的,进而使分类性能变好。
在上述实施例的基础之上,本发明提供了步骤S103中获取欧氏距离和值的三种实现方式,具体如下所示:
第一种方式,为将K个近邻样本进行重构的方式,如图2所示,包括以下步骤:
步骤S201:对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
步骤S202:计算各个样本与其K个重构样本的第一欧氏距离;
步骤S203:计算各个样本与其类别矩阵的第二欧氏距离;
步骤S204:将第一欧氏距离与第二欧氏距离之和作为欧氏距离和值。
第二种方式,为增加信任度系数的方式如图3所示,包括以下步骤:
步骤S301:计算各个样本与其K个近邻样本的第三欧氏距离;
步骤S302:计算各个样本与其类别矩阵的第四欧氏距离;
步骤S303:获取第四欧氏距离与信任度系数的第一乘积;
步骤S304:将所述第三欧氏距离与所述第一乘积的和值作为所述欧氏距离和值。
增加信任度系数为表述类别矩阵使用量,信任度系数理论上可以为任意正数,其值越大表示类别矩阵使用越多,其值越小表示类别使用越少,优选的,可以为10。使用类别信息越多,得到的效果越好,但是会增加计算量及带来其他问题。
优选的,第一种方式和第二种方式的总和,如图4所示,包括以下步骤:
步骤S401:对各个样本K个近邻样本进行重构,获得各个样本的K个重构样本;
步骤S402:计算各个样本与其K个重构样本的第五欧氏距离;
步骤S403:计算各个样本与其类别矩阵的第六欧氏距离;
步骤S404:获取第六欧氏距离与信任度系数的第二乘积;
步骤S405:将第五欧氏距离与第二乘积的之和作为所述欧氏距离和值。
第三种方式能够具有以上两种方式的优势。
第一种方式和第三种方式中,对各个样本K个近邻样本进行重构包括:利用重构权值矩阵对K个近邻样本进行重构。
优选的,本发明上述实施例中获取重构权值矩阵的具体实现过程可以有两种实现方式,第一种实现方式S1:根据局部散度计算重构权值矩阵,第二种实现方式S2:根据总体散度计算重构权值矩阵。
采用局部散度计算得到计算重构权值矩阵时,由于局部散度中判别信息不完整,不能很好的利用判别信息构建投影变换矩阵,因此为了充分利用判别信息采用总体散度的方式构建投影变换矩阵,总体散度为局部散度与非局部散度的总和。
第一种方式:如图5所示,包括以下步骤:
步骤S501:利用重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
步骤S502:计算各个训练样本与其K个重构训练样本的第七欧氏距离;
步骤S503:对所述第七欧氏距离取最小值获取重构权值矩阵。
第一种方式为采用训练样本获取重构权值矩阵,由于判别子空间中的样本与训练样本仅为维数不同而已,还保持着训练样本的特性,训练样本中的重构权值矩阵能够适用于判别子空间中。
第二种方式:如图6所示,包括以下步骤:
步骤S601:利用重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
步骤S602:计算各个训练样本与其K个重构训练样本的第八欧氏距离;
步骤S603:取所述重构权值矩阵的一范数;
步骤S604:取第八欧氏距离与一范数之和的最小值,获取重构权值矩阵。
第二种方式在第一种方式的基础之上增加了一范数,一范数的作用为将重构权值矩阵中为零的越多,不为零的越少,使K个训练样本中与训练样本同类的参与计算,与训练样本异类的不参与计算,即忽略异类样本的作用,由此得到的重构权值矩阵更能代表各个样本的原始信息。
优选的,在步骤S101之前本发明还包括:对所述各个训练样本进行预降维处理。
现实世界中物体对应的数据维度很高,为了降低运算量先对原始训练样本进行降维处理,降维处理之后的训练样本维度较低能够更好的进行计算。
为了清楚表达本发明的实现过程,下面我们采用具体实施例进行详细表述:
(1)确定训练样本与类别信息
将训练样本集定义为 { x i , y i } i = 1 l , x i ∈ R D , y i = { 1,2 , . . . , c } .
其中,yi是xi的类别标签即类别信息,c表示类别信息的数量,l表示训练样本的总个数,D表示训练样本集中的训练样本的维数;
(2)一次降维处理
为了降低运算的复杂度,提高运算速度;首先,对上述训练样本集进行随机降维,将训练样本由D维降到d维,在降维过程中,训练样本的类别信息保持不变,其中,d<D;在本实施例中d=100。
降维后的训练样本定义为:
Figure BDA0000494502900000102
在本实施例中D=10304,l=200,c=40。
其中,d为降维后的训练样本的维数,
Figure BDA0000494502900000103
为降维后的训练样本。
(3)构造类别矩阵
利用训练样本的标签信息,构造一个具有分类信息的矩阵即当yi=j,i=1,2,...,l时,hi的第j个分量为1,否则为0。
(4)获取重构权值矩阵
重构权值系数矩阵W可以通过求解下面的优化问题来获得:
min &Sigma; i = 1 l ( | | x _ i - &Sigma; j = 1 k W ij x _ ij | | 2 + | | W i | | 1 )
s . t &Sigma; j = 1 k W ij = 1
其中
Figure BDA0000494502900000106
Figure BDA0000494502900000107
的K个近邻样本。
(5)获取投影变换矩阵
为了同时考虑保持低维坐标的几何特征和训练点信息,寻找一个最优变换A,将数据集
Figure BDA0000494502900000111
投影到相对低维的特征空间
Figure BDA0000494502900000112
其中x'i∈Rc。引入一个具有判别信息的项,即
min A &Sigma; i = 1 l ( | | x &prime; i - &Sigma; j = 1 k W ij x &prime; j | | 2 + &beta; | | x &prime; i - h i | | 2 )
其中β∈(0,+∞)反映了样本对已知低维信息的信任度,控制着训练样本对数据的影响,最小化(1)式可以得到二次投影矩阵A:
A=β(X1MX1 T+βX1X1 T)-TX1HT      (2)
其中M=(I-W)T(I-W),I为单位矩阵,H=[h1,h2,...,hl]∈Rc×l
为了得到投影变换矩阵P,需要对对称矩阵A进行特征分解,获得特征值λl及其对应的特征矢量Pl。把特征值按照从大到小的顺序排列,即λ1≥λ2≥"≥λd。取前r个最大特征值对应的特征向量,则投影变换矩阵为P=[P1,",Pr],其中,r为特征值的个数。
基于上述实施例提供的投影变换矩阵获取方法,在获取投影变换矩阵之后,本发明还提供了一种样本分类方法,如图7所示,包括:
步骤S701:将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如如图1所述的方法获取的;
在得到投影变换矩阵后,可以将降维后的训练样本集映射到判别子空间中,其中,判别子空间的训练样本集具体为其中,
Figure BDA0000494502900000115
步骤S702:将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
优选的,在将待分类样本利用所述投影变换矩阵降维至所述判别子空间之前还包括:对所述待分类样本进行降维处理。
待测试样本定义为x,首先,对待测试样本x进行随机降维,具体方法与对训练样本集中的训练样本进行随机降维的方法相同,需要说明的是,需要降维后的待测试样本的维数与降维后的训练样本的维数相同;
即,将待测试样本的维数降到d维后,待测试样本x变为
Figure BDA0000494502900000116
其次,利用投影变换矩阵P将降维后的待测试样本映射到判别子空间中,从而得到判别子空间中的测试样本
Figure BDA0000494502900000121
步骤S703:在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
本发明提供的样本分类方法中由于使用了投影变换矩阵将训练样本和待分类样本都投影至判别子空间中,投影变换矩阵不仅对训练样本和待分类样本进行了降维处理,还拉近了同类样本之间的距离,扩大了异类样本之间的距离,使得在对待分类样本进行分类时,能够更加精确,使得分类性能更好。利用K近邻分类器,对二次降维测试样本进行分类。即在二次降维训练样本中,找到K个和二次降维测试样本相邻的样本,哪个类别的二次降维训练样本占多数,就把哪个类别赋予该测试样本。
本发明与现有技术中的邻域保持嵌入方法相比加入了判别信息,实现了有监督的学习。
如图8所示,本发明还提供了一种投影变换矩阵的获取装置,包括:
构建单元100,用于依据各个训练样本的类别标签构建类别矩阵;
第一降维单元200,用于将所述各个训练样本利用投影变换矩阵降维至判别子空间;
计算单元300,用于在判别子空间计算所有样本的欧氏距离和值,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离,加上各个样本与其类别矩阵的欧氏距离之和;
获取单元400,用于对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
如图9所示,本发明还提供了一种样本分类装置,包括:
第二降维单元500,用于将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如图1所述的方法获取的;
第三降维单元600,用于将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
分类单元700,用于在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (13)

1.一种投影变换矩阵的获取方法,其特征在于,包括:
依据各个训练样本的类别标签构建类别矩阵;
将所述各个训练样本利用投影变换矩阵降维至判别子空间;
在所述判别子空间中计算所有样本的欧氏距离和值,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离,加上各个样本与其类别矩阵的欧氏距离之和;
对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
2.如权利要求1所述的方法,其特征在于,依据各个训练样本的类别标签构建类别矩阵包括:
所述类别矩阵的每一行对应一个训练样本,类别矩阵的每一列表示一个类别;
所述类别矩阵中各个样本行的类别标签列为1,其余都为0,由此构建类别矩阵。
3.如权利要求1所述的方法,其特征在于,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的第一欧氏距离;
计算各个样本与其类别矩阵的第二欧氏距离;
将所述第一欧氏距离与所述第二欧氏距离的之和作为所述欧氏距离和值。
4.如权利要求1所述的方法,其特征在于,欧氏距离和值的获取过程包括:
计算各个样本与其K个近邻样本的第三欧氏距离;
计算各个样本与其类别矩阵的第四欧氏距离;
获取所述第四欧氏距离与信任度系数的第一乘积;
将所述第三欧氏距离与所述第一乘积的和值作为所述欧氏距离和值。
5.如权利要求1所述的方法,其特征在于,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的第五欧氏距离;
计算各个样本与其类别矩阵的第六欧氏距离;
获取所述第六欧氏距离与信任度系数的第二乘积;
将所述第五欧氏距离与所述第二乘积的之和作为所述欧氏距离和值。
6.如权利要求3或5所述的方法,其特征在于,对各个样本的K个近邻样本进行重构包括:
利用重构权值矩阵对所述K个近邻样本进行重构。
7.如权利要求6所述的方法,其特征在于,所述重构权值矩阵的获取方法包括:
利用所述重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本的第七欧氏距离;
对所述第七欧氏距离取最小值获取重构权值矩阵。
8.如权利要求6所述的方法,其特征在于,重构权值矩阵的获取方法包括:
利用所述重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本的第八欧氏距离;
取所述重构权值矩阵的一范数;
取第八欧氏距离与一范数之和的最小值,获取重构权值矩阵。
9.如权利要求1所述的方法,其特征在于,在依据各个训练样本的类别标签构建类别矩阵之前还包括:
对所述各个训练样本进行预降维处理。
10.一种样本分类方法,其特征在于,包括:
将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
11.如权利要求10所述的方法,其特征在于,在将待分类样本利用所述投影变换矩阵降维至所述判别子空间之前还包括:
对所述待分类样本进行降维处理。
12.一种投影变换矩阵的获取装置,其特征在于,包括:
构建单元,用于依据各个训练样本的类别标签构建类别矩阵;
第一降维单元,用于将所述各个训练样本利用投影变换矩阵降维至判别子空间;
计算单元,用于在判别子空间计算所有样本的欧氏距离和值,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离,加上各个样本与其类别矩阵的欧氏距离之和;
获取单元,用于对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
13.一种样本分类装置,其特征在于,包括:
第二降维单元,用于将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
第三降维单元,用于将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
分类单元,用于在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
CN201410161914.6A 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置 Active CN103886345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410161914.6A CN103886345B (zh) 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410161914.6A CN103886345B (zh) 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置

Publications (2)

Publication Number Publication Date
CN103886345A true CN103886345A (zh) 2014-06-25
CN103886345B CN103886345B (zh) 2018-11-02

Family

ID=50955228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410161914.6A Active CN103886345B (zh) 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置

Country Status (1)

Country Link
CN (1) CN103886345B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832427A (zh) * 2020-06-22 2020-10-27 华中科技大学 基于欧氏对齐和Procrustes分析的EEG分类的迁移学习方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110249001A1 (en) * 2010-04-13 2011-10-13 Hirokazu Kameyama Matrix generation apparatus, method, and program, and information processing apparatus
CN102682089A (zh) * 2012-04-24 2012-09-19 浙江工业大学 一种利用鉴别随机邻域嵌入分析的数据降维方法
CN103577839A (zh) * 2013-11-28 2014-02-12 苏州大学 一种邻域保持判别嵌入人脸识别方法及系统
CN103679162A (zh) * 2014-01-03 2014-03-26 苏州大学 一种人脸识别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110249001A1 (en) * 2010-04-13 2011-10-13 Hirokazu Kameyama Matrix generation apparatus, method, and program, and information processing apparatus
CN102682089A (zh) * 2012-04-24 2012-09-19 浙江工业大学 一种利用鉴别随机邻域嵌入分析的数据降维方法
CN103577839A (zh) * 2013-11-28 2014-02-12 苏州大学 一种邻域保持判别嵌入人脸识别方法及系统
CN103679162A (zh) * 2014-01-03 2014-03-26 苏州大学 一种人脸识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEI ZHANG ET AL.: "Discriminant neighborhood embedding for classification", 《PATTERN RECOGNITION》 *
杜海顺等: "一种邻域保持判别嵌入人脸识别方法", 《仪器仪表学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832427A (zh) * 2020-06-22 2020-10-27 华中科技大学 基于欧氏对齐和Procrustes分析的EEG分类的迁移学习方法和系统

Also Published As

Publication number Publication date
CN103886345B (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
US20150278408A1 (en) Information processing apparatus and information processing method
Lukic et al. Morphological classification of radio galaxies: capsule networks versus convolutional neural networks
Li et al. A comparative analysis of evolutionary and memetic algorithms for community detection from signed social networks
CN103365997B (zh) 一种基于集成学习的观点挖掘方法
KR20190031318A (ko) 도메인 분리 뉴럴 네트워크들
CN105824802A (zh) 一种获取知识图谱向量化表示的方法以及装置
CN104462614A (zh) 一种基于网络数据的主动学习方法及装置
CN103605985A (zh) 一种基于张量全局-局部保持投影的数据降维方法
Pokorny et al. Topological trajectory clustering with relative persistent homology
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
Xiong et al. Diagnose like a pathologist: Transformer-enabled hierarchical attention-guided multiple instance learning for whole slide image classification
CN102915448A (zh) 一种基于AdaBoost的三维模型自动分类方法
Ćiprijanović et al. DeepAdversaries: examining the robustness of deep learning models for galaxy morphology classification
Planas et al. Extrapolation with gaussian random processes and evolutionary programming
Zhong et al. LightMixer: A novel lightweight convolutional neural network for tomato disease detection
CN110197213A (zh) 基于神经网络的图像匹配方法、装置和设备
CN112598089B (zh) 图像样本的筛选方法、装置、设备及介质
CN103886345A (zh) 投影变换矩阵的获取方法及装置、样本分类方法及装置
CN103870848A (zh) 投影变换矩阵的获取方法、样本分类方法
CN103955676A (zh) 一种人脸识别方法及系统
CN104091131A (zh) 应用程序与权限的关系确定方法及确定装置
Lennox et al. Deep metric learning for proteomics
Prakash et al. Determination of the relative inclination and the viewing angle of an interacting pair of galaxies using Convolutional Neural Networks
Kuncheva et al. Multi-scale community detection in temporal networks using spectral graph wavelets
CN106157285A (zh) 用于选择用于视差计算的参数组的优选值的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190703

Address after: 610000 China (Sichuan) Free Trade Pilot Zone Chengdu High-tech Zone Jiaozi Avenue 177 Building 1 2501, 2502, 2503, 2504, 2505

Patentee after: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

Address before: 215123 199 Ren Yan Road, Suzhou Industrial Park, Jiangsu

Patentee before: Soochow University

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for obtaining projection transformation matrix and sample classification method and device

Effective date of registration: 20191012

Granted publication date: 20181102

Pledgee: Chengdu Rural Commercial Bank Co.,Ltd. Juqiao sub branch

Pledgor: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

Registration number: Y2019510000036

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: No.1, 12 / F, building 8, No.399, west section of Fucheng Avenue, Chengdu hi tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610015

Patentee after: Sichuan Hagong Chuangxing big data Co.,Ltd.

Address before: No. 1104, 11th floor, building 1, No. 530, middle section of Tianfu Avenue, Chengdu high tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610094

Patentee before: Harbin University of technology big data group Sichuan Co.,Ltd.

Address after: No. 1104, 11th floor, building 1, No. 530, middle section of Tianfu Avenue, Chengdu high tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610094

Patentee after: Harbin University of technology big data group Sichuan Co.,Ltd.

Address before: 610000 China (Sichuan) Free Trade Pilot Zone Chengdu High-tech Zone Jiaozi Avenue 177 Building 1 2501, 2502, 2503, 2504, 2505

Patentee before: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

PM01 Change of the registration of the contract for pledge of patent right
PM01 Change of the registration of the contract for pledge of patent right

Change date: 20210617

Registration number: Y2019510000036

Pledgor after: Sichuan Hagong Chuangxing big data Co.,Ltd.

Pledgor before: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230606

Granted publication date: 20181102

Pledgee: Chengdu Rural Commercial Bank Co.,Ltd. Juqiao sub branch

Pledgor: Sichuan Hagong Chuangxing big data Co.,Ltd.

Registration number: Y2019510000036