CN103886345B - 投影变换矩阵的获取方法及装置、样本分类方法及装置 - Google Patents

投影变换矩阵的获取方法及装置、样本分类方法及装置 Download PDF

Info

Publication number
CN103886345B
CN103886345B CN201410161914.6A CN201410161914A CN103886345B CN 103886345 B CN103886345 B CN 103886345B CN 201410161914 A CN201410161914 A CN 201410161914A CN 103886345 B CN103886345 B CN 103886345B
Authority
CN
China
Prior art keywords
sample
euclidean distance
matrix
value
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410161914.6A
Other languages
English (en)
Other versions
CN103886345A (zh
Inventor
张莉
包兴
赵梦梦
王邦军
何书萍
杨季文
李凡长
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University Of Technology Big Data Group Sichuan Co ltd
Sichuan Hagong Chuangxing Big Data Co ltd
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201410161914.6A priority Critical patent/CN103886345B/zh
Publication of CN103886345A publication Critical patent/CN103886345A/zh
Application granted granted Critical
Publication of CN103886345B publication Critical patent/CN103886345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种投影变换矩阵的获取方法及装置、样本分类方法及装置,本发明使用训练样本的类别标签构建类别矩阵,并根据类别矩阵加入计算投影变换矩阵中。本发明中由于类别标签能够准确的表示训练样本的类别,因此类别矩阵能够准确反应训练样本的类别。本发明取在欧氏距离和值最小的基础上,加入类别信息实现了有监督的学习,因此能够获得正确地投影变换矩阵,并很好地实现拉近同类之间距离,扩大异类之间距离的目的,进而使分类性能变好。

Description

投影变换矩阵的获取方法及装置、样本分类方法及装置
技术领域
本发明涉及人工智能领域,尤其涉及一种投影变换矩阵的获取方法及装置、样本分类方法及装置。
背景技术
在人工智能逐步发展的今天,经常需要计算机对待分类样本进行分类,即在训练样本及类别中确定待分类样本的类别,例如:根据多个已知人脸及与已知人脸一一对应的姓名,确定待分类人脸的姓名。
待分类样本和训练样本为真实世界物体的数据,一般采用矩阵的形式来表示,由于真实世界物体的维度较高,针对高维数据进行分类时经常会出现维数灾难问题,所以一般将数据映射到低维空间,以便降低数据的处理难度,现有技术中通常采用投影变换矩阵对样本数据进行降维处理。
为了能够准确的在训练样本中识别待分类样本的类别,我们希望训练样本中同类样本之间的距离更近,异类样本之间的距离更远,为了达到这一目的,我们希望训练样本进行降维处理的同时拉近同类样本之间的距离,扩大异类样本之间的距离,因此投影变换矩阵肩负着对数据进行降维处理、拉近同类样本之间距离和扩大异类样本之间的距离的三重任务。
为了获得投影变换矩阵,现有技术中通过如下实现方式实现:
在训练样本中随机选取一个样本A,计算样本A与其余各个样本的欧氏距离,若样本B与样本A之间的欧氏距离在预设范围内,则样本B与样本A为同类,若样本C与样本A之间的欧氏距离超出预设范围,则样本C与样本A为异类,通过此方法构建样本A的类内集合和类间集合,类内集合为与样本A同类的样本集合,类间集合为与样本A异类的样本集合,根据类内集合和类间集合经过进一步的矩阵处理得到投影变换矩阵,得到投影变换矩阵能够拉近类内集合中样本的距离,扩大类间集合中样本的距离。
但是,使用欧氏距离判断同类、异类的方式,容易出现分类错误的情况,即可能出现样本C与样本A之间的欧氏距离小于样本B与样本A之间的欧氏距离的情况,导致类内集合和类间集合的分类出现错误,进一步导致投影变换矩阵的失效,出现拉近异类之间的距离,扩大同类之间的距离的情况。因此本方法得到的投影变换矩阵是不正确的,不能很好的实现拉近同类之间距离,扩大异类之间距离的目的,进而导致分类性能变差。
发明内容
鉴于上述问题,本发明提供了一种投影变换矩阵的获取方法及装置、样本分类方法及装置,本发明考虑了样本本身的类别信息,能够获得准确地投影变换矩阵,使分类性能变好。
为了实现上述目的,本发明提供以下技术手段:
一种投影变换矩阵的获取方法,包括:
依据各个训练样本的类别标签构建类别矩阵;
将所述各个训练样本利用虚拟的投影变换矩阵降维至判别子空间;
在所述判别子空间中计算所有样本的欧氏距离和值,其中,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离的和值,加上各个样本与其类别矩阵的欧氏距离的和值;
对所述欧氏距离和值取最小值,获得所需的投影变换矩阵。
优选的,依据各个训练样本的类别标签构建类别矩阵包括:
所述类别矩阵的每一行对应一个训练样本,类别矩阵的每一列表示一个类别;
所述类别矩阵中各个样本行的类别标签列为1,其余都为0,由此构建类别矩阵。
优选的,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的欧式距离的和值,并将其称为第一欧氏距离;
计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第二欧氏距离;
将所述第一欧氏距离与所述第二欧氏距离的之和作为所述欧氏距离和值。
优选的,欧氏距离和值的获取过程包括:
计算各个样本与其K个近邻样本的欧式距离的和值,并将其称为第三欧氏距离;
计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第四欧氏距离;
获取所述第四欧氏距离与信任度系数的第一乘积;
将所述第三欧氏距离与所述第一乘积的和值作为所述欧氏距离和值。
优选的,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的欧式距离的和值,并将其称为第五欧氏距离;
计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第六欧氏距离;
获取所述第六欧氏距离与信任度系数的第二乘积;
将所述第五欧氏距离与所述第二乘积的之和作为所述欧氏距离和值。
优选的,对各个样本的K个近邻样本进行重构包括:
利用重构权值矩阵对所述K个近邻样本进行重构。
优选的,所述重构权值矩阵的获取方法包括:
利用虚拟的重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本的欧式距离的和值,并将其称为第七欧氏距离;
对所述第七欧氏距离取最小值获取所需的重构权值矩阵。
优选的,重构权值矩阵的获取方法包括:
利用虚拟的重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本的欧式距离的和值,并将其称为第八欧氏距离;
取所述重构权值矩阵的一范数;
取第八欧氏距离与一范数之和的最小值,获取所需的重构权值矩阵。
优选的,在依据各个训练样本的类别标签构建类别矩阵之前还包括:
对所述各个训练样本进行预降维处理。
一种样本分类方法,包括:
将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
优选的,在将待分类样本利用所述投影变换矩阵降维至所述判别子空间之前还包括:
对所述待分类样本进行降维处理。
一种投影变换矩阵的获取装置,包括:
构建单元,用于依据各个训练样本的类别标签构建类别矩阵;
第一降维单元,用于将所述各个训练样本利用虚拟的投影变换矩阵降维至判别子空间;
计算单元,用于在判别子空间计算所有样本的欧氏距离和值;其中,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离的和值,与各个样本与其类别矩阵的欧氏距离之和;
获取单元,用于对所述欧氏距离和值取最小值,获得所述投影变换矩阵。
一种样本分类装置,包括:
第二降维单元,用于将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
第三降维单元,用于将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
分类单元,用于在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
本发明提供了一种投影变换矩阵的获取方法,该方法中使用训练样本的类别标签构建类别矩阵,并根据类别矩阵加入计算投影变换矩阵中。本方法中由于类别标签能够准确的表示训练样本的类别,因此类别矩阵能够准确反应训练样本的类别。本方法中在计算各个样本与其K个近邻样本的欧氏距离的和值的基础上,加上各个样本与类别矩阵的欧氏距离,从而获得欧式距离和孩子。然后,取欧氏距离和值的最小值得到所需的投影变换矩阵,欧氏距离和值越小表示K个近邻样本越接近同类样本,其值越大表示为异类样本。
本发明取在欧氏距离和值最小的基础上,加入类别信息实现了有监督的学习,因此本方法能够获得正确地投影变换矩阵,并很好地实现拉近同类之间距离,扩大异类之间距离的目的,进而使分类性能变好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的投影变换矩阵的获取方法的流程图;
图2为本发明实施例公开的又一投影变换矩阵的获取方法的流程图;
图3为本发明实施例公开的又一投影变换矩阵的获取方法的流程图;
图4为本发明实施例公开的又一投影变换矩阵的获取方法的流程图;
图5为本发明实施例公开的投影变换矩阵的获取方法中获取重构权值矩阵的流程图;
图6为本发明实施例公开的又一投影变换矩阵的获取方法中获取重构权值矩阵的流程图;
图7为本发明实施例公开的本发明实施例公开的样本分类方法的流程图;
图8为本发明实施例公开的投影变换矩阵的获取装置的结构示意图;
图9为本发明实施例公开的样本分类装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种投影变换矩阵的获取方法,如图1所示,该方法包括以下步骤:
S101:依据各个训练样本的类别标签构建类别矩阵;
训练样本集中包括多个训练样本,各个训练样本都有其对应的类别标签,提取类别标签将其转为与类别标签一一对应的类别信息,根据类别信息能够准确的判断各个训练样本所属类别。
类别矩阵的行为各个训练样本的数量,列为各个训练样本的类别信息的数量。优选的,依据各个训练样本的类别标签构建类别矩阵包括:所述类别矩阵的每一行对应一个训练样本,类别矩阵的每一列表示一个类别;各个样本行的类别标签列为1,其余都标0,由此构建类别矩阵。
S102:将所述各个训练样本利用虚拟的投影变换矩阵降维至判别子空间;
投影变换矩阵的作用为将各个训练样本进行降维处理,且能够拉近同类样本之间的距离,扩大异类样本之间的距离,因此为了获取投影变换矩阵,本发明先虚拟一个投影变换矩阵,将各个训练样本利用虚拟的投影变换矩阵降维至判别子空间中。在判别子空间中对虚拟的投影变换矩阵进行计算。
S103:在判别子空间计算所有样本的欧氏距离和值;其中,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离的和值,与各个样本与其类别矩阵的欧氏距离之和;
以判别子空间中的一个目标样本为例进行说明,在判别子空间中通过K近邻分类器获取目标样本的K个近邻样本,可以理解的是,K个近邻样本中有目标样本的同类样本,也有目标样本的异类样本。计算目标样本与K个近邻样本的欧氏距离的和值,再计算目标样本与其类别矩阵的欧氏距离,取两者欧氏距离的和值,对各个样本都进行上述操作即可得到所有样本的欧氏距离和值。
S104:对所述欧氏距离和值取最小值,获得所需的投影变换矩阵。
投影变换矩阵的作用将目标样本与K个近邻样本的距离最小,并且在此基础之上,将K个近邻样本中与目标样本为同一类别的样本相互靠近,与目标样本非同一类别的样本拉远。
取欧氏距离和值最小值时对应的投影变换矩阵作为本发明所需的投影变换矩阵,欧氏距离和值最小即为各个样本与其K个近邻样本的距离之和最小,和各个样本与其类别矩阵的欧氏距离之和最小,其中各个样本与其类别矩阵的欧氏距离最小,表示各个样本的中同类样本相互靠近,异类样本相互拉远。
对欧氏距离和值取最小值后得到最终表达式,得到投影变换矩阵。
本发明提供了一种投影变换矩阵的获取方法,该方法中使用训练样本的类别标签构建类别矩阵,并根据类别矩阵加入计算投影变换矩阵中。本方法中由于类别标签能够准确的表示训练样本的类别,因此类别矩阵能够准确反应训练样本的类别。
本方法中在计算各个样本与其K个近邻样本的欧氏距离的和值的基础上,加上各个样本与类别矩阵的欧氏距离,从而获得欧氏距离和值。然后取欧氏距离和值的最小值得到投影变换矩阵,欧氏距离和值越小表示K个近邻样本越接近同类样本,其值越大表示为异类样本。
本发明取在欧氏距离和值最小的基础上,使各个样本与类别矩阵的距离越小,即使同类样本越来越近,因此本方法能够获得正确地投影变换矩阵,并很好地实现拉近同类之间距离,扩大异类之间距离的目的,进而使分类性能变好。
在上述实施例的基础之上,本发明提供了步骤S103中获取欧氏距离和值的三种实现方式,具体如下所示:
第一种方式,为将K个近邻样本进行重构的方式,如图2所示,包括以下步骤:
步骤S201:对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
步骤S202:计算各个样本与其K个重构样本的欧式距离的和值,并将其称为第一欧氏距离;
步骤S203:计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第二欧氏距离;
步骤S204:将第一欧氏距离与第二欧氏距离之和作为欧氏距离和值。
第二种方式,为增加信任度系数的方式如图3所示,包括以下步骤:
步骤S301:计算各个样本与其K个近邻样本的欧式距离的和值,并将其称为第三欧氏距离;
步骤S302:计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第四欧氏距离;
步骤S303:获取第四欧氏距离与信任度系数的第一乘积;
步骤S304:将所述第三欧氏距离与所述第一乘积的和值作为所述欧氏距离和值。
增加信任度系数为表述类别矩阵使用量,信任度系数理论上可以为任意正数,其值越大表示类别矩阵使用越多,其值越小表示类别使用越少,优选的,可以为10。使用类别信息越多,得到的效果越好,但是会增加计算量及带来其他问题。
优选的,第一种方式和第二种方式的总和,如图4所示,包括以下步骤:
步骤S401:对各个样本K个近邻样本进行重构,获得各个样本的K个重构样本;
步骤S402:计算各个样本与其K个重构样本的欧式距离的和值,并将其称为第五欧氏距离;
步骤S403:计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第六欧氏距离;
步骤S404:获取第六欧氏距离与信任度系数的第二乘积;
步骤S405:将第五欧氏距离与第二乘积的之和作为所述欧氏距离和值。
第三种方式能够具有以上两种方式的优势。
第一种方式和第三种方式中,对各个样本K个近邻样本进行重构包括:利用重构权值矩阵对K个近邻样本进行重构。
优选的,本发明上述实施例中获取重构权值矩阵的具体实现过程可以有两种实现方式,第一种实现方式S1:根据局部散度计算重构权值矩阵,第二种实现方式S2:根据总体散度计算重构权值矩阵。
采用局部散度计算得到计算重构权值矩阵时,由于局部散度中判别信息不完整,不能很好的利用判别信息构建投影变换矩阵,因此为了充分利用判别信息采用总体散度的方式构建投影变换矩阵,总体散度为局部散度与非局部散度的总和。
第一种方式:如图5所示,包括以下步骤:
步骤S501:利用虚拟的重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
步骤S502:计算各个训练样本与其K个重构训练样本的欧式距离的和值,并将其称为第七欧氏距离;
步骤S503:对所述第七欧氏距离取最小值获取所需的重构权值矩阵。
第一种方式为采用训练样本获取重构权值矩阵,由于判别子空间中的样本与训练样本仅为维数不同而已,还保持着训练样本的特性,训练样本中的重构权值矩阵能够适用于判别子空间中。
第二种方式:如图6所示,包括以下步骤:
步骤S601:利用虚拟的重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
步骤S602:计算各个训练样本与其K个重构训练样本的欧式距离的和值,并将其称为第八欧氏距离;
步骤S603:取所述重构权值矩阵的一范数;
步骤S604:取第八欧氏距离与一范数之和的最小值,获取所需的重构权值矩阵。
第二种方式在第一种方式的基础之上增加了一范数,一范数的作用为将重构权值矩阵中为零的越多,不为零的越少,使K个训练样本中与训练样本同类的参与计算,与训练样本异类的不参与计算,即忽略异类样本的作用,由此得到的重构权值矩阵更能代表各个样本的原始信息。
优选的,在步骤S101之前本发明还包括:对所述各个训练样本进行预降维处理。
现实世界中物体对应的数据维度很高,为了降低运算量先对原始训练样本进行降维处理,降维处理之后的训练样本维度较低能够更好的进行计算。
为了清楚表达本发明的实现过程,下面我们采用具体实施例进行详细表述:
(1)确定训练样本与类别信息
将训练样本集定义为
其中,yi是xi的类别标签即类别信息,c表示类别信息的数量,l表示训练样本的总个数,D表示训练样本集中的训练样本的维数;
(2)一次降维处理
为了降低运算的复杂度,提高运算速度;首先,对上述训练样本集进行随机降维,将训练样本由D维降到d维,在降维过程中,训练样本的类别信息保持不变,其中,d<D;在本实施例中d=100。
降维后的训练样本定义为:在本实施例中D=10304,l=200,c=40。
其中,d为降维后的训练样本的维数,为降维后的训练样本。
(3)构造类别矩阵
利用训练样本的标签信息,构造一个具有分类信息的矩阵即当yi=j,i=1,2,...,l时,hi的第j个分量为1,否则为0。
(4)获取重构权值矩阵
重构权值系数矩阵W可以通过求解下面的优化问题来获得:
其中的K个近邻样本。
(5)获取投影变换矩阵
为了同时考虑保持低维坐标的几何特征和训练点信息,寻找一个最优变换A,将数据集投影到相对低维的特征空间其中x'i∈Rc。引入一个具有判别信息的项,即
其中β∈(0,+∞)反映了样本对已知低维信息的信任度,控制着训练样本对数据的影响,最小化(1)式可以得到投影变换矩阵A:
其中M=(I-W)T(I-W),I为单位矩阵,H=[h1,h2,...,hl]∈Rc×l
基于上述实施例提供的投影变换矩阵获取方法,在获取投影变换矩阵之后,本发明还提供了一种样本分类方法,如图7所示,包括:
步骤S701:将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如如图1所述的方法获取的;
在得到投影变换矩阵后,可以将降维后的训练样本集映射到判别子空间中,其中,判别子空间的训练样本集具体为其中,
步骤S702:将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
优选的,在将待分类样本利用所述投影变换矩阵降维至所述判别子空间之前还包括:对所述待分类样本进行降维处理。
待测试样本定义为x,首先,对待测试样本x进行随机降维,具体方法与对训练样本集中的训练样本进行随机降维的方法相同,需要说明的是,需要降维后的待测试样本的维数与降维后的训练样本的维数相同;
即,将待测试样本的维数降到d维后,待测试样本x变为
其次,利用投影变换矩阵A将降维后的待测试样本映射到判别子空间中,从而得到判别子空间中的测试样本
步骤S703:在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
本发明提供的样本分类方法中由于使用了投影变换矩阵将训练样本和待分类样本都投影至判别子空间中,投影变换矩阵不仅对训练样本和待分类样本进行了降维处理,还拉近了同类样本之间的距离,扩大了异类样本之间的距离,使得在对待分类样本进行分类时,能够更加精确,使得分类性能更好。利用K近邻分类器,对二次降维测试样本进行分类。即在二次降维训练样本中,找到K个和二次降维测试样本相邻的样本,哪个类别的二次降维训练样本占多数,就把哪个类别赋予该测试样本。
本发明与现有技术中的邻域保持嵌入方法相比加入了判别信息,实现了有监督的学习。
如图8所示,本发明还提供了一种投影变换矩阵的获取装置,包括:
构建单元100,用于依据各个训练样本的类别标签构建类别矩阵;
第一降维单元200,用于将所述各个训练样本利用虚拟的投影变换矩阵降维至判别子空间;
计算单元300,用于在判别子空间计算所有样本的欧氏距离和值;其中,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离的和值,与加上各个样本与其类别矩阵的欧氏距离之和;
获取单元400,用于对所述欧氏距离和值取最小值,获得所需的投影变换矩阵。
如图9所示,本发明还提供了一种样本分类装置,包括:
第二降维单元500,用于将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如图1所述的方法获取的;
第三降维单元600,用于将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
分类单元700,用于在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (13)

1.一种投影变换矩阵的获取方法,其特征在于,包括:
依据各个训练样本的类别标签构建类别矩阵;
将所述各个训练样本利用虚拟的投影变换矩阵降维至判别子空间;
在所述判别子空间中计算所有样本的欧氏距离和值;其中所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离的和值,与各个样本与其类别矩阵的欧氏距离之和;
对所述所有样本的欧氏距离和值取最小值,获得所需的投影变换矩阵。
2.如权利要求1所述的方法,其特征在于,依据各个训练样本的类别标签构建类别矩阵包括:
所述类别矩阵的每一行对应一个训练样本,类别矩阵的每一列表示一个类别;
所述类别矩阵中各个样本行的类别标签列为1,其余都为0,由此构建类别矩阵。
3.如权利要求1所述的方法,其特征在于,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的欧式距离的和值,并将其称为第一欧氏距离;
计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第二欧氏距离;
将所述第一欧氏距离与所述第二欧氏距离的之和作为所述欧氏距离和值。
4.如权利要求1所述的方法,其特征在于,欧氏距离和值的获取过程包括:
计算各个样本与其K个近邻样本的欧式距离的和值,并将其称为第三欧氏距离;
计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第四欧氏距离;
获取所述第四欧氏距离与信任度系数的第一乘积;
将所述第三欧氏距离与所述第一乘积的和值作为所述欧氏距离和值。
5.如权利要求1所述的方法,其特征在于,欧氏距离和值的获取过程包括:
对各个样本的K个近邻样本进行重构,获得各个样本的K个重构样本;
计算各个样本与其K个重构样本的欧式距离的和值,并将其称为第五欧氏距离;
计算各个样本与其类别矩阵的欧式距离的和值,并将其称为第六欧氏距离;
获取所述第六欧氏距离与信任度系数的第二乘积;
将所述第五欧氏距离与所述第二乘积的之和作为所述欧氏距离和值。
6.如权利要求3或5所述的方法,其特征在于,对各个样本的K个近邻样本进行重构包括:
利用重构权值矩阵对所述K个近邻样本进行重构。
7.如权利要求6所述的方法,其特征在于,所述重构权值矩阵的获取方法包括:
利用虚拟的重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本欧式距离的和值,并将其称为第七欧氏距离;
对所述第七欧氏距离取最小值,获取所需的重构权值矩阵。
8.如权利要求6所述的方法,其特征在于,重构权值矩阵的获取方法包括:
利用虚拟的重构权值矩阵对各个训练样本的K个近邻样本进行重构,获得各个训练样本的K个重构训练样本;
计算各个训练样本与其K个重构训练样本欧式距离的和值,并将其称为第八欧氏距离;
取所述重构权值矩阵的一范数;
取第八欧氏距离与一范数之和的最小值,获取所需的重构权值矩阵。
9.如权利要求1所述的方法,其特征在于,在依据各个训练样本的类别标签构建类别矩阵之前还包括:
对所述各个训练样本进行预降维处理。
10.一种样本分类方法,其特征在于,包括:
将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
11.如权利要求10所述的方法,其特征在于,在将待分类样本利用所述投影变换矩阵降维至所述判别子空间之前还包括:
对所述待分类样本进行降维处理。
12.一种投影变换矩阵的获取装置,其特征在于,包括:
构建单元,用于依据各个训练样本的类别标签构建类别矩阵;
第一降维单元,用于将所述各个训练样本利用虚拟的投影变换矩阵降维至判别子空间;
计算单元,用于在判别子空间计算所有样本的欧氏距离和值;其中,所述欧氏距离和值为各个样本与其K个近邻样本的欧氏距离的和值,与各个样本与其类别矩阵的欧氏距离之和;
获取单元,用于对所述所有样本的欧氏距离和值取最小值,获得所需的投影变换矩阵。
13.一种样本分类装置,其特征在于,包括:
第二降维单元,用于将各个训练样本利用投影变换矩阵降维至判别子空间,所述投影变换矩阵为采用如权利要求1所述的方法获取的;
第三降维单元,用于将待分类样本利用所述投影变换矩阵降维至所述判别子空间;
分类单元,用于在所述判别子空间中利用最近邻分类器对所述待分类样本进行分类。
CN201410161914.6A 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置 Active CN103886345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410161914.6A CN103886345B (zh) 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410161914.6A CN103886345B (zh) 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置

Publications (2)

Publication Number Publication Date
CN103886345A CN103886345A (zh) 2014-06-25
CN103886345B true CN103886345B (zh) 2018-11-02

Family

ID=50955228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410161914.6A Active CN103886345B (zh) 2014-04-22 2014-04-22 投影变换矩阵的获取方法及装置、样本分类方法及装置

Country Status (1)

Country Link
CN (1) CN103886345B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832427B (zh) * 2020-06-22 2022-02-18 华中科技大学 基于欧氏对齐和Procrustes分析的EEG分类的迁移学习方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679162A (zh) * 2014-01-03 2014-03-26 苏州大学 一种人脸识别方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5410355B2 (ja) * 2010-04-13 2014-02-05 富士フイルム株式会社 行列生成装置、方法、プログラムならびに情報処理装置
CN102682089A (zh) * 2012-04-24 2012-09-19 浙江工业大学 一种利用鉴别随机邻域嵌入分析的数据降维方法
CN103577839B (zh) * 2013-11-28 2017-01-04 苏州大学 一种邻域保持判别嵌入人脸识别方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679162A (zh) * 2014-01-03 2014-03-26 苏州大学 一种人脸识别方法及系统

Also Published As

Publication number Publication date
CN103886345A (zh) 2014-06-25

Similar Documents

Publication Publication Date Title
Mustafa et al. Modelling built-up expansion and densification with multinomial logistic regression, cellular automata and genetic algorithm
Li et al. Hard drive failure prediction using decision trees
Lichti et al. Estimating utilization distributions with kernel versus local convex hull methods
Shi et al. A modified particle swarm optimizer
Ma et al. Blended biogeography-based optimization for constrained optimization
CN105912990A (zh) 人脸检测的方法及装置
Gori et al. Clustering genes of common evolutionary history
US20150278408A1 (en) Information processing apparatus and information processing method
CN108021945A (zh) 一种变压器状态评价模型建立方法及装置
CN106327468A (zh) 曲线检测方法和曲线检测装置
CN110969200A (zh) 基于一致性负样本的图像目标检测模型训练方法及装置
Tamosiunas et al. Investigating cosmological GAN emulators using latent space interpolation
US9904740B1 (en) Network of networks reconstruction employing compressed sensing
WO2024045989A1 (zh) 图网络数据集的处理方法、装置、电子设备、程序及介质
Lity et al. Optimizing product orders using graph algorithms for improving incremental product-line analysis
Kurtz et al. Disentangling microbial associations from hidden environmental and technical factors via latent graphical models
Zarei et al. Detecting community structure in complex networks using genetic algorithm based on object migrating automata
CN103488656B (zh) 一种数据处理方法及装置
CN103886345B (zh) 投影变换矩阵的获取方法及装置、样本分类方法及装置
Ambjørn et al. Shaken, but not stirred—Potts model coupled to quantum gravity
CN103870848B (zh) 投影变换矩阵的获取方法、样本分类方法
CN109815992A (zh) 一种支持向量机并行加速训练方法及系统
Zong et al. Research on data mining of sports wearable intelligent devices based on big data analysis
del Rey et al. A CA model for mobile malware spreading based on bluetooth connections
CN112883651B (zh) 基于改进pbi方法的系统级测试性设计多目标优化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190703

Address after: 610000 China (Sichuan) Free Trade Pilot Zone Chengdu High-tech Zone Jiaozi Avenue 177 Building 1 2501, 2502, 2503, 2504, 2505

Patentee after: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

Address before: 215123 199 Ren Yan Road, Suzhou Industrial Park, Jiangsu

Patentee before: Soochow University

TR01 Transfer of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for obtaining projection transformation matrix and sample classification method and device

Effective date of registration: 20191012

Granted publication date: 20181102

Pledgee: Chengdu Rural Commercial Bank Co.,Ltd. Juqiao sub branch

Pledgor: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

Registration number: Y2019510000036

PE01 Entry into force of the registration of the contract for pledge of patent right
CP03 Change of name, title or address

Address after: No.1, 12 / F, building 8, No.399, west section of Fucheng Avenue, Chengdu hi tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610015

Patentee after: Sichuan Hagong Chuangxing big data Co.,Ltd.

Address before: No. 1104, 11th floor, building 1, No. 530, middle section of Tianfu Avenue, Chengdu high tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610094

Patentee before: Harbin University of technology big data group Sichuan Co.,Ltd.

Address after: No. 1104, 11th floor, building 1, No. 530, middle section of Tianfu Avenue, Chengdu high tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610094

Patentee after: Harbin University of technology big data group Sichuan Co.,Ltd.

Address before: 610000 China (Sichuan) Free Trade Pilot Zone Chengdu High-tech Zone Jiaozi Avenue 177 Building 1 2501, 2502, 2503, 2504, 2505

Patentee before: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

CP03 Change of name, title or address
PM01 Change of the registration of the contract for pledge of patent right

Change date: 20210617

Registration number: Y2019510000036

Pledgor after: Sichuan Hagong Chuangxing big data Co.,Ltd.

Pledgor before: SICHUAN GONGDA CHUANGXING BIG DATA Co.,Ltd.

PM01 Change of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230606

Granted publication date: 20181102

Pledgee: Chengdu Rural Commercial Bank Co.,Ltd. Juqiao sub branch

Pledgor: Sichuan Hagong Chuangxing big data Co.,Ltd.

Registration number: Y2019510000036

PC01 Cancellation of the registration of the contract for pledge of patent right