CN110717854B - 一种图像降维方法 - Google Patents
一种图像降维方法 Download PDFInfo
- Publication number
- CN110717854B CN110717854B CN201910959811.7A CN201910959811A CN110717854B CN 110717854 B CN110717854 B CN 110717854B CN 201910959811 A CN201910959811 A CN 201910959811A CN 110717854 B CN110717854 B CN 110717854B
- Authority
- CN
- China
- Prior art keywords
- image
- dimension reduction
- matrix
- subspace
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 230000009467 reduction Effects 0.000 title claims abstract description 86
- 239000011159 matrix material Substances 0.000 claims abstract description 73
- 239000013598 vector Substances 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像降维方法,包括:获取样本图像的图像空间;采用比迹降维的方法对图像空间进行降维处理得到投影矩阵;将待识别的图像通过投影矩阵投影到图像子空间;采用分类器对投影到图像子空间的待识别图像进行识别。本申请通过比迹降维的方法获取投影矩阵,使得能够最大效率的呈现数据的有用信息,提高降维的准确性。
Description
技术领域
本申请涉及数据降维技术领域,尤其涉及一种图像降维方法。
背景技术
随着大数据时代的到来,数据量巨增,数据维度不断升高。而在数据的高维空间中,往往会包含许多冗余,其本质维度往往比原始的数据维度要小的多,因此高维数据的处理问题可以归结为通过相关的降维方法减少一些不太相关的数据而降低它的维数,然后用低维数据的处理办法进行处理。实践表明,在数据分析前先对其特征进行降维是避免“维数灾难”的有效手段。也因此,降维方法也成为了近年来人们所研究的热点。
发明内容
本申请实施例提供了一种图像降维方法,使得能够最大效率的呈现数据的有用信息,提高降维的准确性。
有鉴于此,本申请第一方面提供了一种图像降维方法,所述方法包括:
获取样本图像的图像空间;
采用比迹降维的方法对图像空间进行降维处理得到投影矩阵;
将待识别的图像通过投影矩阵投影到图像子空间;
采用分类器对投影到图像子空间的待识别图像进行识别。
优选地,将所述获取样本图像的图像空间具体为:
优选地,所述采用比迹降维的方法对图像空间进行降维处理得到图像子空间具体为:
获取降维处理的目标函数;
采用正交局部投影的方法求解目标函数,得到投影矩阵。
优选地,所述目标函数具体为:
优选地,所述采用正交局部投影的方法求解目标函数具体为:
将采用拉格朗日乘子法得到公式求偏导并经过变换得到关于特征向量的求解公式:
则wk是{I-Sw -1wk-1[Hk-1][wk-1]T}Sw -1Sb的最大特征值对应的特征向量;
根据特征向量得到对应的投影矩阵;
其中β表示拉格朗日乘子,I代表单位向量。
优选地,所述将待识别的图像通过投影矩阵投影到图像子空间具体为:
在求解出投影矩阵W后,通过公式Y=WTX,将待识别的图像投影到子空间;其中,X代表待识别的图像,Y代表投影到图像子空间后图像。
优选地,所述采用分类器对投影到图像子空间的待识别图像进行识别具体为:
将投影到图像子空间的待识别图像输入到分类器中,得到分类结果。
本申请第二方面提供一种图像降维装置,所述装置包括:
样本获取单元,所述样本获取单元用于获取样本图像的图像空间;
降维处理单元,所述降维处理单元用于采用比迹降维的方法对图像空间进行降维处理得到投影矩阵;
投影单元,所述投影单元用于将待识别的图像通过投影矩阵投影到图像子空间;
识别单元,所述识别单元采用分类器对投影到图像子空间的待识别图像进行识别。
本申请第三方面提供一种图像降维设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的一种图像降维方法的步骤。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:本身请提供了一种图像降维方法,包括获取样本图像的图像空间;采用比迹降维的方法对图像空间进行降维处理得到投影矩阵;将待识别的图像通过投影矩阵投影到图像子空间;采用分类器对投影到图像子空间的待识别图像进行识别。本申请通过比迹降维的方法获取投影矩阵,使得能够最大效率的呈现数据的有用信息,提高降维的准确性。
附图说明
图1为本申请一种图像降维方法的一个实施例的方法流程图;
图2为本申请一种图像降维方法的另一个实施例的方法流程图;
图3为本申请一种图像降维装置的一个实施例的结构示意图;
图4为本申请一种图像降维方法与fisherface(PCA+LDA)和trace ratio 两降维方法在每类训练样本为5时的降低维度与错误率曲线图;
图5为本申请一种图像降维方法与fisherface(PCA+LDA)和trace ratio 两降维方法在每类训练样本为10时的降低维度与错误率曲线图;
图6为本申请一种图像降维方法与fisherface(PCA+LDA)和trace ratio 两降维方法在每类训练样本为20时的降低维度与错误率曲线图;
图7为本申请一种图像降维方法与fisherface(PCA+LDA)和trace ratio 两降维方法在每类训练样本为30时的降低维度与错误率曲线图。
具体实施方式
本申请通过比迹降维的方法获取投影矩阵,使得能够最大效率的呈现数据的有用信息,提高降维的准确性。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,图1为本申请一种图像降维方法的一个实施例的方法流程图,如图1所示,图1中包括:
101、获取样本图像的图像空间。
需要说明的是,其中的样本图像为训练图像样本,将图像样本转换成样本矩阵,并获取样本对应的标签,构成标签矩阵,从而可以得到样本矩阵的类间散度矩阵和类内散度矩阵。
102、采用比迹降维的方法对图像空间进行降维处理得到投影矩阵。
需要说明的是,采用比迹降维的方法可以通过正交局部投影的方法求解目标函数得到对应的特征向量,从而得到投影矩阵。
103、将待识别的图像通过投影矩阵投影到图像子空间。
需要说明的是,将待识别的图像经过投影矩阵进行投影,投影到相应的图像子空间,从而实现对待识别图像进行降维。
104、采用分类器对投影到图像子空间的待识别图像进行识别。
本申请通过比迹降维的方法获取投影矩阵,使得能够最大效率的呈现数据的有用信息,提高降维的准确性。
为了进一步的理解本申请的技术方案,可以参照图2,图2为本申请一种图像降维方法的另一个实施例的方法流程图,包括:
201、获取样本图像的图像空间。
需要说明的是,其中的样本图像为训练图像样本,将图像样本转换成样本矩阵,并获取样本对应的标签,构成标签矩阵,从而可以得到样本矩阵的类间散度矩阵和类内散度矩阵。在具体的实施例中,可以将图像样本转换成样本矩阵样本矩阵即为图像空间;n代表样本个数;其相应的标签为xi表示第i个样本,m表示样本数,cj表示第j 个类别,nc代表的是类别的个数。可以求得样本矩阵的类间散度矩阵Sb和类内散度矩阵Sw。
202、获取降维处理的目标函数;采用正交局部投影的方法求解目标函数,得到投影矩阵。
需要说明的是,获取降维处理的目标函数具体为:
其中,wk表示最大特征值对应的特征向量,k表示降维之后的维度,wkT表示wk的转置矩阵。
采用正交局部投影的方法求解目标函数,得到投影矩阵具体为:
当k=1时;
其中β和δ表示拉格朗日乘子。
将求偏导后的公式的左侧乘以Sw -1可以得到:
2Sw -1Sbwk-2βwk-δ1Sw -1w1-…-δk-1Sw -1wk-1=0
则wk是{I-Sw -1wk-1[Hk-1][wk-1]T}Sw -1Sb的最大特征值对应的特征向量;采用迭代的方法得到k组正交基向量,即:
当k=1时,上式变为Sw -1Sbw1=λw1,即为求Sw -1Sb的最大特征值所对应的特征向量,为w1;
当k=2时,则对应的[I-Sw -1wk-1[Hk-1][(wk-1)T]]Sw -1Sb的最大特征值所对应的特征向量为w2;
依次迭代最后求得wk为[I-Sw -1wk-1[Hk-1][(wk-1)T]]Sw -1Sb在k=k时的最大特征值对应的特征向量。
最后w=[w1,w2,…,wk],为得到的投影矩阵。
其中,I代表单位向量,wk的每一列代表数据的一个投影方向。
203、将待识别的图像通过投影矩阵投影到图像子空间。
需要说明的是,将待识别的图像通过投影矩阵投影到图像子空间具体为:在求解出投影矩阵W后,通过公式Y=WTX,将待识别的图像投影到子空间;其中,X代表待识别的图像,Y代表投影到图像子空间后图像。
204、将投影到图像子空间的待识别图像输入到分类器中,得到分类结果。
本申请基于正交局部投影通过对投影矩阵增加正交约束,使得在降维后依然保留数据的原始欧几里得结构,再利用迭代的方法对投影矩阵进行求解,可以使所有投影方向达到最优,从而提高了降维的性能。
另外,本申请还提供了一种具体的实施例,并获取该实施例的实验数据,如下所示:首先,将一张大小为n*m的面部图像被表示为图像空间中的矢量(例如:像素为32*32的图像可以表示为矢量),因此,每个图像由 1024维表示,然后重构该向量,使其变为R1*1024。
采用的是COIL-20数据库对分类器进行训练:其中COIL-20包含来自20 个科目的1440灰度图像,每个物体水平旋转360°,每隔5°拍摄/拍摄一张照片,因此每个物体总共有72张图像,每幅图像的尺寸为32x 32像素,每像素 256个灰度级。得到的样本集的尺寸为1400*1024,可以得到了一个1400*1024 的矩阵(每一列代表一个样本)。
分别将本申请中的方案ratio trace与fisherface(PCA+LDA)和trace ratio 两种经典的降维方法进行对比,得到每类训练样本为5,10,20,30时的降低维度与错误率曲线,如图4-图7所示,可以得到在现实生活场景中的实际应用中,譬如人脸识别,文本分类等等,当数据集中样本方差偏小甚至为零的时候,本发明所提出的比迹方法会取得更佳的效果。
本申请还提供了一种图像降维装置,如图3所示,图3为本申请一种图像降维装置的一个实施例的结构示意图,包括:
样本获取单元301,用于获取样本图像的图像空间。
降维处理单元302,用于采用比迹降维的方法对图像空间进行降维处理得到投影矩阵。
投影单元303,用于将待识别的图像通过投影矩阵投影到图像子空间。
识别单元304,采用分类器对投影到图像子空间的待识别图像进行识别。
本实施例通过比迹降维的方法获取投影矩阵,使得能够最大效率的呈现数据的有用信息,提高降维的准确性。
本申请实施例还提供了一种图像降维设备,包括处理器以及存储器,其中存储器用于存储程序代码,并将程序代码传输给处理器;处理器用于根据所述程序代码中的指令执行一种图像降维方法。
本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例所述的一种图像降维方法中的任意一种实施方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b 或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称: Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称: Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (8)
4.根据权利要求1所述的一种图像降维方法,其特征在于,所述将待识别的图像通过投影矩阵投影到图像子空间具体为:
在求解出投影矩阵W后,通过公式Y=WTX,将待识别的图像投影到子空间;其中,X代表待识别的图像,Y代表投影到图像子空间后图像。
5.根据权利要求1所述的一种图像降维方法,其特征在于,所述采用分类器对投影到图像子空间的待识别图像进行识别具体为:
将投影到图像子空间的待识别图像输入到分类器中,得到分类结果。
7.一种图像降维设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-5任一项所述的一种图像降维方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-5任一项所述的一种图像降维方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910959811.7A CN110717854B (zh) | 2019-10-10 | 2019-10-10 | 一种图像降维方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910959811.7A CN110717854B (zh) | 2019-10-10 | 2019-10-10 | 一种图像降维方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110717854A CN110717854A (zh) | 2020-01-21 |
CN110717854B true CN110717854B (zh) | 2023-05-09 |
Family
ID=69211343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910959811.7A Active CN110717854B (zh) | 2019-10-10 | 2019-10-10 | 一种图像降维方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717854B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298149B (zh) * | 2021-05-25 | 2022-02-01 | 广东云曌医疗科技有限公司 | 图像聚类方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005101298A2 (en) * | 2004-04-14 | 2005-10-27 | Imperial Innovations Limited | Estimation of within-class matrix in image classification |
CN101916376A (zh) * | 2010-07-06 | 2010-12-15 | 浙江大学 | 基于局部样条嵌入的正交半监督子空间图像分类方法 |
CN106874841A (zh) * | 2016-12-30 | 2017-06-20 | 陕西师范大学 | 基于正则化局部保持投影的sar变形目标识别方法 |
-
2019
- 2019-10-10 CN CN201910959811.7A patent/CN110717854B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005101298A2 (en) * | 2004-04-14 | 2005-10-27 | Imperial Innovations Limited | Estimation of within-class matrix in image classification |
CN101916376A (zh) * | 2010-07-06 | 2010-12-15 | 浙江大学 | 基于局部样条嵌入的正交半监督子空间图像分类方法 |
CN106874841A (zh) * | 2016-12-30 | 2017-06-20 | 陕西师范大学 | 基于正则化局部保持投影的sar变形目标识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110717854A (zh) | 2020-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106777318B (zh) | 基于协同训练的矩阵分解跨模态哈希检索方法 | |
Shakeel et al. | Deep-feature encoding-based discriminative model for age-invariant face recognition | |
Wang et al. | Unsupervised feature selection via unified trace ratio formulation and k-means clustering (track) | |
US7263243B2 (en) | Method of image registration using mutual information | |
US9691003B2 (en) | Keypoint descriptor generation by complex wavelet analysis | |
JP2005512201A5 (zh) | ||
US9247139B2 (en) | Method for video background subtraction using factorized matrix completion | |
CN110619367B (zh) | 联合低秩约束跨视角判别子空间学习方法及装置 | |
JP2005512201A (ja) | カーネルフィッシャーフェイスを使用した顔認識 | |
CN105069424A (zh) | 面部快速识别系统和方法 | |
Chen et al. | Solving partial least squares regression via manifold optimization approaches | |
JP2004152297A (ja) | 複数のキューを統合するための方法及びシステム | |
WO2016142285A1 (en) | Method and apparatus for image search using sparsifying analysis operators | |
Zaeemzadeh et al. | Iterative projection and matching: Finding structure-preserving representatives and its application to computer vision | |
Ma et al. | FAST: Fast and accurate scale estimation for tracking | |
CN110717854B (zh) | 一种图像降维方法 | |
Ahn et al. | Dynamic background subtraction with masked RPCA | |
Li et al. | Data-driven ranking and selection: High-dimensional covariates and general dependence | |
Hoang et al. | Simultaneous compression and quantization: A joint approach for efficient unsupervised hashing | |
Belabbas et al. | On landmark selection and sampling in high-dimensional data analysis | |
EP3166022A1 (en) | Method and apparatus for image search using sparsifying analysis operators | |
Bunte et al. | Dimensionality reduction mappings | |
Huo et al. | Ensemble of sparse cross-modal metrics for heterogeneous face recognition | |
CN111667495A (zh) | 一种图像场景解析方法和装置 | |
Kim et al. | Robust elastic-net subspace representation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |