CN113657358A - 数据图像的非负特征表示和识别方法、装置、设备及介质 - Google Patents

数据图像的非负特征表示和识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN113657358A
CN113657358A CN202111223119.1A CN202111223119A CN113657358A CN 113657358 A CN113657358 A CN 113657358A CN 202111223119 A CN202111223119 A CN 202111223119A CN 113657358 A CN113657358 A CN 113657358A
Authority
CN
China
Prior art keywords
matrix
data
image
data image
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111223119.1A
Other languages
English (en)
Other versions
CN113657358B (zh
Inventor
李洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xinshizhi Technology Co ltd
Original Assignee
Shenzhen Xinshizhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xinshizhi Technology Co ltd filed Critical Shenzhen Xinshizhi Technology Co ltd
Priority to CN202111223119.1A priority Critical patent/CN113657358B/zh
Publication of CN113657358A publication Critical patent/CN113657358A/zh
Application granted granted Critical
Publication of CN113657358B publication Critical patent/CN113657358B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种核锥体约束数据图像的非负特征的表示和识别方法、装置、设备及介质,所述方法包括:将训练样本的矩阵投影到核特征空间当中,使用F范数度量矩阵分解的损失,通过加入对锥体约束的核锥体正则项,从而构建了目标函数F(P,H);将目标函数F(P,H)转化为两个凸子优化问题,通过KKT条件求解两个子优化问题得到矩阵分解的更新迭代公式;进一步的还包括了基于上述目标函数的构建以及矩阵分解的更新迭代的训练步骤和识别步骤。本发明可以提高数据图像非负特征表示的准确性。

Description

数据图像的非负特征表示和识别方法、装置、设备及介质
技术领域
本发明涉及特征识别技术领域,尤其涉及一种核锥体约束数据图像的非负特征的表示和识别方法、装置、计算机设备、及计算机可读存储介质。
背景技术
特征识别技术主要包含两个阶段,第一阶段是提取数据图像中关键的特征信息,提取的图像特征信息质量决定了图像识别技术的好坏,第二阶段是利用提取的特征信息,对未知数据样本进行分类。主成分分析(PCA)和局部保持投影(LPP)是经典的特征提取方法。但是经过这些方法提取的特征信息通常存在负数,对于原始非负数据图像提取到存在负分量的特征信息,其算法的可解释性较差。
非负矩阵分解(NMF)是能有效的提取非负数据的特征,该方法被广泛的应用在图像识别,数据压缩,高光谱成像等任务中,其目的是将非负数据矩阵X近似的分解成非负的基图像矩阵W和非负的特征矩阵H的乘积,即
Figure 823269DEST_PATH_IMAGE001
。经过分解后,数据矩阵X的每一列可以由基图像矩阵的列向量线性组合而成,即
Figure 209251DEST_PATH_IMAGE002
。这也使得NMF算法具有更好的合理性解释,即对于整体的感知,是由部分感知线性组合而成。但非负矩阵分解没有对基图像矩阵W进行约束,存在识别率低,鲁棒性差等缺点。就此,不少学者提出了改进NMF方法,例如大锥非负矩阵分解(LCNMF)。比如大锥非负矩阵分解方法,其目的在于对基图像矩阵进行约束,使得更多的数据样本点落入到适当的锥体空间当中,从而提升非负矩阵分解算法的泛化能力。大锥非负矩阵分解方法有两种度量的方式,即大容量非负矩阵分解(LVNMF)和大角度非负矩阵分解(LANMF)。大锥非负矩阵分解和非负矩阵分解算法相比有如下的优点:(1)能收敛到一个较好的局部极小值点;(2)在训练数据和测试数据中,大锥非负矩阵分解具有更好的泛化能力和较小的重构误差。
然而,非负矩阵分解和大锥非负矩阵分解都是线性特征提取方法。在实际场景中,图像数据在模式空间分布往往十分复杂,常呈现出非线性性。采用线性方法处理非线性数据往往存在着识别率较差等缺点。为了处理数据图像中存在的非线性问题可以采用核方法(Kernal method)。核方法的思想是通过非线性映射将原始数据投影到再生核希尔伯特空间(RKHS)中,使得投影后的数据线性可分。核方法的关键是核技巧(Kernal trick),其思想是通过使用核函数表示被映射函数的内积,而不需要考虑非线性映射的具体表现形式;利用核方法,传统的非负矩阵分解可以推广为核非负矩阵分解(KNMF)。KNMF的思想是通过使用非线性映射
Figure 457830DEST_PATH_IMAGE003
,将原特征空间中的数据矩阵X映射到高维特征空间中,映射后的数据矩阵为
Figure 321881DEST_PATH_IMAGE004
,接着在高维特征空间中对被映射的矩阵
Figure 605094DEST_PATH_IMAGE005
进行NMF算法,使其近似分解成
Figure 896398DEST_PATH_IMAGE006
H矩阵的乘积,即
Figure 632273DEST_PATH_IMAGE007
,其中W是原像矩阵,H是特征矩阵,同时保证原像矩阵和特征矩形的非负性。常见的KNMF有多项式核非负矩阵分解(PNMF)和高斯核非负矩阵分解(RBFNMF)。但是核非负矩阵分解方法没有对基图像矩阵或特征矩阵进行约束,存在鲁棒性差等缺点。
NMF算法没有对基图像矩阵进行任何约束,因此在训练样本和测试样本中存在重构误差大,鲁棒性低等特点;大角度非负矩阵分解对基图像矩阵进行了约束,使锥体的角度更大,但是大角度非负矩阵分解是线性特征提取方法,由于实际的数据分布复杂,往往呈现出非线性性,使用线性的方法解决非线性问题,算法的识别率会受到影响。多项式核非负矩阵分解将原始数据投影到再生核希尔博特征空间中,并对投影后的矩阵进行非负矩阵分解,但是该方法没有对原像矩阵进行约束,因此存在着鲁棒性差,识别率低等特点。
发明内容
基于此,有必要针对上述问题,提出了一种核锥体约束数据图像的非负特征的表示和识别方法、装置、计算机设备、及计算机可读存储介质。
在本发明的第一部分,提供了一种核锥体约束数据图像的非负特征的表示和识别方法,所述方法包括:
将训练样本对应的数据矩阵投影到核特征空间当中,使用F范数度量矩阵分解后的损失,加入核锥体正则项进行约束,构建目标函数
Figure 300015DEST_PATH_IMAGE008
将目标函数
Figure 437735DEST_PATH_IMAGE008
转化为两个凸子优化问题,通过KKT条件获得矩阵分解的更新迭代公式,其中,更新迭代公式包括系数矩阵P和特征矩阵H的更新迭代公式;
基于系数矩阵P计算待识别数据图像y的特征向量
Figure 899941DEST_PATH_IMAGE009
,计算待识别数据图像的特征向量
Figure 123112DEST_PATH_IMAGE009
与每一类训练样本的平均特征向量
Figure 328965DEST_PATH_IMAGE010
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类。
可选的,所述通过KKT条件获得矩阵分解的更新迭代公式的步骤,还包括:通过KKT条件获取系数矩阵P的第一更新迭代公式和特征矩阵H的第二更新迭代公式。
可选的,所述特征矩阵H的第二更新迭代公式为
Figure 321192DEST_PATH_IMAGE011
,所述系数矩阵P的第一更新迭代公式为
Figure 219878DEST_PATH_IMAGE012
,其中,X是训练样本对应的数据矩阵,H是特征矩阵,P是系数矩阵,
Figure 930345DEST_PATH_IMAGE013
是将训练样本投影到核特征空间当中的核数据矩阵,且该核数据矩阵的元素为
Figure 674310DEST_PATH_IMAGE014
,
Figure 798341DEST_PATH_IMAGE015
是正则项参数。
可选的,所述基于系数矩阵P计算待识别数据图像y的特征向量
Figure 602349DEST_PATH_IMAGE009
的步骤,还包括:根据公式
Figure 534533DEST_PATH_IMAGE016
,计算待识别数据图像y的特征向量
Figure 82189DEST_PATH_IMAGE009
所述计算待识别数据图像的特征向量
Figure 49008DEST_PATH_IMAGE009
与每一类训练样本的平均特征向量
Figure 289496DEST_PATH_IMAGE010
之间的距离的步骤,还包括:根据公式
Figure 708976DEST_PATH_IMAGE017
计算第j类训练样本的平均特征向量
Figure 60323DEST_PATH_IMAGE018
;其中,
Figure 881649DEST_PATH_IMAGE019
Figure 293038DEST_PATH_IMAGE020
Figure 199815DEST_PATH_IMAGE021
c表示训练样本类别的数量,
Figure 89273DEST_PATH_IMAGE022
是一个维度为
Figure 30684DEST_PATH_IMAGE023
的全1列向量。
可选的,所述方法还包括:
获取训练样本,将其转化为数据矩阵X,利用核函数将数据矩阵X投影到高维的核特征空间当中;
确定迭代误差
Figure 612975DEST_PATH_IMAGE024
、最大迭代次数
Figure 7048DEST_PATH_IMAGE025
初始化特征矩阵H和系数矩阵P
通过特征矩阵H的第二更新迭代公式更新特征矩阵H,其中,当目标函数
Figure 700197DEST_PATH_IMAGE008
满足
Figure 230536DEST_PATH_IMAGE026
,或对特征矩阵H的更新迭代次数达到最大迭代次数
Figure 983728DEST_PATH_IMAGE025
,停止对特征矩阵H的迭代并输出矩阵H
通过系数矩阵P的第一更新迭代公式更新系数矩阵P,其中,当目标函数
Figure 865096DEST_PATH_IMAGE008
满足
Figure 361937DEST_PATH_IMAGE027
,或对系数矩阵P的更新迭代次数达到最大迭代次数
Figure 12361DEST_PATH_IMAGE028
,停止对系数矩阵P的迭代并输出系数矩阵P
可选的,所述基于系数矩阵P计算待识别数据图像y的特征向量
Figure 670875DEST_PATH_IMAGE009
,计算待识别数据图像的特征向量
Figure 39540DEST_PATH_IMAGE029
与每一类训练样本的平均特征向量
Figure 74492DEST_PATH_IMAGE010
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类的步骤,还包括:
计算待识别数据图像的特征向量
Figure 845002DEST_PATH_IMAGE009
与每一类训练样本的平均特征向量
Figure 674418DEST_PATH_IMAGE010
之间的距离;
确定距离最小的平均特征向量
Figure 530378DEST_PATH_IMAGE030
对应的训练样本的类别,将待识别数据图像y判定为第q 类,其中,
Figure 369021DEST_PATH_IMAGE031
在本发明的第二部分,提供了一种核锥体约束数据图像的非负特征的表示和识别装置,所述装置包括:
目标函数构建模块,用于将训练样本对应的数据矩阵投影到核特征空间当中,使用F范数度量矩阵分解后的损失,加入核锥体正则项进行约束,构建目标函数
Figure 728458DEST_PATH_IMAGE008
更新迭代公式计算模块,用于将目标函数
Figure 994355DEST_PATH_IMAGE008
转化为两个凸子优化问题,通过KKT条件获得矩阵分解的更新迭代公式,其中,更新迭代公式包括系数矩阵P和特征矩阵H的更新迭代公式;
图像识别模块,用于基于系数矩阵P计算待识别数据图像y的特征向量
Figure 72032DEST_PATH_IMAGE009
,计算待识别数据图像的特征向量
Figure 714366DEST_PATH_IMAGE029
与每一类训练样本的平均特征向量
Figure 193889DEST_PATH_IMAGE010
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类。
在本发明的第三部分,提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器有可执行代码,当所述可执行代码在所述处理器上运行以实现如本发明的第一部分所述的核锥体约束数据图像的非负特征的表示和识别方法。
在本发明的第四部分,提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行如本发明的第一部分所述的核锥体约束数据图像的非负特征的表示和识别方法。
采用本发明实施例,具有如下有益效果:
采用了上述核锥体约束数据图像的非负特征的表示和识别方法、装置、计算机设备、计算机可读存储介质之后,首先根据数据图像样本构建的训练样本矩阵,并将其投影到高维核特征空间中,使用F范数度量矩阵分解的损失并加入了对锥体角度约束的核锥体正则项从而构建了矩阵分解的目标函数。将目标函数转化为两个凸子优化问题,利用KKT条件求解两个子优化问题得到了关于系数矩阵P和特征矩阵H的更新迭代公式。在数据图像的识别过程中,基于系数矩阵P计算待识别数据图像的特征向量
Figure 630686DEST_PATH_IMAGE009
,和每一类训练样本的平均特征向量
Figure 195660DEST_PATH_IMAGE010
,并计算待识别数据图像的特征向量
Figure 376106DEST_PATH_IMAGE009
与训练样本的平均特征向量
Figure 506873DEST_PATH_IMAGE010
之间的距离,如果
Figure 114571DEST_PATH_IMAGE029
与第q类训练样本的平均特征向量距离最近,则将待识别数据图像归为第q类。在上述数据图像的非负特征特征的表示和识别方法中,将数据图像投影到高维再生核希尔博特征空间中,使得矩阵的非负特征表示的算法提升处理非线性数据的能力,并且,通过增加核椎体正则项对基图像矩阵进行约束,以提高数据图像的识别率,以及数据图像识别的鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中核锥体约束数据图像的非负特征矩阵分解过程的流程示意图;
图2为一个实施例中核锥体约束数据图像的非负特征矩阵分解过程的训练步骤的流程示意图;
图3为一个实施例中核锥体约束数据图像的非负特征矩阵分解过程的识别步骤的流程示意图;
图4为一个实施例中一种核锥体约束数据图像的非负特征的表示和识别方法的流程示意图;
图5为一个实施例中一种核锥体约束数据图像的非负特征的表示和识别方法的流程示意图;
图6为一个实施例中核锥体约束数据图像的非负特征的表示和识别方法的收敛实验数据示意图;
图7为一个实施例中一种核锥体约束数据图像的非负特征的表示和识别装置的结构示意图;
图8为一个实施例中运行上述核锥体约束数据图像的非负特征的表示和识别方法的计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本实施例公开了一种核锥体约束数据图像的非负特征的表示和识别方法、装置及计算机设备,以通过自构核锥体正则项用于增强数据图像的识别性能。
在描述上述核锥体约束数据图像的非负特征的表示和识别方法之前,先对非负矩阵分解的多种方法进行描述。
1. 非负矩阵分解
假设非负数据矩阵X,它的维度分别是
Figure 166841DEST_PATH_IMAGE032
。非负矩阵分解需要求解的最优化问题为:
Figure 885398DEST_PATH_IMAGE033
通过梯度下降法求解上述最优化问题,其更新公式为:
Figure 339513DEST_PATH_IMAGE034
其中,
Figure 118114DEST_PATH_IMAGE035
Figure 657679DEST_PATH_IMAGE036
分别表示矩阵的元素乘法和矩阵的元素除法。S是一个对角矩阵,其元素为
Figure 179928DEST_PATH_IMAGE037
2. 大角度非负矩阵分解(LANMF)
LANMF采用了大角度正则项对基图像矩阵进行约束,该正则项为
Figure 488549DEST_PATH_IMAGE039
。其中,B是一个对称矩阵,其元素为
Figure 438051DEST_PATH_IMAGE040
Figure 199333DEST_PATH_IMAGE041
表示的是哈达玛积。采用F范数度量矩阵分解后的损失,同时使得矩阵B的每一列的元素均为1,那么大角度非负矩阵分解的目标函数为
Figure 525272DEST_PATH_IMAGE042
将目标函数转化为两个子优化问题,利用梯度下降法和投影梯度法对子优化问题进行求解,LANMF的迭代公式分别如下
Figure 688400DEST_PATH_IMAGE043
其中,
Figure 808803DEST_PATH_IMAGE044
Figure 322961DEST_PATH_IMAGE045
3. 核非负矩阵分解(KNMF)
假设存在非负数据样本
Figure 187012DEST_PATH_IMAGE046
和非线性映射
Figure 204647DEST_PATH_IMAGE047
,核非负矩阵分解的目的是将在原特征空间中的数据矩阵X投影到高维特征空间当中,并在高维特征空间中对被映射后的数据矩阵
Figure 761530DEST_PATH_IMAGE048
使用非负矩阵分解,即
Figure 497405DEST_PATH_IMAGE049
,其中,矩阵W是原像矩阵,矩阵H是特征矩阵。
KNMF的优化问题如下:
Figure 165146DEST_PATH_IMAGE050
,利用梯度下降法分别求解在固定矩阵WH下的优化问题,可以得到KNMF的迭代公式:
Figure 37287DEST_PATH_IMAGE051
其中,B是对角矩阵,其对角线上的元素为
Figure 765072DEST_PATH_IMAGE052
Figure 988243DEST_PATH_IMAGE053
Figure 194096DEST_PATH_IMAGE054
,矩阵S是对原像矩阵W归一化,其元素为
Figure 186323DEST_PATH_IMAGE055
在本实施例中,首先对于核锥体约束数据图像的非负特征分解进行描述。
假设获取了n个非负训练样本(即n个类的训练样本),其对应的非负的数据矩阵可以写成
Figure 85009DEST_PATH_IMAGE056
。通过非线性映射
Figure 529897DEST_PATH_IMAGE057
,把训练样本矩阵X投影到再生核希尔博特征空间中,被映射的矩阵可以表示为
Figure 539441DEST_PATH_IMAGE058
。在高维特征空间中使用非负矩阵分解算法作用在被映射的数据矩阵中,可以得到:
Figure 651754DEST_PATH_IMAGE059
Figure 444043DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
,其中
Figure 110647DEST_PATH_IMAGE062
。其中,H为特征矩阵。
在本实施例中,为了提高核非负矩阵分解的分类能力,构建了如下的核锥体角度正则项:
Figure 658303DEST_PATH_IMAGE063
。将核锥体角度正则项加入到核非负矩阵分解的损失函数中,构成了如下目标函数:
Figure 625122DEST_PATH_IMAGE064
其中,
Figure 600032DEST_PATH_IMAGE065
a是用于平衡核锥体角度正则项和损失函数的参数,
Figure 285091DEST_PATH_IMAGE066
为Frobenius范数。
根据再生核空间理论,任何一个最优解
Figure 636438DEST_PATH_IMAGE067
会落在由所有训练样本
Figure 457763DEST_PATH_IMAGE068
张成的特征空间中,从而可以得到:
Figure 869153DEST_PATH_IMAGE069
进一步用矩阵形式进行表达,得到:
Figure 775929DEST_PATH_IMAGE070
其中,P为系数矩阵。
从而可以得到如下目标函数:
Figure 665388DEST_PATH_IMAGE071
其中,
Figure 606799DEST_PATH_IMAGE072
在上述损失函数中,
Figure 923511DEST_PATH_IMAGE073
Figure 317583DEST_PATH_IMAGE074
的内积可以使用核函数
Figure 10733DEST_PATH_IMAGE075
进行计算,例如
Figure 9913DEST_PATH_IMAGE076
。给定两个矩阵AB,列数分别是
Figure 763105DEST_PATH_IMAGE077
Figure 441211DEST_PATH_IMAGE078
,记
Figure 672472DEST_PATH_IMAGE079
是一个大小为
Figure 322896DEST_PATH_IMAGE080
的矩阵,其元素为
Figure 246990DEST_PATH_IMAGE081
Figure 615655DEST_PATH_IMAGE082
Figure 650607DEST_PATH_IMAGE083
分别代表的是矩阵A的第i列和矩阵B的第j列。
在本实施例中,综上所述,核锥体非负矩阵分解可以转换成求如下解优化问题:
Figure 155537DEST_PATH_IMAGE084
考虑到上述问题同时对两个未知矩阵PH来说不是凸优化问题。但是如果只固定其中一个矩阵PH,求解另外一个矩阵HP时目标函数是凸优化问题。因此,上述的优化问题可以转换成下面两个凸子优化问题,即:
Figure 250532DEST_PATH_IMAGE085
Figure 106493DEST_PATH_IMAGE086
其中,
Figure 679557DEST_PATH_IMAGE087
Figure 304573DEST_PATH_IMAGE088
分别是固定矩阵PH
Figure 570469DEST_PATH_IMAGE089
基于上述优化问题的获取,可以进一步的得到核锥体约束数据图像的非负特征的更新迭代公式。
具体的,对于子优化问题
Figure 648147DEST_PATH_IMAGE091
,构造拉格朗日函数
Figure 290481DEST_PATH_IMAGE092
为:
Figure 770003DEST_PATH_IMAGE094
其中,
Figure 206801DEST_PATH_IMAGE095
是与矩阵H维度相同的拉格朗日乘子矩阵。令
Figure 771775DEST_PATH_IMAGE096
,可以得到:
Figure 686641DEST_PATH_IMAGE098
使用KKT互补松弛条件
Figure 286250DEST_PATH_IMAGE099
,可以得到:
Figure 893948DEST_PATH_IMAGE101
从而可以进一步得到关于特征矩阵H的迭代公式:
Figure 946218DEST_PATH_IMAGE103
对于子优化问题
Figure 664775DEST_PATH_IMAGE104
,定义拉格朗日函数
Figure 118890DEST_PATH_IMAGE105
为:
Figure 897491DEST_PATH_IMAGE107
其中,
Figure 437056DEST_PATH_IMAGE108
是与矩阵P维度相同的拉格朗日乘子矩阵。令
Figure 959305DEST_PATH_IMAGE110
,即
Figure 267926DEST_PATH_IMAGE112
经过计算,可以得到:
Figure 217428DEST_PATH_IMAGE114
使用KKT互补松弛条件
Figure 978710DEST_PATH_IMAGE116
,可以得到
Figure 304649DEST_PATH_IMAGE118
进一步可以得到系数矩阵P的迭代公式:
Figure 467777DEST_PATH_IMAGE119
综上所述,上述核锥体角度正则项与非负矩阵分解结合的算法的更新迭代公式为:
Figure 588180DEST_PATH_IMAGE120
上述实施例给出了在核锥体空间的非负特征在人脸图像对应的训练样本矩阵中的训练过程进行了说明,根据上述内容,可以得到系数矩阵P和特征矩阵H
在获取到了系数矩阵P以及特征矩阵H之后,需要进一步的对待识别数据图像进行特征提取。
假设y为待识别数据图像,通过使用非线性映射
Figure 102338DEST_PATH_IMAGE121
将待识别数据图像投影到高维特征得到
Figure 966389DEST_PATH_IMAGE122
,且有
Figure 984024DEST_PATH_IMAGE123
,其中
Figure 540907DEST_PATH_IMAGE009
Figure 276782DEST_PATH_IMAGE124
的特征向量。使用矩阵
Figure 678944DEST_PATH_IMAGE125
左乘上述矩阵可以得到
Figure 816664DEST_PATH_IMAGE127
。根据公式
Figure 278870DEST_PATH_IMAGE128
,将其代入到上述式子中,经过计算可以得到待识别数据图像y的特征向量
Figure 236461DEST_PATH_IMAGE130
,其中矩阵P是从训练阶段得到的矩阵。平均特征向量可以表示为:
Figure 973473DEST_PATH_IMAGE132
,其中,
Figure 965700DEST_PATH_IMAGE133
是第
Figure 598807DEST_PATH_IMAGE134
类样本数,
Figure 309274DEST_PATH_IMAGE135
是一个维度为
Figure 53239DEST_PATH_IMAGE136
的全1列向量。
也就是说,在本实施例中,在上述构建核锥体约束数据图像的非负特征过程中,有如下有益效果:
(1)在本实施例中,使用矩阵Frobenius范数度量矩阵分解后的损失,通过加入了对基图像矩阵W约束的核锥体角度正则项来提升算法的识别性能,提高了图像识别的准确性;
(2)在本实施例中,将目标函数的求解转化成两个凸子优化问题的求解,并使用KKT条件求解凸子优化问题得到系数矩阵P和特征矩阵H的更新迭代公式,在保证算法准确度的情况下,可以通过简单的矩阵迭代更新来计算系数矩阵P和特征矩阵H
(3)通过将待识别数据图像投影到核空间中,计算与每一类训练样本的平均特征向量之间的距离来确定待识别数据图像属于哪一类,可以准确的对待识别数据图像进行分类识别。
本实施例中,进一步的提供了核锥体约束数据图像的非负特征矩阵分解的训练步骤和识别步骤(请参见图1),并进一步的请参见图2,其中所述训练步骤包括如下步骤:
步骤S11:获取多个数据图像,将其转化为训练样本对应的数据矩阵X,并将其投影到高维核特征空间中;
步骤S12:初始化系数矩阵P和特征矩阵H,并设置最大迭代次数
Figure 224191DEST_PATH_IMAGE137
,误差阈值
Figure 293778DEST_PATH_IMAGE138
步骤S21:设置特征矩阵H的迭代次数
Figure 225962DEST_PATH_IMAGE139
步骤S22:按照特征矩阵H迭代公式
Figure 39197DEST_PATH_IMAGE140
更新特征矩阵H,并对迭代次数进行计数:
Figure 6016DEST_PATH_IMAGE141
步骤S23:判断
Figure 980925DEST_PATH_IMAGE142
是否成立或迭代次数n是否达到了最大迭代次数
Figure 665985DEST_PATH_IMAGE143
步骤S24:如果上述两者达到一个,停止对特征矩阵H的迭代计算,并输出特征矩阵H,否则执行步骤S22,继续进行特征矩阵H的迭代;
步骤S31:设置系数矩阵P的迭代次数
Figure 17332DEST_PATH_IMAGE139
步骤S32:按照系数矩阵P迭代公式更新系数矩阵P,并增加迭代次数
Figure 838657DEST_PATH_IMAGE144
步骤S33:判断
Figure 984468DEST_PATH_IMAGE145
是否成立或迭代次数n是否达到了最大迭代次数
Figure 891244DEST_PATH_IMAGE143
步骤S34:如果上述两者达到一个,停止对系数矩阵P的迭代计算,并输出基矩阵P,否则执行步骤S32,继续进行系数矩阵P基矩阵P的迭代。
步骤S41:判断
Figure 46282DEST_PATH_IMAGE146
步骤S42:如果该不等式满足,则输出系数矩阵P和特征矩阵H,否则执行步骤S21,继续进行迭代计算。
进一步的,请参见图3,上述识别步骤包括:
步骤51:将待识别数据图像投影到高维核特征空间当中,计算其特征;
步骤52:计算待识别数据图像的特征向量
Figure 722114DEST_PATH_IMAGE009
到每一类的训练样本的平均特征向量
Figure 304405DEST_PATH_IMAGE010
的距离,即
Figure 698477DEST_PATH_IMAGE147
,如果
Figure 391626DEST_PATH_IMAGE148
,则把待识别数据图像归为第q类。
步骤53:输出识别得到的类别q,完成对待识别数据图像的分类识别任务。
本发明实施例提出的上述核锥体约束数据图像的非负特征的表示和识别方法,可以克服上述缺陷,准确的对训练样本矩阵进行非负矩阵分解,提高后续数据图像识别的准确性。
在本实施例中,进一步的请参见图4,还给出了上述核锥体约束数据图像的非负特征的表示和识别方法的流程示意图,其包括了如下步骤:
步骤S102:获取待识别数据图像。
上述的待识别数据图像可以是通过图像采集设备采集的图像获得的数据图像,可以是任意的数据图像。在一个具体的实施例中,待识别数据图像可以是待识别的人脸图像,在下面的实施例描述中,以待识别数据图像为人脸图像为例进行描述。具体的,可以是采用内嵌人脸抓拍功能的人脸抓拍摄像机直接抓拍得到的图像获得的人脸图像,还可以是摄像机采集视频后,通过计算机进行人脸抓拍得到的人脸图像,其中,图像采集设备采集的图像可以称之为原始图像。
进一步的,上述的待识别数据图像可以是根据图像采集设备所采集的图像实时获得的图像,还可以是根据图像采集设备所采集的图像离线获得的图像。
可以理解的,图像采集设备所采集的图像中可能仅仅包含一个人物的人脸区域,也可能包含多个人物的人脸区域。在图像采集设备所采集的图像中仅仅包含一个人物的人脸区域的情况下,该图像仅仅对应一个人脸图像;在图像采集设备所采集的图像中包含多个人物的人脸区域的情况下,该图像对应多个人脸图像。
需要说明的是,上述待识别数据图像可以是上述图像采集设备所采集的图像对应的人脸图像中的一个人脸图像。
在图像采集设备所采集的图像中包含多个人物的人脸区域的情况下,可以分别将每个人脸区域作为待识别数据图像多次执行本发明实施例提供的步骤,以完成对上述所采集的图像的分类识别。
为便于进行人脸识别、人脸匹配等操作,预设的人脸图像数据库中所存储的人脸图像中通常仅仅包括一个人物的人脸区域。基于此,在本发明的一种较佳实现方式中,待识别数据图像中仅仅包含一个人物的人脸区域。
步骤S104:根据基矩阵P计算待识别数据图像y的待识别特征向量
Figure 187544DEST_PATH_IMAGE009
待识别数据图像为y ,通过非线性映射
Figure 940736DEST_PATH_IMAGE149
将待识别数据图像投影到高维特征得到
Figure 556526DEST_PATH_IMAGE150
,根据前述非负矩阵分解的过程,可以得到:
Figure 53366DEST_PATH_IMAGE151
,其中是
Figure 703790DEST_PATH_IMAGE009
Figure 893463DEST_PATH_IMAGE150
特征向量(待识别特征向量)。使用矩阵
Figure 996548DEST_PATH_IMAGE125
左乘上述矩阵可以得到
Figure 31500DEST_PATH_IMAGE152
。根据公式
Figure 802010DEST_PATH_IMAGE153
,将其代入到上述式子中,经过计算可以得到待识别数据图像y的待识别特征向量:
Figure 897005DEST_PATH_IMAGE154
其中基矩阵P是从前述非负矩阵分解的过程中计算得到的矩阵。
步骤S106:计算预设的至少一个训练样本的特征向量与待识别特征向量之间的距离。
在一个具体的实施例中,上述训练样本矩阵中包含了n个训练样本,根据非负矩阵分解的过程可以知道
Figure 487387DEST_PATH_IMAGE155
H为特征矩阵,从而可以得到的是,训练样本
Figure 326030DEST_PATH_IMAGE156
对应的特征向量为
Figure 951046DEST_PATH_IMAGE157
,其中,
Figure 216942DEST_PATH_IMAGE158
为特征矩阵H的第i列数据对应的向量。
在另一个实施例中,需要进一步的计算每一个人训练样本对应的平均特征向量,其中,计算方式如下,第j个训练样本
Figure 294620DEST_PATH_IMAGE159
的平均特征向量的计算方式如下:
Figure 671374DEST_PATH_IMAGE160
其中,
Figure 150897DEST_PATH_IMAGE161
是一个维度为
Figure 587695DEST_PATH_IMAGE162
的全1列向量。
也就是说,在本步骤中,需要计算每一个训练样本对应的平均特征向量
Figure 152668DEST_PATH_IMAGE010
,然后进一步基于每一个训练样本的平均特征向量进行数据图像的分类识别。
计算待识别数据图像对应的待识别特征向量
Figure 333114DEST_PATH_IMAGE009
到每一个训练样本(即为每一个训练样本的分类)的平均特征向量
Figure 932723DEST_PATH_IMAGE010
的距离,例如,可以计算两个特征向量之间的Frobenius范数:
Figure 540421DEST_PATH_IMAGE163
,n为训练样本的类别数(即为样本数量)。
步骤S108:确定距离最小的训练样本作为数据图像分类识别结果。
上述步骤S106中,计算了每一个训练样本与待识别数据图像的特征向量之间的距离值大小,在本步骤中,根据每一个训练样本与待识别数据图像的特征向量之间的距离值大小来确定与待识别数据图像对应的数据图像识别结果,即确定与待识别数据图像对应的训练样本,将该训练样本的分类作为本实施例的数据图像识别的分类识别结果。
具体的,求解
Figure 327112DEST_PATH_IMAGE164
,以得到距离值最小的平均特征向量
Figure 311248DEST_PATH_IMAGE165
,也就是说,
Figure 765363DEST_PATH_IMAGE009
与平均特征向量
Figure 543964DEST_PATH_IMAGE165
距离最近,判定待识别数据图像属于第p类训练样本,输出类别 p
也就是说,在上述核锥体约束数据图像的非负特征的表示和识别方法中,给出了在核锥体空间中数据图像的非负特征的表示和识别方法,在再生核希尔伯特空间中对核锥体正则项进行了约束从而构建了新的目标函数;将目标函数转换为最优化问题,通过求解最优化问题得到算法的更新迭代公式。
进一步的,请参见图5,给出了上述核锥体约束数据图像的非负特征的表示和识别方法的一个流程示意图,具体包括了如图5所示的如下步骤:
步骤S201:将多个类的训练样本对应的数据矩阵投影到核空间当中,使用F范数度量矩阵矩阵分解的损失,通过加入核锥体正则项进行约束,以构建矩阵分解对应的目标函数
Figure 817950DEST_PATH_IMAGE008
步骤S202:将目标函数
Figure 340198DEST_PATH_IMAGE008
转化为两个凸子优化问题,通过KKT条件获取系数矩阵P的第一更新迭代公式和特征矩阵H的第二更新迭代公式;
步骤S203:基于多个类的训练样本,根据系数矩阵P的第一更新迭代公式对系数矩阵P的更新求解,分别计算出每一类训练样本的特征向量;
步骤S204:基于系数矩阵P计算待识别数据图像y的特征向量
Figure 648820DEST_PATH_IMAGE009
,计算待识别数据图像的特征向量与每一类训练样本的平均特征向量之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类。
在本实施例中,上述核锥体约束数据图像的非负特征的表示和识别方法在用作训练数据的人脸图像样本不含有噪声情况下,上述核锥体约束数据图像的非负特征的表示和识别方法具有识别率高的特点;在训练数据含有噪声情况下,核锥体约束数据图像的非负特征的表示和识别方法表现出了较强的鲁棒性。
具体请参见图6,其中给出了上述核锥体约束数据图像的非负特征的表示和识别方法的实验数据。实验数据表明了在非负矩阵分解的迭代中,上述核锥体约束数据图像的非负特征的表示和识别方法能较快收敛,具被有良好的的收敛速度,相应算法的收敛性在实验数据中得到了较好的证明。
进一步的,在另一个实施例中,还提出了一种核锥体约束数据图像的非负特征的表示和识别装置,具体请参见图7,该核锥体约束数据图像的非负特征的表示和识别装置包括:
目标函数构建模块101,用于将训练样本对应的数据矩阵投影到核特征空间当中,使用F范数度量矩阵分解后的损失,加入核锥体正则项进行约束,构建目标函数
Figure 598321DEST_PATH_IMAGE008
更新迭代公式计算模块102,用于将目标函数
Figure 625183DEST_PATH_IMAGE008
转化为两个凸子优化问题,通过KKT条件获得矩阵分解的更新迭代公式,其中,更新迭代公式包括系数矩阵P和特征矩阵H的更新迭代公式;
图像识别模块104,基于系数矩阵P计算待识别数据图像y的特征向量
Figure 685543DEST_PATH_IMAGE009
,计算待识别数据图像的特征向量与每一类训练样本的平均特征向量
Figure 114250DEST_PATH_IMAGE010
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类。
在一个可选的实施例中,如图7所示,核锥体约束数据图像的非负特征的表示和识别装置还包括矩阵更新模块103,用于基于多个类的训练样本,根据系数矩阵P的第一更新迭代公式对系数矩阵P的更新求解,分别计算出每一类训练样本的特征向量。
在一个可选的实施例中,更新迭代公式计算模块102还用于通过KKT条件获取系数矩阵P的第一更新迭代公式和特征矩阵H的第二更新迭代公式。
在一个可选的实施例中,所述特征矩阵H的第二更新迭代公式为
Figure 234653DEST_PATH_IMAGE166
,所述系数矩阵P的第一更新迭代公式为
Figure 483232DEST_PATH_IMAGE167
,其中,X是训练样本对应的数据矩阵,H是特征矩阵,P是系数矩阵,
Figure 347283DEST_PATH_IMAGE168
是将训练样本投影到核特征空间当中的核数据矩阵,且该核数据矩阵的元素为
Figure 896076DEST_PATH_IMAGE169
,
Figure 187380DEST_PATH_IMAGE170
是正则项参数。
在一个可选的实施例中,图像识别模块104还用于根据公式
Figure DEST_PATH_IMAGE171
,计算待识别数据图像y的特征向量
Figure 126517DEST_PATH_IMAGE009
;根据公式
Figure 794259DEST_PATH_IMAGE172
计算第j类训练样本的平均特征向量
Figure 931979DEST_PATH_IMAGE010
;其中,
Figure DEST_PATH_IMAGE173
Figure 863026DEST_PATH_IMAGE174
Figure DEST_PATH_IMAGE175
,c表示训练样本类别的数量,
Figure 555038DEST_PATH_IMAGE176
是一个维度为
Figure DEST_PATH_IMAGE177
的全1列向量。
在一个可选的实施例中,矩阵更新模块103还用于获取训练样本,将其转化为数据矩阵X,利用核函数将数据矩阵X投影到高维的核特征空间当中;确定迭代误差
Figure 760892DEST_PATH_IMAGE178
、最大迭代次数
Figure DEST_PATH_IMAGE179
;初始化特征矩阵H和系数矩阵P;通过特征矩阵H的第二更新迭代公式更新特征矩阵H,其中,当目标函数
Figure 210241DEST_PATH_IMAGE089
满足
Figure 843348DEST_PATH_IMAGE180
,或对特征矩阵H的更新迭代次数达到最大迭代次数
Figure 553815DEST_PATH_IMAGE143
,停止对特征矩阵H的迭代并输出矩阵H;通过系数矩阵P的第一更新迭代公式更新系数矩阵P,其中,当目标函数
Figure 563359DEST_PATH_IMAGE008
满足
Figure DEST_PATH_IMAGE181
,或对系数矩阵P的更新迭代次数达到最大迭代次数
Figure 878934DEST_PATH_IMAGE143
,停止对系数矩阵P的迭代并输出系数矩阵P
在一个可选的实施例中,图像识别模块104还用于计算待识别数据图像的特征向量
Figure 948521DEST_PATH_IMAGE009
与每一类训练样本的平均特征向量
Figure 880705DEST_PATH_IMAGE010
之间的距离;确定距离最小的平均特征向量
Figure 693940DEST_PATH_IMAGE165
对应的训练样本的类别,将待识别数据图像y判定为第q 类,其中,
Figure 395180DEST_PATH_IMAGE182
图8示出了一个实施例中实现上述核锥体约束数据图像的非负特征的表示和识别方法的计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图8所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行上述方法。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
采用了上述核锥体约束数据图像的非负特征的表示和识别方法、装置、计算机设备、计算机可读存储介质之后,首先根据数据图像样本构建的训练样本矩阵,并将其投影到核空间中,使用F范数度量矩阵分解的损失并加入了对锥体角度约束的核锥体正则项构建目标函数。将目标函数转化为两个凸子优化问题,利用KKT条件求解两个子优化问题得到了关于系数矩阵P和特征矩阵H的更新迭代公式。在数据图像的识别过程中,基于系数矩阵P计算待识别数据图像的特征向量
Figure 635669DEST_PATH_IMAGE009
,和每一类训练样本的平均特征向量
Figure 55149DEST_PATH_IMAGE010
,并计算待识别数据图像的特征向量
Figure 406496DEST_PATH_IMAGE009
与训练样本的平均特征向量
Figure 227821DEST_PATH_IMAGE010
之间的距离,如果
Figure DEST_PATH_IMAGE183
与第q类训练样本的平均特征向量距离最近,则将待识别数据图像归为第q类。在上述数据图像的非负特征特征的表示和识别方法中,将数据图像投影到高维再生核希尔博特征空间中,使得矩阵的非负特征表示的算法提升处理非线性数据的能力,并且,通过增加核椎体正则项对基图像矩阵W进行约束,以提高数据图像的识别率,以及数据图像识别的鲁棒性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种核锥体约束数据图像的非负特征的表示和识别方法,其特征在于,所述方法包括:
将训练样本对应的数据矩阵投影到核特征空间当中,使用F范数度量矩阵分解后的损失,加入核锥体正则项进行约束,构建目标函数
Figure 155712DEST_PATH_IMAGE001
将目标函数
Figure 604011DEST_PATH_IMAGE002
转化为两个凸子优化问题,通过KKT条件获得矩阵分解的更新迭代公式,其中,更新迭代公式包括系数矩阵P和特征矩阵H的更新迭代公式;
基于系数矩阵P计算待识别数据图像y的特征向量
Figure 711644DEST_PATH_IMAGE003
,计算待识别数据图像的特征向量
Figure 841274DEST_PATH_IMAGE003
与每一类训练样本的平均特征向量
Figure 186805DEST_PATH_IMAGE004
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类。
2.根据权利要求1所述的核锥体约束数据图像的非负特征的表示和识别方法,其特征在于,所述通过KKT条件获得矩阵分解的更新迭代公式的步骤,还包括:
通过KKT条件获取系数矩阵P的第一更新迭代公式和特征矩阵H的第二更新迭代公式。
3.根据权利要求2所述的核锥体约束数据图像的非负特征的表示和识别方法,其特征在于,所述特征矩阵H的第二更新迭代公式为
Figure 41891DEST_PATH_IMAGE005
所述系数矩阵的第一更新迭代公式为
Figure 840083DEST_PATH_IMAGE006
其中,X是训练样本对应的数据矩阵,H是特征矩阵,P是系数矩阵,
Figure 835721DEST_PATH_IMAGE007
是将训练样本投影到核特征空间当中的核数据矩阵,且该核数据矩阵的元素为
Figure 35758DEST_PATH_IMAGE008
,
Figure 560280DEST_PATH_IMAGE009
是正则项参数。
4.根据权利要求1所述的核锥体约束数据图像的非负特征的表示和识别方法,其特征在于,所述基于系数矩阵P计算待识别数据图像y的特征向量
Figure 845768DEST_PATH_IMAGE003
的步骤,还包括:
根据公式
Figure 113938DEST_PATH_IMAGE010
,计算待识别数据图像y的特征向量
Figure 371744DEST_PATH_IMAGE003
所述计算待识别数据图像的特征向量
Figure 332747DEST_PATH_IMAGE003
与每一类训练样本的平均特征向量
Figure 604066DEST_PATH_IMAGE004
之间的距离的步骤,还包括:
根据公式
Figure 410348DEST_PATH_IMAGE011
计算第j类训练样本的平均特征向量
Figure 584977DEST_PATH_IMAGE004
其中,
Figure 451302DEST_PATH_IMAGE012
Figure 976961DEST_PATH_IMAGE013
Figure 586934DEST_PATH_IMAGE014
c表示训练样本类别的数量,
Figure 616070DEST_PATH_IMAGE016
是一个维度为
Figure 918876DEST_PATH_IMAGE017
的全1列向量。
5.根据权利要求3所述的核锥体约束数据图像的非负特征的表示和识别方法,其特征在于,所述方法还包括:
获取训练样本,将其转化为数据矩阵X,利用核函数将数据矩阵X投影到高维核特征空间当中;
确定迭代误差
Figure 902137DEST_PATH_IMAGE018
、最大迭代次数
Figure 519063DEST_PATH_IMAGE019
初始化特征矩阵H和系数矩阵P
通过特征矩阵H的第二更新迭代公式更新特征矩阵H,其中,当目标函数
Figure 402706DEST_PATH_IMAGE002
满足
Figure 876413DEST_PATH_IMAGE020
,或对特征矩阵H的更新迭代次数达到最大迭代次数
Figure 845506DEST_PATH_IMAGE021
,停止对特征矩阵H的迭代并输出特征矩阵H
通过系数矩阵P的第一更新迭代公式更新系数矩阵P,其中,当目标函数
Figure 62860DEST_PATH_IMAGE002
满足
Figure 66588DEST_PATH_IMAGE022
,或对系数矩阵P的更新迭代次数达到最大迭代次数
Figure 711196DEST_PATH_IMAGE021
,停止对系数矩阵P的迭代并输出系数矩阵P
6.根据权利要求4所述的核锥体约束数据图像的非负特征的表示和识别方法,其特征在于,所述基于系数矩阵P计算待识别数据图像y的特征向量
Figure 167585DEST_PATH_IMAGE003
,计算待识别数据图像的特征向量
Figure 439165DEST_PATH_IMAGE003
与每一类训练样本的平均特征向量
Figure 31820DEST_PATH_IMAGE004
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类的步骤,还包括:
计算待识别数据图像的特征向量
Figure 50592DEST_PATH_IMAGE003
与每一类训练样本的平均特征向量
Figure 994277DEST_PATH_IMAGE004
之间的距离;
确定距离最小的平均特征向量
Figure 553435DEST_PATH_IMAGE023
对应的训练样本的类别,将待识别数据图像y判定为第q类,其中,
Figure 266176DEST_PATH_IMAGE024
7.一种核锥体约束数据图像的非负特征的表示和识别装置,其特征在于,所述装置包括:
目标函数构建模块,用于将训练样本对应的数据矩阵投影到核特征空间当中,使用F范数度量矩阵分解后的损失,加入核锥体正则项进行约束,构建目标函数
Figure 987007DEST_PATH_IMAGE002
更新迭代公式计算模块,用于将目标函数
Figure 417988DEST_PATH_IMAGE002
转化为两个凸子优化问题,通过KKT条件获得矩阵分解的更新迭代公式,其中,更新迭代公式包括系数矩阵P的更新迭代公式和特征矩阵H的更新迭代公式;
图像识别模块,用于基于系数矩阵P计算待识别数据图像y的特征向量
Figure 515257DEST_PATH_IMAGE003
,计算待识别数据图像的特征向量
Figure 849549DEST_PATH_IMAGE003
与每一类训练样本的平均特征向量
Figure 6861DEST_PATH_IMAGE004
之间的距离,根据计算得到的距离对待识别数据图像的类别进行分类。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1至6任一所述核锥体约束数据图像的非负特征的表示和识别方法。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器有可执行代码,当所述可执行代码在所述处理器上运行以实现如权利要求1至6任一所述的核锥体约束数据图像的非负特征的表示和识别方法。
CN202111223119.1A 2021-10-20 2021-10-20 数据图像的非负特征表示和识别方法、装置、设备及介质 Active CN113657358B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111223119.1A CN113657358B (zh) 2021-10-20 2021-10-20 数据图像的非负特征表示和识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111223119.1A CN113657358B (zh) 2021-10-20 2021-10-20 数据图像的非负特征表示和识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113657358A true CN113657358A (zh) 2021-11-16
CN113657358B CN113657358B (zh) 2022-02-08

Family

ID=78484323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111223119.1A Active CN113657358B (zh) 2021-10-20 2021-10-20 数据图像的非负特征表示和识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113657358B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897685A (zh) * 2017-02-17 2017-06-27 深圳大学 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897685A (zh) * 2017-02-17 2017-06-27 深圳大学 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统
WO2018149133A1 (zh) * 2017-02-17 2018-08-23 深圳大学 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
TONGLIANG LIU ET AL: "Large-Cone Nonnegative Matrix Factorization", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
YANG LI ET AL: "Class-Cone based Nonnegative Matrix Factorization for Face Recognition", 《2018 14TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL INTELLIGENCE AND SECURITY (CIS)》 *
杨宝 等: "基于核非负分解的人脸图像特征提取与分类", 《计算机工程与应用》 *

Also Published As

Publication number Publication date
CN113657358B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
US11403876B2 (en) Image processing method and apparatus, facial recognition method and apparatus, and computer device
Bietti et al. Group invariance, stability to deformations, and complexity of deep convolutional representations
Huber et al. Fitting 3d morphable face models using local features
US9400919B2 (en) Learning deep face representation
CN109063742B (zh) 蝴蝶识别网络构建方法、装置、计算机设备及存储介质
WO2022041678A1 (zh) 张量协作图判别分析遥感图像特征提取方法
Tzimiropoulos Project-out cascaded regression with an application to face alignment
WO2020228446A1 (zh) 模型训练方法、装置、终端及存储介质
JP6798183B2 (ja) 画像解析装置、画像解析方法およびプログラム
Chen et al. Convolutional neural network based dem super resolution
CN111275685B (zh) 身份证件的翻拍图像识别方法、装置、设备及介质
WO2020062360A1 (zh) 一种图像融合分类的方法及装置
CN111680746A (zh) 车损检测模型训练、车损检测方法、装置、设备及介质
CN110046577B (zh) 行人属性预测方法、装置、计算机设备和存储介质
CN109002794B (zh) 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质
CN111062324A (zh) 人脸检测方法、装置、计算机设备和存储介质
CN114419406A (zh) 图像变化检测方法、训练方法、装置和计算机设备
CN116453232A (zh) 人脸活体检测方法、人脸活体检测模型的训练方法和装置
CN109101984B (zh) 一种基于卷积神经网络的图像识别方法及装置
CN113822871A (zh) 基于动态检测头的目标检测方法、装置、存储介质及设备
CN113657358B (zh) 数据图像的非负特征表示和识别方法、装置、设备及介质
Khan et al. Spectral unmixing for end member extraction and abundance estimation
Bietti et al. Group invariance, stability to deformations, and complexity of deep convolutional representations
CN116740421A (zh) 基于无监督公共子空间学习模型的遥感图像分类方法和装置
CN112699809B (zh) 痘痘类别识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Non negative feature representation and recognition method, device, equipment and medium of data image

Effective date of registration: 20221121

Granted publication date: 20220208

Pledgee: Shenzhen hi tech investment small loan Co.,Ltd.

Pledgor: Shenzhen Xinshizhi Technology Co.,Ltd.

Registration number: Y2022980022685

PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20220208

Pledgee: Shenzhen hi tech investment small loan Co.,Ltd.

Pledgor: Shenzhen Xinshizhi Technology Co.,Ltd.

Registration number: Y2022980022685