CN108108769B - 一种数据的分类方法、装置及存储介质 - Google Patents

一种数据的分类方法、装置及存储介质 Download PDF

Info

Publication number
CN108108769B
CN108108769B CN201711489062.3A CN201711489062A CN108108769B CN 108108769 B CN108108769 B CN 108108769B CN 201711489062 A CN201711489062 A CN 201711489062A CN 108108769 B CN108108769 B CN 108108769B
Authority
CN
China
Prior art keywords
sample
matrix
data
projection
view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711489062.3A
Other languages
English (en)
Other versions
CN108108769A (zh
Inventor
奚晓钰
李琳
周冰
邓凯庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Migu Cultural Technology Co Ltd
China Mobile Communications Group Co Ltd
Original Assignee
Migu Cultural Technology Co Ltd
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Migu Cultural Technology Co Ltd, China Mobile Communications Group Co Ltd filed Critical Migu Cultural Technology Co Ltd
Priority to CN201711489062.3A priority Critical patent/CN108108769B/zh
Publication of CN108108769A publication Critical patent/CN108108769A/zh
Application granted granted Critical
Publication of CN108108769B publication Critical patent/CN108108769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据的分类方法,所述方法包括:获取图像数据库中每个视图在投影空间分别对应的投影矩阵;根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;根据所述分类信息,确定所述待测试样本所属的类别。本发明还同时公开了一种数据的分类装置及存储介质。

Description

一种数据的分类方法、装置及存储介质
技术领域
本发明涉及数据分类技术,具体涉及一种数据分类方法、装置及存储介质。
背景技术
目前对多视图问题进行研究解决,最重要的是得到多视图中便于进行特征选择的公共空间。首先被提出的方法就是典型相关分析,以及它在非线性核化方面的扩展变化。典型相关分析方法也是最典型的研究两个视图的方法。该方法学习到两个变换,两个变换都是通过最大化两个视图之间的交叉相关特性来获得。一个变换对应一个视图,把每个视图的样本都分别投影到学习到的一个公共空间。
而另一种被提出了一种改进的人脸识别方法,可以用来处理多姿态、低分辨率和草图的问题。该方法应用偏最小二乘回归将两个视图的样本投影到一个公共的潜在子空间,在这个子空间里,一个视图的样本作为回归量,另一个视图的样本作为响应。
但是,尽管两个视图之间的差异都可以通过上述方法最小化,但是对于多视图的特征提取,现有多视图技术没有直接地考虑到鉴别信息,即样本的标记信息。在很多情况下,有标记的样本一般只有很小的数量,而未标记的样本数据似乎都是“无限多”。而现有方案在多视图中没有完善考虑如何充分利用有限的有标记数据和大量的未标记图像,来提高图像自动识别的性能。
发明内容
为解决现有存在的技术问题,本发明实施例期望提供一种数据的分类方法、装置及存储介质,能够提高图像自动识别的效率。
本发明实施例的技术方案是这样实现的:
根据本发明实施例的一方面,提供一种数据的分类方法,所述方法包括:
获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
根据所述分类信息,确定所述待测试样本所属的类别。
上述方案中,所述获取图像数据库中每个视图在投影空间分别对应的投影矩阵,包括:
对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;
根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
上述方案中,所述投影矩阵中至少包括样本投影矩阵;
所述根据所述样本特征数据对所述待测试样本进行数据分类,包括:
使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;
根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。
上述方案中,所述投影矩阵中至少包括标签投影矩阵;
所述根据所述样本特征数据对所述待测试样本进行数据分类,包括:
根据所述标签投影矩阵对所述待测试样本进行计算,得到表征所述待测试样本所属类别的标签;
根据所述标签对所述待测试样本进行数据分类。
上述方案中,在根据所述样本特征数据对所述待测试样本进行数据分类之前,所述方法还包括:
对所述标签投影矩阵以及偏差项进行共用。
上述方案中,通过以下公式获取图像数据库中每个视图在投影空间分别对应的投影矩阵:
Figure BDA0001535272940000031
其中,矩阵变量中:Tr表示迹、F为预测标签矩阵、Lt为拉普拉斯矩阵、Y为真实标签矩阵、U∈Rn×n为决策规则对角矩阵、Pt为投影矩阵、
Figure BDA0001535272940000032
为第t个视图的训练样本矩阵、W∈Rd×c为多个视图共用的标签投影矩阵、b∈Rc为多个视图共用的偏差项、上标T是一个运算符号,表示转置;
变量和参数:视图编号t、视图个数m、平衡参数μ、平衡参数γ
常量和计算符号:全1向量1n、正则化项
Figure BDA0001535272940000033
矩阵M的l2,1范数定义为:
Figure BDA0001535272940000034
而Tr(Ft TLtFt)是基于图的半监督学习方法的局部保留,F同时满足在训练数据和图形模型S中基本真实标签的平滑性;拉普拉斯矩阵Lt是从视图特征Xt=[x1,x2,x3....xn]中计算所得,这里,Xt=[x1,x2,x3....xn]是对于第t个视图的数据;
Tr((Ft-Yt)TU(Ft-Yt))在基于图的半监督学习方法中,要使得预测标签矩阵F应同时满足在训练数据和图形模型S中基本真实标签的平滑性;
μ||(Pt TXt)TW+1nbT-Ft||2,1是一个具有鲁棒性的分类器,该分类器应该能够容忍带有噪声标签的样本,并且采用广义的l2,1损耗,其中μ是平衡参数;W∈Rd×c是多个视图共用的标签投影矩阵,b∈Rc是多个视图共用的偏差项;
Figure BDA0001535272940000035
是正则化项,1n是一个全1向量;矩阵M的l2,1范数定义为:
Figure BDA0001535272940000036
其中,Mi是M的第i行;
在μ||(Pt TXt)TW+1nbT-Ft||2,1中,Pt TXt用Pt矩阵对样本Xt进行投影之后对样本进行降维和去噪,然后对每个视图将其标签投影矩阵W以及用于降噪的偏差项b进行共用;
Figure BDA0001535272940000041
则是加入正则项。
根据本发明实施例中的另一方面,提个一种数据的分类装置,所述装置包括:获取单元、计算单元、分类单元和确定单元;
其中,所述获取单元,用于获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
所述计算单元,用于根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
所述分类单元,用于根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
所述确定单元,用于根据所述分类信息,确定所述待测试样本所属的类别。
上述方案中,所述装置还包括:训练单元;
所述训练单元,用于对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;
所述获取单元,用于根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
上述方案中,所述投影矩阵中至少包括样本投影矩阵;
所述分类单元,具体用于使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。
根据本发明实施例的第三方面,提供一种数据的分类装置,所述装置包括:存储器和处理器;
其中,所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于运行所述计算机程序时,执行上述数据的分类方法中任一项所述方法的步骤。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述数据的分类方法中任一项所述方法的步骤
本发明实施例提供一种数据的分类方法、装置及存储介质,通过获取图像数据库中每个视图在投影空间分别对应的投影矩阵;根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;根据所述分类信息,确定所述待测试样本所属的类别。如此,不仅能够有效利用有类别标签的数据的同时,充分利用大量的无类别标签的数据;而且还能在不同的视图之间获得相关和互补的信息,从而提高图像自动识别效率以及识别精确度。
附图说明
图1为本发明实施例一种信息的推送方法流程示意图;
图2是本发明实施例中基于图学习的多视图半监督特征提取算法的模型示意图;
图3为本发明实施例中数据的分类装置的结构示意图一;
图4为本发明实施例中数据的分类装置的结构组成示意图二。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1为本发明实施例一种信息的推送方法流程示意图;如图1所示,所述方法包括:
步骤101,获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
本发明实施例中,所述方法主要应用于针对数据分类的装置,所装置可以是数据分类器、数据训练器等。
具体地,所述装置是利用基于图学习的半监督学习方法为基础的多视图半监督特征提取算法对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;然后再根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
这里,所述投影矩阵可以是样本投影矩阵,也可以是标签投影矩阵。
通过利用半监督学习方法能够将已标注样本和未标注样本综合利用来进行分类器的训练,既保证了训练速度又可以提高分类的效果。而将半监督学习方法成功运用在多个视图(或特征集)里面,可以实现在多视图学习中,有标签样本占少数以及无标签样本占多数的情况下,利用少数有标签的样本蕴含的标签信息,再充分利用大量的无标签样本进行特征提取。
步骤102,根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
步骤103,根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
本发明实施例中,可以使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。或者,根据所述标签投影矩阵对所述待测试样本进行计算,得到表征所述待测试样本所属类别的标签;根据所述标签对所述待测试样本进行数据分类。
本发明实施例中,当根据所述样本特征数据对所述待测试样本进行数据分类之前,对所述标签投影矩阵以及偏差项进行了共用,那么,最终得到的分类数据了是共用的。
图2是本发明实施例中基于图学习的多视图半监督特征提取算法的模型示意图,如图2所示,在多视图中,为了在有效利用有类别标签的数据的同时,充分利用大量的无类别标签的数据。本发明实施例以基于图学习的半监督学习方法为基础的多视图半监督特征提取算法。利用该算法对多个视图(例如X、Y、Z三个视图)进行样本训练,以获得多个视图在投影空间分别对应的投影矩阵(W、P1),然后再根据多个视图对应的投影矩阵来对测试样本进行投影,以提取测试样本的样本特征,最后再对测试样本进行分类。
该方法的数学模型主要是将多视图学习的思想,与基于图形的半监督分类学习相结合,在不同的视图之间获得相关和互补的信息,可以获得更好的性能。
本发明实施例中,除了考虑局部保留以及半监督学习中预测标签和真实标签的相对一致性,还要学习一个具有鲁棒性的分类器,能够容忍带有噪声标签的样本,该方法采用广义的l2,1损耗。其中,用样本投影矩阵分别对每个视图样本进行投影之后可以对其进行降维和去噪,并对每个视图的标签投影矩阵以及偏差项进行共用,能够有效学习到多个视图的样本特征,除此之外所以该方法能够学习具有鲁棒性的用于多视图的分类器。
为了使得标签投影矩阵的复杂度最低,在模型中还可以加入带有平衡参数的正则项。
下面,对基于图学习的多视图半监督特征提取算法的具体实现过程进行描述:
假设训练样本集对应有m个视图,每个视图有n个样本。
用公式:Xt=[x1 (t),x2 (t),...,xl (t),xl+1 (t),...,xn (t)]表示上述样本中第t个视图中的样本;
用公式:
Figure BDA0001535272940000071
表示第i个样本对应第t个视图上的特征;
其中,在公式
Figure BDA0001535272940000072
中,dt表示第t个视图上的特征空间的维数。假设在上面的数据集中,前l个样本中都是有标签的,而剩下的n-l个样本都是无标签的。那么给出第t个视图对应的训练数据集的标记矩阵为Yt,用公式:
Yt=[y1 (t),y2 (t),...,yl (t),yl+1 (t),...,yn (t)]T∈{-1,0,1}n×c表示,其中的c是标签的数量;当1≤i≤l的时候(即:有标签样本),标签矩阵为yi (t)∈{-1,1}c;当l+1≤i≤n的时候(即:无标签样本),标签矩阵yi (t)为全零矩阵。
下面,用yij (t)来表示对应第t个视图第j类的第i个样本数据;
当yij (t)=1时,表示第i个样本对应第j类,也就是说该样本数据被正确划分到所属的类别为j类;否则,yij (t)=-1,表示第i个样本不属于第j类。与此同时,yij (t)被设置为0,当样本是无标签的时候。这项工作的目的就是将多个视图的有标签样本和无标签样本都充分利用起来,以学习具有鲁棒性的分类器用于图像识别。
为了充分利用所有样本数据,定义公式:F=[f1,f2,...fn]T∈Rn×c作为对所有训练数据进行预测的标签矩阵。其中,fi∈Rc(1≤i≤n)是第i个样本的预测标签表示。
对于第t个视图的数据Xt=[x1,x2,x3....xn],可以从视图特征Xt中计算基于视图的拉普拉斯矩阵Lt
下面,给定一组数据样本,可以定义图形模型S。其元素Sij反映第i个样本和第j个样本之间的相似性。为了简单,采用如下公式定义S:
Figure BDA0001535272940000081
上述公式中:Nk(·)表示数据的k个最近邻数据的集合。通过定义对角矩阵D,在D中,其第i个对角线元素计算为
Figure BDA0001535272940000082
接下来计算图拉普拉斯矩阵为:L=D-S。
基于以上定义,下面介绍一种多视图学习的思想,用来跟基于图的半监督分类学习相结合,在不同的视图之间获得相关和互补的信息,可以获得更好的性能。为此,联合所有视图对应的目标函数将其最小化,将基于图的半监督方法加入投影应用到多视图中。
具体,基于图学习的多视图半监督特征提取算法的目标函数可以如以下公式所示:
Figure BDA0001535272940000083
上述公式从多视图学习与基于图的半监督学习中获益,结合了这两种学习方法。将其应用于得出多视图半监督学习算法的计算过程。该算法可以用来解决多视图半监督在分类方法方面的问题。然后,可以通过目标函数公式计算依赖于视图的预测标签矩阵Ft
上述公式的目标函数中的第一部分Tr(Ft TLtFt)是用于基于图的半监督学习方法的局部保留,F应同时满足在训练数据和图形模型S中基本真实标签的平滑性,其中各个视图的拉普拉斯矩阵Lt已在上面定义。
上述公式中目标函数的第二部分Tr((Ft-Yt)TU(Ft-Yt))在基于图的半监督学习方法中,要使得预测标签矩阵F应同时满足在训练数据和图形模型S中基本真实标签的平滑性。因此,预测的标签可以通过使其与真实标签差值对比并最小化的方式获得。其目的是为了使得学习之后每个视图的预测标记和真实的标记相对一致。其中的U∈Rn×n是对角矩阵,并被称为决策规则矩阵。其对角元素Uii是根据第i个数据点是否被标记来决定的,如果被标记了,Uii则是一个大数,否则,Uii=1。该决策规则矩阵U做出跟基本真实标签矩阵Y一致的预测标签F。
上述公式中目标函数的第三部分μ||(Pt TXt)TW+1nbT-Ft||2,1是为了学习一个具有鲁棒性的分类器,该分类器应该能够容忍带有噪声标签的样本,这里对具有鲁棒性的损耗函数整合不同噪声水平的自适应功率。为此,采用广义的l2,1损耗,可以将框架加入该部分。其中μ是平衡参数。W∈Rd×c是多个视图共用的标签投影矩阵,b∈Rc是多个视图共用的偏差项。
Figure BDA0001535272940000091
是正则化项,1n是一个全1向量。矩阵M的l2,1范数定义为:
Figure BDA0001535272940000092
其中,Mi是M的第i行。其次,也注意到这一部分对样本进行了投影处理。在这里将对每个视图样本进行投影应用到多视图中,首先将该部分的Pt作为样本投影矩阵,在这一项μ||(Pt TXt)TW+1nbT-Ft||2,1中,Pt TXt这一部分用Pt矩阵对样本Xt进行投影之后可以对样本进行降维和去噪,然后对每个视图将其标签投影矩阵W以及用于降噪的偏差项b进行共用。所以这一项在学习有效的分类器的同时,能够将每个视图的样本Xt用Pt投影进行降维和去噪。除此之外,共用标签投影矩阵W以及共用偏差项b能够有效学习到多个视图的样本特征,并且有利于学习一个具有鲁棒性的分类器,因为每个视图测试样本在分类的过程中,不需要每个视图单独学习标签投影矩阵和偏差项,而通过共用的矩阵构成的分类器来分类会更加方便。
上述公式中目标函数的最后一部分
Figure BDA0001535272940000101
则是加入正则项。这一项放在括号之外,因为最后一项的
Figure BDA0001535272940000102
与具体哪个视图无关。将其可以放到前面某一个视图求和公式之外,作为对所有视图共用标签投影矩阵的正则项。将其用于标签的投影可以实现提取出所有视图的互补信息的目的,使得标签投影矩阵W的复杂度最低,其中γ是平衡参数。
这种模式有效地利用了大量未标记的数据和来自不同视图之间的互补信息。首先,这里在处理视图一致的正则项部分,将其设定成为视图之间共同学习,将标签投影矩阵和偏差项定为与视图无关,即视图间可以共用,有效提取视图之间的互补信息,进行共用可以降低后续迭代计算的复杂度。剩下的就是对上述目标函数进行迭代求解。
以下是对目标函数的求解过程,要想处理上述目标函数模型求解问题,迭代算法在这里起了很重要的作用,将其成功应用到了模型求解上面。注意,由于l2,1损耗和l2,1正则化矩阵的非凸性,直接对目标函数求出解析解是不可能的。为了克服这个问题,首先将原始公式转换为以下可替代的公式:
Figure BDA0001535272940000103
上式中,Dt (l)是一个对角矩阵,其第i个对角元素计算如下公式所示:
Figure BDA0001535272940000104
其中,rt i是矩阵(Pt TXt)TW+1nbT-Ft的第i行。
这里,注意到,Dt (l)是跟Ft,Pt,W和b有关,这使得上述可替代公式(1)的问题很难解。因此,为了绕过这个障碍,设计一个迭代方法,使用上一次迭代获得的固定的Dt (l)来求解。通过这种方法,可以解决上述难解的问题,解出Ft,Pt,W和b。
以下是按b-W-Pt-Ft的顺序优化进行的数学求解推导:
1.根据公式(1)先对bT求导并使其等于0;其求导公式如下:
Figure BDA0001535272940000105
先将其展开,涉及目标函数中的第三项,然后对这一项中与bT有关的对bT求导并化简,得到如下公式:
1n TDt (l)1nbT-1n TDt (l)Ft+1n TDt (l)Xt TPtW=0 (3);
再采用以下公式对公式(3)中bT进行计算:
Figure BDA0001535272940000111
2、代入bT的结果,化简目标函数(1),再对W求导并使其等于0;
同1类似,先将其展开,涉及目标函数中的后面两项,然后对这展开式中与W有关的对W求导并化简,得到公式(5):
Figure BDA0001535272940000112
为了方便表示,令Ht=Dt (l)1n(1n TDt (l)1n)-11n TDt (l),则上式可以表示为公式(6):
(μPt TXtDt (l)Xt TPt-2μPt TXtHtXt TPt+γI)W=μ(Pt TXtDt (l)Ft-Pt TXtHtFt) (6);
通过以下公式对公式(6)中的W进行计算:
W=μ(μPt TXtDt (l)Xt TPt-2μPt TXtHtXt TPt+γI)-1(Pt TXtDt (l)-Pt TXtHt)Ft (7);
进一步,为了方便下一步计算Pt,用At表示前半部分:
At=μ(μPt TXtDt (l)Xt TPt-2μPt TXtHtXt TPt+γI)-1(Pt TXtDt (l)-Pt TXtHt) (8);
再通过以下公式对公式(7)中W进行计算:
W=AtFt(9);
3、代入bT的结果,化简目标函数(1),再对Pt T求导并使其等于0;
根据所提算法和目标函数可知,Pt T和W相互影响,相互关联。所以在对Pt T求导化简的时候,先将W看做常量,然后能够化简得到Pt T的迭代式。
同2类似,先将其展开,涉及目标函数中的第三项,然后对这一项中与Pt T有关的对Pt T求导并化简,得到:
WWTPt TXtDt (l)Xt T-WFt TDt (l)Xt T+WFt THtXt T-2WWTPt TXtHtXt T=0;
将上述公式化简后,得到公式:WWTPt TXt(Dt (l)-2Ht)Xt T=WFt T(Dt (l)-Ht)Xt T,根据化简公式计算出公式(10):
Pt T=(WT)-1Ft T(Dt (l)-Ht)Xt TXt(Dt (l)-2Ht)Xt T (10);
这里,为了方便表示,用Bt表示后半部分:
Bt=(Dt (l)-Ht)Xt TXt(Dt (l)-2Ht)Xt T (11);
则Pt T可以表示为Pt T=(WT)-1Ft TBt,将公式(9)代入化简得到Pt T的表达式:
Pt T=(At T)-1Bt (12);
4、代入bT、W和Pt T的结果,化简目标函数(1),再对Ft求导并使其等于0;
同3类似,先将其展开,涉及目标函数中的前三项,然后对这展开式中与Ft有关的对Ft求导并化简,得到公式(13):
Figure BDA0001535272940000121
进一步化简得到下面公式(14):
Figure BDA0001535272940000122
则计算出Ft=(Lt+U+μ(Dt (l)+BtXtHt+HtXt TBt T-BtXtDt (l)-Dt (l)Xt TBt T-2Ht))-1UYt,为了方便表示,令:
Mt=(Lt+U+μ(Dt (l)+BtXtHt+HtXt TBt T-BtXtDt(l)-Dt(l)Xt TBtT-2Ht))-1 (15);
Qt=UYt (16);
则Ft可以表示为公式(17):
Ft=MtQt (17);
如此,基于上述转换得到的目标函数,再利用迭代方法通过上述求解过程能依次按顺序得到预测标签矩阵Ft,样本投影矩阵Pt,标签投影矩阵W,以及偏差项b。
下面给出基于图学习的多视图半监督特征提取算法过程:
1)获取训练和测试图像;
2)输入:第t个视图的训练样本矩阵表示为
Figure BDA0001535272940000123
训练样本的标记矩阵为Y∈Rn×c
3)随机初始化Ft,Pt,W和b,t=1,2,...,m;
4)计算第t个视图的拉普拉斯矩阵Lt
5)迭代;
具体地,(a)根据Dt (l)计算公式(2),计算出Dt (l)的值,t=1,2,...,m;
(b)t=1,2,...,m循环计算:
先计算Ht=Dt (l)1n(1n TDt (l)1n)-11n TDt (l)
然后分别根据公式(8)、(11)、(15)、(16)计算At、Bt、Mt、Qt
接着分别根据公式(17)、(12)更新Ft、Pt T
(c)根据公式(9)、(4)更新W、bT
6)直到Ft、Pt T、W、bT收敛,t=1,2,...,m,返回结果;
7)输出:最优化分类参数矩阵,即标签投影矩阵为W∈Rd×c
8)将上面求出的投影矩阵对样本进行投影,将其投影到低维空间,这样能够得到新的低维空间中存在的样本特征集合;
9)利用标签投影矩阵对样本的标签进行计算;
10)对测试样本进行分类。
通过本发明实施例提供的方案利用基于图的半监督学习方法得到各个视图对应的投影矩阵,求得投影矩阵之后可用于对数据样本的投影并分类。鉴于半监督学习方法是目前研究较多的技术,可以用来解决传统有监督和无监督方法进行特征提取方面存在不足的问题。将半监督学习方法成功运用在多个视图(或特征集)里面。可以实现在多视图学习中,有标签样本占少数以及无标签样本占多数的情况下,利用少数有标签的样本蕴含的标签信息,再充分利用大量的无标签样本进行特征提取。
这时由于近年来在模式识别领域,对于多视图的学习研究引起了众多学者的广泛关注。在许多计算机视觉应用中,同一物体可以从不同的角度来观察,也可以通过使用不同的传感器来连接获取信息。从而获得多个不同角度或者不同形式的样本,甚至完全互异也有可能。例如,对于一张人脸,其照片可以从不同的视角拍,会得到多种姿态的人脸图像;同样也可以通过可见光或近红外照明分别来获取可见光图像或近红外图像,这些不同的图像就可以看作一张人脸的多个视图。最近,越来越多的研究考虑通过从视图间和视图内两个方面同时来进行分类。然而,来自不同视图的样本必定会依附于完全互异的空间。在此基础上,这些来自不同视图的样本是不能直接相互比较的。所以视图间和视图内的共同分类基本上是不能直接进行的。因此,处理这个问题的方法是尝试去学习一个多视图能够共享的公共空间。在获得这个公共空间之后,就能够解决上述来自多个视图的样本不可以直接相互比较的问题。
图3为本发明实施例中数据的分类装置的结构示意图一,如图3所示,所述装置包括:301获取单元、计算单元302、分类单元303和确定单元304;
其中,所述获取单元301,用于获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
所述计算单元302,用于根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
所述分类单元303,用于根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
所述确定单元304,用于根据所述分类信息,确定所述待测试样本所属的类别。
本发明实施例中,所述装置还包括:训练单元305;
所述训练单元305,用于对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;所述获取单元301,用于根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
本发明实施例中,所述投影矩阵中至少包括样本投影矩阵。
所述分类单元303,具体用于使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。
本发明实施例中,所述投影矩阵中至少包括标签投影矩阵;
所述计算单元302,还用于根据所述标签投影矩阵对所述待测试样本进行计算,得到表征所述待测试样本所属类别的标签;所述分类单元303,具体还用于根据所述标签对所述待测试样本进行数据分类。
本发明实施例中,所述分类单元303在根据所述样本特征数据对所述待测试样本进行数据分类之前,所述计算单元302还用于对所述标签投影矩阵以及偏差项进行共用。
当所述计算单元302对所述标签投影矩阵以及偏差项进行共用时,所述分类单元最终对测试样本进行分类后的数据也是共用的。
需要说明的是:上述实施例提供的分类装置在进行对测式样本进行分类时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将分类装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的数据的分类装置与数据的分类方法实施例二者属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4为本发明实施例中数据的分类装置的结构组成示意图二;如图4所示,所述分类装置400可以是移动电话、计算机、数字广播终端、信息收发设备、游戏控制台、平板设备、个人数字助理、信息推送服务器、内容服务器、身份认证服务器等。图4所示的分类装置400包括:至少一个处理器401、存储器402、至少一个网络接口404和用户接口403。分类装置400中的各个组件通过总线系统405耦合在一起。可理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统405。
其中,用户接口403可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器402可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
本发明实施例中的存储器402用于存储各种类型的数据以支持分类装置400的操作。这些数据的示例包括:用于在分类装置400上操作的任何计算机程序,如操作系统4021和应用程序4022;其中,操作系统4021包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序4022可以包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。
上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器401可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,分类装置400可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
具体所述处理器401运行所述计算机程序时,执行:获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
根据所述分类信息,确定所述待测试样本所属的类别。
所述处理器401运行所述计算机程序时,还执行:对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;
根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
所述投影矩阵中至少包括样本投影矩阵;所述处理器401运行所述计算机程序时,还执行:使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。
所述投影矩阵中至少包括标签投影矩阵;所述处理器401运行所述计算机程序时,还执行:根据所述标签投影矩阵对所述待测试样本进行计算,得到表征所述待测试样本所属类别的标签;根据所述标签对所述待测试样本进行数据分类。
所述处理器401运行所述计算机程序时,还执行:对所述标签投影矩阵以及偏差项进行共用。
在示例性实施例中,本发明实施例还提供了一种计算机可读存储介质,例如包括计算机程序的存储器402,上述计算机程序可由分类装置400的处理器401执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备,如移动电话、计算机、平板设备、个人数字助理等。
一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器运行时,执行:检测到影像启用操作时,生成弹出指令;
向所述设备中的运动机构发送所述弹出指令,使所述运动机构以第一运动方式运动,并驱动所述设备中的拍摄单元向所述设备的第一方向移动,使得所述拍摄单元能够获取影像数据。
该计算机程序被处理器运行时,还执行:获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
根据所述分类信息,确定所述待测试样本所属的类别。
该计算机程序被处理器运行时,还执行:对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;
根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
所述投影矩阵中至少包括样本投影矩阵;该计算机程序被处理器运行时,还执行:使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;
根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。
所述投影矩阵中至少包括标签投影矩阵;该计算机程序被处理器运行时,还执行:根据所述标签投影矩阵对所述待测试样本进行计算,得到表征所述待测试样本所属类别的标签;
根据所述标签对所述待测试样本进行数据分类。
该计算机程序被处理器运行时,还执行:对所述标签投影矩阵以及偏差项进行共用。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种数据的分类方法,其特征在于,所述方法包括:
获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
根据所述分类信息,确定所述待测试样本所属的类别;
其中,所述投影矩阵通过以下公式获取:
Figure FDA0002409320660000011
其中,矩阵变量中:Tr表示迹、F为预测标签矩阵、Lt为拉普拉斯矩阵、Y为真实标签矩阵、U∈Rn×n为决策规则对角矩阵、Pt为投影矩阵、
Figure FDA0002409320660000014
为第t个视图的训练样本矩阵、W∈Rd ×c为多个视图共用的标签投影矩阵、b∈Rc为多个视图共用的偏差项、上标T是一个运算符号,表示转置;
变量和参数:视图编号t、视图个数m、平衡参数μ、平衡参数γ;
常量和计算符号:全1向量1n、正则化项
Figure FDA0002409320660000012
矩阵M的l2,1范数定义为:
Figure FDA0002409320660000013
而Tr(Ft TLtFt)是基于图的半监督学习方法的局部保留,F同时满足在训练数据和图形模型S中基本真实标签的平滑性;拉普拉斯矩阵Lt是从视图特征Xt=[x1,x2,x3....xn]中计算所得,这里,Xt=[x1,x2,x3....xn]是对于第t个视图的数据;
Tr((Ft-Yt)TU(Ft-Yt))在基于图的半监督学习方法中,要使得预测标签矩阵F应同时满足在训练数据和图形模型S中基本真实标签的平滑性;
μ||(Pt TXt)TW+1nbT-Ft||2,1是一个具有鲁棒性的分类器,该分类器应该能够容忍带有噪声标签的样本,并且采用广义的l2,1损耗,其中μ是平衡参数;W∈Rd×c是多个视图共用的标签投影矩阵,b∈Rc是多个视图共用的偏差项;
Figure FDA0002409320660000021
是正则化项,1n是一个全1向量;矩阵M的l2,1范数定义为:
Figure FDA0002409320660000022
其中,Mi是M的第i行;
在μ||(Pt TXt)TW+1nbT-Ft||2,1中,Pt TXt用Pt矩阵对样本Xt进行投影之后对样本进行降维和去噪,然后对每个视图将其标签投影矩阵W以及用于降噪的偏差项b进行共用;
Figure FDA0002409320660000023
则是加入正则项。
2.根据权利要求1所述的方法,其特征在于,所述获取图像数据库中每个视图在投影空间分别对应的投影矩阵,包括:
对图像数据库中的每个视图进行样本训练,得到每个视图的训练模型;
根据所述训练模型获取所述图像数据库中每个视图在投影空间分别对应的投影矩阵。
3.根据权利要求2所述的方法,其特征在于在,所述投影矩阵中至少包括样本投影矩阵;
所述根据所述样本特征数据对所述待测试样本进行数据分类,包括:
使用所述样本投影矩阵对所述待测试样本进行投影,得到投影后的所述待测试样本的样本特征数据;
根据投影后的所述待测试样本的样本特征数据对所述待测试样本数据进行分类。
4.根据权利要求2所述的方法,其特征在于,所述投影矩阵中至少包括标签投影矩阵;
所述根据所述样本特征数据对所述待测试样本进行数据分类,包括:
根据所述标签投影矩阵对所述待测试样本进行计算,得到表征所述待测试样本所属类别的标签;
根据所述标签对所述待测试样本进行数据分类。
5.根据权利要求4所述的方法,其特征在于,在根据所述样本特征数据对所述待测试样本进行数据分类之前,所述方法还包括:
对所述标签投影矩阵以及偏差项进行共用。
6.一种数据的分类装置,其特征在于,所述装置包括:获取单元、计算单元、分类单元和确定单元;
其中,所述获取单元,用于获取图像数据库中每个视图在投影空间分别对应的投影矩阵;
所述计算单元,用于根据所述投影矩阵对待测试样本进行迭代计算,得到所述待测试样本的样本特征数据;
所述分类单元,用于根据所述样本特征数据对所述待测试样本进行数据分类,得到所述待测试样本的分类信息;
所述确定单元,用于根据所述分类信息,确定所述待测试样本所属的类别;
其中,所述投影矩阵通过以下公式获取:
Figure FDA0002409320660000031
其中,矩阵变量中:Tr表示迹、F为预测标签矩阵、Lt为拉普拉斯矩阵、Y为真实标签矩阵、U∈Rn×n为决策规则对角矩阵、Pt为投影矩阵、
Figure FDA0002409320660000034
为第t个视图的训练样本矩阵、W∈Rd ×c为多个视图共用的标签投影矩阵、b∈Rc为多个视图共用的偏差项、上标T是一个运算符号,表示转置;
变量和参数:视图编号t、视图个数m、平衡参数μ、平衡参数γ
常量和计算符号:全1向量1n、正则化项
Figure FDA0002409320660000032
矩阵M的l2,1范数定义为:
Figure FDA0002409320660000033
而Tr(Ft TLtFt)是基于图的半监督学习方法的局部保留,F同时满足在训练数据和图形模型S中基本真实标签的平滑性;拉普拉斯矩阵Lt是从视图特征Xt=[x1,x2,x3....xn]中计算所得,这里,Xt=[x1,x2,x3....xn]是对于第t个视图的数据;
Tr((Ft-Yt)TU(Ft-Yt))在基于图的半监督学习方法中,要使得预测标签矩阵F应同时满足在训练数据和图形模型S中基本真实标签的平滑性;
μ||(Pt TXt)TW+1nbT-Ft||2,1是一个具有鲁棒性的分类器,该分类器应该能够容忍带有噪声标签的样本,并且采用广义的l2,1损耗,其中μ是平衡参数;W∈Rd×c是多个视图共用的标签投影矩阵,b∈Rc是多个视图共用的偏差项;
Figure FDA0002409320660000041
是正则化项,1n是一个全1向量;矩阵M的l2,1范数定义为:
Figure FDA0002409320660000042
其中,Mi是M的第i行;
在μ||(Pt TXt)TW+1nbT-Ft||2,1中,Pt TXt用Pt矩阵对样本Xt进行投影之后对样本进行降维和去噪,然后对每个视图将其标签投影矩阵W以及用于降噪的偏差项b进行共用;
Figure FDA0002409320660000043
则是加入正则项。
7.一种数据的分类装置,其特征在于,所述装置包括:存储器和处理器;
其中,所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于运行所述计算机程序时,执行权利要求1至5任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。
CN201711489062.3A 2017-12-29 2017-12-29 一种数据的分类方法、装置及存储介质 Active CN108108769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711489062.3A CN108108769B (zh) 2017-12-29 2017-12-29 一种数据的分类方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711489062.3A CN108108769B (zh) 2017-12-29 2017-12-29 一种数据的分类方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN108108769A CN108108769A (zh) 2018-06-01
CN108108769B true CN108108769B (zh) 2020-08-25

Family

ID=62215269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711489062.3A Active CN108108769B (zh) 2017-12-29 2017-12-29 一种数据的分类方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN108108769B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008987B (zh) * 2019-02-20 2022-02-22 深圳大学 分类器鲁棒性的测试方法、装置、终端及存储介质
CN110781837B (zh) * 2019-10-28 2023-05-05 苏州大学 一种基于声呐信号的物体分类方法、装置、设备及介质
CN111488951B (zh) * 2020-05-22 2023-11-28 南京大学 一种用于rgb-d图像分类的对抗度量学习模型生成方法
CN113221941B (zh) * 2021-03-22 2024-01-09 哈尔滨工业大学(深圳) 一种自适应对称图信息传播的鉴别回归分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335756A (zh) * 2015-10-30 2016-02-17 苏州大学 一种鲁棒学习模型与图像分类系统
CN105354595A (zh) * 2015-10-30 2016-02-24 苏州大学 一种鲁棒视觉图像分类方法及系统
CN105956612A (zh) * 2016-04-25 2016-09-21 西安电子科技大学 基于主动学习和半监督学习的高光谱图像分类方法
CN107169505A (zh) * 2017-04-01 2017-09-15 南京邮电大学 一种基于核统计不相关的多视图的图像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335756A (zh) * 2015-10-30 2016-02-17 苏州大学 一种鲁棒学习模型与图像分类系统
CN105354595A (zh) * 2015-10-30 2016-02-24 苏州大学 一种鲁棒视觉图像分类方法及系统
CN105956612A (zh) * 2016-04-25 2016-09-21 西安电子科技大学 基于主动学习和半监督学习的高光谱图像分类方法
CN107169505A (zh) * 2017-04-01 2017-09-15 南京邮电大学 一种基于核统计不相关的多视图的图像分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multi-view Semi-supervised Learning for Web Image Annotation;Mengqiu Hu;《Proceedings of the 23rd ACM international conference on multimedia》;20151231;947-950页 *
一种基于半监督多任务学习的特征选择模型;王晓栋;《厦门大学学报》;20170731;567-575页 *
基于多视图半监督学习的图像识别;奚晓钰 等;《计算机技术与发展》;20170927;48-51页 *

Also Published As

Publication number Publication date
CN108108769A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
Tang et al. RGBT salient object detection: Benchmark and a novel cooperative ranking approach
Yan et al. Ranking with uncertain labels
Boussaad et al. Deep-learning based descriptors in application to aging problem in face recognition
CN108108769B (zh) 一种数据的分类方法、装置及存储介质
Duong et al. Deep appearance models: A deep boltzmann machine approach for face modeling
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
Rafique et al. Deep fake detection and classification using error-level analysis and deep learning
CN107590505B (zh) 联合低秩表示和稀疏回归的学习方法
Gao et al. Human action recognition on depth dataset
Marinoni et al. Unsupervised data driven feature extraction by means of mutual information maximization
Zhang et al. Weakly supervised human fixations prediction
Zheng et al. Fusing shape and spatio-temporal features for depth-based dynamic hand gesture recognition
Huang et al. Extreme learning machine with multi-scale local receptive fields for texture classification
An et al. Integrating appearance features and soft biometrics for person re-identification
Mao et al. 3dg-stfm: 3d geometric guided student-teacher feature matching
Fan et al. A hierarchical Dirichlet process mixture of generalized Dirichlet distributions for feature selection
Singh et al. A novel position prior using fusion of rule of thirds and image center for salient object detection
Zhang et al. Robust visual tracking using multi-frame multi-feature joint modeling
An Pedestrian Re‐Recognition Algorithm Based on Optimization Deep Learning‐Sequence Memory Model
Singh et al. Performance enhancement of salient object detection using superpixel based Gaussian mixture model
Xu et al. Person re-identification based on improved attention mechanism and global pooling method
Rani et al. PoolNet deep feature based person re-identification
Ramos-Arredondo et al. PhotoId-Whale: Blue whale dorsal fin classification for mobile devices
Zheng et al. Template‐Aware Transformer for Person Reidentification
Yadav et al. End-to-end bare-hand localization system for human–computer interaction: a comprehensive analysis and viable solution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant