CN107358172B - 一种基于人脸朝向分类的人脸特征点初始化方法 - Google Patents

一种基于人脸朝向分类的人脸特征点初始化方法 Download PDF

Info

Publication number
CN107358172B
CN107358172B CN201710485262.5A CN201710485262A CN107358172B CN 107358172 B CN107358172 B CN 107358172B CN 201710485262 A CN201710485262 A CN 201710485262A CN 107358172 B CN107358172 B CN 107358172B
Authority
CN
China
Prior art keywords
face
training
orientation
human face
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710485262.5A
Other languages
English (en)
Other versions
CN107358172A (zh
Inventor
秦华标
黄波
廖才满
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710485262.5A priority Critical patent/CN107358172B/zh
Publication of CN107358172A publication Critical patent/CN107358172A/zh
Application granted granted Critical
Publication of CN107358172B publication Critical patent/CN107358172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于人脸朝向分类的人脸特征点初始化方法,属于图像处理和计算机视觉领域。该方法的实现过程为:首先对每一张新输入的人脸图像,提取其HOG特征,通过随机森林的决策树投票得到其朝向分类标签,不同的朝向选取对应训练子集特征点的均值作为其初始化值。由于在同一类朝向下人脸特征点位置分布趋势差异不大,但是在类别不同的人脸朝向下特征点位置分布趋势有很明显的变化,因此采用与输入人脸图像相同朝向的特征点均值来初始化的方法可以降低人脸朝向的变化对特征点初始化的影响,从而提高人脸特征点初始化的准确率。

Description

一种基于人脸朝向分类的人脸特征点初始化方法
技术领域
本发明属于图像处理和计算机视觉领域,具体是一种基于人脸朝向分类的人脸特征点初始化方法。
背景技术
人脸特征点检测是一种自动人脸标定算法,其研究目的在于通过对人脸图像进行分析,获取一组预先定义好的足以描述人脸形状结构的特征点位置信息。作为计算机视觉领域内的一项基础研究,人脸特征点检测有着重要的研究意义和应用前景。对许多人脸图像相关的算法,如人脸识别、表情识别、性别识别、年龄识别、人脸动画、视频压缩等,人脸特征点检测往往是其必须的环节。
传统的人脸特征点检测算法主要包括主动形状模型、主动外观模型等。然而,这些方法在实际应用中对特征点的初始化结果都较为敏感。如果特征点初始化结果与真实位置差异过大,会影响后续的特征点检测精度。常规的人脸特征点初始化方法通常只针对正脸,无法处理姿势变化的情况。而在人脸多姿态变化的场景下,由于不同姿态的人脸图像人脸特征点分布差异很大,选择不同的姿态作为检测的初始值,会导致人脸特征点检测出现不同的偏差。根据不同的特征点检测模型,采用初始化的方法也不一样,其中主要有随机初始化、基于统计学习的初始化、渐进式回归初始化这三种。
随机初始化的思路是,不需要对输入的人脸图像进行区别处理,而是采用统一的多次随机取均值的方式,其本质上是通过取多次随机求均值降低总体随机误差。在人脸特征点检测的过程中,通过多次随机选取训练样本中不同的初始形状,进行多次重启人脸回归模型,取多次回归的结果均值作为最终的定位结果。基于统计学习的初始化方法是通过概率统计的方式代替随机抽取的方式,利用先验知识对人脸一些显著的特征点进行估计,如眼睛、嘴巴等关键位置,而后用于初始化。渐进式回归初始化的思路是由于人脸不同部位特征点分布不同,其对应检测的难度也不一样,因此不同部位的特征点对初始化的依赖也各不一样。在初始化的过程中,渐进式初始化将初始化分为三个不同的初始化过程,特征点检测的难度从易到难。造成算法复杂度较高。可见,随机初始化的算法简单、快速,但由于不同姿态下的训练样本的特征点分布差异性很大,导致随机初始化在人脸姿态变化的情况下不能保证初始化的有效性。而基于统计学习的方法对特征的选取十分依赖,渐进式回归的初始化效率不高。
因此,需要提出一种高效可靠的人脸特征点初始化方法,以增强人脸特征点检测算法的鲁棒性。
发明内容
本发明的目的是解决人脸特征点检测算法对特征点初始化结果敏感的问题。通过设计一种人脸特征点初始化算法,确定输入人脸图像的特征点初始位置,以提高后续人脸特征点检测的精度。本发明通过如下技术方案实现。
一种基于人脸朝向分类的人脸特征点初始化方法,该方法包括分类器建立方法和人脸特征点初始化方法两个部分:分类器建立方法为根据人脸朝向的不同,将训练样本划分为多类,同时得到人脸特征点概率分布模型;然后对训练样本中的所有人脸图像分别提取其特征并降维;最后由随机森林分类器进行训练,得到人脸朝向分类器模型;
人脸特征点初始化方法为对输入的人脸图像,提取能显示脸部形态变化的特征并降维,通过随机森林的决策树投票得到其朝向分类标签,然后从人脸特征点概率分布模型中选择具有相同朝向的特征点分布作为该人脸图像的特征点初始化的结果。
进一步地,将人脸朝向分为多类,降低因朝向变化造成的人脸特征点初始化的误差,同时根据每一类特征点分布的均值得到人脸特征点概率分布模型;首先要选取合适的角度值A1、A2,A1<A2,把训练集中人脸朝向划分为不同类,其中平动角Yaw在-A1~+A1,分为正脸朝向,+A1~+A2分为右脸朝向,-A1~-A2分为左脸朝向;A1代表角度值大小,-代表偏左的旋转角度,+代表偏右的旋转角度;其中人脸朝向以平动角Yaw、转动角Pitch变化组合而成,Pitch∈{-45°,0°,+45°}三个离散姿态。
进一步地,对训练集合内所有的样本,分别提取其HOG特征,并按行排成特征矩阵;然后利用PCA对特征矩阵降维并保留90%的主成分;构建随机森林决策树,将降维后的特征矩阵进行归一化,并将归一化的特征矩阵送进分类器进行训练得到人脸朝向分类器模型。
进一步地,根据输入的人脸图像的朝向来初始化人脸特征点,包括如下步骤:对输入的人脸图像提取能充分显示其形态变化和朝向信息的HOG特征,并利用PCA算法降低提取的特征的冗余信息从而提高效率;然后将降维后的特征送到随机森林分类器,通过决策树投票得到模型预测的人脸朝向;最后利用人脸特征点概率分布模型中具有相同朝向的特征点分布来初始化输入图像的人脸特征点。
进一步地,作为优选的方案,基于人脸朝向分类的人脸特征点初始化方法,该方法包括如下具体步骤:(1)根据人脸朝向把训练集划分成多类,本方法取三类,得到三种子集,并计算每一类相对应的特征点位置的均值,从而得到人脸特征点概率分布模型。(2)在分类器建立过程中,对训练集的所有样本提取HOG(Histogram of Oriented Gradient,方向梯度直方图)特征。(3)对训练集提取的HOG特征用PCA(Principal Component Analysis,主成分分析)算法保留90%的主成分来进行降维。(4)构建随机森林决策树,将降维后的HOG特征送到分类器进行训练,得到人脸朝向分类器模型。(5)在人脸特征点初始化过程中将输入的人脸图像提取HOG特征并降维后送到分类器进行分类,得到相应的人脸朝向,然后用相同朝向训练子集的人脸特征点概率分布模型初始化该人脸图像。
上述方法中,所述的步骤(1),包括:首先要选取合适的角度值A1、A2(A1<A2)把训练集中人脸朝向划分为不同类,其中平动角(Yaw)在-A1~+A1(A1代表角度值大小,-代表偏左的旋转角度,+代表偏右的旋转角度)分为正脸朝向,+A1~+A2分为右脸朝向,-A1~-A2分为左脸朝向;其中人脸朝向以平动角(Yaw)、转动角(Pitch)变化组合而成,Pitch∈{-45°,0°,+45°}三个离散姿态;本方法把平动角为-A1~+A1且任意转动角下的情况归为一类;另外两种分类也是如此;本方法选取A1为30°,A2为60°,则-30°~+30°分为正脸朝向,+30°~+60°分为右脸朝向,-30°~-60°分为左脸朝向。同时,将正脸的标签定为1,右脸的标签定为2,左脸的标签定为3。
上述方法中,所述的步骤(2),包括:对训练集中的每一张图片提取HOG特征,并将该特征存到一个行数与样本数量一样的Mat(opencv库的图片类型)型变量里。
上述方法中,所述的步骤(3),包括:对步骤(2)中得到的特征矩阵利用PCA算法进行降维,保留90%的主成分。
上述方法中,所述的步骤(4),包括:在分类器建立阶段,首先需要从不同人脸朝向的图像训练数据集D中采用bagging(bootstrap aggregating)采样的方法随机抽出N个训练子集,每个训练子集而后用于生成一棵决策树。每一次抽样都是随机且有放回的,每个训练子集的大小可取总样本集的二分之一或三分之二,这样可以保证每个训练子集里的样本存在一定的差异性,从而提高最后决策的泛化能力。当通过bagging采样得到训练子数据集后,需要为每个训练子数据集分别构建成一棵决策树,从而组成森林。由于随机森林的随机性防止了过拟合,因此在树的生成过程中不需要剪枝。在节点分裂的过程中,决策树的当前节点特征m是从训练子数据集中的M维特征中随机选取(m<M),每一个节点的分裂准则是基于基尼系数(Gini coefficient)的选择方法,即通过比较基尼系数与设定的阀值来决定分裂的方向。这样选出最优的属性特征,作为该节点的分裂属性。最后通过分裂函数将节点分裂成左右子树,直到不再分裂为止。
上述方法中,所述的步骤(5),包括:在人脸特征点初始化过程中将输入的人脸图像提取HOG特征并降维后送到分类器中,决策树对输入的数据进行投票决策得到样本的朝向分类结果,然后用相同朝向训练子集的特征点均值初始化该人脸图像。
与现有技术相比,本发明具有如下优点和技术效果:本发明通过将人脸朝向分成三个子类,减弱了特征点初始化过程中由于人脸朝向的差异带来的初始化的误差;同时结合HOG特征和随机森林的方法来得到更加精确的人脸朝向,再利用相对应子集特征点的均值来初始化人脸特征点,进一步提高了人脸特征点初始化的精度。
附图说明
图1是基于人脸朝向分类的人脸特征点初始化方法的整体流程图。
图2是计算细胞单元的方向梯度直方图。
图3是人脸朝向分类算法流程图。
图4特征点初始化流程图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
结合图1,具体实施方式如下:
步骤1:根据人脸朝向的角度,将人脸朝向在-30°~+30°(-代表偏左的旋转角度,+代表偏右的旋转角度)分为正脸朝向,+30°~+60°分为右脸朝向,-30°~-60°分为左脸朝向。同时,将正脸的标签定为1,右脸的标签定为2,左脸的标签定为3。
步骤2:训练得到人脸朝向分类器模型,具体步骤如下:
2.1)对训练样本中的每一张人脸图像提取HOG特征并利用PCA降维,具体步骤如下:
a)计算梯度幅值和方向。
梯度的计算采用的是积分模板对人脸图像I(x,y)(x,y表示图像矩阵的下标)进行卷积,见式(1)、(2),得到幅值G(x,y),方向θ(x,y)。
Figure GDA0001398675210000051
Figure GDA0001398675210000052
b)计算细胞单元的方向梯度直方图,见图2。
如图2所示,将人脸图像平均分割成10×10的像素细胞单元(Cell),将梯度方向(0-179)等分为9个区间,接下来根据求得的像素点梯度值对该细胞单元中所有的像素点对应的梯度值进行加权累加,统计得到其梯度方向直方图。
c)合并细胞单元
通常为了更好地描述图像的梯度特征,需要将细胞单元组成更大的一个区间,称为区间块(Block)。本文取相邻四个细胞单元组成一个块,其大小为20×20。由于每个细胞单元由9维向量组成,因此,每个块中特征向量有9×4=36维。
d)组合区间块向量,得到HOG特征
在具体的实现过程中,通常还需要用滑动窗口在图像上对区间块进行采样,本文选取的窗口大小为40×40,窗口的滑动步长为40,区间块在窗口中的滑动步长为10。如图3所示,每个块在窗口里滑动次数为
Figure GDA0001398675210000053
那么窗口在人脸图像中滑动次数为
Figure GDA0001398675210000054
所以最后得到的人脸HOG特征为36×12×30=12960维。同样,需要对提取得到的HOG特征进行PCA降维,得到400维。
2.2)构建随机森林决策树,主要分为三个步骤
a)随机抽样生成训练子集
在训练阶段,首先需要从不同人脸朝向的图像训练数据集D中采用bagging采样的方法随机抽出N个训练子集,每个训练子集而后用于生成一棵决策树。每一次抽样都是随机且有放回的,每个训练子集的大小可取总样本集的二分之一或三分之二,这样可以保证每个训练子集里的样本存在一定的差异性,从而提高最后决策的泛化能力,本文抽样子集取二分之一。
b)构建决策树
当通过bagging采样得到训练子数据集后,需要为每个训练子数据集分别构建成一棵决策树,从而组成森林。由于随机森林的随机性防止了过拟合,因此在树的生成过程中不需要剪枝。在节点分裂的过程中,决策树的当前节点特征m是从训练子数据集中的M维特征中随机选取(m<M),每一个节点的分裂准则是基于基尼系数(Gini coefficient)的选择方法,即通过比较基尼系数与设定的阀值来决定分裂的方向。这样选出最优的属性特征,作为该节点的分裂属性。最后通过分裂函数将节点分裂成左右子树,直到不再分裂为止。由于基于基尼系数的分裂方法不仅可以处理离散数据,还可以处理连续数据,增强了决策树的鲁棒性。如式(3)所示:
Figure GDA0001398675210000061
其中pi为当前样本属于分类i的概率,分类总的类别为n,C为样本集。接着根据所选择的特征作为当前节点的属性,把训练样本分裂为左右两个子树中,设为CL和CR(L代表左边方向,R代表右边方向),分别计算其基尼系数大小,如式(4),选取基尼系数最小的样本划分特征作为当前节点的属性。
Figure GDA0001398675210000062
其中,i表示取左或者取右,Ci表示左子集或者右子集。
C)投票决策
在重复执行步骤1和2后就可以得到N个决策树,由其构成的决策森林用于新的人脸测试集的决策。当输入新的人脸测试样本后,决策树对输入的数据进行投票决策得到样本的朝向分类结果。
步骤3:将输入的人脸图像提取HOG特征并降维后送到分类器中,决策树对输入的数据进行投票决策得到样本的朝向分类结果,然后用相同朝向训练子集的特征点均值初始化该人脸图像。如图4所示。

Claims (1)

1.一种基于人脸朝向分类的人脸特征点初始化方法,其特征在于包括:
步骤1:根据人脸朝向的角度,将人脸朝向在-30°~+30°分为正脸朝向,+30°~+60°分为右脸朝向,-30°~-60°分为左脸朝向,其中-代表偏左的旋转角度,+代表偏右的旋转角度;同时,将正脸的标签定为1,右脸的标签定为2,左脸的标签定为3;
步骤2:训练得到人脸朝向分类器模型,具体步骤如下:
2.1)对训练样本中的每一张人脸图像提取HOG特征并利用PCA降维,具体步骤如下:
a)计算梯度幅值和方向;
梯度的计算采用的是积分模板对人脸图像I(x,y)进行卷积,见式(1)、(2),得到幅值G(x,y),方向θ(x,y),x,y表示图像矩阵的下标;
Figure FDA0003509075440000011
Figure FDA0003509075440000012
b)计算细胞单元的方向梯度直方图;
将人脸图像平均分割成10×10的像素细胞单元,将梯度方向(0-179)等分为9个区间,接下来根据求得的像素点梯度值对该细胞单元中所有的像素点对应的梯度值进行加权累加,统计得到其梯度方向直方图;
c)合并细胞单元
通常为了更好地描述图像的梯度特征,需要将细胞单元组成更大的一个区间,称为区间块;取相邻四个细胞单元组成一个块,其大小为20×20;由于每个细胞单元由9维向量组成,因此,每个块中特征向量有9×4=36维;
d)组合区间块向量,得到HOG特征
在具体的实现过程中,通常还需要用滑动窗口在图像上对区间块进行采样,选取的窗口大小为40×40,窗口的滑动步长为40,区间块在窗口中的滑动步长为10;每个块在窗口里滑动次数为
Figure FDA0003509075440000013
那么窗口在人脸图像中滑动次数为
Figure FDA0003509075440000021
所以最后得到的人脸HOG特征为36×12×30=12960维;同样,需要对提取得到的HOG特征进行PCA降维,得到400维;
2.2)构建随机森林决策树,主要分为三个步骤
a)随机抽样生成训练子集
在训练阶段,首先需要从不同人脸朝向的图像训练数据集D中采用bagging采样的方法随机抽出N个训练子集,每个训练子集而后用于生成一棵决策树;每一次抽样都是随机且有放回的,每个训练子集的大小可取总样本集的二分之一或三分之二,这样可以保证每个训练子集里的样本存在一定的差异性,从而提高最后决策的泛化能力,本文抽样子集取二分之一;
b)构建决策树
当通过bagging采样得到训练子数据集后,需要为每个训练子数据集分别构建成一棵决策树,从而组成森林;由于随机森林的随机性防止了过拟合,因此在树的生成过程中不需要剪枝;在节点分裂的过程中,决策树的当前节点特征m是从训练子数据集中的M维特征中随机选取,m<M,每一个节点的分裂准则是基于基尼系数的选择方法,即通过比较基尼系数与设定的阀值来决定分裂的方向;这样选出最优的属性特征,作为该节点的分裂属性;最后通过分裂函数将节点分裂成左右子树,直到不再分裂为止;由于基于基尼系数的分裂方法不仅可以处理离散数据,还可以处理连续数据,增强了决策树的鲁棒性;如式(3)所示:
Figure FDA0003509075440000022
其中pi为当前样本属于分类i的概率,分类总的类别为n,C为样本集;接着根据所选择的特征作为当前节点的属性,把训练样本分裂为左右两个子树中,设为CL和CR,L代表左边方向,R代表右边方向,分别计算其基尼系数大小,如式(4),选取基尼系数最小的样本划分特征作为当前节点的属性;
Figure FDA0003509075440000023
其中,i表示取左或者取右,Ci表示左子集或者右子集;
C)投票决策
在重复执行步骤1和2后就可以得到N个决策树,由其构成的决策森林用于新的人脸测试集的决策;当输入新的人脸测试样本后,决策树对输入的数据进行投票决策得到样本的朝向分类结果;
步骤3:将输入的人脸图像提取HOG特征并降维后送到分类器中,决策树对输入的数据进行投票决策得到样本的朝向分类结果,然后用相同朝向训练子集的特征点均值初始化该人脸图像。
CN201710485262.5A 2017-06-22 2017-06-22 一种基于人脸朝向分类的人脸特征点初始化方法 Active CN107358172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710485262.5A CN107358172B (zh) 2017-06-22 2017-06-22 一种基于人脸朝向分类的人脸特征点初始化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710485262.5A CN107358172B (zh) 2017-06-22 2017-06-22 一种基于人脸朝向分类的人脸特征点初始化方法

Publications (2)

Publication Number Publication Date
CN107358172A CN107358172A (zh) 2017-11-17
CN107358172B true CN107358172B (zh) 2022-05-24

Family

ID=60273640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710485262.5A Active CN107358172B (zh) 2017-06-22 2017-06-22 一种基于人脸朝向分类的人脸特征点初始化方法

Country Status (1)

Country Link
CN (1) CN107358172B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197547B (zh) * 2017-12-26 2019-12-17 深圳云天励飞技术有限公司 人脸姿态估计方法、装置、终端及存储介质
US10993417B2 (en) * 2019-08-14 2021-05-04 International Business Machines Corporation Detection and management of disease outbreaks in livestock using health graph networks
CN110738110A (zh) * 2019-09-11 2020-01-31 北京迈格威科技有限公司 基于锚点的人脸关键点检测方法、装置、系统和存储介质
CN111444787B (zh) * 2020-03-12 2023-04-07 江西赣鄱云新型智慧城市技术研究有限公司 一种性别约束的全智能化人脸表情识别方法及系统
CN113011280A (zh) * 2021-02-26 2021-06-22 清华大学 人员接触距离的检测方法、装置、计算机设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004284024A (ja) * 2003-03-19 2004-10-14 Ricoh Co Ltd 相変化光記録媒体
CN103268497B (zh) * 2013-06-18 2016-03-09 厦门大学 一种人脸姿态检测方法与在人脸识别中的应用
CN105760809B (zh) * 2014-12-19 2019-05-31 联想(北京)有限公司 用于头部姿态估计的方法和设备
CN104615996B (zh) * 2015-02-15 2017-11-21 四川川大智胜软件股份有限公司 一种多视角二维人脸特征点自动定位方法
CN105069430B (zh) * 2015-08-05 2016-09-14 杭州南江机器人股份有限公司 一种基于msnrd特征的多姿态人脸检测器的设计方法
CN106682598B (zh) * 2016-12-14 2021-02-19 华南理工大学 一种基于级联回归的多姿态的人脸特征点检测方法

Also Published As

Publication number Publication date
CN107358172A (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN107358172B (zh) 一种基于人脸朝向分类的人脸特征点初始化方法
Lerch-Hostalot et al. Unsupervised steganalysis based on artificial training sets
CN108038435B (zh) 一种基于卷积神经网络的特征提取与目标跟踪方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
WO2014205231A1 (en) Deep learning framework for generic object detection
Meng et al. Weakly supervised semantic segmentation by a class-level multiple group cosegmentation and foreground fusion strategy
CN109033978B (zh) 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN112784929A (zh) 一种基于双元组扩充的小样本图像分类方法及装置
Mahmood et al. A Comparative study of a new hand recognition model based on line of features and other techniques
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
Saqib et al. Intelligent dynamic gesture recognition using CNN empowered by edit distance
Khokher et al. A super descriptor tensor decomposition for dynamic scene recognition
Elsayed et al. Hand gesture recognition based on dimensionality reduction of histogram of oriented gradients
Cho Content-based structural recognition for flower image classification
Chen et al. Cluster trees of improved trajectories for action recognition
Zamzami et al. An accurate evaluation of msd log-likelihood and its application in human action recognition
Dong et al. Kinship classification based on discriminative facial patches
CN115294424A (zh) 一种基于生成对抗网络的样本数据增强方法
Xing et al. Dynamic texture classification based on bag-of-models with mixture of student’s t-hidden Markov models
CN111695526B (zh) 网络模型生成方法、行人重识别方法及装置
CN112329803B (zh) 一种基于标准字形生成的自然场景文字识别方法
CN111507243A (zh) 一种基于格拉斯曼流形分析的人体行为识别方法
Hema et al. Patch-SIFT: Enhanced feature descriptor to learn human facial emotions using an Ensemble approach
Li et al. CRF with locality-consistent dictionary learning for semantic segmentation
Wang et al. Self-trained video anomaly detection based on teacher-student model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant