CN112926502A - 基于核化双群稀疏学习的微表情识别方法及系统 - Google Patents
基于核化双群稀疏学习的微表情识别方法及系统 Download PDFInfo
- Publication number
- CN112926502A CN112926502A CN202110307024.1A CN202110307024A CN112926502A CN 112926502 A CN112926502 A CN 112926502A CN 202110307024 A CN202110307024 A CN 202110307024A CN 112926502 A CN112926502 A CN 112926502A
- Authority
- CN
- China
- Prior art keywords
- micro
- expression
- group
- double
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 151
- 230000014509 gene expression Effects 0.000 claims abstract description 56
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 38
- 238000013507 mapping Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 230000000903 blocking effect Effects 0.000 claims description 2
- YDGMGEXADBMOMJ-LURJTMIESA-N N(g)-dimethylarginine Chemical compound CN(C)C(\N)=N\CCC[C@H](N)C(O)=O YDGMGEXADBMOMJ-LURJTMIESA-N 0.000 claims 1
- 230000003416 augmentation Effects 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 3
- 238000010187 selection method Methods 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 5
- 230000008451 emotion Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000008921 facial expression Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006911 nucleation Effects 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于核化双群稀疏学习的微表情识别方法及系统,该方法主要包括:(1)从微表情数据集样本中分别提取两组不同类型的特征向量,构建相应的特征矩阵;(2)对每个特征向量赋予一个权重,构建核化双群稀疏学习模型,用于学习每个特征向量的权重;(3)求解核化双群稀疏学习模型,得到每个特征向量的权重;(4)对于输入的测试视频,提取两组不同类型的特征,并将权重高于阈值的特征向量拼接在一起作为微表情特征向量;(5)使用分类器对微表情特征向量进行分类,得到微表情类别。本发明利用微表情数据集中的训练样本学习每个特征向量的权重,从两组不同特征中自动筛选出最优特征向量用于微表情识别,能够有效提升识别准确率。
Description
技术领域
本发明涉及情感识别和人工智能技术领域,尤其涉及一种基于核化双群稀疏学习的微表情识别方法及系统。
背景技术
人脸表情识别技术是计算机理解人类情感的基础,也是探索智能人机交互的有效途径。机器人利用交互信息对用户真实情感的探索有利于提升人机交互的和谐友好性。然而,由于自身防御机制的影响,人类经常会试图压抑或隐藏自身的真实情感状态,即在生活中,除了普通面部表情(即宏表情)外,还存在着另一种很难被察觉到的表情——微表情(micro-expression)。与宏表情相比,微表情最显著的特点是持续时间短、强度弱,其持续时间在0.04~0.20s,是人类试图压抑或隐藏真实情感时不由自主流露出的非常短暂的、不受主观意志控制的情感表达。微表情自身的不可伪装性携带着人类试图隐藏的真实情感。针对微表情的情感认知分析有助于在自然的人机交互过程中识别出人类的真实情感状态,有利于促进人机交互的和谐友好性。另一方面,微表情可作为测试谎言和行为分析的重要线索,微表情识别在测谎、抑郁症和精神分裂症等心理疾病的临床诊断以及侦查审讯等领域具有潜在的应用前景。例如,在临床医疗护理中,如果能够知道患者,尤其是有表达障碍的患者的情感状态,就可以采取不同的护理措施,以提高护理质量;在侦查审讯、解救人质谈判中可以利用犯罪嫌疑人的微表情变化来判断其内心的变化以及口供真伪。
由于微表情具有动作幅度小、持续时间短的特点,所以很难被人眼察觉。依靠人工识别微表情受限于专业培训,费时费力,且识别率不高,在已知的文献报道中识别率只有47%。随着计算机视觉技术的进步,微表情的自动识别已成为研究热点,但就目前的研究现状而言,微表情识别的准确率较低,仍然是面临挑战的开放课题。
微表情特征的提取是微表情识别系统中最为关键的一步,提取的特征是否有效直接影响微表情识别的准确率。在微表情识别中,常用的特征包括纹理特征、时空梯度特征和基于光流的运动特征。当使用不同类型的多种特征进行特征融合时,如果不加选择地使用过多的特征必然会产生特征冗余,过高的特征向量维数不仅会增加计算复杂度,而且会导致识别准确率的下降,引起“维数灾难”问题。对于这个问题,目前有两种解决方案,一种方案是对维数高的特征向量进行降维处理,另外一种方案是对特征进行择优选择。对于降维方法,由于相同类型的不同特征具有较强的相关性,降维并不能够彻底解决特征冗余的问题;另外,缩减的维数是有限度的,当特征向量的维数被缩减到一定的维数时,特征的信息就有可能丢失。而特征选择是根据某种评价准则对特征集中各个特征的重要性进行评估,从原始特征集中剔除不相关或冗余的特征,筛选出具有良好区分特性的特征子集,以降低特征向量的维数。
本专利发明人在最近的研究中发现,如果在提取LBP-TOP(Local Binary Patternfrom Three Orthogonal Planes)特征的基础上添加补充单方向梯度直方图HSDG(Histogram of Single Direction Gradient)特征,将优选的HSDG特征向量与LBP-TOP特征向量进行拼接后作为微表情的特征向量,则可以提升微表情的识别率。但是研究中也发现,有些HSDG特征向量与LBP-TOP特征向量进行拼接后作为微表情的特征向量,并不能提高微表情识别的准确率,反而会降低识别率,因而需要通过大量实验轮流测试每个HSDG特征向量,然后挑选出最优的HSDG特征向量。然而,这种通过人工手段来挑选最优的特征向量是不切实际的。
发明内容
发明目的:针对现有微表情识别方法存在特征选择困难、识别准确率低的问题,本发明的目的是提供一种基于核化双群稀疏学习的微表情识别方法及系统,通过构建一种核化的双群稀疏学习模型,利用微表情数据集中的训练样本学习两组不同特征中每个特征向量的重要性权重,从两组不同特征中自动筛选出稀疏的最优特征向量用于微表情识别,以提高微表情识别的准确率。
技术方案:为实现上述发明目的,本发明采用如下技术方案:
一种基于核化双群稀疏学习的微表情识别方法,包括以下步骤:
(1)从微表情视频样本中提取两组不同类型的特征,得到第一组特征向量和第二组特征向量;所有样本的第一组特征向量和第二组特征向量分别组成第一组特征矩阵和第二组特征矩阵其中i=1,2,…,N1,j=1,2,…,N2,M为样本数量,N1和N2分别为第一组特征向量和第二组特征向量的个数,d1和d2分别为第一组特征向量和第二组特征向量中向量的维数;
(2)对两组特征中的每个特征向量赋予一个重要性权重,构建如下双群稀疏学习模型并拓展为核化的双群稀疏学习模型:
其中,是微表情视频样本的标签向量组成标签矩阵,c是微表情类别数;Un是将特征矩阵映射到标签矩阵的映射矩阵;||·||F是Frobenius范数;αn是第n个特征向量的重要性权重;λ和μ为正则化系数;上标T表示矩阵的转置;
(3)求解核化的双群稀疏学习模型,得到两组特征中每个特征向量的重要性权重;
(4)对于输入的测试视频,提取两组不同类型的特征,根据步骤(3)中求得的每个特征向量的重要性权重,分别筛选出权重高于设定阈值的特征向量,并将筛选出的特征向量拼接起来,得到微表情特征向量;
(5)使用分类器对微表情特征向量进行分类,得到微表情类别。
作为优选方案,所述核化的双群稀疏学习模型表示为:
作为优选方案,在步骤(3)中,求解核化双群稀疏学习模型的步骤如下:
(3.2)固定αA k和αB k,计算Hk+1;
(3.3)固定αA k和αB k,更新Pk+1:
其中,zn=vec((Pk+1)TKn),n=1,2,…,N1+N2,vec(·)表示矩阵的向量化操作;
(3.5)固定Pk+1,更新αA k+1和αB k+1:
其中,I=vec(L);
(3.6)k=k+1;
(3.7)当k<MaxIter时,转到步骤(3.2)执行,否则停止迭代,得到最优的αA和αB。
作为优选方案,在步骤(3.3)中,采用不精确增广拉格朗日乘子法(InexactAugmented Lagrange Multiplier,IALM)求解最优的Pk+1。
作为优选方案,在步骤(3.5)中,采用交替方向法(Alternating DirectionMethods,ADM)交替地求解αA k+1和αB k+1。
作为优选方案,所提取的两组不同类型的特征是LBP-TOP特征和HSDG特征,采用分块策略将微表情视频样本划分为不同的块,针对每个块提取LBP-TOP特征向量,从而得到一组LBP-TOP特征向量;提取微表情视频样本在不同方向上的HSDG特征向量,从而得到一组HSDG特征向量。
基于相同的发明构思,本发明提供的一种基于核化双群稀疏学习的微表情识别系统,包括:
特征提取模块,用于从微表情视频样本中提取两组不同类型的特征,得到第一组特征向量和第二组特征向量;所有样本的第一组特征向量和第二组特征向量分别组成第一组特征矩阵和第二组特征矩阵其中i=1,2,…,N1,j=1,2,…,N2,M为样本数量,N1和N2分别为第一组特征向量和第二组特征向量的个数,d1和d2分别为第一组特征向量和第二组特征向量中向量的维数;
特征选择模块,用于对两组特征中的每个特征向量赋予一个重要性权重,构建如下双群稀疏学习模型并拓展为核化的双群稀疏学习模型后进行求解,得到两组特征中每个特征向量的重要性权重;
其中,是微表情视频样本的标签向量组成标签矩阵,c是微表情类别数;Un是将特征矩阵映射到标签矩阵的映射矩阵;||·||F是Frobenius范数;αn是第n个特征向量的重要性权重;λ和μ为正则化系数;上标T表示矩阵的转置;
以及,分类识别模块,用于对于输入的测试视频,提取两组不同类型的特征,根据特征选择模块求得的每个特征向量的重要性权重,分别筛选出权重高于设定阈值的特征向量,并将筛选出的特征向量拼接起来,得到微表情特征向量;使用分类器对微表情特征向量进行分类,得到微表情类别。
基于相同的发明构思,本发明提供的一种基于核化双群稀疏学习的微表情识别系统,包括至少一台计算设备,该计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的一种基于核化双群稀疏学习的微表情识别方法。
有益效果:与现有技术相比,本发明具有以下技术效果:
(1)本发明针对微表情识别中采用两组不同类型特征时存在特征选择困难的问题,提出一种基于核化双群稀疏学习的特征选择方法,通过构建一种核化的双群稀疏学习模型,利用微表情数据集中的训练样本学习两组不同特征中每个特征向量的重要性权重,并运用优化算法求解每个特征向量的重要性权重,从两组不同特征中自动筛选出稀疏的最优特征向量用于微表情识别,可以提高微表情识别的准确率,实验结果验证了本发明提出的基于核化双群稀疏学习的特征选择方法能够提升微表情识别的准确率。
(2)在本发明构建的核化双群稀疏学习模型中,λ和μ为可调的正则化系数,可以根据两组不同类型的特征对于微表情识别的不同重要性的先验知识来初始设定,并可以灵活调整。
(3)在本发明构建的核化双群稀疏学习模型中,通过引入“核函数”的技巧,不需要定义复杂的非线性操作子的显式表达式,即不必将Xn和Un真正映射到核空间分别得到和而Xn和Un映射到核空间后两两之间的内积和可以由核函数k(Xn,Un)和k(Xn,Xn)确定。
(4)本发明采用不精确增广拉格朗日乘子法(IALM)和交替方向法(ADM)求解核化双群稀疏学习模型的优化问题,求解出每个特征向量的权重系数,具有收敛速度快、运行时间短的优点。
(5)本发明采用基于核化双群稀疏学习方法优选在LBP-TOP特征和HSDG特征之间进行选择,能够更好地适用于微表情识别,具有较高的微表情识别准确率。
附图说明
图1是本发明实施例的方法流程图。
图2是本发明实施例中HSDG的18方向解释图。
具体实施方式
为了更加详细了解本发明,下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
如图1所示,本发明实施例公开的一种基于核化双群稀疏学习的微表情识别方法,首先从微表情数据集样本中分别提取两组不同类型的特征向量,构建相应的特征矩阵;然后对每个特征向量赋予一个重要性权重,构建核化双群稀疏学习模型,用于学习每个特征向量的权重;再求解核化双群稀疏学习模型,得到每个特征向量的权重;最后对于输入的测试视频,提取两组不同类型的特征,并将权重高于阈值的特征向量拼接在一起作为微表情特征向量,使用分类器对微表情特征向量进行分类,得到微表情类别。本发明实施例中数据集样本的标签矩阵和特征矩阵的表示如下:
从微表情数据集中选择M个微表情视频样本,设微表情类别数为c,每个微表情视频样本的类别标签采用one-hot编码,M个微表情视频样本的标签向量组成标签矩阵首先,对于第m个(m=1,2,…,M)微表情视频样本,提取两组不同类型的特征:和其中,第一组特征包含N1个特征向量,第i个特征向量为第二组特征包含N2个特征向量,第j个特征向量为然后,将M个微表情视频样本的第一组特征中的第i个特征向量组成第一组特征矩阵 将M个微表情视频样本的第二组特征中的第j个特征向量组成第二组特征矩阵最后,将M个微表情视频样本的第一组特征中的N1个特征向量组成特征矩阵将M个微表情视频样本的第二组特征中的N2个特征向量组成特征矩阵其中,D1=d1×N1,D2=d2×N2。其中所提取的视频样本的特征可以是LBP-IP、LBP-TOP、LBP-SIP、光流OF、方向梯度直方图HOG、单方向梯度直方图HSDG等。为了更直观理解本发明,下面以本发明在SMIC-HS微表情数据集上的应用为例,详细说明本发明方法的各个具体步骤。本领域技术人可以理解的是,本发明的保护范围不局限于本实施例所使用的特定的微表情数据集和特征种类。
本实施例中采用的SMIC-HS微表情数据集包含164个样本,三种微表情类别,即M=164,c=3。本实施例提取的两组特征是LBP-TOP特征和HSDG(特征。HSDG计算某一方向上的梯度并进行量化,最后采用直方图操作得到特征向量。研究发现,LBP-TOP在拼接某些方向上的HSDG后,可以达到一个优秀的识别率,因此本发明优选将这两个特征作为本发明的实施例。LBP-TOP和HSDG特征的具体提取过程如下:首先,对微表情数据集中的视频样本进行人脸检测、裁剪、对齐和尺寸归一化等预处理,采用分块策略将每个视频样本划分为8×8×2个块;然后,对每个块提取48维的LBP-TOP特征向量,得到128个48维的LBP-TOP特征向量,即N1=128,d1=48;同时提取在18个方向上的HSDG特征向量(18个方向的选取如图2,Pv是中心像素点,例如,存在点①,则为一个方向;对于十八个点的确定,假设Pv的坐标为((Px,Py,Pt),在前后Rt帧上选取18个点,假设某一点相对中心点坐标的距离为(x,y,z),则该点坐标为(Px+x,Py+y,Pt+z),其中,x=Rx,0,-Rx,y=Ry,0,-Ry,z=Rt,-Rt,Rx、Ry、Rt分别是图像长度、宽度和帧长方向的步长,本实例中,Rx=Ry=Rt=3),每个方向上的HSDG特征向量的维数为256,得到18个256维的HSDG特征向量,即N2=18,d2=256。
具体地,本发明实施例提供的一种基于核化双群稀疏学习的微表情识别方法,主要包括如下步骤:
(1)从SMIC-HS微表情数据集中选择164个微表情视频样本,每个微表情视频样本的类别标签采用one-hot编码,164个微表情视频样本的标签向量组成标签矩阵对于每个微表情视频样本,分别提取128个48维的LBP-TOP特征向量和18个256维的HSDG特征向量;然后,将164个微表情视频样本的第i个LBP-TOP特征向量组成第一组特征矩阵i=1,2,...,128,将164个微表情视频样本的第j个HSDG特征向量组成第二组特征矩阵最后,将164个微表情视频样本的128个48维的LBP-TOP特征向量组成特征矩阵 将164个微表情视频样本的18个256维的HSDG特征向量组成特征矩阵
(2)对步骤(1)提取的两组特征中的每个特征向量赋予一个重要性权重,具体地,令第一组的128个48维的LBP-TOP特征向量对应的权重向量为第二组的18个256维的HSDG特征向量对应的权重向量为然后通过以下两个子步骤来构建一个核化双群稀疏学习模型,用于学习每个特征向量的重要性权重。
(2.1)构建一个双群稀疏学习模型:
其中,Un是将特征矩阵映射到标签矩阵的映射矩阵,是一个可学习的矩阵;||·||F是Frobenius范数;和为正则化惩罚项,用于约束αA和αB的稀疏性,使冗余特征向量的权重尽可能为0;λ和μ为可调的正则化系数,分别决定αA和αB的稀疏程度,即λ值越大,αA中包含的0元素越多,同理μ值越大,αB中包含的0元素越多;在本实施例中,取λ=0.0045,μ=0.09;
(2.2)将双群稀疏学习模型拓展为核化的双群稀疏学习模型:
(3)求解核化双群稀疏学习模型,得到最优的权重向量αA和αB,具体步骤如下:
(3.2)固定αA k和αB k,计算Hk+1,其中,上标k和k+1表示迭代次数;
(3.3)固定αA k和αB k,采用不精确增广拉格朗日乘子法(IALM)求解下式的优化问题,求得最优的P,更新Pk+1:
其中,zn=vec((Pk+1)TKn),n=1,2,...,146,vec(·)表示矩阵的向量化操作;
(3.5)固定Pk+1,采用交替方向法(ADM)求解下式的优化问题,求得最优的αA和αB,更新αA k+1和αB k+1:
其中,I=vec(L);
(3.6)k=k+1;
(3.7)当k<MaxIter时,转到步骤(3.2)执行,否则停止迭代,得到最优的αA和αB。
(4)对于输入的测试视频,提取两组不同类型的特征,设定阈值T1=0,T2=2.3,根据步骤(3)中求得的最优的αA和αB,得到每个特征向量的重要性权重,从第一组的128个LBP-TOP特征向量中筛选出权重高于阈值T1的特征向量,从第二组的18个HSDG特征向量中筛选出权重高于阈值T2的特征向量,并将筛选出的所有特征向量拼接在一起作为微表情特征向量。
(5)使用基于支持向量机(SVM)的分类器对微表情特征向量进行分类,得到微表情类别。
本发明的有益效果可以通过表1中的对比实验结果进一步说明。
表1特征选择方法在SMIC-HS微表情数据集上的性能比较
特征选择方法 | 识别率 | F1-分数 |
128LBP-top | 64.97% | 0.5935 |
128LBP-top+18HSDG | 60.75% | 0.5750 |
128LBP-top+HSDG | 67.86% | 0.6136 |
本发明的方法 | 75.64% | 0.6821 |
在表1中,“128LBP-TOP”表示没有采用HSDG特征向量和特征选择方法,只将第一组的128个LBP-TOP特征向量拼接在一起作为微表情特征向量;“128LBP-TOP+18HSDG”表示没有采用特征选择方法,直接将第一组的128个LBP-TOP特征向量与第二组的18个HSDG特征向量拼接在一起作为微表情特征向量;“128LBP-TOP+HSDG”表示将第一组的128个LBP-TOP特征向量与最优的1个HSDG特征向量拼接在一起作为微表情特征向量。对比“128LBP-TOP”和“128LBP-TOP+18HSDG”的识别性能可以看出来,由于不同类型特征效用的区别,并不是特征取的越多越好,如果不加选择地使用过多的特征必然会产生特征冗余,过高的特征向量维数不仅会增加计算复杂度,反而会带来干扰,导致微表情识别性能的下降。对比“128LBP-TOP”和“128LBP-TOP+HSDG”的识别性能可以看出来,在LBP-TOP特征向量的基础上有选择地拼接HSDG特征向量,可以起到互补的作用,能提升微表情识别性能。对比本发明提出的特征选择方法与其他方法,使用基于核化双群稀疏学习的特征选择方法得到的微表情特征向量能够获得最佳的识别性能,本发明具有明显的优势,从而验证了本发明提出的基于核化双群稀疏学习的特征选择方法的有效性。
基于相同的发明构思,本发明实施例提供的基于核化双群稀疏学习的微表情识别系统,包括:
特征选择模块,用于对两组特征中的每个特征向量赋予一个重要性权重,构建双群稀疏学习模型并拓展为核化的双群稀疏学习模型后进行求解,得到两组特征中每个特征向量的重要性权重;
以及,分类识别模块,用于对于输入的测试视频,提取两组不同类型的特征,根据特征选择模块求得的每个特征向量的重要性权重,分别筛选出权重高于设定阈值的特征向量,并将筛选出的特征向量拼接起来,得到微表情特征向量;使用分类器对微表情特征向量进行分类,得到微表情类别。
各模块的具体实现参考上述方法实施例,不再赘述。本领域技术人员可以理解,可以对实施例中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个系统中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。
基于相同的发明构思,本发明实施例提供的基于核化双群稀疏学习的微表情识别系统,包括至少一台计算设备,该计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现上述的基于核化双群稀疏学习的微表情识别方法。
本发明所公开的技术方案既包含了上述实施方案中涉及的技术方法,也包括由以上技术方法任意组合成的技术方案。本技术领域的普通技术人员,在不脱离本发明的原理的前提下,可以作出一定的改善和修饰,这些改善和修饰也被认为本发明的保护范围。
Claims (8)
1.一种基于核化双群稀疏学习的微表情识别方法,其特征在于,该方法包括以下步骤:
(1)从微表情视频样本中提取两组不同类型的特征,得到第一组特征向量和第二组特征向量;所有样本的第一组特征向量和第二组特征向量分别组成第一组特征矩阵和第二组特征矩阵其中i=1,2,…,N1,j=1,2,…,N2,M为样本数量,N1和N2分别为第一组特征向量和第二组特征向量的个数,d1和d2分别为第一组特征向量和第二组特征向量中向量的维数;
(2)对两组特征中的每个特征向量赋予一个重要性权重,构建如下双群稀疏学习模型并拓展为核化的双群稀疏学习模型:
s.t.αn≥0,n=1,2,…,N1+N2
其中,是微表情视频样本的标签向量组成标签矩阵,c是微表情类别数;Un是将特征矩阵映射到标签矩阵的映射矩阵;||·||F是Frobenius范数;αn是第n个特征向量的重要性权重;λ和μ为正则化系数;上标T表示矩阵的转置;
(3)求解核化的双群稀疏学习模型,得到两组特征中每个特征向量的重要性权重;
(4)对于输入的测试视频,提取两组不同类型的特征,根据步骤(3)中求得的每个特征向量的重要性权重,分别筛选出权重高于设定阈值的特征向量,并将筛选出的特征向量拼接起来,得到微表情特征向量;
(5)使用分类器对微表情特征向量进行分类,得到微表情类别。
3.根据权利要求2所述的一种基于核化双群稀疏学习的微表情识别方法,其特征在于,在步骤(3)中,求解核化的双群稀疏学习模型的步骤如下:
(3.2)固定αA k和αB k,计算Hk+1;
(3.3)固定αA k和αB k,更新Pk+1:
其中,zn=vec((Pk+1)TKn),n=1,2,…,N1+N2,vec(·)表示矩阵的向量化操作;
(3.5)固定Pk+1,更新αA k+1和αB k+1:
s.t.αn≥0,n=1,2,…,N1+N2
其中,I=vec(L);
(3.6)k=k+1;
(3.7)当k<MaxIter时,转到步骤(3.2)执行,否则停止迭代,得到最优的αA和αB。
4.根据权利要求3所述的一种基于核化双群稀疏学习的微表情识别方法,其特征在于,在步骤(3.3)中,采用不精确增广拉格朗日乘子法IALM求解最优的Pk+1。
5.根据权利要求3所述的一种基于核化双群稀疏学习的微表情识别方法,其特征在于,在步骤(3.5)中,采用交替方向法ADM交替地求解αA k+1和αB k+1。
6.根据权利要求1所述的一种基于核化双群稀疏学习的微表情识别方法,其特征在于,所提取的两组不同类型的特征是LBP-TOP特征和HSDG特征,采用分块策略将微表情视频样本划分为不同的块,针对每个块提取LBP-TOP特征向量,从而得到一组LBP-TOP特征向量;提取微表情视频样本在不同方向上的HSDG特征向量,从而得到一组HSDG特征向量。
7.一种基于核化双群稀疏学习的微表情识别系统,其特征在于,包括:
特征提取模块,用于从微表情视频样本中提取两组不同类型的特征,得到第一组特征向量和第二组特征向量;所有样本的第一组特征向量和第二组特征向量分别组成第一组特征矩阵和第二组特征矩阵其中i=1,2,…,N1,j=1,2,…,N2,M为样本数量,N1和N2分别为第一组特征向量和第二组特征向量的个数,d1和d2分别为第一组特征向量和第二组特征向量中向量的维数;
特征选择模块,用于对两组特征中的每个特征向量赋予一个重要性权重,构建如下双群稀疏学习模型并拓展为核化的双群稀疏学习模型后进行求解,得到两组特征中每个特征向量的重要性权重;
s.t.αn≥0,n=1,2,…,N1+N2
其中,是微表情视频样本的标签向量组成标签矩阵,c是微表情类别数;Un是将特征矩阵映射到标签矩阵的映射矩阵;||·||F是Frobenius范数;αn是第n个特征向量的重要性权重;λ和μ为正则化系数;上标T表示矩阵的转置;
以及,分类识别模块,用于对于输入的测试视频,提取两组不同类型的特征,根据特征选择模块求得的每个特征向量的重要性权重,分别筛选出权重高于设定阈值的特征向量,并将筛选出的特征向量拼接起来,得到微表情特征向量;使用分类器对微表情特征向量进行分类,得到微表情类别。
8.一种基于核化双群稀疏学习的微表情识别系统,其特征在于,包括至少一台计算设备,该计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现根据权利要求1-6任一项所述的一种基于核化双群稀疏学习的微表情识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110307024.1A CN112926502B (zh) | 2021-03-23 | 2021-03-23 | 基于核化双群稀疏学习的微表情识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110307024.1A CN112926502B (zh) | 2021-03-23 | 2021-03-23 | 基于核化双群稀疏学习的微表情识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926502A true CN112926502A (zh) | 2021-06-08 |
CN112926502B CN112926502B (zh) | 2022-07-29 |
Family
ID=76175510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110307024.1A Active CN112926502B (zh) | 2021-03-23 | 2021-03-23 | 基于核化双群稀疏学习的微表情识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926502B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378998A (zh) * | 2021-07-12 | 2021-09-10 | 西南石油大学 | 一种基于机器学习的地层岩性随钻识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097020A (zh) * | 2019-05-10 | 2019-08-06 | 山东大学 | 一种基于联合稀疏字典学习的微表情识别方法 |
CN111832426A (zh) * | 2020-06-23 | 2020-10-27 | 东南大学 | 基于双稀疏迁移学习的跨库微表情识别方法及装置 |
-
2021
- 2021-03-23 CN CN202110307024.1A patent/CN112926502B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097020A (zh) * | 2019-05-10 | 2019-08-06 | 山东大学 | 一种基于联合稀疏字典学习的微表情识别方法 |
CN111832426A (zh) * | 2020-06-23 | 2020-10-27 | 东南大学 | 基于双稀疏迁移学习的跨库微表情识别方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378998A (zh) * | 2021-07-12 | 2021-09-10 | 西南石油大学 | 一种基于机器学习的地层岩性随钻识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112926502B (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liao et al. | Deep facial spatiotemporal network for engagement prediction in online learning | |
Yu et al. | Corn leaf diseases diagnosis based on K-means clustering and deep learning | |
CN109472194B (zh) | 一种基于cblstm算法模型的运动想象脑电信号特征识别方法 | |
Alani et al. | Hand gesture recognition using an adapted convolutional neural network with data augmentation | |
CN107609460B (zh) | 一种融合时空双重网络流和attention机制的人体行为识别方法 | |
CN109685819B (zh) | 一种基于特征增强的三维医学图像分割方法 | |
CN110309856A (zh) | 图像分类方法、神经网络的训练方法及装置 | |
CN111797683A (zh) | 一种基于深度残差注意力网络的视频表情识别方法 | |
CN112488205B (zh) | 基于优化kpca算法的神经网络图像分类识别方法 | |
CN112668366B (zh) | 图像识别方法、装置、计算机可读存储介质及芯片 | |
CN105139004A (zh) | 基于视频序列的人脸表情识别方法 | |
CN113989890A (zh) | 基于多通道融合和轻量级神经网络的人脸表情识别方法 | |
Huang et al. | End-to-end continuous emotion recognition from video using 3D ConvLSTM networks | |
CN108875655A (zh) | 一种基于多特征的实时目标视频跟踪方法及系统 | |
CN109165698A (zh) | 一种面向智慧交通的图像分类识别方法及其存储介质 | |
Pandian et al. | Fusion of contourlet transform and zernike moments using content based image retrieval for MRI brain tumor images | |
CN114781441B (zh) | Eeg运动想象分类方法及多空间卷积神经网络模型 | |
He et al. | What catches the eye? Visualizing and understanding deep saliency models | |
CN114187546B (zh) | 组合性动作识别方法及系统 | |
CN113239866B (zh) | 一种时空特征融合与样本注意增强的人脸识别方法及系统 | |
Singh et al. | Performance enhancement of salient object detection using superpixel based Gaussian mixture model | |
CN112926502B (zh) | 基于核化双群稀疏学习的微表情识别方法及系统 | |
CN115330759B (zh) | 一种基于豪斯多夫距离计算距离损失的方法及装置 | |
CN112132253A (zh) | 3d动作识别方法、装置、计算机可读存储介质及设备 | |
CN113591797B (zh) | 一种深度视频行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 210003, 66 new model street, Gulou District, Jiangsu, Nanjing Applicant after: NANJING University OF POSTS AND TELECOMMUNICATIONS Address before: No. 186, software Avenue, Yuhuatai District, Nanjing, Jiangsu Province, 210012 Applicant before: NANJING University OF POSTS AND TELECOMMUNICATIONS |
|
GR01 | Patent grant | ||
GR01 | Patent grant |