CN110516608A

CN110516608A - 一种基于多模态数据异常检测的微表情识别方法

Info

Publication number: CN110516608A
Application number: CN201910802576.2A
Authority: CN
Inventors: 詹德川; 盛祥荣; 陆苏; 姜�远
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2019-08-28
Filing date: 2019-08-28
Publication date: 2019-11-29
Anticipated expiration: 2039-08-28
Also published as: CN110516608B

Abstract

本发明公开了一种基于多模态数据异常检测的微表情识别方法，具体来说，基于计算机视觉技术对被测试者视频进行预处理得到多模态数据集，然后利用基于局部近邻的多模态异常检测技术得到每一帧图像的异常度得分，最后依据预设阈值，判定异常度大于阈值的图像含有微表情。本发明实施过程中可以自动、高效、准确地识别被测试者视频中的微表情，节省人力成本。

Description

一种基于多模态数据异常检测的微表情识别方法

技术领域

本发明涉及一种基于多模态数据异常检测的微表情识别方法，属于计算机视觉技术领域。

背景技术

微表情是指人类试图压抑或隐藏真实情感时泄露的短暂而不能自主控制的面部表情。在很多领域中，比如司法审讯，临床医学等领域，微表情检测得到了广泛关注，需要对被检测者进行微表情识别来挖掘被检测者的真实情绪和意图。由于微表情通常持续时间短并且强度低于正常表情，我们一般需要对于被测试者的测试视频里的每一帧图像进行单独分析，以此来检测识别微表情。

目前，微表情识别严重依赖于人力，要识别长视频中的微表情，只能依靠专家进行识别，而微表情识别专家往往非常稀缺。因此，需要一种能够自动、高效的微表情识别的方法。

发明内容

发明目的：针对现有技术中存在的问题与不足，本发明提供一种基于多模态数据异常检测的微表情识别方法，具体来说，首先利用计算机视觉技术对视频进行预处理，随后利用基于局部近邻的多模态数据异常检测算法对微表情进行识别。

技术方案：一种基于多模态数据异常检测的微表情识别方法，包括基于计算机视觉的面部图像预处理步骤和基于局部近邻的多模态数据异常检测步骤；

所述基于计算机视觉的面部图像预处理步骤具体为：

步骤100，输入被测试者的测试视频；

步骤101，将测试视频的每一帧图像作为一条样本添加到数据集中；

步骤102，将每个样本根据面部的上半部分和下半部分分为两个模态得到多模态数据集；由于微表情十分微弱，可能只出现在面部上半部分或者下半部分。还有少量微表情会同时出现在面部上半部分和下半部分。这两类微表情恰好对应了多模态数据中的两类异常点。具体来说，在面部上半部分和下半部分同时出现的微表情对应于多模态数据中的一致异常数据，即模态之间一致且异常的数据；只在面部上半部分或者下半部分出现的微表情对应于多模态数据中的不合异常数据，即模态之间表现不一致的异常数据；

步骤103，使用LBP算法提取多模态面部数据的特征；

步骤104，面部图像预处理完成。

所述基于局部近邻的多模态数据异常检测步骤具体为：

步骤200，输入多模态面部数据集；

步骤201，初始化多模态面部数据集中每个面部图像样本的正常度得分为1，用S-score表示正常度，异常度的分为1-S-score＝0；

步骤202，对于每个面部图像样本的每个模态，计算它与其他样本的“正常距离”，“正常距离”计算方式为样本距离*S-score；对于样本i，样本j与样本i的“正常距离”为i，j之间距离*样本j的S-score；

步骤203，对于每个面部图像样本，在每个模态寻找K个距离该样本“正常距离”最小的样本作为其K正常近邻；把所有样本的正常近邻用矩阵W表示，若样本j为样本i的K正常近邻，则W第i行第j列为1，否则为0；

步骤204，将所有面部图像样本的S-score用向量O表示，向量O的第i维为样本i的S-score；优化目标O^TWO^T，得到样本更新后的正常度向量O和S-score；优化方法可以选择区间放松优化技术或者谱放松优化技术。其中区间放松优化技术放松整数约束为连续区间约束，整体上可以取得很好的检测结果。谱放松优化技术放松整数约束为谱约束，检测效果相比区间优化技术效果会有一定损失，但可以大幅加速检测时间。

步骤205，重复步骤202、步骤203、204，直至收敛；

步骤206，输出数据集中每个面部图像样本的异常度打分1-S-score；

步骤207，根据预先设立好的阈值判定异常度高于阈值的面部图像包含微表情。

有益效果：与现有技术相比，本发明所提供的基于多模态数据异常检测的微表情识别方法，实施过程中可以自动、高效、准确地识别被测试者视频中的微表情，节省人力成本。具体优点如下：

一、本发明首先根据计算机视觉技术预处理被测试者视频得到多模态数据集。其中的构思是：由于微表情十分微弱，可能只出现在面部上半部分或者下半部分；还有少量微表情会同时出现在面部上半部分和下半部分；这两类微表情恰好对应了多模态数据中的两类异常点。具体来说，在面部上半部分和下半部分同时出现的微表情对应于多模态数据中的一致异常数据，即模态之间一致且异常的数据；只在面部上半部分或者下半部分出现的微表情对应于多模态数据中的不合异常数据，即模态之间表现不一致的异常数据。

二、通过计算机视觉技术将被测试者视频预处理得到多模态数据集后，本发明使用基于局部近邻的多模态异常检测技术来检测被测试者视频中的微表情。这其中的构思是：对于多模态异常样本，其在某一个模态的正常近邻在其他模态与该样本相似度小，将相似度累加后可以得到样本正常度得分S-score，随后可以通过1-S-core计算得到该样本的异常度得分。基于局部近邻的多模态异常检测技术的优化目标基于此思想，同时估计样本异常度和异常样本集合，其中的核心思想是找到一个样本集合，使得该集合异常得分总和最小。但是这个问题是一个NP难的问题，我们一般会把集合中的离散0，1约束放松为连续约束进行求解，即步骤204中的优化目标O^TWO^T，用连续的O表示样本异常度来替代原本的0，1表示样本是否在集合内。确定了目标函数后，可以通过区间放松优化技术或者谱放松优化技术来求解问题。其中区间放松优化技术放松整数约束为连续区间约束，整体上可以取得很好的检测结果。谱放松优化技术放松整数约束为谱约束，检测效果相比区间优化技术效果会有一定损失，但可以大幅加速检测时间。优化完成后，即可以得到每一帧图像的异常度得分。基于局部近邻的多模态异常检测技术判定异常度大于预设阈值的图片帧为含有微表情的图像。

附图说明

图1为本发明实施例的基于计算机视觉的面部图像预处理步骤流程图；

图2为本发明实施例的基于局部近邻的多模态数据异常检测步骤流程图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

一种基于多模态数据异常检测的微表情识别方法，具体来说，基于计算机视觉技术对被测试者视频进行预处理得到多模态数据集，然后利用基于局部近邻的多模态异常检测技术得到每一帧图像的异常度得分，最后依据预设阈值，判定异常度大于阈值的图像含有微表情。

基于计算机视觉的面部图像预处理步骤工作流程如图1所示。首先输入被测试者的测试视频(步骤10)；然后将测试视频的每一帧图像作为一条样本添加到数据集中(步骤11)；将每样本根据面部的上半部分和下半部分分为两个模态得到多模态数据集(步骤12)；使用LBP算法提取多模态面部数据的特征(步骤13)；面部图像预处理完成，结束(步骤14)。

基于局部近邻的多模态数据异常检测步骤工作流程如图2所示。输入多模态面部数据集(步骤20)；初始化多模态面部数据集中每个面部图像样本的正常度得分为1，用S-score表示正常度，异常度的分为1-S-score＝0(步骤21)；对于每个面部图像样本的每个模态，计算它与其他样本的“正常距离”，“正常距离”计算方式为样本距离*S-score；对于样本i，样本j与样本i的“正常距离”为i，j之间距离*样本j的S-score(步骤22)；对于每个面部图像样本，在每个模态寻找K个距离该样本“正常距离”最小的样本作为其K正常近邻；把所有样本的正常近邻用矩阵W表示，若样本j为样本i的K正常近邻，则W第i行第j列为1，否则为0(步骤23)；将所有面部图像样本的S-score用向量O表示，向量O的第i维为样本i的S-score；优化目标O^TWO^T，得到样本更新后的正常度向量O和S-score(步骤24)；重复步骤22、步骤23、24，直至收敛(步骤25)；输出数据集中每个面部图像样本的异常度打分1-S-score(步骤26)；根据预先设立好的阈值判定异常度高于阈值的面部图像包含微表情(步骤27)。

K正常近邻的K是个超参数，要根据实际情况进行调整，目前情况下，K一般设置为5或者10。

预先设立好的阈值是个超参数，要根据数据集的实际情况进行调整，阈值一般设置为0.9。

多模态数据异常检测具有一定的通用性，可以在多模态数据不存在簇结构的情况下使用。

Claims

1.一种基于多模态数据异常检测的微表情识别方法，其特征在于：包括基于计算机视觉的面部图像预处理步骤和基于局部近邻的多模态数据异常检测步骤；

所述基于计算机视觉的面部图像预处理步骤具体为：

步骤100，输入被测试者的测试视频；

步骤102，将每个图像根据面部的上半部分和下半部分分为两个模态得到多模态数据集；

步骤103，使用LBP算法提取多模态面部数据的特征；

步骤104，面部图像预处理完成。

所述基于局部近邻的多模态数据异常检测步骤具体为：

步骤200，输入多模态面部数据集；

步骤204，将所有面部图像样本的S-score用向量O表示，向量O的第i维为样本i的S-score；优化目标O^TWO^T，得到样本更新后的正常度向量O和S-score；

步骤205，重复步骤202、步骤203、204，直至收敛；

2.如权利要求1所述的基于多模态数据异常检测的微表情识别方法，其特征在于：所述K正常近邻的K是个超参数，K的取值为5或者10。

3.如权利要求1所述的基于多模态数据异常检测的微表情识别方法，其特征在于：设立好的阈值是个超参数，要根据数据集的实际情况进行调整，阈值设置为0.9。

4.如权利要求1所述的基于多模态数据异常检测的微表情识别方法，其特征在于：步骤204目标优化方法选择区间放松优化技术或者谱放松优化技术；其中区间放松优化技术放松整数约束为连续区间约束；谱放松优化技术放松整数约束为谱约束。