WO2021047185A1

WO2021047185A1 - 基于人脸识别的监测方法、装置、存储介质及计算机设备

Info

Publication number: WO2021047185A1
Application number: PCT/CN2020/087555
Authority: WO
Inventors: 陈梦莎
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-09-12
Filing date: 2020-04-28
Publication date: 2021-03-18
Also published as: CN110580470A

Abstract

本申请提供了一种基于人脸识别的监测方法、装置、存储介质及计算机设备，其中，该方法包括：获取待识别图像，并提取待识别图像中的所有人脸图像，确定每个人脸图像所对应的身份标识；确定人脸图像中的表情信息，并判断表情信息是否异常；在表情信息异常时，将与具有异常的表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成异常身份标识的异常行为记录。本申请提供的一种基于人脸识别的监测方法、装置、存储介质及计算机设备，可以自动识别全班学生的表情情绪变化，并抓取异常的表情，不需要老师过多参与；基于异常行为记录可以有针对性地分析相应学生的教学概况，也方便教师有针对性地进行教学，可以提高教师的教学效果。

Description

基于人脸识别的监测方法、装置、存储介质及计算机设备

本申请要求于2019年9月12日提交中国专利局、申请号为201910865404.X，发明名称为“基于人脸识别的监测方法、装置、存储介质及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及教学教育领域，特别涉及一种基于人脸识别的监测方法、装置、存储介质及计算机设备。

背景技术

课堂教学是教师给学生传授知识和技能的全过程，是人才培养过程中进行理论知识传授最基本、最重要的环节。其是教育教学中普遍使用的一种手段，课堂教学质量的优劣对人才培养的质量有着直接的影响。为了提高课堂教学质量，需要教师了解学生在课堂中的实际学习情况。在上课过程中，学生容易出现自制能力比较弱，容易走神等状况。若老师无法及时察觉并及时制止，长期下来学生容易出现跟不上课堂的授课内容、成绩下滑等情况。

发明人发现在目前的教师授课过程中，尤其大班授课，学生课堂听课状况实时掌握非常困难，而辅导机构的一对一辅导虽然可以有效避免该问题，但其收费昂贵，并不具有普遍适用性。

发明内容

为解决上述问题，本申请提供一种基于人脸识别的监测方法、装置、存储介质及计算机设备。

根据本申请的第一个方面，提供一种基于人脸识别的监测方法，包括：获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。

根据本申请的第二个方面，提供一种基于人脸识别的监测装置，包括：获取模块，用于获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；表情识别模块，用于确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；异常记录模块，用于在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。

根据本申请的第三个方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现一种基于人脸识别的监测的方法，其中，所述基于人脸识别的监测的方法包括以下步骤：获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。

根据本申请的第四个方面，提供一种计算机设备，其包括：一个或多个处理器；存储器；一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于执行一种基于人脸识别的监测的方法，其中，所述基于人脸识别的监测的方法包括以下步骤：获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。

本申请实施例提供的一种基于人脸识别的监测方法、装置、存储介质及计算机设备，在提取待识别图像中学生的人脸图像的同时，还确定每个人脸图像对应的学生的身份标识，并基于表情识别确定学生表情是否异常；在表情异常时可以准确定位异常的学生，且可以为相应的学生生成异常行为记录。该方式可以自动识别全班学生的表情情绪变化，并抓取异常的表情，不需要老师过多参与；基于异常行为记录可以有针对性地分析相应学生的教学概况，也方便教师有针对性地进行教学，可以提高教师的教学效果。基于循环神经网络可以生成包含所有人脸部位图像以及所有邻接关系的图像序列，可以保证表情识别的准确性；且将多维的人脸图像转换为一维的人脸特征序列，可以更加快速地训练表情识别模型，模型的识别结果更加准确。

附图说明

图1为本申请实施例提供的基于人脸识别的监测方法的流程示意图；

图2为本申请实施例提供的基于人脸识别的监测方法中，确定人脸图像中的表情信息的具体流程示意图；

图3为本申请实施例提供的人脸图像的一种划分示意图；

图4为本申请实施例提供的循环神经网络的一种结构示意图；

图5为本申请实施例提供的基于人脸识别的监测装置的结构示意图；

图6为本申请实施例提供的执行课堂监测方法的计算机设备的结构示意图。

具体实施方式

本申请实施例提供的一种基于人脸识别的监测方法，适用于智慧城市技术领域，参见图1所示，包括：

步骤101：获取待识别图像，并提取待识别图像中的所有人脸图像，确定每个人脸图像所对应的身份标识。

本申请实施例中，基于预先设置好的摄像设备可以采集到包含人脸的图像，即待识别图像，进而可以提取出该待识别图像中的人脸图像。本实施例中，教师在向学生授课的过程中，可以在课堂内架设拍摄装置，例如相机、摄像头等，且该拍摄装置可以采集到包含学生人脸图像的课堂图像，即上述待识别图像。具体的，该拍摄装置可以架设在课堂的前方，且镜头朝向听课的学生。在获取到待识别图像之后，即可基于人脸识别技术提取出待识别图像中所有的人脸图像。其中，可以通过拍摄装置直接采集到待识别图像；或者，通过拍摄装置采集课堂视频，并从课堂视频中提取出待识别图像。同时，课堂中不同学生具有不同的人脸特征，即每个人脸图像可以对应相应的学生，从而可以确定每个人脸图像所对应是哪个学生，即可以确定人脸图像所对应的学生的身份标识。

可选的，可以采用多种方式来确定人脸图像对应的身份标识。具体的，上述步骤101中“确定每个人脸图像所对应的身份标识”包括：

步骤A1：对人脸图像与人脸数据库进行匹配处理，将人脸数据库中与人脸图像相匹配的人脸的身份标识作为人脸图像的身份标识。

本实施例中，预先建立包含学生人脸的人脸数据库，在提取出待识别图像中的人脸图像后，即可对该人脸图像与人脸数据库进行匹配处理，即查询在人脸数据库中是否存在与该人脸图像相匹配的学生人脸，若存在，则说明采集到的人脸图像与人脸数据库中的一个人脸是相匹配，由于预先设置了人脸数据库中每个人脸的身份标识，即预先设置了每个人脸对应哪个学生，故此时可以直接将人脸数据库中与人脸图像相匹配的人脸的身份标识作为人脸图像的身份标识。

或者，上述步骤101中“确定每个人脸图像所对应的身份标识”包括：步骤A2：预先设置待识别图像中每个图像区域与身份标识之间的对应关系，根据人脸图像在待识别图像中所属的图像区域以及图像区域与身份标识之间的对应关系确定人脸图像所对应的身份标识。

本申请实施例中，预先固定采集待识别图像的拍摄装置的位置，此时，情况下，课堂上不同学生的人脸图像位于该待识别图像的不同位置，通过预先设置待识别图像中每个图像区域与身份标识之间的对应关系，在采集到待识别图像时即可确定每个人脸图像所对应的学生，即人脸图像所对应的身份标识。例如，待识别图像左上角的某片区域对应学生A的人脸图像，若待识别图像在该左上角的区域内存在某个人脸图像a，则该人脸图像a对应学生A的身份标识。

或者，上述步骤101中“确定每个人脸图像所对应的身份标识”包括：步骤A3：基于设在不同位置的多个拍摄装置所采集的图像生成具有景深信息的待识别图像，并提取出待识别图像中具有景深信息的人脸图像；根据人脸图像的景深信息以及人脸图像在待识别图像中的位置确定人脸图像在世界坐标系下的三维坐标，将三维坐标所对应的用户的身份标识作为人脸图像的身份标识。

本实施例中，基于多个不同位置的拍摄装置可以采集到景深信息，即可以采集并生成三维的待识别图像，之后基于拍摄装置本身固有的物理参数(例如所在位置、焦距等)即可将待识别图像中的人脸图像转换至世界坐标系中，从而可以确定人脸图像在世界坐标系下的三维坐标，之后即可确定该三维坐标对应哪个学生，即可以确定人脸图像的身份标识。例如，学生A在教室的第三排第四列，且第三排第四列在真实世界的世界坐标系下对应坐标(30,40)；若待识别图像中的某个人脸图像a的三维坐标为(30,40,10)，其中的10为高度值，则说明该人脸图像a是学生A的人脸图像，即人脸图像a对应学生A的身份标识。其中，多个拍摄装置采集到三维图像的原理与双目相机的工作原理基本类似，此处不做赘述。

步骤102：确定人脸图像中的表情信息，并判断表情信息是否异常。

本申请实施例中，在确定人脸图像后，可以识别出人脸图像中的表情信息，基于该表情信息来判断学生是否走神。具体的，可以基于传统的表情识别方法来识别出人脸图像中的表情信息，从而可以判断相应的学生的课堂情绪状态。例如，在面部表情编码系统(FacialAction Coding System，FACS)中，一般识别表情时是基于多个运动单元AU(Action Unit)实现的，即通过多个运动单元AU完成表情识别的过程。

步骤103：在表情信息异常时，将与具有异常的表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成异常身份标识的异常行为记录。

本申请实施例中，若学生的表情信息表示走神、注意力不集中等，则认为该表情信息异常，此时基于哪些表情信息异常即可判断哪些学生走神，即可以确定异常身份标识，之后即可生成该异常身份标识的异常行为记录。其中，该异常行为记录可以记载走神等异常行为，基于该异常行为记录可以实时提醒教师哪些学生注意力不集中，或者生成课堂报告，使得教师基于该课堂报告可以有针对性地进行教学，提高教学效果。

本申请实施例提供的一种基于人脸识别的监测方法，在提取待识别图像中学生的人脸图像的同时，还确定每个人脸图像对应的学生的身份标识，并基于表情识别确定学生表情是否异常；在表情异常时可以准确定位异常的学生，且可以为相应的学生生成异常行为记录。该方式可以自动识别全班学生的表情情绪变化，并抓取异常的表情，不需要老师过多参与；基于异常行为记录可以有针对性地分析相应学生的教学概况，也方便教师有针对性地进行教学，可以提高教师的教学效果。

在上述实施例的基础上，参见图2所示，步骤102“确定人脸图像中的表情信息”具体包括：

步骤1021：将人脸图像划分为多个部位，并确定每个部位所对应的人脸部位图像。

本申请实施例中，将人脸图像分为多个部位，每个部位对应一个图像，即人脸部位图像，比如左眼图像、右眼图像、嘴部图像等；基于多个部位的图像可以精细化确定该人脸图像对应的表情或情绪。

步骤1022：根据所有的人脸部位图像生成人脸图像的人脸特征序列，并将人脸特征序列作为预先训练好的表情识别模型的输入，根据表情识别模型确定人脸图像所对应的表情信息。

传统表情识别模型一般直接将人脸图像作为输入，该方式虽然简单，但是由于表情识别模型输入的是完整的人脸图像，在训练表情识别模型时需要大量的训练集，且识别精度不高。本申请实施例中，基于人脸图像的所有人脸部位图像生成人脸特征序列，将多维的人脸图像转换为一维的人脸特征序列，可以更加准确快速地训练表情识别模型，模型的识别结果更加准确。

其中，在将人脸特征序列作为预先训练好的表情识别模型的输入之前，还包括训练表情识别模型的过程，该过程具体包括：

步骤B1：确定训练样本，并建立表情识别模型，训练样本包括人脸样本图像的人脸特征序列以及与人脸样本图像相对应表情信息。

步骤B2：将人脸样本图像的人脸特征序列作为表情识别模型的输入、将与人脸样本图像相对应表情信息作为表情识别模型的输出，对表情识别模型进行训练，并生成训练好的表情识别模型。

本申请实施例中，该表情识别模型具体可以为分类器，在训练完后，即可基于训练好的表情识别模型进行表情识别。

在上述实施例的基础上，基于人脸部位图像之间的邻接关系来生成人脸特征序列，步骤1022“根据所有的人脸部位图像生成人脸图像的人脸特征序列”具体包括：

步骤C1：根据人脸部位图像在人脸图像中的位置分别确定每个人脸部位图像与其他人脸部位图像之间的邻接关系。

本申请实施例中，人脸图像被分为多个人脸部位图像，此时基于人脸部位图像在该人脸图像中的位置，即可确定哪些人脸部位图像是相邻的，即可以确定某个人脸部位图像与其他哪个人脸部位图像之间具有邻接关系，比如嘴部图像和鼻部图像具有邻接关系。为方便描述，本实施例以将人脸图像分为四个人脸部位图像为例说明，划分方式可参见图3，如图所示，人脸图像分为四个人脸部位图像①②③④，其中，③分别与①、②、④相邻，则①与③之间具有邻接关系，②与③之间具有邻接关系，③与④之间具有邻接关系；同时，④分别与①、②相邻，则①与司之间具有邻接关系，②与④之间具有邻接关系。其中，邻接关系只是表示两个人脸部位图像相邻，并不限定两个人脸部位图像的主次，例如，①与③之间的邻接关系，③与①之间的邻接关系，二者表示相同的含义。

步骤C2：将具有最多邻接关系的人脸部位图像作为待定的图像序列的第一顺位图像，之后将第一顺位图像作为当前顺位图像，并将与当前顺位图像具有邻接关系的其他人脸部位图像作为下一顺位图像，重复上述基于当前顺位图像选取下一顺位图像的过程，直至遍历所有的人脸部位图像、且遍历人脸部位图像之间的所有邻接关系，最终生成包含所有的人脸部位图像、以及人脸部位图像之间的所有邻接关系的图像序列。

由于人脸的表情都是基于面部肌肉做出来的，当某一肌肉动作时，很难只是影响人脸的某个部位，由于相邻的部位之间都是有关联关系的，当某个肌肉带动某一部位动作时，同时也会带动与该部位相邻的其他部位动作。例如，人嘴角上扬时会影响脸颊的状态，甚至影响到人的眼睛。本申请实施例中通过建立多个人脸部位图像的序列来体现部位之间的关系，即基于人脸部位图像的邻接关系来生成图像序列。例如，嘴部图像与鼻子图像是相邻的，则该图像序列中包含“嘴部图像→鼻子图像”或者“鼻子图像→嘴部图像”；由于某个部位可能与多个其他部位是相邻的，最终生成的图像序列中，某个部位可能出现多次。

具体的，由于图像序列需要包含所有的邻接关系，若将邻接关系较少的人脸部位图像作为该图像序列的第一顺位图像，为了保证其他具有较多邻接关系的人脸部位图像的所有邻接关系均包含在该图像序列中，需要额外增加图像序列中人脸部位图像的数量，导致图像序列过长。本申请实施例中，为了尽量减少图像序列的长度，将具有最多邻接关系的人脸部位图像作为图像序列的第一顺位图像，可以减少图像序列的长度，且有利于模型训练以及表情识别的过程，可以有效减少训练量，同时也能精确识别出人脸图像的表情。

如图3所示，人脸部位图像①与③和④相邻，则人脸部位图像①具有两个邻接关系，同理可知，人脸部位图像②、③、④分别具有两个邻接关系、三个邻接关系、三个邻接关系。此时若将①作为图像序列的第一顺位图像，则图像序列前面可以为①→③→④→②→③，但是此时由于不包含①与④之间的邻接关系，此时需要最后补上“①→④”或“④→①”，即完整的图像序列可以为①→③→④→②→③→④→①，该图像序列包含七个人脸部位图像。若将具有最多邻接关系的人脸部位图像作为图像序列的第一顺位图像，即将人脸部位图像③或④作为第一顺位图像，可以减小图像序列的长度。具体的，将人脸部位图像③作为第一顺位图像，则该图像序列可以为③→①→④→②→③→④，或者③→④→①→③→②→④，此时的图像序列包含六个人脸部位图像，该图像序列在包含所有邻接关系的同时，还具有较小的长度。

其中，由于如何将人脸图像划分为多个人脸部位图像，以及人脸部位图像的邻接关系均可以是预先设置好的，故可以预先设置好生成图像序列的方式，在从待识别图像中提取出人脸图像后，可以直接按照生成图像序列的方式生成该人脸图像的图像序列。

步骤C3：基于循环神经网络将所述图像序列转换为所述人脸图像的人脸特征序列。

本申请实施例中，利用循环神经网络可以记忆相邻序列的特点，基于循环神经网络生成人脸图像的人脸特征序列。具体的，将图像序列中的每个人脸部位图像依次作为循环神经网络的输入，从而可以生成包含人脸部位图像的邻接关系的人脸特征序列。循环神经网络的一种结构示意图参见图4所示，其中，x ₁至x ₄表示循环神经网络的输入，E ₁至E ₄表示循环神经网络的输出，s ₁至s ₄表示循环神经网络的网络参数；若本实施例中的图像序列包含四个人脸部位图像①②③①，则将四个人脸部位图像①②③①分别作为x ₁、x ₂、x ₃、x ₄输入至该循环神经网络中，从而可以确定相应的输出，此时即可以将E ₁E ₂E ₃E ₄拼接为一个整体并作为人脸特征序列。

本申请实施例中，基于循环神经网络可以生成包含所有人脸部位图像以及所有邻接关系的图像序列，可以保证表情识别的准确性；且将多维的人脸图像转换为一维的人脸特征序列，可以更加快速地训练表情识别模型，模型的识别结果更加准确。

此外，基于一张人脸图像可能不能正确判断学生的表情，例如学生眨眼，若拍摄装置正好捕捉到学生闭眼时的图像，此时并不能说明该学生在闭眼睡觉。本申请实施例中基于多帧连续的人脸图像来确定学生的动态特征，从而可以动态确定学生的表情信息是否异常，例如确定学生是否走神等。其中，“将人脸特征序列作为预先训练好的表情识别模型的输入，根据表情识别模型确定人脸图像所对应的表情信息”具体可以包括；

步骤D1：连续获取多帧的待识别图像，从多帧的待识别图像中依次提取出具有相同身份标识的多帧的人脸图像，并确定每一帧的人脸图像的人脸特征序列。

步骤D2：将多帧的人脸图像的人脸特征序列作为预先训练好的表情识别模型的输入，根据表情识别模型确定多帧的人脸图像所对应的表情信息。

本申请实施例中，基于多张连续拍摄的人脸图像，可以提取出学生表情的动态变化，使得判断结果更加准确。对于多张人脸图像的人脸特征序列，可以将多张人脸图像的人脸特征序列拼接为一个整体序列；或者，也可以基于另一个循环神经网络，将每个人脸特征序列依次作为循环神经网络的输入，从而生成包含该学生动态变化特征的完整特征序列。其中，该循环神经网络具体可采用LSTM(Long Short-Term Memory，长短期记忆网络)。

在上述实施例的基础上，在步骤103“生成异常身份标识的异常行为记录”之后，该方法还包括：

步骤E1：获取相关联系统中记录的异常身份标识的关联信息，根据关联信息以及异常行为记录生成异常身份标识的综合教学记录；或者

步骤E2：将异常行为记录发送至相关联系统，指示相关联系统基于相关联系统中记录的异常身份标识的关联信息以及异常行为记录生成异常身份标识的综合教学记录。

本实施例中，可以与其他的相关联系统进行对接或信息共享，该相关联系统具体可以是与教学相关的系统，例如成绩系统等，从该相关联系统中可以获取到相应的关联信息，例如学生成绩信息等；结合学生在课堂上的异常行为记录、以及成绩等信息，基于大数据分析技术可以生成该学生的综合性报告，即综合教学记录，基于该综合教学记录可以更加方便老师针对该学生进行适应性教学。

本申请实施例提供的一种基于人脸识别的监测方法，在提取待识别图像中学生的人脸图像的同时，还确定每个人脸图像对应的学生的身份标识，并基于表情识别确定学生表情是否异常；在表情异常时可以准确定位异常的学生，且可以为相应的学生生成异常行为记录。该方式可以自动识别全班学生的表情情绪变化，并抓取异常的表情，不需要老师过多参与；基于异常行为记录可以有针对性地分析相应学生的教学概况，也方便教师有针对性地进行教学，可以提高教师的教学效果。基于循环神经网络可以生成包含所有人脸部位图像以及所有邻接关系的图像序列，可以保证表情识别的准确性；且将多维的人脸图像转换为一维的人脸特征序列，可以更加快速地训练表情识别模型，模型的识别结果更加准确。

以上详细介绍了基于人脸识别的监测方法流程，该方法也可以通过相应的装置实现，下面详细介绍该装置的结构和功能。

本申请实施例提供的一种基于人脸识别的监测装置，参见图5所示，包括：

获取模块51，用于获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；

表情识别模块52，用于确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；

异常记录模块53，用于在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。

在上述实施例的基础上，所述获取模块51确定每个所述人脸图像所对应的身份标识包括：

对所述人脸图像与人脸数据库进行匹配处理，将所述人脸数据库中与所述人脸图像相匹配的人脸的身份标识作为所述人脸图像的身份标识；或者

预先设置所述待识别图像中每个图像区域与身份标识之间的对应关系，根据所述人脸图像在所述待识别图像中所属的图像区域以及图像区域与身份标识之间的对应关系确定所述人脸图像所对应的身份标识；或者

基于设在不同位置的多个拍摄装置所采集的图像生成具有景深信息的待识别图像，并提取出所述待识别图像中具有景深信息的人脸图像；根据所述人脸图像的景深信息以及所述人脸图像在所述待识别图像中的位置确定所述人脸图像在世界坐标系下的三维坐标，将所述三维坐标所对应的用户的身份标识作为所述人脸图像的身份标识。

在上述实施例的基础上，所述表情识别模块52包括：

图像划分单元，用于将所述人脸图像划分为多个部位，并确定每个部位所对应的人脸部位图像；

表情识别单元，用于根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列，并将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息。

在上述实施例的基础上，所述表情识别单元根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列包括：

根据所述人脸部位图像在所述人脸图像中的位置分别确定每个所述人脸部位图像与其他人脸部位图像之间的邻接关系；

将具有最多邻接关系的人脸部位图像作为待定的图像序列的第一顺位图像，之后将所述第一顺位图像作为当前顺位图像，并将与所述当前顺位图像具有邻接关系的其他人脸部位图像作为下一顺位图像，重复上述基于当前顺位图像选取下一顺位图像的过程，直至遍历所有的所述人脸部位图像、且遍历所述人脸部位图像之间的所有邻接关系，最终生成包含所有的所述人脸部位图像、以及所述人脸部位图像之间的所有邻接关系的图像序列；

基于循环神经网络将所述图像序列转换为所述人脸图像的人脸特征序列。

在上述实施例的基础上，所述表情识别单元将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息包括；

连续获取多帧的待识别图像，从多帧的所述待识别图像中依次提取出具有相同身份标识的多帧的人脸图像，并确定每一帧的人脸图像的人脸特征序列；

将多帧的人脸图像的人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定多帧的所述人脸图像所对应的表情信息。

在上述实施例的基础上，所述表情识别模块52还包括训练单元；

在所述表情识别单元将所述人脸特征序列作为预先训练好的表情识别模型的输入之前，所述训练单元用于：

确定训练样本，并建立表情识别模型，所述训练样本包括人脸样本图像的人脸特征序列以及与所述人脸样本图像相对应表情信息；将所述人脸样本图像的人脸特征序列作为所述表情识别模型的输入、将与所述人脸样本图像相对应表情信息作为所述表情识别模型的输出，对所述表情识别模型进行训练，并生成训练好的表情识别模型。

在上述实施例的基础上，所述装置还包括综合处理模块；

在所述异常记录模块53生成所述异常身份标识的异常行为记录之后，所述综合处理模块用于：

获取相关联系统中记录的所述异常身份标识的关联信息，根据所述关联信息以及所述异常行为记录生成所述异常身份标识的综合教学记录；或者

将所述异常行为记录发送至相关联系统，指示所述相关联系统基于所述相关联系统中记录的所述异常身份标识的关联信息以及所述异常行为记录生成所述异常身份标识的综合教学记录。

本申请实施例提供的一种基于人脸识别的监测装置，在提取待识别图像中学生的人脸图像的同时，还确定每个人脸图像对应的学生的身份标识，并基于表情识别确定学生表情是否异常；在表情异常时可以准确定位异常的学生，且可以为相应的学生生成异常行为记录。该方式可以自动识别全班学生的表情情绪变化，并抓取异常的表情，不需要老师过多参与；基于异常行为记录可以有针对性地分析相应学生的教学概况，也方便教师有针对性地进行教学，可以提高教师的教学效果。基于循环神经网络可以生成包含所有人脸部位图像以及所有邻接关系的图像序列，可以保证表情识别的准确性；且将多维的人脸图像转换为一维的人脸特征序列，可以更加快速地训练表情识别模型，模型的识别结果更加准确。

本申请实施例还提供了一种存储有计算机可读指令的存储介质，所述存储介质为易失性存储介质或非易失性存储介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。

图6示出了本申请的另一个实施例的一种计算机设备的结构框图。所述计算机设备1100可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本申请具体实施例并不对计算机设备的具体实现做限定。

该计算机设备1100包括至少一个处理器(processor)1110、通信接口(Communications Interface)1120、存储器(memory array)1130和总线1140。其中，处理器1110、通信接口1120、以及存储器1130通过总线1140完成相互间的通信。

通信接口1120用于与网元通信，其中网元包括例如虚拟机管理中心、共享存储等。

处理器1110用于执行程序。处理器1110可能是一个中央处理器CPU，或者是专用集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。

存储器1130用于可执行的指令。存储器1130可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1130也可以是存储器阵列。存储器1130还可能被分块，并且所述块可按一定的规则组合成虚拟卷。存储器1130存储的指令可被处理器1110执行，以使处理器1110能够执行上述任意方法实施例中的方法。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种基于人脸识别的监测的方法，包括：

获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；

确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；

在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。
根据权利要求1所述的方法，所述确定每个所述人脸图像所对应的身份标识包括：

对所述人脸图像与人脸数据库进行匹配处理，将所述人脸数据库中与所述人脸图像相匹配的人脸的身份标识作为所述人脸图像的身份标识；或者

预先设置所述待识别图像中每个图像区域与身份标识之间的对应关系，根据所述人脸图像在所述待识别图像中所属的图像区域以及图像区域与身份标识之间的对应关系确定所述人脸图像所对应的身份标识；或者

基于设在不同位置的多个拍摄装置所采集的图像生成具有景深信息的待识别图像，并提取出所述待识别图像中具有景深信息的人脸图像；根据所述人脸图像的景深信息以及所述人脸图像在所述待识别图像中的位置确定所述人脸图像在世界坐标系下的三维坐标，将所述三维坐标所对应的用户的身份标识作为所述人脸图像的身份标识。
根据权利要求1所述的方法，所述确定所述人脸图像中的表情信息包括：

将所述人脸图像划分为多个部位，并确定每个部位所对应的人脸部位图像；

根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列，并将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息。
根据权利要求3所述的方法，所述根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列包括：

根据所述人脸部位图像在所述人脸图像中的位置分别确定每个所述人脸部位图像与其他人脸部位图像之间的邻接关系；

将具有最多邻接关系的人脸部位图像作为待定的图像序列的第一顺位图像，之后将所述第一顺位图像作为当前顺位图像，并将与所述当前顺位图像具有邻接关系的其他人脸部位图像作为下一顺位图像，重复上述基于当前顺位图像选取下一顺位图像的过程，直至遍历所有的所述人脸部位图像、且遍历所述人脸部位图像之间的所有邻接关系，最终生成包含所有的所述人脸部位图像、以及所述人脸部位图像之间的所有邻接关系的图像序列；

基于循环神经网络将所述图像序列转换为所述人脸图像的人脸特征序列。
根据权利要求3所述的方法，所述将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息包括；

连续获取多帧的待识别图像，从多帧的所述待识别图像中依次提取出具有相同身份标识的多帧的人脸图像，并确定每一帧的人脸图像的人脸特征序列；

将多帧的人脸图像的人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定多帧的所述人脸图像所对应的表情信息。
根据权利要求3-5任一所述的方法，在所述将所述人脸特征序列作为预先训练好的表情识别模型的输入之前，还包括：

确定训练样本，并建立表情识别模型，所述训练样本包括人脸样本图像的人脸特征序列以及与所述人脸样本图像相对应表情信息；

将所述人脸样本图像的人脸特征序列作为所述表情识别模型的输入、将与所述人脸样本图像相对应表情信息作为所述表情识别模型的输出，对所述表情识别模型进行训练，并生成训练好的表情识别模型。
根据权利要求1-5任一所述的方法，在所述生成所述异常身份标识的异常行为记录之后，还包括：

获取相关联系统中记录的所述异常身份标识的关联信息，根据所述关联信息以及所述异常行为记录生成所述异常身份标识的综合教学记录；或者

将所述异常行为记录发送至相关联系统，指示所述相关联系统基于所述相关联系统中记录的所述异常身份标识的关联信息以及所述异常行为记录生成所述异常身份标识的综合教学记录。
一种基于人脸识别的监测装置，包括：

获取模块，用于获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；

表情识别模块，用于确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；

异常记录模块，用于在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现一种基于人脸识别的监测的方法，其中，所述基于人脸识别的监测的方法包括以下步骤：

获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；

确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；

在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。
根据权利要求9所述的计算机可读存储介质，所述确定每个所述人脸图像所对应的身份标识包括：

对所述人脸图像与人脸数据库进行匹配处理，将所述人脸数据库中与所述人脸图像相匹配的人脸的身份标识作为所述人脸图像的身份标识；或者

预先设置所述待识别图像中每个图像区域与身份标识之间的对应关系，根据所述人脸图像在所述待识别图像中所属的图像区域以及图像区域与身份标识之间的对应关系确定所述人脸图像所对应的身份标识；或者

基于设在不同位置的多个拍摄装置所采集的图像生成具有景深信息的待识别图像，并提取出所述待识别图像中具有景深信息的人脸图像；根据所述人脸图像的景深信息以及所述人脸图像在所述待识别图像中的位置确定所述人脸图像在世界坐标系下的三维坐标，将所述三维坐标所对应的用户的身份标识作为所述人脸图像的身份标识。
根据权利要求9所述的计算机可读存储介质，所述确定所述人脸图像中的表情信息包括：

将所述人脸图像划分为多个部位，并确定每个部位所对应的人脸部位图像；

根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列，并将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息。
根据权利要求11所述的计算机可读存储介质，所述根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列包括：

根据所述人脸部位图像在所述人脸图像中的位置分别确定每个所述人脸部位图像与其他人脸部位图像之间的邻接关系；

将具有最多邻接关系的人脸部位图像作为待定的图像序列的第一顺位图像，之后将所述第一顺位图像作为当前顺位图像，并将与所述当前顺位图像具有邻接关系的其他人脸部位图像作为下一顺位图像，重复上述基于当前顺位图像选取下一顺位图像的过程，直至遍历所有的所述人脸部位图像、且遍历所述人脸部位图像之间的所有邻接关系，最终生成包含所有的所述人脸部位图像、以及所述人脸部位图像之间的所有邻接关系的图像序列；

基于循环神经网络将所述图像序列转换为所述人脸图像的人脸特征序列。
根据权利要求11所述的计算机可读存储介质，所述将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息包括；

连续获取多帧的待识别图像，从多帧的所述待识别图像中依次提取出具有相同身份标识的多帧的人脸图像，并确定每一帧的人脸图像的人脸特征序列；

将多帧的人脸图像的人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定多帧的所述人脸图像所对应的表情信息。
根据权利要求11-13任一所述的计算机可读存储介质，在所述将所述人脸特征序列作为预先训练好的表情识别模型的输入之前，还包括：

确定训练样本，并建立表情识别模型，所述训练样本包括人脸样本图像的人脸特征序列以及与所述人脸样本图像相对应表情信息；

将所述人脸样本图像的人脸特征序列作为所述表情识别模型的输入、将与所述人脸样本图像相对应表情信息作为所述表情识别模型的输出，对所述表情识别模型进行训练，并生成训练好的表情识别模型。
根据权利要求9-13任一所述的计算机可读存储介质，在所述生成所述异常身份标识的异常行为记录之后，还包括：

获取相关联系统中记录的所述异常身份标识的关联信息，根据所述关联信息以及所述异常行为记录生成所述异常身份标识的综合教学记录；或者

将所述异常行为记录发送至相关联系统，指示所述相关联系统基于所述相关联系统中记录的所述异常身份标识的关联信息以及所述异常行为记录生成所述异常身份标识的综合教学记录。
一种计算机设备，包括：

一个或多个处理器；

存储器；

一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于执行一种基于人脸识别的监测的方法，其中，所述基于人脸识别的监测的方法包括以下步骤：

获取待识别图像，并提取所述待识别图像中的所有人脸图像，确定每个所述人脸图像所对应的身份标识；

确定所述人脸图像中的表情信息，并判断所述表情信息是否异常；

在所述表情信息异常时，将与具有异常的所述表情信息的人脸图像相对应的身份标识作为异常身份标识，并生成所述异常身份标识的异常行为记录。
根据权利要求16所述的计算机设备，所述确定每个所述人脸图像所对应的身份标识包括：

对所述人脸图像与人脸数据库进行匹配处理，将所述人脸数据库中与所述人脸图像相匹配的人脸的身份标识作为所述人脸图像的身份标识；或者

预先设置所述待识别图像中每个图像区域与身份标识之间的对应关系，根据所述人脸图像在所述待识别图像中所属的图像区域以及图像区域与身份标识之间的对应关系确定所述人脸图像所对应的身份标识；或者

基于设在不同位置的多个拍摄装置所采集的图像生成具有景深信息的待识别图像，并提取出所述待识别图像中具有景深信息的人脸图像；根据所述人脸图像的景深信息以及所述人脸图像在所述待识别图像中的位置确定所述人脸图像在世界坐标系下的三维坐标，将所述三维坐标所对应的用户的身份标识作为所述人脸图像的身份标识。
根据权利要求16所述的计算机设备，所述确定所述人脸图像中的表情信息包括：

将所述人脸图像划分为多个部位，并确定每个部位所对应的人脸部位图像；

根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列，并将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息。
根据权利要求18所述的计算机设备，所述根据所有的所述人脸部位图像生成所述人脸图像的人脸特征序列包括：

根据所述人脸部位图像在所述人脸图像中的位置分别确定每个所述人脸部位图像与其他人脸部位图像之间的邻接关系；

将具有最多邻接关系的人脸部位图像作为待定的图像序列的第一顺位图像，之后将所述第一顺位图像作为当前顺位图像，并将与所述当前顺位图像具有邻接关系的其他人脸部位图像作为下一顺位图像，重复上述基于当前顺位图像选取下一顺位图像的过程，直至遍历所有的所述人脸部位图像、且遍历所述人脸部位图像之间的所有邻接关系，最终生成包含所有的所述人脸部位图像、以及所述人脸部位图像之间的所有邻接关系的图像序列；

基于循环神经网络将所述图像序列转换为所述人脸图像的人脸特征序列。
根据权利要求18所述的计算机设备，所述将所述人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定所述人脸图像所对应的表情信息包括；

连续获取多帧的待识别图像，从多帧的所述待识别图像中依次提取出具有相同身份标识的多帧的人脸图像，并确定每一帧的人脸图像的人脸特征序列；

将多帧的人脸图像的人脸特征序列作为预先训练好的表情识别模型的输入，根据所述表情识别模型确定多帧的所述人脸图像所对应的表情信息。