CN111814556A

CN111814556A - 一种基于计算机视觉的教学辅助方法和系统

Info

Publication number: CN111814556A
Application number: CN202010518543.8A
Authority: CN
Inventors: 陈俐燕; 刘昆宏; 林璐; 王备战; 宋叶; 丁子力
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2020-06-09
Filing date: 2020-06-09
Publication date: 2020-10-23

Abstract

一种基于计算机视觉的教学辅助方法和系统。所述方法包括：步骤一，通过摄像头采集学生视频，并将学生视频截取为视频序列；步骤二，对视频序列进行人脸识别和检测，识别出学生的人脸图片，并对识别出的人脸图片进行标记；步骤三，从人脸图片中识别出面部表情和头部姿态，根据面部表情和头部姿态计算出注意状态，存储到人脸图片表格；步骤四，将人脸图片与预存储的人脸模板进行匹配，得出对应的学生信息；步骤五，对学生表格数据进行分析，按照群体级别、统计周期、学生、课程四个维度绘制学生课堂分析图；步骤五，将绘制的学生课堂分析图针对不同目标群体进行个性化呈现。本发明针对课堂开发一个可以判断学生课堂注意状态，并通过不同形式反馈给学生、家长与教师的方法。

Description

一种基于计算机视觉的教学辅助方法和系统

技术领域

本申请一般涉及图像识别领域，尤其涉及基于计算机视觉的教学辅助系统。

背景技术

在课堂教学目的方面，对比过去过于把记住一些知识放在首位，如今教育更强调情感态度与价值观、过程与方法、知识与技能“三维”目标的达成。在课堂教学评价方面，跳出以前评估把目光放在选拔上的桎梏，而赋予了评价“改善教学质量、帮助孩子发展”的新意义。

在传统的教学中，存在一个难以解决的问题，即教师的精力有限，因此每一个学生都不能充分考虑自己在课堂上是否全神贯注，对教学内容理解能否做到鞭辟入里。同时过去的面授课堂中存在着评估标准单一、反馈滞后、关注结果而不是经过等问题。

而对于课堂教学质量评价，不同的学校与教育机构各自运行其不同的方法或体系，并没有一个统一的标准，因而课堂教学评价受到主观影响较大。传统课堂教学评价多采用人工记录、课后调查等记录信息不准确全面，人为主观因素过多的方式，对真正提高课堂教学质量起到的作用不大。

将基于人工智能的人脸检测、表情识别、人脸比对与姿态估计等计算机视觉领域技术与教育相结合，为传统教育的改革提供了一条新的思路。

发明内容内容

鉴于现有技术中的上述缺陷或不足，提供一种基于计算机视觉的教学辅助方法和系统。该方法结合人工智能算法，通过对课堂上学生的表情、头部姿态等进行识别后计算和分析统计，针对课堂开发一个可以判断学生课堂注意状态，并通过不同形式反馈给学生、家长与教师的方法。

第一方面，本申请实施例提供了一种基于计算机视觉的教学辅助方法，其特征在于，该方法包括：

步骤一，通过摄像头采集学生视频，并将学生视频截取为视频序列；

步骤二，对视频序列进行人脸识别和检测，识别出学生的人脸图片，并对识别出的人脸图片进行标记；

步骤三，从人脸图片中识别出面部表情和头部姿态，根据面部表情和头部姿态计算出注意状态，存储到人脸图片表格；

步骤四，将人脸图片与预存储的人脸模板进行匹配，得出对应的学生信息，并将人脸图片、人脸模板、学生三项联合查询，将匹配成功的数据录入学生表格，若学生已有旧的信息，则更新注意状态评分为旧值和新值的平均值；

步骤五，对学生表格数据进行分析，按照群体级别、统计周期、学生、课程四个维度绘制学生课堂分析图，其中群体级别包括班级、年级、学校三个级别，统计周期包括日、周、月、年；

步骤五，将绘制的学生课堂分析图针对不同目标群体进行个性化呈现。

第二方面，本申请实施例提供了一种基于计算机视觉的教学辅助系统，其特征在于，该系统包括：

采集模块，用于通过摄像头采集学生视频，并将学生视频截取为视频序列；

人脸识别模块，用于对视频序列进行人脸识别和检测，识别出学生的人脸图片，并对识别出的人脸图片进行标记；从人脸图片中识别出面部表情和头部姿态，根据面部表情和头部姿态计算出注意状态，存储到人脸图片表格；

存储模块，用于将人脸图片与预存储的人脸模板进行匹配，得出对应的学生信息，并将人脸图片、人脸模板、学生三项联合查询，将匹配成功的数据录入学生表格，若学生已有旧的信息，则更新注意状态评分为旧值和新值的平均值；

分析模块，用于对学生表格数据进行分析，按照群体级别、统计周期、学生、课程四个维度绘制学生课堂分析图，其中群体级别包括班级、年级、学校三个级别，统计周期包括日、周、月、年；

显示模块，用于将绘制的学生课堂分析图针对不同目标群体进行个性化呈现。

第三方面，本申请实施例提供了一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现本申请实施例描述的方法。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1示出了本申请实施例提供的教学辅助流程图；

图2示出了本申请教师端辅助功能图；

图3示出了本申请家长端辅助功能图；

图4示出了本申请学生端辅助功能图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1，图1示出了本申请实施例提供的电除尘系统智能节能优化流程示意图。如图1所示，该方法包括：

步骤五，将绘制的学生课堂分析图针对不同目标群体进行个性化呈现。具体应用实例包括：经过对某个学生学期内的学习注意状态进行分析，获取该学生在不同课程的平均注意状态，结合课程的平均上课时段，计算得到该学生对不同科目的喜好程度，提醒老师、家长和学生对偏科科目加强学习。

其中，进行人脸检测具体包括：

从已有人脸的文件夹中循环读取人脸图片，使用OpenCV的plt读取图片，并使用numpy的array将图片转化为包含宽度、高度、通道三维度的存储格式；

使用Dlib定义的人脸识别检测算子detector开始检测人脸，返回人脸特征；

计算待检测人脸和已有人脸文件夹中每个人脸图片的人脸特征之间的差异程度，用欧式距离表示，按欧式距离进行排序，欧式距离最小，且小于预设的阈值的就是匹配的人脸，若大于阈值，则告知“无匹配身份”。

进行头部姿态估计具体包括：

使用X，Y，Z三个方向自由度标识头部平移运动，使用滚动、俯仰、偏航三个自由度来标识头部旋转运动；

读入图片后，抽取头部姿态估计所需要的点坐标，获取头部标准模型的旋转向量和平移向量；

将旋转向量转换为欧拉角，得到用于判断头部姿态的滚动、俯仰、偏航三个角度；

使用6个自定义特征点的头部位置，即坐标为(0.0,0.0,0.0)的鼻尖，坐标为(0.0,-330.0,-65.0)的下巴尖，坐标为(-225.0,170.0,-135.0)的左眼左角，坐标为(225.0,170.0,-135.0)‘的右眼右角，坐标为(-150.0,-150.0,-125.0)的左嘴角，坐标为(150.0,-150.0,-125.0)的右嘴角；使用函数solvePnP用于获得平移，旋转矩阵，输入标准人脸模型特征点3D坐标、真实图像特征点2D坐标、由多张图片标定的相机内参矩阵与畸变参数，输出旋转向量与平移矩阵；

使用四维向量表示头部在三维空间的旋转，四维向量是(w,x,y,z)，计算公式是：w＝cos(α/2),x＝sin(α/2)cos(β_x),y＝sin(α/2)cos(β_y),z＝sin(α/2)cos(β_z)，其中α是绕旋转轴转过的角度，(β_x,β_y,β_z)为Axis-Angle表示方法中Axis的单位向量；

将四维向量转换成欧拉角，转换公式是：

φ＝arctan(2(wx+yz)/(1-2(x²+y²))),θ＝arcsin(2(wy-zx)),

ψ＝arctan(2(wz+xy)/(1-2(y²+z²)))，其中φ,θ,ψ分别表示围绕X轴旋转的俯仰角，围绕Y轴旋转的偏航角，围绕Z轴旋转的翻滚角。

头部姿态数据格式如表1所示：

表1

进行学生注意状态检测的具体步骤包括：

输入已检测的人脸静态图像；

计算头部姿态；

通过线性回归预测头部姿态注意状态，并进行评分，如果低于阈值则输出注意状态，如果高于阈值则识别面部情绪，对面部情绪进行分类，通过线性回归预测面部表情注意状态评分，综合头部姿态注意状态和面部表情注意状态进行评分，

综合评分S＝λ*S_head+μ*S_face，其中S_head为头部姿态注意状态评分，S_face为面部表情注意状态评分，λ和μ分别为头部姿态注意状态和面部表情注意状态的评分权重；

将最终得到的注意状态进行输出。

面部表情识别结果如表2所示：

表2

进行注意状态判断规则如下：

向教师推送的学生课堂分析图包括不同班级和课程的课堂学生注意状态变化、状态分布，教师还可以选择日、周、月、年的注意状态变化趋势和平均注意状态，可以作为学生或的老师的评价参考；

向家长推送的学生课堂分析图包括学生在课堂的注意状态、当天的注意状态、设定的统计周期的注意状态；

向学生推送的学生课堂分析图包括自己当天的注意状态变化和分布、设定的统计周期的注意状态。

对教室中坐在不同位置的学生注意状态进行聚类分析，通过聚类结果挖掘出注意力不够集中的区域，提醒教师通过调整位置提高课堂整体听课效果，具体包括：

从教室里学生注意状态数据中进行特征数据提取，得到特征数据集，随机选取k个特征数据作为聚类中心，k为正整数；

计算特征数据与每个聚类中心之间的距离，将该特征数据放入最小距离对应的聚类中心所在的聚类中，得到k个临时聚类；

对k个临时聚类重新生成聚类中心；

重复执行针对特征数据集中的每个特征数据，计算特征数据与每个聚类中心之间的距离，将特征数据放入最小第一距离对应的聚类中心所在的聚类中，得到k个临时聚类的步骤，直到迭代次数达到预设次数；

将得到的k个临时聚类结果进行输出。

本申请又一实施例提供了基于计算机视觉的教学辅助系统，其特征在于，该系统包括：采集模块，用于通过摄像头采集学生视频，并将学生视频截取为视频序列；

优选的，人脸识别模块还用于：

计算待检测人脸和已有人脸文件夹中每个人脸图片的人脸特征之间的差异程度，用欧式距离表示，按欧式距离进行排序，欧式距离最小，且小于预设的阈值的就是匹配的人脸，若大于阈值，则告知“无匹配身份”；

将四维向量转换成欧拉角，转换公式是：

φ＝arctan(2(wx+yz)/(1-2(x²+y²))),θ＝arcsin(2(wy-zx)),

ψ＝arctan(2(wz+xy)/(1-2(y²+z²)))，其中φ,θ,ψ分别表示围绕X轴旋转的俯仰角，围绕Y轴旋转的偏航角，围绕Z轴旋转的翻滚角；

输入已检测的人脸静态图像；

计算头部姿态；

将最终得到的注意状态进行输出。

作为另一方面，本申请还提供了一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如描述于本申请的教学辅助方法。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或它们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(ProgrammableGate Array；以下简称：PGA)，现场可编程门阵列(Field ProgrammableGate Array；以下简称：FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于计算机视觉的教学辅助方法，其特征在于，该方法包括：

2.根据权利要求1所述的方法，其特征在于，进行人脸检测具体包括：

3.根据权利要求2所述的方法，其特征在于，进行头部姿态估计具体包括：

使用6个自定义特征点的头部位置，即坐标为(0.0,0.0,0.0)的鼻尖，坐标为(0.0,-330.0,-65.0)的下巴尖，坐标为(-225.0,170.0,-135.0)的左眼左角，坐标为(225.0,170.0,-135.0)‘的右眼右角，坐标为(-150.0,-150.0,-125.0)的左嘴角，坐标为(150.0,-150.0,-125.0)的右嘴角；

使用函数solvePnP用于获得平移，旋转矩阵，输入标准人脸模型特征点3D坐标、真实图像特征点2D坐标、由多张图片标定的相机内参矩阵与畸变参数，输出旋转向量与平移矩阵；

使用四维向量表示头部在三维空间的旋转，四维向量是(w,x,y,z)，计算公式是：

w＝cos(α/2),x＝sin(α/2)cos(β_x),y＝sin(α/2)cos(β_y),z＝sin(α/2)cos(β_z)，其中α是绕旋转轴转过的角度，(β_x,β_y,β_z)为Axis-Angle表示方法中Axis的单位向量；

将四维向量转换成欧拉角，转换公式是：

φ＝arctan(2(wx+yz)/(1-2(x²+y²))),θ＝arcsin(2(wy-zx)),

4.根据权利要求2所述的方法，其特征在于：进行学生注意状态检测的具体步骤包括：

输入已检测的人脸静态图像；

计算头部姿态；

将最终得到的注意状态进行输出。

5.根据权利要求4所述的方法，其特征在于：

6.根据权利要求1-5任一项所述的方法，其特征在于：经过对某个学生学期内的学习注意状态进行分析，获取该学生在不同课程的平均注意状态，结合课程的平均上课时段，计算得到该学生对不同科目的喜好程度，提醒老师、家长和学生对偏科科目加强学习。

7.根据权利要求1-5任一项所述的方法，其特征在于：对教室中坐在不同位置的学生注意状态进行聚类分析，通过聚类结果挖掘出注意力不够集中的区域，提醒教师通过调整位置提高课堂整体听课效果，具体包括：

对k个临时聚类重新生成聚类中心；

将得到的k个临时聚类结果进行输出。

8.一种基于计算机视觉的教学辅助系统，其特征在于，该系统包括：

9.根据权利要求8所述的系统，其特征在于，人脸识别模块还用于：

将四维向量转换成欧拉角，转换公式是：

φ＝arctan(2(wx+yz)/(1-2(x²+y²))),θ＝arcsin(2(wy-zx)),

输入已检测的人脸静态图像；

计算头部姿态；

综合评分S＝λ*S_head+μ*S_face，其中S_head为头部姿态注意状态评分，S_face为面部表情注意状态评分，λ和μ分别为头部姿态注意状态和面部表情注意状态的评分权重；将最终得到的注意状态进行输出。

10.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的面部表情识别方法。