CN110175534A - 基于多任务级联卷积神经网络的授课辅助系统 - Google Patents
基于多任务级联卷积神经网络的授课辅助系统 Download PDFInfo
- Publication number
- CN110175534A CN110175534A CN201910377955.1A CN201910377955A CN110175534A CN 110175534 A CN110175534 A CN 110175534A CN 201910377955 A CN201910377955 A CN 201910377955A CN 110175534 A CN110175534 A CN 110175534A
- Authority
- CN
- China
- Prior art keywords
- teacher
- face
- behavior
- machine
- key point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 13
- 230000006399 behavior Effects 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 9
- 210000000887 face Anatomy 0.000 claims abstract description 3
- 230000001815 facial effect Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 230000006870 function Effects 0.000 claims description 2
- 210000003128 head Anatomy 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明方法是在高校课堂上基于多任务级联卷积神经网络的授课辅助系统,采用卷积神经网络训练人脸样本生成人脸识别模型,利用训练的结果识别人脸关键点和面部朝向,关键点包括:人眼、鼻子、嘴、脸的轮廓。根据关键点的位置分析学生听课行为,根据分析面部朝向、是否闭眼、表情和眼睛相对面部的运动轨迹,分析学生听课行为,听课行为包括:睡觉、溜号、不听课、疑惑、理解,收集听课行为并及时给出提示,通过收集的听课行为评估学生学习状态,辅助教师掌握学生听课情况。
Description
技术领域
本发明方法是基于多任务级联卷积神经网络的授课辅助系统;本方法可广泛应用于机房授课场景下教师授课辅助教学的问题,基于任务级联卷积神经网络训练人脸样本数据,实现人脸关键点、人脸朝向和人脸轮廓的识别功能;通过识别结果分析听课行为,并在教师PC机和客户端PC机给予提示和建议,帮助教师及时掌握学生课堂表现。
背景技术
深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示;深度学习在人脸识别领域的应用提高了人脸识别准确率;卷积神经网络是一种多层神经网络,擅长处理图像特别是大图像的相关深度学习问题,最典型的卷积网络,由卷积层、池化层、全连接层组成,其中卷积层与池化层配合,组成多个卷积组,逐层提取特征,通过若干个全连接层完成分类;通过深度学习方法可以直接将人脸图像映射到欧几里得空间,空间的距离代表了人脸图像的相似性;通过生成的映射空间与待检测人脸进行比较,完成人脸识别,验证和聚类任务。基于深度学习的人脸识别方法相比较其他方法具有精度更高、速度更快的特点。
发明内容
本发明的目的是为课堂教师及时掌握学生听课状态,并根据听课状态及时采取措施,提高授课效果;基于多任务级联卷积神经网络的授课辅助系统,采用卷积神经网络训练人脸样本,利用训练的结果识别人脸关键点和面部朝向,关键点包括:人眼、鼻子、嘴、脸的轮廓。根据关键点的位置分析学生听课行为,收集听课行为并及时给出提示,通过收集的听课行为评估学生学习状态,辅助教师掌握学生听课情况;
所需设备:采用1个服务器PC机,1个教师PC机,客户端PC机套装,一个学生配置一个客户端PC机套装,一个客户端PC机套装包括:1个罗技(Logitech)C922 高清网络摄像头,分辨率1080P/30fps,工作视角为78度;一个PC机,以及用于连接客户端PC和摄像头的线路;
方法步骤如下:
(010)部分,多任务级联卷积神经网络训练样本具体步骤如下:
步骤C011:收集学生人脸照片,每人5张不同图片,并且下载LFW人脸数据库,组建样本图片;
步骤C012:预处理样本图片,检测每张图片中人脸的矩形框,并对齐人脸,转换对齐后的人脸图片为大小160*160的图像;
步骤C013:采用多任务级联卷积神经网络训练样本,生成模型文件;
(020)部分,识别人脸关键点、面部朝向具体步骤如下:
步骤C021:采用步骤C013生成的模型文件,识别摄像头获取的视频中人脸关键点;
步骤C022:根据人脸关键点位置坐标分析面部朝向、是否闭眼、表情;
(030)部分,分析听课行为具体步骤如下:
步骤C031:根据分析面部朝向、是否闭眼、表情和眼睛相对面部的运动轨迹,分析学生听课行为,听课行为包括:睡觉、溜号、不听课、疑惑、理解;
步骤C032:根据分析得到的听课行为,记录行为发生时课程的时间点和内容,并上传服务器;对于睡觉、溜号、不听课行为同时在教师PC机和检测到该行为客户端PC机给予提示;对于疑惑、理解行为在教师PC机给予提示;教师PC机提示信息主要包括:行为的学生数量、学生位置、建议采用措施;教师根据教师PC机显示信息,采用措施提高授课效果;客户端PC机提示信息主要包括:睡觉、溜号、不听课提示;
(040)部分,分析课程授课效果具体步骤如下:
步骤C041:根据分析学生的听课行为和教师采用的措施的过程分析课程授课效果。
有益效果
本发明提出了一种基于多任务级联卷积神经网络的授课辅助系统,该系统的灵活性较高,可实时监测课堂学生听课状态,并根据学生听课状态同步教师PC机给予建议,提高学生听课效果;多任务级联卷积神经网络包含三个子网络:Proposal Network(P-Net)、RefineNetwork(R-Net)、Output Network(O-Net),这三个网络对人脸的处理依次从粗到细,在使用这三个子网络之前,需要使用图像金字塔将原始图像缩放到不同的尺度,然后将不同尺度的图像送入这三个子网络中进行训练,目的是为了可以检测到不同大小的人脸,从而实现多尺度目标检测;通过多任务级联卷积神经网络训练生成的模型具有较高的人脸识别准确率和效率。
附图说明:
图1客户端PC机图;
图2样本数据训练流程图;
图3识别照片关键点流程图;
图4分析上课行为流程图;
具体实施方式:
首先预处理样本人脸图像,将图像中人脸区域对齐转换成大小为160*160的图像;
通过三元组损失训练样本数据,三元组损失( Triplet Loss )的原理是:每次都在训练数据中取出三张人脸图像,第一张图像记为xai, 第二张图像记为xpi,第三张图像记为xni
,在这样一个“三元组”中,xai和xpi 对应的是同一个人的图像,而xni 是另外一个不同的人的人脸图像;因此,距离||f(xai) - f(xpi)||2 应该较小,而距离||f(xai) - f(xni)||2应该较大;三元组损失公式Li如下:
训练生成模型文件,根据模型文件识别人脸关键点、人脸轮廓和面部朝向;
根据识别的人脸关键点、人脸轮廓和面部朝向分析听课行为睡觉、溜号、不听课、疑惑、理解,传入数据库并在教师PC机和客户端PC机显示提示和建议。
Claims (1)
1.基于多任务级联卷积神经网络的授课辅助系统,采用卷积神经网络训练人脸样本,利用训练的结果识别人脸关键点和面部朝向,关键点包括:人眼、鼻子、嘴、脸的轮廓;根据关键点的位置分析学生听课行为,收集听课行为并及时给出提示,通过收集的听课行为评估学生学习状态,辅助教师掌握学生听课情况;
所需设备:采用1个服务器PC机,1台深度学习服务器,1个教师PC机,客户端PC机套装,一个学生配置一个客户端PC机套装,一个客户端PC机套装包括:1个罗技(Logitech)C922高清网络摄像头,分辨率1080P/30fps,工作视角为78度;一个PC机,以及用于连接客户端PC和摄像头的线路;
方法步骤如下:
(010)部分,多任务级联卷积神经网络训练样本具体步骤如下:
步骤C011:收集学生人脸照片,每人5张不同图片,并且下载LFW人脸数据库,组建样本图片,使用深度学习服务器训练数据;
步骤C012:预处理样本图片,检测每张图片中人脸的矩形框,提取人脸矩形框并对齐人脸,转换对齐后的人脸图片为大小160*160的图像,由大小为160*160的人脸图像构成训练样本;
步骤C013:采用多任务级联卷积神经网络训练样本,多任务级联卷积神经网络由三个子网络构成,分别是Proposal Network(P-Net)、Refine Network(R-Net)、Output Network(O-Net) 这三个网络对人脸的处理依次从粗到细;P-Net对样本进行处理生成人脸候选框,并且给出人脸框的回归和人脸关键点定位;由于P-Net的检测时比较粗略,接下来使用R-Net进一步优化;R-Net和P-Net类似,不过这一步的输入是前面P-Net生成的边界框,输出是去除大量的非人脸框;O-Net与R-Net执行同样的操作,在输出的时候精简人脸框并带有人脸关键点;在通过损失函数训练参数得到人脸关键点识别模型文件;
(020)部分,识别人脸关键点、面部朝向具体步骤如下:
步骤C021:采用步骤C013生成的模型文件,识别摄像头获取的视频中人脸关键点;
步骤C022:根据人脸关键点位置坐标分析面部朝向、是否闭眼、表情,表情包括皱眉、笑、说话、点头;
(030)部分,分析听课行为具体步骤如下:
步骤C031:根据分析面部朝向、是否闭眼、表情和眼睛相对面部的运动轨迹,分析学生听课行为,听课行为包括:睡觉、溜号、不听课、疑惑、理解;
步骤C032:根据分析得到的听课行为,记录行为发生时课程的时间点和内容,并上传服务器;对于睡觉、溜号、不听课行为同时在教师PC机和检测到该行为客户端PC机给予提示;对于疑惑、理解行为在教师PC机给予提示;教师PC机提示信息主要包括:行为的学生数量、学生位置、建议采用措施;教师根据教师PC机显示信息,采用措施提高授课效果;客户端PC机提示信息主要包括:睡觉、溜号、不听课提示;
(040)部分,分析课程授课效果具体步骤如下:
步骤C041:根据分析学生的听课行为和教师采用的措施的过程分析课程授课效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910377955.1A CN110175534A (zh) | 2019-05-08 | 2019-05-08 | 基于多任务级联卷积神经网络的授课辅助系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910377955.1A CN110175534A (zh) | 2019-05-08 | 2019-05-08 | 基于多任务级联卷积神经网络的授课辅助系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110175534A true CN110175534A (zh) | 2019-08-27 |
Family
ID=67690656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910377955.1A Pending CN110175534A (zh) | 2019-05-08 | 2019-05-08 | 基于多任务级联卷积神经网络的授课辅助系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110175534A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827595A (zh) * | 2019-12-12 | 2020-02-21 | 广州三人行壹佰教育科技有限公司 | 虚拟教学中的互动方法、装置及计算机存储介质 |
CN110866962A (zh) * | 2019-11-20 | 2020-03-06 | 成都威爱新经济技术研究院有限公司 | 一种基于卷积神经网络的虚拟人像与表情同步方法 |
CN111144368A (zh) * | 2019-12-31 | 2020-05-12 | 重庆和贯科技有限公司 | 基于长短时记忆神经网络的学生行为检测方法 |
CN111178242A (zh) * | 2019-12-27 | 2020-05-19 | 上海掌学教育科技有限公司 | 一种面向在线教育的学生人脸表情识别方法及系统 |
CN111341164A (zh) * | 2020-03-04 | 2020-06-26 | 王慧 | 一种网络授课终端辅助设备及网络授课辅助系统 |
CN111402987A (zh) * | 2019-12-31 | 2020-07-10 | 武汉星巡智能科技有限公司 | 基于可见光视频的用药提醒方法、装置、设备及存储介质 |
CN111507555A (zh) * | 2019-11-05 | 2020-08-07 | 浙江大华技术股份有限公司 | 人体状态检测方法、课堂教学质量的评价方法及相关装置 |
CN111563702A (zh) * | 2020-06-24 | 2020-08-21 | 重庆电子工程职业学院 | 一种课堂教学互动系统 |
CN112270277A (zh) * | 2020-11-02 | 2021-01-26 | 湖南长城科技信息有限公司 | 基于人工智能技术的网课在线学生学习行为识别系统 |
CN112767782A (zh) * | 2021-01-19 | 2021-05-07 | 武汉理工大学 | 一种用于实时检测教师情绪的智能教鞭系统 |
CN114022939A (zh) * | 2021-11-16 | 2022-02-08 | 河南职业技术学院 | 一种实践课堂教学课件推荐方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106878677A (zh) * | 2017-01-23 | 2017-06-20 | 西安电子科技大学 | 基于多传感器的学生课堂掌握程度评估系统和方法 |
CN108073888A (zh) * | 2017-08-07 | 2018-05-25 | 中国科学院深圳先进技术研究院 | 一种教学辅助方法及采用该方法的教学辅助系统 |
CN208421888U (zh) * | 2018-06-19 | 2019-01-22 | 江苏师范大学 | 一种基于人脸识别的学生实时考勤系统 |
CN109344682A (zh) * | 2018-08-02 | 2019-02-15 | 平安科技(深圳)有限公司 | 课堂监控方法、装置、计算机设备及存储介质 |
CN109657529A (zh) * | 2018-07-26 | 2019-04-19 | 台州学院 | 基于面部表情识别的课堂教学效果评价系统 |
-
2019
- 2019-05-08 CN CN201910377955.1A patent/CN110175534A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106878677A (zh) * | 2017-01-23 | 2017-06-20 | 西安电子科技大学 | 基于多传感器的学生课堂掌握程度评估系统和方法 |
CN108073888A (zh) * | 2017-08-07 | 2018-05-25 | 中国科学院深圳先进技术研究院 | 一种教学辅助方法及采用该方法的教学辅助系统 |
CN208421888U (zh) * | 2018-06-19 | 2019-01-22 | 江苏师范大学 | 一种基于人脸识别的学生实时考勤系统 |
CN109657529A (zh) * | 2018-07-26 | 2019-04-19 | 台州学院 | 基于面部表情识别的课堂教学效果评价系统 |
CN109344682A (zh) * | 2018-08-02 | 2019-02-15 | 平安科技(深圳)有限公司 | 课堂监控方法、装置、计算机设备及存储介质 |
WO2020024400A1 (zh) * | 2018-08-02 | 2020-02-06 | 平安科技(深圳)有限公司 | 课堂监控方法、装置、计算机设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
ZHANG K: "Joint face detection and alignment using multitask cascaded convolutional networks", 《IEEE SIGNAL PROCESSING LETTERS》 * |
大奥特曼打小怪兽: "人脸检测MTCNN和人脸识别Facenet", 《HTTPS://WWW.CNBLOGS.COM/ZYLY/P/9703614.HTML(博客园)》 * |
张敬然: "基于面部识别技术的在线学习行为深度感知方法研究与应用", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507555A (zh) * | 2019-11-05 | 2020-08-07 | 浙江大华技术股份有限公司 | 人体状态检测方法、课堂教学质量的评价方法及相关装置 |
CN111507555B (zh) * | 2019-11-05 | 2023-11-14 | 浙江大华技术股份有限公司 | 人体状态检测方法、课堂教学质量的评价方法及相关装置 |
CN110866962A (zh) * | 2019-11-20 | 2020-03-06 | 成都威爱新经济技术研究院有限公司 | 一种基于卷积神经网络的虚拟人像与表情同步方法 |
CN110827595A (zh) * | 2019-12-12 | 2020-02-21 | 广州三人行壹佰教育科技有限公司 | 虚拟教学中的互动方法、装置及计算机存储介质 |
CN111178242A (zh) * | 2019-12-27 | 2020-05-19 | 上海掌学教育科技有限公司 | 一种面向在线教育的学生人脸表情识别方法及系统 |
CN111402987A (zh) * | 2019-12-31 | 2020-07-10 | 武汉星巡智能科技有限公司 | 基于可见光视频的用药提醒方法、装置、设备及存储介质 |
CN111144368A (zh) * | 2019-12-31 | 2020-05-12 | 重庆和贯科技有限公司 | 基于长短时记忆神经网络的学生行为检测方法 |
CN111402987B (zh) * | 2019-12-31 | 2024-05-10 | 武汉星巡智能科技有限公司 | 基于可见光视频的用药提醒方法、装置、设备及存储介质 |
CN111341164A (zh) * | 2020-03-04 | 2020-06-26 | 王慧 | 一种网络授课终端辅助设备及网络授课辅助系统 |
CN111563702A (zh) * | 2020-06-24 | 2020-08-21 | 重庆电子工程职业学院 | 一种课堂教学互动系统 |
CN112270277A (zh) * | 2020-11-02 | 2021-01-26 | 湖南长城科技信息有限公司 | 基于人工智能技术的网课在线学生学习行为识别系统 |
CN112270277B (zh) * | 2020-11-02 | 2024-09-20 | 湖南长城科技信息有限公司 | 基于人工智能技术的网课在线学生学习行为识别系统 |
CN112767782A (zh) * | 2021-01-19 | 2021-05-07 | 武汉理工大学 | 一种用于实时检测教师情绪的智能教鞭系统 |
CN114022939A (zh) * | 2021-11-16 | 2022-02-08 | 河南职业技术学院 | 一种实践课堂教学课件推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110175534A (zh) | 基于多任务级联卷积神经网络的授课辅助系统 | |
CN110889672B (zh) | 一种基于深度学习的学生打卡及上课状态的检测系统 | |
CN106127139B (zh) | 一种mooc课程中学生面部表情的动态识别方法 | |
CN107679522B (zh) | 基于多流lstm的动作识别方法 | |
Deng et al. | MVF-Net: A multi-view fusion network for event-based object classification | |
WO2021047185A1 (zh) | 基于人脸识别的监测方法、装置、存储介质及计算机设备 | |
CN107766842B (zh) | 一种手势识别方法及其应用 | |
WO2019028592A1 (zh) | 一种教学辅助方法及采用该方法的教学辅助系统 | |
CN111242962A (zh) | 远程培训视频的生成方法、装置、设备及存储介质 | |
CN106778506A (zh) | 一种融合深度图像和多通道特征的表情识别方法 | |
CN110163567A (zh) | 基于多任务级联卷积神经网络的课堂点名系统 | |
CN103473801A (zh) | 一种基于单摄像头与运动捕捉数据的人脸表情编辑方法 | |
CN111931598A (zh) | 一种基于人脸识别的课堂智能实时分析方法及系统 | |
CN106846949A (zh) | 一种远程情感教学系统 | |
CN117055724A (zh) | 虚拟教学场景中生成式教学资源系统及其工作方法 | |
Balasuriya et al. | Learning platform for visually impaired children through artificial intelligence and computer vision | |
CN110147736A (zh) | 一种基于姿态的重复异常行为检测方法 | |
Manikandan et al. | Hand gesture detection and conversion to speech and text | |
CN111611854A (zh) | 一种基于模式识别的课堂情况评价方法 | |
CN112861809B (zh) | 基于多目标视频分析的课堂抬头检测系统及其工作方法 | |
Liu et al. | 4D facial analysis: A survey of datasets, algorithms and applications | |
CN112085105B (zh) | 一种基于人体形状与姿态估计的动作相似度评价方法 | |
CN112488165A (zh) | 一种基于深度学习模型的红外行人识别方法及系统 | |
CN112634096A (zh) | 一种基于智能黑板的课堂管理方法及系统 | |
Chiang et al. | A virtual tutor movement learning system in eLearning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190827 |