CN115497025A - 一种基于3d头部姿态估计的青少年专注度评价方法 - Google Patents

一种基于3d头部姿态估计的青少年专注度评价方法 Download PDF

Info

Publication number
CN115497025A
CN115497025A CN202211176037.0A CN202211176037A CN115497025A CN 115497025 A CN115497025 A CN 115497025A CN 202211176037 A CN202211176037 A CN 202211176037A CN 115497025 A CN115497025 A CN 115497025A
Authority
CN
China
Prior art keywords
model
data
face image
concentration degree
head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211176037.0A
Other languages
English (en)
Inventor
刘文华
刘冰
徐超立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Rouling Technology Co ltd
Original Assignee
Zhejiang Rouling Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Rouling Technology Co ltd filed Critical Zhejiang Rouling Technology Co ltd
Priority to CN202211176037.0A priority Critical patent/CN115497025A/zh
Publication of CN115497025A publication Critical patent/CN115497025A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及专注度识别技术领域,且公开了一种基于3D头部姿态估计的青少年专注度评价方法,包括以下步骤:S1、在教室多方位安装摄像头,用于采集教室中学生上课视频数据;S2、对采集的视频数据进行预处理,将采集视频数据保存为图片;S3、通过labeling对人脸数据进行boxes标注;S4、搭建yolov5模型,训练头部检测模型。通过使用模型剪枝量化技术,使模型更轻量,在高分辨率的视频数据可以达到实时效果,从而实时关注学生的专注度。使用3D头部姿态估计技术可以实现任意角度的姿态估计,以适应不同的场景,在训练中使用了单独标注的学生数据,模型精度更高。根据教室高密度场景设计了非常轻量的slimpe‑net网络,在满足精度的同时减少识别时间。

Description

一种基于3D头部姿态估计的青少年专注度评价方法
技术领域
本发明涉及专注度识别技术领域,具体为一种基于3D头部姿态估计的青少年专注度评价方法。
背景技术
人工智能技术进入校园,带来的重要变化之一是:用数据丈量课堂,课堂关注度在衡量课堂质量、优化教学设计方面的价值受到教育工作者的认可,课堂上学生的专注力如此重要,传统课堂缺少工具帮助老师了解学生是否进入学习状态。在这种情况下,课堂专注度应用而生,以时间反应了课堂上学生专注力变化的趋势,以及在哪个时间专注度最高,哪个时间度最低。学生是否集中注意力,会透过他们的头部行为体现出来。例如,老师在讲课时,学生抬头听讲被看作是注意的集中表现,所以,判断学生在课堂上头部姿态是计算课堂专注度的重要依据。
目前基于计算机视觉的方法是通过人脸关键点去估计头部姿态,由于在教室场景中人脸小/遮挡/光照/等因素影响,很难检测出人脸关键点,而在3D空间中,表示物体的旋转可以由三个欧拉角来表示:分别计算pitch(围绕X轴旋转),yaw(围绕y轴旋转)和roll(围绕Z轴旋转),如图1,通过计算三个自由度,很容易估计出头部各个姿态,从而适应与不同的场景。基本都是基于计算机视觉人脸关键点计算头部姿态或对头部几个姿态打标签训练一个多分类模型,通过人脸关键点对遮挡人脸和侧脸人脸效果特别差,通过头部几分类打标签,使用性差,估计的姿态有限,应用范围比较小。
发明内容
针对现有技术的不足,本发明提供了一种基于3D头部姿态估计的青少年专注度评价方法,具备模型轻量化,在高分辨率的视频数据可以达到实时效果,从而实时关注学生的专注度,使用3D头部姿态估计技术可以实现任意角度的姿态估计,以适应不同的场景的优点。
为实现上述目的,本发明提供如下技术方案:一种基于3D头部姿态估计的青少年专注度评价方法,包括以下步骤:
S1、在教室多方位安装摄像头,用于采集教室中学生上课视频数据;
S2、对采集的视频数据进行预处理,将采集视频数据保存为图片;
S3、通过labeling对人脸数据进行boxes标注;
S4、搭建yolov5模型,训练头部检测模型;
S5、对保存的模型yolov5进行剪枝,量化,并保存模型;
S6、构建卷积神经网络simple-net;
S7、下载数据300W-LP对模型进行初始训练,对采集的数据进行头部姿态估计,并保存标签,建立人工矫正标签,重新训练模型,得到头部姿态估计模型并保存。
优选的,所述采集视频数据对应实时人脸图像,图像处理包括:
确定实时对应的人脸图像视频;
视频采集时间与人脸图像视频时间同步;
依据预设的截取频率及时间间隔,对采集的实时人脸图像视频进行跟踪截取,提取人脸图像视频中人脸图像。
优选的,提取每幅人脸图像的特征点,并对提取的所述特征点进行处理,通过labeling对人脸数据进行boxes标注。
优选的,所述通过labeling对人脸数据进行boxes标注的具体过程为:
读取摄像头视频数据,确定图像数据特征点;
对实时人脸图像进行yolov5人脸检测,搭建yolov5模型;
根据simple-net对人脸进行姿态估计,获得统计学上上课头部姿态;
依据预设的人脸图像专注程度类别与专注度值区间之间的映射关系,将所述采集人脸图像对应的专注程度类别设为所述实时人脸图像所属的预设专注度值区间所映射的专注程度类别;
得到学生上课专注度。
优选的,所述步骤5的具体过程为:
对采集视频数据进行数据保存,将数据进行标注分流;
包括进行yolov5模型训练,对训练模型保存,根据保存模型进行剪枝量化,并对剪枝量化模型进行保存;
还包括根据人脸头部姿态估计打标签,确定人工矫正有误标签,根据simple-net对人脸进行姿态模型训练,进行模型保存。
优选的,所述卷积神经网络simple-net网络结构设置为9层。
优选的,所述卷积神经网络simple-net网络结构全部使用卷积。
有益效果:
1、该基于3D头部姿态估计的青少年专注度评价方法,通过使用模型剪枝量化技术,使模型更轻量,在高分辨率的视频数据可以达到实时效果,从而实时关注学生的专注度。使用3D头部姿态估计技术可以实现任意角度的姿态估计,以适应不同的场景,在训练中使用了单独标注的学生数据,模型精度更高。根据教室高密度场景设计了非常轻量的slimpe-net网络,在满足精度的同时减少识别时间。
2、该基于3D头部姿态估计的青少年专注度评价方法,通过头部姿态估计网络,更容易学习到头部整体信息,不会像关键点检测因为遮挡等原因缺少关键点信息而无法估计,相对分类模型可以识别头部任意姿态,调高使用效果。
3、该基于3D头部姿态估计的青少年专注度评价方法,通过3D头部姿态估计的轻量级网络simple-net,可以实时识别头部的任意姿态;
4、该基于3D头部姿态估计的青少年专注度评价方法,通过该算法可以使用在教室高密度,小人脸侧脸的头部姿态估计,simple-net轻量级网络,满足准确率的前提下,推理耗时在毫秒级别。
附图说明
图1为本发明在3D空间中的yolov5模型示意图;
图2为本发明专注度实现整体流程示意图;
图3为本发明对整体训练流程示意图;
图4为本发明simple-net 3D姿态整体网络架构及训练与预测示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-4,一种基于3D头部姿态估计的青少年专注度评价方法,包括以下步骤:
S1、在教室多方位安装摄像头,用于采集教室中学生上课视频数据;
S2、对采集的视频数据进行预处理,将采集视频数据保存为图片;
所述采集视频数据对应实时人脸图像,图像处理包括:
确定实时对应的人脸图像视频;
视频采集时间与人脸图像视频时间同步;
依据预设的截取频率及时间间隔,对采集的实时人脸图像视频进行跟踪截取,提取人脸图像视频中人脸图像;
S3、通过labeling对人脸数据进行boxes标注,提取每幅人脸图像的特征点,并对提取的所述特征点进行处理,通过labeling对人脸数据进行boxes标注;
S4、搭建yolov5模型,训练头部检测模型,参考图2;
所述通过labeling对人脸数据进行boxes标注的具体过程为:
读取摄像头视频数据,确定图像数据特征点;
参考图1,对实时人脸图像进行yolov5人脸检测,搭建yolov5模型,在3D空间中,表示物体的旋转可以由三个欧拉角来表示:分别计算pitch(围绕X轴旋转),yaw(围绕y轴旋转)和roll(围绕Z轴旋转),通过计算三个自由度,估计头部各个姿态;
根据simple-net对人脸进行姿态估计,获得统计学上上课头部姿态;
依据预设的人脸图像专注程度类别与专注度值区间之间的映射关系,将所述采集人脸图像对应的专注程度类别设为所述实时人脸图像所属的预设专注度值区间所映射的专注程度类别;
得到学生上课专注度;
S5、对保存的模型yolov5进行剪枝,量化,并保存模型,参考图2-3;
对采集视频数据进行数据保存,将数据进行标注分流;
包括进行yolov5模型训练,对训练模型保存,根据保存模型进行剪枝量化,并对剪枝量化模型进行保存;
还包括根据人脸头部姿态估计打标签,确定人工矫正有误标签,根据simple-net对人脸进行姿态模型训练,进行模型保存;
S6、构建卷积神经网络simple-net;
所述卷积神经网络simple-net网络结构设置为9层,所述卷积神经网络simple-net网络结构全部使用卷积,没有权连接层,极大的减少了参数量,模型大小仅5M;
S7、下载数据300W-LP对模型进行初始训练,对采集的数据进行头部姿态估计,并保存标签,建立人工矫正标签,重新训练模型,得到头部姿态估计模型并保存,参考图4。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于,包括以下步骤:
S1、在教室多方位安装摄像头,用于采集教室中学生上课视频数据;
S2、对采集的视频数据进行预处理,将采集视频数据保存为图片;
S3、通过labeling对人脸数据进行boxes标注;
S4、搭建yolov5模型,训练头部检测模型;
S5、对保存的模型yolov5进行剪枝,量化,并保存模型;
S6、构建卷积神经网络simple-net;
S7、下载数据300W-LP对模型进行初始训练,对采集的数据进行头部姿态估计,并保存标签,建立人工矫正标签,重新训练模型,得到头部姿态估计模型并保存。
2.根据权利要求1所述的一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于:所述采集视频数据对应实时人脸图像,图像处理包括:
确定实时对应的人脸图像视频;
视频采集时间与人脸图像视频时间同步;
依据预设的截取频率及时间间隔,对采集的实时人脸图像视频进行跟踪截取,提取人脸图像视频中人脸图像。
3.根据权利要求2所述的一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于:提取每幅人脸图像的特征点,并对提取的所述特征点进行处理,通过labeling对人脸数据进行boxes标注。
4.根据权利要求3所述的一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于:所述通过labeling对人脸数据进行boxes标注的具体过程为:
读取摄像头视频数据,确定图像数据特征点;
对实时人脸图像进行yolov5人脸检测,搭建yolov5模型;
根据simple-net对人脸进行姿态估计,获得统计学上上课头部姿态;
依据预设的人脸图像专注程度类别与专注度值区间之间的映射关系,将所述采集人脸图像对应的专注程度类别设为所述实时人脸图像所属的预设专注度值区间所映射的专注程度类别;
得到学生上课专注度。
5.根据权利要求1所述的一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于:所述步骤5的具体过程为:
对采集视频数据进行数据保存,将数据进行标注分流;
包括进行yolov5模型训练,对训练模型保存,根据保存模型进行剪枝量化,并对剪枝量化模型进行保存;
还包括根据人脸头部姿态估计打标签,确定人工矫正有误标签,根据simple-net对人脸进行姿态模型训练,进行模型保存。
6.根据权利要求1所述的一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于:所述卷积神经网络simple-net网络结构设置为9层。
7.根据权利要求6所述的一种基于3D头部姿态估计的青少年专注度评价方法,其特征在于:所述卷积神经网络simple-net网络结构全部使用卷积。
CN202211176037.0A 2022-09-26 2022-09-26 一种基于3d头部姿态估计的青少年专注度评价方法 Pending CN115497025A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211176037.0A CN115497025A (zh) 2022-09-26 2022-09-26 一种基于3d头部姿态估计的青少年专注度评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211176037.0A CN115497025A (zh) 2022-09-26 2022-09-26 一种基于3d头部姿态估计的青少年专注度评价方法

Publications (1)

Publication Number Publication Date
CN115497025A true CN115497025A (zh) 2022-12-20

Family

ID=84471466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211176037.0A Pending CN115497025A (zh) 2022-09-26 2022-09-26 一种基于3d头部姿态估计的青少年专注度评价方法

Country Status (1)

Country Link
CN (1) CN115497025A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117275069A (zh) * 2023-09-26 2023-12-22 华中科技大学 基于可学习向量与注意力机制的端到端头部姿态估计方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117275069A (zh) * 2023-09-26 2023-12-22 华中科技大学 基于可学习向量与注意力机制的端到端头部姿态估计方法
CN117275069B (zh) * 2023-09-26 2024-06-04 华中科技大学 基于可学习向量与注意力机制的端到端头部姿态估计方法

Similar Documents

Publication Publication Date Title
CN108764048B (zh) 人脸关键点检测方法及装置
CN109359526B (zh) 一种人脸姿态估计方法、装置和设备
CN111160440B (zh) 一种基于深度学习的安全帽佩戴检测方法及装置
CN112990310A (zh) 服务于电力机器人的人工智能系统及方法
CN109934847B (zh) 弱纹理三维物体姿态估计的方法和装置
CN111968048B (zh) 电力巡检少样本图像数据增强方法及系统
CN110967014B (zh) 一种基于增强现实技术的机房室内导航和设备追踪的方法
CN109145803A (zh) 手势识别方法及装置、电子设备、计算机可读存储介质
CN112991534B (zh) 一种基于多粒度物体模型的室内语义地图构建方法及系统
CN110555408A (zh) 一种基于自适应映射关系的单摄像头实时三维人体姿态检测方法
CN113159466A (zh) 一种短时光伏发电功率预测系统及方法
CN112637550B (zh) 多路4k准实时拼接视频的ptz动目标跟踪方法
CN115497025A (zh) 一种基于3d头部姿态估计的青少年专注度评价方法
CN111770450B (zh) 一种车间生产监控服务器、移动终端及应用
CN110553650A (zh) 一种基于小样本学习的移动机器人重定位方法
CN112861809B (zh) 基于多目标视频分析的课堂抬头检测系统及其工作方法
CN111898552B (zh) 一种判别人员关注目标物的方法、装置及计算机设备
CN113705393A (zh) 一种基于3d人脸模型的俯角人脸识别方法及系统
CN117711066A (zh) 一种三维人体姿态估计方法、装置、设备及介质
CN113536926A (zh) 基于距离向量和多角度自适应网络的人体动作识别方法
CN112347974A (zh) 人体头部姿态估计算法及操作员工作状态识别系统
CN113569594A (zh) 一种人脸关键点的标注方法及装置
CN116894978B (zh) 一种融合面部情绪与行为多特征的线上考试防作弊系统
CN114612864B (zh) 一种基于深度学习分割策略的智能黑烟检测方法和系统
CN113591705B (zh) 巡检机器人仪表识别系统及方法、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination