WO2020034902A1

WO2020034902A1 - 具有状态监控功能的智能桌、监控系统服务器及监控方法

Info

Publication number: WO2020034902A1
Application number: PCT/CN2019/099957
Authority: WO
Inventors: 涂列群; 刘亮
Original assignee: 昆山美卓智能科技有限公司
Priority date: 2018-08-11
Filing date: 2019-08-09
Publication date: 2020-02-20
Also published as: US11836631B2; CN110334697B; CN113792625A; US20210326585A1; CN110334697A

Abstract

本发明公开了一种具有状态监控功能的智能桌、监控系统服务器及监控方法，智能桌包括桌体、设置在桌体上的图像采集装置和AI识别模块，所述图像采集装置用于采集使用者的人脸图像，并将采集到的人脸图像输入AI识别模块，AI识别模块用于识别输入的图像中人脸是否处于注意力集中状态；所述智能桌还包括通信模块和/或本地提示装置，AI识别模块能够将注意力集中状态识别结果通过通信模块发送至后台服务器和/或第一客户端，或者，本地提示装置能够根据AI识别模块的注意力集中状态识别结果受到触发。本发明的智能桌基于AI识别技术实现对学习/工作中注意力进行监测，并在监测到注意力不集中时作出提示动作，以督促集中注意力，提高学习/工作效率。

Description

具有状态监控功能的智能桌、监控系统服务器及监控方法

相关申请的交叉引用

本申请要求2018年8月11日提交的申请号为201810911166.7的专利申请的优先权。

技术领域

本发明涉及智能书桌领域，尤其涉及一种具有状态监控功能的智能桌、监控系统服务器及监控方法。

背景技术

目前市面上的智能书桌集中在智能调节桌面、智能调光等方面作出改进，但是目前的智能书桌无法对伏案学习或者工作的人进行学习状态/工作状态的监督。因此，为了督促学生集中注意力，通常需要家长在旁监督提醒。

但是这种监督方式不仅花费家长的精力，而且使学生在学习的时候倍感压力而反感这种在旁监督的方式，反而不利于注意力的集中。

现有技术中缺少一种合理、有效的学习/工作状态监控系统和方法。

发明内容

为了解决现有技术的问题，本发明提供了一种具有状态监控功能的智能桌、监控系统服务器及监控方法，鉴于对上述过程的长期观察和思考，本设计人积极加以研究创新，以期创设一种空间环境优化装置及系统，使其更具有方便实用特点和产业上价值。所述技术方案如下：

一方面，本发明提供了一种具有状态监控功能的智能桌，包括桌体、设置在桌体上的图像采集装置和AI识别模块，所述图像采集装置用于采集使用者的人脸图像，并将采集到的所述人脸图像输入所述AI识别模块，所述AI识别模块用于识别输入的图像中人脸是否处于注意力集中状态，所述AI识别模块为由后台服务器生成并定期更新；

所述智能桌还包括通信模块和/或本地提示装置，所述AI识别模块能够将注意力集中状态识别结果通过通信模块发送至后台服务器和/或第一客户端，或者，所述本地提示装置能够根据所述AI识别模块的注意力集中状态识别结果受到触发。

进一步地，所述AI识别模块识别输入的图像中人脸是否处于注意力集中状态包括：利用眼球的对称性，根据图像中眼珠的球面弧度虚拟出眼球球心的位置，并结合图像中瞳孔中心的位置，虚拟出自眼球球心向瞳孔中心射出的目光射线，根据两眼目光射线汇聚的情况判断注意力是否集中，若所述目光射线没有焦点，或者所述目光射线的焦点在一定区域内停留的时间超过预设的时间范围，则判定为注意力不集中；若所述目光射线的焦点在预设的时间范围内发生移动，则判定为注意力集中。

进一步地，所述AI识别模块为完成训练的情绪识别神经网络模型，所述情绪识别神经网络模型的训练方法如下：

获取训练样本，所述训练样本包括若干个人脸图像样本及对应注意力集中状态的预标定结果；

定义损失函数，并对损失函数进行最小化操作；

所述情绪识别神经网络模型根据所述训练样本及完成最小化的损失函数进行自学习，直至识别结果的准确率达到预设的百分比阈值，则得到完成训练的情绪识别神经网络模型。

进一步地，所述对损失函数进行最小化操作包括：

根据神经网络的所有权重和损失函数，采用反向传播法得到损失函数的梯度；

根据所述梯度，采用随机梯度下降法，更新神经网络的权重；

将更新的权重进行预设次数的迭代，完成对损失函数的最小化操作。

进一步地，所述本地提示装置包括控制模块与执行模块，所述控制模块与所述AI识别模块的输出端电连接，所述本地提示装置能够根据所述AI识别模块输出的注意力集中状态识别结果受到触发包括：

所述控制模块接收所述AI识别模块输出的注意力集中状态识别结果，并统计识别得到注意力集中的状态结果与注意力不集中的状态结果的数量，若注意力集中的状态结果所占比例低于预设的比例阈值，则所述控制模块触发所述执行模块发出提示信号，所述提示信号包括声、光和/或振动信号。

可选地，所述图像采集装置包括一个或多个摄像头。

进一步地，所述智能桌还包括下载有第二客户端的终端，所述第二客户端与所述第一客户端能够通过后台服务器进行消息传输；

所述第二客户端能够接收第一客户端发送的本地提示请求，下载有所述第二客户端的终端根据所述本地提示请求触发本地提示装置发出提示信号，所述提示信号包括声、光和/或振动信号。

另一方面，本发明公开了一种状态监控系统服务器，所述服务器接收通过无线通信方式上传的图像，所述服务器包括AI识别模块及处理器，所述AI识别模块用于识别接收的图像中人脸处于注意力集中状态或注意力不集中状态，所述处理器用于统计所述AI识别模块的识别结果，所述服务器将接收的图像和/或所述处理器的统计结果通过无线通信方式发送至相应的第一客户端。

进一步地，所述服务器还用于将第一客户端发出的消息通过无线通信的方式转发给指定的第二客户端。

再一方面，本发明提供了一种基于情绪识别的状态监控方法，包括以下步骤：

获取待监控对象的视频信息，并将视频按时序提取一个或多个帧图像；

将所述帧图像顺序输入预训练的情绪识别神经网络模型，所述情绪识别神经网络模型用于识别帧图像中人脸处于注意力集中状态或注意力不集中状态；

接收所述情绪识别神经网络模型输出的对应于每个帧图像的识别结果；

统计识别得到注意力集中的状态结果所占比例。

进一步地，在将视频按时序提取一个或多个帧图像之后还包括：

根据人脸识别算法，提取所述帧图像中的人脸区域，生成对应的人脸区域图像。

进一步地，所述情绪识别神经网络模型的训练方法如下：

定义损失函数，并对损失函数进行最小化操作；

进一步地，所述统计识别得到注意力集中的状态结果所占比例之后还包括：

将统计结果发送至施行监控方的第一客户端；或者，

若所述注意力集中的状态结果所占比例低于预设的比例阈值，则向施行监控方的第一客户端发送提示消息，或者向被监控方的第二客户端发送提示消息；或者，

接收施行监控方的第一客户端发送的消息或请求，并将所述消息或请求转发至被监控方的第二客户端。

本发明还提供了一种基于人脸识别技术的工作、学习状态监测方法，包括面向人脸摄像的摄像系统，连接用于视频、图像处理的处理单元、连接数据管理的存储器，监测方法包括以下步骤：S1：通过摄像头采集人面部特征图像或视频；S2：依据人脸识别算法，提取出视频图像中的人脸区域，提取人脸区域内的特征点/量；S3：根据提取的人脸区域的特征判断工作、学习人员是否有分心，不在学习或工作状态，即注意力是否分散；

系统还包括网络系统，连接处理单元和存储器，转存或直接在网络系统的云端存储摄像系统资料；

步骤S2中，提取工作、学习状态中的视频图像中的人脸区域包括以下步骤：S2.1：对采集的工作、学习时的脸部视频进行图像取样，取样值为2帧或若干帧图片相互比较特征量或特征点，或者由用户自定义，时间范围在N秒或N帧进行比对；或者如果涉及到多个摄像头，则将不同摄像头之间采集到的特征集进行对比；

S2.1之后S2.2：依据人脸识别原理，对图像中的人脸图像进行特征提取，将特征集入库存取；S2.3：如涉及到多个摄像头，则将不同摄像头之间采集到的特征集进行比对，按照设定的阈值确认人员重复数量、消重、避免人员被重复统计；

所述方法还包括：建立受监控的工作、学习状态中的人的人脸图库，通过人脸比对从而识别每个人的专注度数据，从而判断某个特定人的专注度行为，分析其参数和特征；

所述处理器还连接一摄像头，用于拍摄学习或工作内容所在的区域；

所述方法还包括：导入状态监控过程数据，形成被监控人的过程专注度分布分析，具体包括：1、在网络段按照设定的阈值发布多级报警信号给上级管理员，特别是网络端的高级管理员；2、以时间值为维度进行数据关联；3、以时间为轴线，形成监控场景/区域内的过程专注度分布结果，完成被监控人工作、学习状态的监控。

本发明提供的技术方案带来的有益效果如下：

a.智能桌配置本地AI识别模块，实现离网状况下对学习者的学习状态进行监控，督促提高学习效率；

b.智能桌的通信模块连接云端服务器，实现云端监控和远程监控。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的具有状态监控功能的智能桌的模块框图；

图2是本发明实施例提供的状态监控系统的基本模块框图；

图3是本发明实施例提供的具有人脸特征提取功能的状态监控系统的模块框图；

图4是本发明实施例提供的基于情绪识别的状态监控方法的流程图；

图5是本发明实施例提供的状态监控方法中设有人脸特征提取步骤的流程图；

图6是本发明实施例提供的状态监控方法中第一客户端进行提醒控制的方法流程图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本发明的一个实施例中，提供了一种具有状态监控功能的智能桌，如图1所示，所述智能桌包括桌体、设置在桌体上的图像采集装置和AI识别模块，所述图像采集装置用于采集使用者的人脸图像，并将采集到的所述人脸图像输入所述AI识别模块，所述AI识别模块用于识别输入的图像中人脸是否处于注意力集中状态，所述AI识别模块由所述后台服务器生成并定期更新。

在所述AI识别模块完成训练的情况下，即使断网，所述智能桌也可以实现状态监控功能：所述智能桌上设有本地提示装置，所述本地提示装置包括控制模块与执行模块，所述控制模块与所述AI识别模块的输出端电连接，所述控制模块接收所述AI识别模块输出的注意力集中状态识别结果，并统计识别得到注意力集中的状态结果与注意力不集中的状态结果的数量，若注意力集中的状态结果所占比例低于预设的比例阈值，则所述控制模块触发所述执行模块发出提示信号，所述提示信号包括声、光和/或振动信号。优选地，所述图像采集装置等时间间隔地采集使用者的人脸图像，这样，使得统计的图片数量比值就可以类比于时间的比值，比如在40分钟内，所述图像采集装置采集了4800帧图像，或者拍摄得到的视频流可以按时序提取等时间间隔的4800帧图像，每一帧图像输入AI识别模块进行识别，所述AI识别模块的识别结果要么为1(表示注意力集中)，要么为0(表示注意力不集中)，所述控制模块统计在这4800帧图像中，识别为1的帧图像的数量为N，则其所占比例为N/4800，相当于注意力集中的时间占总时间(40分钟)的比例。根据专家分析，全程40分钟要保持注意力集中是基本上不可能的，按照专家的建议，可以制定注意力集中评价结果，比如40分钟内注意力集中的时间少于25分钟，则评价为注意力集中度不合格，注意力集中的时间多于或等于32分钟，则评价为注意力集中度优秀，等等。按照上述标准，若所述控制模块统计识别结果为1的帧图像的数量少于3000(即4800*25/40)帧，则所述控制模块触发执行模块发出提示信号，所述执行模块可以是指示灯、扬声器喇叭或者是振动电机等等，也可以是结合多种提示方式。

除了断网状态下进行监控提醒，在本发明的一个实施例中，可以实现在线监控提醒，在线状态下，所述后台服务器可以对所述AI识别模块进行模型更新优化，以不断提高模型识别的准确率。在线监控的过程如下：所述AI识别模块能够通过通信模块与后台服务器通信连接，并通过后台服务器与对应的监控方(比如家长)的手机客户端连接，最终将AI识别结果或者视频图像发送至家长的手机上，或者经过后台服务器对AI识别结果进行分析处理后，得到的分析结果(比如注意力集中曲线及集中度评价结果，比如以时间为轴线形成监控区域内的过程专注度分布曲线)发送至家长的手机上，或者将提醒消息发送至智能桌侧的第二客户端，以提醒被监控方集中注意力。下文中将监控方比如家长的手机客户端称为第一客户端，将集成在智能桌桌体上的或者学生自己的手机(或平板等其他终端)上的客户端称为第二客户端。需要说明的是，本发明的智能桌对于具体为书桌、工作桌还是其他类型的桌子不作特别限定。

下面对AI识别模块识别输入的图像中人脸是否处于注意力集中状态的具体方案进行说明：

第一种方案是：所述AI识别模块识别输入的图像中人脸是否处于注意力集中状态包括：利用眼球的对称性，根据图像中眼珠的球面弧度虚拟出眼球球心的位置，并结合图像中瞳孔中心的位置，虚拟出自眼球球心向瞳孔中心射出的目光射线，根据两眼目光射线汇聚的情况判断注意力是否集中，若所述目光射线没有焦点，或者所述目光射线的焦点在一定区域内停留的时间超过预设的时间范围，则判定为注意力不集中；若所述目光射线的焦点在预设的时间范围内发生移动，则判定为注意力集中。其中，针对所述目光射线没有焦点的情况，根据单帧图像即可判断出，而针对目光射线有焦点的情况，需要根据前后多帧图像才可以判断出注意力是否集中。

第二种方案，所述AI识别模块实际上为完成训练的情绪识别神经网络模型，所述AI识别模块由后台服务器训练得到，所述情绪识别神经网络模型的训练方法如下：

首先，获取训练样本，所述训练样本包括若干个人脸图像样本及对应注意力集中状态的预标定结果。具体地，所述训练样本的标定由专业的心理学家或教育学家进行标定，即对于某一帧图像，标定为1则表明该帧图像中的人脸反映出注意力集中的状态，标定为0则表明该帧图像中的人脸反映出注意力不集中的状态。完成标定的训练样本输入神经网络模型进行训练学习，训练样本越多，标定越准确，则最后训练完成后的情绪识别神经网络模型的识别准确性就越高。

其次，定义损失函数，并对损失函数进行最小化操作。具体地，根据神经网络的所有权重和损失函数，采用反向传播法得到损失函数的梯度；根据所述梯度，采用随机梯度下降法，更新神经网络的权重；将更新的权重进行预设次数的迭代，完成对损失函数的最小化操作。

再次，所述情绪识别神经网络模型根据所述训练样本及完成最小化的损失函数进行自学习，直至识别结果的准确率达到预设的百分比阈值，则得到完成训练的情绪识别神经网络模型。其中，所述百分比阈值是人为设定的，设定值越高，则训练时间越长及训练难度越大，完成训练的模型的识别准确性也越大。

在本发明的一个优选实施例中，所述图像采集装置包括一个或多个摄像头，所述桌体具有可升降结构，所述摄像头随所述桌体桌面的升高而升高或者随所述桌体桌面的降低而降低。即所述摄像头与所述桌体桌面之间的高度保持不变，这样可以使得不管智能桌的使用者身高如何，当桌面调节到适合其的高度时，所述摄像头可以拍摄到其人脸图像。至于多个摄像头，其拍摄的方向均集中朝向同一个使用者，相比于单个摄像头，设置多个摄像头能够多个角度地拍摄人脸图像，其中，优选以正面拍摄的人脸图像为主要判断依据，侧面拍摄的图像为辅助判断依据，在正面图像能够较高准确度地判定注意力集中状态的前提下，侧拍图像可以不加以分析，只有当正面图像无法有大的把握判定正确的状态时，需要侧拍图像辅助分析，以提高情绪识别神经网络模型的识别结果的正确率。所述摄像头优选为大广角镜头，所述摄像头固定的位置可变。

在本发明的一个优选实施例中，所述智能桌还包括下载有第二客户端的终端(该终端可以为学生的智能终端，也可以为集成在智能桌上的智能终端)，当所述终端连接网络的前提下，所述第二客户端与所述第一客户端能够通过后台服务器进行消息传输，比如所述第二客户端能够与所述第一客户端进行语音和/或视频通讯，所述语音和/或视频通讯可以由第一客户端向第二客户端发起，也可以由第二客户端向第一客户端发起。或者，所述第二客户端能够接收第一客户端发送的本地提示请求，下载有所述第二客户端的终端根据所述本地提示请求触发本地提示装置发出提示信号，所述提示信号包括声、光和/或振动信号，比如，家长通过第一客户端查询到智能桌前学习的用户注意力不集中，则家长在第一客户端点击提醒按钮，后台服务器接收到该第一客户端的提醒动作，则向与第一客户端对应的第二客户端发送提示信号，比如使第二客户端接收到消息铃声或者控制所述第二客户端所在的终端播放提示动画或使其处于振动模式。

在本发明的一个实施例中，提供了一种状态监控系统服务器，如图2所示，所述服务器接收通过无线通信方式上传的图像，与上述实施例中AI识别模块设置在本地不同的是，本实施例中的AI识别模块设置在服务器端或云端，所述服务器包括AI识别模块及处理器，所述AI识别模块用于识别接收的图像中人脸处于注意力集中状态或注意力不集中状态，所述处理器用于统计所述AI识别模块的识别结果，所述服务器将接收的图像和/或所述处理器的统计结果通过无线通信方式发送至相应的第一客户端。在本发明的一个优选实施例中，所述状态监控系统如图3所示，其中所述处理器还用于根据人脸识别算法，提取所述帧图像中的人脸区域，生成对应的人脸区域图像，这样由于提取了人脸区域的图像，而放弃了人脸区域以外的图像，可以使得降低原图像的干扰，提高最终AI识别模块的识别准确率。另外，将AI识别模块设置在服务器端，由于服务器对应于多个智能桌的图像采集装置，因此，服务器可以接收多个智能桌上传的图像资源，使得服务器端的AI识别模块能够(相比于设置在智能桌本地的情况) 具有更广泛的学习素材资源，以更好地自适应学习，提高模型精度和识别准确率。

本发明实施例的状态监控系统服务器还用于将第一客户端发出的消息通过无线通信的方式转发给指定的第二客户端，所述消息包括比如音频/视频通话请求、比如提醒集中注意力的信号，又或者是触发智能桌上的本地提示装置的触发信号，作为一种可实施例的技术方案，具体如下：当家长在第一客户端上发送智能提醒信号，所述服务器可以将该提醒信号发送至第二客户端，在第二客户端所在终端连接智能桌上的本地提示装置中的控制模块的输入端的前提下，所述控制模块可以根据所述第一客户端的智能提醒信号控制所述本地提示装置中的执行模块发出本地提示信号，比如所述执行模块为嵌置在桌面中的振动电机，实现预设时间的振动，即家长远程监控，当发现被监测对象注意力不集中的时候，按下手机客户端按钮，即可触发智能桌的桌面发生振动，以提醒被监测对象集中注意力，这对于注意力不集中的用户立马集中注意力非常有效。

在本发明的一个实施例中，提供了一种基于情绪识别的状态监控方法，参见图4，所述监控方法包括以下步骤：

S11、获取待监控对象的视频信息，并将视频按时序提取等时间间隔的一个或多个帧图像。具体地，所述视频信息由智能桌上的图像采集装置(摄像装置)摄取，能够摄取到包含被监控对象的人脸区域的图像。

S12、将所述帧图像顺序输入预训练的情绪识别神经网络模型，所述情绪识别神经网络模型用于识别帧图像中人脸处于注意力集中状态或注意力不集中状态。

S13、接收所述情绪识别神经网络模型输出的对应于每个帧图像的识别结果。

S14、统计识别得到注意力集中的状态结果所占比例。

在S14之后，一种是可以主动地将统计结果发送至施行监控方的第一客户端；另一种是等第一客户端发送查询请求之后，再将统计结果发送至施行监控方的第一客户端。

在S14之后，还可以执行S15、判断注意力集中的状态结果所占比例是否低于预设的比例阈值，若是，则执行S16、向施行监控方的第一客户端发送提示消息，或者直接向被监控方的第二客户端发送提示消息，如图4所示。

在本发明的一个优选实施例中，所述状态监控方法还包括：接收施行监控方的第一客户端发送的消息或请求；将所述消息或请求转发至被监控方的第二客户端，所述消息或请求包括比如音频/视频通话请求、比如提醒集中注意力的信号，又或者是触发智能桌上的本地提示装置的触发信号。

S12中的所述情绪识别神经网络模型的训练方法如下：

定义损失函数，并对损失函数进行最小化操作；

具体参见上述智能桌实施例，在此不再赘述。

在本发明的一个更优选实施例中，所述基于情绪识别的状态监控方法如图5所示，包括以下步骤：

S21、获取待监控对象的视频信息，并将视频按时序提取等时间间隔的一个或多个帧图像。具体地，所述视频信息由智能桌上的图像采集装置(摄像装置)摄取，能够摄取到包含被监控对象的人脸区域的图像。

S22、根据人脸识别算法，提取所述帧图像中的人脸区域，生成对应的人脸区域的新的帧图像。

S23、将所述帧图像顺序输入预训练的情绪识别神经网络模型，所述情绪识别神经网络模型用于识别帧图像中人脸处于注意力集中状态或注意力不集中状态。

S24、接收所述情绪识别神经网络模型输出的对应于每个帧图像的识别结果。

S25、统计识别得到注意力集中的状态结果所占比例。

所述基于情绪识别的状态监控方法还可以包括以下步骤，如图6所示：

S31、接收施行监控方的第一客户端的提醒请求；

S32、将所述提醒请求转发至被监控方的第二客户端。

第二客户端在接收到提醒请求后，一种方式是在第二客户端上或者其所在终端上发出提示信息，提醒被监控方集中注意力，另一种方式是通过第二客户端所在终端将所述提醒请求发送至本地提示装置的控制模块，由控制模块控制所述本地提示装置的执行模块执行声、光和/或振动报警操作。

本发明公开了一种基于人脸识别技术的工作、学习状态监测系统及系统，特别涉及监督学生的及提高学习效率和工作人员效率用的一种基于人脸识别技术的工作、学习状态监测系统及系统。现有的技术方案中，对于学习的人的分析，直接通过监督的人旁观的方式去记录，偏重于听课人员的主观印象的人工方式；本技术采用比较新的技术，通过人脸识别来进行分析判断。从而改变依赖大量的人力参与，缺乏实际应用效果的方式。而目前市场上出现本方法在数据采集之后的计算分析上，缺乏科学性；在实际应用上，缺乏数据应用的关联分析，系统性缺失。鉴于对上述过程的长期观察和思考，本设计人积极加以研究创新，以期创设一种空间环境优化装置及系统，使其更具有方便实用特点和产业上价值。

本发明的首要目的是提供一种基于人脸识别技术的工作、学习状态监测系统，通过科学的大数据算法，为教学的学情分析或工作效率监控，提供了客观、真实的数据结果。本发明的进一步目的是供一种基于人脸识别技术的的工作、学习状态监测系统。本系统能够提供高效的学习环境和高效的工作环境，统计出被监控人的最佳学习时间和工作状态时间段。为解决上述技术问题，本发明的技术方案如下：在本发明的一个实施例中，提供了一种基于人脸识别技术的工作、学习状态监测方法，包括面向人脸摄像的摄像系统，连接用于视频、图像处理的处理单元、连接数据管理的存储器，所述监测方法包括以下步骤：S1：通过摄像头采集人面部特征图像或视频；S2：依据人脸识别算法，提取出视频图像中的人脸区域，提取人脸区域内的特征点/量；S3：根据提取的人脸区域的特征判断工作、学习人员是否有分心，不在学习或工作状态，即注意力是否分散。

较佳地，所述系统还包括网络系统，连接处理单元和存储器，转存或直接在网络系统的云端存储摄像系统资料；

较佳地，步骤S2中，提取工作、学习状态中的视频图像中的人脸区域包括以下步骤：S2.1：对采集的工作、学习时的脸部视频进行图像取样，取样值为2帧或若干帧图片相互比较特征量或特征点，或者由用户自定义，时间范围在N秒或N帧进行比对；或者如果涉及到多个摄像头，则将不同摄像头之间采集到的特征集进行对比；

较佳地，S2.1之后S2.2：依据人脸识别原理，对图像中的人脸图像进行特征提取，将特征集入库存取；S2.3：如涉及到多个摄像头，则将不同摄像头之间采集到的特征集进行比对，按照设定的阈值确认人员重复数量、消重、避免人员被重复统计；

较佳地，所述方法还包括：建立受监控的工作、学习状态中的人的人脸图库，通过人脸比对从而识别每个人的专注度数据，从而判断某个特定人的专注度行为，分析其参数和特征；

较佳地，所述处理器还连接一摄像头，用于拍摄学习或工作内容所在的区域；例如工作工具的电脑屏幕、学习时的桌面上书等，一般该摄像头设置在被监控对象的人脸前方，优选其设置位置可调。

较佳地，所述方法还包括：导入状态监控过程数据，形成被监控人的过程专注度分布分析，具体包括：1、在网络段按照设定的阈值发布多级报警信号给上级管理员，特别是网络端的高级管理员；2、以时间值为维度进行数据关联；3、以时间为轴线，形成监控场景/区域内的过程专注度分布结果，完成被监控人工作、学习状态的监控。

本发明的智能桌基于AI识别技术实现对学习/工作中注意力进行监测，并在监测到注意力不集中时作出提示动作，以督促集中注意力，提高学习/工作效率。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种基于人脸识别技术的工作、学习状态监测方法，包括面向人脸摄像的摄像系统，连接用于视频、图像处理的处理单元、连接数据管理的存储器，其特征在于，包括以下步骤：S1：通过摄像头采集人面部特征图像或视频；S2：依据人脸识别算法，提取出视频图像中的人脸区域，提取人脸区域内的特征点/量；S3：根据提取的人脸区域的特征判断工作、学习人员是否有分心，不在学习或工作状态，即注意力是否分散；

系统还包括网络系统，连接处理单元和存储器，转存或直接在网络系统的云端存储摄像系统资料；

步骤S2中，提取工作、学习状态中的视频图像中的人脸区域包括以下步骤：S2.1：对采集的工作、学习时的脸部视频进行图像取样，取样值为2帧或若干帧图片相互比较特征量或特征点，或者由用户自定义，时间范围在N秒或N帧进行比对；或者如果涉及到多个摄像头，则将不同摄像头之间采集到的特征集进行对比；

S2.1之后S2.2：依据人脸识别原理，对图像中的人脸图像进行特征提取，将特征集入库存取；S2.3：如涉及到多个摄像头，则将不同摄像头之间采集到的特征集进行比对，按照设定的阈值确认人员重复数量、消重、避免人员被重复统计；

所述方法还包括：建立受监控的工作、学习状态中的人的人脸图库，通过人脸比对从而识别每个人的专注度数据，从而判断某个特定人的专注度行为，分析其参数和特征；

所述处理器还连接一摄像头，用于拍摄学习或工作内容所在的区域；

所述方法还包括：导入状态监控过程数据，形成被监控人的过程专注度分布分析，具体包括：1、在网络段按照设定的阈值发布多级报警信号给上级管理员，特别是网络端的高级管理员；2、以时间值为维度进行数据关联；3、以时间为轴线，形成监控场景/区域内的过程专注度分布结果，完成被监控人工作、学习状态的监控。
一种具有状态监控功能的智能桌，其特征在于，包括桌体、设置在桌体上的图像采集装置和AI识别模块，所述图像采集装置用于采集使用者的人脸图像，并将采集到的所述人脸图像输入所述AI识别模块，所述AI识别模块用于识别输入的图像中人脸是否处于注意力集中状态，所述AI识别模块为由后台服务器生成并定期更新；

所述智能桌还包括通信模块和/或本地提示装置，所述AI识别模块能够将注意力集中状态识别结果通过通信模块发送至后台服务器和/或第一客户端，或者，所述本地提示装置能够根据所述AI识别模块的注意力集中状态识别结果受到触发。
根据权利要求2所述的智能桌，其特征在于，所述AI识别模块识别输入的图像中人脸是否处于注意力集中状态包括：利用眼球的对称性，根据图像中眼珠的球面弧度虚拟出眼球球心的位置，并结合图像中瞳孔中心的位置，虚拟出自眼球球心向瞳孔中心射出的目光射线，根据两眼目光射线汇聚的情况判断注意力是否集中，若所述目光射线没有焦点，或者所述目光射线的焦点在一定区域内停留的时间超过预设的时间范围，则判定为注意力不集中；若所述目光射线的焦点在预设的时间范围内发生移动，则判定为注意力集中。
根据权利要求2所述的智能桌，其特征在于，所述AI识别模块为完成训练的情绪识别神经网络模型，所述情绪识别神经网络模型的训练方法如下：

获取训练样本，所述训练样本包括若干个人脸图像样本及对应注意力集中状态的预标定结果；

定义损失函数，并对损失函数进行最小化操作；

所述情绪识别神经网络模型根据所述训练样本及完成最小化的损失函数进行自学习，直至识别结果的准确率达到预设的百分比阈值，则得到完成训练的情绪识别神经网络模型。
根据权利要求4所述的智能桌，其特征在于，所述对损失函数进行最小化操作包括：

根据神经网络的所有权重和损失函数，采用反向传播法得到损失函数的梯度；

根据所述梯度，采用随机梯度下降法，更新神经网络的权重；

将更新的权重进行预设次数的迭代，完成对损失函数的最小化操作。
根据权利要求2所述的智能桌，其特征在于，所述本地提示装置包括控制模块与执行模块，所述控制模块与所述AI识别模块的输出端电连接，所述本地提示装置能够根据所述AI识别模块输出的注意力集中状态识别结果受到触发包括：

所述控制模块接收所述AI识别模块输出的注意力集中状态识别结果，并统计识别得到注意力集中的状态结果与注意力不集中的状态结果的数量，若注意力集中的状态结果所占比例低于预设的比例阈值，则所述控制模块触发所述执行模块发出提示信号，所述提示信号包括声、光和/或振动信号。
根据权利要求2所述的智能桌，其特征在于，所述智能桌还包括下载有第二客户端的终端，所述第二客户端与所述第一客户端能够通过后台服务器进行消息传输；

所述第二客户端能够接收第一客户端发送的本地提示请求，下载有所述第二客户端的终端根据所述本地提示请求触发本地提示装置发出提示信号，所述提示信号包括声、光和/或振动信号。
一种状态监控系统服务器，其特征在于，所述服务器接收通过无线通信方式上传的图像，所述服务器包括AI识别模块及处理器，所述AI识别模块用于识别接收的图像中人脸处于注意力集中状态或注意力不集中状态，所述处理器用于统计所述AI识别模块的识别结果，所述服务器将接收的图像和/或所述处理器的统计结果通过无线通信方式发送至相应的第一客户端。
一种基于情绪识别的状态监控方法，其特征在于，包括以下步骤：

获取待监控对象的视频信息，并将视频按时序提取一个或多个帧图像；

将所述帧图像顺序输入预训练的情绪识别神经网络模型，所述情绪识别神经网络模型用于识别帧图像中人脸处于注意力集中状态或注意力不集中状态；

接收所述情绪识别神经网络模型输出的对应于每个帧图像的识别结果。
根据权利要求9所述的状态监控方法，其特征在于，在将视频按时序提取一个或多个帧图像之后还包括：

根据人脸识别算法，提取所述帧图像中的人脸区域，生成对应的人脸区域图像。
根据权利要求9所述的状态监控方法，其特征在于，所述情绪识别神经网络模型的训练方法如下：

获取训练样本，所述训练样本包括若干个人脸图像样本及对应注意力集中状态的预标定结果；

定义损失函数，并对损失函数进行最小化操作；

所述情绪识别神经网络模型根据所述训练样本及完成最小化的损失函数进行自学习，直至识别结果的准确率达到预设的百分比阈值，则得到完成训练的情绪识别神经网络模型。
根据权利要求9所述的状态监控方法，其特征在于，所述接收所述情绪识别神经网络模型输出的对应于每个帧图像的识别结果之后还包括：统计识别得到注意力集中的状态结果所占比例；及/或

将统计结果发送至施行监控方的第一客户端；或者，

若所述注意力集中的状态结果所占比例低于预设的比例阈值，则向施行监控方的第一客户端发送提示消息，或者向被监控方的第二客户端发送提示消息；或者，

接收施行监控方的第一客户端发送的消息或请求，并将所述消息或请求转发至被监控方的第二客户端。