CN115410275A - 基于图像识别的办公场所人员状态检测方法及其系统 - Google Patents

基于图像识别的办公场所人员状态检测方法及其系统 Download PDF

Info

Publication number
CN115410275A
CN115410275A CN202211051208.7A CN202211051208A CN115410275A CN 115410275 A CN115410275 A CN 115410275A CN 202211051208 A CN202211051208 A CN 202211051208A CN 115410275 A CN115410275 A CN 115410275A
Authority
CN
China
Prior art keywords
image
feature map
tracking
key frames
tracking feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211051208.7A
Other languages
English (en)
Inventor
张凯元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Junkai Electronic Technology Co ltd
Original Assignee
Shaanxi Junkai Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Junkai Electronic Technology Co ltd filed Critical Shaanxi Junkai Electronic Technology Co ltd
Priority to CN202211051208.7A priority Critical patent/CN115410275A/zh
Publication of CN115410275A publication Critical patent/CN115410275A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像识别的办公场所人员状态检测方法及其系统,其从摄像头采集的待监测对象的监控视频中提取前景部分以得到多个图像前景关键帧,并通过使用三维卷积核的第一神经网络对多个图像前景关键帧进行编码以得到第一跟踪特征图,使用目标检测网络以及第三卷积核的第二卷积神经网络对多个图像前景关键帧中各个图像前景关键帧进行编码以得到第二跟踪特征图,然后对所述第一跟踪特征图和所述第二跟踪特征图进行校正并融合以得到分类特征图,该分类特征图通过分类器以得到用于表示待监测对象是否存在异常行为的分类结果。

Description

基于图像识别的办公场所人员状态检测方法及其系统
技术领域
本申请涉及办公场所人员状态检测技术领域,且更为具体地,涉及一种基于图像识别的办公场所人员状态检测方法及其系统。
背景技术
对于现代企业而言,办公场所内人员的工作状态管理与监控是一直以来存在的难题。例如,在以时薪制为主导的企业中,员工在办公场所内会做出上班时间打瞌睡、上班时间擅自离岗、姿态异常、疲劳作业等。传统的解决方案是通过人工来进行监管,例如,通过上级主管的巡查等,但这种人工方案不仅浪费上级主管的时间,且监管效果也不好。
因此,期待一种用于对办公场所的人员进行状态检测的方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于图像识别的办公场所人员状态检测系统、方法和电子设备,其从摄像头采集的待监测对象的监控视频中提取前景部分以得到多个图像前景关键帧,通过使用三维卷积核的第一神经网络对多个图像前景关键帧进行编码以得到第一跟踪特征图,使用目标检测网络以及第三卷积核的第二卷积神经网络对多个图像前景关键帧中各个图像前景关键帧进行编码以得到第二跟踪特征图,然后对所述第一跟踪特征图和所述第二跟踪特征图进行校正并融合以得到分类特征图,该分类特征图通过分类器以得到用于表示待监测对象是否存在异常行为的分类结果,这样有利于提高办公场所内人员的监管效果。
根据本申请的一个方面,提供了一种基于图像识别的办公场所人员状态检测系统,包括:
监控模块,用于获取由部署于办公场所内的摄像头采集的待监测对象的监控视频;
图像关键帧提取模块,用于从所述监控图像提取多个图像关键帧;
去背景模块,用于提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;
第一卷积编码模块,用于将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图;
感兴趣区域提取模块,用于将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;
第二卷积编码模块,用于将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;
特征分布校正模块,用于分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;
特征融合模块,用于融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;以及
状态检测结果生成模块,用于将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
另一方面,本申请提供一种基于图像识别的办公场所人员状态检测方法,包括:
获取由部署于办公场所内的摄像头采集的待监测对象的监控视频;
从所述监控图像提取多个图像关键帧;
提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;
将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图;
将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;
将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;
分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;
融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;以及
将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于图像识别的办公场所人员状态检测方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于图像识别的办公场所人员状态检测方法。
与现有技术相比,本申请提供的基于图像识别的办公场所人员状态检测系统及其方法,其从摄像头采集的待监测对象的监控视频中提取前景部分以得到多个图像前景关键帧,通过使用三维卷积核的第一神经网络对多个图像前景关键帧进行编码以得到第一跟踪特征图,使用目标检测网络以及第三卷积核的第二卷积神经网络对多个图像前景关键帧中各个图像前景关键帧进行编码以得到第二跟踪特征图,然后对所述第一跟踪特征图和所述第二跟踪特征图进行校正并融合以得到分类特征图,该分类特征图通过分类器以得到用于表示待监测对象是否存在异常行为的分类结果,这样有利于提高办公场所内人员的监管效果。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的基于图像识别的办公场所人员状态检测方法的一个应用场景图。
图2图示了根据本申请实施例的基于图像识别的办公场所人员状态检测系统的结构框图;
图3图示了根据本申请实施例的基于图像识别的办公场所人员状态检测系统的架构示意图;
图4图示了根据本申请实施例的基于图像识别的办公场所人员状态检测方法的流程图;
图5图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述:
如上所述,期待一种用于对办公场所的人员进行状态检测的方案。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
深度学习以及神经网络的发展为办公场所的人员的状态检测提供了新的解决思路和解决方案。应可以理解,办公场所内人员状态检测问题本质上是一个多分类问题,也就是,对办公场所内人员的行为特征进行提取,并将行为特征输入到多标签分类器进行分类以得到办公场所内人员的行为标签。在本申请的应用场景中,行为标签包括但不限于上班时间打瞌睡、上班时间擅自离岗、姿态异常、疲劳作业等。
具体地,首先通过部署于办公场所内的摄像头采集待监测对象的监控视频。考虑到整个监控视频中许多连续帧是重复或相似的,造成了信息冗余,增加后续模型计算量。针对这一技术问题,从所述监控图像中提取所述多个图像帧作为所述多个图像关键帧,这样有效去除视频序列冗余信息,极大提高了时间效率。例如,在本申请一个具体的示例中,以预定采样频率从所述监控图像中提取所述多个图像帧作为所述多个图像关键帧;在本申请另一具体的示例中,以差帧法(利用相邻图像帧之间的差异作为关键帧确定标准)从所述监控图像中提取所述多个图像帧作为所述多个图像关键帧。
进一步地,为了去除背景信息的干扰,利用前景提取模板从所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧。接着,以卷积神经网络模型作为特征提取器从所述多个图像前景关键帧提取被监控对象的行为特征以得到第一跟踪特征图。也就是,以所述多个图像前景关键帧替代整个所述监控视频作为神经网络的输入,以一方面降低所述神经网络模型的数据处理量,另一方面,避免输入端带入的干扰信息为神经网络的特征提取带来混淆。
除了以整个被监控对象作为特征提取的单元外,在本申请的技术方案中,考虑到人员状态更多地反应在人脸区域,因此,在本申请的技术方案中,将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域,这里,所述目标区域检测网络为人脸区域检测网络。然后,同样以使用三维卷积核的神经网络模型作为特征提取器提取所述被监控对象的人脸区域的动态变化特征,以得到第二跟踪特征图。
接着,在融合所述第一跟踪特征图和所述第二跟踪特征图以得到分类特征图后,将所述分类特征图通过分类器就可以得到用于表示待监测对象是否存在异常行为的分类结果。
特别地,在本申请的技术方案中,由于所述第一跟踪特征图表示所述图像前景关键帧的图像语义关联特征,而所述第二跟踪特征图表示图像前景关键帧的感兴趣区域的图像语义关联特征,这使得所述第二跟踪特征图作为局部图像语义关联特征,与所述第一跟踪特征图的整体图像语义关联特征之间存在高维流形的尺度差异,导致融合后的高维流形可能存在尺度相容性方面的缺陷,影响分类效果。
因此,基于所述第一跟踪特征图和所述第二跟踪特征图在图像维度上的局部-整体的重叠关系,计算所述第一跟踪特征图和所述第二跟踪特征图的节俭分解鼓励因数作为加权系数,表示为:
Figure 537898DEST_PATH_IMAGE001
Figure 306134DEST_PATH_IMAGE002
Figure 939109DEST_PATH_IMAGE003
Figure 335455DEST_PATH_IMAGE004
分别是所述第一跟踪特征图和所述第二跟踪特征图的特征值,
Figure 146417DEST_PATH_IMAGE005
Figure 878313DEST_PATH_IMAGE006
是超参数,
Figure 659187DEST_PATH_IMAGE007
表示
Figure 316564DEST_PATH_IMAGE007
激活函数,且
Figure 157481DEST_PATH_IMAGE008
表示向量的二范数
该节俭分解鼓励因数用于对特征图在图像平面上进行分组,并对组内元素的重叠施加惩罚,以通过计算符号化函数的距离式联合来促进特征图的高维流形的节俭分解,也就是,将高维流形的几何形状分解为凸多面体(convex polytope)的集合,这样,在融合所述第一跟踪特征图和所述第二跟踪特征图时,由于将所述将第一跟踪特征图和所述第二跟踪特征图均以基础流形的集合表示,就提高了融合后的高维流形的尺度相容性。这样,提高对办公场所内人员状态监测的精准度。
基于此,本申请提出了一种基于图像识别的办公场所人员状态检测系统及其方法,其从摄像头采集的待监测对象的监控视频中提取前景部分以得到多个图像前景关键帧,通过使用三维卷积核的第一神经网络对多个图像前景关键帧进行编码以得到第一跟踪特征图,使用目标检测网络以及第三卷积核的第二卷积神经网络对多个图像前景关键帧中各个图像前景关键帧进行编码以得到第二跟踪特征图,然后对所述第一跟踪特征图和所述第二跟踪特征图进行校正并融合以得到分类特征图,该分类特征图通过分类器以得到用于表示待监测对象是否存在异常行为的分类结果,这样有利于提高办公场所内人员的监管效果。
图1图示了根据本申请实施例的基于图像识别的办公场所人员状态检测方法的场景示意图。如图1所示,在本申请的一个应用场景中,首先,通过部署于办公场所(如图1中的W)内的摄像头(如图1中的C)采集待监测对象(如图1中的P)的监控视频,然后,将待监测对象的监控视频输入至部署有基于图像识别的办公场所人员状态检测算法的服务器(如图1中的S)中,其中,所述服务器能够通过基于图像识别的办公场所人员状态检测算法对待监测对象的监控视频进行处理,以输出用于表示待监测对象是否存在异常行为的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图2图示了根据本申请实施例的基于图像识别的办公场所人员状态检测系统的结构框图。
如图2所示,本申请实施例提供的基于图像识别的办公场所人员状态检测系统100,包括:监控模块110,用于获取由部署于办公场所内的摄像头采集的待监测对象的监控视频;图像关键帧提取模块120,用于从所述监控图像提取多个图像关键帧;去背景模块130,用于提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;第一卷积编码模块140,用于将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图;感兴趣区域提取模块150,用于将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;第二卷积编码模块160,用于将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;特征分布校正模块170,用于分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;特征融合模块180,用于融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;状态检测结果生成模块190,用于将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
图3图示了根据本申请实施例的基于图像识别的办公场所人员状态检测系统的架构示意图。如图3所示,在该网络架构中,首先,从待监测对象的监控视频中提取多个图像关键帧,并提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;接着,将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图,将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域,将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;然后,分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;然后,融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;最后,将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
具体地,所述监控模块110用于获取由部署于办公场所内的摄像头采集的待监测对象的监控视频。为了提取办公场所内人员的行为特征,在本申请实施例中,通过部署于办公场所内的摄像头采集的待监测对象的监控视频,从该待监测对象的监控视频中提取出待监测对象的行为特征,用以判定待监测对象是否存在异常行为。
所述图像关键帧提取模块120用于从所述监控图像提取多个图像关键帧。考虑到整个监控视频中许多连续帧是重复或相似的,造成了信息冗余,增加后续模型计算量。针对这一技术问题,从所述监控图像中提取所述多个图像帧作为所述多个图像关键帧,这样有效去除视频序列冗余信息,极大提高了时间效率。例如,在本申请一个具体的示例中,以预定采样频率从所述监控图像中提取所述多个图像帧作为所述多个图像关键帧;在本申请另一具体的示例中,以差帧法(利用相邻图像帧之间的差异作为关键帧确定标准)从所述监控图像中提取所述多个图像帧作为所述多个图像关键帧。
更具体地,所述图像关键帧提取模块120包括:
预处理模块,用于对待监测视频中每一帧进行灰度化并高斯模糊处理,得到预处理后的多个帧;
阈值计算模块,用于计算相邻两帧的像素差值的平均值和标准差,并计算得到像素阈值,该像素阈值=0.75*标准差+平均值;
关键帧筛选模块,用于判断相邻两帧的像素差值(如像素差值的平均值等)是否大于该像素阈值,若大于,则当前帧为图像关键帧,若不大于,则判断下一个相邻两帧的像素差值是否大于该像素阈值,直到所有相邻两帧对比完毕后,得到多个图像关键帧。
也就是说,采用帧差法提取图像关键帧,以关键帧序列替换原始视频序列,有效去除视频序列冗余信息,极大提高了时间效率。
所述去背景模块130和所述第一卷积编码模块140,用于提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧,将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图。进一步地,为了去除背景信息的干扰,利用前景提取模板从所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧。接着,以卷积神经网络模型作为特征提取器从所述多个图像前景关键帧提取被监控对象的行为特征以得到第一跟踪特征图。也就是,以所述多个图像前景关键帧替代整个所述监控视频作为神经网络的输入,以一方面降低所述神经网络模型的数据处理量,另一方面,避免输入端带入的干扰信息为神经网络的特征提取带来混淆。
所述第一卷积编码模块140进一步用于使用所述第一卷积神经网络的各层在层的正向传递中分别对输入数据进行基于所述三维卷积核的三维卷积处理、池化处理和非线性激活处理以由所述第一卷积神经网络的最后一层输出所述第一跟踪特征图,其中,所述第一卷积神经网络的第一层的输入为所述多个图像前景关键帧。这样,通过第一卷积神经网络从所述多个图像前景关键帧提取被监控对象的高维局部行为特征,即第一跟踪特征图。
所述感兴趣区域提取模块150和所述第二卷积编码模块160,用于将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图。除了以整个被监控对象作为特征提取的单元外,在本申请的技术方案中,考虑到人员状态更多地反应在人脸区域,因此,在本申请的技术方案中,将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域,这里,所述目标区域检测网络为人脸区域检测网络。然后,同样以使用三维卷积核的神经网络模型作为特征提取器提取所述被监控对象的人脸区域的动态变化特征,以得到第二跟踪特征图。
在本申请一些可选示例中,所述目标检测网络为基于无锚窗的目标检测网络,所述基于无锚窗的目标检测网络包括但不限于YOLOv1、FCOS、 CenterNet、CornerNet、ExtremeNet、RepPoints等网络。
所述第二卷积编码模块160进一步用于使用所述第二卷积神经网络的各层在层的正向传递中分别对输入数据进行基于所述三维卷积核的三维卷积处理、池化处理和非线性激活处理以由所述第二卷积神经网络的最后一层输出所述第二跟踪特征图,其中,所述第二卷积神经网络的第一层的输入为所述多个人脸感兴趣区域。这样,通过第二卷积神经网络从所述多个图像前景关键帧提取被监控对象的人脸的高维动态变化特征,即第一跟踪特征图。
可以理解的是,在得到第一跟踪特征图和第二跟踪特征图后,可以在融合所述第一跟踪特征图和所述第二跟踪特征图以得到分类特征图后,将所述分类特征图通过分类器就可以得到用于表示待监测对象是否存在异常行为的分类结果。特别地,在本申请的技术方案中,由于所述第一跟踪特征图表示所述图像前景关键帧的图像语义关联特征,而所述第二跟踪特征图表示图像前景关键帧的感兴趣区域的图像语义关联特征,这使得所述第二跟踪特征图作为局部图像语义关联特征,与所述第一跟踪特征图的整体图像语义关联特征之间存在高维流形的尺度差异,导致融合后的高维流形可能存在尺度相容性方面的缺陷,影响分类效果。因此,在本申请中,基于所述第一跟踪特征图和所述第二跟踪特征图在图像维度上的局部-整体的重叠关系,利用所述第一跟踪特征图和所述第二跟踪特征图的节俭分解鼓励因数作为加权系数,分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正,这样,在融合校正后所述第一跟踪特征图和校正后所述第二跟踪特征图时,由于将所述将第一跟踪特征图和所述第二跟踪特征图均以基础流形的集合表示,就提高了融合后的高维流形的尺度相容性。这样,有利于提高对办公场所内人员状态监测的精准度。
具体地,所述特征分布校正模块170和所述特征融合模块180,用于分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图。
进一步地,所述特征分布校正模块170,包括:
第一权重计算单元,用于计算所述第一跟踪特征图的节俭分解鼓励因数作为加权系数作为第一权重,所述第一跟踪特征图的节俭分解鼓励因数作为加权系数与以所述第一跟踪图的各个特征矩阵中各个位置的特征值的负值为幂的自然指数函数的以特征矩阵为加权单位的加权和有关;
第二权重计算单元,用于计算所述第二跟踪特征图的节俭分解鼓励因数作为加权系数作为第二权重,所述第二跟踪特征图的节俭分解鼓励因数作为加权系数与以所述第二跟踪图的各个特征矩阵中各个位置的特征值的负值为幂的自然指数函数的以特征矩阵为加权单位的加权和有关;
第一校正单元,用于以所述第一权重对所述第一跟踪特征图中各个位置的特征值进行加权以得到所述校正后第一跟踪特征图;以及
第二校正单元,用于以所述第二权重对所述第二跟踪特征图中各个位置的特征值进行加权以得到所述校正后第二跟踪特征图。
在本申请一个实施例中,所述第一权重计算单元,进一步用于:以如下公式计算所述第一跟踪特征图的节俭分解鼓励因数作为加权系数作为第一权重,其中,所述公式为:
Figure 883998DEST_PATH_IMAGE009
其中
Figure 609508DEST_PATH_IMAGE010
为所述第一权重,
Figure 980447DEST_PATH_IMAGE011
是所述第一跟踪特征图的特征值,
Figure 883943DEST_PATH_IMAGE005
是超参数,
Figure 707542DEST_PATH_IMAGE007
表示
Figure 236744DEST_PATH_IMAGE007
激活函数,且
Figure 586823DEST_PATH_IMAGE008
表示向量的二范数。
在本申请一个实施例中,所述第二权重计算单元,进一步用于:以如下公式计算所述第二跟踪特征图的节俭分解鼓励因数作为加权系数作为第二权重,其中,所述公式为:
Figure 769542DEST_PATH_IMAGE002
其中
Figure 18121DEST_PATH_IMAGE012
为所述第二权重,
Figure 833237DEST_PATH_IMAGE004
是所述第二跟踪特征图的特征值,
Figure 788555DEST_PATH_IMAGE006
是超参数,
Figure 673334DEST_PATH_IMAGE013
表示
Figure 596160DEST_PATH_IMAGE007
激活函数,且
Figure 326218DEST_PATH_IMAGE008
表示向量的二范数。
该节俭分解鼓励因数用于对特征图在图像平面上进行分组,并对组内元素的重叠施加惩罚,以通过计算符号化函数的距离式联合来促进特征图的高维流形的节俭分解,也就是,将高维流形的几何形状分解为凸多面体(convex polytope)的集合,这样,在融合所述第一跟踪特征图和所述第二跟踪特征图时,由于将所述将第一跟踪特征图和所述第二跟踪特征图均以基础流形的集合表示,就提高了融合后的高维流形的尺度相容性。
所述状态检测结果生成模块190,用于将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
在本申请一些实施例中,所述状态检测结果生成模块190的分类过程包括:使用所述分类器的多个全连接层对所述分类特征图进行全连接编码以将所述分类特征图转化为分类特征向量;将所述分类特征向量输入Softmax分类函数以获得所述分类特征向量分别归属于待监测对象是否存在异常行为的概率值;若待监测对象存在异常行为的概率值大于或等于待监测对象不存在异常行为,则输出分类结果为待监测对象存在异常行为,若待监测对象存在异常行为的概率值小于待监测对象不存在异常行为的概率值,则输出分类结果为待监测对象不存在异常行为。
所述学习题目智能分配结果生成模块119,进一步用于:
使用所述分类器以如下公式对所述分类特征图进行处理以生成分类结果,其中, 所述公式为:
Figure 401622DEST_PATH_IMAGE014
,其中
Figure 817822DEST_PATH_IMAGE015
表示将所 述分类特征图投影为向量,
Figure 103309DEST_PATH_IMAGE016
Figure 512425DEST_PATH_IMAGE017
为各层全连接层的权重矩阵,
Figure 566969DEST_PATH_IMAGE018
Figure 918185DEST_PATH_IMAGE019
表示各层全连 接层的偏置矩阵。
综上,本申请实施例的基于图像识别的办公场所人员状态检测系统被阐明,其从摄像头采集的待监测对象的监控视频中提取前景部分以得到多个图像前景关键帧,通过使用三维卷积核的第一神经网络对多个图像前景关键帧进行编码以得到第一跟踪特征图,使用目标检测网络以及第三卷积核的第二卷积神经网络对多个图像前景关键帧中各个图像前景关键帧进行编码以得到第二跟踪特征图,然后对所述第一跟踪特征图和所述第二跟踪特征图进行校正并融合以得到分类特征图,该分类特征图通过分类器以得到用于表示待监测对象是否存在异常行为的分类结果,这样有利于提高办公场所内人员的监管效果。
如上所述,根据本申请实施例的基于图像识别的办公场所人员状态检测系统100可以实现在各种终端设备中,例如基于图像识别的办公场所人员状态检测的服务器等。在一个示例中,根据本申请实施例的基于图像识别的办公场所人员状态检测系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,基于图像识别的办公场所人员状态检测系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于图像识别的办公场所人员状态检测系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于图像识别的办公场所人员状态检测系统100与该终端设备也可以是分立的设备,并且该基于图像识别的办公场所人员状态检测系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图4图示了根据本申请实施例的基于图像识别的办公场所人员状态检测方法的流程图。如图4所示,根据本申请实施例的基于图像识别的办公场所人员状态检测方法,包括:
S101、获取由部署于办公场所内的摄像头采集的待监测对象的监控视频;
S102、从所述监控图像提取多个图像关键帧;
S103、提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;
S104、将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图;
S105、将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;
S106、将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;
S107、分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;
S108、融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;以及
S109、将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,所述从所述监控图像提取多个图像关键帧包括:以预定采样频率从所述监控图像提取所述多个图像关键帧。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,所述从所述监控图像提取多个图像关键帧包括:使用差帧法从所述监控图像提取所述多个图像关键帧。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,所述将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图,包括:使用所述第一卷积神经网络的各层在层的正向传递中分别对输入数据进行基于所述三维卷积核的三维卷积处理、池化处理和非线性激活处理以由所述第一卷积神经网络的最后一层输出所述第一跟踪特征图,其中,所述第一卷积神经网络的第一层的输入为所述多个图像前景关键帧。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,所述目标检测网络为基于无锚窗的目标检测网络,所述基于无锚窗的目标检测网络包括YOLOv1、FCOS、 CenterNet、CornerNet、ExtremeNet、RepPoints。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,所述分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图,包括:
计算所述第一跟踪特征图的节俭分解鼓励因数作为加权系数作为第一权重,所述第一跟踪特征图的节俭分解鼓励因数作为加权系数与以所述第一跟踪图的各个特征矩阵中各个位置的特征值的负值为幂的自然指数函数的以特征矩阵为加权单位的加权和有关;
计算所述第二跟踪特征图的节俭分解鼓励因数作为加权系数作为第二权重,所述第二跟踪特征图的节俭分解鼓励因数作为加权系数与以所述第二跟踪图的各个特征矩阵中各个位置的特征值的负值为幂的自然指数函数的以特征矩阵为加权单位的加权和有关;
以所述第一权重对所述第一跟踪特征图中各个位置的特征值进行加权以得到所述校正后第一跟踪特征图;以及
以所述第二权重对所述第二跟踪特征图中各个位置的特征值进行加权以得到所述校正后第二跟踪特征图。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,以如下公式计算所述第一跟踪特征图的节俭分解鼓励因数作为加权系数作为第一权重,其中,所述公式为:
Figure 300756DEST_PATH_IMAGE001
其中
Figure 638196DEST_PATH_IMAGE010
为所述第一权重,
Figure 441854DEST_PATH_IMAGE020
是所述第一跟踪特征图的特征值,
Figure 308179DEST_PATH_IMAGE021
是超参数,
Figure 709204DEST_PATH_IMAGE022
表示
Figure 443811DEST_PATH_IMAGE022
激活函数,且
Figure 472947DEST_PATH_IMAGE023
表示向量的二范数。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,以如下公式计算所述第二跟踪特征图的节俭分解鼓励因数作为加权系数作为第二权重,其中,所述公式为:
Figure 651118DEST_PATH_IMAGE024
其中
Figure 398494DEST_PATH_IMAGE012
为所述第二权重,
Figure 703836DEST_PATH_IMAGE004
是所述第二跟踪特征图的特征值,
Figure 462845DEST_PATH_IMAGE025
是超参数,
Figure 936551DEST_PATH_IMAGE026
表示
Figure 295857DEST_PATH_IMAGE022
激活函数,且
Figure 247633DEST_PATH_IMAGE023
表示向量的二范数。
在其中一个示例中,在上述基于图像识别的办公场所人员状态检测方法中,所述将所述分类特征图通过分类器以得到分类结果,包括:
使用所述分类器以如下公式对所述分类特征图进行处理以生成分类结果,其中, 所述公式为:
Figure 126727DEST_PATH_IMAGE027
,其中
Figure 394504DEST_PATH_IMAGE028
表示将所 述分类特征图投影为向量,
Figure 850893DEST_PATH_IMAGE016
Figure 747305DEST_PATH_IMAGE017
为各层全连接层的权重矩阵,
Figure 605540DEST_PATH_IMAGE018
Figure 545683DEST_PATH_IMAGE019
表示各层全连 接层的偏置矩阵。
这里,本领域技术人员可以理解,上述基于图像识别的办公场所人员状态检测方法中的的具体功能和步骤已经在上面参考图2到图3的基于图像识别的办公场所人员状态检测系统的描述中得到了详细介绍,并因此,将省略其重复描述。
可以理解的是,上述实施例中的部分或全部步骤或操作仅是示例,本申请实施例还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照上述实施例呈现的不同的顺序来执行,并且有可能并非要执行上述实施例中的全部操作。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。
图5图示了根据本申请实施例的电子设备的框图。
如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于图像识别的办公场所人员状态检测方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如参数等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果或警示提示等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于图像识别的办公场所人员状态检测方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于图像识别的办公场所人员状态检测方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种基于图像识别的办公场所人员状态检测系统,其特征在于,包括:
监控模块,用于获取由部署于办公场所内的摄像头采集的待监测对象的监控视频;
图像关键帧提取模块,用于从所述监控图像提取多个图像关键帧;
去背景模块,用于提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;
第一卷积编码模块,用于将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图;
感兴趣区域提取模块,用于将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;
第二卷积编码模块,用于将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;
特征分布校正模块,用于分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;
特征融合模块,用于融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;以及
状态检测结果生成模块,用于将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
2.根据权利要求1所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述图像关键帧提取模块,进一步用于以预定采样频率从所述监控图像提取所述多个图像关键帧。
3.根据权利要求2所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述图像关键帧提取模块,进一步用于使用差帧法从所述监控图像提取所述多个图像关键帧。
4.根据权利要求3所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述第一卷积编码模块,进一步用于使用所述第一卷积神经网络的各层在层的正向传递中分别对输入数据进行基于所述三维卷积核的三维卷积处理、池化处理和非线性激活处理以由所述第一卷积神经网络的最后一层输出所述第一跟踪特征图,其中,所述第一卷积神经网络的第一层的输入为所述多个图像前景关键帧。
5.根据权利要求4所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述目标检测网络为基于无锚窗的目标检测网络,所述基于无锚窗的目标检测网络包括YOLOv1、FCOS、 CenterNet、CornerNet、ExtremeNet、RepPoints。
6.根据权利要求5所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述特征分布校正模块,包括:
第一权重计算单元,用于计算所述第一跟踪特征图的节俭分解鼓励因数作为加权系数作为第一权重,所述第一跟踪特征图的节俭分解鼓励因数作为加权系数与以所述第一跟踪图的各个特征矩阵中各个位置的特征值的负值为幂的自然指数函数的以特征矩阵为加权单位的加权和有关;
第二权重计算单元,用于计算所述第二跟踪特征图的节俭分解鼓励因数作为加权系数作为第二权重,所述第二跟踪特征图的节俭分解鼓励因数作为加权系数与以所述第二跟踪图的各个特征矩阵中各个位置的特征值的负值为幂的自然指数函数的以特征矩阵为加权单位的加权和有关;
第一校正单元,用于以所述第一权重对所述第一跟踪特征图中各个位置的特征值进行加权以得到所述校正后第一跟踪特征图;以及
第二校正单元,用于以所述第二权重对所述第二跟踪特征图中各个位置的特征值进行加权以得到所述校正后第二跟踪特征图。
7.根据权利要求6所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述第一权重计算单元,进一步用于:以如下公式计算所述第一跟踪特征图的节俭分解鼓励因数作为加权系数作为第一权重,其中,所述公式为:
Figure DEST_PATH_IMAGE001
其中
Figure 733814DEST_PATH_IMAGE002
为所述第一权重,
Figure DEST_PATH_IMAGE003
是所述第一跟踪特征图的特征值,
Figure 417605DEST_PATH_IMAGE004
是超参数,
Figure DEST_PATH_IMAGE005
表示
Figure 431478DEST_PATH_IMAGE006
激活函数,且
Figure DEST_PATH_IMAGE007
表示向量的二范数。
8.根据权利要求7所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述第二权重计算单元,进一步用于:以如下公式计算所述第二跟踪特征图的节俭分解鼓励因数作为加权系数作为第二权重,其中,所述公式为:
Figure 73681DEST_PATH_IMAGE008
其中
Figure DEST_PATH_IMAGE009
为所述第二权重,
Figure 802865DEST_PATH_IMAGE010
是所述第二跟踪特征图的特征值,
Figure 900134DEST_PATH_IMAGE011
是超参数,
Figure 873906DEST_PATH_IMAGE005
表示
Figure 155851DEST_PATH_IMAGE006
激活函数,且
Figure 74129DEST_PATH_IMAGE007
表示向量的二范数。
9.根据权利要求8所述的基于图像识别的办公场所人员状态检测系统,其特征在于,所述状态检测结果生成模块,进一步用于:
使用所述分类器以如下公式对所述分类特征图进行处理以生成分类结果,其中,所述 公式为:
Figure DEST_PATH_IMAGE012
,其中
Figure 535941DEST_PATH_IMAGE013
表示将所述 分类特征图投影为向量,
Figure DEST_PATH_IMAGE014
Figure 364220DEST_PATH_IMAGE015
为各层全连接层的权重矩阵,
Figure DEST_PATH_IMAGE016
Figure 144963DEST_PATH_IMAGE017
表示各层全连接 层的偏置矩阵。
10.一种基于图像识别的办公场所人员状态检测方法,其特征在于,包括:
获取由部署于办公场所内的摄像头采集的待监测对象的监控视频;
从所述监控图像提取多个图像关键帧;
提取所述多个图像关键帧中各个图像关键帧的前景部分以得到多个图像前景关键帧;
将所述多个图像前景关键帧通过使用三维卷积核的第一卷积神经网络以得到第一跟踪特征图;
将所述多个图像前景关键帧中各个图像前景关键帧分别通过目标检测网络以得到多个人脸感兴趣区域;
将所述多个人脸感兴趣区域通过使用三维卷积核的第二卷积神经网络以得到第二跟踪特征图;
分别对所述第一跟踪特征图和所述第二跟踪特征图进行校正以得到校正后第一跟踪特征图和校正后第二跟踪特征图;
融合所述校正后第一跟踪特征图和所述校正后第二跟踪特征图以得到分类特征图;以及
将所述分类特征图通过分类器以得到分类结果,所述分类结果用于表示待监测对象是否存在异常行为。
CN202211051208.7A 2022-08-31 2022-08-31 基于图像识别的办公场所人员状态检测方法及其系统 Pending CN115410275A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211051208.7A CN115410275A (zh) 2022-08-31 2022-08-31 基于图像识别的办公场所人员状态检测方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211051208.7A CN115410275A (zh) 2022-08-31 2022-08-31 基于图像识别的办公场所人员状态检测方法及其系统

Publications (1)

Publication Number Publication Date
CN115410275A true CN115410275A (zh) 2022-11-29

Family

ID=84164152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211051208.7A Pending CN115410275A (zh) 2022-08-31 2022-08-31 基于图像识别的办公场所人员状态检测方法及其系统

Country Status (1)

Country Link
CN (1) CN115410275A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116214524A (zh) * 2023-05-08 2023-06-06 国网浙江省电力有限公司宁波供电公司 用于油样回收的无人机抓载方法、装置及存储介质
CN116311005A (zh) * 2023-05-25 2023-06-23 成都睿瞳科技有限责任公司 一种用于运动图像处理装置、方法及存储介质
CN116343134A (zh) * 2023-05-30 2023-06-27 山西双驱电子科技有限公司 驾考车辆信号传输系统及方法
CN116363738A (zh) * 2023-06-01 2023-06-30 成都睿瞳科技有限责任公司 一种基于多移动目标的人脸识别方法、系统及存储介质
CN116486345A (zh) * 2023-05-11 2023-07-25 山东凯迪网络信息技术有限公司 物业服务平台管理系统及其方法
CN116645917A (zh) * 2023-06-09 2023-08-25 浙江技加智能科技有限公司 Led显示屏亮度调节系统及其方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116214524A (zh) * 2023-05-08 2023-06-06 国网浙江省电力有限公司宁波供电公司 用于油样回收的无人机抓载方法、装置及存储介质
CN116214524B (zh) * 2023-05-08 2023-10-03 国网浙江省电力有限公司宁波供电公司 用于油样回收的无人机抓载方法、装置及存储介质
CN116486345A (zh) * 2023-05-11 2023-07-25 山东凯迪网络信息技术有限公司 物业服务平台管理系统及其方法
CN116311005A (zh) * 2023-05-25 2023-06-23 成都睿瞳科技有限责任公司 一种用于运动图像处理装置、方法及存储介质
CN116343134A (zh) * 2023-05-30 2023-06-27 山西双驱电子科技有限公司 驾考车辆信号传输系统及方法
CN116363738A (zh) * 2023-06-01 2023-06-30 成都睿瞳科技有限责任公司 一种基于多移动目标的人脸识别方法、系统及存储介质
CN116645917A (zh) * 2023-06-09 2023-08-25 浙江技加智能科技有限公司 Led显示屏亮度调节系统及其方法

Similar Documents

Publication Publication Date Title
CN115410275A (zh) 基于图像识别的办公场所人员状态检测方法及其系统
CN110197146B (zh) 基于深度学习的人脸图像分析方法、电子装置及存储介质
CN111753643B (zh) 人物姿态识别方法、装置、计算机设备和存储介质
CN110110601A (zh) 基于多时空注意力模型的视频行人重识别算法及装置
CN115471216B (zh) 智慧实验室管理平台的数据管理方法
CN111652225A (zh) 基于深度学习的非侵入式摄像读取方法及系统
CN110827432B (zh) 一种基于人脸识别的课堂考勤方法及系统
CN116343301B (zh) 基于人脸识别的人员信息智能校验系统
CN116503399A (zh) 基于yolo-afps的绝缘子污闪检测方法
CN117541964A (zh) 云端视频处理系统及其方法
CN115239672A (zh) 缺陷检测方法及装置、设备、存储介质
CN113822240B (zh) 一种电力现场作业视频数据提取异常行为的方法及装置
CN116485557A (zh) 一种基于知识图谱的信用风险融合预测方法及系统
CN111882034A (zh) 神经网络处理及人脸识别方法、装置、设备和存储介质
CN113487223B (zh) 一种基于信息融合的风险评估方法和评估系统
CN114913487A (zh) 一种基于多模态学习的目标识别检测方法及相关组件
CN114037873A (zh) 基于人工智能的变电站二次回路保护压板检测系统及方法
CN116959099B (zh) 一种基于时空图卷积神经网络的异常行为识别方法
CN111091056B (zh) 图像中的墨镜识别方法及装置、电子设备、存储介质
CN111597896B (zh) 异常人脸的识别方法、识别装置、识别设备和存储介质
CN114758294A (zh) 分拨中心危险行为的监控方法、装置、设备和存储介质
CN117173385B (zh) 一种变电站的检测方法、装置、介质及设备
CN112084953B (zh) 一种人脸属性识别的方法、系统、设备及可读存储介质
CN118230219A (zh) 一种智慧型城市绿道环境监测方法及设备
CN116824248A (zh) 一种融入个性化标签的场景化图像识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination