CN115512420A - 访客管理系统及其方法 - Google Patents
访客管理系统及其方法 Download PDFInfo
- Publication number
- CN115512420A CN115512420A CN202211222059.6A CN202211222059A CN115512420A CN 115512420 A CN115512420 A CN 115512420A CN 202211222059 A CN202211222059 A CN 202211222059A CN 115512420 A CN115512420 A CN 115512420A
- Authority
- CN
- China
- Prior art keywords
- face
- feature
- visitor
- local feature
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/169—Holistic features and representations, i.e. based on the facial image taken as a whole
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
公开了一种访客管理系统及其方法,其通过利用基于对抗生成网络的去遮挡生成器对所采集访客的人脸图像进行去遮挡处理;然后,通过包含深浅特征融合模块的卷积神经网络模型进行图像特征的提取以得到人脸特征图,其中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征;接着,基于转换器思想,对所述各个人脸局部特征进行基于全局的上下文语义编码以提取所述各个人脸局部特征的全局关联特征,最后通过分类器得到用于表示人脸识别结果的分类结果。这样,可以提高访客人脸识别的精准度,以进行访客智能管理。
Description
技术领域
本申请涉及智能管理技术领域,且更为具体地,涉及一种访客管理系统及其方法。
背景技术
进出访客管理系统是新一代聚集了高新技术于一体的电子产品,代替了传统的手工登记的方式,为企业的访客管理带来了很大的帮助,避免了传统手工登记上的漏洞。
访客在访问公司前,会通过设备或者软件来进行访客登记,例如,上传身份信息等,这样在访客来进行访问公司时,能够通过人脸识别进行访客身份智能识别以确定是否可以放行。
但是,在进行人脸识别时,数据库中的访客身份信息是访客的身份证上的照片,而实际上访客的长相相较于身份证上的人脸图像已发生变化,这会导致访客身份识别的失败。同时,在进行访客人脸识别时,访客还可能带着帽子、太阳镜等遮挡物,进一步增加了访客识别难度。
因此,期待一种优化的访客管理系统,其能够更为精准地进行访客身份识别。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种访客管理系统及其方法,其通过摄像头采集访客的人脸图像并进行去遮挡处理;然后,通过包含深浅特征融合模块的卷积神经网络模型进行图像特征的提取以得到人脸特征图,其中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征;接着,基于转换器思想,对所述各个人脸局部特征进行基于全局的上下文语义编码以提取所述各个人脸局部特征的全局关联特征,最后通过分类器得到用于表示人脸识别结果的分类结果。这样,可以提高访客人脸识别的精准度,以进行访客智能管理。
根据本申请的一个方面,提供了一种访客管理系统,其包括:
访客人脸图像采集模块,用于获取由摄像头采集的访客的人脸图像;
去遮挡模块,用于将所述人脸图像通过去遮挡生成器以得到生成人脸图像;
卷积编码模块,用于将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;
局部特征池化模块,用于将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;
优化模块,用于对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;
全局编码模块,用于将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和
访客识别结果生成模块,用于将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
在上述访客管理系统中,所述去遮挡生成器为对抗生成网络。
在上述访客管理系统中,所述卷积编码模块,包括:特征提取单元,用于使用所述卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以从所述卷积神经网络模型的浅层提取浅层特征图和从所述卷积神经网络模型的深层提取深层特征图;以及,融合单元,用于将所述浅层特征图和所述深层特征图进行级联以得到所述人脸特征图。
在上述访客管理系统中,所述卷积神经网络模型的浅层为1-6层,所述卷积神经网络模型的深层为所述卷积神经网络模型的最后一层。
在上述访客管理系统中,所述局部特征池化模块,进一步用于:将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的均值池化以得到所述多个人脸局部特征向量。
在上述访客管理系统中,所述优化模块,进一步用于:使用如下公式对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到所述多个优化人脸局部特征向量;其中,所述公式为:
其中,vi是所述人脸局部特征向量中各个位置的特征值,vi′是所述优化人脸局部特征向量中各个位置的特征值,μ和σ是所述人脸局部特征向量中所有位置的特征值集合的均值和方差,ReLU()表示非线性修正单元,Sigmoid()表示Sigmoid激活函数,exp(-σ)表示以所述人脸局部特征向量中所有位置的特征集合的方差的负值为幂的自然指数函数值。
在上述访客管理系统中,所述全局编码模块,包括:上下文语义编码单元,用于使用所述基于转换器的上下文编码器对由所述多个优化人脸局部特征向量排列的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量;以及,级联单元,用于将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
在上述访客管理系统中,所述访客识别结果生成模块,进一步用于:使用所述分类器以如下公式对所述人脸全局语义关联特征向量进行处理以生成分类结果,其中,所述公式为:O=softmax{(Wn,Bn):…:(W1,B1)|X},其中X表示所述人脸全局语义关联特征向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置向量。
根据本申请的另一方面,提供了一种访客管理方法,其包括:
获取由摄像头采集的访客的人脸图像;
将所述人脸图像通过去遮挡生成器以得到生成人脸图像;
将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;
将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;
对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;
将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和
将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
在上述访客管理方法中,所述去遮挡生成器为对抗生成网络。
在上述访客管理方法中,所述将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以从所述卷积神经网络模型的浅层提取浅层特征图和从所述卷积神经网络模型的深层提取深层特征图;以及,将所述浅层特征图和所述深层特征图进行级联以得到所述人脸特征图。
在上述访客管理方法中,所述卷积神经网络模型的浅层为1-6层,所述卷积神经网络模型的深层为所述卷积神经网络模型的最后一层。
在上述访客管理方法中,所述将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量,进一步包括:将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的均值池化以得到所述多个人脸局部特征向量。
在上述访客管理方法中,所述对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量,进一步包括:使用如下公式对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到所述多个优化人脸局部特征向量;其中,所述公式为:
其中,vi是所述人脸局部特征向量中各个位置的特征值,vi′是所述优化人脸局部特征向量中各个位置的特征值,μ和σ是所述人脸局部特征向量中所有位置的特征值集合的均值和方差,ReLU()表示非线性修正单元,Sigmoid()表示Sigmoid激活函数,exp(-σ)表示以所述人脸局部特征向量中所有位置的特征集合的方差的负值为幂的自然指数函数值。
在上述访客管理方法中,所述将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量,包括:使用所述基于转换器的上下文编码器对由所述多个优化人脸局部特征向量排列的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量;以及,将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
在上述访客管理方法中,所述将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果,进一步包括:使用所述分类器以如下公式对所述人脸全局语义关联特征向量进行处理以生成分类结果,其中,所述公式为:O=softmax{(Wn,Bn):…:(W1,B1)|X},其中X表示所述人脸全局语义关联特征向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置向量。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的访客管理方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的访客管理方法。
与现有技术相比,本申请提供的一种访客管理系统及其方法,其通过摄像头采集访客的人脸图像并进行去遮挡处理;然后,通过包含深浅特征融合模块的卷积神经网络模型进行图像特征的提取以得到人脸特征图,其中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征;接着,基于转换器思想,对所述各个人脸局部特征进行基于全局的上下文语义编码以提取所述各个人脸局部特征的全局关联特征,最后通过分类器得到用于表示人脸识别结果的分类结果。这样,可以提高访客人脸识别的精准度,以进行访客智能管理。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的访客管理系统的应用场景图。
图2图示了根据本申请实施例的访客管理系统的框图。
图3图示了根据本申请实施例的访客管理系统中所述卷积编码模块的框图。
图4图示了根据本申请实施例的访客管理系统中所述全局编码模块的框图。
图5图示了根据本申请实施例的访客管理方法的流程图。
图6图示了根据本申请实施例的访客管理方法的架构示意图。
图7图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如上所述,在进行人脸识别时,数据库中的访客身份信息是访客的身份证上的照片,而实际上访客的长相相较于身份证上的人脸图像已发生变化,这会导致访客身份识别的失败。同时,在进行访客人脸识别时,访客还可能带着帽子、太阳镜等遮挡物,进一步增加了访客识别难度。因此,期待一种优化的访客管理系统,其能够更为精准地进行访客身份识别。
相应地,在本申请的技术方案中,首先将获取的访客的人脸图像通过去遮挡生成器以得到生成人脸图像。也就是,考虑到访客在进行人脸识别时,可能带着帽子、太阳镜等遮挡物,使用所述去遮挡生成器来进行人脸图像去遮挡处理以降低遮挡物对人脸识别的干扰。在本申请的技术方案中,所述去遮挡生成器为基于对抗生成网络的去遮挡生成器,应可以理解,所述对抗生成网络包括生成器和鉴别器,其中,所述生成器用于生成去遮挡人脸图像,所述鉴别器用于计算去遮挡人脸图像和真实无遮挡图像之间的差异,并通过梯度下降的方向传播算法来更新所述生成器的网络参数以得到具有去遮挡功能的生成器,即,所述去遮挡生成器。
接着,将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图。也就是,使用在图像特征提取领域具有优异性能表现的卷积神经网络模型作为特征提取器来提取所述生成人脸图像的图像特征(图像局部区域的高维隐含特征)。特别地,在本申请的技术方案中,考虑到在人脸识别时,人脸的轮廓、线条等浅层特征对于人脸识别具有重要意义,而卷积神经网络在编码时,随着其深度的加深,浅层特征会变得模糊甚至被噪声所淹没,因此,在本申请的技术方案中,使用包含深浅特征融合模块的卷积神经网络模型对所述生成人脸图像进行处理,相较于标准卷积神经网络模型,根据本申请的所述卷积神经网络模型能够保留浅层特征和深层特征,不仅使得特征信息更为丰富,且不同深度的特征能得以保留,以提高人脸识别的精度。
虽然卷积神经网络模型能够有效地提取生成人脸图像中的图像特征,但在人脸识别中,人脸局部特征并非一个孤立地存在,相反地,人脸是一个有机的整体,因此,为了提高人脸识别的精度,期待提取各个人脸局部特征的全局关联信息。
具体地,在本申请的技术方案中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征,可使用基于转换器思想,对各个人脸局部特征进行基于全局的上下文语义编码以提取各个人脸局部特征的全局关联特征。
更具体地,首先将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化(例如,均值池化、最大值池化和中位数池化)以得到多个人脸局部特征向量,然后,将所述多个人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量。相应地,所述基于转换器(Transformer)的上下文编码器能够对由所述多个人脸局部特征向量排列而成的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量,接着将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
继而,将所述人脸全局语义关联特征向量通过分类器就可以得到用于表示人脸识别结果的分类结果。所述人脸识别结果为访客人脸图像所属的身份标签。
特别地,在本申请的技术方案中,在将所述人脸特征图的沿通道维度的特征矩阵进行基于行方向或列方向的池化以得到多个人脸局部特征向量时,由于沿行方向或列方向的池化降低了所述人脸局部特征向量的各个位置的特征值之间的分布相关性,因此,为了提高所述多个人脸局部特征向量中的每个人脸局部特征向量的各个位置的特征值之间的分布相关性,从而获得表达一致性,计算每个人脸局部特征向量的递归的压榨-激励加权优化,具体为:
μ和σ是特征集合vi∈V的均值和方差,其中vi是所述人脸局部特征向量V的特征值。
也就是,基于所述每个人脸局部特征向量的沿特征分布方向的特征集合的统计特性来激活特征分布的定向递归,从而推断特征在其每个采样位置的定向分布,并且,采用由ReLU-Sigmoid函数构成的定向压榨-激励机制,来获取注意力增强的采样位置置信度值,以提升所述每个人脸局部特征向量在其分布方向上的表达一致性。这样,提高访客人脸识别的精准度,以便于进行访客智能管理。
基于此,本申请提出了一种访客管理系统,其包括:访客人脸图像采集模块,用于获取由摄像头采集的访客的人脸图像;去遮挡模块,用于将所述人脸图像通过去遮挡生成器以得到生成人脸图像;卷积编码模块,用于将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;局部特征池化模块,用于将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;优化模块,用于对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;全局编码模块,用于将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和,访客识别结果生成模块,用于将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
图1图示了根据本申请实施例的访客管理系统的应用场景图。如图1所示,在该应用场景中,首先获取由摄像头(例如,如图1中所示意的C)采集的访客的人脸图像(例如,如图1中所示意的U);然后将获取的访客的人脸图像输入至部署有访客管理系统的服务器(例如,如图1所示意的S)中,其中,所述服务器以访客管理算法对所述访客的人脸图像进行处理,以得到分类结果,所述分类结果为人脸识别结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1图示了根据本申请实施例的访客管理系统的应用场景图。如图1所示,根据本申请实施例的访客管理系统100,包括:访客人脸图像采集模块110,用于获取由摄像头采集的访客的人脸图像;去遮挡模块120,用于将所述人脸图像通过去遮挡生成器以得到生成人脸图像;卷积编码模块130,用于将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;局部特征池化模块140,用于将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;优化模块150,用于对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;全局编码模块160,用于将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和,访客识别结果生成模块170,用于将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
具体地,在本申请实施例中,所述访客人脸图像采集模块110和所述去遮挡模块120,用于获取由摄像头采集的访客的人脸图像,以及,用于将所述人脸图像通过去遮挡生成器以得到生成人脸图像。如前所述,在进行人脸识别时,数据库中的访客身份信息是访客的身份证上的照片,而实际上访客的长相相较于身份证上的人脸图像已发生变化,这会导致访客身份识别的失败。同时,在进行访客人脸识别时,访客还可能带着帽子、太阳镜等遮挡物,进一步增加了访客识别难度。因此,期待一种优化的访客管理系统,其能够更为精准地进行访客身份识别。
相应地,在本申请的技术方案中,首先将获取的访客的人脸图像通过去遮挡生成器以得到生成人脸图像。也就是,考虑到访客在进行人脸识别时,可能带着帽子、太阳镜等遮挡物,使用所述去遮挡生成器来进行人脸图像去遮挡处理以降低遮挡物对人脸识别的干扰。在本申请的技术方案中,所述去遮挡生成器为基于对抗生成网络的去遮挡生成器,应可以理解,所述对抗生成网络包括生成器和鉴别器,其中,所述生成器用于生成去遮挡人脸图像,所述鉴别器用于计算去遮挡人脸图像和真实无遮挡图像之间的差异,并通过梯度下降的方向传播算法来更新所述生成器的网络参数以得到具有去遮挡功能的生成器,即,所述去遮挡生成器。
具体地,在本申请实施例中,所述卷积编码模块130,用于将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图。应可以理解,在得到所述生成人脸图像后,接着,将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图。也就是,使用在图像特征提取领域具有优异性能表现的卷积神经网络模型作为特征提取器来提取所述生成人脸图像的图像特征(图像局部区域的高维隐含特征)。
特别地,在本申请的技术方案中,考虑到在人脸识别时,人脸的轮廓、线条等浅层特征对于人脸识别具有重要意义,而卷积神经网络在编码时,随着其深度的加深,浅层特征会变得模糊甚至被噪声所淹没,因此,在本申请的技术方案中,使用包含深浅特征融合模块的卷积神经网络模型对所述生成人脸图像进行处理,相较于标准卷积神经网络模型,根据本申请的所述卷积神经网络模型能够保留浅层特征和深层特征,不仅使得特征信息更为丰富,且不同深度的特征能得以保留,以提高人脸识别的精度。
更具体地,在本申请实施例中,图3图示了根据本申请实施例的访客管理系统中所述卷积编码模块的框图,如图3所示,所述卷积编码模块130,包括:特征提取单元210,用于使用所述卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以从所述卷积神经网络模型的浅层提取浅层特征图和从所述卷积神经网络模型的深层提取深层特征图;以及,融合单元220,用于将所述浅层特征图和所述深层特征图进行级联以得到所述人脸特征图。
相应地,在本申请一具体示例中,所述卷积神经网络模型的浅层为1-6层,所述卷积神经网络模型的深层为所述卷积神经网络模型的最后一层。
具体地,在本申请实施例中,所述局部特征池化模块140,用于将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量。应可以理解,虽然卷积神经网络模型能够有效地提取生成人脸图像中的图像特征,但在人脸识别中,人脸局部特征并非一个孤立地存在,相反地,人脸是一个有机的整体,因此,为了提高人脸识别的精度,期待提取各个人脸局部特征的全局关联信息。
更具体地,将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化(例如,均值池化、最大值池化和中位数池化)以得到多个人脸局部特征向量。例如,在本申请一具体示例中,将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的均值池化以得到所述多个人脸局部特征向量。
具体地,在本申请实施例中,所述优化模块150,用于对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量。特别地,在本申请的技术方案中,在将所述人脸特征图的沿通道维度的特征矩阵进行基于行方向或列方向的池化以得到多个人脸局部特征向量时,由于沿行方向或列方向的池化降低了所述人脸局部特征向量的各个位置的特征值之间的分布相关性。
因此,为了提高所述多个人脸局部特征向量中的每个人脸局部特征向量的各个位置的特征值之间的分布相关性,从而获得表达一致性,计算每个人脸局部特征向量的递归的压榨-激励加权优化,也就是,使用如下公式对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到所述多个优化人脸局部特征向量;其中,所述公式为:
其中,vi是所述人脸局部特征向量中各个位置的特征值,vi′是所述优化人脸局部特征向量中各个位置的特征值,μ和σ是所述人脸局部特征向量中所有位置的特征值集合的均值和方差,ReLU()表示非线性修正单元,Sigmoid()表示Sigmoid激活函数,exp(-σ)表示以所述人脸局部特征向量中所有位置的特征集合的方差的负值为幂的自然指数函数值。
也就是,基于所述每个人脸局部特征向量的沿特征分布方向的特征集合的统计特性来激活特征分布的定向递归,从而推断特征在其每个采样位置的定向分布,并且,采用由ReLU-Sigmoid函数构成的定向压榨-激励机制,来获取注意力增强的采样位置置信度值,以提升所述每个人脸局部特征向量在其分布方向上的表达一致性。这样,提高访客人脸识别的精准度,以便于进行访客智能管理。
具体地,在本申请实施例中,所述全局编码模块160,用于将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量。应可以理解,在本申请的技术方案中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征,可使用基于转换器思想,对各个人脸局部特征进行基于全局的上下文语义编码以提取各个人脸局部特征的全局关联特征。
更具体地,首先将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化(例如,均值池化、最大值池化和中位数池化)以得到多个人脸局部特征向量,然后,将所述多个人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量。相应地,所述基于转换器(Transformer)的上下文编码器能够对由所述多个人脸局部特征向量排列而成的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量,接着将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
继而,将所述人脸全局语义关联特征向量通过分类器就可以得到用于表示人脸识别结果的分类结果。所述人脸识别结果为访客人脸图像所属的身份标签。
进一步地,在本申请实施例中,图4图示了根据本申请实施例的访客管理系统中所述全局编码模块的框图,如图4所示,所述全局编码模块160,包括:上下文语义编码单元310,用于使用所述基于转换器的上下文编码器对由所述多个优化人脸局部特征向量排列的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量;以及,级联单元320,用于所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
在本申请一具体示例中,所述上下文编码器使用基于转换器的Bert模型对由所述多个优化人脸局部特征向量排列的向量的序列进行基于全局的上下文语义编码,以得到多个人脸语义局部特征向量。
具体地,在本申请实施例中,所述访客识别结果生成模块170,用于将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。也就是,将所述人脸全局语义关联特征向量输入分类函数以获得分类函数值,其中,所述分类函数值为所述分类结果,所述分类结果为人脸识别结果。
更具体地,在本申请实施例中,使用所述分类器以如下公式对所述人脸全局语义关联特征向量进行处理以生成分类结果,其中,所述公式为:O=softmax{(Wn,Bn):…:(W1,B1)|X},其中X表示所述人脸全局语义关联特征向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置向量。
应可以理解,在本申请的技术方案中,被访者经常需要与政府、公司或个人进行业务来往,因此为了能够及时与来访者进行沟通,在所述访客管理系统生成人脸识别结果后,还会继续将来访者的访客信息传送至被访人,被访人确认访客信息后决定是否接受访问。进一步地,当访问结束后,若访客在一定时间内没有通过出口离开,所述访客管理系统会通知被访者,由被访者对访客进行寻找并带其离开,进而避免访客带有其他目的在公司内自由走动给公司带来损失。综上,基于本申请实施例的访客管理系统100被阐明,其通过摄像头采集访客的人脸图像并进行去遮挡处理;然后,通过包含深浅特征融合模块的卷积神经网络模型进行图像特征的提取以得到人脸特征图,其中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征;接着,基于转换器思想,对所述各个人脸局部特征进行基于全局的上下文语义编码以提取所述各个人脸局部特征的全局关联特征,最后通过分类器得到用于表示人脸识别结果的分类结果。这样,可以提高访客人脸识别的精准度,以进行访客智能管理。
如上所述,根据本申请实施例的访客管理系统100可以实现在各种终端设备中,例如用于访客管理系统的服务器等。在一个示例中,根据本申请实施例的访客管理系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该访客管理系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该访客管理系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该访客管理系统100与该终端设备也可以是分立的设备,并且该访客管理系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图5图示了根据本申请实施例的访客管理方法的流程图。如图5所示,根据本申请实施例的访客管理方法,包括:S110,获取由摄像头采集的访客的人脸图像;S120,将所述人脸图像通过去遮挡生成器以得到生成人脸图像;S130,将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;S140,将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;S150,对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;S160,将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和,S170,将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
图6图示了根据本申请实施例的访客管理方法的架构示意图。如图6所示,在所述访客管理方法的网络架构中,首先,获取由摄像头采集的访客的人脸图像;然后,将所述人脸图像通过去遮挡生成器以得到生成人脸图像;接着,将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;然后,将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;接着,对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;然后,将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和,最后,将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
在本申请的一个实施例中,在上述访客管理方法中,所述去遮挡生成器为对抗生成网络。如前所述,在进行人脸识别时,数据库中的访客身份信息是访客的身份证上的照片,而实际上访客的长相相较于身份证上的人脸图像已发生变化,这会导致访客身份识别的失败。同时,在进行访客人脸识别时,访客还可能带着帽子、太阳镜等遮挡物,进一步增加了访客识别难度。因此,期待一种优化的访客管理系统,其能够更为精准地进行访客身份识别。
相应地,在本申请的技术方案中,首先将获取的访客的人脸图像通过去遮挡生成器以得到生成人脸图像。也就是,考虑到访客在进行人脸识别时,可能带着帽子、太阳镜等遮挡物,使用所述去遮挡生成器来进行人脸图像去遮挡处理以降低遮挡物对人脸识别的干扰。在本申请的技术方案中,所述去遮挡生成器为基于对抗生成网络的去遮挡生成器,应可以理解,所述对抗生成网络包括生成器和鉴别器,其中,所述生成器用于生成去遮挡人脸图像,所述鉴别器用于计算去遮挡人脸图像和真实无遮挡图像之间的差异,并通过梯度下降的方向传播算法来更新所述生成器的网络参数以得到具有去遮挡功能的生成器,即,所述去遮挡生成器。
在本申请的一个实施例中,在上述访客管理方法中,所述将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以从所述卷积神经网络模型的浅层提取浅层特征图和从所述卷积神经网络模型的深层提取深层特征图;以及,将所述浅层特征图和所述深层特征图进行级联以得到所述人脸特征图。
应可以理解,在得到所述生成人脸图像后,接着,将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图。也就是,使用在图像特征提取领域具有优异性能表现的卷积神经网络模型作为特征提取器来提取所述生成人脸图像的图像特征(图像局部区域的高维隐含特征)。
特别地,在本申请的技术方案中,考虑到在人脸识别时,人脸的轮廓、线条等浅层特征对于人脸识别具有重要意义,而卷积神经网络在编码时,随着其深度的加深,浅层特征会变得模糊甚至被噪声所淹没,因此,在本申请的技术方案中,使用包含深浅特征融合模块的卷积神经网络模型对所述生成人脸图像进行处理,相较于标准卷积神经网络模型,根据本申请的所述卷积神经网络模型能够保留浅层特征和深层特征,不仅使得特征信息更为丰富,且不同深度的特征能得以保留,以提高人脸识别的精度。
在本申请的一个实施例中,在上述访客管理方法中,所述卷积神经网络模型的浅层为1-6层,所述卷积神经网络模型的深层为所述卷积神经网络模型的最后一层。
在本申请的一个实施例中,在上述访客管理方法中,所述将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量,进一步包括:将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的均值池化以得到所述多个人脸局部特征向量。
应可以理解,虽然卷积神经网络模型能够有效地提取生成人脸图像中的图像特征,但在人脸识别中,人脸局部特征并非一个孤立地存在,相反地,人脸是一个有机的整体,因此,为了提高人脸识别的精度,期待提取各个人脸局部特征的全局关联信息。具体地,将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化(例如,均值池化、最大值池化和中位数池化)以得到多个人脸局部特征向量。
在本申请的一个实施例中,在上述访客管理方法中,所述对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量,进一步包括:使用如下公式对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到所述多个优化人脸局部特征向量;其中,所述公式为:
其中,vi是所述人脸局部特征向量中各个位置的特征值,vi′是所述优化人脸局部特征向量中各个位置的特征值,μ和σ是所述人脸局部特征向量中所有位置的特征值集合的均值和方差,ReLU()表示非线性修正单元,Sigmoid()表示Sigmoid激活函数,exp(-σ)表示以所述人脸局部特征向量中所有位置的特征集合的方差的负值为幂的自然指数函数值。
特别地,在本申请的技术方案中,在将所述人脸特征图的沿通道维度的特征矩阵进行基于行方向或列方向的池化以得到多个人脸局部特征向量时,由于沿行方向或列方向的池化降低了所述人脸局部特征向量的各个位置的特征值之间的分布相关性,因此,需要提高所述多个人脸局部特征向量中的每个人脸局部特征向量的各个位置的特征值之间的分布相关性,从而获得表达一致性。
也就是,基于所述每个人脸局部特征向量的沿特征分布方向的特征集合的统计特性来激活特征分布的定向递归,从而推断特征在其每个采样位置的定向分布,并且,采用由ReLU-Sigmoid函数构成的定向压榨-激励机制,来获取注意力增强的采样位置置信度值,以提升所述每个人脸局部特征向量在其分布方向上的表达一致性。这样,提高访客人脸识别的精准度,以便于进行访客智能管理。
在本申请的一个实施例中,在上述访客管理方法中,所述将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量,包括:使用所述基于转换器的上下文编码器对由所述多个优化人脸局部特征向量排列的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量;以及,将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
应可以理解,在本申请的技术方案中,所述人脸特征图的沿通道维度的各个特征矩阵表示各个人脸局部特征,可使用基于转换器思想,对各个人脸局部特征进行基于全局的上下文语义编码以提取各个人脸局部特征的全局关联特征。
更具体地,首先将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化(例如,均值池化、最大值池化和中位数池化)以得到多个人脸局部特征向量,然后,将所述多个人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量。相应地,所述基于转换器(Transformer)的上下文编码器能够对由所述多个人脸局部特征向量排列而成的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量,接着将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
继而,将所述人脸全局语义关联特征向量通过分类器就可以得到用于表示人脸识别结果的分类结果。所述人脸识别结果为访客人脸图像所属的身份标签。
在本申请的一个实施例中,在上述访客管理方法中,所述将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果,进一步包括:使用所述分类器以如下公式对所述人脸全局语义关联特征向量进行处理以生成分类结果,其中,所述公式为:
O=softmax{(Wn,Bn):…:(W1,B1)|X},其中X表示所述人脸全局语义关联特征向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置向量。
也就是,将所述人脸全局语义关联特征向量输入分类函数以获得分类函数值,其中,所述分类函数值为所述分类结果,所述分类结果为人脸识别结果。
这里,本领域技术人员可以理解,上述访客管理方法中的具体功能和操作已经在上面参考图1到图4的访客管理系统描述中得到了详细介绍,并因此,将省略其重复描述。
示例性电子设备
下面,参考图7来描述根据本申请实施例的电子设备。
图7图示了根据本申请实施例的电子设备的框图。
如图7所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的访客管理方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如访客人脸信息等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出分类结果。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的访客管理方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的访客管理方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种访客管理系统,其特征在于,包括:
访客人脸图像采集模块,用于获取由摄像头采集的访客的人脸图像;
去遮挡模块,用于将所述人脸图像通过去遮挡生成器以得到生成人脸图像;
卷积编码模块,用于将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;
局部特征池化模块,用于将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;
优化模块,用于对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;
全局编码模块,用于将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和
访客识别结果生成模块,用于将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
2.根据权利要求1所述的访客管理系统,其特征在于,所述去遮挡生成器为对抗生成网络。
3.根据权利要求2所述的访客管理系统,其特征在于,所述卷积编码模块,包括:
特征提取单元,用于使用所述卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以从所述卷积神经网络模型的浅层提取浅层特征图和从所述卷积神经网络模型的深层提取深层特征图;以及
融合单元,用于将所述浅层特征图和所述深层特征图进行级联以得到所述人脸特征图。
4.根据权利要求3所述的访客管理系统,其特征在于,所述卷积神经网络模型的浅层为1-6层,所述卷积神经网络模型的深层为所述卷积神经网络模型的最后一层。
5.根据权利要求4所述的访客管理系统,其特征在于,所述局部特征池化模块,进一步用于:将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的均值池化以得到所述多个人脸局部特征向量。
7.根据权利要求6所述的访客管理系统,其特征在于,所述全局编码模块,包括:
上下文语义编码单元,用于使用所述基于转换器的上下文编码器对由所述多个优化人脸局部特征向量排列的向量的序列进行基于全局的上下文语义编码以得到多个人脸语义局部特征向量;以及
级联单元,用于将所述多个人脸语义局部特征向量进行级联以得到所述人脸全局语义关联特征向量。
8.根据权利要求7所述的访客管理系统,其特征在于,所述访客识别结果生成模块,进一步用于:使用所述分类器以如下公式对所述人脸全局语义关联特征向量进行处理以生成分类结果,其中,所述公式为:O=softmax{(Wn,Bn):...:(W1,B1)|X},其中X表示所述人脸全局语义关联特征向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置向量。
9.一种访客管理方法,其特征在于,包括:
获取由摄像头采集的访客的人脸图像;
将所述人脸图像通过去遮挡生成器以得到生成人脸图像;
将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图;
将所述人脸特征图的沿通道维度的各个特征矩阵进行基于行向量方向或列向量方向的池化以得到多个人脸局部特征向量;
对所述多个人脸局部特征向量中各个人脸局部特征向量进行优化以得到多个优化人脸局部特征向量;
将所述多个优化人脸局部特征向量排列为向量的序列后通过基于转换器的上下文编码器以得到人脸全局语义关联特征向量;和
将所述人脸全局语义关联特征向量通过分类器以得到分类结果,所述分类结果为人脸识别结果。
10.根据权利要求9所述的访客管理方法,其特征在于,所述将所述生成人脸图像通过包含深浅特征融合模块的卷积神经网络模型以得到人脸特征图,包括:
使用所述卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以从所述卷积神经网络模型的浅层提取浅层特征图和从所述卷积神经网络模型的深层提取深层特征图;以及
将所述浅层特征图和所述深层特征图进行级联以得到所述人脸特征图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211222059.6A CN115512420A (zh) | 2022-10-08 | 2022-10-08 | 访客管理系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211222059.6A CN115512420A (zh) | 2022-10-08 | 2022-10-08 | 访客管理系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115512420A true CN115512420A (zh) | 2022-12-23 |
Family
ID=84508549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211222059.6A Withdrawn CN115512420A (zh) | 2022-10-08 | 2022-10-08 | 访客管理系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115512420A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115860271A (zh) * | 2023-02-21 | 2023-03-28 | 杭州唛扑网络科技有限公司 | 艺术设计用方案管理系统及其方法 |
CN116652988A (zh) * | 2023-07-28 | 2023-08-29 | 江苏泽宇智能电力股份有限公司 | 智能光纤配线机器人及其控制方法 |
CN116739868A (zh) * | 2023-07-05 | 2023-09-12 | 浙江星宸环境建设有限公司 | 基于人工智能的园林绿化管理系统及其方法 |
CN116844217A (zh) * | 2023-08-30 | 2023-10-03 | 成都睿瞳科技有限责任公司 | 用于生成人脸数据的图像处理系统及方法 |
CN117094940A (zh) * | 2023-04-18 | 2023-11-21 | 湖州东尼新能源有限公司 | 一种fpc智能化生产方法及其系统 |
CN117315749A (zh) * | 2023-09-25 | 2023-12-29 | 惠州市沃生照明有限公司 | 用于台灯的灯光智能调控方法及系统 |
-
2022
- 2022-10-08 CN CN202211222059.6A patent/CN115512420A/zh not_active Withdrawn
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115860271A (zh) * | 2023-02-21 | 2023-03-28 | 杭州唛扑网络科技有限公司 | 艺术设计用方案管理系统及其方法 |
CN117094940A (zh) * | 2023-04-18 | 2023-11-21 | 湖州东尼新能源有限公司 | 一种fpc智能化生产方法及其系统 |
CN116739868A (zh) * | 2023-07-05 | 2023-09-12 | 浙江星宸环境建设有限公司 | 基于人工智能的园林绿化管理系统及其方法 |
CN116739868B (zh) * | 2023-07-05 | 2024-04-23 | 浙江星宸环境建设有限公司 | 基于人工智能的园林绿化管理系统及其方法 |
CN116652988A (zh) * | 2023-07-28 | 2023-08-29 | 江苏泽宇智能电力股份有限公司 | 智能光纤配线机器人及其控制方法 |
CN116652988B (zh) * | 2023-07-28 | 2023-10-27 | 江苏泽宇智能电力股份有限公司 | 智能光纤配线机器人及其控制方法 |
CN116844217A (zh) * | 2023-08-30 | 2023-10-03 | 成都睿瞳科技有限责任公司 | 用于生成人脸数据的图像处理系统及方法 |
CN116844217B (zh) * | 2023-08-30 | 2023-11-14 | 成都睿瞳科技有限责任公司 | 用于生成人脸数据的图像处理系统及方法 |
CN117315749A (zh) * | 2023-09-25 | 2023-12-29 | 惠州市沃生照明有限公司 | 用于台灯的灯光智能调控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115512420A (zh) | 访客管理系统及其方法 | |
CN115203380B (zh) | 基于多模态数据融合的文本处理系统及其方法 | |
CN111079532B (zh) | 一种基于文本自编码器的视频内容描述方法 | |
WO2021238333A1 (zh) | 一种文本处理网络、神经网络训练的方法以及相关设备 | |
CN116415654A (zh) | 一种数据处理方法及相关设备 | |
WO2023236977A1 (zh) | 一种数据处理方法及相关设备 | |
WO2024113435A1 (zh) | 基于大数据的电梯故障模式识别系统 | |
CN112733768A (zh) | 基于双向特征语言模型的自然场景文本识别方法及装置 | |
CN113949582B (zh) | 一种网络资产的识别方法、装置、电子设备及存储介质 | |
CN115471216B (zh) | 智慧实验室管理平台的数据管理方法 | |
CN112923523A (zh) | 一种基于物联网数据链的智能型新风系统调控方法 | |
CN116403253A (zh) | 基于卷积神经网络的人脸识别监控管理系统及其方法 | |
EP4318322A1 (en) | Data processing method and related device | |
Dong et al. | Research on image classification based on capsnet | |
CN114610488A (zh) | 基于负载均衡的数据采集方法、系统和电子设备 | |
CN114884772A (zh) | 裸机vxlan的部署方法、系统和电子设备 | |
WO2023231753A1 (zh) | 一种神经网络的训练方法、数据的处理方法以及设备 | |
CN116320459B (zh) | 一种基于人工智能的计算机网络通信数据处理方法及系统 | |
CN112244863A (zh) | 信号识别方法、信号识别装置、电子设备及可读存储介质 | |
CN115331081A (zh) | 图像目标检测方法与装置 | |
CN114741532A (zh) | 基于多尺度分散动态路由的知识图谱补全方法及系统 | |
CN112560712A (zh) | 基于时间增强图卷积网络的行为识别方法、装置及介质 | |
CN112836752A (zh) | 基于深度值的特征图融合的智能采样参数控制方法 | |
WO2023143262A1 (zh) | 一种数据处理方法及相关设备 | |
CN118133004A (zh) | 一种模型训练方法、自然语言处理方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20221223 |
|
WW01 | Invention patent application withdrawn after publication |