CN116343301B - 基于人脸识别的人员信息智能校验系统 - Google Patents
基于人脸识别的人员信息智能校验系统 Download PDFInfo
- Publication number
- CN116343301B CN116343301B CN202310319142.3A CN202310319142A CN116343301B CN 116343301 B CN116343301 B CN 116343301B CN 202310319142 A CN202310319142 A CN 202310319142A CN 116343301 B CN116343301 B CN 116343301B
- Authority
- CN
- China
- Prior art keywords
- face
- feature
- feature map
- image
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012795 verification Methods 0.000 title claims abstract description 88
- 238000001514 detection method Methods 0.000 claims abstract description 109
- 238000003062 neural network model Methods 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 94
- 238000010586 diagram Methods 0.000 claims description 78
- 238000007689 inspection Methods 0.000 claims description 74
- 238000003708 edge detection Methods 0.000 claims description 52
- 238000012545 processing Methods 0.000 claims description 47
- 230000007246 mechanism Effects 0.000 claims description 37
- 238000013527 convolutional neural network Methods 0.000 claims description 35
- 238000011084 recovery Methods 0.000 claims description 32
- 238000012935 Averaging Methods 0.000 claims description 22
- 238000011176 pooling Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000010606 normalization Methods 0.000 claims description 12
- 230000009467 reduction Effects 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 43
- 230000006870 function Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 19
- 230000000694 effects Effects 0.000 description 16
- 238000004590 computer program Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 238000005065 mining Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000001931 thermography Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Collating Specific Patterns (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及智能校验领域,其具体地公开了一种基于人脸识别的人员信息智能校验系统,其通过采用基于深度学习的神经网络模型挖掘出人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息,以此来对于人员身份信息进行精准地校验识别。
Description
技术领域
本申请涉及智能校验领域,且更为具体地,涉及基于人脸识别的人员信息智能校验系统。
背景技术
人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为人员信息的校验和身份鉴别提供了必要的前提。
传统的人脸识别技术主要是基于可见光图像的人脸识别,这也是人们熟悉的识别方式。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果和精度会急剧下降,无法满足实际系统的需要。目前,解决光照问题的方案有三维图像人脸识别和热成像人脸识别,但这两种技术还远不成熟,识别效果不尽人意。
因此,期望一种优化的基于人脸识别的人员信息智能校验系统。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于人脸识别的人员信息智能校验系统,其通过采用基于深度学习的神经网络模型挖掘出人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息,以此来对于人员身份信息进行精准地校验识别。
根据本申请的一个方面,提供了一种基于人脸识别的人员信息智能校验系统,其包括:
图像数据采集模块,用于由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像;
图像处理模块,用于对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图;
图像扩展模块,用于将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像;
空间编码模块,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;
高效编码模块,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图;
特征融合模块,用于融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;
差分对比模块,用于计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;
降维模块,用于对所述差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量;
特征补偿模块,用于基于所述差分特征图的特征分布,对所述通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量;以及
匹配检测模块,用于将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配。
在上述基于人脸识别的人员信息智能校验系统中,所述空间编码模块,包括:第一深度卷积编码单元,用于使用所述第一卷积神经网络模型的各层在层的正向传递中对所述人脸检验多通道图像和所述人脸参考多通道图像分别进行卷积处理、基于局部特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出初始第一人脸检验特征图和初始第一人脸参考特征图;以及,空间注意力单元,用于将所述初始第一人脸检验特征图和初始第一人脸参考特征图输入所述第一卷积神经网络模型的空间注意力层以得到所述第一人脸检验特征图和第一人脸参考特征图。
在上述基于人脸识别的人员信息智能校验系统中,所述高效编码模块,包括:第二深度卷积编码单元,用于将所述人脸检验多通道图像和所述人脸参考多通道图像输入所述卷积神经网络模型的多层卷积层以得到多个卷积特征图;全局均值池化单元,用于计算所述多个卷积特征图的沿通道维度的各个特征矩阵的全局均值以得到多个通道特征向量;一维卷积编码单元,用于对所述多个通道特征向量进行一维卷积编码以得到多个通道关联特征向量;通道注意力权重计算单元,用于将所述多个通道关联特征向量输入所述Sigmoid激活函数以得到多个通道注意力权重向量;以及,通道注意力施加单元,用于以所述多个通道注意力权重向量中各个位置的特征值作为权重分别对所述多个卷积特征图的沿通道维度的各个特征矩阵进行加权以得到所述第二人脸检验特征图和所述第二人脸参考特征图。
在上述基于人脸识别的人员信息智能校验系统中,所述特征融合模块,用于:以如下公式来融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;其中,所述公式为:
Fa=Concat[F1,F2]
Fb=Concat[F3,F4]
其中,F1表示所述第一人脸检验特征图,F2表示所述第二人脸检验特征图,F3表示所述第一人脸参考特征图,F4表示所述第二人脸参考特征图,Concat[·,·]表示级联函数,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图。
在上述基于人脸识别的人员信息智能校验系统中,所述差分对比模块,用于:以如下公式计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;其中,所述公式为:
其中,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图,Fc表示所述差分特征图,表示按位置差分。
在上述基于人脸识别的人员信息智能校验系统中,所述特征补偿模块,包括:相关恢复因数计算单元,用于计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到相关恢复因数;补偿单元,用于以所述相关恢复因数作为加权因数对所述通道加权特征向量进行加权修正以得到所述补偿后通道加权特征向量。
在上述基于人脸识别的人员信息智能校验系统中,所述相关恢复因数计算单元,进一步用于:以如下公式计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到所述相关恢复因数;其中,所述公式为:
其中mi,j表示所述各个特征矩阵的第(i,j)位置的特征值,μ和σ分别是所述各个特征矩阵的各个位置的特征值集合的均值和方差,且W和H分别是所述各个特征矩阵的宽度和高度,log表示以2为底的对数函数值,exp(·)表示自然指数函数值,α表示所述相关恢复因数。
在上述基于人脸识别的人员信息智能校验系统中,所述匹配检测模块,包括:全连接编码单元,用于使用所述分类器的多个全连接层对所述补偿后通道加权特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果生成单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
根据本申请的另一方面,提供了一种基于人脸识别的人员信息智能校验方法,其包括:
由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像;
对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图;
将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像;
将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;
将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图;
融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;
计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;
对所述差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量;
基于所述差分特征图的特征分布,对所述通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量;以及
将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于人脸识别的人员信息智能校验方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于人脸识别的人员信息智能校验方法。
与现有技术相比,本申请提供的一种基于人脸识别的人员信息智能校验系统,其通过采用基于深度学习的神经网络模型挖掘出人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息,以此来对于人员身份信息进行精准地校验识别。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于人脸识别的人员信息智能校验系统的应用场景图;
图2为根据本申请实施例的基于人脸识别的人员信息智能校验系统的框图;
图3为根据本申请实施例的基于人脸识别的人员信息智能校验系统的系统架构图;
图4为根据本申请实施例的基于人脸识别的人员信息智能校验系统中空间编码模块的框图;
图5为根据本申请实施例的基于人脸识别的人员信息智能校验系统中高效编码模块的框图;
图6为根据本申请实施例的基于人脸识别的人员信息智能校验系统中特征补偿模块的框图;
图7为根据本申请实施例的基于人脸识别的人员信息智能校验方法的流程图;
图8为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,传统的人脸识别技术主要是基于可见光图像的人脸识别,这也是人们熟悉的识别方式。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果和精度会急剧下降,无法满足实际系统的需要。目前,解决光照问题的方案有三维图像人脸识别和热成像人脸识别,但这两种技术还远不成熟,识别效果不尽人意。因此,期望一种优化的基于人脸识别的人员信息智能校验系统。
相应地,考虑到在实际进行人脸识别来进行人员信息校验的过程中,为了提高识别的准确性,可以通过对于采集的人员人脸检测图像和录入的人脸参考图像进行对比来完成人员信息检验。但是,由于图像中关于人脸的信息量较多,难以对于有效地关于人员人脸的特征信息进行捕捉提取,这也就降低来对对于人员信息校验的精准度。并且,在人员信息校验的过程中,还可能会由于外界环境的干扰以及检测的精准度不够而造成人员信息校验判断的错误,进而导致严重的后果。在实际人员信息检验的过程中,难点在于如何准确地挖掘出所述人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息,以此来对于人员身份信息进行精准地校验识别。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
深度学习以及神经网络的发展为挖掘所述人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先,通过摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像。接着,考虑到在人员信息校验的过程中,由于图像中存在的信息量较多,难以对于有效信息进行捕捉获取,并且可能会由于外界环境的干扰以及检测的精准度不够而造成人员信息校验判断的错误,进而导致严重的后果,因此,在本申请的技术方案中,为了提高对于人员身份信息校验的准确性,将局部二值模式图和Canny边缘检测图与RGB图像进行合并为5通道作为网络的输入,以扩充网络输入端的数据宽度,使得网络可以学习与表达的东西更加丰富,有利于提高检验精确度。
具体地,对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图。应可以理解,由于局部二值模式是计算机视觉领域中一个非常有效的纹理描述特征,其具有旋转不变性、平移不变性以及可以消除光照变化的问题等优点,具体原理是,以3×3为窗口单位,若周围像素值大于中心像素值,则该像素点标记为1,否则标记为0,之后对邻域像素进行二进制化,将所得的值与二值序列对应相乘后相加即可得到中心像素的LBP值。而Canny算子有三个规范,即边缘点被误报的概率低、检测到的边缘点尽可能位于真实边缘的中心和单边只有一个响应。因此,在本申请的技术方案中,进一步对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图。
然后,将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像,以此将所述局部二值模式图和所述Canny边缘检测图与RGB图像进行合并为5通道作为网络的输入,扩充网络输入端的数据宽度,使得网络可以学习与表达的东西更加丰富,有利于提高人员身份识别的精确度。
进一步地,使用在图像特征提取领域具有优异性能表现的卷积神经网络模型作为特征提取器分别提取人脸检验多通道图像和所述人脸参考多通道图像中的高维局部图像隐藏特征。特别地,考虑到在对于人员人脸特征进行提取以进行人员身份识别时,所述人员的人脸特征在图像中为小尺度的特征信息,即在图像中所占有的特征比例较小,难以对其进行捕捉挖掘。因此,为了能够在特征挖掘时充分提取出所述人脸检验多通道图像和所述人脸参考多通道图像中关于人员人脸特征的小尺度隐含特征信息,以此提高对人员身份信息识别的精准度,在本申请的技术方案中,使用双重注意力机制的卷积神经网络模型来分别对所述人脸检验多通道图像和所述人脸参考多通道图像进行特征挖掘。
也就是说,考虑到网络经过一系列卷积之后,会得到部分特征信息,但不会自动区分各个类别特征间的差异性,网络选择性地使用特征的能力有限,鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此,在本申请的技术方案中,分别引入具有通道注意力机制和空间注意力机制的卷积神经网络模型来分别对于所述人脸检验多通道图像和所述人脸参考多通道图像进行特征挖掘,以分别提取出所述人脸检验多通道图像和所述人脸参考多通道图像中聚焦于空间位置上和通道内容间的关于所述人员人脸的高维隐含特征分布信息,从而得到第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图,以及第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图。
应可以理解,所述通道注意力所提取到的图像特征反映了特征通道间的相关性和重要性,所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重,用来抑制或强化不同空间位置的特征。所述通道注意力和所述空间注意力能够分别关注图像中的特征内容和特征位置,在一定程度上相互补充,提升了网络的特征提取效果,使得不同空间位置上和通道内容间的关于所述人员人脸的的隐藏特征分布信息被大量捕捉到,可有效增强特征辨别学习能力,在网络训练过程中,任务处理系统更专注于找到输入图像数据中显著的与当前输出相关的有用信息,从而提高输出的质量,且渐增的注意力模块将带来持续的性能提升。
特别地,考虑到由于注意力机制是改善目标检测性能的重要方法,但是,传统注意力机制在降维后会为后续分类检测带来的副作用,压缩图像在高维空间中的数据特征信息,使图像中关于人员人脸的有效信息丢失,降低分类的精准度。因此,为了避免这种副作用,旨在获取通道间的依赖关系,增强特征的表达能力,在本申请的技术方案中,使用高效注意力机制(ECA注意力机制)的卷积神经网络模型来代替通道注意机制的卷积神经网络模型,以此来对于所述人脸检验多通道图像和所述人脸参考多通道图像进行处理,以在增强其通道间的相关性的同时避免降低维度引起的信息损失,从而得到所述第二人脸检验特征图和所述第二人脸参考特征图。相应地,在本申请的一个具体示例中,所述ECA注意力机制的卷积神经网络模型能够在不降低维度的情况下对所述人脸检验多通道图像和所述人脸参考多通道图像经过卷积层生成的特征图进行所有通道全局平均池化之后,ECA注意力机制通过一个可以权重共享的一维卷积进行学习,并在学习过程中考虑每个通道与其多个近邻来捕获跨通道间的交互信息。
然后,融合所述第一人脸检验特征图和所述第二人脸检验特征图,以此来融合所述人脸检测图像中关于人员身份信息的具有空间位置和内容关联的人脸高维隐含特征分布信息,从而得到人脸检验特征图;并融合所述第一人脸参考特征图和所述第二人脸参考特征图,以此来融合所述人脸参考图像中关于人员身份信息的具有空间位置和内容关联的人脸高维隐含特征分布信息,从而得到人脸参考特征图。接着,进一步再计算所述人脸检验特征图和所述人脸参考特征图的差分特征图,以此表示所述人脸检测图像中关于人脸高维隐含特征和所述人脸参考图像中关于人脸高维隐含特征的差异性特征分布信息。
进一步地,将所述差分特征图作为分类特征图通过分类器以得到用于表示待校验人员与参考人员的身份信息是否匹配的分类结果。也就是,在本申请的技术方案中,所述分类器的标签包括待校验人员与参考人员的身份信息匹配,以及,待校验人员与参考人员的身份信息不匹配,其中,所述分类器通过软最大值函数来确定所述分类特征图属于哪个分类标签。应可以理解,在本申请的技术方案中,所述分类器的分类标签为待校验人员与参考人员的身份信息是否匹配的判断评估标签,因此,在得到所述分类结果后,可基于所述分类结果来精准地对于待校验人员的身份信息进行识别。
特别地,在本申请的技术方案中,通过使用空间注意力机制的第一卷积神经网络模型和使用高效注意力机制的第二卷积神经网络模型,可以提升所述差分特征图的各个特征矩阵内部的空间维度特征分布表达,因此,如果能够进一步提升所述差分特征图的各个特征矩阵之间的通道维度特征关联性分布表达,显然能够提升所述差分特征图的分类结果的准确性。
因此,例如,可以通过对所述差分特征图的沿通道维度排列的各个特征矩阵进行全局均值池化的方式来得到通道加权特征向量,以对所述差分特征图的沿通道维度排列的各个特征矩阵进行加权。但是,考虑到特征矩阵的全局均值池化不可避免地损失特征矩阵所表达的区别性特征空间分布信息,因此期望对于所述通道加权特征向量进行优化,以尽量恢复所述差分特征图所表达的由各个特征矩阵之间的整体分布相关而表达的特征向量的特征分布信息,从而提升所述通道加权特征向量对于各个特征矩阵之间的通道维度特征关联性分布的表达效果。
基于此,本申请的申请人在对所述差分特征图进行基于通道维度的全局均值池化处理时,计算每个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数,表示为:
μ和σ是特征集合mi,j∈M的均值和方差,mi,j为特征矩阵M的第(i,j)位置的特征值,且W和H分别是特征矩阵的宽度和高度。这里,所述全局均值池化的实例归一化和一致性相关恢复因数针对特征矩阵的全局均值池化不可避免地损失区别性特征信息的问题,在特征矩阵所表达的通道实例的空间分布特征的实例归一化(Instance Normalization:IN)的基础上,通过从类概率的统计残差特征中蒸馏一致性相关(identity-relevant)的特征,来将统计信息中的一致性相关的相干性恢复到特征值表示中,以实现所述通道加权特征向量相对于所述差分特征图的由特征矩阵的空间分布引起的通道因果关系约束(causalityconstraint)的恢复。这样,通过以该因数对所述通道加权特征向量的相应位置的特征值进行加权,就可以使得所述通道加权特征向量包含所述差分特征图所表达的由各个特征矩阵之间的整体分布相关而表达的特征向量的特征分布信息,从而提升所述通道加权特征向量对于各个特征矩阵之间的通道维度特征关联性分布的表达效果,也就相应地提升了所述差分特征图的分类结果的准确性。这样,能够精准地对于人员身份信息进行智能识别校验,以避免人脸识别精度不够导致的严重后果。
图1为根据本申请实施例的基于人脸识别的人员信息智能校验系统的应用场景图。如图1所示,在该应用场景中,首先,通过摄像头(例如,如图1中所示意的C)获取待校验人员的人脸检测图像(例如,如图1中所示意的F1),以及,数据库中获取录入参考人员的人脸参考图像(例如,如图1中所示意的F2)。然后,将上述图像输入至部署有用于基于人脸识别的人员信息智能校验算法的服务器中(例如,如图1中所示意的云服务器S),其中,所述服务器能够以所述基于人脸识别的人员信息智能校验算法对上述输入的图像进行处理,以生成用于表示待校验人员与参考人员的身份信息是否匹配的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图2为根据本申请实施例的基于人脸识别的人员信息智能校验系统的框图。如图2所示,根据本申请实施例的基于人脸识别的人员信息智能校验系统300,包括:图像数据采集模块310;图像处理模块320;图像扩展模块330;空间编码模块340;高效编码模块350;特征融合模块360;差分对比模块370;降维模块380;特征补偿模块390;以及,匹配检测模块400。
其中,所述图像数据采集模块310,用于由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像;所述图像处理模块320,用于对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图;所述图像扩展模块330,用于将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像;所述空间编码模块340,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;所述高效编码模块350,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图;所述特征融合模块360,用于融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;所述差分对比模块370,用于计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;所述降维模块380,用于对所述差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量;所述特征补偿模块390,用于基于所述差分特征图的特征分布,对所述通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量;以及,所述匹配检测模块400,用于将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配。
图3为根据本申请实施例的基于人脸识别的人员信息智能校验系统的系统架构图。如图3所示,在该网络架构中,首先通过所述图像数据采集模块310由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像;接着,所述图像处理模块320对所述图像数据采集模块310获取的人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图;所述图像扩展模块330将所述图像处理模块320得到的人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像;然后,所述空间编码模块340将所述图像扩展模块330得到的人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;所述高效编码模块350将所述图像扩展模块330得到的人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图;然后,所述特征融合模块360融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;然后,所述差分对比模块370计算所述特征融合模块360融合所得的人脸检验特征图和所述人脸参考特征图的差分特征图;所述降维模块380对所述差分对比模块370计算所得的差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量;所述特征补偿模块390基于所述差分特征图的特征分布,对所述降维模块380得到的通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量;进而,所述匹配检测模块400将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述图像数据采集模块310,用于由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像。应可以理解,在实际进行人脸识别来进行人员信息校验的过程中,可以通过对比采集的人员人脸检测图像和录入的人脸参考图像来实现人员信息检验,也就是,在本申请的技术方案中,可基于所述人脸检测图像和所述人脸参考图像中关于人员人脸特征的差异性特征信息来进行比对校验,因此,首先,可通过摄像头来获取待校验人员的人脸检测图像,以及,数据库中获取录入参考人员的人脸参考图像。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述图像处理模块320,用于对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图。考虑到在人员信息校验的过程中,由于图像中存在的信息量较多,难以对于有效信息进行捕捉获取,并且可能会由于外界环境的干扰以及检测的精准度不够而造成人员信息校验判断的错误,进而导致严重的后果,因此,在本申请的技术方案中,为了提高对于人员身份信息校验的准确性,将局部二值模式图和Canny边缘检测图与RGB图像进行合并为5通道作为网络的输入,以扩充网络输入端的数据宽度,使得网络可以学习与表达的东西更加丰富,有利于提高检验精确度。具体地,对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图。由于局部二值模式是计算机视觉领域中一个非常有效的纹理描述特征,其具有旋转不变性、平移不变性以及可以消除光照变化的问题等优点,具体原理是,以3×3为窗口单位,若周围像素值大于中心像素值,则该像素点标记为1,否则标记为0,之后对邻域像素进行二进制化,将所得的值与二值序列对应相乘后相加即可得到中心像素的LBP值。而Canny算子有三个规范,即边缘点被误报的概率低、检测到的边缘点尽可能位于真实边缘的中心和单边只有一个响应。因此,在本申请的技术方案中,进一步对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述图像扩展模块330,用于将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像。应可以理解,通过对局部二值模式图和所述Canny边缘检测图与RGB图像的沿着通道维度排列,可将它们合并为5通道作为网络的输入,扩充网络输入端的数据宽度,使得网络可以学习与表达的东西更加丰富,有利于提高人员身份识别的精确度。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述空间编码模块340和所述高效编码模块350,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;以及,将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图。也就是,使用在图像特征提取领域具有优异性能表现的卷积神经网络模型作为特征提取器分别提取人脸检验多通道图像和所述人脸参考多通道图像中的高维局部图像隐藏特征。特别地,考虑到在对于人员人脸特征进行提取以进行人员身份识别时,所述人员的人脸特征在图像中为小尺度的特征信息,即在图像中所占有的特征比例较小,难以对其进行捕捉挖掘。因此,为了能够在特征挖掘时充分提取出所述人脸检验多通道图像和所述人脸参考多通道图像中关于人员人脸特征的小尺度隐含特征信息,以此提高对人员身份信息识别的精准度,在本申请的技术方案中,使用双重注意力机制的卷积神经网络模型来分别对所述人脸检验多通道图像和所述人脸参考多通道图像进行特征挖掘。也就是说,考虑到网络经过一系列卷积之后,会得到部分特征信息,但不会自动区分各个类别特征间的差异性,网络选择性地使用特征的能力有限,鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此,在本申请的技术方案中,分别引入具有通道注意力机制和空间注意力机制的卷积神经网络模型来分别对于所述人脸检验多通道图像和所述人脸参考多通道图像进行特征挖掘,以分别提取出所述人脸检验多通道图像和所述人脸参考多通道图像中聚焦于空间位置上和通道内容间的关于所述人员人脸的高维隐含特征分布信息,从而得到第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图,以及第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图。其中,所述通道注意力所提取到的图像特征反映了特征通道间的相关性和重要性,所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重,用来抑制或强化不同空间位置的特征。所述通道注意力和所述空间注意力能够分别关注图像中的特征内容和特征位置,在一定程度上相互补充,提升了网络的特征提取效果,使得不同空间位置上和通道内容间的关于所述人员人脸的的隐藏特征分布信息被大量捕捉到,可有效增强特征辨别学习能力,在网络训练过程中,任务处理系统更专注于找到输入图像数据中显著的与当前输出相关的有用信息,从而提高输出的质量,且渐增的注意力模块将带来持续的性能提升。考虑到由于注意力机制是改善目标检测性能的重要方法,但是,传统注意力机制在降维后会为后续分类检测带来的副作用,压缩图像在高维空间中的数据特征信息,使图像中关于人员人脸的有效信息丢失,降低分类的精准度。因此,为了避免这种副作用,旨在获取通道间的依赖关系,增强特征的表达能力,在本申请的技术方案中,使用高效注意力机制(ECA注意力机制)的卷积神经网络模型来代替通道注意机制的卷积神经网络模型,以此来对于所述人脸检验多通道图像和所述人脸参考多通道图像进行处理,以在增强其通道间的相关性的同时避免降低维度引起的信息损失,从而得到所述第二人脸检验特征图和所述第二人脸参考特征图。相应地,在本申请的一个具体示例中,所述ECA注意力机制的卷积神经网络模型能够在不降低维度的情况下对所述人脸检验多通道图像和所述人脸参考多通道图像经过卷积层生成的特征图进行所有通道全局平均池化之后,ECA注意力机制通过一个可以权重共享的一维卷积进行学习,并在学习过程中考虑每个通道与其多个近邻来捕获跨通道间的交互信息。更具体地,所述所述卷积神经网络包括:主体网络,其包括至少两个卷积层、至少一个合并层、全局均值池化层和全连接层,所述主体网络利用修正的卷积神经网络算法对输入的烟雾图像进行处理,和分支网络,其包括至少一个均值池化层,所述均值池化层对对应的卷积层的输出进行均值池化处理。
图4为根据本申请实施例的基于人脸识别的人员信息智能校验系统中空间编码模块的框图。如图4所示,所述空间编码模块340,包括:第一深度卷积编码单元341,用于使用所述第一卷积神经网络模型的各层在层的正向传递中对所述人脸检验多通道图像和所述人脸参考多通道图像分别进行卷积处理、基于局部特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出初始第一人脸检验特征图和初始第一人脸参考特征图;以及,空间注意力单元342,用于将所述初始第一人脸检验特征图和初始第一人脸参考特征图输入所述第一卷积神经网络模型的空间注意力层以得到所述第一人脸检验特征图和第一人脸参考特征图。
图5为根据本申请实施例的基于人脸识别的人员信息智能校验系统中高效编码模块的框图。如图5所示,所述高效编码模块350,包括:第二深度卷积编码单元351,用于将所述人脸检验多通道图像和所述人脸参考多通道图像输入所述卷积神经网络模型的多层卷积层以得到多个卷积特征图;全局均值池化单元352,用于计算所述多个卷积特征图的沿通道维度的各个特征矩阵的全局均值以得到多个通道特征向量;一维卷积编码单元353,用于对所述多个通道特征向量进行一维卷积编码以得到多个通道关联特征向量;通道注意力权重计算单元354,用于将所述多个通道关联特征向量输入所述Sigmoid激活函数以得到多个通道注意力权重向量;以及,通道注意力施加单元355,用于以所述多个通道注意力权重向量中各个位置的特征值作为权重分别对所述多个卷积特征图的沿通道维度的各个特征矩阵进行加权以得到所述第二人脸检验特征图和所述第二人脸参考特征图。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述特征融合模块360,用于融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图。也就是,在本申请的一个具体示例中,可通过级联的方式来融合所述第一人脸检验特征图和所述第二人脸检验特征图,以此来融合所述人脸检测图像中关于人员身份信息的具有空间位置和内容关联的人脸高维隐含特征分布信息,从而得到人脸检验特征图;并通过级联的方式来融合所述第一人脸参考特征图和所述第二人脸参考特征图,以此来融合所述人脸参考图像中关于人员身份信息的具有空间位置和内容关联的人脸高维隐含特征分布信息,从而得到人脸参考特征图。更具体地,以如下公式来融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;其中,所述公式为:
Fa=Concat[F1,F2]
Fb=Concat[F3,F4]
其中,F1表示所述第一人脸检验特征图,F2表示所述第二人脸检验特征图,F3表示所述第一人脸参考特征图,F4表示所述第二人脸参考特征图,Concat[·,·]表示级联函数,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述差分对比模块370,用于计算所述人脸检验特征图和所述人脸参考特征图的差分特征图。也就是,计算两者的差分特征图来表示表示所述人脸检测图像中关于人脸高维隐含特征和所述人脸参考图像中关于人脸高维隐含特征的差异性特征分布信息,在本申请的一个具体示例中,可通过按位置差分的方式来进行计算,更具体地,以如下公式计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;其中,所述公式为:
其中,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图,Fc表示所述差分特征图,表示按位置差分。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述降维模块380,用于对所述差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量。也就是,在本申请的技术方案中,用全局均值池化层对所述差分特征图进行基于通道维度的全局池化以获得全局特征。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述特征补偿模块390,用于基于所述差分特征图的特征分布,对所述通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量。在本申请的技术方案中,通过使用空间注意力机制的第一卷积神经网络模型和使用高效注意力机制的第二卷积神经网络模型,可以提升所述差分特征图的各个特征矩阵内部的空间维度特征分布表达,因此,如果能够进一步提升所述差分特征图的各个特征矩阵之间的通道维度特征关联性分布表达,显然能够提升所述差分特征图的分类结果的准确性。因此,例如,可以通过对所述差分特征图的沿通道维度排列的各个特征矩阵进行全局均值池化的方式来得到通道加权特征向量,以对所述差分特征图的沿通道维度排列的各个特征矩阵进行加权。但是,考虑到特征矩阵的全局均值池化不可避免地损失特征矩阵所表达的区别性特征空间分布信息,因此期望对于所述通道加权特征向量进行优化,以尽量恢复所述差分特征图所表达的由各个特征矩阵之间的整体分布相关而表达的特征向量的特征分布信息,从而提升所述通道加权特征向量对于各个特征矩阵之间的通道维度特征关联性分布的表达效果。基于此,本申请的申请人在对所述差分特征图进行基于通道维度的全局均值池化处理时,计算每个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数,表示为:
其中mi,j表示所述各个特征矩阵的第(i,j)位置的特征值,μ和σ分别是所述各个特征矩阵的各个位置的特征值集合的均值和方差,且W和H分别是所述各个特征矩阵的宽度和高度,log表示以2为底的对数函数值,exp(·)表示自然指数函数值,α表示所述相关恢复因数。这里,所述全局均值池化的实例归一化和一致性相关恢复因数针对特征矩阵的全局均值池化不可避免地损失区别性特征信息的问题,在特征矩阵所表达的通道实例的空间分布特征的实例归一化(Instance Normalization:IN)的基础上,通过从类概率的统计残差特征中蒸馏一致性相关(identity-relevant)的特征,来将统计信息中的一致性相关的相干性恢复到特征值表示中,以实现所述通道加权特征向量相对于所述差分特征图的由特征矩阵的空间分布引起的通道因果关系约束(causality constraint)的恢复。这样,通过以该因数对所述通道加权特征向量的相应位置的特征值进行加权,就可以使得所述通道加权特征向量包含所述差分特征图所表达的由各个特征矩阵之间的整体分布相关而表达的特征向量的特征分布信息,从而提升所述通道加权特征向量对于各个特征矩阵之间的通道维度特征关联性分布的表达效果,也就相应地提升了所述差分特征图的分类结果的准确性。这样,能够精准地对于人员身份信息进行智能识别校验,以避免人脸识别精度不够导致的严重后果。
图6为根据本申请实施例的基于人脸识别的人员信息智能校验系统中特征补偿模块的框图。如图6所示,所述特征补偿模块390,包括:相关恢复因数计算单元391,用于计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到相关恢复因数;补偿单元392,用于以所述相关恢复因数作为加权因数对所述通道加权特征向量进行加权修正以得到所述补偿后通道加权特征向量。
具体地,在所述基于人脸识别的人员信息智能校验系统300的运行过程中,所述匹配检测模块400,用于将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配。也就是,将所述补偿后通道加权特征向量作为分类特征向量通过分类器以得到分类结果,具体地,使用所述分类器以如下公式对所述补偿后通道加权特征向量进行处理以获得分类结果,其中,所述公式为:
O=softmax{(Wn,Bn):…:(W1,B1)|X},其中,W1到Wn为权重矩阵,B1到Bn为偏置向量,X为补偿后通道加权特征向量。具体地,所述分类器包括多个全连接层和与所述多个全连接层最后一个全连接层级联的Softmax层。其中,在所述分类器的分类处理中,使用所述分类器的多个全连接层对所述补偿后通道加权特征向量进行多次全连接编码以得到编码分类特征向量;进而,将所述编码分类特征向量输入所述分类器的Softmax层,即,使用所述Softmax分类函数对所述编码分类特征向量进行分类处理以得到分类标签,在本申请的技术方案中,所述分类器的标签包括待校验人员与参考人员的身份信息匹配,以及,待校验人员与参考人员的身份信息不匹配,其中,所述分类器通过软最大值函数来确定所述分类特征图属于哪个分类标签。应可以理解,在本申请的技术方案中,所述分类器的分类标签为待校验人员与参考人员的身份信息是否匹配的判断评估标签,因此,在得到所述分类结果后,可基于所述分类结果来精准地对于待校验人员的身份信息进行识别。
综上,根据本申请实施例的基于人脸识别的人员信息智能校验系统300被阐明,其通过采用基于深度学习的神经网络模型挖掘出人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息,以此来对于人员身份信息进行精准地校验识别。
如上所述,根据本申请实施例的基于人脸识别的人员信息智能校验系统可以实现在各种终端设备中。在一个示例中,根据本申请实施例的基于人脸识别的人员信息智能校验系统300可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于人脸识别的人员信息智能校验系统300可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于人脸识别的人员信息智能校验系统300同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于人脸识别的人员信息智能校验系统300与该终端设备也可以是分立的设备,并且该基于人脸识别的人员信息智能校验系统300可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图7为根据本申请实施例的基于人脸识别的人员信息智能校验方法的流程图。如图7所示,根据本申请实施例的基于人脸识别的人员信息智能校验方法,包括步骤:S110,由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像;S120,对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图;S130,将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像;S140,将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;S150,将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图;S160,融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;S170,计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;S180,对所述差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量;S190,基于所述差分特征图的特征分布,对所述通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量;以及,S200,将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配。
在一个示例中,在上述基于人脸识别的人员信息智能校验方法中,所述步骤S140,包括:使用所述第一卷积神经网络模型的各层在层的正向传递中对所述人脸检验多通道图像和所述人脸参考多通道图像分别进行卷积处理、基于局部特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出初始第一人脸检验特征图和初始第一人脸参考特征图;以及,将所述初始第一人脸检验特征图和初始第一人脸参考特征图输入所述第一卷积神经网络模型的空间注意力层以得到所述第一人脸检验特征图和第一人脸参考特征图。
在一个示例中,在上述基于人脸识别的人员信息智能校验方法中,所述步骤S150,包括:将所述人脸检验多通道图像和所述人脸参考多通道图像输入所述卷积神经网络模型的多层卷积层以得到多个卷积特征图;计算所述多个卷积特征图的沿通道维度的各个特征矩阵的全局均值以得到多个通道特征向量;对所述多个通道特征向量进行一维卷积编码以得到多个通道关联特征向量;将所述多个通道关联特征向量输入所述Sigmoid激活函数以得到多个通道注意力权重向量;以及,以所述多个通道注意力权重向量中各个位置的特征值作为权重分别对所述多个卷积特征图的沿通道维度的各个特征矩阵进行加权以得到所述第二人脸检验特征图和所述第二人脸参考特征图。
在一个示例中,在上述基于人脸识别的人员信息智能校验方法中,所述步骤S160,包括:以如下公式来融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;其中,所述公式为:
Fa=Concat[F1,F2]
Fb=Concat[F3,F4]
其中,F1表示所述第一人脸检验特征图,F2表示所述第二人脸检验特征图,F3表示所述第一人脸参考特征图,F4表示所述第二人脸参考特征图,Concat[·,·]表示级联函数,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图。
在一个示例中,在上述基于人脸识别的人员信息智能校验方法中,所述步骤S170,包括:以如下公式计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;其中,所述公式为:
其中,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图,Fc表示所述差分特征图,表示按位置差分。
在一个示例中,在上述基于人脸识别的人员信息智能校验方法中,所述步骤S190,包括:计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到相关恢复因数;以所述相关恢复因数作为加权因数对所述通道加权特征向量进行加权修正以得到所述补偿后通道加权特征向量。其中,计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到相关恢复因数,包括:以如下公式计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到所述相关恢复因数;其中,所述公式为:
其中mi,j表示所述各个特征矩阵的第(i,j)位置的特征值,μ和σ分别是所述各个特征矩阵的各个位置的特征值集合的均值和方差,且W和H分别是所述各个特征矩阵的宽度和高度,log表示以2为底的对数函数值,exp(·)表示自然指数函数值,α表示所述相关恢复因数。
在一个示例中,在上述基于人脸识别的人员信息智能校验方法中,所述步骤S200,包括:使用所述分类器的多个全连接层对所述补偿后通道加权特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
综上,根据本申请实施例的基于人脸识别的人员信息智能校验方法被阐明,其通过采用基于深度学习的神经网络模型挖掘出人脸检测图像和人脸参考图像中关于人员人脸特征的差异性特征信息,以此来对于人员身份信息进行精准地校验识别。
示例性电子设备
下面,参考图8来描述根据本申请实施例的电子设备。
图8图示了根据本申请实施例的电子设备的框图。
如图8所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于人脸识别的人员信息智能校验系统中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如补偿后通道加权特征向量各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图8中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性系统”部分中描述的根据本申请各种实施例的基于人脸识别的人员信息智能校验方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性系统”部分中描述的根据本申请各种实施例的基于人脸识别的人员信息智能校验方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (6)
1.一种基于人脸识别的人员信息智能校验系统,其特征在于,包括:
图像数据采集模块,用于由摄像头获取待校验人员的人脸检测图像,以及,从数据库中获取录入参考人员的人脸参考图像;
图像处理模块,用于对所述人脸检测图像和人脸参考图像分别进行局部二值化处理和Canny边缘检测以得到第一局部二值模式图、第一Canny边缘检测图、第二局部二值模式图和第二Canny边缘检测图;
图像扩展模块,用于将所述人脸识别图像、所述第一局部二值模式图和所述第一Canny边缘检测图沿着通道维度排列为人脸检验多通道图像,并将所述人脸参考图像、所述第二局部二值模式图和所述第二Canny边缘检测图沿着通道维度排列为人脸参考多通道图像;
空间编码模块,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用空间注意力机制的第一卷积神经网络模型以得到第一人脸检验特征图和第一人脸参考特征图;
高效编码模块,用于将所述人脸检验多通道图像和所述人脸参考多通道图像分别通过使用高效注意力机制的第二卷积神经网络模型以得到第二人脸检验特征图和第二人脸参考特征图;
特征融合模块,用于融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;
差分对比模块,用于计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;
降维模块,用于对所述差分特征图进行基于通道维度的全局均值池化处理以得到通道加权特征向量;
特征补偿模块,用于基于所述差分特征图的特征分布,对所述通道加权特征向量进行特征补偿以得到补偿后通道加权特征向量;以及
匹配检测模块,用于将所述补偿后通道加权特征向量通过分类器以得到分类结果,所述分类结果用于表示待校验人员与参考人员的身份信息是否匹配;
其中,所述特征补偿模块,包括:
相关恢复因数计算单元,用于计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到相关恢复因数;
补偿单元,用于以所述相关恢复因数作为加权因数对所述通道加权特征向量进行加权修正以得到所述补偿后通道加权特征向量;
其中,所述相关恢复因数计算单元,用于:以如下公式计算所述差分特征图的沿通道维度排列的各个特征矩阵的全局均值池化的实例归一化和一致性相关恢复因数以得到所述相关恢复因数;
其中,所述公式为:
其中mi,j表示所述各个特征矩阵的第(i,j)位置的特征值,μ和σ分别是所述各个特征矩阵的各个位置的特征值集合的均值和方差,且W和H分别是所述各个特征矩阵的宽度和高度,log表示以2为底的对数函数值,exp(·)表示自然指数函数值,α表示所述相关恢复因数。
2.根据权利要求1所述的基于人脸识别的人员信息智能校验系统,其特征在于,所述空间编码模块,包括:
第一深度卷积编码单元,用于使用所述第一卷积神经网络模型的各层在层的正向传递中对所述人脸检验多通道图像和所述人脸参考多通道图像分别进行卷积处理、基于局部特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出初始第一人脸检验特征图和初始第一人脸参考特征图;以及
空间注意力单元,用于将所述初始第一人脸检验特征图和初始第一人脸参考特征图输入所述第一卷积神经网络模型的空间注意力层以得到所述第一人脸检验特征图和第一人脸参考特征图。
3.根据权利要求2所述的基于人脸识别的人员信息智能校验系统,其特征在于,所述高效编码模块,包括:
第二深度卷积编码单元,用于将所述人脸检验多通道图像和所述人脸参考多通道图像输入所述卷积神经网络模型的多层卷积层以得到多个卷积特征图;
全局均值池化单元,用于计算所述多个卷积特征图的沿通道维度的各个特征矩阵的全局均值以得到多个通道特征向量;
一维卷积编码单元,用于对所述多个通道特征向量进行一维卷积编码以得到多个通道关联特征向量;
通道注意力权重计算单元,用于将所述多个通道关联特征向量输入Sigmoid激活函数以得到多个通道注意力权重向量;以及
通道注意力施加单元,用于以所述多个通道注意力权重向量中各个位置的特征值作为权重分别对所述多个卷积特征图的沿通道维度的各个特征矩阵进行加权以得到所述第二人脸检验特征图和所述第二人脸参考特征图。
4.根据权利要求3所述的基于人脸识别的人员信息智能校验系统,其特征在于,所述特征融合模块,用于:以如下公式来融合所述第一人脸检验特征图和所述第二人脸检验特征图以得到人脸检验特征图,并融合所述第一人脸参考特征图和所述第二人脸参考特征图以得到人脸参考特征图;
其中,所述公式为:
Fa=Concat[F1,F2]
Fb=Concat[F3,F4]
其中,F1表示所述第一人脸检验特征图,F2表示所述第二人脸检验特征图,F3表示所述第一人脸参考特征图,F4表示所述第二人脸参考特征图,Concat[·,·]表示级联函数,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图。
5.根据权利要求4所述的基于人脸识别的人员信息智能校验系统,其特征在于,所述差分对比模块,用于:以如下公式计算所述人脸检验特征图和所述人脸参考特征图的差分特征图;
其中,所述公式为:
其中,Fa表示所述人脸检验特征图,Fb表示所述人脸参考特征图,Fc表示所述差分特征图,表示按位置差分。
6.根据权利要求5所述的基于人脸识别的人员信息智能校验系统,其特征在于,所述匹配检测模块,包括:
全连接编码单元,用于使用所述分类器的多个全连接层对所述补偿后通道加权特征向量进行全连接编码以得到编码分类特征向量;以及
分类结果生成单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310319142.3A CN116343301B (zh) | 2023-03-27 | 2023-03-27 | 基于人脸识别的人员信息智能校验系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310319142.3A CN116343301B (zh) | 2023-03-27 | 2023-03-27 | 基于人脸识别的人员信息智能校验系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116343301A CN116343301A (zh) | 2023-06-27 |
CN116343301B true CN116343301B (zh) | 2024-03-08 |
Family
ID=86882030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310319142.3A Active CN116343301B (zh) | 2023-03-27 | 2023-03-27 | 基于人脸识别的人员信息智能校验系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116343301B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117218783A (zh) * | 2023-09-12 | 2023-12-12 | 广东云百科技有限公司 | 物联网安全管理系统及方法 |
CN117173294B (zh) * | 2023-11-03 | 2024-02-13 | 之江实验室科技控股有限公司 | 自动生成数字人的方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010193327A (ja) * | 2009-02-20 | 2010-09-02 | Nec Engineering Ltd | 画像復号装置およびパケット損失補償方法 |
CN110046551A (zh) * | 2019-03-18 | 2019-07-23 | 中国科学院深圳先进技术研究院 | 一种人脸识别模型的生成方法及设备 |
CN111640087A (zh) * | 2020-04-14 | 2020-09-08 | 中国测绘科学研究院 | 一种基于sar深度全卷积神经网络的影像变化检测方法 |
CN111985574A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 医疗图像的识别方法、装置、设备及存储介质 |
CN112241728A (zh) * | 2020-10-30 | 2021-01-19 | 中国科学院合肥物质科学研究院 | 采用注意力机制学习上下文信息的实时车道线检测方法及系统 |
CN112883756A (zh) * | 2019-11-29 | 2021-06-01 | 哈尔滨工业大学(深圳) | 年龄变换人脸图像的生成方法及生成对抗网络模型 |
CN114037938A (zh) * | 2021-11-09 | 2022-02-11 | 桂林电子科技大学 | 一种基于NFL-Net的低照度目标检测方法 |
CN115471781A (zh) * | 2022-09-22 | 2022-12-13 | 美欣达欣环卫科技有限公司 | 智能垃圾分类系统及其分类方法 |
WO2023005161A1 (zh) * | 2021-07-27 | 2023-02-02 | 平安科技(深圳)有限公司 | 人脸图像相似度的计算方法、装置、设备及存储介质 |
CN115705616A (zh) * | 2021-08-06 | 2023-02-17 | 复旦大学 | 基于结构一致性统计映射框架的真实图像风格迁移方法 |
WO2023028908A1 (en) * | 2021-09-01 | 2023-03-09 | Intel Corporation | Dynamic temporal normalization for deep learning in video understanding applications |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021108783A1 (en) * | 2019-11-27 | 2021-06-03 | The Research Foundation For The State University Of New York | Methods and systems for assessing a vasculature |
US11810312B2 (en) * | 2020-04-21 | 2023-11-07 | Daegu Gyeongbuk Institute Of Science And Technology | Multiple instance learning method |
-
2023
- 2023-03-27 CN CN202310319142.3A patent/CN116343301B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010193327A (ja) * | 2009-02-20 | 2010-09-02 | Nec Engineering Ltd | 画像復号装置およびパケット損失補償方法 |
CN110046551A (zh) * | 2019-03-18 | 2019-07-23 | 中国科学院深圳先进技术研究院 | 一种人脸识别模型的生成方法及设备 |
CN112883756A (zh) * | 2019-11-29 | 2021-06-01 | 哈尔滨工业大学(深圳) | 年龄变换人脸图像的生成方法及生成对抗网络模型 |
CN111640087A (zh) * | 2020-04-14 | 2020-09-08 | 中国测绘科学研究院 | 一种基于sar深度全卷积神经网络的影像变化检测方法 |
CN111985574A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 医疗图像的识别方法、装置、设备及存储介质 |
CN112241728A (zh) * | 2020-10-30 | 2021-01-19 | 中国科学院合肥物质科学研究院 | 采用注意力机制学习上下文信息的实时车道线检测方法及系统 |
WO2023005161A1 (zh) * | 2021-07-27 | 2023-02-02 | 平安科技(深圳)有限公司 | 人脸图像相似度的计算方法、装置、设备及存储介质 |
CN115705616A (zh) * | 2021-08-06 | 2023-02-17 | 复旦大学 | 基于结构一致性统计映射框架的真实图像风格迁移方法 |
WO2023028908A1 (en) * | 2021-09-01 | 2023-03-09 | Intel Corporation | Dynamic temporal normalization for deep learning in video understanding applications |
CN114037938A (zh) * | 2021-11-09 | 2022-02-11 | 桂林电子科技大学 | 一种基于NFL-Net的低照度目标检测方法 |
CN115471781A (zh) * | 2022-09-22 | 2022-12-13 | 美欣达欣环卫科技有限公司 | 智能垃圾分类系统及其分类方法 |
Non-Patent Citations (3)
Title |
---|
Attentive normalization;Li X, et al;Computer Vision–ECCV 2020: 16th European Conference, Glasgow, UK;20201119;第70-87页 * |
Learning Identity-Consistent Feature for Cross-Modality Person Re-Identification via Pixel and Feature Alignment;Chan S, et al;Mobile Information Systems;20221010;第1-9页 * |
多光谱及多模态图像全局配准方法;曹思源;浙江大学;20230215;第1-133页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116343301A (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116343301B (zh) | 基于人脸识别的人员信息智能校验系统 | |
CN110929622A (zh) | 视频分类方法、模型训练方法、装置、设备及存储介质 | |
CN116994069B (zh) | 一种基于多模态信息的图像解析方法及系统 | |
CN114782882B (zh) | 基于多模态特征融合的视频目标行为异常检测方法和系统 | |
CN116702156B (zh) | 信息安全风险评价系统及其方法 | |
CN115471216B (zh) | 智慧实验室管理平台的数据管理方法 | |
Akhtar et al. | Optical character recognition (OCR) using partial least square (PLS) based feature reduction: an application to artificial intelligence for biometric identification | |
CN115620303A (zh) | 人事档案智慧管理系统 | |
CN116089648B (zh) | 基于人工智能的档案管理系统及方法 | |
CN111353514A (zh) | 模型训练方法、图像识别方法、装置及终端设备 | |
CN116030018A (zh) | 用于门加工的来料合格检验系统及方法 | |
CN112766223A (zh) | 基于样本挖掘与背景重构的高光谱图像目标检测方法 | |
Zeng et al. | Occlusion‐invariant face recognition using simultaneous segmentation | |
Li et al. | Robust foreground segmentation based on two effective background models | |
CN117636400B (zh) | 基于图像可识别动物身份的方法及系统 | |
CN118115947A (zh) | 基于随机颜色转换和多尺度特征融合的跨模态行人重识别方法 | |
CN116502899B (zh) | 基于人工智能的风险评级模型生成方法、装置及存储介质 | |
CN117596058A (zh) | 网络信息的安全保护系统及方法 | |
CN116912597A (zh) | 知识产权智能管理系统及其方法 | |
CN116467485A (zh) | 一种视频图像检索构建系统及其方法 | |
CN110837804A (zh) | 一种稀疏混合字典学习的人脸鉴别方法 | |
CN116188439A (zh) | 一种基于身份识别概率分布的伪造换脸图像检测方法和装置 | |
CN112380369B (zh) | 图像检索模型的训练方法、装置、设备和存储介质 | |
CN116188847A (zh) | 军事玩具模型的智能化加工方法及其系统 | |
Mowla et al. | Selective fuzzy ensemble learner for cognitive detection of bio-identifiable modality spoofing in MCPS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |