CN117894058B - 基于注意力增强的智慧城市摄像头人脸识别方法 - Google Patents
基于注意力增强的智慧城市摄像头人脸识别方法 Download PDFInfo
- Publication number
- CN117894058B CN117894058B CN202410288916.5A CN202410288916A CN117894058B CN 117894058 B CN117894058 B CN 117894058B CN 202410288916 A CN202410288916 A CN 202410288916A CN 117894058 B CN117894058 B CN 117894058B
- Authority
- CN
- China
- Prior art keywords
- matrix
- convolution
- attention
- layer
- identity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims description 102
- 238000010606 normalization Methods 0.000 claims description 21
- 230000004913 activation Effects 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 11
- 230000017105 transposition Effects 0.000 claims description 7
- 230000001815 facial effect Effects 0.000 claims description 4
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 238000010276 construction Methods 0.000 abstract description 4
- 230000006978 adaptation Effects 0.000 abstract description 2
- 230000002411 adverse Effects 0.000 abstract description 2
- 238000012549 training Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及脸识别技术领域,尤其涉及一种基于注意力增强的智慧城市摄像头人脸识别方法,对MS1M‑V2数据集中的图像进行处理,得到人脸图像和人脸灰度图像并输入到第一卷积网络中,将混合特征输入到第二卷积网络中,得到第二卷积特征,再通过注意力增强模块和身份特征提取器得到身份特征,通过姿势鉴别器和身份鉴别器,得到人脸识别结果。本发明科学有效的为智慧城市摄像头等边缘设备应用提出了一种足够轻量化的人脸识别模型,借助连续索引的域适应,缩小了正面和侧面之间的域差距,充分利用小参数量的训练方式挖掘人脸图像蕴含的潜在语义信息,提高视频监控在智慧城市建设中的应用覆盖,其可以快速响应以及预防不良事件的发生。
Description
技术领域
本发明涉及脸识别技术领域,尤其涉及一种基于注意力增强的智慧城市摄像头人脸识别方法。
背景技术
随着人工智能的快速发展,人脸识别系统取得了令人瞩目的性能,特别是在智慧城市摄像头建设中,这一技术展现出了巨大的潜力。传统的智慧城市摄像头人脸识别系统对模型参数要求比较高。当进行侧面人脸识别时,它们的识别效果往往会受到影响,这主要是因为当前利用姿势不变的人脸识别方法通常使用巨大的主干网络或多个模型,这使得它们很难在边缘设备中应用。而通过注意力增强机制将混合特征图逐层分解为姿势和身份相关的特征,以嵌入式卷积神经网络架构来优化模型结构,当部署到城市摄像头等终端设备时,使得人脸识别性能得到显著增强。
发明内容
本发明针对现有技术的不足,研制一种基于注意力增强的智慧城市摄像头人脸识别方法。
本发明解决技术问题的技术方案为:
一种基于注意力增强的智慧城市摄像头人脸识别方法,包括如下步骤:
a)对MS1M-V2数据集中的图像利用NLM图像去噪方法得到人脸图像,对人脸图像/>使用OpenCV中的cvtColor方法得到人脸灰度图像/>;
b)将人脸图像和人脸灰度图像/>输入到第一卷积网络中,得到混合特征/>;
c)将混合特征输入到第二卷积网络中,得到第二卷积特征/>;
d)将第二卷积特征输入到注意力增强模块中,得到注意力编码/>;
e)将第二卷积特征和注意力编码/>输入到身份特征提取器中,得到身份特征/>;
f)将混合特征输入到姿势鉴别器中,得到姿势特征/>;
g)将身份特征和姿势特征/>输入到身份鉴别器中,得到人脸识别结果;
h)通过交叉熵损失函数利用Adam优化器迭代步骤b)至g)中模型的参数,得到训练后的模型M;
i)将待识别的人脸图像进行预处理后输入到步骤h)中训练好的模型内,输出得到人脸识别结果R2。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤a)包括如下步骤:
a-1)从数据集中获取图像数据对其进行NLM图像去噪,使用python中的dataset类按照类别封装,得到人脸图像;
a-2)对人脸图像使用OpenCV中的cvtColor方法并使用python中的dataset类按照类别封装,得到人脸灰度图像/>。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤b)包括如下步骤:
b-1)第一卷积网络依次由第一卷积模块、第二卷积模块和平均池化层构成,第一卷积模块依次由一个卷积核为3*3*3、步长为1的卷积层,一个批标准化层和一个ReLU激活函数层构成,第二卷积模块依次由一个卷积核为1*1*1、步长为1的卷积层,一个批标准化层和一个ReLU激活函数层构成;
b-2)将人脸图像输入到第一卷积模块中,得到第一初始特征;将人脸灰度图像/>输入到第二卷积模块中,得到第二初始特征;
b-3)将第一初始特征和第二初始特征/>相加,得到初始混合特征/>;
b-4)将初始混合特征输入到平均池化层中,得到混合特征/>。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤c)包括如下步骤:
c-1)第二卷积网络包括卷积模块和最大池化层组,卷积模块依次由一个卷积核为3*3*3、步长为1的卷积层,一个批标准化层和一个sigmoid激活函数层构成;
c-2) 将混合特征输入到卷积模块中,得到第一增强特征/>;
c-3) 将第一增强特征输入到最大池化层中,得到第二卷积特征/>。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤d)包括如下步骤:
d-1)注意力增强模块包括多头注意力层、缩放点积注意力、第一归一化层、第二归一化层、加权层和第三归一化层,多头注意力层包含维度为12×12的查询矩阵Q、键矩阵K和值矩阵V,并对其进行初始化,将第二卷积特征分别乘查询矩阵Q、键矩阵K和值矩阵V得到可学习的查询权重矩阵/>、键权重矩阵/>和值权重矩阵/>;缩放点积注意力对可学习的键权重矩阵/>和值权重矩阵/>进行转置操作并输入第一归一化层,得到键转置矩阵/>和值转置矩阵/>,对可学习的查询权重矩阵/>取平方根并输入第二归一化层得到查询转置矩阵/>;
d-2)加权层分别将、/>与/>相乘,最后相加,并输入第三归一化层得到注意力编码,
注意力编码公式如下:
,
其中,/>,/>代表对不同参数的标准化,/>代表查询权重矩阵,/>代表键权重矩阵,/>代表值权重矩阵。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤e)中 身份特征提取器包括特征融合模块和卷积模块,特征融合模块包括身份矩阵和位置查询编码层;身份矩阵维度为12×12的初始化二维矩阵,将注意力编码与第二卷积特征/>相加后乘以身份矩阵,得到注意力增强身份矩阵/>;位置查询编码层由python中的tanh()函数组成,tanh()函数的输出范围为(-1,1);注意力增强身份矩阵/>的维度数输入到tanh()函数中,将tanh()函数的输出乘以权重系数0.18,得到注意力因子α,将注意力因子α与注意力增强身份矩阵/>的每个元素相加,得到身份融合特征/>,过程中具体公式如下:
;
,
其中代表身份矩阵,/>代表注意力编码,/> 代表c-3)中的第二卷积特征,dim()代表计算参数的维度,/>代表身份融合特征。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤f)包括如下步骤:
f-1) 姿势鉴别器由连续索引域、梯度反转层和姿势分类器,连续索引域由维度为64×64的初始化二维矩阵;
f-2)将混合特征乘以连续索引域,得到姿势矩阵/>;
f-3)梯度反转层由ReLU激活函数HE 反转因子β=-1组成,将姿势矩阵输入ReLU激活函数后乘以反转因子,得到姿势反转矩阵/>;
f-4) 所述姿势分类器由Flatten函数和线性层组成,将姿势反转矩阵输入姿势分类器中,得到姿势特征/>。
上述基于注意力增强的智慧城市摄像头人脸识别方法基础上,步骤g)中身份鉴别器由Flatten函数、线性层和max函数构成,将身份特征输入Flatten函数和线性层中,得到身份分类特征/>,将身份分类特征/>与姿势特征/>相加输入到max函数中,得到人脸识别结果R,R取值范围为/>,N为录入系统的人脸的数量。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案具有如下优点或有益效果:本方法将注意力增强模块嵌入到身份特征提取器的每一层中,以将混合特征逐层分解为姿势和身份相关的特征。科学有效的为智慧城市摄像头等边缘设备应用提出了一种足够轻量化的人脸识别模型,借助连续索引的域适应,缩小了正面和侧面之间的域差距;充分利用小参数量的训练方式挖掘人脸图像蕴含的潜在语义信息,提高视频监控在智慧城市建设中的应用覆盖,其可以快速响应以及预防不良事件的发生,助力视频监控融入网络化、数字化、智能化的智慧城市建设中,对强化视频监控数据安全有重大的意义。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明的模型结构图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。
实施例1 一种基于注意力增强的智慧城市摄像头人脸识别方法,包括如下步骤:
a)对MS1M-V2数据集中的图像利用NLM图像去噪方法得到人脸图像,对人脸图像/>使用OpenCV中的cvtColor方法得到人脸灰度图像/>;
b)将人脸图像和人脸灰度图像/>输入到第一卷积网络中,得到混合特征/>;
c)将混合特征输入到第二卷积网络中,得到第二卷积特征/>;
d)将第二卷积特征输入到注意力增强模块中,得到注意力编码/>;
e)将第二卷积特征和注意力编码/>输入到身份特征提取器中,得到身份特征/>;
f)将混合特征输入到姿势鉴别器中,得到姿势特征/>;
g)将身份特征和姿势特征/>输入到身份鉴别器中,得到人脸识别结果R1;
h)通过交叉熵损失函数利用Adam优化器迭代步骤b)至g)中模型的参数,得到训练后的模型M;
i)将待识别的人脸图像进行预处理后输入到步骤h)中训练好的模型内,输出得到人脸识别结果R2。
本实施例中,步骤a)包括如下步骤:
a-1)从数据集中获取图像数据对其进行NLM图像去噪,使用python中的dataset类按照类别封装,得到人脸图像;
a-2)对人脸图像使用OpenCV中的cvtColor方法并使用python中的dataset类按照类别封装,得到人脸灰度图像/>。
本实施例中,步骤b)包括如下步骤:
b-1)第一卷积网络依次由第一卷积模块、第二卷积模块和平均池化层构成,第一卷积模块依次由一个卷积核为3*3*3、步长为1的卷积层,一个批标准化层和一个ReLU激活函数层构成,第二卷积模块依次由一个卷积核为1*1*1、步长为1的卷积层,一个批标准化层和一个ReLU激活函数层构成;
b-2)将人脸图像输入到第一卷积模块中,得到第一初始特征;将人脸灰度图像/>输入到第二卷积模块中,得到第二初始特征;
b-3)将第一初始特征和第二初始特征/>相加,得到初始混合特征/>;
b-4)将初始混合特征输入到平均池化层中,得到混合特征/>。
本实施例中,步骤c)包括如下步骤:
c-1)第二卷积网络包括卷积模块和最大池化层组,卷积模块依次由一个卷积核为3*3*3、步长为1的卷积层,一个批标准化层和一个sigmoid激活函数层构成;
c-2) 将混合特征输入到卷积模块中,得到第一增强特征/>;
c-3) 将第一增强特征输入到最大池化层中,得到第二卷积特征/>。
本实施例中,步骤d)包括如下步骤:
d-1)注意力增强模块包括多头注意力层、缩放点积注意力、第一归一化层、第二归一化层、加权层和第三归一化层,多头注意力层包含维度为12×12的查询矩阵Q、键矩阵K和值矩阵V,并对其进行初始化,将第二卷积特征分别乘查询矩阵Q、键矩阵K和值矩阵V得到可学习的查询权重矩阵/>、键权重矩阵/>和值权重矩阵/>;缩放点积注意力对可学习的键权重矩阵/>和值权重矩阵/>进行转置操作并输入第一归一化层,得到键转置矩阵/>和值转置矩阵/>,对可学习的查询权重矩阵/>取平方根并输入第二归一化层得到查询转置矩阵/>;
d-2)加权层分别将、/>与/>相乘,最后相加,并输入第三归一化层得到注意力编码,
注意力编码公式如下:
,
其中,/>,/>代表对不同参数的标准化,/>代表查询权重矩阵,/>代表键权重矩阵,/>代表值权重矩阵。
本实施例中,步骤e)中 身份特征提取器包括特征融合模块和卷积模块,特征融合模块包括身份矩阵和位置查询编码层;身份矩阵维度为12×12的初始化二维矩阵,将注意力编码与第二卷积特征/>相加后乘以身份矩阵,得到注意力增强身份矩阵/>;位置查询编码层由python中的tanh()函数组成,tanh()函数的输出范围为(-1,1);注意力增强身份矩阵/>的维度数输入到tanh()函数中,将tanh()函数的输出乘以权重系数0.18,得到注意力因子α,将注意力因子α与注意力增强身份矩阵/>的每个元素相加,得到身份融合特征/>;过程中具体公式如下:
;
,
其中代表身份矩阵,/>代表注意力编码,/> 代表c-3)中的第二卷积特征,dim()代表计算参数的维度,/>代表身份融合特征。
本实施例中,步骤f)包括如下步骤:
f-1) 姿势鉴别器由连续索引域、梯度反转层和姿势分类器,连续索引域由维度为64×64的初始化二维矩阵;
f-2)将混合特征乘以连续索引域,得到姿势矩阵/>;
f-3)梯度反转层由ReLU激活函数HE 反转因子β=-1组成,将姿势矩阵输入ReLU激活函数后乘以反转因子,得到姿势反转矩阵/>;
f-4) 所述姿势分类器由Flatten函数和线性层组成,将姿势反转矩阵输入姿势分类器中,得到姿势特征/>。
本实施例中,步骤g)中身份鉴别器由Flatten函数、线性层和max函数构成,将身份特征输入Flatten函数和线性层中,得到身份分类特征/>,将身份分类特征/>与姿势特征/>相加输入到max函数中,得到人脸识别结果R,R取值范围为/>,N为录入系统的人脸的数量;
下面通过以公开数据集DFEW的数据为例,具体说明该专利的实施方式。其包括以下步骤:
获取KinectFaceDB数据集中的人脸图像、与之对应的人脸身份标签,构建训练后的模型M,包含第一卷积网络、第二卷积网络、注意力增强模块、身份特征提取器、姿势鉴别器和身份鉴别器;将KinectFaceDB数据集进行NLM图像去噪,得到人脸图像,对人脸图像/>使用OpenCV中的cvtColor方法得到人脸灰度图像/>;
在训练后的模型M中,将人脸图像和人脸灰度图像/>输入到第一卷积网络中,得到混合特征/>;将混合特征/>输入到第二卷积网络中,输出得到第二卷积特征/>将第二卷积特征/>输入到注意力增强模块中,得到注意力编码/>;将第二卷积特征/>和注意力编码/>输入到身份特征提取器中,得到身份特征/>;将混合特征和注意力编码/>输入到姿势鉴别器中,得到姿势特征/>;将身份特征/>和姿势特征/>输入到身份鉴别器中,得到人脸识别结果R2,进行人脸识别。
实施例
本实施例通过与传统神经网络模型(CNN、Inception、VGG)以及目前主流神经网络模型(Depth-guided、MTUT、B-DCNN)的对比,在统一实验条件下进行,证明本方法的有效性,对比结果如表1所示。其中Parameters代表参数量,用于衡量模型大小,GFLOPs代表浮点运算次数,用于衡量模型运算速度,Accuracy代表准确率,用于衡量模型预测的精度。
本实施例使用KinectFaceDB进行训练并进行了数据集内评估。结果显示在表1中。公平起见,将所有需要对比的模型在统一实验条件下进行。最终本发明方法的准确率达到了98.23%,比现有的模型的准确率提高了0.13%。本发明提出的模型的总参数为0.58M,比现有的模型的总参数减少了98.47%,比现有最轻量的人脸识别模型减少了6.01M。我们以极低的参数量实现了最优的性能,而城市摄像头等终端设备算力性能往往不高,导致模型的参数量必须很小。这表明本发明的算法系统比现有算法更适合部署于城市摄像头等终端设备。
表1 模型对比结果
。
上述虽然结合附图对发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (6)
1.一种基于注意力增强的智慧城市摄像头人脸识别方法,其特征是:包括如下步骤:
a)对MS1M-V2数据集中的图像利用NLM图像去噪方法得到人脸图像,对人脸图像/>使用OpenCV中的cvtColor方法得到人脸灰度图像/>;
b)将人脸图像和人脸灰度图像/>输入到第一卷积网络中,得到混合特征/>;
步骤b)包括如下步骤:
b-1)第一卷积网络依次由第一卷积模块、第二卷积模块和平均池化层构成,第一卷积模块依次由一个卷积核为3*3*3、步长为1的卷积层,一个批标准化层和一个ReLU激活函数层构成,第二卷积模块依次由一个卷积核为1*1*1、步长为1的卷积层,一个批标准化层和一个ReLU激活函数层构成;
b-2)将人脸图像输入到第一卷积模块中,得到第一初始特征/>;将人脸灰度图像/>输入到第二卷积模块中,得到第二初始特征/>;
b-3)将第一初始特征和第二初始特征/>相加,得到初始混合特征;
b-4)将初始混合特征输入到平均池化层中,得到混合特征/>;
c)将混合特征输入到第二卷积网络中,得到第二卷积特征/>;
d)将第二卷积特征输入到注意力增强模块中,得到注意力编码/>;
e)将第二卷积特征和注意力编码/>输入到身份特征提取器中,得到身份特征;
f)将混合特征输入到姿势鉴别器中,得到姿势特征/>;
步骤f)包括如下步骤:
f-1) 姿势鉴别器由连续索引域、梯度反转层和姿势分类器,连续索引域由维度为64×64的初始化二维矩阵;
f-2)将混合特征乘以连续索引域,得到姿势矩阵/>;
f-3)梯度反转层由ReLU激活函数HE 反转因子β=-1组成,将姿势矩阵输入ReLU激活函数后乘以反转因子,得到姿势反转矩阵/>;
f-4) 所述姿势分类器由Flatten函数和线性层组成,将姿势反转矩阵输入姿势分类器中,得到姿势特征/>;
g)将身份特征和姿势特征/>输入到身份鉴别器中,得到人脸识别结果R1;
h)通过交叉熵损失函数利用Adam优化器迭代步骤b)至g)中模型的参数,得到训练后的模型M;
i)将待识别的人脸图像进行预处理后输入到步骤h)中训练好的模型内,输出得到人脸识别结果R2。
2.根据权利要求1所述基于注意力增强的智慧城市摄像头人脸识别方法,其特征是:步骤a)包括如下步骤:
a-1)从数据集中获取图像数据对其进行NLM图像去噪,使用python中的dataset类按照类别封装,得到人脸图像;
a-2)对人脸图像使用OpenCV中的cvtColor方法并使用python中的dataset类按照类别封装,得到人脸灰度图像/>。
3.根据权利要求1所述基于注意力增强的智慧城市摄像头人脸识别方法,其特征是:步骤c)包括如下步骤:
c-1)第二卷积网络包括卷积模块和最大池化层组,卷积模块依次由一个卷积核为3*3*3、步长为1的卷积层,一个批标准化层和一个sigmoid激活函数层构成;
c-2) 将混合特征输入到卷积模块中,得到第一增强特征/>;
c-3) 将第一增强特征输入到最大池化层中,得到第二卷积特征/>。
4.根据权利要求1所述基于注意力增强的智慧城市摄像头人脸识别方法,其特征是:步骤d)包括如下步骤:
d-1)注意力增强模块包括多头注意力层、缩放点积注意力、第一归一化层、第二归一化层、加权层和第三归一化层,多头注意力层包含维度为12×12的查询矩阵Q、键矩阵K和值矩阵V,并对其进行初始化,将第二卷积特征分别乘查询矩阵Q、键矩阵K和值矩阵V得到可学习的查询权重矩阵/>、键权重矩阵/>和值权重矩阵/>;缩放点积注意力对可学习的键权重矩阵/>和值权重矩阵/>行转置操作并输入第一归一化层,得到键转置矩阵/>和值转置矩阵/>,对可学习的查询权重矩阵/>取平方根并输入第二归一化层得到查询转置矩阵/>;
d-2)加权层分别将、/>与/>相乘,最后相加,并输入第三归一化层得到注意力编码;注意力编码/>公式如下:
,
其中,/>,/>代表对不同参数的标准化,/>代表查询权重矩阵,代表键权重矩阵,/>代表值权重矩阵。
5.根据权利要求1所述基于注意力增强的智慧城市摄像头人脸识别方法,其特征是:步骤e)中身份特征提取器包括特征融合模块和卷积模块,特征融合模块包括身份矩阵和位置查询编码层;身份矩阵/>维度为12×12的初始化二维矩阵,将注意力编码/>与第二卷积特征/>相加后乘以身份矩阵/>,得到注意力增强身份矩阵/>;位置查询编码层由python中的tanh()函数组成,tanh()函数的输出范围为(-1,1);注意力增强身份矩阵/>的维度数输入到tanh()函数中,将tanh()函数的输出乘以权重系数0.18,得到注意力因子α,将注意力因子α与注意力增强身份矩阵/>的每个元素相加,得到身份融合特征/>过程中具体公式如下:
;
,
其中代表身份矩阵,/>代表注意力编码,/> 代表c-3)中的第二卷积特征,dim()代表计算参数的维度,/>代表身份融合特征。
6.根据权利要求1所述基于注意力增强的智慧城市摄像头人脸识别方法,其特征是:步骤g)中身份鉴别器由Flatten函数、线性层和max函数构成,将身份特征输入Flatten函数和线性层中,得到身份分类特征/>将身份分类特征/>与姿势特征/>相加输入到max函数中,得到人脸识别结果R,R取值范围为/>,N为录入系统的人脸的数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410288916.5A CN117894058B (zh) | 2024-03-14 | 2024-03-14 | 基于注意力增强的智慧城市摄像头人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410288916.5A CN117894058B (zh) | 2024-03-14 | 2024-03-14 | 基于注意力增强的智慧城市摄像头人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117894058A CN117894058A (zh) | 2024-04-16 |
CN117894058B true CN117894058B (zh) | 2024-05-24 |
Family
ID=90645964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410288916.5A Active CN117894058B (zh) | 2024-03-14 | 2024-03-14 | 基于注意力增强的智慧城市摄像头人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117894058B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582044A (zh) * | 2020-04-15 | 2020-08-25 | 华南理工大学 | 基于卷积神经网络和注意力模型的人脸识别方法 |
CN112418074A (zh) * | 2020-11-20 | 2021-02-26 | 重庆邮电大学 | 一种基于自注意力的耦合姿态人脸识别方法 |
CN112766160A (zh) * | 2021-01-20 | 2021-05-07 | 西安电子科技大学 | 基于多级属性编码器和注意力机制的人脸替换方法 |
CN112801015A (zh) * | 2021-02-08 | 2021-05-14 | 华南理工大学 | 一种基于注意力机制的多模态人脸识别方法 |
CN112818850A (zh) * | 2021-02-01 | 2021-05-18 | 华南理工大学 | 基于渐进式神经网络和注意力机制的跨姿态人脸识别方法 |
CN112949565A (zh) * | 2021-03-25 | 2021-06-11 | 重庆邮电大学 | 基于注意力机制的单样本部分遮挡人脸识别方法及系统 |
CN114495210A (zh) * | 2022-01-07 | 2022-05-13 | 中北大学南通智能光机电研究院 | 一种基于注意力机制的姿态变化人脸识别方法 |
CN114550252A (zh) * | 2022-02-18 | 2022-05-27 | 北京工业大学 | 一种基于注意力机制的人脸识别方法 |
CN115527253A (zh) * | 2022-08-31 | 2022-12-27 | 广东工业大学 | 一种基于注意力机制的轻量级人脸表情识别方法和系统 |
CN115588218A (zh) * | 2022-08-31 | 2023-01-10 | 北京龙智数科科技服务有限公司 | 人脸识别方法及装置 |
CN116758621A (zh) * | 2023-08-21 | 2023-09-15 | 宁波沃尔斯软件有限公司 | 基于自注意力机制的遮挡人脸面部表情深度卷积识别方法 |
WO2023185243A1 (zh) * | 2022-03-29 | 2023-10-05 | 河南工业大学 | 基于注意力调制上下文空间信息的表情识别方法 |
CN116884074A (zh) * | 2023-07-25 | 2023-10-13 | 湖南大学 | 一种基于混合注意力机制的轻量级人脸识别方法 |
CN117456590A (zh) * | 2023-12-25 | 2024-01-26 | 天津生联智慧科技发展有限公司 | 一种针对智能城市应用的视觉转换的人脸识别方法及装置 |
-
2024
- 2024-03-14 CN CN202410288916.5A patent/CN117894058B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582044A (zh) * | 2020-04-15 | 2020-08-25 | 华南理工大学 | 基于卷积神经网络和注意力模型的人脸识别方法 |
CN112418074A (zh) * | 2020-11-20 | 2021-02-26 | 重庆邮电大学 | 一种基于自注意力的耦合姿态人脸识别方法 |
CN112766160A (zh) * | 2021-01-20 | 2021-05-07 | 西安电子科技大学 | 基于多级属性编码器和注意力机制的人脸替换方法 |
CN112818850A (zh) * | 2021-02-01 | 2021-05-18 | 华南理工大学 | 基于渐进式神经网络和注意力机制的跨姿态人脸识别方法 |
CN112801015A (zh) * | 2021-02-08 | 2021-05-14 | 华南理工大学 | 一种基于注意力机制的多模态人脸识别方法 |
CN112949565A (zh) * | 2021-03-25 | 2021-06-11 | 重庆邮电大学 | 基于注意力机制的单样本部分遮挡人脸识别方法及系统 |
CN114495210A (zh) * | 2022-01-07 | 2022-05-13 | 中北大学南通智能光机电研究院 | 一种基于注意力机制的姿态变化人脸识别方法 |
CN114550252A (zh) * | 2022-02-18 | 2022-05-27 | 北京工业大学 | 一种基于注意力机制的人脸识别方法 |
WO2023185243A1 (zh) * | 2022-03-29 | 2023-10-05 | 河南工业大学 | 基于注意力调制上下文空间信息的表情识别方法 |
CN115527253A (zh) * | 2022-08-31 | 2022-12-27 | 广东工业大学 | 一种基于注意力机制的轻量级人脸表情识别方法和系统 |
CN115588218A (zh) * | 2022-08-31 | 2023-01-10 | 北京龙智数科科技服务有限公司 | 人脸识别方法及装置 |
CN116884074A (zh) * | 2023-07-25 | 2023-10-13 | 湖南大学 | 一种基于混合注意力机制的轻量级人脸识别方法 |
CN116758621A (zh) * | 2023-08-21 | 2023-09-15 | 宁波沃尔斯软件有限公司 | 基于自注意力机制的遮挡人脸面部表情深度卷积识别方法 |
CN117456590A (zh) * | 2023-12-25 | 2024-01-26 | 天津生联智慧科技发展有限公司 | 一种针对智能城市应用的视觉转换的人脸识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
大数据在人脸识别在智慧城市的应用;孔越峰;;自动化与仪表;20200425(第04期);全文 * |
融合CNN与LSTM的网络质量KQI数据特征提取与投诉预警;蒋仕宝;杜翠凤;聂丹彤;;移动通信;20200215(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117894058A (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021042828A1 (zh) | 神经网络模型压缩的方法、装置、存储介质和芯片 | |
Ahmed et al. | Image splicing detection using mask-RCNN | |
Lin et al. | Hyperspectral image denoising via matrix factorization and deep prior regularization | |
CN108875935B (zh) | 基于生成对抗网络的自然图像目标材质视觉特征映射方法 | |
CN111582397B (zh) | 一种基于注意力机制的cnn-rnn图像情感分析方法 | |
CN112528830A (zh) | 一种结合迁移学习的轻量级cnn口罩人脸姿态分类方法 | |
CN114511576B (zh) | 尺度自适应特征增强深度神经网络的图像分割方法与系统 | |
CN111666873A (zh) | 一种基于多任务深度学习网络的训练方法、识别方法及系统 | |
WO2023000895A1 (zh) | 图像风格转换方法、装置、电子设备和存储介质 | |
CN111832650A (zh) | 基于生成对抗网络局部聚合编码半监督的图像分类方法 | |
CN113392711A (zh) | 一种基于高层语义与噪声抑制的烟雾语义分割方法及系统 | |
CN115019173A (zh) | 基于ResNet50的垃圾识别与分类方法 | |
Zheng et al. | T-net: Deep stacked scale-iteration network for image dehazing | |
CN114882278A (zh) | 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置 | |
CN112149526A (zh) | 一种基于长距离信息融合的车道线检测方法及系统 | |
Roy et al. | Classification of massive noisy image using auto-encoders and convolutional neural network | |
CN112016592B (zh) | 基于交叉领域类别感知的领域适应语义分割方法及装置 | |
CN113781324A (zh) | 一种老照片修复方法 | |
CN117576402A (zh) | 一种基于深度学习的多尺度聚合Transformer遥感图像语义分割方法 | |
CN117894058B (zh) | 基于注意力增强的智慧城市摄像头人脸识别方法 | |
Le et al. | Facial Detection in Low Light Environments Using OpenCV | |
CN111783688A (zh) | 一种基于卷积神经网络的遥感图像场景分类方法 | |
CN111209975A (zh) | 一种基于多任务学习的舰船目标识别方法 | |
CN113553917B (zh) | 一种基于脉冲迁移学习的办公设备识别方法 | |
Fang et al. | A New Method of Image Restoration Technology Based on WGAN. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |