CN108710831A - 一种基于机器视觉的小数据集人脸识别算法 - Google Patents
一种基于机器视觉的小数据集人脸识别算法 Download PDFInfo
- Publication number
- CN108710831A CN108710831A CN201810370703.1A CN201810370703A CN108710831A CN 108710831 A CN108710831 A CN 108710831A CN 201810370703 A CN201810370703 A CN 201810370703A CN 108710831 A CN108710831 A CN 108710831A
- Authority
- CN
- China
- Prior art keywords
- layer
- image
- face
- convolutional
- convolutional layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于机器视觉的小数据集人脸识别算法,包括步骤:1)数据集的构建与预处理;2)利用生成对抗网络为图像不足的类别生成虚拟图像;3)利用数据增强算法对所有类别图像进行数据扩充;4)利用卷积神经网络构建适合数据的模型;5)对设计的模型进行训练;6)利用摄像机获取目标图像,导入训练好的模型,再进行人脸识别。通过本发明算法可以对缺少人脸数据的应用场景进行高准确率的人脸识别。
Description
技术领域
本发明涉及图像模式识别的技术领域,尤其是指一种基于机器视觉的小数据集人脸识别算法。
背景技术
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。与虹膜,指纹等生物技术相比,其显著优势是人脸信息丰富,信息采集直观自然且非接触,并且可以远距离操作。因为公共安全,身份认证,数字娱乐产业等领域面部分析和建模的需求提升,人脸识别技术越来越受到学术界和工业界的重视。人脸识别的应用场景十分广泛,如重要通道出入口,大厦门禁系统,互联网登陆验证等,有些应用场景无法获取大量数据,那么一种基于小数据集的人脸识别算法显得尤为重要。本发明采用摄像头获取人脸,并载入小数据集训练的人脸识别模型,进行身份认证。
目前实现人脸识别算法有很多种,其中一种是基于机器学习的人脸识别算法。通过对人脸提取特征,再设计分类器进行识别,但受光照不均,人脸表情等的影响,对非限定条件下的人脸鲁棒性较差。另一种是基于通用深度学习方法。通过获取大量人脸数据,训练深度神经网络模型,再进行识别,准确率高且鲁棒性强,但是需要海量数据,超长的训练时间以及强大的硬件条件,特定应用场景无法满足。以上局限性使得目前的人脸识别方法难以适应非限制条件下小数据集的人脸识别需求。
综合以上论述,发明一种在小数据集前提下,适用非限制条件下人脸的识别方法具有较高的实际应用价值。
发明内容
本发明的目的在于克服现有技术的不足,提出了一种基于机器视觉的小数据集人脸识别算法,主要采用生成对抗网络为图像不足的类别补充数据,并利用数据增强算法扩充数据,再设计匹配数据集的深度神经网络模型,并训练,使人脸识别系统在小数据集的提前提下获得高准确率。
为实现上述目的,本发明所提供的技术方案为:一种基于机器视觉的小数据集人脸识别算法,包括以下步骤:
1)数据集的构建与预处理;
2)利用生成对抗网络为图像不足的类别生成虚拟图像;
3)利用数据增强算法对所有类别图像进行数据扩充;
4)利用卷积神经网络构建适合数据的模型;
5)对设计的模型进行训练;
6)利用摄像机获取目标图像,进行人脸识别。
在步骤1)中,采用实际场景中拍摄到的人脸图像集,即原始数据集,人脸图像集的特点是小且不均衡,图像总数量少,同时类别之间数据量差别大;采用现有机器学习库dlib人脸检测工具对原始图像实现人脸检测与人脸对齐,裁剪出目标人脸,以保证获取的图像满足人脸识别的要求,即取去除多余背景。
在步骤2)中,利用生成对抗网络为图像较少类别生成虚拟图像,包括以下步骤:
2.1)构建判别器
构建自编码器作为生成对抗网络的判别器;编码器由4类结构组成:卷积层结合elu激活层作为固定结构、下采样层、卷积层和全连接层;解码器由4种结构组成:全连接层、卷积层结合elu激活层作为固定结构、resize层和卷积层;编码器与解码器结合作为自编码器;
编码器网络结构为:
第一层由3个子层组成,每个子层为一个卷积层与一个激活层组成;
第二层为卷积层;
第三层为池化层;
第四层由2个子层组成,每个子层由一个卷积层与一个激活层组成;
第五层为卷积层;
第六层为池化层;
第七层由2个子层组成,每个子层为一个卷积层与一个激活层组成;
第八层为卷积层;
第九层为池化层;
第十层由2个子层组成,每个子层为一个卷积层与一个激活层组成;
第十一层为卷积层;
第十二层为池化层;
第十三层由2个子层组成,每个子层为一个卷积层与一个激活层组成;
第十四层为全连接层;
解码器结构为:
第一层为全连接层;
第二层改变输入的形状;
第三层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第四层为resize层改变图像大小;
第五层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第六层为resize层改变图像大小;
第七层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第八层resize层改变图像大小;
第九层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第十层resize层改变图像大小;
第十一层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第十一层为卷积层;
2.2)构建生成器
生成器结构与步骤2.1)中解码器相同;
2.3)设置损失函数
生成对抗网络的损失函数为:
L(v)=|v-D(v)|η
其中,L(v)为v的损失函数,v为图像的样本,D为自编码器函数,η取值1或者2;
LD=L(x)-kt·L(G(zD)) (2)
LG=L(G(zG)) (3)
kt+1=kt+λk(γL(x)-L(G(zG))) (4)
其中(2)~(3)式为平衡条件,即网络损失函数,LD为判别器损失函数,LG为生成器损失函数;L为(1)式,G为解码器函数,zD输入判别器的向量,维数为128,zG输入生成器的向量,维数为128;kt为比例因子,λk为k的比例增益,γ为生成器与判别器的均衡参数;
2.4)设置训练参数
使用Adam优化器优化网络,设置输入图像批次、学习率、衰减率、衰减速度。
在步骤3)中,利用数据增强算法对所有类别图像进行数据扩充,包括以下步骤:
3.1)随机改图像大小
将人脸转换为适合神经网络的输入,随机使用双线性插值、最近邻方法,双三次插值法和面积插值法将人脸图像转换为标准大小;
3.2)随机图像水平翻转
在训练过程中随机翻转图像;
3.3)随机图像片段获取
在保留所需人脸信息的情况下,随机减少部分背景信息;
3.4)随机图像色相调整
随机调整图像的亮度、对比度、饱和度和色相;
3.5)随机添加噪声干扰
为图像添加分布为N(0,1)的高斯噪声。
在步骤4)中,利用卷积神经网络构建适合数据的模型,包括以下步骤:
4.1)结合数据选取构建模型,模型包括多个残差模块、卷积层、下采样层、随机失活层;
输入图像在进行步骤3)后输入深度残差神经网络;
第一层为卷积层;
第二层为最大池化层;
第三层为连续三个相同残差块,若残差块输入为x,输出为H(BN(x))=F(BN(x))+S(BN(x)),其中x为block的输入,BN(x)表示对x进行批标准化,F(x)为多层卷积结构;
第四层残差块结构与第三层残差块结构相同;
第五层残差块结构与第三层残差块结构相同;
第六层残差块结构与第三层残差块结构相同;
第七层为平均池化层;
第八层为随机失活层,公式如下
r(l)~Bernoulli(p)
y~(l)=r(l)·y(l)
其中,r(l)服从概率为p的伯努利分布,y(l)为第l层的激活值,y~(l)为第l层的输出值,为第l+1层的网络权值,bi (l+1)为第l+1层的偏置,为第l+1层的隐藏层输入,f(·)为激活函数;
第九层为卷积层,卷积核为(1,1),滤波器数量为类别数量n,输出为1×1×n;
4.2)设置损失函数
设置交叉熵函数与中心损失函数,交叉熵损失函数如下:
其中,y’为真实的概率分布,即标签的one-hot编码,y是预测的概率分布,即网络残差网络输出,大小为1×1×n;
中心损失函数取第七层输出为深度特征,公式如下:
其中,Lc为中心损失,xi为类别的深度特征,为第i类深度特征中心,m表示mini-batch的大小,为避免错误的标记样本对训练样本造成干扰,采用a来控制特征中心的学习速率,Lc关于xi的导数与的更新如下式:
其中,δ(条件),若条件为真,则δ(条件)为1,否则为0;网络取出全局池化层的特征作为类别深度特征,该特征为2048维的向量,整个网络的损失函数定义式如下:
L=Ls+λLc
其中,Ls为交叉熵损失函数,λ为标量,用于平衡两种损失函数。
在步骤5)中,对模型改进后的模型进行训练,包括以下步骤:
5.1)设置训练参数
设置实验优化器为Adam,学习率、衰减率、衰减速度、批次大小、dropout层的失活概率、中心损失的中心学习率、中心损失函数的权重系数。
5.2)设置训练完成标志
设置验证集实时检测模型训练情况,训练完成标志为已达迭代次数或验证集准确率得到满足。
在步骤6)中,首先利用摄像头获取实时人脸图像,利用机器视觉库dlib进行人脸检测,导入步骤5)训练完成的模型进行预测。
本发明与现有技术相比,具有如下优点与有益效果:
1、使用生成对抗网络与数据增强算法对图片类别进行扩充以满足数据量少的人脸应用场景。
2、采用多种简单实用的技巧改进网络,有效解决了深度神经网络容易过拟合的缺点。
3、对小数据集进行数据扩充并改进网络,使网络容量与数据量匹配,大大减少了模型训练时间。
4、可以对数据量少且数据不均衡的人脸识别应用场景提供高准确率的人脸识别系统。
附图说明
图1为本发明算法流程图。
图2为残差网络训练流程图。
图3为生成对抗网络效果图,其中(a)为中间结果,(b)为生成结果。
图4为数据增强效果图,其中(a)为色彩变化,(b)为随机截取和水平翻转,(c)为图像增强算法效果。
图5为模型损失连接图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
如图1和图2所示,本实施例所提供的基于机器视觉的小数据集人脸识别算法,包括以下步骤:
1)数据集的构建与预处理
采用实际场景中拍摄到的人脸图像集,即原始数据集。人脸图像集的特点是小且不均衡,图像总数量较少,同时类别之间数据量差别很大。采用现有机器学习库dlib人脸检测工具对原始图像实现人脸检测与人脸对齐,裁剪出目标人脸,以保证获取的图像满足人脸识别的基本要求,即取去除多余背景。
2)利用生成对抗网络为图像较少类别生成虚拟图像,如图3所示,包括以下步骤:
2.1)构建判别器
构建输入图像大小为128×128×3、特征层为128的自编码器作为生成对抗网络的判别器。编码器由4个结构组成:卷积层结合elu激活层作为固定结构,下采样层,卷积层和全连接层,其具体操作将图像转换为1×1×128的特征。解码器由4种结构组成,全连接层,卷积层结合elu激活层作为固定结构,resize层和卷积层。编码器与解码器结合作为自编码器。
编码器网络结构为:
网络输入为128×128×3的图像。
第一层由3个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为128个,进行补零操作,输出为128×128×128。
第二层为卷积层,卷积核为(3,3),步长为1,滤波器为256个,进行补零操作,输出为128×128×256。
第三层为池化层,池化核为(2,2),步长为1,输出为64×64×256。
第四层由2个子层组成,每个子层由一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为256个,进行补零操作,输出为64×64×256。
第五层为卷积层,卷积核为(3,3),步长为1,滤波器为384个,进行补零操作,输出为64×64×384。
第六层为池化层,池化核为(2,2),步长为1,输出为32×32×384。
第七层由2个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为384个,进行补零操作,输出为32×32×384。
第八层为卷积层,卷积核为(3,3),步长为1,滤波器为512个,进行补零操作,输出为32×32×512。
第九层为池化层,池化核为(2,2),步长为1,输出为16×16×512。
第十层由2个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为512个,进行补零操作,输出为16×16×512。
第十一层为卷积层,卷积核为(3,3),步长为1,滤波器为640个,进行补零操作,输出为16×16×640。
第十二层为池化层,池化核为(2,2),步长为1,输出为8×8×640。
第十三层由2个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为640个,进行补零操作,输出为8×8×640。
第十四层为全连接层,输出为1×128。
解码器结构为:
网络输入为1×128的向量。
第一层为全连接层,输出为1×8192。
第二层改变输入的形状,输出为8×8×128。
第三层由两个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为128个,进行补零操作,输出为8×8×128。
第四层为resize层改变图像大小,输出为16×16×128。
第五层由两个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为128个,进行补零操作,输出为16×16×128。
第六层为resize层改变图像大小,输出为32×32×128。
第七层由两个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为128个,进行补零操作,输出为32×32×128。
第八层resize层改变图像大小,输出为64×64×128。
第九层由两个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为128个,进行补零操作,输出为64×64×128。
第十层resize层改变图像大小,输出为128×128×128。
第十一层由两个子层组成,每个子层为一个卷积层与一个激活层组成。其中卷积层的卷积核为(3,3),步长为1,滤波器为128个,进行补零操作,输出为128×128×128。
第十一层为卷积层,卷积核为(3,3),步长为1,滤波器为3个,进行补零操作,输出大小为图像128×128×3。
2.2)构建生成器
生成器结构与步骤2.1)中解码器相同。
2.3)设置损失函数
生成对抗网络的损失函数为
L(v)=|v-D(v)|η
其中L(v)为v的损失函数,v为图像的样本,D为自编码器函数,η取值1或者2。
LD=L(x)-kt·L(G(zD)) (2)
LG=L(G(zG)) (3)
kt+1=kt+λk(γL(x)-L(G(zG))) (4)
其中(2)~(3)式为平衡条件,即网络损失函数,LD为判别器损失函数,LG为生成器损失函数。L为(1)式,G为解码器函数,zD输入判别器的向量,维数为128,zG输入生成器的向量,维数为128。kt为比例因子,λk为k的比例增益,γ为生成器与判别器的均衡参数。
2.4)设置训练参数
使用Adam优化器优化网络,设置输入图像批次为16,学习率为0.0001,衰减率为0.95,衰减速度为2k。
3)利用数据增强算法对所有类别图像进行数据扩充,如图4所示,包括以下步骤:
3.1)随机改图像大小
将人脸转换为适合神经网络的输入,随机使用双线性插值、最近邻方法,双三次插值法和面积插值法将人脸图像转换为标准大小。
3.2)随机图像水平翻转
在训练过程中随机翻转图像。
3.3)随机图像片段获取
在保留足够人脸信息的情况下,随机减少部分背景信息。
3.4)随机图像色相调整
随机调整图像的亮度,对比度,饱和度和色相。
3.5)随机添加噪声干扰
为图像添加分布为N(0,1)的高斯噪声。
4)利用卷积神经网络构建适合数据的模型,包括以下步骤:
4.1)结合数据选取构建模型。模型主要由多个残差模块,卷积层,下采样层,随机失活层等组成。
输入图像为224×224×3,进行步骤3)后输入深度残差神经网络。
第一层为卷积层,卷积核为(7,7),步长为2,滤波器数量为64,输出为112×112×64。
第二层为最大池化层,池化核为(2,2),步长为2,输出为56×56×64。
第三层为连续三个相同残差块,若残差块输入为x,输出为H(BN(x))=F(BN(x))+S(BN(x)),其中x为block的输入,BN(x)表示对x进行批标准化。F(x)为多层卷积结构,第一层为核(1,1),滤波器64,第二层为核(3,3),滤波器64,第三层为核(1,1),滤波器256。S(x)为卷积操作,作用是令x与F(x)通道数相同,最后输出为56×56×256。
第四层残差块结构与第三层残差块结构相同,但F(x)为多层卷积结构有所改变,即第一层为核(1,1),滤波器128,第二层为核(3,3),滤波器128,第三层为核(1,1),滤波器512,连续4个上述残差块为第四层,最后输出为28×28×512。
第五层残差块结构与第三层残差块结构相同,但F(x)为多层卷积结构有所改变,即第一层为核(1,1),滤波器256,第二层为核(3,3),滤波器256,第三层为核(1,1),滤波器1024,连续6个上述残差块为第五层,最后输出为14×14×1024。
第六层残差块结构与第三层残差块结构相同,但F(x)为多层卷积结构有所改变,即第一层为核(1,1),滤波器512,第二层为核(3,3),滤波器512,第三层为核(1,1),滤波器512,连续3个上述残差块为第六层,最后输出为7×7×2048。
第七层为平均池化层,池化核为(7,7),步长为7,输出为1×1×2048
第八层为随机失活层,公式如下
r(l)~Bernoulli(p)
y~(l)=r(l)·y(l)
其中r(l)服从概率为p的伯努利分布,y(l)为第l层的激活值,y~(l)为第l层的输出值,为第l+1层的网络权值,bi (l+1)为第l+1层的偏置。为第l+1层的隐藏层输入,f(·)为激活函数。
第九层为卷积层,卷积核为(1,1),滤波器数量为类别数量n,输出为1×1×n。
4.2)设置损失函数
设置交叉熵函数与中心损失函数,交叉熵损失函数如下:
其中y’为真实的概率分布,即标签的one-hot编码,y是预测的概率分布。即网络残差网络输出(大小为1×1×n)。
中心损失函数取第七层输出为深度特征,公式如下:
其中,Lc为中心损失,xi为类别的深度特征,为第i类深度特征中心。m表示mini-batch的大小。为避免错误的标记样本对训练样本造成严重干扰,采用a来控制特征中心的学习速率。Lc关于xi的导数与的更新如下式:
其中,δ(条件),若条件为真,则δ(条件)为1,否则为0。本文的网络取出全局池化层的特征作为类别深度特征,该特征为2048维的向量。整个网络的损失函数定义式如下,损失连接图如图5所示:
L=Ls+λLc
其中,Ls为交叉熵损失函数,λ为标量,用于平衡两种损失函数。
5)对模型改进后的模型进行训练,包括以下步骤:
5.1)设置训练参数
设置实验优化器为Adam,学习率为0.001,衰减率为0.95,衰减速度为10K,批次大小为64张。dropout层的失活概率为0.5,中心损失的中心学习率为0.5,中心损失函数的权重系数为0.003。
5.2)设置训练完成标志
设置验证集实时检测模型训练情况,训练完成标志为已达迭代次数或验证集准确率得到满足。
6)利用摄像头获取实时人脸图像,利用机器视觉库dlib进行人脸检测,导入步骤5)训练完成的模型进行预测。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (7)
1.一种基于机器视觉的小数据集人脸识别算法,其特征在于,包括以下步骤:
1)数据集的构建与预处理;
2)利用生成对抗网络为图像不足的类别生成虚拟图像;
3)利用数据增强算法对所有类别图像进行数据扩充;
4)利用卷积神经网络构建适合数据的模型;
5)对设计的模型进行训练;
6)利用摄像机获取目标图像,进行人脸识别。
2.根据权利要求1所述的一种基于机器视觉的小数据集人脸识别算法,其特征在于:在步骤1)中,采用实际场景中拍摄到的人脸图像集,即原始数据集,人脸图像集的特点是小且不均衡,图像总数量少,同时类别之间数据量差别大;采用现有机器学习库dlib人脸检测工具对原始图像实现人脸检测与人脸对齐,裁剪出目标人脸,以保证获取的图像满足人脸识别的要求,即取去除多余背景。
3.根据权利要求1所述的一种基于机器视觉的小数据集人脸识别算法,其特征在于,在步骤2)中,利用生成对抗网络为图像较少类别生成虚拟图像,包括以下步骤:
2.1)构建判别器
构建自编码器作为生成对抗网络的判别器;编码器由4类结构组成:卷积层结合elu激活层作为固定结构、下采样层、卷积层和全连接层;解码器由4种结构组成:全连接层、卷积层结合elu激活层作为固定结构、resize层和卷积层;编码器与解码器结合作为自编码器;
编码器网络结构为:
第一层由3个子层组成,每个子层为一个卷积层与一个激活层组成;
第二层为卷积层;
第三层为池化层;
第四层由2个子层组成,每个子层由一个卷积层与一个激活层组成;
第五层为卷积层;
第六层为池化层;
第七层由2个子层组成,每个子层为一个卷积层与一个激活层组成;
第八层为卷积层;
第九层为池化层;
第十层由2个子层组成,每个子层为一个卷积层与一个激活层组成;
第十一层为卷积层;
第十二层为池化层;
第十三层由2个子层组成,每个子层为一个卷积层与一个激活层组成;
第十四层为全连接层;
解码器结构为:
第一层为全连接层;
第二层改变输入的形状;
第三层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第四层为resize层改变图像大小;
第五层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第六层为resize层改变图像大小;
第七层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第八层resize层改变图像大小;
第九层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第十层resize层改变图像大小;
第十一层由两个子层组成,每个子层为一个卷积层与一个激活层组成;
第十一层为卷积层;
2.2)构建生成器
生成器结构与步骤2.1)中解码器相同;
2.3)设置损失函数
生成对抗网络的损失函数为:
L(v)=|v-D(v)|η
其中,L(v)为v的损失函数,v为图像的样本,D为自编码器函数,η取值1或者2;
LD=L(x)-kt·L(G(zD)) (2)
LG=L(G(zG)) (3)
kt+1=kt+λk(γL(x)-L(G(zG))) (4)
其中(2)~(3)式为平衡条件,即网络损失函数,LD为判别器损失函数,LG为生成器损失函数;L为(1)式,G为解码器函数,zD输入判别器的向量,维数为128,zG输入生成器的向量,维数为128;kt为比例因子,λk为k的比例增益,γ为生成器与判别器的均衡参数;
2.4)设置训练参数
使用Adam优化器优化网络,设置输入图像批次、学习率、衰减率、衰减速度。
4.根据权利要求1所述的一种基于机器视觉的小数据集人脸识别算法,其特征在于,在步骤3)中,利用数据增强算法对所有类别图像进行数据扩充,包括以下步骤:
3.1)随机改图像大小
将人脸转换为适合神经网络的输入,随机使用双线性插值、最近邻方法,双三次插值法和面积插值法将人脸图像转换为标准大小;
3.2)随机图像水平翻转
在训练过程中随机翻转图像;
3.3)随机图像片段获取
在保留所需人脸信息的情况下,随机减少部分背景信息;
3.4)随机图像色相调整
随机调整图像的亮度、对比度、饱和度和色相;
3.5)随机添加噪声干扰
为图像添加分布为N(0,1)的高斯噪声。
5.根据权利要求1所述的一种基于机器视觉的小数据集人脸识别算法,其特征在于,在步骤4)中,利用卷积神经网络构建适合数据的模型,包括以下步骤:
4.1)结合数据选取构建模型,模型包括多个残差模块、卷积层、下采样层、随机失活层;
输入图像在进行步骤3)后输入深度残差神经网络;
第一层为卷积层;
第二层为最大池化层;
第三层为连续三个相同残差块,若残差块输入为x,输出为H(BN(x))=F(BN(x))+S(BN(x)),其中x为block的输入,BN(x)表示对x进行批标准化,F(x)为多层卷积结构;
第四层残差块结构与第三层残差块结构相同;
第五层残差块结构与第三层残差块结构相同;
第六层残差块结构与第三层残差块结构相同;
第七层为平均池化层;
第八层为随机失活层,公式如下
r(l)~Bernoulli(p)
y~(l)=r(l)·y(l)
其中,r(l)服从概率为p的伯努利分布,y(l)为第l层的激活值,y~(l)为第l层的输出值,为第l+1层的网络权值,bi (l+1)为第l+1层的偏置,为第l+1层的隐藏层输入,f(·)为激活函数;
第九层为卷积层,卷积核为(1,1),滤波器数量为类别数量n,输出为1×1×n;
4.2)设置损失函数
设置交叉熵函数与中心损失函数,交叉熵损失函数如下:
其中,y'为真实的概率分布,即标签的one-hot编码,y是预测的概率分布,即网络残差网络输出,大小为1×1×n;
中心损失函数取第七层输出为深度特征,公式如下:
其中,Lc为中心损失,xi为类别的深度特征,为第i类深度特征中心,m表示mini-batch的大小,为避免错误的标记样本对训练样本造成干扰,采用a来控制特征中心的学习速率,Lc关于xi的导数与的更新如下式:
其中,δ(条件),若条件为真,则δ(条件)为1,否则为0;网络取出全局池化层的特征作为类别深度特征,该特征为2048维的向量,整个网络的损失函数定义式如下:
L=Ls+λLc
其中,Ls为交叉熵损失函数,λ为标量,用于平衡两种损失函数。
6.根据权利要求1所述的一种基于机器视觉的小数据集人脸识别算法,其特征在于,在步骤5)中,对模型改进后的模型进行训练,包括以下步骤:
5.1)设置训练参数
设置实验优化器为Adam,学习率、衰减率、衰减速度、批次大小、dropout层的失活概率、中心损失的中心学习率、中心损失函数的权重系数;
5.2)设置训练完成标志
设置验证集实时检测模型训练情况,训练完成标志为已达迭代次数或验证集准确率得到满足。
7.根据权利要求1所述的一种基于机器视觉的小数据集人脸识别算法,其特征在于,在步骤6)中,首先利用摄像头获取实时人脸图像,利用机器视觉库dlib进行人脸检测,导入步骤5)训练完成的模型进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810370703.1A CN108710831B (zh) | 2018-04-24 | 2018-04-24 | 一种基于机器视觉的小数据集人脸识别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810370703.1A CN108710831B (zh) | 2018-04-24 | 2018-04-24 | 一种基于机器视觉的小数据集人脸识别算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108710831A true CN108710831A (zh) | 2018-10-26 |
CN108710831B CN108710831B (zh) | 2021-09-21 |
Family
ID=63867399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810370703.1A Active CN108710831B (zh) | 2018-04-24 | 2018-04-24 | 一种基于机器视觉的小数据集人脸识别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108710831B (zh) |
Cited By (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109522877A (zh) * | 2018-12-14 | 2019-03-26 | 睿云联(厦门)网络通讯技术有限公司 | 一种基于安卓设备的离线多人脸识别方法以及计算机设备 |
CN109635634A (zh) * | 2018-10-29 | 2019-04-16 | 西北大学 | 一种基于随机线性插值的行人再识别数据增强方法 |
CN109670491A (zh) * | 2019-02-25 | 2019-04-23 | 百度在线网络技术(北京)有限公司 | 鉴别人脸图像的方法、装置、设备和存储介质 |
CN109740413A (zh) * | 2018-11-14 | 2019-05-10 | 平安科技(深圳)有限公司 | 行人重识别方法、装置、计算机设备及计算机存储介质 |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN109829907A (zh) * | 2019-01-31 | 2019-05-31 | 浙江工业大学 | 一种基于深度学习的金属轴表面缺陷识别方法 |
CN109886210A (zh) * | 2019-02-25 | 2019-06-14 | 百度在线网络技术(北京)有限公司 | 一种交通图像识别方法、装置、计算机设备和介质 |
CN109886852A (zh) * | 2019-02-27 | 2019-06-14 | 江苏艾什顿科技有限公司 | 人脸检测识别能力培训方法、装置、设备、介质及系统 |
CN110135349A (zh) * | 2019-05-16 | 2019-08-16 | 北京小米智能科技有限公司 | 识别方法、装置、设备及存储介质 |
CN110148081A (zh) * | 2019-03-25 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、图像处理方法、装置及存储介质 |
CN110188824A (zh) * | 2019-05-31 | 2019-08-30 | 重庆大学 | 一种小样本植物病害识别方法及系统 |
CN110222757A (zh) * | 2019-05-31 | 2019-09-10 | 华北电力大学(保定) | 基于生成对抗网络的绝缘子图像样本扩充方法、系统 |
CN110287767A (zh) * | 2019-05-06 | 2019-09-27 | 深圳市华付信息技术有限公司 | 可防攻击的活体检测方法、装置、计算机设备及存储介质 |
CN110309713A (zh) * | 2019-05-22 | 2019-10-08 | 深圳壹账通智能科技有限公司 | 表情识别模型训练方法、装置、设备和存储介质 |
CN110348376A (zh) * | 2019-07-09 | 2019-10-18 | 华南理工大学 | 一种基于神经网络的行人实时检测方法 |
CN110363183A (zh) * | 2019-07-30 | 2019-10-22 | 贵州大学 | 基于生成式对抗网络的服务机器人视觉图片隐私保护方法 |
CN110689066A (zh) * | 2019-09-24 | 2020-01-14 | 成都考拉悠然科技有限公司 | 一种人脸识别数据均衡与增强相结合的训练方法 |
CN111091059A (zh) * | 2019-11-19 | 2020-05-01 | 佛山市南海区广工大数控装备协同创新研究院 | 一种生活垃圾塑料瓶分类中的数据均衡方法 |
CN111307925A (zh) * | 2020-03-06 | 2020-06-19 | 山东省分析测试中心 | 一种温度控制不连续冻肉的鉴别方法和系统 |
CN111310591A (zh) * | 2020-01-20 | 2020-06-19 | 复旦大学 | 多类型样本数据制作装置及方法 |
CN111369503A (zh) * | 2020-02-25 | 2020-07-03 | 东南大学 | 一种基于卷积神经网络对图像中的铅笔进行精确计数的方法 |
CN111382743A (zh) * | 2018-12-28 | 2020-07-07 | 上海大学 | 基于数据增强和数据生成的车牌字符识别方法 |
CN111376910A (zh) * | 2018-12-29 | 2020-07-07 | 北京嘀嘀无限科技发展有限公司 | 用户行为的识别方法、识别系统及计算机设备 |
CN111537565A (zh) * | 2020-03-27 | 2020-08-14 | 上海交通大学 | 化学传感器定量检测结果预测模型形成方法及检测方法 |
CN111582225A (zh) * | 2020-05-19 | 2020-08-25 | 长沙理工大学 | 一种遥感图像场景分类方法及装置 |
CN111639589A (zh) * | 2020-05-28 | 2020-09-08 | 西北工业大学 | 基于对抗学习和类颜色空间的视频虚假人脸检测方法 |
CN111899193A (zh) * | 2020-07-30 | 2020-11-06 | 湖北工业大学 | 一种基于低照度图像增强算法的刑侦摄影系统及方法 |
CN112016480A (zh) * | 2020-08-31 | 2020-12-01 | 中移(杭州)信息技术有限公司 | 人脸特征表示方法、系统、电子设备和存储介质 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
CN112330526A (zh) * | 2019-08-05 | 2021-02-05 | 深圳Tcl新技术有限公司 | 一种人脸转换模型的训练方法、存储介质及终端设备 |
CN112464912A (zh) * | 2020-12-22 | 2021-03-09 | 杭州电子科技大学 | 基于YOLO-RGGNet的机器人端人脸检测方法 |
CN112712138A (zh) * | 2021-01-19 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN113011370A (zh) * | 2021-03-31 | 2021-06-22 | 重庆理工大学 | 一种基于深度学习的多状态人脸识别方法 |
CN113392757A (zh) * | 2021-06-11 | 2021-09-14 | 恒睿(重庆)人工智能技术研究院有限公司 | 使用不均衡数据训练人体检测模型的方法及装置、介质 |
CN113536270A (zh) * | 2021-07-26 | 2021-10-22 | 网易(杭州)网络有限公司 | 一种信息验证的方法、装置、计算机设备及存储介质 |
CN113673509A (zh) * | 2021-07-28 | 2021-11-19 | 华南理工大学 | 一种基于图像文本的仪表检测分类方法 |
CN113780084A (zh) * | 2021-08-11 | 2021-12-10 | 上海藤核智能科技有限公司 | 基于生成式对抗网络的人脸数据扩增方法、电子设备和存储介质 |
CN113792669A (zh) * | 2021-09-16 | 2021-12-14 | 大连理工大学 | 一种基于层次化自注意力网络的行人重识别基线方法 |
CN114155573A (zh) * | 2021-11-05 | 2022-03-08 | 上海弘目智能科技有限公司 | 基于SE-ResNet网络的人种识别方法、装置及计算机存储介质 |
CN114359677A (zh) * | 2021-12-30 | 2022-04-15 | 北京超维景生物科技有限公司 | 处理图像序列的方法及装置 |
CN114448733A (zh) * | 2022-04-11 | 2022-05-06 | 广州易道智慧信息科技有限公司 | 虚拟机器视觉系统的加密传输模型训练方法及加解密方法 |
CN114781483A (zh) * | 2022-03-18 | 2022-07-22 | 华南理工大学 | 一种基于卷积神经网络的草菇生长状态识别方法 |
CN115690758A (zh) * | 2022-12-12 | 2023-02-03 | 吉林农业大学 | 一种基于深度度量学习的茶脸验真方法及验真系统 |
CN116281479A (zh) * | 2023-04-04 | 2023-06-23 | 南京枫火网络科技有限公司 | 一种基于物联网的电梯故障监测方法及系统 |
CN116738296A (zh) * | 2023-08-14 | 2023-09-12 | 大有期货有限公司 | 机房状况综合智能监控系统 |
CN117649677A (zh) * | 2022-08-20 | 2024-03-05 | 南京视察者智能科技有限公司 | 一种基于3d生成对抗网络的域适应行人重识别方法 |
CN118096586A (zh) * | 2023-09-13 | 2024-05-28 | 哈尔滨工业大学重庆研究院 | 基于残差结构编码器解码器架构的视频人脸隐私保护方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8510703B1 (en) * | 2005-04-01 | 2013-08-13 | Cadence Design Systems, Inc. | Method and mechanism for implementing PCB routing |
CN107292813A (zh) * | 2017-05-17 | 2017-10-24 | 浙江大学 | 一种基于生成对抗网络的多姿态人脸生成方法 |
CN107507250A (zh) * | 2017-06-02 | 2017-12-22 | 北京工业大学 | 一种基于卷积神经网络的面色舌色图像颜色校正方法 |
CN107609481A (zh) * | 2017-08-14 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 为人脸识别生成训练数据的方法、装置和计算机存储介质 |
CN107944358A (zh) * | 2017-11-14 | 2018-04-20 | 华南理工大学 | 一种基于深度卷积对抗网络模型的人脸生成方法 |
-
2018
- 2018-04-24 CN CN201810370703.1A patent/CN108710831B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8510703B1 (en) * | 2005-04-01 | 2013-08-13 | Cadence Design Systems, Inc. | Method and mechanism for implementing PCB routing |
CN107292813A (zh) * | 2017-05-17 | 2017-10-24 | 浙江大学 | 一种基于生成对抗网络的多姿态人脸生成方法 |
CN107507250A (zh) * | 2017-06-02 | 2017-12-22 | 北京工业大学 | 一种基于卷积神经网络的面色舌色图像颜色校正方法 |
CN107609481A (zh) * | 2017-08-14 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 为人脸识别生成训练数据的方法、装置和计算机存储介质 |
CN107944358A (zh) * | 2017-11-14 | 2018-04-20 | 华南理工大学 | 一种基于深度卷积对抗网络模型的人脸生成方法 |
Non-Patent Citations (1)
Title |
---|
刘彬: "基于卷积神经网络的SAR图像目标检测及分类方法研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635634A (zh) * | 2018-10-29 | 2019-04-16 | 西北大学 | 一种基于随机线性插值的行人再识别数据增强方法 |
CN109635634B (zh) * | 2018-10-29 | 2023-03-31 | 西北大学 | 一种基于随机线性插值的行人再识别数据增强方法 |
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109740413A (zh) * | 2018-11-14 | 2019-05-10 | 平安科技(深圳)有限公司 | 行人重识别方法、装置、计算机设备及计算机存储介质 |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN109522877A (zh) * | 2018-12-14 | 2019-03-26 | 睿云联(厦门)网络通讯技术有限公司 | 一种基于安卓设备的离线多人脸识别方法以及计算机设备 |
CN111382743B (zh) * | 2018-12-28 | 2023-05-26 | 上海大学 | 基于数据增强和数据生成的车牌字符识别方法 |
CN111382743A (zh) * | 2018-12-28 | 2020-07-07 | 上海大学 | 基于数据增强和数据生成的车牌字符识别方法 |
CN111376910A (zh) * | 2018-12-29 | 2020-07-07 | 北京嘀嘀无限科技发展有限公司 | 用户行为的识别方法、识别系统及计算机设备 |
CN109829907A (zh) * | 2019-01-31 | 2019-05-31 | 浙江工业大学 | 一种基于深度学习的金属轴表面缺陷识别方法 |
CN109670491A (zh) * | 2019-02-25 | 2019-04-23 | 百度在线网络技术(北京)有限公司 | 鉴别人脸图像的方法、装置、设备和存储介质 |
CN109886210B (zh) * | 2019-02-25 | 2022-07-19 | 百度在线网络技术(北京)有限公司 | 一种交通图像识别方法、装置、计算机设备和介质 |
CN109886210A (zh) * | 2019-02-25 | 2019-06-14 | 百度在线网络技术(北京)有限公司 | 一种交通图像识别方法、装置、计算机设备和介质 |
CN109886852A (zh) * | 2019-02-27 | 2019-06-14 | 江苏艾什顿科技有限公司 | 人脸检测识别能力培训方法、装置、设备、介质及系统 |
US11935166B2 (en) | 2019-03-25 | 2024-03-19 | Tencent Technology (Shenzhen) Company Limited | Training method and apparatus for image processing model, image processing method and apparatus for image processing model, and storage medium |
CN110148081B (zh) * | 2019-03-25 | 2024-02-23 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、图像处理方法、装置及存储介质 |
CN110148081A (zh) * | 2019-03-25 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、图像处理方法、装置及存储介质 |
WO2020192704A1 (zh) * | 2019-03-25 | 2020-10-01 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、图像处理方法、装置及存储介质 |
CN110287767A (zh) * | 2019-05-06 | 2019-09-27 | 深圳市华付信息技术有限公司 | 可防攻击的活体检测方法、装置、计算机设备及存储介质 |
CN110135349A (zh) * | 2019-05-16 | 2019-08-16 | 北京小米智能科技有限公司 | 识别方法、装置、设备及存储介质 |
CN110309713A (zh) * | 2019-05-22 | 2019-10-08 | 深圳壹账通智能科技有限公司 | 表情识别模型训练方法、装置、设备和存储介质 |
WO2020233368A1 (zh) * | 2019-05-22 | 2020-11-26 | 深圳壹账通智能科技有限公司 | 表情识别模型训练方法、装置、设备和存储介质 |
CN110222757A (zh) * | 2019-05-31 | 2019-09-10 | 华北电力大学(保定) | 基于生成对抗网络的绝缘子图像样本扩充方法、系统 |
CN110188824A (zh) * | 2019-05-31 | 2019-08-30 | 重庆大学 | 一种小样本植物病害识别方法及系统 |
CN110348376A (zh) * | 2019-07-09 | 2019-10-18 | 华南理工大学 | 一种基于神经网络的行人实时检测方法 |
CN110348376B (zh) * | 2019-07-09 | 2021-05-14 | 华南理工大学 | 一种基于神经网络的行人实时检测方法 |
CN110363183B (zh) * | 2019-07-30 | 2020-05-08 | 贵州大学 | 基于生成式对抗网络的服务机器人视觉图片隐私保护方法 |
CN110363183A (zh) * | 2019-07-30 | 2019-10-22 | 贵州大学 | 基于生成式对抗网络的服务机器人视觉图片隐私保护方法 |
CN112330526A (zh) * | 2019-08-05 | 2021-02-05 | 深圳Tcl新技术有限公司 | 一种人脸转换模型的训练方法、存储介质及终端设备 |
CN112330526B (zh) * | 2019-08-05 | 2024-02-09 | 深圳Tcl新技术有限公司 | 一种人脸转换模型的训练方法、存储介质及终端设备 |
CN110689066A (zh) * | 2019-09-24 | 2020-01-14 | 成都考拉悠然科技有限公司 | 一种人脸识别数据均衡与增强相结合的训练方法 |
CN111091059A (zh) * | 2019-11-19 | 2020-05-01 | 佛山市南海区广工大数控装备协同创新研究院 | 一种生活垃圾塑料瓶分类中的数据均衡方法 |
CN111310591A (zh) * | 2020-01-20 | 2020-06-19 | 复旦大学 | 多类型样本数据制作装置及方法 |
CN111369503A (zh) * | 2020-02-25 | 2020-07-03 | 东南大学 | 一种基于卷积神经网络对图像中的铅笔进行精确计数的方法 |
CN111307925A (zh) * | 2020-03-06 | 2020-06-19 | 山东省分析测试中心 | 一种温度控制不连续冻肉的鉴别方法和系统 |
CN111537565A (zh) * | 2020-03-27 | 2020-08-14 | 上海交通大学 | 化学传感器定量检测结果预测模型形成方法及检测方法 |
CN111582225A (zh) * | 2020-05-19 | 2020-08-25 | 长沙理工大学 | 一种遥感图像场景分类方法及装置 |
CN111582225B (zh) * | 2020-05-19 | 2023-06-20 | 长沙理工大学 | 一种遥感图像场景分类方法及装置 |
CN111639589B (zh) * | 2020-05-28 | 2022-04-19 | 西北工业大学 | 基于对抗学习和类颜色空间的视频虚假人脸检测方法 |
CN111639589A (zh) * | 2020-05-28 | 2020-09-08 | 西北工业大学 | 基于对抗学习和类颜色空间的视频虚假人脸检测方法 |
CN111899193B (zh) * | 2020-07-30 | 2024-06-14 | 湖北工业大学 | 一种基于低照度图像增强算法的刑侦摄影系统及方法 |
CN111899193A (zh) * | 2020-07-30 | 2020-11-06 | 湖北工业大学 | 一种基于低照度图像增强算法的刑侦摄影系统及方法 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
CN112016480B (zh) * | 2020-08-31 | 2024-05-28 | 中移(杭州)信息技术有限公司 | 人脸特征表示方法、系统、电子设备和存储介质 |
CN112016480A (zh) * | 2020-08-31 | 2020-12-01 | 中移(杭州)信息技术有限公司 | 人脸特征表示方法、系统、电子设备和存储介质 |
CN112464912A (zh) * | 2020-12-22 | 2021-03-09 | 杭州电子科技大学 | 基于YOLO-RGGNet的机器人端人脸检测方法 |
CN112464912B (zh) * | 2020-12-22 | 2024-02-09 | 杭州电子科技大学 | 基于YOLO-RGGNet的机器人端人脸检测方法 |
CN112712138A (zh) * | 2021-01-19 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN112712138B (zh) * | 2021-01-19 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN113011370A (zh) * | 2021-03-31 | 2021-06-22 | 重庆理工大学 | 一种基于深度学习的多状态人脸识别方法 |
CN113392757B (zh) * | 2021-06-11 | 2023-08-15 | 恒睿(重庆)人工智能技术研究院有限公司 | 使用不均衡数据训练人体检测模型的方法及装置、介质 |
CN113392757A (zh) * | 2021-06-11 | 2021-09-14 | 恒睿(重庆)人工智能技术研究院有限公司 | 使用不均衡数据训练人体检测模型的方法及装置、介质 |
CN113536270B (zh) * | 2021-07-26 | 2023-08-08 | 网易(杭州)网络有限公司 | 一种信息验证的方法、装置、计算机设备及存储介质 |
CN113536270A (zh) * | 2021-07-26 | 2021-10-22 | 网易(杭州)网络有限公司 | 一种信息验证的方法、装置、计算机设备及存储介质 |
CN113673509B (zh) * | 2021-07-28 | 2023-06-09 | 华南理工大学 | 一种基于图像文本的仪表检测分类方法 |
CN113673509A (zh) * | 2021-07-28 | 2021-11-19 | 华南理工大学 | 一种基于图像文本的仪表检测分类方法 |
CN113780084A (zh) * | 2021-08-11 | 2021-12-10 | 上海藤核智能科技有限公司 | 基于生成式对抗网络的人脸数据扩增方法、电子设备和存储介质 |
CN113780084B (zh) * | 2021-08-11 | 2024-05-31 | 上海藤核智能科技有限公司 | 基于生成式对抗网络的人脸数据扩增方法、电子设备和存储介质 |
CN113792669B (zh) * | 2021-09-16 | 2024-06-14 | 大连理工大学 | 一种基于层次化自注意力网络的行人重识别基线方法 |
CN113792669A (zh) * | 2021-09-16 | 2021-12-14 | 大连理工大学 | 一种基于层次化自注意力网络的行人重识别基线方法 |
CN114155573A (zh) * | 2021-11-05 | 2022-03-08 | 上海弘目智能科技有限公司 | 基于SE-ResNet网络的人种识别方法、装置及计算机存储介质 |
CN114155573B (zh) * | 2021-11-05 | 2024-09-10 | 上海弘目智能科技有限公司 | 基于SE-ResNet网络的人种识别方法、装置及计算机存储介质 |
CN114359677A (zh) * | 2021-12-30 | 2022-04-15 | 北京超维景生物科技有限公司 | 处理图像序列的方法及装置 |
CN114781483A (zh) * | 2022-03-18 | 2022-07-22 | 华南理工大学 | 一种基于卷积神经网络的草菇生长状态识别方法 |
CN114781483B (zh) * | 2022-03-18 | 2024-05-28 | 华南理工大学 | 一种基于卷积神经网络的草菇生长状态识别方法 |
CN114448733A (zh) * | 2022-04-11 | 2022-05-06 | 广州易道智慧信息科技有限公司 | 虚拟机器视觉系统的加密传输模型训练方法及加解密方法 |
CN117649677A (zh) * | 2022-08-20 | 2024-03-05 | 南京视察者智能科技有限公司 | 一种基于3d生成对抗网络的域适应行人重识别方法 |
CN115690758A (zh) * | 2022-12-12 | 2023-02-03 | 吉林农业大学 | 一种基于深度度量学习的茶脸验真方法及验真系统 |
CN115690758B (zh) * | 2022-12-12 | 2023-08-08 | 吉林农业大学 | 一种基于深度度量学习的茶脸验真方法及验真系统 |
CN116281479B (zh) * | 2023-04-04 | 2023-10-17 | 南京枫火网络科技有限公司 | 一种基于物联网的电梯故障监测方法及系统 |
CN116281479A (zh) * | 2023-04-04 | 2023-06-23 | 南京枫火网络科技有限公司 | 一种基于物联网的电梯故障监测方法及系统 |
CN116738296B (zh) * | 2023-08-14 | 2024-04-02 | 大有期货有限公司 | 机房状况综合智能监控系统 |
CN116738296A (zh) * | 2023-08-14 | 2023-09-12 | 大有期货有限公司 | 机房状况综合智能监控系统 |
CN118096586A (zh) * | 2023-09-13 | 2024-05-28 | 哈尔滨工业大学重庆研究院 | 基于残差结构编码器解码器架构的视频人脸隐私保护方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108710831B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710831A (zh) | 一种基于机器视觉的小数据集人脸识别算法 | |
CN110781838B (zh) | 一种复杂场景下行人的多模态轨迹预测方法 | |
CN110348376A (zh) | 一种基于神经网络的行人实时检测方法 | |
CN108717568B (zh) | 一种基于三维卷积神经网络的图像特征提取与训练方法 | |
CN109255831B (zh) | 基于多任务学习的单视图人脸三维重建及纹理生成的方法 | |
Yang et al. | IA-Net $: $ An inception–attention-module-based network for classifying underwater images from others | |
CN109558832A (zh) | 一种人体姿态检测方法、装置、设备及存储介质 | |
CN110543846B (zh) | 一种基于生成对抗网络的多姿态人脸图像正面化方法 | |
CN110188685A (zh) | 一种基于双注意力多尺度级联网络的目标计数方法及系统 | |
EP4390881A1 (en) | Image generation method and related device | |
CN108564119A (zh) | 一种任意姿态行人图片生成方法 | |
CN109299716A (zh) | 神经网络的训练方法、图像分割方法、装置、设备及介质 | |
CN109443382A (zh) | 基于特征提取与降维神经网络的视觉slam闭环检测方法 | |
CN110458060A (zh) | 一种基于对抗学习的车辆图像优化方法及系统 | |
CN108985317A (zh) | 一种基于可分离卷积和注意力机制的图像分类方法 | |
CN110188768A (zh) | 实时图像语义分割方法及系统 | |
CN109889849A (zh) | 视频生成方法、装置、介质及设备 | |
CN107832835A (zh) | 一种卷积神经网络的轻量化方法及装置 | |
CN116229295A (zh) | 基于融合卷积注意力机制的遥感图像目标检测方法 | |
CN108765512B (zh) | 一种基于多层级特征的对抗图像生成方法 | |
CN110766063A (zh) | 基于压缩激励和紧密连接卷积神经网络的图像分类方法 | |
CN114529940B (zh) | 基于姿态引导的人体图像生成方法 | |
CN112906500B (zh) | 基于深度特权网络的人脸表情识别方法及系统 | |
CN109948607A (zh) | 基于深度学习反卷积网络的候选边框生成和目标检测方法 | |
CN113642621A (zh) | 基于生成对抗网络的零样本图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |