CN111382764B - 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质 - Google Patents

人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111382764B
CN111382764B CN201811633991.1A CN201811633991A CN111382764B CN 111382764 B CN111382764 B CN 111382764B CN 201811633991 A CN201811633991 A CN 201811633991A CN 111382764 B CN111382764 B CN 111382764B
Authority
CN
China
Prior art keywords
trained
layer
neural network
data
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811633991.1A
Other languages
English (en)
Other versions
CN111382764A (zh
Inventor
程立双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Founder Holdings Development Co ltd, Beijing Founder Electronics Co Ltd filed Critical New Founder Holdings Development Co ltd
Priority to CN201811633991.1A priority Critical patent/CN111382764B/zh
Publication of CN111382764A publication Critical patent/CN111382764A/zh
Application granted granted Critical
Publication of CN111382764B publication Critical patent/CN111382764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Abstract

本发明提供一种人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质,方法包括:在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。该神经网络模型能够在保证识别精度的基础上,降低模型的内存大小,因此其能够方便自由存储嵌入存储介质中。

Description

人脸识别或手势识别的神经网络模型建立方法、装置及计算 机可读存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质。
背景技术
随着大数据时代的到来以及计算机硬件的不断更新迭代,图像识别的算法得到突飞猛进的发展。图像识别广泛应用到手写汉字识别、人脸识别、指纹识别、人工机器人等领域。图像识别有很多算法,主要包括传统的机器学习算法和深度学习。深度学习也叫做深层卷积神经网络学习,除了人工修正训练文件的一些配置参数外,网络中的所有参数都是通过训练数据并从数据中学习所得。而且卷积神经网络由于自身拥有局部感知域、权值共享、池化防过拟合等优点,所以在训练过程中能提取图像的深层抽象特征进行学习,并且整个训练过程无需人为干涉,最终的训练模型除了鲁棒性很强外,识别精度非常高。因此,目前人工智能企业都专注于将深度学习训练的网络模型应用到图像识别领域。
常见的卷积神经网络模型有ResNet网络,其实目前公认识别精度最高的卷积神经网络。此外,SqueezeNet网络也是一种常见的卷积神经网络模型,其实目前公认的轻量级卷积神经网络,其在具有较小的内存的基础上,还能够达到较高的识别精度。
但是,上述两种卷积神经网络模型均具有不同的缺点,ResNet网络虽然识别精度很高,但其具有较大的内存,因此模型不能自由存储到FPGA中或嵌入式部署到集成芯片里,以实际应用举例来说,ResNet网络内存大小一般为500MB,但是FPGA只能够具有10MB的内存,因此无法将ResNet网络存储至FPGA中,而且当从云端更新到客户端时需要较大的数据传输量。SqueezeNet网络虽然内存较小,但是精确度低于ResNet网络,因此,如何在实现高识别精度的基础上,降低卷积神经网络的内存以便于存储嵌入即成为了亟待解决的技术问题。
发明内容
本发明提供一种人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质,用于解决现有的卷积神经网络模型无法兼顾识别精度与模型内存的技术问题。
本发明的第一个方面是提供一种人脸识别或手势识别的神经网络模型建立方法,包括:
在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
本发明的另一个方面是提供一种人脸识别或手势识别的神经网络模型建立装置,包括:
特征提取层建立模块,用于在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
膨胀层建立模块,用于将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
关联关系建立模块,用于建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
训练模块,用于通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
本发明的又一个方面是提供一种人脸识别或手势识别的神经网络模型建立装置,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如上述的人脸识别或手势识别的神经网络模型建立方法。
本发明的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的人脸识别或手势识别的神经网络模型建立方法。
本发明提供的人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质,通过在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;通过预设的待训练数据对所述待训练模型进行训练,获得训练后的人脸识别或手势识别神经网络模型。该人脸识别或手势识别神经网络模型能够在保证识别精度的基础上,降低模型的内存大小,因此其能够方便自由存储嵌入存储介质中。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的人脸识别或手势识别的神经网络模型建立方法的流程示意图;
图2为本发明实施例二提供的人脸识别或手势识别的神经网络模型建立方法的流程示意图;
图3为本发明实施例三提供的人脸识别或手势识别的神经网络模型建立方法的流程示意图;
图4为本发明实施例四提供的人脸识别或手势识别的神经网络模型建立装置的结构示意图;
图5为本发明实施例五提供的人脸识别或手势识别的神经网络模型建立装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。
针对上述提及的在现有的神经网络模型无法兼顾识别精度与模型内存的技术问题,本发明提供了一种人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质。
需要说明的是,本申请提供人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质可运用在当前任意一种神经网络模型上,从而实现在保证识别精度的基础上,降低模型的内存,因此其能够方便自由存储嵌入。
图1为本发明实施例一提供的人脸识别或手势识别的神经网络模型建立方法的流程示意图,如图1所示,所述人脸识别或手势识别的神经网络模型建立方法包括:
步骤101、在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取。
在本实施方式中,为了提高轻量级卷积神经网络的精确度,首先可以在数据输入层的下一层设置一特征提取层,利于模型学习更深层的抽象特征。具体地,该特征提取层用于对输入的待识别图像进行特征提取,获得待识别图像的高频图像,利用这些高频图像作为先验知识进行训练学习以及识别,从而能够大幅地提高卷积神经网络的识别精度以及识别效率。可选地,本实施例可以为基于SqueezeNet轻量级卷积神经网络的改进,具体可以为SqueezeNet轻量级卷积神经网络的数据输入层的下一层设置一特征提取层。
步骤102、将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块。
在本实施方式中,在卷积神经网络中,合适的卷积核组合不仅可以增强网络的局部感受野,而且可以适当加深网络层数,提高网络的识别精度。因此,在SqueezeNet轻量级卷积神经网络的数据输入层的下一层设置一特征提取层的基础上,可以为SqueezeNet轻量级卷积神经网络的Fire块,将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块。
步骤103、建立各相邻Fire块之间的关联关系,获得调整后的待训练模型。
在本实施方式中,将一个1*h的卷积核与一个h*1的卷积核相结合作为Fire块之后,需要建立多个相邻Fire块之间的关联关系,获得调整后的待训练模型。
步骤104、通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
在本实施方式中,获得调整后的待训练模型之后,为了使该待训练模型能够实现图像识别的功能,需要通过预设的待训练数据对该待训练模型进行训练,获得训练后的神经网络模型,从而后续可以根据该神经网络模型实现图像识别。可以理解的是,不同功能的神经网络模型可以采用不同的待训练数据进行训练。举例来说,手势识别模型的待训练数据可以为多张已标注的手部图像,人脸识别模型的待训练数据可以为多张已标注的人脸图像。
本实施例提供的人脸识别或手势识别的神经网络模型建立方法,通过在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。该神经网络模型能够在保证识别精度的基础上,降低模型的内存大小,因此其能够方便自由存储嵌入。
进一步地,在上述实施例的基础上,所述方法包括:
在数据输入层的下一层设置小波框架,将所述小波框架作为所述特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
在本实施例中,可以在数据输入层的下一层设置小波框架,将小波框架作为特征提取层,实现对输入图像的高频特征提取,具体地,小波变换是一种空间(时间)和频率的局部变换,通过伸缩和平移等运算功能可对函数或信号进行多尺度的细化分析,能够有效地从信号中提取信息特征。计算机中的图像信息是以离散信号形式存放的,所以需要将连续小波变换离散化。离散小波变换公式如下:
其中m,k均为整数,ψm,k(t)为离散小波基函数。特殊的小波基函数族可以构成小波框架。小波框架可以通过滤波器组的方法快速对数字信号进行多层分解,得到高频特征图像。
本实施例提供的人脸识别或手势识别的神经网络模型建立方法,通过在数据输入层的下一层设置小波框架,将所述小波框架作为所述特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取,从而能够实现对输入图像的高频特征提取,提高神经网络模型的识别精度。
进一步地,在上述实施例的基础上,所述方法包括:
在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数,通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分;
建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
在本实施例中,为了保证1*h的膨胀层和h*1的膨胀层能够输出相同大小的中间图像,需要分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数,通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层。具体地,可以通过公式1与公式2为1*h设置延拓参数和步长参数:
现在kernelw=1,为了保证AfterConvImgw=BeforeConvImgw,只需设置padw=0,stride=1即可;kernelh=h,为了保证AfterConvImgh=BeforeConvImgh,只需设置stride=1即可。
此外,还可以通过上述公式1与公式2为h*1的卷积核设置延拓参数和步长参数。具体地,当kernelw=h时,只需设置stride=1即可;当kernelh=1时,只需设置padw=0,stride=1即可。
本实施例提供的人脸识别或手势识别的神经网络模型建立方法,通过分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数,通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层,从而能够在保证识别精度的基础上,降低模型的内存,因此其能够方便自由存储嵌入。
进一步地,在上述实施例的基础上,所述方法包括:
在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
利用残差原理建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
在本实施例中,可以利用残差原理建立各相邻Fire块之间的关联关系,获得调整后的待训练模型。具体地,在改进的SqueezeNet轻量级卷积神经网络中引入残差思想主要是为了解决网络过深导致梯度弥散的退化问题。残差原理就是让网络学习一个非线性的残差函数F(x)=H(x)-x。这样,相比于没有加入操作的情况,F(x)的微小变化对权重的调整作用会更大,不仅能够解决了梯度消失的现象,而且最终学习的效果也很好。换句话说,残差原理就是抛弃了网络参数的主体部分,突出网络参数微小变化的部分。因为残差原理的一个必要条件是图像大小和图像通道数必须保持相等,所以在建立Fire块之间的联系时,必须保证中间图像的尺度和通道数保持一致。
本实施例提供的人脸识别或手势识别的神经网络模型建立方法,通过利用残差原理建立各相邻Fire块之间的关联关系,获得调整后的待训练模型,从而能够提高神经网络模型的学习效果,进而能够在保证识别精度的基础上,降低模型的内存大小,因此其能够方便自由存储嵌入。
图2为本发明实施例二提供的人脸识别或手势识别的神经网络模型建立方法的流程示意图,在上述任一实施例的基础上,如图2所示,所述方法包括:
步骤201、在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
步骤202、将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
步骤203、建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
步骤204、将所述待训练数据随机分为训练集与测试集;
步骤205、通过预设的数据扩充方式对所述训练集与测试集中的数据量进行扩充;
步骤206、分别对所述训练集与测试集中的数据进行标注;
步骤207、将所述训练集与测试集中的数据转换为统一尺度;
步骤208、通过所述训练集中的数据对所述待训练模型进行训练,通过所述测试集中的数据对所述待训练模型进行测试,获得训练后的神经网络模型。
在本实施例中,为了实现对待训练模型的训练,首先需要对待训练数据进行处理。具体地,可以将预设的待训练数据随机分为测试集与训练集,为了提高神经网络模型的精度,还可以通过预设的数据扩充方式对训练集与测试集中的数据量进行扩充。具体地,可以通过data-augmentation的方式增大训练集和测试集的图片数量,此外,还可以采用其他数据扩充方式实现训练集和测试集的图片数量的扩充,本发明在此不做限制。为了实现对模型的训练,还需要对待训练数据进行标注,具体地,不同功能的神经网络模型可以采用不同的待训练数据进行训练。举例来说,手势识别模型的待训练数据可以为多张已标注的手部图像,人脸识别模型的待训练数据可以为多张已标注的人脸图像。将训练集和测试集resize成统一尺度,然后生成利于高速读取的训练数据格式,例如LMDB格式、LevelDB格式、h5py格式等。通过训练集中的数据对待训练模型进行训练,通过测试集中的数据对待训练模型进行测试,获得训练后的神经网络模型。
本实施例提供的人脸识别或手势识别的神经网络模型建立方法,通过将所述待训练数据随机分为训练集与测试集;通过预设的数据扩充方式对所述训练集与测试集中的数据量进行扩充;分别对所述训练集与测试集中的数据进行标注;将所述训练集与测试集中的数据转换为统一尺度;通过所述训练集中的数据对所述待训练模型进行训练,通过所述测试集中的数据对所述待训练模型进行测试,获得训练后的神经网络模型。从而能够实现对神经网络模型的获取,进而能够在保证识别精度的基础上,降低模型的内存,因此其能够方便自由存储嵌入。
图3为本发明实施例三提供的人脸识别或手势识别的神经网络模型建立方法的流程示意图,在上述任一实施例的基础上,所述人脸识别或手势识别的神经网络模型建立方法包括:
步骤301、在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
步骤302、将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
步骤303、建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
步骤304、通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型;
步骤305、接收待识别图像,通过所述训练后的神经网络模型对所述待识别图像进行识别,获得识别结果。
在本实施例中,在数据输入层的下一层设置特征提取层,特征提取层用于对输入的待识别图像进行特征提取;将一个1*h的卷积核与一个h*1的卷积核相结合作为Fire块,其中,h为正奇数;建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;通过预设的待训练数据对待训练模型进行训练,获得训练后的神经网络模型之后,可以通过该神经网络模型实现对待识别图像的识别。具体地,可以接收待识别图像,通过训练后的神经网络模型对所述待识别图像进行识别,获得识别结果。
本实施例提供的人脸识别或手势识别的神经网络模型建立方法,通过训练后的神经网络模型对所述待识别图像进行识别,获得识别结果,由于该神经网络模型能够在保证识别精度的基础上,降低模型的内存,因此其能够方便自由存储嵌入,进而通过该神经网络模型获得的识别结果精度较高。
图4为本发明实施例四提供的人脸识别或手势识别的神经网络模型建立装置的结构示意图,如图4所示,所述装置包括:
特征提取层建立模块41,用于在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;
膨胀层建立模块42,用于将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
关联关系建立模块43,用于建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
训练模块44,用于通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。
本实施例提供的神经网络模型建立装置,通过在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型。该神经网络模型能够在保证识别精度的基础上,降低模型的内存,因此其能够方便自由存储嵌入。
进一步地,在上述任一实施例的基础上,所述特征提取层建立模块包括:
小波框架设置单元,用于在数据输入层的下一层设置小波框架,将所述小波框架作为所述特征提取层。
进一步地,在上述任一实施例的基础上,所述膨胀层建立模块包括:
膨胀层建立单元,用于分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数,通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层。
进一步地,在上述任一实施例的基础上,所述关联关系建立模块包括:
关联关系建立单元,用于利用残差原理建立相邻Fire块之间的关联关系。
进一步地,在上述任一实施例的基础上,所述训练模块包括:
分类单元,用于将所述待训练数据随机分为训练集与测试集;
扩充单元,用于通过预设的数据扩充方式对所述训练集与测试集中的数据量进行扩充;
标注单元,用于分别对所述训练集与测试集中的数据进行标注;
转换单元,用于将所述训练集与测试集中的数据转换为统一尺度;
训练单元,用于通过所述训练集中的数据对所述待训练模型进行训练,通过所述测试集中的数据对所述待训练模型进行测试,获得训练后的神经网络模型。
进一步地,在上述任一实施例的基础上,所述装置还包括:
识别模块,用于接收待识别图像,通过所述训练后的神经网络模型对所述待识别图像进行识别,获得识别结果。
图5为本发明实施例五提供的人脸识别或手势识别的神经网络模型建立装置的结构示意图,如图5所示,所述神经网络模型建立装置,包括:存储器51,处理器52;
存储器51;用于存储所述处理器52可执行指令的存储器51;
其中,所述处理器52被配置为由所述处理器52执行如上述任一实施例所述的人脸识别或手势识别的神经网络模型建立方法。
本发明又一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的人脸识别或手势识别的神经网络模型建立方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种人脸识别或手势识别的神经网络模型建立方法,其特征在于,包括:
在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;所述待识别图像为手部图像或人脸图像;
将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型;所述待训练数据为手部图像,所述训练后的神经网络模型为手势识别模型;或者,所述待训练数据为人脸图像,所述训练后的神经网络模型为人脸识别模型;
所述将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,包括:
分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数,通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分;
所述通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型,包括:
将所述待训练数据随机分为训练集与测试集;
通过预设的数据扩充方式对所述训练集与测试集中的数据量进行扩充;
分别对所述训练集与测试集中的数据进行标注;
将所述训练集与测试集中的数据转换为统一尺度;
通过所述训练集中的数据对所述待训练模型进行训练,通过所述测试集中的数据对所述待训练模型进行测试,获得训练后的神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述在数据输入层的下一层设置特征提取层,包括:
在数据输入层的下一层设置小波框架,将所述小波框架作为所述特征提取层。
3.根据权利要求1所述的方法,其特征在于,所建立各相邻Fire块之间的关联关系,包括:
利用残差原理建立相邻Fire块之间的关联关系。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型之后,还包括:
接收待识别图像,通过所述训练后的神经网络模型对所述待识别图像进行识别,获得识别结果。
5.一种人脸识别或手势识别的神经网络模型建立装置,其特征在于,包括:
特征提取层建立模块,用于在数据输入层的下一层设置特征提取层,所述特征提取层用于对输入的待识别图像进行特征提取;所述待识别图像为手部图像或人脸图像;
膨胀层建立模块,用于将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分,其中,h为正奇数,将所述膨胀层与压榨层串联作为Fire块;
关联关系建立模块,用于建立各相邻Fire块之间的关联关系,获得调整后的待训练模型;
训练模块,用于通过预设的待训练数据对所述待训练模型进行训练,获得训练后的神经网络模型;所述待训练数据为手部图像,所述训练后的神经网络模型为手势识别模型;或者,所述待训练数据为人脸图像,所述训练后的神经网络模型为人脸识别模型;
所述膨胀层建立模块,具体用于分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数,通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分;
所述训练模块,具体用于将所述待训练数据随机分为训练集与测试集;通过预设的数据扩充方式对所述训练集与测试集中的数据量进行扩充;分别对所述训练集与测试集中的数据进行标注;将所述训练集与测试集中的数据转换为统一尺度;通过所述训练集中的数据对所述待训练模型进行训练,通过所述测试集中的数据对所述待训练模型进行测试,获得训练后的神经网络模型。
6.根据权利要求5所述的装置,其特征在于,所述特征提取层建立模块包括:
小波框架设置单元,用于在数据输入层的下一层设置小波框架,将所述小波框架作为所述特征提取层。
7.一种人脸识别或手势识别的神经网络模型建立装置,其特征在于,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如权利要求1-4任一项所述的人脸识别或手势识别的神经网络模型建立方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-4任一项所述的人脸识别或手势识别的神经网络模型建立方法。
CN201811633991.1A 2018-12-29 2018-12-29 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质 Active CN111382764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811633991.1A CN111382764B (zh) 2018-12-29 2018-12-29 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811633991.1A CN111382764B (zh) 2018-12-29 2018-12-29 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111382764A CN111382764A (zh) 2020-07-07
CN111382764B true CN111382764B (zh) 2024-02-13

Family

ID=71218279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811633991.1A Active CN111382764B (zh) 2018-12-29 2018-12-29 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111382764B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190852A (zh) * 2021-05-31 2021-07-30 贵州师范学院 一种基于轻量级深度网络模型的计算机病毒检测方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0018489D0 (en) * 2000-07-27 2000-09-13 Audiotrack Watermark Solutions Watermarking key
CN106771886A (zh) * 2017-02-13 2017-05-31 深圳供电局有限公司 一种基于神经网络的线缆混合线路双端测距方法和系统
CN106951395A (zh) * 2017-02-13 2017-07-14 上海客鹭信息技术有限公司 面向压缩卷积神经网络的并行卷积运算方法及装置
CN108021923A (zh) * 2017-12-07 2018-05-11 维森软件技术(上海)有限公司 一种用于深度神经网络的图像特征提取方法
CN108062575A (zh) * 2018-01-03 2018-05-22 广东电子工业研究院有限公司 一种高相似度图像识别与分类方法
CN108307660A (zh) * 2016-11-09 2018-07-20 松下知识产权经营株式会社 信息处理方法、信息处理装置以及程序
CN108389220A (zh) * 2018-02-05 2018-08-10 湖南航升卫星科技有限公司 遥感视频图像运动目标实时智能感知方法及其装置
CN108416440A (zh) * 2018-03-20 2018-08-17 上海未来伙伴机器人有限公司 一种神经网络的训练方法、物体识别方法及装置
CN108537282A (zh) * 2018-04-13 2018-09-14 东北大学 一种使用超轻量级SqueezeNet网络的糖尿病视网膜病变分级方法
CN108573197A (zh) * 2017-03-13 2018-09-25 北京大学 视频动作检测方法及装置
CN108805166A (zh) * 2018-05-03 2018-11-13 全球能源互联网研究院有限公司 一种建立图像分类神经网络模型及图像分类方法、装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0018489D0 (en) * 2000-07-27 2000-09-13 Audiotrack Watermark Solutions Watermarking key
CN108307660A (zh) * 2016-11-09 2018-07-20 松下知识产权经营株式会社 信息处理方法、信息处理装置以及程序
CN106771886A (zh) * 2017-02-13 2017-05-31 深圳供电局有限公司 一种基于神经网络的线缆混合线路双端测距方法和系统
CN106951395A (zh) * 2017-02-13 2017-07-14 上海客鹭信息技术有限公司 面向压缩卷积神经网络的并行卷积运算方法及装置
CN108573197A (zh) * 2017-03-13 2018-09-25 北京大学 视频动作检测方法及装置
CN108021923A (zh) * 2017-12-07 2018-05-11 维森软件技术(上海)有限公司 一种用于深度神经网络的图像特征提取方法
CN108062575A (zh) * 2018-01-03 2018-05-22 广东电子工业研究院有限公司 一种高相似度图像识别与分类方法
CN108389220A (zh) * 2018-02-05 2018-08-10 湖南航升卫星科技有限公司 遥感视频图像运动目标实时智能感知方法及其装置
CN108416440A (zh) * 2018-03-20 2018-08-17 上海未来伙伴机器人有限公司 一种神经网络的训练方法、物体识别方法及装置
CN108537282A (zh) * 2018-04-13 2018-09-14 东北大学 一种使用超轻量级SqueezeNet网络的糖尿病视网膜病变分级方法
CN108805166A (zh) * 2018-05-03 2018-11-13 全球能源互联网研究院有限公司 一种建立图像分类神经网络模型及图像分类方法、装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李照洋. 基于深度学习的人类动作识别研究.中国优秀硕士学位论文全文数据库 (信息科技辑).2018,(第6期),全文. *

Also Published As

Publication number Publication date
CN111382764A (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN107247949B (zh) 基于深度学习的人脸识别方法、装置和电子设备
CN109784347B (zh) 基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法
Ye et al. Unsupervised feature learning framework for no-reference image quality assessment
CN107665364A (zh) 神经网络方法和设备
CN109657582B (zh) 人脸情绪的识别方法、装置、计算机设备及存储介质
Vishwakarma et al. A novel non-linear modifier for adaptive illumination normalization for robust face recognition
CN111382867A (zh) 神经网络压缩的方法、数据处理的方法及相关装置
CN110674824A (zh) 基于R2U-Net的手指静脉分割方法、装置和存储介质
US20220067888A1 (en) Image processing method and apparatus, storage medium, and electronic device
CN109697442B (zh) 一种字符识别模型的训练方法和装置
CN110717929A (zh) 图像目标检测方法、装置及存储介质
CN110414516B (zh) 一种基于深度学习的单个汉字识别方法
CN111382764B (zh) 人脸识别或手势识别的神经网络模型建立方法、装置及计算机可读存储介质
US20220301106A1 (en) Training method and apparatus for image processing model, and image processing method and apparatus
CN110782001A (zh) 一种基于组卷积神经网络使用共享卷积核的改进方法
CN113052096B (zh) 一种视频检测方法、装置、设备及存储介质
CN111353514A (zh) 模型训练方法、图像识别方法、装置及终端设备
CN115600040B (zh) 一种钓鱼网站识别方法及装置
CN109784154B (zh) 基于深度神经网络的情绪识别方法、装置、设备及介质
CN116245765A (zh) 基于增强型深度扩张卷积神经网络的图像去噪方法及系统
CN112733670B (zh) 指纹特征提取方法、装置、电子设备及存储介质
CN115937121A (zh) 基于多维度特征融合的无参考图像质量评价方法及系统
CN111368602A (zh) 人脸图像模糊程度评价方法、装置、可读存储介质及设备
CN115601752A (zh) 文字识别方法、装置、电子设备及介质
CN110427892B (zh) 基于深浅层自相关融合的cnn人脸表情特征点定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230704

Address after: 3007, Hengqin International Financial Center Building, No. 58 Huajin Street, Hengqin New District, Zhuhai City, Guangdong Province, 519030

Applicant after: New founder holdings development Co.,Ltd.

Applicant after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant