CN110795993A - 一种构建模型的方法、装置、终端设备及介质 - Google Patents
一种构建模型的方法、装置、终端设备及介质 Download PDFInfo
- Publication number
- CN110795993A CN110795993A CN201910866631.4A CN201910866631A CN110795993A CN 110795993 A CN110795993 A CN 110795993A CN 201910866631 A CN201910866631 A CN 201910866631A CN 110795993 A CN110795993 A CN 110795993A
- Authority
- CN
- China
- Prior art keywords
- convolutional layer
- face detection
- detection model
- channel
- convolutional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本申请适用于模型构建技术领域,提供了一种构建模型的方法、构建模型的装置、终端设备及介质,其中,一种构建模型的方法,通过从训练好的人脸检测模型中确定出卷积层列队,再基于卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照卷积层列队中卷积层的排列顺序,依次对每个卷积层进行通道删除,进而得到新的人脸检测模型,由于新的人脸检测模型中并未删除卷积层,仅是删除卷积层中的部分通道,因此能够在保证人脸检测的准确率不变的情况下,降低了运行新的人脸检测模型时的资源占用率,同时提高了人脸图像识别的效率。
Description
技术领域
本申请属于模型构建技术领域,尤其涉及一种构建模型的方法、装置、终端设备及计算机可读存储介质。
背景技术
人脸检测技术,是基于人的脸部特征信息进行身份识别的一种生物识别技术。同时,人脸检测技术也是多种生物识别技术中,被应用范围交广的技术之一。例如,终端的解锁、消费活动中的支付验证或者门禁考勤等,都应用到了人脸检测技术。
在实现对人脸图像进行识别时,大多数是应用包含神经网络的人脸图像识别模型对采集到的人脸图像进行识别。虽然,现有的人脸图像识别模型中都配置有较为复杂的特征提取网络层,能够用于提取图像中的各种特征,但是同时也会占用大部分的机器资源,且识别过程需要耗费较长时间。可见,现有的人脸图像识别过程中,存在人脸检测模型的识别效率较低的问题。
发明内容
有鉴于此,本申请实施例提供了一种构建模型的方法、装置、终端设备及计算机可读存储介质,以解决现有的人脸图像识别过程中,存在人脸检测模型的识别效率较低的问题。
本申请实施例的第一方面提供了一种构建模型的方法,包括:
从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相反;
基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
进一步的,所述从训练好的人脸检测模型中确定出卷积层列队,包括:
获取训练好的人脸检测模型的脚本文件;
根据预设的卷积层标识,从所述脚本文件中确定出用于描述卷积层的所有目标脚本文件,得到脚本文件集合;
按照执行所述目标脚本文件的相反顺序,对所述脚本文件集合中的目标脚本文件进行排列,得到卷积层列队。
进一步的,所述基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型,包括:
若按照所述排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型;
利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型;
若按照所述排列顺序无法从所述卷积层列队中确定出下一级目标卷积层,则将所述训练好的目标人脸检测模型识别为所述新的人脸检测模型。
进一步的,所述利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型的步骤之后,还包括:
若按照所述排列顺序从所述卷积层列队中确定出下一级目标卷积层,则将所述下一级目标卷积层识别为所述当前目标卷积层。进一步的,所述若按照所述排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型,包括:
获取所述当前目标卷积层中每个特征通道的通道权值和预设的通道删除比例;删除所有所述通道权值中所述通道权值较小的前N个特征通道,得到目标人脸检测模型;其中N=INT(M*L),M为所述当前目标卷积层中包含的特征通道数量,L为所述预设的通道删除比例,INT表示取整。
进一步的,所述从训练好的人脸检测模型中确定出卷积层列队的步骤之前,还包括:
获取多个人脸图像样本;其中,每个人脸图像样本配置有用于描述人脸归属的信息标签;
对每个所述人脸图像样本进行边长缩放,得到标准图像样本;
建立所述标准图像样本与所述信息标签之间的映射关系,得到人脸图像训练集;
利用所述人脸图像训练集对原始人脸检测模型进行训练,得到训练好的人脸检测模型。
进一步的,所述新的人脸检测模型包括多个卷积层和多个池化层;所述方法还包括:
若在目标区域内采集到人脸图像,则调用新的人脸检测模型对所述人脸图像进行人脸检测;其中,所述新的人脸检测模型中的多个所述卷积层分别对所述人脸图像的不同感受野特征进行卷积,多个所述池化层分别用于得到所述不同感受野特征。
本申请实施例的第二方面提供了一种构建模型的装置,包括:
确定单元,用于从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相反;
执行单元,用于基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述终端设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方案提供的构建模型的方法的各步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方案提供的构建模型的方法的各步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的构建模型的方法的各步骤。
实施本申请实施例提供的一种构建模型的方法、装置、终端设备及计算机可读存储介质具有以下有益效果:
本申请实施例提供的一种构建模型的方法,通过从训练好的人脸检测模型中确定出卷积层列队,再基于卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照卷积层列队中卷积层的排列顺序,依次对每个卷积层进行通道删除,进而得到新的人脸检测模型,由于新的人脸检测模型中并未删除卷积层,仅是删除卷积层中的部分通道,因此能够在保证人脸检测的准确率不变的情况下,降低了运行新的人脸检测模型时的资源占用率,同时提高了人脸图像识别的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种构建模型的方法的实现流程图;
图2是本申请另一实施例提供的一种构建模型的方法的实现流程图;
图3是本申请实施例提供的一种构建模型的装置结构框图;
图4是本申请另一实施例提供的一种终端设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参阅图1,图1是本申请实施例提供的一种构建模型的方法的实现流程图。本实施例中,构建模型的方法用于对腺体图像进行腺腔体和腺体边缘的识别,其执行主体为计算机终端设备,例如,用于进行模型构建或者模型优化的计算机或服务器等。
需要说明的是,在本申请所有实施例中,构建模型是在已有的模型基础上,通过优化已有的模型结构,以得到新的模型结构,进而在保证应用模型目的性不变的情况下,提升计算机运行的效率。
如图1所示的构建模型的方法包括以下步骤:
S11:从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相反。
在步骤S11中,训练好的人脸检测模型,用于对人脸图像进行特征识别,进而能够确定出与人脸图像关联的对象。训练好的人脸检测模型是利用训练集合数据对原始的人脸检测模型进行训练后得到的模型,在未对原始的人脸检测模型进行训练时,原始的人脸检测模型是基于卷积神经网络构建得到的用于进行人脸图像识别的功能性模型,通过利用训练集合数据对该功能性模型进行训练,进而得到的训练好的人脸检测模型。训练好的人脸检测模型卷积列队中包含了训练好的人脸检测模型中的所有卷积层。
需要说明的是,在基于卷积神经网络构建的人脸检测模型中,每层卷积层由若干个卷积单元组成,也即由不同的特征通道组成,每个特征通道的参数都是通过反向传播算法最佳化得到的。特征通道是提取输入的不同特征,第一层卷积层中的特征通道只能提取一些低级的特征,如图像的边缘、线条和角等层级,更多层的模型能从低级特征中迭代提取更复杂的特征。因此只有保证人脸检测模型中具有一定数量的卷积层结构,才能够保证对人脸图像识别的精确度。
在本实施例中,卷积层列队中的信息用于描述训练好的人脸检测模型中的所有卷积层,且在卷积层列队中卷积层的排列顺序与卷积层的特征输出顺序相反。例如,训练好的人脸检测模型中有N个卷积层,且卷积层之间的特征输出顺序是从低层级向高层级输出,也即人脸图像通过输入层输入训练好的人脸图像识别模型中,由第一卷积层对人脸图像进行第一次特征卷积,并将结果传输至池化层进行池化处理,再由池化层向第二卷积层进行特征输出,由第二卷积层进行第二次特征卷积,并将结果传输至池化层进行池化处理,再由池化层向第三卷积层进行特征输出,以此类推,直到由第N-1卷积层对人脸图像进行第N-1次特征卷积,并将结果传输至池化层进行池化处理,再由池化层向第N卷积层进行特征输出,卷积层的特征输出顺序为从(低)小级别卷积层向(高)大级别卷积层,也即从小到大。由于卷积层的排列顺序与卷积层的特征输出顺序相反,因此卷积层列队中卷积层的排列顺序为从(高)大级别卷积层向(低)小级别卷积层,也即从大到小。
至于从训练好的人脸检测模型中确定出卷积层列队的时机,可以包括但不仅限于以下两种场景。
场景1:若检测到用于对训练好的人脸检测模型进行模型压缩的预设指令,则从训练好的人脸检测模型中确定出卷积层列队。
例如,利用人脸图像构成的训练数据集合对人脸检测模型进行训练之后,将训练好的人脸检测模型的脚本文件导入模型压缩工具中,通过输入用于对训练好的人脸检测模型进行模型压缩的预设指令,则模型压缩工具从训练好的人脸检测模型中确定出卷积层列队。
需要说明的是,模型压缩工具可以是基于现有的脚本文件识别工具进行重新配置的,用于从训练好的人脸检测模型的脚本文件中识别出卷积层脚本片段的工具。由于人脸检测模型在构建过程中,模型中的所有卷积层都配置有相应的卷积层标识,因此可以通过在模型压缩工具中配置该卷积层标识,即可通过模型压缩工具从训练好的人脸检测模型中确定出卷积层列队。
场景2:若检测到用于表征人脸检测模型训练好的信息,则从训练好的人脸检测模型中确定出卷积层列队。
例如,当利用人脸图像构成的训练数据集合对人脸检测模型进行训练完成之后,获取训练好的人脸检测模型,并从该训练好的人脸检测模型中确定出所有卷积层,组成卷积层列队。
可以理解的是,从训练好的人脸检测模型中确定出卷积层列队,卷积层列队具体可以是由卷积层标识组成的列表,训练好的人脸检测模型中所有卷积层均对应有相应的卷积层标识,通过从训练好的人脸检测模型的脚本文件中提取所有卷积层的卷积层标识,组成卷积层列队。
作为本实施例一种可能实现的方式,步骤S11可以包括:
获取训练好的人脸检测模型的脚本文件;根据预设的卷积层标识,从所述脚本文件中确定出用于描述卷积层的所有目标脚本文件,得到脚本文件集合;按照执行所述目标脚本文件的相反顺序,对所述脚本文件集合中的目标脚本文件进行排列,得到卷积层列队。
在本实施例中,目标脚本文件为用于描述卷积层运算逻辑的脚本文件。
需要说明的是,由于训练好的人脸检测模型在对人脸图像进行识别时,训练好的人脸检测模型中的卷积层之间的运行或者特征数据传递顺序是层层传递的关系,也即卷积层脚本文件的执行顺序与卷积层之间设置的前后位置顺序对应。
为了避免在对卷积层的通道进行删除时出现通道删除过多的现象,在进行通道删除之前,需要对所有卷积层进行排序,也即确定进行通道删除的卷积层次序,可以在先删除一层卷积层的通道之后,再根据其他卷积层受影响的程度,配置下一卷积层的通道删除比例。
S12:基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
在步骤S12中,卷积层为训练好的人脸检测模型中用于进行特征识别和特征计算的中间层,卷积层可以被配置到两个池化层之间。每层卷积层由若干个卷积单元组成,也即由不同的特征通道组成。通道权值用于描述特征通道在进行特征识别或者完成特征识别任务过程中的贡献程度大小。预设的通道删除比例用于描述删除的通道个数占所有通道个数的比例。
需要说明的是,在调用训练好的人脸检测模型对人脸图像进行识别时,卷积层可以根据不同的感受野对人脸图像中的特征进行特征卷积,为了保证模型识别人脸图像的准确程度,对卷积层中的通道进行删除时,并不是删除卷积层中的所有通道,而是对通道权值较小的通道进行删除。
在实际有应用中,设置预设的通道删除比例可以根据不同卷积层的通道权值对应设定,即预设的通道删除比例与通道权值相关,具体的,预设的通道删除比例用于表征通道权值较低的通道占卷积层所有通道个数的比例。
在本申请的所有实施例中,由于卷积层中不同的通道权值表征不同通道特征识别的贡献程度大小,因此通道权值越小则表示该通道对人脸图像识别的结果所造成的影响程度越小,故删除每个卷积层中通道权值较小的通道,能够在不删除卷积层的条件下,最大化压缩模型的特征提取内容以及模型的大小,从而降低了计算机运行该模型时所需要占用的资源,且提高了模型整体的运算时长,也即提高了对人脸图像的识别效率。
表1
表1示出了三种不同人脸检测模型对简单样本和复制样本进行识别的准确率、运行时间以及模型脚本文件。
如表1所示,对训练好的人脸检测模型、新的人脸检测模型以及删除部分卷积层的人脸检测模型进行数据比较。其中,训练好的人脸检测模型,也即没有对卷积层进行通道删除的模型,无论是对简单样本的识别还是对复杂样本的识别,其识别的准确率最高,但运行时间也最长,且该模型对应的脚本文件也最大。新的人脸检测模型,也即对卷积层进行通道删除的模型,无论是对简单样本的识别还是对复杂样本的识别,其识别的准确率相对较高,但运行时间最短,且该模型对应的脚本文件也最小。删除部分卷积层的人脸检测模型,虽然其运行时间最短,且该模型对应的脚本文件也最小,但是对简单样本的识别和对复杂样本的识别,其识别的准确率都最低。可见,表1中示出的三个模型中,新的人脸检测模型在仅对卷积层进行通道删除,且未进行卷积层删除的条件下,不仅能够保持对样本识别的较高准确率,且运行时间较短,脚本文件大小也最小,因此能够在保证人脸检测的准确率的情况下,降低了运行新的人脸检测模型时的资源占用率,同时提高了人脸图像识别的效率。
以上可以看出,本实施例提供的一种构建模型的方法,通过从训练好的人脸检测模型中确定出卷积层列队,再基于卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照卷积层列队中卷积层的排列顺序,依次对每个卷积层进行通道删除,进而得到新的人脸检测模型,由于新的人脸检测模型中并未删除卷积层,仅是删除卷积层中的部分通道,因此能够在保证人脸检测的准确率不变的情况下,降低了运行新的人脸检测模型时的资源占用率,同时提高了人脸图像识别的效率。
请参阅图2,图2是本申请另一实施例提供的一种构建模型的方法的实现流程图。相对于图1对应的实施例,本实施例提供的支付方法在步骤S11之前还包括步骤S21~S24。详述如下:
S21:获取多个人脸图像样本;其中,每个人脸图像样本配置有用于描述人脸归属的信息标签。
S22:对每个所述人脸图像样本进行边长缩放,得到标准图像样本。
S23:建立所述标准图像样本与所述信息标签之间的映射关系,得到人脸图像训练集。
S24:利用所述人脸图像训练集对原始人脸检测模型进行训练,得到训练好的人脸检测模型。
本实施例中,多个人脸图像样本中每个人脸图像样本均包括一个人的人脸图像。人脸图像样本可以是对人脸进行拍照得到的样本,也可以是从视频图像中截取清楚的人脸图像得到的样本。每个人脸图像样本与每个信息标签相对应,信息标签用于描述人脸归属,也即人脸图像的人物来源。原始人脸检测模型可以是现有的人脸检测模型,例如,以YOLOV3网络为基础进行配置得到的模型。
需要说明的是,为了减少对人脸图像样本的处理步骤,在获取到多个人脸图像样本后,仅对人脸图像样本进行边长缩放,也即仅进行长边缩放,不进行图像填充,简化了对人脸图像样本的处理步骤,同时还可以有效地控制人脸图像样本的文件大小,避免样本的文件大小过大。通过建立标准图像样本与信息标签之间的映射关系,使得人脸图像训练集中的信息能够用于描述标准图像样本与信息标签之间的对应关系,因此在利用人脸图像训练集对原始人脸检测模型进行训练时,使得到训练好的人脸检测模型能够准确地识别出人脸图像所对应的信息标签。
如图2所示,在本实施例中当执行完了步骤S21~S24之后,便开始执行步骤S11和S12。
S11:从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相反。
S12:基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
作为本实施例一种可能实现的方式,步骤S12具体包括:
若按照所述卷积层的排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型;利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型;若按照所述卷积层的排列顺序无法从所述卷积层列队中确定出下一级目标卷积层,则将所述训练好的目标人脸检测模型识别为所述新的人脸检测模型。
在本实施例中,按照排列顺序依次对卷积层列队中的卷积层进行通道删除时,先按照排列顺序从卷积层列队中确定出当前目标卷积层,当前目标卷积层为正在进行通道删除的卷积层。可以理解的是,由于训练好的人脸检测模型中包含了多个卷积层,且对卷积层进行通道删除需要遵循卷积列队中卷积层的排列顺序,因此在对卷积列队中的第一个卷积层进行通道删除时,第一个卷积层即为当前目标卷积层,当第一个卷积层已完成了通道删除时,卷积积列队中的第二个卷积层则被识别为下一级目标卷积层。依次类推,当第N-1个卷积层已完成了通道删除时,卷积积列队中的第N个卷积层则被识别为下一级目标卷积层。
需要说明的是,在对每个卷积层进行了通道删除之后,得到目标人脸检测模型,利用人脸图像训练集对目标人脸检测模型进行训练,可以下一个进行通道删除的卷积层能够与已进行通道删除的卷积层之间有更好的耦合度,也即使得到的训练好的目标人脸检测模型中各卷积层之间有高的耦合程度。
可以理解的是,当按照卷积层的排列顺序无法从卷积层列队中确定出下一级目标卷积层,则表示已对卷积层列队中的所有卷积层完成了通道删除,故将训练好的目标人脸检测模型识别为新的人脸检测模型。
作为本实施例一种可能实现的方式,步骤:利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型的步骤之后,还包括:
若按照所述卷积层的排列顺序从所述卷积层列队中确定出下一级目标卷积层,则将所述下一级目标卷积层识别为所述当前目标卷积层。
在本实施例中,当前目标卷积层为正在进行通道删除的卷积层。
可以理解的是,当按照排列顺序从卷积层列队中确定出下一级目标卷积层时,则表示卷积层列队中还有卷积层未进行通道删除,因此将下一级目标卷积层识别为当前目标卷积层,循环上述实施例中对卷积层进行通道删除,以及模型进行训练的步骤,也即循环步骤:基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型;利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型,直到按照排列顺序无法从卷积层列队中确定出下一级目标卷积层为止。
作为本实施例一种可能实现的方式,步骤:若按照所述排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型,包括:
获取所述当前目标卷积层中每个特征通道的通道权值和预设的通道删除比例;删除所有所述通道权值中所述通道权值较小的前N个特征通道,得到目标人脸检测模型;其中N=INT(M*L),M为所述当前目标卷积层中包含的特征通道数量,L为所述预设的通道删除比例,INT表示取整。
在本实施例中,在每次对目标卷积层进行通道删除时,需要去顶该卷积层中各特征通道的通道权值。
在实际应用中,可以利用人脸图像输入训练好的人脸检测模型中,并通过检测训练好的人脸检测模型中各个卷积层的运行数据,即可得到每个卷积层中各个通道在进行人脸检测时的通道权值。针对每个卷积层,对该卷积层的所有通道权值进行大小顺序进行排序,即可确定出所有通道权值中通道权值较小的前N个特征通道。
在实际应用中,在确定了通道权值较小的前N个特征通道后,获取通道权值较小的前N个特征通道对应的目标索引,根据目标索引,可以从当前目标卷积层对应的目标脚本文件中确定出目标数据字段。从目标脚本文件中删除目标数据字段,得到目标人脸检测模型。
在本实施例中,为了保证卷积层的特征识别的准确程度,从权值集合中确定出的目标索引,所指向的目标通道为通道权值交底的通道,也即删除也是删除卷积层中通道权值低的部分通道。
需要说明的是,由于对训练好的人脸检测模型中的卷积层进行了通道删除,因此能够保证卷积层数量不变的情况下,通过减少每个卷积层的通道来降低模型整体的运算量,进而降低了运行模型所占用的资源,减少了运算时间,提高了模型整体的识别效率。
作为本实施例一种可能实现的方式,所述新的人脸检测模型包括多个卷积层和多个池化层;图2所述的方法还包括:
若在目标区域内采集到人脸图像,则调用新的人脸检测模型对所述人脸图像进行人脸检测,并在识别通过时,显示与所述人脸图像对应的信息标签;其中,所述新的人脸检测模型中的多个所述卷积层分别对所述人脸图像的不同感受野特征进行卷积,多个所述池化层分别用于得到所述不同感受野特征。
在本实施例中,信息标签用于描述人脸图像的归属,也即用于指向人脸图像的来源人物。
由于新的人脸检测模型是对训练好的人脸检测模型中的卷积层进行了通道删除后得到的模型,因此在调用新的人脸检测模型对人脸图像进行人脸检测时,新的人脸检测模型中的卷积层数未减少,但各卷积层中进行特征卷积运算的通道变少,因此能够降低模型整体的运算量,进而降低了运行模型所占用的资源,减少了运算时间,提高了模型整体的识别效率。以上可以看出,本实施例提供的一种构建模型的方法,通过从训练好的人脸检测模型中确定出卷积层列队,再基于卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照卷积层列队中卷积层的排列顺序,依次对每个卷积层进行通道删除,进而得到新的人脸检测模型,由于新的人脸检测模型中并未删除卷积层,仅是删除卷积层中的部分通道,因此能够在保证人脸检测的准确率不变的情况下,降低了运行新的人脸检测模型时的资源占用率,同时提高了人脸图像识别的效率。
此外,在对人脸图像样本进行处理时,仅对人脸图像样本进行边长缩放,不进行图像填充,能够简化样本的处理步骤,控制样本的整体数据大小,提高了配置人脸图像训练集的效率。
请参阅图3,图3是本申请实施例提供的一种构建模型的装置的结构框图。本实施例中该构建模型的装置包括的各单元用于执行图1至图2对应的实施例中的各步骤。具体请参阅图1至图2以及图1至图2所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,构建模型的装置300包括:确定单元31和执行单元32。其中:
确定单元31,用于从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相反。
执行单元32,用于基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
作为本申请一实施例,构建模型的装置300,还包括:
获取单元33,用于获取多个人脸图像样本;其中,每个人脸图像样本配置有用于描述人脸归属的信息标签。
缩放单元34,用于对每个所述人脸图像样本进行边长缩放,得到标准图像样本。
映射单元35,用于建立所述标准图像样本与所述信息标签之间的映射关系,得到人脸图像训练集。
训练单元36,用于利用所述人脸图像训练集对原始人脸检测模型进行训练,得到训练好的人脸检测模型。
作为本申请一实施例,确定单元31具体用于,获取训练好的人脸检测模型的脚本文件;根据预设的卷积层标识,从所述脚本文件中确定出用于描述卷积层的所有目标脚本文件,得到脚本文件集合;按照执行所述目标脚本文件的相反顺序,对所述脚本文件集合中的目标脚本文件进行排列,得到卷积层列队。
作为本申请一实施例,执行单元32具体用于,若按照所述排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型;利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型;若按照所述排列顺序无法从所述卷积层列队中确定出下一级目标卷积层,则将所述训练好的目标人脸检测模型识别为所述新的人脸检测模型。
作为本申请一实施例,执行单元32具体还用于,若按照所述排列顺序从所述卷积层列队中确定出下一级目标卷积层,则将所述下一级目标卷积层识别为所述当前目标卷积层。作为本申请一实施例,执行单元32具体还用于,获取所述当前目标卷积层中每个特征通道的通道权值和预设的通道删除比例;删除所述通道权值较小的前N个特征通道,得到目标人脸检测模型;其中N=INT(M*L),M为所述当前目标卷积层中包含的特征通道数量,L为所述预设的通道删除比例,INT表示取整。
作为本申请一实施例,构建模型的装置300,还包括:
识别单元,用于若在目标区域内采集到人脸图像,则调用新的人脸检测模型对所述人脸图像进行人脸检测;其中,所述新的人脸检测模型中的多个所述卷积层分别对所述人脸图像的不同感受野特征进行卷积,多个所述池化层分别用于得到所述不同感受野特征。
以上可以看出,本实施例方案,通过从训练好的人脸检测模型中确定出卷积层列队,再基于卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照卷积层列队中卷积层的排列顺序,依次对每个卷积层进行通道删除,进而得到新的人脸检测模型,由于新的人脸检测模型中并未删除卷积层,仅是删除卷积层中的部分通道,因此能够在保证人脸检测的准确率不变的情况下,降低了运行新的人脸检测模型时的资源占用率,同时提高了人脸图像识别的效率。
此外,在对人脸图像样本进行处理时,仅对人脸图像样本进行边长缩放,不进行图像填充,能够简化样本的处理步骤,控制样本的整体数据大小,提高了配置人脸图像训练集的效率。
图4是本申请另一实施例提供的一种终端设备的结构框图。如图4所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,例如构建模型的方法的程序。处理器50执行所述计算机程序52时实现上述各个构建模型的方法各实施例中的步骤,例如图1所示的S11至S12,图2所示的S21至S12。或者,所述处理器50执行所述计算机程序52时实现上述图3对应的实施例中各单元的功能,例如,图3所示的单元41至46的功能,具体请参阅图4对应的实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序52可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器51中,并由所述处理器50执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。例如,所述计算机程序52可以被分割成确定单元和执行单元,还可以被分成获取单元、缩放单元、映射单元及训练单元,各单元具体功能如上所述。
所述终端设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图4仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种构建模型的方法,其特征在于,包括:
从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相反;
基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
2.根据权利要求1所述的构建模型的方法,其特征在于,所述从训练好的人脸检测模型中确定出卷积层列队,包括:
获取训练好的人脸检测模型的脚本文件;
根据预设的卷积层标识,从所述脚本文件中确定出用于描述卷积层的所有目标脚本文件,得到脚本文件集合;
按照执行所述目标脚本文件的相反顺序,对所述脚本文件集合中的目标脚本文件进行排列,得到卷积层列队。
3.根据权利要求2所述的构建模型的方法,其特征在于,所述基于所述卷积层列队中每个卷积层的各特征通道的通道权值和预设的通道删除比例,按照所述卷积层的排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型,包括:
若按照所述卷积层的排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型;
利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型;
若按照所述卷积层的排列顺序无法从所述卷积层列队中确定出下一级目标卷积层,则将所述训练好的目标人脸检测模型识别为所述新的人脸检测模型。
4.根据权利要求3所述的构建模型的方法,其特征在于,所述利用所述人脸图像训练集对所述目标人脸检测模型进行训练,得到训练好的目标人脸检测模型的步骤之后,还包括:
若按照所述卷积层的排列顺序从所述卷积层列队中确定出下一级目标卷积层,则将所述下一级目标卷积层识别为所述当前目标卷积层。
5.根据权利要求4所述的构建模型的方法,其特征在于,所述若按照所述排列顺序从所述卷积层列队中确定出当前目标卷积层,则基于所述当前目标卷积层的各特征通道的通道权值和所述预设的通道删除比例,对所述当前目标卷积层进行通道删除,得到目标人脸检测模型,包括:
获取所述当前目标卷积层中每个特征通道的通道权值和预设的通道删除比例;删除所有所述通道权值中所述通道权值较小的前N个特征通道,得到目标人脸检测模型;其中N=INT(M*L),M为所述当前目标卷积层中包含的特征通道数量,L为所述预设的通道删除比例,INT表示取整。
6.根据权利要求1至5任一项所述的构建模型的方法,其特征在于,所述从训练好的人脸检测模型中确定出卷积层列队的步骤之前,还包括:
获取多个人脸图像样本;其中,每个人脸图像样本配置有用于描述人脸归属的信息标签;
对每个所述人脸图像样本进行边长缩放,得到标准图像样本;
建立所述标准图像样本与所述信息标签之间的映射关系,得到人脸图像训练集;
利用所述人脸图像训练集对原始人脸检测模型进行训练,得到训练好的人脸检测模型。
7.根据权利要求1至5任一项所述的构建模型的方法,其特征在于,所述新的人脸检测模型包括多个卷积层和多个池化层;所述方法还包括:
若在目标区域内采集到人脸图像,则调用新的人脸检测模型对所述人脸图像进行人脸检测,并在识别通过时,显示与所述人脸图像对应的信息标签;其中,所述新的人脸检测模型中的多个所述卷积层分别对所述人脸图像的不同感受野特征进行卷积,多个所述池化层分别用于得到所述不同感受野特征。
8.一种构建模型的装置,其特征在于,包括:
确定单元,用于从训练好的人脸检测模型中确定出卷积层列队;其中,所述卷积层列队中排列有所述训练好的人脸检测模型中的所有卷积层,且所述卷积层的排列顺序与所述卷积层的特征输出顺序相逆;
执行单元,用于基于所述卷积层列队中每个卷积层的全部通道权值和预设的通道删除比例,按照所述排列顺序依次对每个所述卷积层进行通道删除,得到新的人脸检测模型。
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述终端设备上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910866631.4A CN110795993A (zh) | 2019-09-12 | 2019-09-12 | 一种构建模型的方法、装置、终端设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910866631.4A CN110795993A (zh) | 2019-09-12 | 2019-09-12 | 一种构建模型的方法、装置、终端设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110795993A true CN110795993A (zh) | 2020-02-14 |
Family
ID=69427087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910866631.4A Pending CN110795993A (zh) | 2019-09-12 | 2019-09-12 | 一种构建模型的方法、装置、终端设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110795993A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418405A (zh) * | 2020-12-03 | 2021-02-26 | 厦门市美亚柏科信息股份有限公司 | 模型压缩方法和装置 |
CN113435385A (zh) * | 2021-07-08 | 2021-09-24 | 网易(杭州)网络有限公司 | 脸部的检测模型训练方法、识别方法、装置、介质和设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102916848A (zh) * | 2012-07-13 | 2013-02-06 | 北京航空航天大学 | 一种基于脚本技术的以太网接口设备的自动测试方法 |
CN106095391A (zh) * | 2016-05-31 | 2016-11-09 | 携程计算机技术(上海)有限公司 | 基于大数据平台和算法模型的计算方法及系统 |
CN108009600A (zh) * | 2017-11-30 | 2018-05-08 | 北京小米移动软件有限公司 | 模型优化、质量检测方法、装置、设备及存储介质 |
CN108615049A (zh) * | 2018-04-09 | 2018-10-02 | 华中科技大学 | 一种车辆部件检测模型压缩方法及系统 |
CN109657780A (zh) * | 2018-06-15 | 2019-04-19 | 清华大学 | 一种基于剪枝顺序主动学习的模型压缩方法 |
CN109688395A (zh) * | 2018-12-29 | 2019-04-26 | 北京中科寒武纪科技有限公司 | 运算方法、装置及相关产品 |
CN109858611A (zh) * | 2019-01-11 | 2019-06-07 | 平安科技(深圳)有限公司 | 基于通道注意力机制的神经网络压缩方法及相关设备 |
CN109976751A (zh) * | 2019-03-28 | 2019-07-05 | 北京中科寒武纪科技有限公司 | 模型操作方法、相关装置及计算机可读介质 |
CN110020724A (zh) * | 2019-03-18 | 2019-07-16 | 浙江大学 | 一种基于权重显著性的神经网络列稀疏方法 |
CN110059796A (zh) * | 2018-01-19 | 2019-07-26 | 杭州海康威视数字技术股份有限公司 | 卷积神经网络的生成方法及装置 |
US20190251441A1 (en) * | 2018-02-13 | 2019-08-15 | Adobe Systems Incorporated | Reducing architectural complexity of convolutional neural networks via channel pruning |
-
2019
- 2019-09-12 CN CN201910866631.4A patent/CN110795993A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102916848A (zh) * | 2012-07-13 | 2013-02-06 | 北京航空航天大学 | 一种基于脚本技术的以太网接口设备的自动测试方法 |
CN106095391A (zh) * | 2016-05-31 | 2016-11-09 | 携程计算机技术(上海)有限公司 | 基于大数据平台和算法模型的计算方法及系统 |
CN108009600A (zh) * | 2017-11-30 | 2018-05-08 | 北京小米移动软件有限公司 | 模型优化、质量检测方法、装置、设备及存储介质 |
CN110059796A (zh) * | 2018-01-19 | 2019-07-26 | 杭州海康威视数字技术股份有限公司 | 卷积神经网络的生成方法及装置 |
US20190251441A1 (en) * | 2018-02-13 | 2019-08-15 | Adobe Systems Incorporated | Reducing architectural complexity of convolutional neural networks via channel pruning |
CN108615049A (zh) * | 2018-04-09 | 2018-10-02 | 华中科技大学 | 一种车辆部件检测模型压缩方法及系统 |
CN109657780A (zh) * | 2018-06-15 | 2019-04-19 | 清华大学 | 一种基于剪枝顺序主动学习的模型压缩方法 |
CN109688395A (zh) * | 2018-12-29 | 2019-04-26 | 北京中科寒武纪科技有限公司 | 运算方法、装置及相关产品 |
CN109858611A (zh) * | 2019-01-11 | 2019-06-07 | 平安科技(深圳)有限公司 | 基于通道注意力机制的神经网络压缩方法及相关设备 |
CN110020724A (zh) * | 2019-03-18 | 2019-07-16 | 浙江大学 | 一种基于权重显著性的神经网络列稀疏方法 |
CN109976751A (zh) * | 2019-03-28 | 2019-07-05 | 北京中科寒武纪科技有限公司 | 模型操作方法、相关装置及计算机可读介质 |
Non-Patent Citations (2)
Title |
---|
姜春晖: "深度神经网络剪枝方法研究", 《中国博士学位论文全文数据库_信息科技辑》 * |
张建明等: "基于压缩卷积神经网络的交通标识分类算法", 《华中科技大学学报(自然科学版)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418405A (zh) * | 2020-12-03 | 2021-02-26 | 厦门市美亚柏科信息股份有限公司 | 模型压缩方法和装置 |
CN112418405B (zh) * | 2020-12-03 | 2022-08-19 | 厦门市美亚柏科信息股份有限公司 | 模型压缩方法和装置 |
CN113435385A (zh) * | 2021-07-08 | 2021-09-24 | 网易(杭州)网络有限公司 | 脸部的检测模型训练方法、识别方法、装置、介质和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936911B2 (en) | Logo detection | |
CN108154105B (zh) | 水下生物检测与识别方法、装置、服务器及终端设备 | |
CN111222500B (zh) | 一种标签提取方法及装置 | |
CN111754396B (zh) | 脸部图像处理方法、装置、计算机设备和存储介质 | |
CN110941978B (zh) | 一种未识别身份人员的人脸聚类方法、装置及存储介质 | |
CN109034069B (zh) | 用于生成信息的方法和装置 | |
CN112232293A (zh) | 图像处理模型训练、图像处理方法及相关设备 | |
CN110738235B (zh) | 肺结核判定方法、装置、计算机设备及存储介质 | |
CN110765860A (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
CN111008640A (zh) | 图像识别模型训练及图像识别方法、装置、终端及介质 | |
CN107729928B (zh) | 信息获取方法和装置 | |
CN111126347B (zh) | 人眼状态识别方法、装置、终端及可读存储介质 | |
US20200279128A1 (en) | Object Detection and Candidate Filtering System | |
CN111931809A (zh) | 数据的处理方法、装置、存储介质及电子设备 | |
CN111914908A (zh) | 一种图像识别模型训练方法、图像识别方法及相关设备 | |
CN108717520A (zh) | 一种行人重识别方法及装置 | |
CN110795993A (zh) | 一种构建模型的方法、装置、终端设备及介质 | |
CN112749666A (zh) | 一种动作识别模型的训练及动作识别方法与相关装置 | |
CN111488810A (zh) | 人脸识别方法、装置、终端设备及计算机可读介质 | |
CN105354228A (zh) | 相似图搜索方法及装置 | |
CN110659631A (zh) | 车牌识别方法和终端设备 | |
CN110969640A (zh) | 视频图像的分割方法、终端设备以及计算机可读存储介质 | |
CN112183303A (zh) | 变电设备图像分类方法、装置、计算机设备和介质 | |
CN111783677A (zh) | 人脸识别方法、装置、服务器和计算机可读介质 | |
CN111222558A (zh) | 图像处理方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200214 |