CN107103285B - 基于卷积神经网络的人脸深度预测方法 - Google Patents

基于卷积神经网络的人脸深度预测方法 Download PDF

Info

Publication number
CN107103285B
CN107103285B CN201710183903.1A CN201710183903A CN107103285B CN 107103285 B CN107103285 B CN 107103285B CN 201710183903 A CN201710183903 A CN 201710183903A CN 107103285 B CN107103285 B CN 107103285B
Authority
CN
China
Prior art keywords
neural network
depth prediction
convolutional
face depth
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710183903.1A
Other languages
English (en)
Other versions
CN107103285A (zh
Inventor
王好谦
章书豪
方璐
王兴政
张永兵
戴琼海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Weilai Media Technology Research Institute
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Weilai Media Technology Research Institute
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Weilai Media Technology Research Institute, Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Weilai Media Technology Research Institute
Priority to CN201710183903.1A priority Critical patent/CN107103285B/zh
Publication of CN107103285A publication Critical patent/CN107103285A/zh
Application granted granted Critical
Publication of CN107103285B publication Critical patent/CN107103285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于卷积神经网络的人脸深度预测方法,包括生成一人脸深度预测神经网络的步骤,所述生成一人脸深度预测神经网络的步骤包括:搭建具有特定架构的卷积神经网络,所述特定架构是指在卷积层的输出端依次串联规范化操作和激励操作,再在串联了前述两个操作的卷积层上并联k×k的卷积;初始化该卷积神经网络;将RGB人脸图片输入该卷积神经网络,以最小化代价函数为目标进行迭代,以训练形成所述人脸深度预测神经网络。

Description

基于卷积神经网络的人脸深度预测方法
技术领域
本发明涉及计算机视觉与数字图像处理领域,具体涉及一种基于卷积神经网络的人脸深度预测方法。
背景技术
人脸深度预测,是计算机视觉领域一个新颖且富有挑战性的问题。对人脸进行深度预测是理解整个人脸几何关系的重要组成部分。相应的,这样得到的人脸几何关系能够很好地反映人脸上的器官以及整个人面部的环境,如果能得到较好的人脸面部深度信息,将会对人脸识别问题提供非常大的帮助,同时也助于构建人脸的3D模型,还可协助解决人脸三维重建问题。
但是从一张人脸的RGB图片中预测出整个人脸的深度信息本身是一个具有病态性质的问题,因为在将RGB图像的颜色信息映射成深度值的过程中面临诸多的不确定性。为了解决这一问题,一些现有的方法通过马尔科夫随场来获得深度信息,通过条件随机场来正则化深度图,但是这些方法依赖于图像的水平校准,因而对训练环境比较敏感。而后,随着卷积神经网络(Convolutional Neural Networks,CNN)的提出,有人提出了基于卷积神经网络进行深度预测的方法,这些方法取得了较好的效果,但也存在诸多缺陷和不足,例如:随着卷积网络层数的不断增加会面临梯度消失从而训练不下去的问题;网络训练出的深度图精度较低,图像较为粗糙。
发明内容
本发明的主要目的在于提出一种基于卷积神经网络的人脸深度预测方法,以增强卷积神经网络的学习能力,解决前述现有技术所存在的随着卷积网络层数增加而梯度消失的问题,同时提升深度预测的准确性,以获得更加清晰的深度图。
本发明为达上述目的所提供的一种技术方案如下:
一种基于卷积神经网络的人脸深度预测方法,包括生成一人脸深度预测神经网络的步骤,所述生成一人脸深度预测神经网络的步骤包括:
S1、搭建卷积神经网络,所述卷积神经网络包括多个依次串联的卷积层单元和多个依次串联的反卷积层,并且最末一个卷积层单元的输出端连接于第一个反卷积层的输入端;每个所述卷积层单元包括一个卷积层以及该卷积层输出端依次串联的一规范化操作和一激励操作;每个所述卷积层单元分别并联有一个k×k的卷积,其中k为大于0的整数;
S2、初始化所述卷积神经网络的训练参数;
S3、将用于训练的人脸图片输入到初始化后的卷积神经网络中,以最小化代价函数为目标进行迭代,以生成所述人脸深度预测神经网络;其中,每迭代一次则更新一次所述训练参数。
对于RGB图像而言,卷积层数的增加可以使神经网络更加充分地学习图片的特征,使得图像处理结果更佳,而现有技术中用于训练的神经网络随着层数增加会导致梯度消失而无法收敛,鉴于此,本发明提供的上述人脸深度预测方法,通过搭建前述具有特定架构的卷积神经网络,即通过对每个卷积层后面连接规范化操作和激励操作以提升深层网络的收敛性,但提升收敛性的同时网络学习能力会有所退化且训练速度慢,此时又通过并联k×k的卷积,使网络层间的数据流通更加快捷、流畅同时还无需引入额外的参数、不增加复杂度;
这样一来,不仅解决了因网络层数增加导致梯度消失而无法收敛的问题,还提高了网络的训练速度,从而可以快速地训练层数较多的卷积神经网络;经过训练得到的人脸深度预测神经网络,只要将待预测的RGB人脸图片输入,经过卷积层提取图像特征,再经过反卷积层将图像特征复原成深度图,这样的深度图在三维重建中具有非常重要的应用;另外,由于解决了随着网络层数增加梯度消失、训练速度慢的问题,可以多增加网络层数以追求深度预测的高准确性,从而获得较为清晰的深度图。
优选地,步骤S2中通过随机高斯分布生成初始化的训练参数;步骤S3中利用反向传播算法来更新所述训练参数。
优选地,步骤S3中的代价函数如下:
其中,为正则项,
Figure BDA0001254328010000023
为损失项;yi、yi*分别表示用于训练的第i张人脸图片经过所述卷积神经网络训练后所得到的像素深度值、像素ground truth值,n表示用于训练的每张人脸图片中具有深度信息的像素点个数,λ表示损失项的正则系数。
优选地,通过采用Adam Optimizer方法来最小化代价函数。
优选地,所述规范化操作为Batch Normalization操作,所述激励操作为LeakyReLU激励操作。进行Batch Normalization操作可以解决卷积神经网络随着卷积层数增多而导致的内部变量偏移问题,从而使得神将网络能够更容易优化,避免陷入局部最优。
本发明为达上述目的还提供了另一种技术方案如下:
一种基于卷积神经网络的人脸深度预测方法,包括生成一人脸深度预测神经网络的步骤,所述生成一人脸深度预测神经网络的步骤包括:
S1、搭建卷积神经网络,所述卷积神经网络包括多个依次串联的第一卷积层单元、多个依次串联的第二卷积层和多个依次串联的反卷积层,并且,所述第二卷积层的数量与所述反卷积层的数量相同;每个所述第一卷积层单元均包括一个第一卷积层以及该第一卷积层输出端依次串联的一规范化操作和一激励操作,并且,每个所述第一卷积层单元分别并联有一个k×k的卷积;最末一个所述第一卷积层单元的输出端连接于第一个所述第二卷积层的输入端,最末一个所述第二卷积层的输出端连接于第一个反卷积层的输入端;第一个所述第二卷积层的输出端与最末一个反卷积层的输出端之间连接有一个k×k的卷积,第二个所述第二卷积层的输出端与倒数第二个反卷积层的输出端之间连接有一个k×k的卷积,依此类推,使得每一个所述第二卷积层的输出端分别经由一个k×k的卷积后一一对应地连接至一反卷积层的输出端;其中k为大于0的整数;
S2、初始化所述卷积神经网络的训练参数;
S3、将用于训练的人脸图片输入到初始化后的卷积神经网络中,以最小化代价函数为目标进行迭代,以生成所述人脸深度预测神经网络;其中,每迭代一次则更新一次所述训练参数。
本发明另提供的上述人脸深度预测方法,具有与前一种人脸深度预测方法相同的基本思路,即通过对卷积层后面连接规范化操作和激励操作以提升深层网络的收敛性,又通过并联k×k的卷积使网络层间的数据流通更加快捷、流畅同时还无需引入额外的参数、不增加复杂度,不同的地方仅仅在于:
后面一部分卷积层(即多个所述第二卷积层)并未连接规范化操作和激励操作,但其各自的输出不仅连接到后一卷积层,还分别进行k×k的卷积而后一一对应地(对应方式参见前述技术方案内容)叠加到反卷积层的输出端,这样可以使卷积神经网络的训练精度更高,从而使人脸预测神经网络的输出深度图更加清晰。
优选地,步骤S2中通过随机高斯分布生成初始化的训练参数;步骤S3中利用反向传播算法来更新所述训练参数。
优选地,步骤S3中的代价函数如下:
其中,
Figure BDA0001254328010000042
为正则项,
Figure BDA0001254328010000043
为损失项;yi、yi*分别表示用于训练的第i张人脸图片经过所述卷积神经网络训练后所得到的像素深度值、像素groundtruth值,n表示用于训练的每张人脸图片中具有深度信息的像素点个数,λ表示损失项的正则系数。
优选地,采用Adam Optimizer方法来最小化代价函数。
优选地,所述规范化操作为BatchNormalization操作,所述激励操作为LeakyReLU激励操作。
附图说明
图1是本发明基于卷积神经网络的人脸深度预测方法的流程图;
图2是本发明其中一种具体实施方式的卷积神经网络的架构图;
图3是本发明另外一种具体实施方式的卷积神经网络的架构图;
图4是本发明的人脸深度预测神经网络的输入、输出示例图。
具体实施方式
下面结合附图和具体的实施方式对本发明作进一步说明。
在计算机视觉和基于神经网络进行图像处理的领域,网络层数越多,则可提取的图像特征等级也就越高,图像处理效果越佳。但梯度消失是训练深层网络的主要障碍,会导致无法收敛。鉴于此,本发明提出了一种新型的基于卷积神经网络的人脸深度预测方法,该方法的核心在于快速训练生成一层数较多且预测较准确的人脸深度预测神经网络,生成所述人脸深度预测神经网络的的大致流程如图1所示,首先搭建具有特定架构的卷积神经网络,然后初始化该卷积神经网络的训练参数,接着输入训练图片进行该卷积神经网络的训练,以最小化代价函数为目标进行迭代并更新参数,从而生成一个人脸深度预测神经网络。只要将待预测的图片输入到生成的人脸深度预测神经网络,即可输出包含有人脸深度信息的深度图,该人脸深度预测神经网络的输入和输出对比图如图4所示,输入的是上方的人脸RGB图片,输出的是下方的深度图。其中,本发明提供的所述具有特定架构的卷积神经网络主要有两种模型,图2和图3分别示出了两种不同架构的卷积神经网络的具体实施方式。
本发明的人脸深度预测方法中,所搭建的其中一种卷积神经网络的架构可参考图2,包括多个依次串联的卷积层单元100和多个依次串联的反卷积层,并且最末一个卷积层单元的输出端连接于第一个反卷积层的输入端;如图2所示,每个卷积层单元100包括一个卷积层以及该卷积层输出端依次串联的一规范化操作和一激励操作;每个卷积层单元分别并联有一个k×k的卷积,其中k为大于0的整数(在后述的例子中均取k=5)。在一种优选的实施例中,所述规范化操作是Batch Normalization操作,即把每一卷积层的输入正则化为标准高斯分布;所述激励操作是Leaky ReLU激励操作,使用Leaky ReLU激励函数可以克服普通ReLU激励函数在梯度较大情况下产生的神经元死亡现象。在图2中,示例性地画出了30个卷积层,5个反卷积层,但这仅仅是一个具体的实施例,并不限制本发明的保护范围,仅将神经网络层数作变化属本发明的保护范围之内。
在搭建了上述架构的卷积神经网络之后,采用随机高斯分布初始化该卷积神经网络的训练参数。以图2所示的卷积神经网络为例,来说明本发明的人脸深度预测方法:
选取30000张人脸正面RGB图片(包括男女)作为数据集,每张图片的尺寸为640x640,每张图片都有其ground truth图(此处指参考标准图),将数据集随机分为两部分,数量多的一部分作为训练神经网络用的训练集(例如25000张),数量少的另一部分作为测试用。在本例中,图片输入卷积神经网络前将其裁剪为384x384。然后,采用随机高斯分布来初始化卷积神经网络的训练参数:训练参数包括每层的输入大小inputsize、卷积核尺寸kernelsize、卷积核的步长stride等,每层卷积层的输出大小outputsize=(inputsize-kernelsize)/stride+1。在本实施例中每次输入到所述卷积神经网络进行网络训练的图像数为50,学习率可取为0.0001。其中,学习率越小,则神经网络的学习能力越强,学习较为细致,但训练速度相对较慢,反之,训练速度较快但学习较为粗糙。
接着,采用训练集中的图片开始对所述卷积神经网络进行训练,求解以下代价函数:
Figure BDA0001254328010000061
以上代价函数由正则项
Figure BDA0001254328010000062
和损失项
Figure BDA0001254328010000063
构成,y、y*分别表示训练后得到的像素的深度值和像素groundtruth值(groundtruth值:此处指像素在用于训练的图片中的真实深度值,也即深度值的参考标准),加下标i之后的yi、yi*分别表示用于训练的第i张人脸图片经过所述卷积神经网络训练后所得到的像素的深度值、像素ground truth值,n表示用于训练的每张人脸图片中具有深度信息的像素点个数,λ表示损失项的正则系数,本例中取λ=0.5。
由于在训练的过程中,图片上物体边界周围的深度信息经常会存在缺失现象,本实施例采取的做法是将这些缺失深度信息的点去除掉,只在有深度信息的点上来最小化代价函数。
本例中采用Adam Optimizer方法来最小化代价函数,Adam算法相比于传统的SGD(随机梯度下降)更加适用于数据量大、层数深的网络。Adam算法是根据代价函数对每个参数的梯度进行一阶距估计和二阶距估计从而动态调整每个参数的学习率。Adam算法的优点在于每一次迭代过程中的参数更加平稳,不容易陷入到局部最优。每求解一次代价函数则采用反向传播算法来更新一次训练参数,在不断迭代的过程中,当代价函数的值几乎不再下降时,可认为已最小化,此时可以停止训练网络,此时更新的参数为最终训练好的网络的参数,此时已训练成为所述人脸深度预测神经网络。
采用上述经训练形成的所述人脸深度预测神经网络,以下面的例子进行深度预测:输入待预测的人脸RGB图像m=6000张,每张大小为640x640,输出的深度预测图像的大小为384x384,其中:
平均绝对相关误差
均方根误差
Figure BDA0001254328010000072
log10误差
Figure BDA0001254328010000073
rel、rms、log10的值越小,表明所述人脸深度预测神经网络的预测结果越准确,即所输出的深度图的深度信息越精确。
本发明的人脸深度预测方法中,所搭建的另外一种卷积神经网络的架构可参考图3,包括多个依次串联的第一卷积层单元200、多个依次串联的第二卷积层和多个依次串联的反卷积层,并且,所述第二卷积层的数量与所述反卷积层的数量相同;每个所述第一卷积层单元均包括一个第一卷积层以及该第一卷积层输出端依次串联的一规范化操作和一激励操作,并且,每个所述第一卷积层单元分别并联有一个k×k的卷积;最末一个所述第一卷积层单元的输出端连接于第一个所述第二卷积层的输入端,最末一个所述第二卷积层的输出端连接于第一个反卷积层的输入端;第一个所述第二卷积层的输出端与最末一个反卷积层的输出端之间连接有一个k×k的卷积,第二个所述第二卷积层的输出端与倒数第二个反卷积层的输出端之间连接有一个k×k的卷积,依此类推,使得每一个所述第二卷积层的输出端分别经由一个k×k的卷积后一一对应地连接至一反卷积层的输出端;其中k为大于0的整数。图3示例性地绘示了一个具有5个第二卷积层和5个反卷积层的网络,第一卷积层单元的数量优选地较多,例如25,30,40等。层数的多少并不限制本发明的保护范围,仅将神经网络层数作变化属本发明的保护范围之内。
采用如图3所示架构的卷积神经网络来进行训练,虽架构与图2所示的不同,但这两者,训练过程是采用相同的方法,在此不再赘述,且具有同样的优点,所得到的人脸深度预测神经网络的预测精确度也同样较好。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于卷积神经网络的人脸深度预测方法,包括生成一人脸深度预测神经网络的步骤,所述生成一人脸深度预测神经网络的步骤包括:
S1、搭建卷积神经网络,所述卷积神经网络包括多个依次串联的卷积层单元和多个依次串联的反卷积层,并且最末一个卷积层单元的输出端连接于第一个反卷积层的输入端;每个所述卷积层单元包括一个卷积层以及该卷积层输出端依次串联的一规范化操作和一激励操作,通过对卷积层后面连接所述规范化操作和所述激励操作以提升深层网络的收敛性;每个所述卷积层单元分别并联有一个k×k的卷积,其中k为大于0的整数;
S2、初始化所述卷积神经网络的训练参数;
S3、将用于训练的人脸图片输入到初始化后的卷积神经网络中,以最小化代价函数为目标进行迭代,以生成所述人脸深度预测神经网络;其中,每迭代一次则更新一次所述训练参数。
2.如权利要求1所述的人脸深度预测方法,其特征在于:步骤S2中通过随机高斯分布生成初始化的训练参数;步骤S3中利用反向传播算法来更新所述训练参数。
3.如权利要求1所述的人脸深度预测方法,其特征在于:步骤S3中的代价函数如下:
Figure FDA0002272150090000011
其中,
Figure FDA0002272150090000012
为正则项,为损失项;yi、yi*分别表示用于训练的第i张人脸图片经过所述卷积神经网络训练后所得到的像素深度值、像素ground truth值,n表示用于训练的每张人脸图片中具有深度信息的像素点个数,λ表示损失项的正则系数。
4.如权利要求3所述的人脸深度预测方法,其特征在于:通过采用Adam Optimizer方法来最小化代价函数。
5.如权利要求1所述的人脸深度预测方法,其特征在于:所述规范化操作为BatchNormalization操作,所述激励操作为Leaky ReLU激励操作。
6.一种基于卷积神经网络的人脸深度预测方法,包括生成一人脸深度预测神经网络的步骤,所述生成一人脸深度预测神经网络的步骤包括:
S1、搭建卷积神经网络,所述卷积神经网络包括多个依次串联的第一卷积层单元、多个依次串联的第二卷积层和多个依次串联的反卷积层,并且,所述第二卷积层的数量与所述反卷积层的数量相同;每个所述第一卷积层单元均包括一个第一卷积层以及该第一卷积层输出端依次串联的一规范化操作和一激励操作,通过对卷积层后面连接所述规范化操作和所述激励操作以提升深层网络的收敛性;并且,每个所述第一卷积层单元分别并联有一个k×k的卷积;最末一个所述第一卷积层单元的输出端连接于第一个所述第二卷积层的输入端,最末一个所述第二卷积层的输出端连接于第一个反卷积层的输入端;第一个所述第二卷积层的输出端与最末一个反卷积层的输出端之间连接有一个k×k的卷积,第二个所述第二卷积层的输出端与倒数第二个反卷积层的输出端之间连接有一个k×k的卷积,依此类推,使得每一个所述第二卷积层的输出端分别经由一个k×k的卷积后一一对应地连接至一反卷积层的输出端;其中k为大于0的整数;
S2、初始化所述卷积神经网络的训练参数;
S3、将用于训练的人脸图片输入到初始化后的卷积神经网络中,以最小化代价函数为目标进行迭代,以生成所述人脸深度预测神经网络;其中,每迭代一次则更新一次所述训练参数。
7.如权利要求6所述的人脸深度预测方法,其特征在于:步骤S2中通过随机高斯分布生成初始化的训练参数;步骤S3中利用反向传播算法来更新所述训练参数。
8.如权利要求6所述的人脸深度预测方法,其特征在于:步骤S3中的代价函数如下:
Figure FDA0002272150090000021
其中,
Figure FDA0002272150090000022
为正则项,
Figure FDA0002272150090000023
为损失项;yi、yi*分别表示用于训练的第i张人脸图片经过所述卷积神经网络训练后所得到的像素深度值、像素ground truth值,n表示用于训练的每张人脸图片中具有深度信息的像素点个数,λ表示损失项的正则系数。
9.如权利要求8所述的人脸深度预测方法,其特征在于:采用AdamOptimizer方法来最小化代价函数。
10.如权利要求6所述的人脸深度预测方法,其特征在于:所述规范化操作为BatchNormalization操作,所述激励操作为Leaky ReLU激励操作。
CN201710183903.1A 2017-03-24 2017-03-24 基于卷积神经网络的人脸深度预测方法 Active CN107103285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710183903.1A CN107103285B (zh) 2017-03-24 2017-03-24 基于卷积神经网络的人脸深度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710183903.1A CN107103285B (zh) 2017-03-24 2017-03-24 基于卷积神经网络的人脸深度预测方法

Publications (2)

Publication Number Publication Date
CN107103285A CN107103285A (zh) 2017-08-29
CN107103285B true CN107103285B (zh) 2020-03-03

Family

ID=59675047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710183903.1A Active CN107103285B (zh) 2017-03-24 2017-03-24 基于卷积神经网络的人脸深度预测方法

Country Status (1)

Country Link
CN (1) CN107103285B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784270A (zh) * 2017-09-08 2018-03-09 四川云图睿视科技有限公司 一种基于卷积神经网络的人脸检测方法及系统
CN107679477B (zh) * 2017-09-27 2021-02-02 深圳市未来媒体技术研究院 基于空洞卷积神经网络的人脸深度和表面法向量预测方法
CN107767419A (zh) * 2017-11-07 2018-03-06 广州深域信息科技有限公司 一种人体骨骼关键点检测方法及装置
CN107832727A (zh) * 2017-11-21 2018-03-23 深圳市未来媒体技术研究院 一种室内商场店铺特征提取方法
CN108537733B (zh) * 2018-04-11 2022-03-11 南京邮电大学 基于多路径深度卷积神经网络的超分辨率重建方法
CN108629291B (zh) * 2018-04-13 2020-10-20 深圳市未来媒体技术研究院 一种抗网格效应的人脸深度预测方法
CN109272046A (zh) * 2018-09-26 2019-01-25 北京科技大学 基于L2重新正则化Adam切换模拟回火SGD的深度学习方法
CN111507131B (zh) * 2019-01-31 2023-09-19 北京市商汤科技开发有限公司 活体检测方法及装置、电子设备和存储介质
US11599768B2 (en) 2019-07-18 2023-03-07 International Business Machines Corporation Cooperative neural network for recommending next user action
CN114119923B (zh) * 2021-11-29 2022-07-19 浙江大学 三维人脸重建方法、装置以及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204468A (zh) * 2016-06-27 2016-12-07 深圳市未来媒体技术研究院 一种基于ReLU卷积神经网络的图像去噪方法
CN106408522A (zh) * 2016-06-27 2017-02-15 深圳市未来媒体技术研究院 一种基于卷积对神经网络的图像去噪方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204468A (zh) * 2016-06-27 2016-12-07 深圳市未来媒体技术研究院 一种基于ReLU卷积神经网络的图像去噪方法
CN106408522A (zh) * 2016-06-27 2017-02-15 深圳市未来媒体技术研究院 一种基于卷积对神经网络的图像去噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于卷积神经网络的图像语义分割;陈鸿翔;《中国优秀硕士学位论文全文数据库信息科技辑》;20160715;全文 *

Also Published As

Publication number Publication date
CN107103285A (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
CN107103285B (zh) 基于卷积神经网络的人脸深度预测方法
CN107679477B (zh) 基于空洞卷积神经网络的人脸深度和表面法向量预测方法
CN110298361B (zh) 一种rgb-d图像的语义分割方法和系统
KR102302725B1 (ko) 룸 레이아웃 추정 방법들 및 기술들
CN113240580B (zh) 一种基于多维度知识蒸馏的轻量级图像超分辨率重建方法
CN107945204B (zh) 一种基于生成对抗网络的像素级人像抠图方法
CN109816012B (zh) 一种融合上下文信息的多尺度目标检测方法
CN108510485B (zh) 一种基于卷积神经网络的无参照图像质量评估方法
CN108229381B (zh) 人脸图像生成方法、装置、存储介质和计算机设备
CN108629291B (zh) 一种抗网格效应的人脸深度预测方法
CN111340814B (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN108230278B (zh) 一种基于生成对抗网络的图像去雨滴方法
CN112001914A (zh) 深度图像补全的方法和装置
CN106780588A (zh) 一种基于稀疏激光观测的图像深度估计方法
CN112396645B (zh) 一种基于卷积残差学习的单目图像深度估计方法和系统
CN112686119B (zh) 基于自注意力生成对抗网络的车牌运动模糊图像处理方法
CN112489164B (zh) 基于改进深度可分离卷积神经网络的图像着色方法
WO2015078017A1 (en) Method and system for exacting face features from data of face images
CN108171249B (zh) 一种基于rgbd数据的局部描述子学习方法
CN110705566B (zh) 一种基于空间金字塔池的多模态融合显著性检测方法
CN111476249A (zh) 多尺度大感受野卷积神经网络的构建方法
CN110222615A (zh) 基于InceptionV3网络的被遮挡目标识别方法
CN112861727A (zh) 一种基于混合深度可分离卷积的实时语义分割方法
CN111553296B (zh) 一种基于fpga实现的二值神经网络立体视觉匹配方法
CN114743027B (zh) 弱监督学习引导的协同显著性检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant