CN107704812A - 一种人脸识别方法及移动终端 - Google Patents
一种人脸识别方法及移动终端 Download PDFInfo
- Publication number
- CN107704812A CN107704812A CN201710841531.7A CN201710841531A CN107704812A CN 107704812 A CN107704812 A CN 107704812A CN 201710841531 A CN201710841531 A CN 201710841531A CN 107704812 A CN107704812 A CN 107704812A
- Authority
- CN
- China
- Prior art keywords
- sample
- domain
- face
- network
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012549 training Methods 0.000 claims abstract description 188
- 238000001514 detection method Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- 238000007689 inspection Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 10
- 230000036544 posture Effects 0.000 description 25
- 238000012545 processing Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 230000006854 communication Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 3
- 230000001151 other effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种人脸识别方法及移动终端,其中方法包括:获取目标图像;通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。本发明使用多域混合网络模型进行人脸识别,能够实现多姿态的人脸识别,提高人脸识别的识别效果。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种人脸识别方法及移动终端。
背景技术
人脸识别技术广泛应用于金融身份识别、安防监控或者通讯设备身份识别等领域,当前,针对多姿态的人脸识别通常采用人脸姿态校正,获取正脸信息,然后进行人脸识别。例如采用正脸补偿算子进行正脸校正的方法,一般通过人脸角度信息预测,根据脸部信息的对称性,获取正脸信息。然而,基于对称性的冗余信息,并不能完全补充不可见一侧的人脸信息。可见,现有人脸识别的方法存在识别效果较差的问题。
发明内容
本发明实施例提供一种人脸识别方法及移动终端,以解决人脸识别效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:一种人脸识别方法,包括:
获取目标图像;
通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
第一方面,本发明实施例提供了一种人脸识别方法,包括:
获取目标图像;
通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
第二方面,本发明实施例提供了一种移动终端,包括:
获取模块,用于获取目标图像;
识别模块,用于通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
第三方面,本发明实施例提供了另一种移动终端,包括处理器,存储器,存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述人脸识别方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述人脸识别方法的步骤。
这样,本发明实施例使用多域混合网络模型进行人脸识别,能够实现多姿态的人脸识别,提高人脸识别的识别效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。
图1是本发明实施例提供的一种人脸识别方法的流程图;
图2是本发明实施例提供的另一种人脸识别方法的流程图;
图3是本发明实施例提供的一种多域混合网络模型训练的流程图;
图4是本发明实施例提供的基础网络训练模型的结构示意图;
图5是本发明实施例提供的权重训练模型的结构示意图;
图6是本发明实施例提供的包括五个分域网络的多域混合网络模型示意图;
图7是本发明实施例提供的包括五个分域网络的多域混合网络模型的训练流程示意图。
图8是本发明实施例提供的一种移动终端的结构图;
图9是本发明实施例提供的另一种移动终端的结构图;
图10是本发明实施例提供的另一种移动终端的结构图;
图11是本发明实施例提供的另一种移动终端的结构图;
图12是本发明实施例提供的另一种移动终端的结构图;
图13是本发明实施例提供的一种移动终端的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种人脸识别方法的流程图,如图1所示,包括以下步骤:
步骤101、获取目标图像。
该步骤中,移动终端可以获取目标图像,该目标图像用于人脸识别,该目标图像可以通过图像采集器件(例如摄像头)采集而被移动终端获取。
可选的,移动终端获取目标图像的方式是:首先,摄像头向移动终端输入初始图像;其次,该初始图像经人脸检测算法,得到人脸区域;再次,对得到的人脸区域进行人脸特征点检测,例如,可以只检测五个人脸特征点,左眼中心、右眼中心、鼻尖点、左嘴角点和右嘴角点;然后,利用平均脸,进行人脸对齐,并截取人脸区域,该人脸区域可以作为上述目标图像。
步骤102、通过多域混合网络模型对所述目标图像进行人脸识别。
该步骤中,移动终端可以通过多域混合网络模型对上述目标图像进行人脸识别,其中,该多域混合网络模型为使用多域样本训练得到的网络模型,该多域样本为按照姿态分类的训练样本。
本发明实施例中,由于多域混合网络模型使用的训练样本按照姿态进行分类,因此本发明实施例能够实现多姿态的人脸识别。可见,本发明实施例能够提高人脸识别的识别效果。
参见图2,图2是本发明实施例提供的另一种人脸识别方法的流程图,如图2所示,包括以下步骤:
步骤201、使用多域样本对多域混合网络模型进行训练。
该步骤中,移动终端可以使用多域样本对多域混合网络模型进行训练,其中,多域样本为按照人脸姿态分类得到的训练样本,多域样本的数量应当大于或者等于2。
可选的,多域混合网络模型包括基础网络和多域网络,其中,多域网络包括至少两个按照人脸姿态分类得到的分域网络。
这里,至少两个分域网络可以理解为在共同的基础网络下的至少两个子集合的网络,还可以理解为在共同的基础网络下的多任务识别网络。
基于上述多域混合网络模型,如图3所示,使用多域样本对多域混合网络模型进行训练,可以包括如下步骤:
步骤2011、将多域样本输入至所述基础网络中进行训练,得到所述多域样本中每个样本的第一特征。
该步骤中,移动终端可以将预先准备的N个训练样本(即多域样本)输入至基础网络base-net进行训练,其中,训练样本可以是具有人脸图像的图片,N为大于1的正整数。
N个训练样本经过基础网络训练之后,移动终端可以获得每个训练样本的第一特征Ψi(i=0,1,…,N),并将第一特征Ψi输出,其中,第一特征Ψi可以理解为一个向量。
基础网络采用的网络模型可以是残差网络,图4示出了基础网络训练模型结构示意图。
步骤2012、将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征。
该步骤中,移动终端可以将N个训练样本(即多域样本)的N个第一特征Ψi分组输入至对应的分域网络domain-net中进行训练,得到N个训练样本的第二特征out,其中,第二特征out可以理解为一个向量。
可选的,每个分域网络包括身份识别网络和权重检测网络;
所述将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征的步骤,包括:
将所述多域样本的第一特征分组输入至对应的分域网络中;
在每个分域网络中对每个样本分别进行身份识别网络训练和权重检测网络训练,得到每个样本的身份特征和权重特征;
根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征。
本发明实施方式中,移动终端可以将N个训练样本的N个第一特征Ψi分组输入至对应的分域网络domain-net中进行训练。
本发明实施方式中,由于设置有至少两个分域网络,因此,为了综合考虑至少两个分域网络在人脸识别训练中的权重,在每个分域网络中新增卷积层,用于进行权重训练。图5示出了权重训练模型的结构示意图。
由于每个分域网络包括身份识别网络和权重检测网络,因此,每个训练样本可以在各自的分域网络中进行身份训练和权重训练,从而可以获得每个训练样本的身份特征pi(i=0,1,…,N)和权重特征wi(i=0,1,…,N),其中,身份特征pi和权重特征wi均可以理解为一个向量。
这里,从第一特征Ψi到身份特征pi的过程可以表示为:
g{Ψi}→{pi},i=0,1,…,N
从第一特征Ψi到权重特征wi的过程可以表示为:
f{Ψi}→{wi},i=0,1,…,N
将N个训练样本进行分组,可以根据训练样本的人脸姿态进行分组。
本发明实施方式中,通过至少两个分域网络进行权重训练和身份训练,相对于单一训练的网络,这种多域混合训练的方式充分考虑了不同域(即不同人脸姿态)对于人脸识别结果的影响,从而有利于提高人脸识别的识别效果。
可选的,所述根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征的步骤,包括:
对每个训练样本的身份特征和权重特征进行加权求和,得到所述多域样本的第二特征。
本发明实施方式中,可以通过将每个训练样本的身份特征和权重特征进行加权求和的方式,得到N个训练样本(即多域样本)的第二特征,从身份特征pi和权重特征wi到第二特征out可以表示如下:
本发明实施方式中,通过加权求和的方式得到的多域样本的第二特征,综合考虑至少两个分域网络在人脸识别训练中的权重,能够提高多姿态人脸识别的识别效果。
可选的,在所述使用多域样本对所述多域混合网络模型进行训练的步骤之前,所述方法还包括:
对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类。
本发明实施方式中,在使用N个训练样本对多域混合网络模型进行训练之前,移动终端可以将预先准备的N个训练样本进行分域处理(即分类处理),通过分域处理,即可确定N个训练样本中每个训练样本所对应的分域网络。
具体的,移动终端可以对N个训练样本进行姿态检测,并根据姿态检测的检测结果对N个训练样本进行分类。例如,移动终端可以采用人脸姿态检测算子对N个训练样本进行人脸姿态检测。
本发明实施方式中,通过对N个训练样本进行人脸姿态检测,根据人脸姿态检测的检测结果来对N个训练样本进行分域处理,可以综合考虑不同人脸姿态对于人脸识别结果的影响,有利于提高多姿态人脸识别的识别效果。
可选的,所述对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类的步骤,包括:
对训练样本进行人脸左右偏转角度和/或人脸上下偏转角度检测;
根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络。
一般的,人脸姿态可以分为三个维度,包括平面内角度Roll,上下偏转角度Pitch,以及左右偏转角度Yaw。由于Roll角度可以通过简单的旋转操作获取正面人脸,因此,为简化训练样本的分类处理,本发明实施方式中,只考虑人脸上下偏转角度Pitch和人脸左右偏转角度Yaw。
可选的,所述根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络的步骤,包括:
若训练样本的人脸左右偏转角度和人脸上下偏转角度均大于﹣10°且小于10°,则确定训练样本对应第一分域网络;
若训练样本的人脸左右偏转角度大于或者等于﹣35°且小于或者等于﹣10°,或者,训练样本的人脸左右偏转角度大于或者等于10°且小于或者等于35°,则确定训练样本对应第二分域网络;
若训练样本的人脸左右偏转角度小于﹣35°或者大于35°,则确定训练样本对应第三分域网络;
若训练样本的人脸上下偏转角度大于或者等于﹣20°且小于或者等于﹣10°,或者,训练样本的人脸上下偏转角度大于或者等于10°且小于或者等于20°,则确定训练样本对应第四分域网络;
若训练样本的人脸上下偏转角度为小于﹣20°或者大于20°,则确定训练样本对应第五分域网络。
本发明实施方式中,得到了五个分域网络,分别为第一分域网络(Near frontal域)、第二分域网络(Yaw-1域)、第三分域网络(Yaw-2域)、第四分域网络(Pitch-1域)、第五分域网络(Pitch-2域)。图6示出了包括上述五个分域网络的多域混合网络模型示意图,图7示出了包括上述五个分域网络的多域混合网络模型的训练流程示意图。
步骤202、获取目标图像。
该步骤中,移动终端可以获取目标图像,该目标图像用于人脸识别,该目标图像可以通过图像采集器件(例如摄像头)采集而被移动终端获取。
可选的,移动终端获取目标图像的方式是:首先,摄像头向移动终端输入初始图像;其次,该初始图像经人脸检测算法,得到人脸区域;再次,对得到的人脸区域进行人脸特征点检测,例如,可以只检测五个人脸特征点,左眼中心、右眼中心、鼻尖点、左嘴角点和右嘴角点;然后,利用平均脸,进行人脸对齐,并截取人脸区域,该人脸区域可以作为上述目标图像。
步骤203、通过多域混合网络模型对所述目标图像进行人脸识别。
该步骤中,移动终端可以通过步骤201中训练得到的多域混合网络模型对上述目标图像进行人脸识别。
本发明实施例中,由于多域混合网络模型使用的训练样本按照姿态进行分类,因此本发明实施例能够实现多姿态的人脸识别。可见,本发明实施例能够提高人脸识别的识别效果。
参见图8,图8是本发明实施例提供的一种移动终端的结构图,如图8所示,移动终端800包括:
获取模块801,用于获取目标图像;
识别模块802,用于通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
可选的,如图9所示,移动终端800还包括:
训练模块803,用于使用多域样本对所述多域混合网络模型进行训练,所述多域样本为按照人脸姿态分类得到的训练样本。
可选的,所述多域混合网络模型包括基础网络和多域网络,所述多域网络包括至少两个按照人脸姿态分类得到的分域网络;
如图10所示,所述训练模块803包括:
第一训练子模块8031,用于将所述多域样本输入至所述基础网络中进行训练,得到所述多域样本中每个样本的第一特征;
第二训练子模块8032,用于将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征。
可选的,每个分域网络包括身份识别网络和权重检测网络;
所述第二训练子模块8032具体用于:
将所述多域样本的第一特征分组输入至对应的分域网络中;
在每个分域网络中对每个样本分别进行身份识别网络训练和权重检测网络训练,得到每个样本的身份特征和权重特征;
根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征。
可选的,所述第二训练子模块8032具体用于:
对每个训练样本的身份特征和权重特征进行加权求和,得到所述多域样本的第二特征。
可选的,如图11所示,移动终端800还包括:
检测模块804,用于对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类。
可选的,如图12所示,所述检测模块804包括:
检测子模块8041,用于对训练样本进行人脸左右偏转角度和/或人脸上下偏转角度检测;
确定子模块8042,用于根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络。
可选的,所述确定子模块8042具体用于:
若训练样本的人脸左右偏转角度和人脸上下偏转角度均大于﹣10°且小于10°,则确定训练样本对应第一分域网络;
若训练样本的人脸左右偏转角度大于或者等于﹣35°且小于或者等于﹣10°,或者,训练样本的人脸左右偏转角度大于或者等于10°且小于或者等于35°,则确定训练样本对应第二分域网络;
若训练样本的人脸左右偏转角度小于﹣35°或者大于35°,则确定训练样本对应第三分域网络;
若训练样本的人脸上下偏转角度大于或者等于﹣20°且小于或者等于﹣10°,或者,训练样本的人脸上下偏转角度大于或者等于10°且小于或者等于20°,则确定训练样本对应第四分域网络;
若训练样本的人脸上下偏转角度为小于﹣20°或者大于20°,则确定训练样本对应第五分域网络。
本发明实施例提供的移动终端800能够实现图1至图7的方法实施例中移动终端实现的各个过程,为避免重复,这里不再赘述。
本发明实施例中,由于多域混合网络模型使用的训练样本按照姿态进行分类,因此本发明实施例能够实现多姿态的人脸识别。可见,本发明实施例能够提高人脸识别的识别效果。
图13为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端1300包括但不限于:射频单元1301、网络模块1302、音频输出单元1303、输入单元1304、传感器1305、显示单元1306、用户输入单元1307、接口单元1308、存储器1309、处理器1310、以及电源1311等部件。本领域技术人员可以理解,图13中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器1310,用于:
获取目标图像;
通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
可选的,处理器1310,还用于:
使用多域样本对所述多域混合网络模型进行训练,所述多域样本为按照人脸姿态分类得到的训练样本。
可选的,所述多域混合网络模型包括基础网络和多域网络,所述多域网络包括至少两个按照人脸姿态分类得到的分域网络;
处理器1310,还用于:
将所述多域样本输入至所述基础网络中进行训练,得到所述多域样本中每个样本的第一特征;
将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征。
可选的,每个分域网络包括身份识别网络和权重检测网络;
处理器1310,还用于:
将所述多域样本的第一特征分组输入至对应的分域网络中;
在每个分域网络中对每个样本分别进行身份识别网络训练和权重检测网络训练,得到每个样本的身份特征和权重特征;
根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征。
可选的,处理器1310,还用于:
对每个训练样本的身份特征和权重特征进行加权求和,得到所述多域样本的第二特征。
可选的,处理器1310,还用于:
对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类。
可选的,处理器1310,还用于:
对训练样本进行人脸左右偏转角度和/或人脸上下偏转角度检测;
根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络。
可选的,处理器1310,还用于:
若训练样本的人脸左右偏转角度和人脸上下偏转角度均大于﹣10°且小于10°,则确定训练样本对应第一分域网络;
若训练样本的人脸左右偏转角度大于或者等于﹣35°且小于或者等于﹣10°,或者,训练样本的人脸左右偏转角度大于或者等于10°且小于或者等于35°,则确定训练样本对应第二分域网络;
若训练样本的人脸左右偏转角度小于﹣35°或者大于35°,则确定训练样本对应第三分域网络;
若训练样本的人脸上下偏转角度大于或者等于﹣20°且小于或者等于﹣10°,或者,训练样本的人脸上下偏转角度大于或者等于10°且小于或者等于20°,则确定训练样本对应第四分域网络;
若训练样本的人脸上下偏转角度为小于﹣20°或者大于20°,则确定训练样本对应第五分域网络。
本发明实施例中,通过使用多域混合网络模型进行人脸识别,由于多域混合网络模型使用的训练样本按照姿态进行分类,因此本发明实施例能够实现多姿态的人脸识别。可见,本发明实施例能够提高人脸识别的识别效果。
应理解的是,本发明实施例中,射频单元1301可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器1310处理;另外,将上行的数据发送给基站。通常,射频单元1301包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元1301还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块1302为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元1303可以将射频单元1301或网络模块1302接收的或者在存储器1309中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元1303还可以提供与移动终端1300执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元1303包括扬声器、蜂鸣器以及受话器等。
输入单元1304用于接收音频或视频信号。输入单元1304可以包括图形处理器(Graphics Processing Unit,GPU)13041和麦克风13042,图形处理器13041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元1306上。经图形处理器13041处理后的图像帧可以存储在存储器1309(或其它存储介质)中或者经由射频单元1301或网络模块1302进行发送。麦克风13042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元1301发送到移动通信基站的格式输出。
移动终端1300还包括至少一种传感器1305,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板13061的亮度,接近传感器可在移动终端1300移动到耳边时,关闭显示面板13061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器1305还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元1306用于显示由用户输入的信息或提供给用户的信息。显示单元1306可包括显示面板13061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板13061。
用户输入单元1307可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元1307包括触控面板13071以及其他输入设备13072。触控面板13071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板13071上或在触控面板13071附近的操作)。触控面板13071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1310,接收处理器1310发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板13071。除了触控面板13071,用户输入单元1307还可以包括其他输入设备13072。具体地,其他输入设备13072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板13071可覆盖在显示面板13061上,当触控面板13071检测到在其上或附近的触摸操作后,传送给处理器1310以确定触摸事件的类型,随后处理器1310根据触摸事件的类型在显示面板13061上提供相应的视觉输出。虽然在图13中,触控面板13071与显示面板13061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板13071与显示面板13061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元1308为外部装置与移动终端1300连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元1308可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端1300内的一个或多个元件或者可以用于在移动终端1300和外部装置之间传输数据。
存储器1309可用于存储软件程序以及各种数据。存储器1309可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1309可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器1310是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器1309内的软件程序和/或模块,以及调用存储在存储器1309内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器1310可包括一个或多个处理单元;优选的,处理器1310可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1310中。
移动终端1300还可以包括给各个部件供电的电源1311(比如电池),优选的,电源1311可以通过电源管理系统与处理器1310逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端1300包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器1310,存储器1309,存储在存储器1309上并可在所述处理器1310上运行的计算机程序,该计算机程序被处理器1310执行时实现上述人脸识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述人脸识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (18)
1.一种人脸识别方法,其特征在于,包括:
获取目标图像;
通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
2.根据权利要求1所述的方法,其特征在于,所述通过多域混合网络模型对所述目标图像进行人脸识别的步骤之前,还包括:
使用多域样本对所述多域混合网络模型进行训练,所述多域样本为按照人脸姿态分类得到的训练样本。
3.根据权利要求2所述的方法,其特征在于,所述多域混合网络模型包括基础网络和多域网络,所述多域网络包括至少两个按照人脸姿态分类得到的分域网络;
所述使用多域样本对所述多域混合网络模型进行训练的步骤,包括:
将所述多域样本输入至所述基础网络中进行训练,得到所述多域样本中每个样本的第一特征;
将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征。
4.根据权利要求3所述的方法,其特征在于,每个分域网络包括身份识别网络和权重检测网络;
所述将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征的步骤,包括:
将所述多域样本的第一特征分组输入至对应的分域网络中;
在每个分域网络中对每个样本分别进行身份识别网络训练和权重检测网络训练,得到每个样本的身份特征和权重特征;
根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征。
5.根据权利要求4所述的方法,其特征在于,所述根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征的步骤,包括:
对每个训练样本的身份特征和权重特征进行加权求和,得到所述多域样本的第二特征。
6.根据权利要求3至5中任一项所述的方法,其特征在于,在所述使用多域样本对所述多域混合网络模型进行训练的步骤之前,所述方法还包括:
对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类。
7.根据权利要求6所述的方法,其特征在于,所述对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类的步骤,包括:
对训练样本进行人脸左右偏转角度和/或人脸上下偏转角度检测;
根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络。
8.根据权利要求7所述的方法,其特征在于,所述根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络的步骤,包括:
若训练样本的人脸左右偏转角度和人脸上下偏转角度均大于﹣10°且小于10°,则确定训练样本对应第一分域网络;
若训练样本的人脸左右偏转角度大于或者等于﹣35°且小于或者等于﹣10°,或者,训练样本的人脸左右偏转角度大于或者等于10°且小于或者等于35°,则确定训练样本对应第二分域网络;
若训练样本的人脸左右偏转角度小于﹣35°或者大于35°,则确定训练样本对应第三分域网络;
若训练样本的人脸上下偏转角度大于或者等于﹣20°且小于或者等于﹣10°,或者,训练样本的人脸上下偏转角度大于或者等于10°且小于或者等于20°,则确定训练样本对应第四分域网络;
若训练样本的人脸上下偏转角度为小于﹣20°或者大于20°,则确定训练样本对应第五分域网络。
9.一种移动终端,其特征在于,包括:
获取模块,用于获取目标图像;
识别模块,用于通过多域混合网络模型对所述目标图像进行人脸识别,所述多域混合网络模型为使用多域样本训练得到的网络模型,所述多域样本为按照姿态分类的训练样本。
10.根据权利要求9所述的移动终端,其特征在于,所述移动终端还包括:
训练模块,用于使用多域样本对所述多域混合网络模型进行训练,所述多域样本为按照人脸姿态分类得到的训练样本。
11.根据权利要求10所述的移动终端,其特征在于,所述多域混合网络模型包括基础网络和多域网络,所述多域网络包括至少两个按照人脸姿态分类得到的分域网络;
所述训练模块包括:
第一训练子模块,用于将所述多域样本输入至所述基础网络中进行训练,得到所述多域样本中每个样本的第一特征;
第二训练子模块,用于将所述多域样本的第一特征分组输入至对应的分域网络中进行训练,得到所述多域样本的第二特征。
12.根据权利要求11所述的移动终端,其特征在于,每个分域网络包括身份识别网络和权重检测网络;
所述第二训练子模块具体用于:
将所述多域样本的第一特征分组输入至对应的分域网络中;
在每个分域网络中对每个样本分别进行身份识别网络训练和权重检测网络训练,得到每个样本的身份特征和权重特征;
根据每个样本的身份特征和权重特征,得到所述多域样本的第二特征。
13.根据权利要求12所述的移动终端,其特征在于,所述第二训练子模块具体用于:
对每个训练样本的身份特征和权重特征进行加权求和,得到所述多域样本的第二特征。
14.根据权利要求11至13中任一项所述的移动终端,其特征在于,所述移动终端还包括:
检测模块,用于对训练样本进行姿态检测,并根据所述姿态检测的检测结果对训练样本进行分类。
15.根据权利要求14所述的移动终端,其特征在于,所述检测模块包括:
检测子模块,用于对训练样本进行人脸左右偏转角度和/或人脸上下偏转角度检测;
确定子模块,用于根据训练样本的人脸左右偏转角度和/或人脸上下偏转角度确定每个训练样本对应的分域网络。
16.根据权利要求15所述的移动终端,其特征在于,所述确定子模块具体用于:
若训练样本的人脸左右偏转角度和人脸上下偏转角度均大于﹣10°且小于10°,则确定训练样本对应第一分域网络;
若训练样本的人脸左右偏转角度大于或者等于﹣35°且小于或者等于﹣10°,或者,训练样本的人脸左右偏转角度大于或者等于10°且小于或者等于35°,则确定训练样本对应第二分域网络;
若训练样本的人脸左右偏转角度小于﹣35°或者大于35°,则确定训练样本对应第三分域网络;
若训练样本的人脸上下偏转角度大于或者等于﹣20°且小于或者等于﹣10°,或者,训练样本的人脸上下偏转角度大于或者等于10°且小于或者等于20°,则确定训练样本对应第四分域网络;
若训练样本的人脸上下偏转角度为小于﹣20°或者大于20°,则确定训练样本对应第五分域网络。
17.一种移动终端,其特征在于,包括处理器,存储器,存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的人脸识别方法的步骤。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的人脸识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710841531.7A CN107704812A (zh) | 2017-09-18 | 2017-09-18 | 一种人脸识别方法及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710841531.7A CN107704812A (zh) | 2017-09-18 | 2017-09-18 | 一种人脸识别方法及移动终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107704812A true CN107704812A (zh) | 2018-02-16 |
Family
ID=61172849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710841531.7A Pending CN107704812A (zh) | 2017-09-18 | 2017-09-18 | 一种人脸识别方法及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107704812A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443752A (zh) * | 2019-07-25 | 2019-11-12 | 维沃移动通信有限公司 | 一种图像处理方法和移动终端 |
CN110647811A (zh) * | 2019-08-15 | 2020-01-03 | 中国平安人寿保险股份有限公司 | 人脸姿态检测方法、装置及计算机可读存储介质 |
CN110969085A (zh) * | 2019-10-30 | 2020-04-07 | 维沃移动通信有限公司 | 脸部特征点定位方法及电子设备 |
CN111291780A (zh) * | 2018-12-07 | 2020-06-16 | 深圳光启空间技术有限公司 | 一种跨域网络训练及图像识别方法 |
CN111582027A (zh) * | 2020-04-01 | 2020-08-25 | 广州亚美智造科技有限公司 | 身份认证方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030108244A1 (en) * | 2001-12-08 | 2003-06-12 | Li Ziqing | System and method for multi-view face detection |
CN100585617C (zh) * | 2008-07-04 | 2010-01-27 | 西安电子科技大学 | 基于分类器集成的人脸识别系统及其方法 |
CN102831413A (zh) * | 2012-09-11 | 2012-12-19 | 上海中原电子技术工程有限公司 | 基于多分类器融合的人脸识别方法及系统 |
CN106384087A (zh) * | 2016-09-05 | 2017-02-08 | 大连理工大学 | 一种基于多层网络人体特征的身份识别方法 |
CN106503687A (zh) * | 2016-11-09 | 2017-03-15 | 合肥工业大学 | 融合人脸多角度特征的监控视频人物身份识别系统及其方法 |
CN104866831B (zh) * | 2015-05-29 | 2018-06-05 | 福建省智慧物联网研究院有限责任公司 | 特征加权的人脸识别算法 |
-
2017
- 2017-09-18 CN CN201710841531.7A patent/CN107704812A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030108244A1 (en) * | 2001-12-08 | 2003-06-12 | Li Ziqing | System and method for multi-view face detection |
CN100585617C (zh) * | 2008-07-04 | 2010-01-27 | 西安电子科技大学 | 基于分类器集成的人脸识别系统及其方法 |
CN102831413A (zh) * | 2012-09-11 | 2012-12-19 | 上海中原电子技术工程有限公司 | 基于多分类器融合的人脸识别方法及系统 |
CN104866831B (zh) * | 2015-05-29 | 2018-06-05 | 福建省智慧物联网研究院有限责任公司 | 特征加权的人脸识别算法 |
CN106384087A (zh) * | 2016-09-05 | 2017-02-08 | 大连理工大学 | 一种基于多层网络人体特征的身份识别方法 |
CN106503687A (zh) * | 2016-11-09 | 2017-03-15 | 合肥工业大学 | 融合人脸多角度特征的监控视频人物身份识别系统及其方法 |
Non-Patent Citations (1)
Title |
---|
陈雯柏: "《人工神经网络原理与实践》", 31 January 2016 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291780A (zh) * | 2018-12-07 | 2020-06-16 | 深圳光启空间技术有限公司 | 一种跨域网络训练及图像识别方法 |
CN111291780B (zh) * | 2018-12-07 | 2024-07-12 | 深圳光启空间技术有限公司 | 一种跨域网络训练及图像识别方法 |
CN110443752A (zh) * | 2019-07-25 | 2019-11-12 | 维沃移动通信有限公司 | 一种图像处理方法和移动终端 |
CN110443752B (zh) * | 2019-07-25 | 2023-05-05 | 维沃移动通信有限公司 | 一种图像处理方法和移动终端 |
CN110647811A (zh) * | 2019-08-15 | 2020-01-03 | 中国平安人寿保险股份有限公司 | 人脸姿态检测方法、装置及计算机可读存储介质 |
CN110969085A (zh) * | 2019-10-30 | 2020-04-07 | 维沃移动通信有限公司 | 脸部特征点定位方法及电子设备 |
CN110969085B (zh) * | 2019-10-30 | 2024-03-19 | 维沃移动通信有限公司 | 脸部特征点定位方法及电子设备 |
CN111582027A (zh) * | 2020-04-01 | 2020-08-25 | 广州亚美智造科技有限公司 | 身份认证方法、装置、计算机设备和存储介质 |
CN111582027B (zh) * | 2020-04-01 | 2024-03-22 | 广州亚美智造科技有限公司 | 身份认证方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704812A (zh) | 一种人脸识别方法及移动终端 | |
CN108255378A (zh) | 一种显示控制方法及移动终端 | |
CN107943551A (zh) | 一种屏幕显示方法及移动终端 | |
CN108459797A (zh) | 一种折叠屏的控制方法及移动终端 | |
CN107707729A (zh) | 一种终端灭屏或亮屏方法、终端及计算机可读存储介质 | |
CN108628565A (zh) | 一种移动终端操作方法及移动终端 | |
CN107832110A (zh) | 一种信息处理方法及移动终端 | |
CN107742072A (zh) | 人脸识别方法及移动终端 | |
CN108427873A (zh) | 一种生物特征识别方法及移动终端 | |
CN107730261A (zh) | 一种资源转移方法及相关设备 | |
CN107330347A (zh) | 一种显示方法、终端及计算机可读存储介质 | |
CN107958161A (zh) | 一种多任务显示方法及移动终端 | |
CN107831891A (zh) | 一种亮度调节方法及移动终端 | |
CN108415641A (zh) | 一种图标的处理方法及移动终端 | |
CN107730460A (zh) | 一种图像处理方法及移动终端 | |
CN109901809A (zh) | 一种显示控制方法、设备及计算机可读存储介质 | |
CN109471571A (zh) | 悬浮控件的显示方法、移动终端及计算机可读存储介质 | |
CN108257104A (zh) | 一种图像处理方法及移动终端 | |
CN107734172A (zh) | 一种信息显示方法及移动终端 | |
CN108055388A (zh) | 一种虚拟红包的展示方法、装置及移动终端 | |
CN108494936A (zh) | 一种光强度的检测方法、移动终端 | |
CN108600544A (zh) | 一种单手控制方法及终端 | |
CN109871176A (zh) | 一种对象显示方法及终端设备 | |
CN108335259A (zh) | 一种图像处理方法、图像处理设备及移动终端 | |
CN107704334A (zh) | 一种sdk的处理方法及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180216 |