CN108875528B - 一种人脸形状点定位方法及装置、存储介质 - Google Patents
一种人脸形状点定位方法及装置、存储介质 Download PDFInfo
- Publication number
- CN108875528B CN108875528B CN201810016603.9A CN201810016603A CN108875528B CN 108875528 B CN108875528 B CN 108875528B CN 201810016603 A CN201810016603 A CN 201810016603A CN 108875528 B CN108875528 B CN 108875528B
- Authority
- CN
- China
- Prior art keywords
- shape point
- face image
- face
- marked
- prediction unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种人脸形状点定位方法及装置、存储介质,该方法包括:通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点;通过标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注;将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练;利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点。该方法可以提高标注效率,快速生成形状点定位训练数据。该装置及存储介质具有类似的优点。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种人脸形状点定位方法及装置、存储介质。
背景技术
人脸形状点定位是人脸相关技术中一项核心技术,也是计算机视觉领域的一个经典问题。随着深度学习的不断发展,计算机视觉的很多研究问题都可以转化为基于海量数据的深度模型训练的问题,基于深度学习的形状点定位也因此取得了很好的性能。但深度学习的一个主要问题是需要有监督的训练数据,并且随着深度学习的发展,训练模型对训练数据的需求也越来越大。只要收集到更多的标注好的训练数据,便可以获得更好的模型,因此如何标注数据便成了关键。在形状点定位中,有监督数据为人脸图像及标注好的人脸形状点位置,因此人脸形状点定位需要收集人脸图像,然后人工标注出人脸的形状点。通常,形状点数目在100左右,包含眉毛,眼睛,鼻子,嘴巴,轮廓等位置,标注员通过鼠标等标注工具在图像中标出预先定义好的形状点位置。为了提高标注效率,一些传统的标注方法先通过预先训练的形状点定位模型获得每张图像的预标注,然后标注员只用调整形状点的位置,减小工作量。然而,为了获得更好的模型适应性,人脸图像往往需要在光照,角度,遮挡,表情,模糊等不同场景进行采集,这使得形状点标注的难度增大。这是因为:一方面,由于图像的多样性,预先训练好的模型往往难以得到较准确的预测形状点,标注员需要一一匹配每个形状点的预测位置和真实位置,这反而增加了标注员的工作量;另一方面,图像的多样性也使得形状点的真实位置千变万化,标注员更难标注。
因此,需要提供一种人脸形状点定位方法及装置、存储介质,以解决上面提到的问题。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施例部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
为了解决上述问题,本发明提供了一种人脸形状点定位方法,包括:
通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点;
通过标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注;
将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练;
利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点。
在本发明一个实施例中,该方法还包括:
对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置;
所述主形状点预测单元根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
在本发明一个实施例中,在通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点之前,该方法还包括:
通过预先训练的副形状点预测单元给出所述待标注人脸图像的预测形状点;
计算所述主形状点预测单元给出的所述待标注人脸图像的预测形状点与所述副形状点预测单元给出所述待标注人脸图像的预测形状点的差值,以获得整批待标注人脸图像的差值分布;
根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至所述标注单元。
在本发明一个实施例中,在将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元之前,该方法还包括:
在所述完成形状点标注的人脸图像中加入人工噪声。
根据本发明的人脸形状点定位方法,一方面通过预先训练的主形状点预测单元给出待标注人脸图像的形状预测点来减少标注员的标注工作量;另一方面,不断利用完成形状点标注的人脸图像迭代训练所述主形状点预测单元,以使主形状点预测单元更好地适应新加入的待标注人脸图像,提高形状点预测精度,通过这样的相互作用根据本发明的生成形状点定位训练数据的方法相比通常的全量标注所有样本的方法可以在一个月内完成100万样本的标注,速度提升了20倍左右。
根据本发明的另一个方面,还提供了一种人脸形状点定位装置,包括:
预先训练的主形状点预测单元,用于给出待标注人脸图像的预测形状点;
标注单元,用于显示所述待标注人脸图像,并供标注员调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注;
迭代训练单元,用于将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练。
在本发明一个实施例中,对于每次新输入的待标注人脸图像使用迭代训练后的所述主形状点预测单元给出所述待标注人脸图像的预测形状点。
在本发明一个实施例中,所述主形状点预测单元包括:
人脸检测模块,用于对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置;
人脸定位模块,用于根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
在本发明一个实施例中,该装置还包括:
人脸检测模块,用于对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置;
所述主形状点预测单元根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
在本发明一个实施例中,该装置还包括:
预先训练的副形状点预测单元,用于给出所述待标注人脸图像的预测形状点;
数据划分单元,用于计算所述主形状点预测模型给出的所述待标注人脸图像的预测形状点与所述副形状点预测模型给出所述待标注人脸图像的预测形状点的差值,以获得整批待标注人脸图像的差值分布,并根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至所述标注工具。
在本发明一个实施例中,所述迭代训练单元在将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元之前,在所述完成形状点标注的人脸图像中加入人工噪声。
根据本发明的人脸形状点定位装置,一方面,通过预先训练的主形状点预测单元给出待标注人脸图像的形状预测点来减少标注员的标注工作量;另一方面,不断利用完成形状点标注的人脸图像迭代训练所述主形状点预测单元,以使主形状点预测单元更好地适应新加入的待标注人脸图像,提高形状点预测精度,通过这样的相互作用根据本发明的生成形状点定位训练数据的装置相比通常的全量标注所有样本的装置可以在一个月内完成100万样本的标注,速度提升了20倍左右。
根据本发明的另一个方面,还提供了一种人脸形状点定位装置,所述装置包括存储器和处理器,所述存储器上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行如上所述的人脸形状点定位方法。
根据本发明的另一个方面,还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时执行如上所述的人脸形状点定位方法。
附图说明
本发明实施例的下列附图在此作为本发明的一部分用于理解本发明。附图中示出了本发明的实施例及其描述,用来解释本发明的原理。在附图中,
图1是用于实现根据本发明实施例的人脸形状点定位方法和装置的示例电子设备的示意性框图;
图2为根据本发明一实施例的人脸形状点定位方法的示意性流程图;
图3为根据本发明另一实施例的人脸形状点定位的方法的示意性流程图;
图4为根据本发明实施例的对待标注人脸图像进行划分的示意性流程图;
图5为根据本发明实施例的人脸形状点定位装置的示意性结构框图;
图6为根据本发明实施例的预先训练的主形状点预测单元的示意性结构框图;
图7为根据本发明实施例的具有预测形状点的待标注人脸图像的示意图。
具体实施例
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明实施例可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明实施例发生混淆,对于本领域公知的一些技术特征未进行描述。
应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例。相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。在附图中,为了清楚,部件、元件等的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
图1是用于实现根据本发明实施例的人脸形状点定位方法和装置的示例电子设备的示意性框图。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入/输出装置106、通信接口108以及一个或多个图像采集装置110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构,也可以不包括前述的部分组件,例如可以不包括图像采集装置。
所述处理器102一般表示任何类型或形式的能够处理数据或解释和执行指令的处理单元。一般而言,处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。此外,处理器也可以是神经网络处理器、图形处理器(GPU)、现场可编程门阵列(FPGA)或数字信号处理器(DSP),或者它们的一种或多种的组合。在特定实施例中,处理器102可以接收来自软件应用或模块的指令。这些指令可以导致处理器102完成本文描述和/或示出的一个或多个示例实施例的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入/输出装置106可以是用户用来输入指令和向外部输出各种信息的装置,例如输入装置可以包括按钮、键盘、鼠标、麦克风和触摸屏等中的一个或多个。输出装置可以包括显示器、扬声器、投影仪、网卡等中的一个或多个。
通信接口108广泛地表示任何类型或形式的能够促进示例电子设备100和一个或多个附加设备之间的通信的设备或适配器。例如,通信接口108可以促进电子设备100和前端或附件电子设备以及后端服务器或云端的通信。通信接口108的示例包括但不限于有线网络接口(诸如网络接口卡)、无线网络接口(诸如无线网络接口卡)、调制解调器和任何其他合适的接口。在一实施例中,通信接口108通过与诸如因特网的网络的直连提供到远程服务器/远程前端设备的直连。在特定实施例中,通信接口108通过与专用网络,例如视频监控网络、天网系统网络等网络的直连提供到远程服务器/远程前端设备的直连。通信接口108还可以间接提供这种通过任何其它合适连接的连接。
所述图像采集装置110可以拍摄用户期望的图像(例如照片、视频等),并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。图像采集装置110可以采用各种合适的图像传感器或摄像头装置。
示例性地,用于实现根据本发明实施例的人脸形状点定位方法和装置的电子设备可以实现为个人计算机、桌面计算机或服务器等。
图2为根据本发明一实施例的人脸形状点定位方法的示意性流程图;图3为根据本发明另一实施例的人脸形状点定位方法的示意性流程图;图4为根据本发明实施例的对待标注人脸图像进行划分的示意性流程图。下面将结合图2~图4对根据本发明实施例的人脸形状点定位方法进行描述。
首先,如图2和图3所示,本发明实施例公开的人脸形状点定位方法包括:
步骤201,通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点。
所述预先训练的主形状点预测单元为预先训练过的可以计算待标注人脸图像的形状点,并在所述待标注人脸图像标出所述形状点的模型。所述形状点指的是可以表示人脸形状和特征的点,包含眉毛、眼睛、鼻子、嘴巴、轮廓等人脸器官边缘上的等分点。在本实施例中,包含106个形状点,图7给出具有预测形状点的待标注人脸图像的示意图。
作为一个示例,所述预先训练的主形状点预测单元包括人脸检测模块和人脸定位模块。所述人脸检测模块用于从所述待标注的人脸图像中检测出人脸位置。所述人脸定位模块用于根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
在一实施例中,所述人脸检测模块可以为利用预先训练好的人脸检测器。例如,可以预先利用哈尔(Haar)算法、Adaboost算法、卷积神经网络等人脸检测与识别算法在大量图片的基础上训练出人脸检测器。在另一实施例中,所述人脸检测模块采用标准的opencv人脸检测模型。
在一实施例中,所述人脸定位模块可以为预先训练好的形状点定位器。例如,可以预先利用级联回归方法、机器学习方法(深度学习或基于局部特征的回归算法)在大量人工标注的人脸图片(例如预先搜集大量人脸图像(如N=10000),人工在每张图像中标注出人脸的眼角,眼眶外轮廓点等一系列形状点的基础上训练出形状点定位器。在又一实施例中,所述人脸定位模块采用通用的VGG深度网络。
作为另一示例,所述预先训练的主形状点预测单元仅包括人脸定位模块而不包括人脸检测模块。此时,如图3所示,在步骤201之前还包括:
步骤S200,对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置。例如,可以利用预先训练好的人脸检测器来在所述待标注人脸图像中定位人脸区域。例如,可以预先利用哈尔(Haar)算法、Adaboost算法、卷积神经网络等人脸检测与识别算法在大量图片的基础上训练出人脸检测器。又或者,利用标准的opencv人脸检测模型在所述待标注人脸图像中定位人脸区域。
当完成步骤S200之后,在步骤S201中所述主形状点预测单元根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
步骤202,通过标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注。
当在步骤201中通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点之后,则将具有预测形状点的待标注人脸图像导入标注单元中,标注人员利用标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注。示例性地,所述标注单元可以为一个网页端标注工具,例如一个网页端插件。该工具可以批量显示所有待标注的人脸图像,并可以读取所有待标注的图像的预测形状点。标注员可以通过鼠标点击和拖动所述预测形状点到人脸图像对应位置完成形状点标注。示例性地,所述标注单元也可以为客户端标注工具。
步骤203,将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练。
在步骤S202中完成所述待标注人脸图像的形状点标注之后,则将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练,通过所述主形状点预测单元的迭代训练来增加所述主形状点预测单元对新输入待标注图像的适应性,提高预测精度,减少标注员的工作量,提高标注效率。具体地,完成形状点标注的人脸图像会形成一个组成一个微型批量图像,加入一些人工扰动作噪声后输入到所述主形状点预测单元中,由于所述主形状点预测单元已经训练过,因此小样本的输入很容易就收敛了。在本实施例中,为提高效率,该训练过程是在每张待标注图像提交标注的过程中完成,而不是整批待标注图像完成标注后一次性训练。此外,需要说明的是,所谓人工扰动指的是对所述微型批量图像施加随机的轻微旋转、偏移等操作,以增加训练数据的代表性,从而提高训练效果。
步骤204,利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点。
当在步骤203中完成所述主形状点预测单元的迭代训练后,则利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点,然后继续执行步骤S202和S203,如此往复,不断生成形状点定位训练数据,即标注了形状点的人脸图像。
在本实施例中,为了更好的拟合待标注人脸图像的数据分布,使得每次加入训练的数据分布与全量数据更一致,在通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点之前,还对待标注的人脸图像进行划分。下面结合图4对待标注人脸图像的划分过程进行描述。
如图4所示,对待标注人脸图像的划分包括:
步骤S401,通过预先训练的副形状点预测单元给出所述待标注人脸图像的预测形状点。
所述预先训练的副形状点预测单元与所述预先训练的主形状点预测单元具有相同的结构,但模型参数更少。所述预先训练的副形状点预测单元给出所述待标注人脸图像的形状点的过程与所述预先训练的主副形状点预测单元给出所述待标注人脸图像的形状点的过程相似,在此不再赘述。
可以理解,当生成形状点定位训练数据的方法包含对待标注人脸图像的划分步骤时,所述预先训练的副形状点预测单元和所述预先训练的主形状点预测单元,在同一步骤中给出所述待标注人脸图像的形状点,本文由于前述已经描述了所述预先训练的主形状点预测单元,因此此处略去所述预先训练的主形状点预测单元给出所述待标注人脸图像的形状点的相关描述。
步骤S402,计算所述主形状点预测单元给出的所述待标注人脸图像的预测形状点与所述副形状点预测单元给出所述待标注人脸图像的形状点的差值,以获得整批待标注人脸图像的差值分布。
当通过所述主形状点预测单元和所述副形状点预测单元分别给出所述待标注人脸图像的预测形状点之后,则计算所述主形状点预测单元给出的所述待标注人脸图像的预测形状点与所述副形状点预测单元给出所述待标注人脸图像的形状点的差值,并将所有的差值按大小排序,获得整批待标注人脸图像的差值分布。
步骤S403,根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至所述标注单元。
当获得整批待标注人脸图像的差值分布,则根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至所述标注单元。作为示例,例如整批待标注图像的数量为1000张,则按照差值大小对该1000张图像进行排序,然后按照每100张选10张的方法从该1000张待标注人脸图像中选出100张待标注图像作为一组数据输入至标注工具中,供标注员进行标注,这样每次选择100张待标注图像时使得差值较小与较大的样本均能够被选中,从而使得每次选择的100张待标注图像具有和整批1000张图像相似的数据分布,进而避免随机选择样本会导致选择的样本过于简单或过于偏向于某类样本的问题。
根据本发明实施例的人脸形状点定位方法可以部署在个人计算机、桌面计算机等。替代地,根据本发明实施例的人脸形状点定位方法还可以分布地部署在服务器端(或云端)和终端处,例如在服务器部署预先训练的所述主形状点预测单元和所述副形状点预测单元,并执行相应的步骤,在终端处部署标注单元,并执行相应的步骤。
根据本发明实施例的人脸形状点定位方法,一方面通过预先训练的主形状点预测单元给出待标注人脸图像的形状预测点来减少标注员的标注工作量;另一方面,不断利用完成形状点标注的人脸图像迭代训练所述主形状点预测单元,以使主形状点预测单元更好地适应新加入的待标注人脸图像,提高形状点预测精度,通过这样的相互作用根据本发明的生成形状点定位训练数据的方法相比通常的全量标注所有样本的方法可以在一个月内完成100万样本的标注,速度提升了20倍左右。
图5为根据本发明实施例的人脸形状点定位装置的示意性结构框图;图6为根据本发明实施例的预先训练的主形状点预测单元的示意性结构框图。下面结合图5至图6对根据本发明实施例的人脸形状点定位装置进行详细描述。
如图5所示,根据本发明实施例的人脸形状点定位装置500包括预先训练的主形状点预测单元510、预先训练的副形状点预测单元520、数据划分单元530、标注单元540和迭代训练单元550。
预先训练的主形状点预测单元510用于给出待标注人脸图像的预测形状点。预先训练的主形状点预测单元510可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S200~S201、S204。
作为一个示例,如图6所示,所述预先训练的主形状点预测单元510包括人脸检测模块5101和人脸定位模块5102。
所述人脸检测模块5101用于从所述待标注的人脸图像中检测出人脸位置。所述人脸检测模块5101可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S200。在一实施例中,所述人脸检测模块可以为利用预先训练好的人脸检测器。例如,可以预先利用哈尔(Haar)算法、Adaboost算法、卷积神经网络等人脸检测与识别算法在大量图片的基础上训练出人脸检测器。在另一实施例中,所述人脸检测模块采用标准的opencv人脸检测模型。
所述人脸定位模块5102用于根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。所述人脸定位模块5102可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S201。在一实施例中,所述人脸定位模块可以为预先训练好的形状点定位器。例如,可以预先利用级联回归方法、机器学习方法(深度学习或基于局部特征的回归算法)在大量人工标注的人脸图片(例如预先搜集大量人脸图像(如N=10000),人工在每张图像中标注出人脸的眼角,眼眶外轮廓点等一系列形状点的基础上训练出形状点定位器。在又一实施例中,所述人脸定位模块采用通用的VGG深度网络。
作为另一示例,所述预先训练的主形状点预测单元510仅包括人脸定位模块5102而不包括人脸检测模块5101。此时,根据本发明实施例的生成形状点定位训练数据的装置500则进一步包括单独的人脸检测模块用于从所述待标注的人脸图像中检测出人脸位置,所述预先训练的主形状点预测单元510则根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
预先训练的副形状点预测单元520用于给出待标注人脸图像的预测形状点。预先训练的主形状点预测单元510可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S401。预先训练的副形状点预测单元520的结构与预先训练的主形状点预测单元510具有相同的结构,但模型参数更少。
数据划分单元530用于计算所述主形状点预测模型给出的所述待标注人脸图像的预测形状点与所述副形状点预测模型给出所述待标注人脸图像的预测形状点的差值,以获得整批待标注人脸图像的差值分布,并根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至所述标注工具。数据划分单元530可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S402~S403。
标注单元540用于显示所述待标注人脸图像,并供标注员调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注。标注单元540可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S202。
迭代训练单元550用于将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元510对所述主形状点预测单元510进行迭代训练。迭代训练单元550可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的人脸形状点定位方法中的步骤S203。
根据本发明实施例的人脸形状点定位装置,一方面,通过预先训练的主形状点预测单元给出待标注人脸图像的形状预测点来减少标注员的标注工作量;另一方面,不断利用完成形状点标注的人脸图像迭代训练所述主形状点预测单元,以使主形状点预测单元更好地适应新加入的待标注人脸图像,提高形状点预测精度,通过这样的相互作用根据本发明的生成形状点定位训练数据的装置相比通常的全量标注所有样本的装置可以在一个月内完成100万样本的标注,速度提升了20倍左右。
此外,根据本发明的实施例,还提供了一种人脸形状点定位装置,所述装置包括存储器和处理器,所述存储器上存储有由所述处理器运行的计算机程序,在所述计算机程序被计算机或处理器运行时用于执行本发明实施例的生成形状点定位训练数据的方法的相应步骤,并且用于实现根据本发明实施例的人脸形状点定位装置中的预先训练的主形状点预测单元、预先训练的副形状点预测单元、数据划分单元、标注单元和迭代训练单元。
在一个实施例中,所述计算机程序在被所述处理器运行时执行以下步骤:通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点;通过标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注,以完成所述待标注人脸图像的形状点标注;将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练;利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了计算机程序,在所述计算机程序被计算机或处理器运行时用于执行本发明实施例的人脸形状点定位方法的相应步骤,并且用于实现根据本发明实施例的人脸形状点定位装置中的预先训练的主形状点预测单元、预先训练的副形状点预测单元、数据划分单元、标注单元和迭代训练单元。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合,例如一个计算机可读存储介质包含用于实现预先训练的主形状点预测单元、预先训练的副形状点预测单元、数据划分单元的计算机可读的程序代码,另一个计算机可读存储介质包含用于实现标注单元和迭代训练单元的计算机可读的程序代码。
在一个实施例中,所述计算机程序在被计算机运行时执行以下步骤:通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点;通过标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注;将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练;利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点。
根据本发明实施例的人脸形状点定位装置中的各模块可以通过根据本发明实施例的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。
根据本发明实施例的人脸形状点定位方法和装置以及存储介质减少了标注员的工作率,提高了人脸图像形状点的标注效率,便于快速生成形状点定位训练数据。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种人脸形状点定位方法,其特征在于,包括:
通过预先训练的主形状点预测单元给出待标注人脸图像的预测形状点;
通过预先训练的副形状点预测单元给出所述待标注人脸图像的预测形状点;
计算所述主形状点预测单元给出的所述待标注人脸图像的预测形状点与所述副形状点预测单元给出所述待标注人脸图像的预测形状点的差值,以获得整批待标注人脸图像的差值分布;
根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至标注单元;
通过标注单元调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注;
将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练;
利用迭代训练后的所述主形状点预测单元给出新的待标注人脸图像的预测形状点。
2.根据权利要求1所述的方法,其特征在于,还包括:
对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置;
所述主形状点预测单元根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
3.根据权利要求1所述的方法,其特征在于,在将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元之前,还包括:
在所述完成形状点标注的人脸图像中加入人工噪声。
4.一种人脸形状点定位装置,其特征在于,包括:
预先训练的主形状点预测单元,用于给出待标注人脸图像的预测形状点;
预先训练的副形状点预测单元,用于给出所述待标注人脸图像的预测形状点;
数据划分单元,用于计算所述主形状点预测单元给出的所述待标注人脸图像的预测形状点与所述副形状点预测单元给出的所述待标注人脸图像的预测形状点的差值,以获得整批待标注人脸图像的差值分布,并根据整批待标注人脸图像的差值分布按照固定步长选择每个补偿区间下固定数量的待标注图像,并将选择出的所有待标注图像发送至标注单元;
标注单元,用于显示所述待标注人脸图像,并供标注员调整所述待标注人脸图像的所述预测形状点到对应位置,以完成所述待标注人脸图像的形状点标注;
迭代训练单元,用于将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元对所述主形状点预测单元进行迭代训练。
5.根据权利要求4所述的装置,其特征在于,对于每次新输入的待标注人脸图像使用迭代训练后的所述主形状点预测单元给出所述待标注人脸图像的预测形状点。
6.根据权利要求4所述的装置,其特征在于,所述主形状点预测单元包括:
人脸检测模块,用于对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置;
人脸定位模块,用于根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
7.根据权利要求4所述的装置,其特征在于,还包括:
人脸检测模块,用于对所述待标注人脸图像进行人脸检测,以确定所述待标注人脸图像中人脸的位置;
所述主形状点预测单元根据所确定的人脸的位置给出所述待标注人脸图像的所述预测形状点。
8.根据权利要求4所述的装置,其特征在于,所述迭代训练单元在将完成形状点标注的人脸图像作为训练数据输入所述主形状点预测单元之前,在所述完成形状点标注的人脸图像中加入人工噪声。
9.一种人脸形状点定位装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1-3中的任一项所述的人脸形状点定位方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序在运行时执行如权利要求1-3中的任一项所述的人脸形状点定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810016603.9A CN108875528B (zh) | 2018-01-08 | 2018-01-08 | 一种人脸形状点定位方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810016603.9A CN108875528B (zh) | 2018-01-08 | 2018-01-08 | 一种人脸形状点定位方法及装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108875528A CN108875528A (zh) | 2018-11-23 |
CN108875528B true CN108875528B (zh) | 2021-01-29 |
Family
ID=64326020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810016603.9A Active CN108875528B (zh) | 2018-01-08 | 2018-01-08 | 一种人脸形状点定位方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108875528B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469380A (zh) * | 2014-09-05 | 2016-04-06 | 株式会社理光 | 对于对象的遮挡进行检测的方法和装置 |
CN105868769A (zh) * | 2015-01-23 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 图像中的人脸关键点定位方法及装置 |
CN106707293A (zh) * | 2016-12-01 | 2017-05-24 | 百度在线网络技术(北京)有限公司 | 用于车辆的障碍物识别方法和装置 |
CN107169463A (zh) * | 2017-05-22 | 2017-09-15 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9323980B2 (en) * | 2011-05-13 | 2016-04-26 | Microsoft Technology Licensing, Llc | Pose-robust recognition |
-
2018
- 2018-01-08 CN CN201810016603.9A patent/CN108875528B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469380A (zh) * | 2014-09-05 | 2016-04-06 | 株式会社理光 | 对于对象的遮挡进行检测的方法和装置 |
CN105868769A (zh) * | 2015-01-23 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 图像中的人脸关键点定位方法及装置 |
CN106707293A (zh) * | 2016-12-01 | 2017-05-24 | 百度在线网络技术(北京)有限公司 | 用于车辆的障碍物识别方法和装置 |
CN107169463A (zh) * | 2017-05-22 | 2017-09-15 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108875528A (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875633B (zh) | 表情检测与表情驱动方法、装置和系统及存储介质 | |
US11431896B2 (en) | Augmented reality for three-dimensional model reconstruction | |
CN109961009B (zh) | 基于深度学习的行人检测方法、系统、装置及存储介质 | |
US10769496B2 (en) | Logo detection | |
US9349076B1 (en) | Template-based target object detection in an image | |
CN108961149B (zh) | 图像处理方法、装置和系统及存储介质 | |
CN108876804B (zh) | 抠像模型训练和图像抠像方法、装置和系统及存储介质 | |
EP2903256B1 (en) | Image processing device, image processing method and program | |
CN109034069B (zh) | 用于生成信息的方法和装置 | |
CN105956059A (zh) | 基于情绪识别的信息推荐方法和装置 | |
US20210141826A1 (en) | Shape-based graphics search | |
WO2021238548A1 (zh) | 区域识别方法、装置、设备及可读存储介质 | |
CN110413816A (zh) | 彩色草图图像搜索 | |
CN107909088B (zh) | 获取训练样本的方法、装置、设备和计算机存储介质 | |
CN110175528B (zh) | 人体跟踪方法及装置、计算机设备及可读介质 | |
CN109829380B (zh) | 一种狗脸特征点的检测方法、装置、系统及存储介质 | |
CN111124863B (zh) | 智能设备性能测试方法、装置及智能设备 | |
CN109345460B (zh) | 用于矫正图像的方法和装置 | |
CN109447996A (zh) | 三维图像中的手部分割 | |
CN111814573A (zh) | 一种人脸信息的检测方法、装置、终端设备及存储介质 | |
CN111832579B (zh) | 地图兴趣点数据处理方法、装置、电子设备以及可读介质 | |
CN112329663A (zh) | 一种基于人脸图像序列的微表情时刻检测方法及装置 | |
JP2020154773A (ja) | 画像処理装置、画像処理方法及び画像処理システム | |
KR102440198B1 (ko) | 시각 검색 방법, 장치, 컴퓨터 기기 및 저장 매체 (video search method and apparatus, computer device, and storage medium) | |
US20140198177A1 (en) | Realtime photo retouching of live video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A method, device, and storage medium for locating facial shape points Effective date of registration: 20230404 Granted publication date: 20210129 Pledgee: Shanghai Yunxin Venture Capital Co.,Ltd. Pledgor: BEIJING KUANGSHI TECHNOLOGY Co.,Ltd. Registration number: Y2023990000193 |