CN110490164B

CN110490164B - 生成虚拟表情的方法、装置、设备及介质

Info

Publication number: CN110490164B
Application number: CN201910791437.4A
Authority: CN
Inventors: 李宣平; 李岩; 张国鑫
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-08-26
Filing date: 2019-08-26
Publication date: 2022-05-24
Anticipated expiration: 2039-08-26
Also published as: CN110490164A

Abstract

本公开关于一种生成虚拟表情的方法、装置、电子设备及存储介质，可以获取人脸图像；从人脸图像中，获取基础人物的嘴巴区域图像，和嘴巴关键点坐标；将嘴巴区域图像和嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型；获取嘴巴分类神经网络模型输出的嘴巴类型；根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成基础人物的虚拟嘴巴作为虚拟表情。可见，应用本公开实施例，可以识别出人脸图像基础人物的嘴巴类型，根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成基础人物的虚拟嘴巴作为虚拟表情，无需像相关技术需要手动设置虚拟嘴巴，应用本公开实施例，简化了用户操作。

Description

生成虚拟表情的方法、装置、设备及介质

技术领域

本公开涉及图像处理技术领域，尤其涉及一种生成虚拟表情的方法、装置、电子设备及存储介质。

背景技术

相关技术中，用户可以在应用程序中手动设置虚拟表情，包括：可以在预设的虚拟形象素材库中分别选择虚拟眼睛、虚拟鼻子和虚拟嘴巴等虚拟表情，可以在应用程序上将虚拟表情发送给其他用户，也可以用这些虚拟表情构成一个虚拟形象。这个虚拟形象可以用做应用程序的头像，例如：可以用做即时通信软件或社交平台软件等等的用户头像。虚拟表情和虚拟形象因为趣味性和互动性比较好，所以很受用户喜爱。

然而，相关技术需要手动生成虚拟表情，用户操作比较复杂。

发明内容

本公开提供一种生成虚拟表情方法、装置、电子设备及存储介质，以至少解决相关技术中用户操作比较复杂的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种生成虚拟表情的方法，包括：

获取人脸图像；所述人脸图像中包含用于生成虚拟表情的基础人物的图像；

从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标；

将所述嘴巴区域图像和所述嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型；

获取所述嘴巴分类神经网络模型输出的嘴巴类型；

根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情。

可选的，所述从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标的步骤，包括：

从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标；

根据所述基础人物的脸部轮廓和嘴巴关键点坐标，获取嘴巴区域图像。

可选的，所述根据所述基础人物的脸部轮廓和嘴巴关键点坐标，获取嘴巴区域图像的步骤，包括：

根据嘴巴关键点坐标，计算脸部轮廓与水平方向的目标夹角；

根据所述目标夹角，将所述脸部轮廓调整至水平方向；

根据调整后的脸部轮廓，获取嘴巴区域图像。

可选的，所述根据调整后的脸部轮廓，获取嘴巴区域图像的步骤，包括：

按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取嘴巴区域图像。

可选的，所述从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标的步骤，包括：

从所述人脸图像中，获取左嘴角关键点坐标、右嘴角关键点坐标和嘴巴中线与上下嘴唇的交点，作为嘴巴关键点坐标，并获取所述基础人物的脸部轮廓。

可选的，所述根据嘴巴关键点坐标，计算脸部轮廓与水平方向的目标夹角的步骤，包括：

根据左嘴角关键点坐标和右嘴角关键点坐标，计算脸部轮廓与水平方向的目标夹角。

可选的，所述按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取嘴巴区域图像的步骤，包括：

按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取嘴巴区域图像的尺寸；

根据所述嘴巴区域图像的尺寸和所述嘴巴关键点坐标获取嘴巴区域图像。

可选的，所述嘴巴分类神经网络模型的训练过程，包括：

用多个包含基础人物的图像作为样本图像，获取人工标注的每个样本图像基础人物的嘴巴类型；

获取每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标；

根据所述每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标，获取每个样本图像的嘴巴区域图像；

基于人工标注的每个样本图像基础人物的嘴巴类型，根据所述每个样本图像的嘴巴区域图像和所述每个样本图像基础人物的嘴巴关键点坐标，对待训练的嘴巴分类神经网络模型进行训练，获取训练好的嘴巴分类神经网络模型。

可选的，所述根据所述每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标，获取每个样本图像的嘴巴区域图像的步骤，包括；

根据每个样本图像基础人物的嘴巴关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角；

根据所述样本目标夹角，将所述每个样本图像基础人物的脸部轮廓调整至水平方向；

根据每个样本图像基础人物调整后的脸部轮廓，分别获取每个样本图像基础人物的嘴巴区域图像。

可选的，所述根据每个样本图像基础人物调整后的脸部轮廓，分别获取每个样本图像基础人物的嘴巴区域图像的步骤，包括：

按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取每个样本图像基础人物的嘴巴区域图像。

可选的，所述获取每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标的步骤，包括：

获取每个样本图像基础人物的样本左嘴角关键点坐标、样本右嘴角关键点坐标和样本嘴巴中线与上下嘴唇的交点，作为每个样本图像基础人物的嘴巴关键点坐标，并获取每个样本图像基础人物的脸部轮廓。

可选的，所述根据每个样本图像基础人物的嘴巴关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角的步骤，包括：

根据每个样本左嘴角关键点坐标和每个样本右嘴角关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角。

可选的，所述按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取每个样本图像基础人物的嘴巴区域图像的步骤，包括：

按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取每个样本图像基础人物的嘴巴区域图像的尺寸；

根据所述每个样本图像基础人物的嘴巴区域图像的尺寸和所述每个样本图像基础人物的嘴巴关键点坐标，获取每个样本图像基础人物的嘴巴区域图像。

根据本公开实施例的第二方面，提供一种生成虚拟表情的装置，包括：

图像获取单元，被配置为获取人脸图像；所述人脸图像中包含用于生成虚拟表情的基础人物的图像；

区域图像和关键点坐标获取单元，被配置为从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标；

模型输入单元，被配置为将所述嘴巴区域图像和所述嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型；

嘴巴类型获取单元，被配置为获取所述嘴巴分类神经网络模型输出的嘴巴类型；

虚拟表情生成单元，被配置为根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情。

可选的，所述区域图像和关键点坐标获取单元，包括：脸部轮廓和关键点获取模块，及区域图像获取模块；

所述脸部轮廓和关键点获取模块，被配置为从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标；

所述区域图像获取模块，被配置为根据所述基础人物的脸部轮廓和嘴巴关键点坐标，获取嘴巴区域图像。

可选的，所述区域图像获取模块，包括：

目标夹角计算子模块，被配置为根据嘴巴关键点坐标，计算脸部轮廓与水平方向的目标夹角；

水平调整子模块，被配置为根据所述目标夹角，将所述脸部轮廓调整至水平方向；

嘴巴区域图像获取子模块，被配置为根据调整后的脸部轮廓，获取嘴巴区域图像。

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

可选的，所述脸部轮廓和关键点获取模块，具体被配置为：

可选的，所述目标夹角计算子模块，具体被配置为：

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

可选的，所述装置还包括：嘴巴分类神经网络模型训练单元；

所述嘴巴分类神经网络模型训练单元，包括：

嘴巴类型标注模块，被配置为用多个包含基础人物的图像作为样本图像，获取人工标注的每个样本图像基础人物的嘴巴类型；

嘴巴关键点坐标获取模块，被配置为获取每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标；

嘴巴区域图像获取模块，被配置为根据所述每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标，获取每个样本图像的嘴巴区域图像；

嘴巴分类神经网络模型训练模块，被配置为基于人工标注的每个样本图像基础人物的嘴巴类型，根据所述每个样本图像的嘴巴区域图像和所述每个样本图像基础人物的嘴巴关键点坐标，对待训练的嘴巴分类神经网络模型进行训练，获取训练好的嘴巴分类神经网络模型。

可选的，所述嘴巴区域图像获取模块，包括：

样本目标夹角计算子模块，被配置为根据每个样本图像基础人物的嘴巴关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角；

样本水平调整子模块，被配置为根据所述样本目标夹角，将所述每个样本图像基础人物的脸部轮廓调整至水平方向；

嘴巴区域图像获取子模块，被配置为根据每个样本图像基础人物调整后的脸部轮廓，分别获取每个样本图像基础人物的嘴巴区域图像。

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

可选的，所述嘴巴关键点坐标获取模块，具体被配置为：

可选的，所述样本目标夹角计算子模块，具体被配置为：根据每个样本左嘴角关键点坐标和每个样本右嘴角关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角。

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

根据本公开实施例的第三方面，提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述生成虚拟表情任一所述的方法步骤。

根据本公开实施例的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一生成虚拟表情的方法的步骤。

根据本公开实施例的第五方面，提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一生成虚拟表情的方法。

本公开的实施例提供的技术方案至少带来以下有益效果：本公开实施例中，可以获取人脸图像；所述人脸图像中包含用于生成虚拟表情的基础人物的图像；从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标；将所述嘴巴区域图像和所述嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型；获取所述嘴巴分类神经网络模型输出的嘴巴类型；根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情。可见，应用本公开实施例，可以识别出人脸图像基础人物的嘴巴类型，根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成基础人物的虚拟嘴巴作为虚拟表情，无需像相关技术需要手动设置虚拟嘴巴，应用本公开实施例，简化了用户操作。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种生成虚拟表情的方法的流程图；

图2a是根据一示例性实施例示出的一种嘴巴分类神经网络模型的结构图；

图2b是根据一示例性实施例示出的一种嘴巴分类神经网络模型的训练流程图；

图2c、图2d、图2e和图2f是根据一示例性实施例示出的人工标注的嘴巴类型的示例；

图3是根据一示例性实施例示出的另一种生成虚拟表情的方法的流程图；

图4是根据一示例性实施例示出的一种生成虚拟表情的装置的框图；

图5是根据一示例性实施例示出的一种电子设备的框图；

图6是根据一示例性实施例示出的一种用于生成虚拟表情的设备的框图；

图7是根据一示例性实施例示出的另一种用于生成虚拟表情的设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

为了解决相关技术需要手动生成虚拟表情，用户操作比较复杂的问题，本公开实施例提供了一种生成虚拟表情的方法、装置、电子设备及存储介质。本公开实施例所提供生成虚拟表情的方法，可以应用于任意需要生成虚拟表情的电子设备，如：电脑或移动终端等，在此不做具体限定。为了描述方便，以下简称电子设备。

图1是根据一示例性实施例示出的一种生成虚拟表情的方法的流程图，如图1所示，该生成虚拟表情的方法，应用于电子设备中，包括以下步骤：

步骤S101，获取人脸图像；所述人脸图像中包含用于生成虚拟表情的基础人物的图像。

可实施的，该人脸图像可以是该电子设备当前拍摄的包含基础人物的图像，也可以是用户从电子设备已经保存的图片中选择的包含基础人物的图像。基础人物可以是用户本人，也可以是用户选择的其他人，在此对获取人脸图像的方式不做具体限定。

步骤S102，从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标。

可实施的，可以采用两种方式来获取基础人物的嘴巴区域图像：

一种方式是：可以先从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标；再根据所述基础人物的脸部轮廓和嘴巴关键点坐标，获取嘴巴区域图像。

另一种方式是：可以先从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标；再根据嘴巴关键点坐标，计算脸部轮廓与水平方向的目标夹角；根据所述目标夹角，将所述脸部轮廓调整至水平方向；根据调整后的脸部轮廓，获取嘴巴区域图像。相对来说，用这种方式获取的嘴巴区域图像，识别出的嘴巴类型更准确。

步骤S103，将所述嘴巴区域图像和所述嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型。

可实施的，嘴巴分类神经网络模型的训练过程，可以包括：

步骤S104，获取所述嘴巴分类神经网络模型输出的嘴巴类型。

步骤S105，根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情。

例如：识别出是大嘴、唇锋锋利、嘴唇薄并且是M唇时，则可以生成所述基础人物的虚拟嘴巴作为虚拟表情。

可见，应用本公开实施例，可以识别出人脸图像基础人物的嘴巴类型，根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成基础人物的虚拟嘴巴作为虚拟表情，无需像相关技术需要手动设置虚拟嘴巴，应用本公开实施例，简化了用户操作。

可实施的，上述实施例中提到的嘴巴分类神经网络模型可以为深度神经网络模型训练获得，可以如图2a所示。

图2a是根据一示例性实施例示出的嘴巴分类神经网络模型的结构图，可以包括：

卷积神经网络、全连接网络和其它网络；

因为卷积神经网络可以用于处理二维图像，所以可以将嘴巴区域图像输入至卷积神经网络，获得图像特征；因为全连接网络可以用于处理一维信号，所以将嘴巴关键点坐标输入到全连接网络，获得关键点特征；再将该图像特征和该关键点特征输入到其它网络，实际应用中，该其它网络可以为对该图像特征和该关键点特征进行特征融合的附加网络；获得其它网络预测的该嘴巴的类型。

图2b是根据一示例性实施例示出的一种嘴巴分类神经网络模型的训练流程图，如图2b所示，该嘴巴分类神经网络模型的训练方法，包括以下步骤：

步骤S201，用多个包含基础人物的图像作为样本图像，获取人工标注的每个样本图像基础人物的嘴巴类型。

可实施的，可以用多个包含基础人物的图像作为样本图像。

可实施的，可以对每个样本图像预先分别标注嘴唇大小、嘴唇薄厚、嘴唇锋利/椭圆和M唇/omega唇。

人工标注的嘴巴类型的示例可以参照图2c、图2d、图2e和图2f。

如图2c左图所示，为厚唇的示例；如图2c右图所示，为薄唇的示例。

如图2d左图所示，为M唇的示例；如图2d右图所示，为Ω(omega)唇的示例。

如图2e左图所示，为唇锋锐利的示例；如图2e右图所示，为唇锋椭圆的示例。

如图2f左图所示，为大嘴巴的示例；如图2f右图所示，为小嘴巴的示例。

步骤S202，获取每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标。

在一种实施方式中，可以使用多任务级联卷积神经网络(MTCNN,Multi-taskCascaded Convolutional Networks)检测每个样本图像基础人物的脸部轮廓和获取每个样本图像基础人物的嘴巴关键点坐标。

可实施的，可以获取每个样本图像基础人物的样本左嘴角关键点坐标、样本右嘴角关键点坐标和样本嘴巴中线与上下嘴唇的交点，作为每个样本图像基础人物的嘴巴关键点坐标，并获取每个样本图像基础人物的脸部轮廓。

步骤S203，根据每个样本图像基础人物的嘴巴关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角。

可实施的，可以根据每个样本左嘴角关键点坐标和每个样本右嘴角关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角。可实施的，如果以屏幕的左上角为坐标原点，并且假设左嘴角和右嘴角的关键点坐标分别为(x1,y1)和(x2,y2)，则样本目标夹角alpha为：alpha＝arctan(-(y2-y1)/(x2-x1))。

步骤S204，根据所述样本目标夹角，将所述每个样本图像基础人物的脸部轮廓调整至水平方向。

步骤S205，根据每个样本图像基础人物调整后的脸部轮廓，分别获取每个样本图像基础人物的嘴巴区域图像。

可实施的，可以有两种方式获取嘴巴区域图像；

一种方式可以是：按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取每个样本图像基础人物的嘴巴区域图像。因为嘴巴的大小是相对于人脸而言的，例如：技术人员可以预先设置待裁剪的嘴巴区域为脸部轮廓的三分之一，则嘴巴区域图像就可以对应裁剪脸部轮廓的三分之一，在这里对预设的待裁剪的嘴巴区域与脸部轮廓的关系不做具体限定，技术开发人员可以根据实际情况预先设置。

另一种方式可以是：按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取每个样本图像基础人物的嘴巴区域图像的尺寸；根据所述每个样本图像基础人物的嘴巴区域图像的尺寸和所述每个样本图像基础人物的嘴巴关键点坐标，获取每个样本图像基础人物的嘴巴区域图像。例如：技术人员可以根据样本嘴巴中线与上下嘴唇的交点坐标计算出该样本嘴巴中心点坐标，根据嘴巴区域图像的尺寸对齐样本嘴巴中心点坐标，获取每个样本图像基础人物的嘴巴区域图像。

步骤S206，基于人工标注的每个样本图像基础人物的嘴巴类型，根据所述每个样本图像的嘴巴区域图像和所述每个样本图像基础人物的嘴巴关键点坐标，对待训练的嘴巴分类神经网络模型进行训练，获取训练好的嘴巴分类神经网络模型。

可实施的，该步骤具体可以包括：

步骤A，将多个样本图像的嘴巴区域图像和嘴巴关键点坐标输入待训练的嘴巴分类神经网络模型。

可实施的，具体可以是：将嘴巴区域图像输入到待训练的嘴巴分类神经网络模型的卷积神经网络，将嘴巴关键点坐标输入到待训练的嘴巴分类神经网络模型的全连接网络。

步骤B，获取所述待训练的嘴巴分类神经网络模型输出该样本中嘴巴类型的预测结果。

步骤C，使用该样本中人工标注的嘴巴类型、输出的嘴巴类型的预测结果和预设的损失函数计算损失值。

步骤D，根据损失值判断嘴巴分类神经网络模型是否收敛。

如果收敛，则待训练的嘴巴分类神经网络模型为训练好的的嘴巴分类神经网络模型；如果未收敛，则调整待训练的嘴巴分类神经网络模型的网络参数，返回执行所述将多个样本图像的嘴巴区域图像和嘴巴关键点坐标输入待训练的嘴巴分类神经网络模型的步骤，直到嘴巴分类神经网络模型收敛，训练结束。

另外，在其他实施方式中，当对嘴巴分类神经网络模型输出的嘴巴类型精度要求不高时，也可以不获取样本目标夹角，即不用将脸部轮廓调整为水平，只要裁剪较大的嘴巴区域图像，也可以实现对嘴巴分类神经网络模型的训练。

在本公开实施例中，将嘴巴区域图像和嘴巴关键点坐标，输入到嘴巴分类神经网络模型中进行训练，获得的嘴巴分类神经网络模型对嘴巴类型识别的准确率较高。

图3是根据一示例性实施例示出的另一种生成虚拟表情方法的流程图，如图3所示，该生成虚拟表情方法用于电子设备中，包括以下步骤：

步骤S301，获取人脸图像；所述人脸图像中包含用于生成虚拟表情的基础人物的图像。

实际应用中，步骤S301可以与图1中的步骤S101相同，这里不再详细说明。

步骤S302，从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标。

在一种实施方式中，可以使用多任务级联卷积神经网络(MTCNN,Multi-taskCascaded Convolutional Networks)检测人脸脸部轮廓和获取嘴巴关键点坐标。

可实施的，从所述人脸图像中，获取左嘴角关键点坐标、右嘴角关键点坐标和嘴巴中线与上下嘴唇的交点，作为嘴巴关键点坐标，并获取所述基础人物的脸部轮廓。

步骤S303，根据嘴巴关键点坐标，计算脸部轮廓与水平方向的目标夹角。

可实施的，可以根据左嘴角关键点坐标和右嘴角关键点坐标，计算脸部轮廓与水平方向的目标夹角。如果以屏幕的左上角为坐标原点，并且假设左嘴角和右嘴角的关键点坐标分别为(x1,y1)和(x2,y2)，则目标夹角alpha为：alpha＝arctan(-(y2-y1)/(x2-x1))。

步骤S304，根据所述目标夹角，将所述脸部轮廓调整至水平方向。

步骤S305，根据调整后的脸部轮廓，获取嘴巴区域图像。

可实施的，可以按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取嘴巴区域图像。

在一种具体的实施方式中，可以按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取嘴巴区域图像的尺寸；根据所述嘴巴区域图像的尺寸和所述嘴巴关键点坐标获取嘴巴区域图像。

步骤S306，将所述嘴巴区域图像和所述嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型。

步骤S307，获取所述嘴巴分类神经网络模型输出的嘴巴类型。

步骤S308，根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情。

实际应用中，上述步骤S306～308可以与图1中的步骤S103～步骤S105相同，这里不再详细说明。

图4是根据一示例性实施例示出的一种生成虚拟表情的装置框图。参照图4，该装置包括：

图像获取单元401，被配置为获取人脸图像；所述人脸图像中包含用于生成虚拟表情的基础人物的图像；

区域图像和关键点坐标获取单元402，被配置为从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标；

模型输入单元403，被配置为将所述嘴巴区域图像和所述嘴巴关键点坐标，输入到预先训练好的嘴巴分类神经网络模型；

嘴巴类型获取单元404，被配置为获取所述嘴巴分类神经网络模型输出的嘴巴类型；

虚拟表情生成单元405，被配置为根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情。

可选的，所述区域图像获取模块，包括：

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

可选的，所述脸部轮廓和关键点获取模块，具体被配置为：

可选的，所述目标夹角计算子模块，具体被配置为：

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

所述嘴巴分类神经网络模型训练单元，包括：

可选的，所述嘴巴区域图像获取模块，包括：

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

可选的，所述嘴巴关键点坐标获取模块，具体被配置为：

可选的，所述嘴巴区域图像获取子模块，具体被配置为：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本发明实施例还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现如下步骤：

获取所述嘴巴分类神经网络模型输出的嘴巴类型；

图6是根据一示例性实施例示出的一种用于生成虚拟表情的装置600的框图。例如，装置600可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图6，装置600可以包括以下一个或多个组件：处理组件602，存储器604，电源组件606，多媒体组件608，音频组件610，输入/输出(I/O)接口612，传感器组件614，以及通信组件616。

处理组件602通常控制装置600的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件602可以包括一个或多个模块，便于处理组件602和其他组件之间的交互。例如，处理组件602可以包括多媒体模块，以方便多媒体组件608和处理组件602之间的交互。

存储器604被配置为存储各种类型的数据以支持在装置600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件606为装置600的各种组件提供电力。电源组件606可以包括电源管理系统，一个或多个电源，及其他与为装置600生成、管理和分配电力相关联的组件。

多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件610被配置为输出和/或输入音频信号。例如，音频组件610包括一个麦克风(MIC)，当装置600处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中，音频组件610还包括一个扬声器，用于输出音频信号。

I/O接口612为处理组件602和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件614包括一个或多个传感器，用于为装置600提供各个方面的状态评估。例如，传感器组件614可以检测到设备600的打开/关闭状态，组件的相对定位，例如所述组件为装置600的显示器和小键盘，传感器组件614还可以检测装置600或装置600一个组件的位置改变，用户与装置600接触的存在或不存在，装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件614还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件616还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器604，上述指令可由装置600的处理器620执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图7是根据一示例性实施例示出的一种用于生成虚拟表情的装置700的框图。例如，装置700可以被提供为一服务器。参照图7，装置700包括处理组件722，其进一步包括一个或多个处理器，以及由存储器732所代表的存储器资源，用于存储可由处理组件722的执行的指令，例如应用程序。存储器732中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件722被配置为执行指令，以执行上述任一生成虚拟表情的方法。

装置700还可以包括一个电源组件726被配置为执行装置700的电源管理，一个有线或无线网络接口750被配置为将装置700连接到网络，和一个输入输出(I/O)接口758。装置700可以操作基于存储在存储器732的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似……。

在示例性实施例中，还提供了一种存储介质，所述存储介质内存储有计算机程序，当所述计算机程序被处理器执行时，实现上述任一所述的生成虚拟表情的方法。

可选地，该存储介质可以是非临时性计算机可读存储介质，示例性的，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的生成虚拟表情的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种生成虚拟表情的方法，其特征在于，包括：

获取所述嘴巴分类神经网络模型输出的嘴巴类型；

根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情；

所述嘴巴分类神经网络模型，包括：卷积神经网络、全连接网络和附加网络；

其中，所述卷积神经网络，用于根据所述嘴巴区域图像，得到图像特征；

所述全连接网络，用于根据嘴巴关键点坐标，得到关键点特征；

所述附加网络，用于对所述图像特征与所述关键点特征进行融合，得到所述嘴巴类型。

2.根据权利要求1所述的方法，其特征在于，所述从所述人脸图像中，获取所述基础人物的嘴巴区域图像，和嘴巴关键点坐标的步骤，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述基础人物的脸部轮廓和嘴巴关键点坐标，获取嘴巴区域图像的步骤，包括：

根据所述目标夹角，将所述脸部轮廓调整至水平方向；

根据调整后的脸部轮廓，获取嘴巴区域图像。

4.根据权利要求3所述的方法，其特征在于，所述根据调整后的脸部轮廓，获取嘴巴区域图像的步骤，包括：

5.根据权利要求3所述的方法，其特征在于，所述从所述人脸图像中，获取所述基础人物的脸部轮廓和嘴巴关键点坐标的步骤，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据嘴巴关键点坐标，计算脸部轮廓与水平方向的目标夹角的步骤，包括：

7.根据权利要求4所述的方法，其特征在于，所述按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取嘴巴区域图像的步骤，包括：

8.根据权利要求1所述的方法，其特征在于，所述嘴巴分类神经网络模型的训练过程，包括：

9.根据权利要求8所述的方法，其特征在于，所述根据所述每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标，获取每个样本图像的嘴巴区域图像的步骤，包括；

10.根据权利要求9所述的方法，其特征在于，所述根据每个样本图像基础人物调整后的脸部轮廓，分别获取每个样本图像基础人物的嘴巴区域图像的步骤，包括：

11.根据权利要求9所述的方法，其特征在于，所述获取每个样本图像基础人物的脸部轮廓和每个样本图像基础人物的嘴巴关键点坐标的步骤，包括：

12.根据权利要求11所述的方法，其特征在于，所述根据每个样本图像基础人物的嘴巴关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角的步骤，包括：

13.根据权利要求10所述的方法，其特征在于，所述按照预设的嘴巴区域图像的尺寸和脸部轮廓的尺寸对应关系，获取每个样本图像基础人物的嘴巴区域图像的步骤，包括：

14.一种生成虚拟表情的装置，其特征在于，包括：

虚拟表情生成单元，被配置为根据预设的嘴巴类型与各个虚拟嘴巴的对应关系，生成所述基础人物的虚拟嘴巴作为虚拟表情；

15.根据权利要求14所述的装置，其特征在于，所述区域图像和关键点坐标获取单元，包括：脸部轮廓和关键点获取模块，及区域图像获取模块；

16.根据权利要求15所述的装置，其特征在于，所述区域图像获取模块，包括：

17.根据权利要求16所述的装置，其特征在于，所述嘴巴区域图像获取子模块，具体被配置为：

18.根据权利要求16述的装置，其特征在于，所述脸部轮廓和关键点获取模块，具体被配置为：

19.根据权利要求18所述的装置，其特征在于，所述目标夹角计算子模块，具体被配置为：

20.根据权利要求17所述的装置，其特征在于，所述嘴巴区域图像获取子模块，具体被配置为：

21.根据权利要求14所述的装置，其特征在于，所述装置还包括：嘴巴分类神经网络模型训练单元；

所述嘴巴分类神经网络模型训练单元，包括：

22.根据权利要求21所述的装置，其特征在于，所述嘴巴区域图像获取模块，包括：

23.根据权利要求22所述的装置，其特征在于，所述嘴巴区域图像获取子模块，具体被配置为：

24.根据权利要求22所述的装置，其特征在于，所述嘴巴关键点坐标获取模块，具体被配置为：

25.根据权利要求24所述的装置，其特征在于，所述样本目标夹角计算子模块，具体被配置为：根据每个样本左嘴角关键点坐标和每个样本右嘴角关键点坐标，计算每个样本图像基础人物的脸部轮廓与水平方向的样本目标夹角。

26.根据权利要求23所述的装置，其特征在于，所述嘴巴区域图像获取子模块，具体被配置为：

27.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-13任一所述的方法步骤。

28.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-13任一所述的方法步骤。