CN113409454B - 人脸图像处理方法、装置、电子设备及存储介质 - Google Patents

人脸图像处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113409454B
CN113409454B CN202110796598.XA CN202110796598A CN113409454B CN 113409454 B CN113409454 B CN 113409454B CN 202110796598 A CN202110796598 A CN 202110796598A CN 113409454 B CN113409454 B CN 113409454B
Authority
CN
China
Prior art keywords
face model
standard
stylized
transformed
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110796598.XA
Other languages
English (en)
Other versions
CN113409454A (zh
Inventor
陈睿智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110796598.XA priority Critical patent/CN113409454B/zh
Publication of CN113409454A publication Critical patent/CN113409454A/zh
Application granted granted Critical
Publication of CN113409454B publication Critical patent/CN113409454B/zh
Priority to US17/827,403 priority patent/US20220292795A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/149Segmentation; Edge detection involving deformable models, e.g. active contour models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/08Indexing scheme for image data processing or generation, in general involving all processing steps from image acquisition to 3D model generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2024Style variation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Architecture (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

本公开提供了一种人脸图像处理方法、装置、电子设备及存储介质,涉及图像处理、增强现实、计算机视觉、深度学习等技术领域。方法包括:获取待处理人脸图像的三维人脸模型,三维人脸模型包括多个网格节点;确定三维人脸模型的待变换区域;获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;基于刚性变换关系对待变换区域进行处理,得到待处理人脸图像对应的风格化人脸模型。本公开技术方案,基于标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系,对待处理人脸图像的待变换区域进行处理,这样得到的风格化人脸模型,在保持风格化人脸模型总体风格的前提下,极大地提升了风格化人脸模型与待处理人脸图像的相似度。

Description

人脸图像处理方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及图像处理、增强现实、计算机视觉、深度学习等领域。
背景技术
随着人们生活内容逐渐数字化虚拟化,以及数字世界和数字孪生等概念的深入人心,虚拟现实和增强现实的应用需求必将出现井喷。虚拟形象作为数字世界中人的重要代理形式,其个性化生产目前还主要依赖于设计师定制,成本较高。一般来讲,生产一个低品质的代理模型需要数万的成本,如果定制高精度模型的话,比如,针对某个具体人物制作相似度较高的数字主持人等,成本一般都在100万左右。
为了降低成本,现有技术中的个性化虚拟形象解决方案,一般包括人脸重建和重建结果风格化两个过程。虽然人脸重建过程可以还原出照片人脸的形状,但后续的风格化模型生成过程由于需要展现诸如大眼睛、小鼻子等的风格特征,天然地就会弱化原始图像的人脸特征。因此,需要一种能够保持原始人脸特征的风格化模型生成方法。
发明内容
本公开提供了一种人脸图像处理方法、装置、电子设备及存储介质。
根据本公开的一方面,提供了一种人脸图像处理方法,包括:
获取待处理人脸图像的三维人脸模型,三维人脸模型包括多个网格节点;
确定三维人脸模型的待变换区域;
获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;
基于刚性变换关系对待变换区域进行处理,得到待处理人脸图像对应的风格化人脸模型。
根据本公开的另一方面,提供了一种人脸图像处理装置,包括:
模型获取模块,用于获取待处理人脸图像的三维人脸模型,三维人脸模型包括多个网格节点;
区域确定模块,用于确定三维人脸模型的待变换区域;
关系获取模块,用于获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;
模型生成模块,用于基于刚性变换关系对待变换区域进行处理,得到待处理人脸图像对应的风格化人脸模型。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例中的方法。
本公开技术方案提供的人脸图像处理方法、装置、电子设备及存储介质,基于标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系,对待处理人脸图像的待变换区域进行处理,这样得到的风格化人脸模型,在保持风格化人脸模型总体风格的前提下,极大地提升了风格化人脸模型与待处理人脸图像的相似度。同时,基于待处理人脸图像的三维人脸模型,即可自动完成风格化人脸模型的生成,从而降低了多风格虚拟形象的素材适配成本。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开一实施例中人脸图像处理方法的示意图;
图2为本公开一实施例中确定三维人脸模型的待变换区域的示意图;
图3为本公开一实施例中人脸图像处理方法的示意图;
图4为本公开一实施例中人脸图像处理方法的示意图;
图5为本公开一实施例中人脸图像处理方法的示意图;
图6为本公开一实施例中人脸图像处理方法的示意图;
图7为本公开一实施例中人脸图像处理装置的示意图;
图8为本公开一实施例中关系获取模块的示意图;
图9是用来实现本公开实施例的人脸图像处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开技术方案,为了让生成的个性化虚拟形象既有原始照片中的人脸特征,又能够具备虚拟形象统一的风格化特征,同时也为了降低新风格虚拟形象对虚拟形象自动建模系统的接入成本,提供了一种能够保持原始人脸特征的生成风格化模型的解决方案。
需要说明的是,本公开技术方案的各实施例中涉及的人脸图像处理方法的执行主体服务器可以通过各种公开、合法合规的方式获取人脸图像,例如可以是从公开数据集处获取的,或者是经过了用户的授权从用户处获取的。
本公开技术方案的各实施例中涉及的三维人脸模型、标准三维人脸模型和标准风格化人脸模型包含了人脸图像指示的用户的人脸信息,但三维人脸模型、标准三维人脸模型和标准风格化人脸模型的构建是在经用户授权后执行的,其构建过程符合相关法律法规。
本公开的执行主体可以是任一电子设备,例如,服务器、终端设备。以下将详细介绍本公开实施例中的人脸图像处理方法。
图1为本公开一实施例中人脸图像处理方法的示意图。如图1所示,人脸图像处理方法可以包括:
步骤S101,获取待处理人脸图像的三维人脸模型,三维人脸模型包括多个网格节点;
本实施例以服务器为执行主体。服务器获取到二维的待处理人脸图像后,提取待处理人脸图像的特征,根据提取到的特征,以及二维图像到三维模型的对应关系,对二维人脸图像进行重建,得到三维人脸模型,三维人脸模型包括多个网格节点,每个网格节点的位置可以通过一个三维坐标来表示。
服务器获取二维的待处理人脸图像的具体方式可以包括但不限于在预设图像数据库中获取,也可以接收用户终端发送的人脸图像,还可以通过其他方式获取人脸图像,本申请对此不做限定。
步骤S102,确定三维人脸模型的待变换区域;
其中,待变换区域可以是三维人脸模型中能够反映出人脸特征的区域,可以是一个区域,也可以是两个或者两个以上区域,可以根据具体需要来配置待变换区域的具体位置和数量。
步骤S103,获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;
其中,标准三维人脸模型和标准风格化人脸模型均为预存储的人脸模型。标准三维人脸模型可以是通过大量人脸图像进行重建,得到多个三维人脸模型,根据这些三维人脸模型的特征得到的标准化的人脸模型。标准风格化人脸模型可以是根据不同风格设计的人脸模型,例如,大眼睛小鼻子的风格、小眼睛大鼻子的风格等。可以预先存储多个不同风格的标准风格化人脸模型。
服务器计算标准三维人脸模型中的各网格节点到标准风格化人脸模型的各网格节点之间的刚性变换关系。刚性变换包括但不限于旋转、平移、缩放的变换。
步骤S104,基于刚性变换关系对待变换区域进行处理,得到待处理人脸图像对应的风格化人脸模型。
可选的,确定待变换区域在标准三维人脸模型、标准风格化人脸模型中对应的区域,根据标准三维人脸模型中对应的区域到标准风格化人脸模型中对应的区域之间的刚性变化关系,对待变换区域进行处理,得到风格化人脸模型。
例如,三维人脸模型中的待变换区域为左眼所在的区域,则基于标准三维人脸模型中左眼所在的区域到标准风格化人脸模型中左眼所在的区域之间的刚性变化关系,对三维人脸模型中的左眼所在的区域进行处理,得到处理后的风格化人脸模型。本公开技术方案提供的人脸图像处理方法,基于标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系,对待处理人脸图像的待变换区域进行处理,这样得到的风格化人脸模型,在保持风格化人脸模型总体风格的前提下,极大地提升了风格化人脸模型与待处理人脸图像的相似度。同时,基于待处理人脸图像的三维人脸模型,即可自动完成风格化人脸模型的生成,从而降低了多风格虚拟形象的素材适配成本。
本公开技术方案中,获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系的具体方式,见如下实施例:
在一种实现方式中,步骤S103,包括:
步骤S1031,按照相同方式分别将标准三维人脸模型和标准风格化人脸模型划分为多个区域,每个区域包括多个网格节点;
步骤S1032,分别将标准三维人脸模型的每个区域作为当前区域,确定当前区域的网格节点到标准风格化人脸模型的对应区域的网格节点的刚性变换,得到当前区域对应的刚性变换矩阵。
具体的,分别将标准三维人脸模型和标准风格化人脸模型划分为多个区域,两个模型中区域的数量相同,标准三维人脸模型中的各区域和标准风格化人脸模型中的各区域的位置相对应。对于标准三维人脸模型中的每个当前区域,计算该区域中的网格节点到标准风格化人脸模型的对应区域的网格节点的刚性变换,得到刚性变换矩阵。刚性变换关系可以是刚性变换矩阵,矩阵中的每个元素是标准三维人脸模型的每个区域中的网格节点到标准风格化人脸模型的对应区域的网格节点的刚性变换。
本公开实施例中,按照相同方式分别将标准三维人脸模型和标准风格化人脸模型划分区域,并计算标准三维人脸模型和标准风格化人脸模型中对应区域的网格节点之间的刚性变换,从而得到刚性变换矩阵,作为后续对于待处理人脸图像进行处理的基础,刚性变换可以使得模型变换过程中保留更多的形态特征。
其中,对于如何按照相同方式分别将标准三维人脸模型和标准风格化人脸模型划分为多个区域,具体见如下实施例:
在一种实现方式中,按照相同方式分别将标准三维人脸模型和标准风格化人脸模型划分为多个区域,包括:
分别基于标准三维人脸模型和标准风格化人脸模型中的五官的位置,将标准三维人脸模型和标准风格化人脸模型划分为多个区域。
具体的,分别确定标准三维人脸模型和标准风格化人脸模型中的五官的位置,对于标准三维人脸模型和标准风格化人脸模型进行区域划分时,由于五官是能够体现人脸特征的部分,因此可以按照五官的位置划分区域,从而得到标准三维人脸模型中五官的位置对应的区域,以及标准风格化人脸模型中五官的位置对应的区域。
本公开实施例中,按照标准三维人脸模型和标准风格化人脸模型中的五官的位置划分区域,这样计算得到的标准三维人脸模型和标准风格化人脸模型各区域中的网格节点的刚性变换,应用到待处理人脸图中,更能够体现出待处理人脸图像中的人脸的特征。
本公开技术方案中,确定三维人脸模型的待变换区域的具体方式,见如下实施例:
在一种实现方式中,步骤S102,包括:
基于三维人脸模型中的五官的位置,确定三维人脸模型的待变换区域。
具体的,在确定三维人脸模型的待变换区域时,由于五官是能够体现人脸特征的部分,因此可以按照五官的位置确定待变换区域,将五官的位置对应的区域作为待变换区域。
本公开实施例中,根据三维人脸模型中的五官的位置,确定三维人脸模型的待变换区域,在进行风格化人脸模型生成的过程中,可以使风格化人脸模型和待处理人脸图像中的人脸相似度更高。
在一种实现方式中,五官的位置包括以下至少一种:左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖各自对应的位置。
其中,五官的位置可以是左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖中的一项对应的位置,也可以是其中的多项对应的位置。
在一个具体的实施例中,可以将待处理人脸图像对应的三维人脸模型按照左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖对应位置划分为8个待变换区域,如图2所示,头盖对应的位置为区域1,右眉毛对应的位置为区域2,左眉毛对应的位置为区域3,左眼睛对应的位置为区域4,右眼睛对应的位置为区域5,鼻子对应的位置为区域6,嘴巴对应的位置为区域7,脸颊对应的位置为区域8。在获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系时,则计算标准三维人脸模型和标准风格化人脸模型之间的上述8个区域的刚性变换矩阵,得到8个刚性变换矩阵,基于8个刚性变换矩阵分别对8个待变换区域进行处理,得到风格化人脸模型。
本公开实施例中,由于人脸中左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖能够体现出人脸的特征,因此根据左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖的位置确定三维人脸模型的待变换区域,在进行风格化人脸模型生成的过程中,可以使风格化人脸模型和待处理人脸图像中的人脸相似度更高。
本公开实施例中,基于刚性变换关系对待变换区域进行处理,得到待处理人脸图像对应的风格化人脸模型的具体实现方式,见如下实施例:
在一种实现方式中,步骤S104,包括:
步骤S1041,基于刚性变换关系对待变换区域进行变换;
步骤S1042,确定变换后的三维人脸模型中的待变换区域和非待变换区域的交界区域,对交界区域进行平滑处理,得到待处理人脸图像对应的风格化人脸模型。
在实际应用中,基于刚性变换关系对三维人脸模型的待变换区域进行变换之后,三维人脸模型中的待变换区域和非待变换区域的交界区域可能会出现褶皱等不光滑现象,因此,需要确定出交界区域的位置,针对交界区域的网格节点进行平滑处理,这样通过刚性变换和平滑处理两个部分的处理,得到待处理人脸图像对应的风格化人脸模型。
本公开实施例中,通过刚性变换和平滑处理两个部分的处理,这样得到待处理人脸图像对应的风格化人脸模型,和待处理人脸图像中的人脸相似度更高,由于进行的平滑处理,视觉效果更好。
在一种实现方式中,对交界区域进行平滑处理,得到待处理人脸图像对应的风格化人脸模型,包括:
利用拉普拉斯光顺算法对交界区域进行平滑处理,得到待处理人脸图像对应的风格化人脸模型。
其中,平滑处理可以通过多种平滑处理算法来实现,例如,拉普拉斯光顺算法(Laplace smoothing)。可以理解的是,还可以通过其他平滑处理算法对存在褶皱的交界区域进行处理,本申请对此不做限定。
本公开实施例中,利用拉普拉斯光顺算法对交界区域进行平滑处理,处理后视觉效果更好,可以满足风格化模型生成的需要。
图3为本公开一实施例中人脸图像处理方法的示意图。本实施例中通过风格化模型生成系统来实现人脸图像处理方法。如图3所示,将待处理人脸图像1输入风格化模型生成系统,获取待处理人脸图像1的三维人脸模型,如图3中第二行第二列的图像,按照三维人脸模型中五官的位置,确定三维人脸模型的待变换区域,获取标准三维人脸模型(如图3中第一行的第一个图像“标准人脸模型”)和标准风格化人脸模型(如图3中第一行的第二个图像“标准风格化模型”)之间的刚性变换关系,基于刚性变换关系对待变换区域进行变换(如图3中所示的“五官区域的分区映射”),得到变换后的三维人脸模型,如图3中第二行的第三列的图像,确定变换后的三维人脸模型中的待变换区域和非待变换区域的交界区域,对交界区域进行平滑处理(如图3中所示的“非五官区域的平滑”),得到待处理人脸图像1对应的风格化人脸模型,如图3中第二行的第四列的图像。同样处理方式,将待处理人脸图像2输入风格化模型生成系统,待处理人脸图像2的三维人脸模型,如图3中第三行第二列的图像,按照三维人脸模型中五官的位置,确定三维人脸模型的待变换区域,获取标准三维人脸模型(如图3中第一行的第一个图像“标准人脸模型”)和标准风格化人脸模型(如图3中第一行的第二个图像“标准风格化模型”)之间的刚性变换关系,基于刚性变换关系对待变换区域进行变换(如图3中所示的“五官区域的分区映射”),得到变换后的三维人脸模型,如图3中第三行的第三列的图像,确定变换后的三维人脸模型中的待变换区域和非待变换区域的交界区域,对交界区域进行平滑处理(如图3中所示的“非五官区域的平滑”),得到待处理人脸图像2对应的风格化人脸模型,如图3中第三行的第四列的图像。
图4为本公开一实施例中人脸图像处理方法的示意图。如图4所示,预存储标准人脸三维模型(如图4中第一行第一列的图像“标准人脸模型”)和标准风格化人脸模型(如图4中第一行第二列的图像“标准风格化模型”),分别将标准人脸三维模型和标准风格化人脸模型按照五官的位置进行分区,得到分区后的标准人脸三维模型(如图4中第二行第一列的图像“分区后的标准人脸模型”)和标准风格化人脸模型(如图4中第二行第二列的图像“分区后的标准风格化模型”),标准人脸三维模型和标准风格化人脸模型分别包括多个网格节点,计算标准人脸三维模型和标准风格化人脸模型各对应区域的网格节点的刚性变换关系,基于刚性变换关系,对标准人脸三维模型的各区域的网格节点进行处理,得到处理之后的风格化人脸模型,如图4中第二行第三列的图像“风格化模型”。
本公开技术方案中,标准风格化人脸模型可以是预存储的多个模型,基于标准三维人脸模型和多个标准风格化人脸模型得到的刚性变换关系,对待处理人脸图像进行处理之后,可以得到多个风格化人脸模型。本实施例中通过风格化模型生成系统来实现人脸图像处理方法,包括三个标准风格化人脸模型。图5为本公开一实施例中人脸图像处理方法的示意图。如图5所示,预存储模型(如图中所示的“base模型”)包括:标准三维人脸模型,以及风格1的标准风格化人脸模型、风格2的标准风格化人脸模型、风格3的标准风格化人脸模型。
将待处理人脸图像(如图5所示的“人脸图像1”)输入风格化模型生成系统,对待处理人脸图像进行重建,得到重建结果,也就是三维人脸模型,如图5中第二行第二列的图像,获取标准三维人脸模型(如图5中第一行的第一个图像)和风格1的标准风格化人脸模型(如图5中第一行的第二个图像)之间的刚性变换关系,基于刚性变换关系对三维人脸模型进行处理,并对交界区域进行平滑处理,得到人脸图像1对应的风格1的风格化人脸模型,如图5中第二行的第三列的图像。
同样的处理方式,获取标准三维人脸模型(如图5中第一行的第一个图像)和风格2的标准风格化人脸模型(如图5中第一行的第三个图像)之间的刚性变换关系,基于刚性变换关系对三维人脸模型进行处理,并对交界区域进行平滑处理,得到人脸图像1对应的风格2的风格化人脸模型,如图5中第二行的第四列的图像。
同样的处理方式,获取标准三维人脸模型(如图5中第一行的第一个图像)和风格3的标准风格化人脸模型(如图5中第一行的第四个图像)之间的刚性变换关系,基于刚性变换关系对三维人脸模型进行处理,并对交界区域进行平滑处理,得到人脸图像1对应的风格3的风格化人脸模型,如图5中第二行的第五列的图像。
对人脸图像2采用同样的处理方式,得到人脸图像2对应的风格1的风格化人脸模型(如图5中第三行的第三列的图像)、风格2的风格化人脸模型(如图5中第三行的第四列的图像)和风格3的风格化人脸模型(如图5中第三行的第五列的图像)。
图6为本公开一实施例中人脸图像处理方法的示意图。如图6所示,人脸图像处理方法可以包括:
步骤S601,获取待处理人脸图像的三维人脸模型,三维人脸模型包括多个网格节点;
步骤S602,确定三维人脸模型的待变换区域;
步骤S603,分别基于标准三维人脸模型和标准风格化人脸模型中的五官的位置,将标准三维人脸模型和标准风格化人脸模型划分为多个区域;
步骤S604,分别将标准三维人脸模型的每个区域作为当前区域,确定当前区域的网格节点到标准风格化人脸模型的对应区域的网格节点的刚性变换,得到当前区域对应的刚性变换矩阵;
步骤S605,基于刚性变换矩阵对待变换区域进行变换;
步骤S606,确定变换后的三维人脸模型中的待变换区域和非待变换区域的交界区域,对交界区域进行平滑处理,得到待处理人脸图像对应的风格化人脸模型。
本公开实施例中,根据三维人脸模型中的五官的位置,确定三维人脸模型的待变换区域,在进行风格化人脸模型生成的过程中,可以使风格化人脸模型和待处理人脸图像中的人脸相似度更高。通过刚性变换和平滑处理两个部分的处理,这样得到待处理人脸图像对应的风格化人脸模型,和待处理人脸图像中的人脸相似度更高,由于进行的平滑处理,视觉效果更好。
图7为本公开一实施例中人脸图像处理装置的示意图。如图7所示,人脸图像处理装置可以包括:
模型获取模块701,用于获取待处理人脸图像的三维人脸模型,三维人脸模型包括多个网格节点;
区域确定模块702,用于确定三维人脸模型的待变换区域;
关系获取模块703,用于获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;
模型生成模块704,用于基于刚性变换关系对待变换区域进行处理,得到待处理人脸图像对应的风格化人脸模型。
本公开技术方案提供的人脸图像处理装置,基于标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系,对待处理人脸图像的待变换区域进行处理,这样得到的风格化人脸模型,在保持风格化人脸模型总体风格的前提下,极大地提升了风格化人脸模型与待处理人脸图像的相似度。同时,基于待处理人脸图像的三维人脸模型,即可自动完成风格化人脸模型的生成,从而降低了多风格虚拟形象的素材适配成本。
图8为本公开一实施例中关系获取模块的示意图。如图8所示,在一种实现方式中,关系获取模块703包括划分单元和确定单元;
划分单元801,用于按照相同方式分别将标准三维人脸模型和标准风格化人脸模型划分为多个区域,每个区域包括多个网格节点;
确定单元802,用于分别将标准三维人脸模型的每个区域作为当前区域,确定当前区域的网格节点到标准风格化人脸模型的对应区域的网格节点的刚性变换,得到当前区域对应的刚性变换矩阵。
在一种实现方式中,划分单元801具体用于:
分别基于标准三维人脸模型和标准风格化人脸模型中的五官的位置,将标准三维人脸模型和标准风格化人脸模型划分为多个区域。
在一种实现方式中,区域确定模块702,具体用于:
基于三维人脸模型中的五官的位置,确定三维人脸模型的待变换区域。
在一种实现方式中,五官的位置包括以下至少一种:左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖各自对应的位置。
在一种实现方式中,模型生成模块704包括变换单元和处理单元;
变换单元,用于基于刚性变换关系对待变换区域进行变换;
处理单元,用于确定变换后的三维人脸模型中的待变换区域和非待变换区域的交界区域,对交界区域进行平滑处理,得到待处理人脸图像对应的风格化人脸模型。
在一种实现方式中,处理单元在对交界区域进行平滑处理时,用于:
利用拉普拉斯光顺算法对交界区域进行平滑处理,得到待处理人脸图像对应的风格化人脸模型。
本公开实施例各装置中的各单元、模块或子模块的功能可以参见上述方法实施例中的对应描述,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如人脸图像处理方法。例如,在一些实施例中,人脸图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的人脸图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行人脸图像处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (15)

1.一种人脸图像处理方法,所述方法包括:
获取待处理人脸图像的三维人脸模型,所述三维人脸模型包括多个网格节点;
确定所述三维人脸模型的待变换区域;
获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;
基于所述刚性变换关系对所述待变换区域进行处理,得到所述待处理人脸图像对应的风格化人脸模型;
其中,所述确定所述三维人脸模型的待变换区域,包括:
基于所述三维人脸模型中的五官的位置,确定所述三维人脸模型的待变换区域。
2.根据权利要求1所述的方法,其中,所述获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系,包括:
按照相同方式分别将所述标准三维人脸模型和所述标准风格化人脸模型划分为多个区域,每个区域包括多个网格节点;
分别将所述标准三维人脸模型的每个区域作为当前区域,确定所述当前区域的网格节点到所述标准风格化人脸模型的对应区域的网格节点的刚性变换,得到所述当前区域对应的刚性变换矩阵。
3.根据权利要求2所述的方法,其中,所述按照相同方式分别将所述标准三维人脸模型和所述标准风格化人脸模型划分为多个区域,包括:
分别基于所述标准三维人脸模型和所述标准风格化人脸模型中的五官的位置,将所述标准三维人脸模型和所述标准风格化人脸模型划分为多个区域。
4.根据权利要求1或3所述的方法,其中,所述五官的位置包括以下至少一种:左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖各自对应的位置。
5.根据权利要求1所述的方法,其中,所述基于所述刚性变换关系对所述待变换区域进行处理,得到所述待处理人脸图像对应的风格化人脸模型,包括:
基于所述刚性变换关系对所述待变换区域进行变换;
确定所述变换后的三维人脸模型中的所述待变换区域和非待变换区域的交界区域,对所述交界区域进行平滑处理,得到所述待处理人脸图像对应的风格化人脸模型。
6.根据权利要求5所述的方法,其中,所述对所述交界区域进行平滑处理,得到所述待处理人脸图像对应的风格化人脸模型,包括:
利用拉普拉斯光顺算法对所述交界区域进行平滑处理,得到所述待处理人脸图像对应的风格化人脸模型。
7.一种人脸图像处理装置,所述装置包括:
模型获取模块,用于获取待处理人脸图像的三维人脸模型,所述三维人脸模型包括多个网格节点;
区域确定模块,用于确定所述三维人脸模型的待变换区域;
关系获取模块,用于获取标准三维人脸模型和标准风格化人脸模型之间的刚性变换关系;
模型生成模块,用于基于所述刚性变换关系对所述待变换区域进行处理,得到所述待处理人脸图像对应的风格化人脸模型;
其中,所述区域确定模块,具体用于:
基于所述三维人脸模型中的五官的位置,确定所述三维人脸模型的待变换区域。
8.根据权利要求7所述的装置,其中,所述关系获取模块包括划分单元和确定单元;
所述划分单元,用于按照相同方式分别将所述标准三维人脸模型和所述标准风格化人脸模型划分为多个区域,每个区域包括多个网格节点;
所述确定单元,用于分别将所述标准三维人脸模型的每个区域作为当前区域,确定所述当前区域的网格节点到所述标准风格化人脸模型的对应区域的网格节点的刚性变换,得到所述当前区域对应的刚性变换矩阵。
9.根据权利要求8所述的装置,其中,所述划分单元,具体用于:
分别基于所述标准三维人脸模型和所述标准风格化人脸模型中的五官的位置,将所述标准三维人脸模型和所述标准风格化人脸模型划分为多个区域。
10.根据权利要求9所述的装置,其中,所述五官的位置包括以下至少一种:左眉毛、右眉毛、左眼睛、右眼睛、鼻子、嘴巴、脸颊和头盖各自对应的位置。
11.根据权利要求7所述的装置,其中,所述模型生成模块包括变换单元和处理单元;
所述变换单元,用于基于所述刚性变换关系对所述待变换区域进行变换;
所述处理单元,用于确定所述变换后的三维人脸模型中的所述待变换区域和非待变换区域的交界区域,对所述交界区域进行平滑处理,得到所述待处理人脸图像对应的风格化人脸模型。
12.根据权利要求11所述的装置,其中,所述处理单元在对所述交界区域进行平滑处理时,用于:
利用拉普拉斯光顺算法对所述交界区域进行平滑处理,得到所述待处理人脸图像对应的风格化人脸模型。
13.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
CN202110796598.XA 2021-07-14 2021-07-14 人脸图像处理方法、装置、电子设备及存储介质 Active CN113409454B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110796598.XA CN113409454B (zh) 2021-07-14 2021-07-14 人脸图像处理方法、装置、电子设备及存储介质
US17/827,403 US20220292795A1 (en) 2021-07-14 2022-05-27 Face image processing method, electronic device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110796598.XA CN113409454B (zh) 2021-07-14 2021-07-14 人脸图像处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113409454A CN113409454A (zh) 2021-09-17
CN113409454B true CN113409454B (zh) 2022-05-13

Family

ID=77686485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110796598.XA Active CN113409454B (zh) 2021-07-14 2021-07-14 人脸图像处理方法、装置、电子设备及存储介质

Country Status (2)

Country Link
US (1) US20220292795A1 (zh)
CN (1) CN113409454B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037814B (zh) * 2021-11-11 2022-12-23 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和介质
US11776227B1 (en) * 2022-09-13 2023-10-03 Katmai Tech Inc. Avatar background alteration

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205813B (zh) * 2016-12-16 2022-06-03 微软技术许可有限责任公司 基于学习网络的图像风格化
US10586368B2 (en) * 2017-10-26 2020-03-10 Snap Inc. Joint audio-video facial animation system
CN108596091A (zh) * 2018-04-24 2018-09-28 杭州数为科技有限公司 人物形象卡通化还原方法、系统及介质
CN108648142A (zh) * 2018-05-21 2018-10-12 北京微播视界科技有限公司 图像处理方法及装置
CN109978930B (zh) * 2019-03-27 2020-11-10 杭州相芯科技有限公司 一种基于单幅图像的风格化人脸三维模型自动生成方法
CN111127668B (zh) * 2019-12-26 2023-08-22 网易(杭州)网络有限公司 一种角色模型生成方法、装置、电子设备和存储介质
CN111695471B (zh) * 2020-06-02 2023-06-27 北京百度网讯科技有限公司 虚拟形象生成方法、装置、设备以及存储介质
US11587288B2 (en) * 2021-03-15 2023-02-21 Tencent America LLC Methods and systems for constructing facial position map

Also Published As

Publication number Publication date
US20220292795A1 (en) 2022-09-15
CN113409454A (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN113643412B (zh) 虚拟形象的生成方法、装置、电子设备及存储介质
CN113327278B (zh) 三维人脸重建方法、装置、设备以及存储介质
CN113409454B (zh) 人脸图像处理方法、装置、电子设备及存储介质
CN112785674A (zh) 纹理贴图的生成方法、渲染方法、装置、设备及存储介质
CN111768477A (zh) 三维人脸表情基建立方法及装置、存储介质及电子设备
CN111383308B (zh) 生成动画表情的方法和电子设备
JP2024004444A (ja) 3次元顔再構成モデルトレーニング、3次元顔イメージ生成方法及び装置
CN115147265A (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN114549710A (zh) 一种虚拟形象的生成方法、装置、电子设备及存储介质
CN115049799A (zh) 3d模型和虚拟形象的生成方法和装置
CN114708374A (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN113380269B (zh) 视频图像生成方法、装置、设备、介质和计算机程序产品
CN113658035A (zh) 脸部变换方法、装置、设备、存储介质以及产品
CN112562043A (zh) 图像处理方法、装置和电子设备
CN115359171B (zh) 虚拟形象处理方法、装置、电子设备和存储介质
CN116524162A (zh) 三维虚拟形象迁移方法、模型更新方法及相关设备
CN115775300A (zh) 人体模型的重建方法、人体重建模型的训练方法及装置
CN115761196A (zh) 一种对象的表情生成方法、装置、设备及介质
CN115082298A (zh) 图像生成方法、装置、电子设备以及存储介质
CN114648601A (zh) 虚拟形象的生成方法、电子设备、程序产品及用户终端
CN113781653A (zh) 对象模型生成方法、装置、电子设备及存储介质
CN113610992B (zh) 骨骼驱动系数确定方法、装置、电子设备及可读存储介质
CN116385643B (zh) 虚拟形象生成、模型的训练方法、装置及电子设备
CN114037814B (zh) 数据处理方法、装置、电子设备和介质
CN116229214B (zh) 模型训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant