CN113808249B - 图像处理方法、装置、设备和计算机存储介质 - Google Patents

图像处理方法、装置、设备和计算机存储介质 Download PDF

Info

Publication number
CN113808249B
CN113808249B CN202110892854.5A CN202110892854A CN113808249B CN 113808249 B CN113808249 B CN 113808249B CN 202110892854 A CN202110892854 A CN 202110892854A CN 113808249 B CN113808249 B CN 113808249B
Authority
CN
China
Prior art keywords
mixed
face
shape
mixed shape
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110892854.5A
Other languages
English (en)
Other versions
CN113808249A (zh
Inventor
陈睿智
赵晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110892854.5A priority Critical patent/CN113808249B/zh
Publication of CN113808249A publication Critical patent/CN113808249A/zh
Priority to US17/875,519 priority patent/US20230043766A1/en
Application granted granted Critical
Publication of CN113808249B publication Critical patent/CN113808249B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2021Shape modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Architecture (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

本公开公开了一种图像处理方法、装置、设备和计算机存储介质,涉及计算机视觉、增强现实和人工智能技术领域。具体实现方案为:获取待处理人脸图像;基于所述待处理人脸图像进行人脸重建,得到基于第一混合形状基底组的第一混合系数向量;依据预先得到的第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵,将所述第一混合系数向量映射至第二混合形状基底组,得到基于第二混合形状基底组的第二混合系数向量;获取输入的人脸调整信息,所述人脸调整信息包括第二混合形状基底信息;基于所述第二混合形状基底信息和所述第二混合系数向量,得到目标人脸图像。通过本公开提供的技术方案能够方便、灵活地进行人脸编辑。

Description

图像处理方法、装置、设备和计算机存储介质
技术领域
本公开涉及图像处理技术领域,尤其涉及计算机视觉、增强现实和人工智能技术领域。
背景技术
随着图像处理技术的发展和人们对产品趣味性需求的不断提升,虚拟形象的应用越来越广泛。例如,在直播场景中由虚拟形象代替主播的真实形象进行视频直播。再例如,在人机交互场景中采用虚拟形象模拟真实人物与用户进行交互。
目前的技术中已经能够根据输入的人脸图像生成与该人脸图像匹配的虚拟形象,但对生成的虚拟形象进行人脸编辑的技术亟待提高。
发明内容
有鉴于此,本公开提供了一种图像处理方法、装置、设备和计算机存储介质,提高对虚拟形象进行人脸编辑的灵活度。
根据本公开的第一方面,提供了一种图像处理方法,包括:
获取待处理人脸图像;
基于所述待处理人脸图像进行人脸重建,得到基于第一混合形状基底组的第一混合系数向量;
依据预先得到的第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵,将所述第一混合系数向量映射至第二混合形状基底组,得到基于第二混合形状基底组的第二混合系数向量;
获取输入的人脸调整信息,所述人脸调整信息包括第二混合形状基底信息;
基于所述第二混合形状基底信息和所述第二混合系数向量,得到目标人脸图像。
根据本公开的第二方面,提供了一种图像处理装置,包括:
图像获取单元,用于获取待处理人脸图像;
人脸重建单元,用于基于所述待处理人脸图像进行人脸重建,得到基于第一混合形状基底组的第一混合系数向量;
系数映射单元,用于依据预先得到的第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵,将所述第一混合系数向量映射至第二混合形状基底组,得到基于第二混合形状基底组的第二混合系数向量;
调整获取单元,用于获取输入的人脸调整信息,所述人脸调整信息包括第二混合形状基底信息;
编辑处理单元,用于基于所述第二混合形状基底信息和所述第二混合系数向量,得到目标人脸图像。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
根据本公开的第五方面,一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开实施例提供的主要方法流程图;
图2为本公开实施例提供的第一混合形状基底组的实例图;
图3为本公开实施例提供的第二混合形状基底组的实例图;
图4为本公开实施例提供的图像处理装置的结构图;
图5是用来实现本公开实施例的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在公开实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
图1为本公开实施例提供的主要方法流程图,该方法的执行主体为图像处理装置,该装置可以是位于服务器端的应用,或者还可以为位于服务器端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者,还可以位于具有较强计算能力的计算机终端,本申请实施例对此不进行特别限定。如图1中所示,该方法可以包括:
在101中,获取待处理人脸图像。
在102中,基于待处理人脸图像进行人脸重建,得到基于第一blendshape(混合形状)基底组的第一混合系数向量。
在103中,依据预先得到的第一blendshape基底组与第二blendshape基底组之间的系数映射矩阵,将第一混合系数向量映射至第二blendshape基底组,得到基于第二blendshape基底组的第二混合系数向量。
在104中,获取输入的人脸调整信息,该人脸调整信息包括第二blendshape基底信息。
在105中,基于第二blendshape基底信息和第二混合系数向量,得到目标人脸图像。
由以上技术方案可以看出,本公开提供了一种图像处理技术,能够方便、灵活地进行人脸编辑。下面结合实施例对上述各步骤进行详细描述。
在此需要说明的是,本公开实施例中涉及的“第一”、“第二”等并不具备顺序、大小、数量等方面的限制,仅仅用以在名称上进行区分。例如采用“第一blendshape基底组”和“第二blendshape基底组”用以区分两个blendshape基底组。再例如采用“第一混合系数向量”和“第二混合系数向量”区分两个向量。等等。
首先结合实施例对上述步骤101即“获取待处理人脸图像”进行详细描述。
在本公开实施例中,获取的待处理人脸图像指的是包含人脸的图像,可以包含一个人脸,也可以包含多个人脸。若包含多个人脸,可以对其中一个用户指定的人脸执行本公开实施例提供的处理方法,也可以对包含的所有人脸都分别执行本公开实施例提供的处理方法。
待处理人脸图像可以是灰度图像,也可以是彩色图像。本公开获取的待处理人脸图像指的是二维的人脸图像。
作为其中一种实施方式,对待处理人脸图像的获取可以是通过图像采集装置实时获取,例如用户通过诸如数码相机、智能终端的摄像头、网络摄像头等等图像采集装置实时对人脸进行拍摄,得到待处理人脸图像。
作为另一种实施方式,可以从用户终端本地获取存储的包含人脸的图像作为待处理人脸图像。例如,用户从计算机终端、智能手机、平板电脑等设备本地获取存储的待处理人脸图像。
待处理人脸图像可以是原始采集的人脸图像,也可以是进行了相关预处理之后的人脸图像。预处理可以包括诸如缩放、格式转换、图像增强、降噪滤波、图像校正等。
下面结合实施例对上述步骤102即“基于待处理人脸图像进行人脸重建,得到基于第一blendshape基底组的第一混合系数向量”进行详细描述。
为了方便对本步骤的理解,首先对blendshape进行说明。
blendshape的人脸表达是人脸重建技术的核心环节,其是单个网格变形以实现许多预定义形状和任何数量之间组合的技术。例如单个网格是默认形状的基本形状(例如无表情的面),并且基本形状的其他形状用于混合,是不同的表达(笑、皱眉、闭合眼皮),这些被统称为混合形状。
人脸重建指的是从一张或多张二维图像中重建出人脸的三维模型。人脸的三维模型M可以表示为:
M=(S,T) (1)
其中,S指的是人脸形状向量,T指的是人脸纹理向量。在本公开中仅涉及和关心人脸形状向量。
对于具体的人脸形状可以通过对不同blendshape基底进行加权来获取人脸重建结果。其中每个基底包括人脸上多个三维关键点的坐标。三维关键点指的是人脸在三维空间中的关键点。例如三位关键点可以为人脸的一些表达能力强的关键点,例如眼睛、人脸外轮廓、鼻子、眉毛、眼角、嘴巴、下巴等等。一个blendshape基底对应一个人脸形状。在本步骤中对人脸采用的不同blendshape基底称为第一blendshape基底组。人脸重建得到的人脸形状可以表示为如下公式:
Figure BDA0003196783930000051
其中,
Figure BDA0003196783930000052
指的是平均人脸基底的向量。第一blendshape基底组包含m个blendshape基底,对应基底的向量表示为si 1。αi 1为m个基底对应的加权系数,所有基底对应的加权系数就构成了第一混合系数向量α1。在本公式以及后续公式中,上标1和2分别代表第一blendshape基底组和第二blendshape基底组。
举个例子,如图2中所示,第一blendshape基底组包含平均人脸基底base和4个其他人脸基底base1~base4,其中平均人脸base对应的向量为
Figure BDA0003196783930000054
四个其他人脸基底对应的向量为s1 1~s4 1。每个人脸基底分别对应有一个加权系数,表示为α1 1~α4 1。那么人脸形状可以表示为:
Figure BDA0003196783930000053
通过改变加权系数可以生成不同形状的人脸,人脸重建的过程实际上就是利用第一blendshape基底组对人脸形状进行拟合的过程。基于第一blendshape基底组,不同人脸形状可以对应不同的第一混合系数向量,也就是说,一个人脸形状可以采用第一混合系数向量进行表示。
本公开实施例中采用的第一blendshape基底组可以采用但不限于BFM(BaselFace Model)、FWH(Facewarehouse)。
学术界使用的blendshape基底大多是通过批量采集人脸扫描数据,利用PCA来实现blendshape提取。这样构造的基底有较强的表现力,脸型和五官虽然在不同基底之间有细微的变化,但很难对应具体的语义信息。例如图2中所示的脸型基底很难具体用诸如“长脸”、“圆脸”、“杏眼”、“凤眼”等语义来形容,这就不利于用户对生成的人脸形状进行调整。
目前人脸重建的具体算法已经较为成熟,有基于人脸关键点的重建算法,也有基于深度学习的人脸重建算法。因此具体算法在此不做详述。
下面结合实施例对上述步骤103即“依据预先得到的第一blendshape基底组与第二blendshape基底组之间的系数映射矩阵,将第一混合系数向量映射至第二blendshape基底组,得到基于第二blendshape基底组的第二混合系数向量”进行详细描述。
在本步骤中涉及到“第二blendshape基底组”,为了方便用户进行人脸编辑,可以预先设计基于语义的blendshape基底组作为第二blendshape基底组。该第二blendshape基底组中可以包括一种以上语义类型的混合形状基底。例如图3中所示,第二blendshape基底组中除了包含平均人脸基底之外,还可以包含眼型基底、嘴型基底、鼻型基底。每一种语义类型可以包含多个基底,在图3中仅以每一种语义类型包含2个基底为例。实际应用中,通常语义会有更细致的划分。比如脸型包括宽脸、窄脸、长脸、短脸;眼睛位置包括高、低、前、后、宽、窄;眼角类型包括内眼角向上、外眼角向下等;嘴巴类型包括大嘴、小嘴、高嘴、低嘴等;鼻子类型有宽鼻子、窄鼻子、大鼻子、小鼻子等;眉毛类型有粗眉毛、细眉毛、宽眉毛、窄眉毛等。
在本公开中可以预先将第一blendshape基底组与第二blendshape基底组进行系数映射得到系数映射矩阵。系数映射可以采用最小二乘的映射策略,例如系数映射矩阵M可以表示为:
Figure BDA0003196783930000063
其中,Ma为第一blendshape基底组对应的第一混合形状矩阵,Mb为第二blendshape基底组对应的混合形状矩阵。混合形状矩阵由blendshape基底组中各基底分别与平均人脸基底的差构成。
Figure BDA0003196783930000061
其中m为第一blendshape基底组的基底数量。
Figure BDA0003196783930000062
其中n为第二blendshape基底组的基底数量。第一blendshape基底组和第二blendshape基底组共享同一个平均人脸基底。
也就是说,系数映射矩阵的获取方式包括:获取预设的第一blendshape基底组和第二blendshape基底组;获取第一blendshape基底组相比较平均脸基底的第一混合形状矩阵,以及第二blendshape基底组相比较平均脸基底的第二混合形状矩阵;利用第一混合形状矩阵和第二混合形状矩阵,得到第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵,例如公式(4)所示的方式。
在执行步骤103时,第二混合系数向量可以由系数映射矩阵与第一混合系数向量的积确定。例如,第二混合系数向量α2可以为:
α2=M*α1 (5)
其中,M为系数映射矩阵,α1为第一混合系数向量。
下面结合实施例对上述步骤104即“获取输入的人脸调整信息,该人脸调整信息包括第二blendshape基底信息”进行详细描述。
作为其中一种实现方式,用户可以通过输入指令来输入人脸调整信息,例如输入代码、语句等方式设置第二blendshape基底信息。
作为另一种优选的实现方式,可以向用户提供交互界面,通过该交互界面向用户展示可选择的第二混合形状基底信息;获取用户通过交互界面输入的人脸调整信息,人脸调整信息包括用户选择的第二混合形状基底信息。
上述的第二blendshape基底信息包括用户具体要调整的语义信息。例如用户要调整脸型,则第二blendshape基底信息包括用户设置或选择的具体脸型对应的基底信息。再例如用户要调整鼻型,则第二blendshape基底信息包括用户设置或选择的具体鼻型对应的基底信息。可以是具体的基底标识、名称等信息。
下面结合实施例对上述步骤105即“基于第二blendshape基底信息和第二混合系数向量,得到目标人脸图像”进行详细描述。
作为其中一种优选的实施方式,可以具体包括以下步骤:
步骤1051、确定第二blendshape基底信息的语义类型。
上面实施例中已经提到,设计的第二blendshape基底组通常包含多种语义类型,例如嘴型、鼻型、脸型等。因此对于用户输入的第二blendshape基底信息需要确定其对应的语义类型。
但若第二blendshape基底组仅包含一种语义类型,则可以不执行本步骤。
步骤1052、将第二混合系数向量中第二blendshape基底信息对应位置的系数更新为生效值,将确定出的语义类型在第二混合系数向量中对应的其他位置的系数更新为未生效值。
由于在步骤103中已经得到了待处理人脸图像基于第二blendshape基底组的第二混合系数向量,用户输入的第二blendshape基底信息是用户要调整的语义信息,其包含了用户针对具体语义希望设置的形状。因此,将将第二混合系数向量中第二blendshape基底信息对应位置的系数更新为生效值,例如设置为1。而第二混合系数向量中该语义信息对应的其他形状是用户不采用的形状,因此将确定出的语义类型在第二混合系数向量中对应的其他位置的系数更新为未生效值,例如设置为0。
举个例子,假设第二混合系数向量为[α1 22 23 24 25 26 2],其中,α1 2和α2 2是眼型基底包含的两种眼型对应的加权系数,α3 2和α4 2是嘴型基底包含的两种嘴型对应的加权系数,α5 2和α6 2是鼻型基底包含的两种鼻型对应的加权系数。若用户要调整鼻型,选择了其中一种鼻型,该鼻型对应的是α5 2的位置,则将α5 2设置为1,α6 2设置为0。其他语义对应的系数不变。
步骤1053、利用更新后的第二混合系数向量得到目标人脸图像。
本步骤中,可以在平均人脸基底的基础上,采用更新后的第二混合系数向量对第二blendshape基底组中的各基底进行加权处理,得到目标人脸图像。即通过本步骤就能够得到目标人脸图像中的人脸形状。
目标人脸形状S'可以为:
Figure BDA0003196783930000081
作为一个典型的应用场景,目标人脸图像可以是虚拟形象。那么通过上述实施例就能够在步骤102之后依据待处理人脸图像得到初始的虚拟形象。然后通过步骤103~105方便用户针对具体语义实现对虚拟形状中的人脸编辑。例如调整具体的脸型、嘴型、眼型、鼻型等等。
作为一种典型的系统框架,用户设备采集到待处理人脸图像后,将待处理人脸图像发送至服务器端,由服务器端执行上述方法实施例中的各流程。在上述流程期间,服务器端可以将交互界面发送给用户设备。由用户设备提供给用户,供用户通过交互界面输入人脸调整信息,并将人脸调整信息发送至服务器端。服务器端最终生成的目标人脸图像可以返回至用户设备进行显示。
上述用户设备可以是智能移动设备、智能家居设备、可穿戴式设备、PC(个人计算机)等。其中智能移动设备可以包括诸如手机、平板电脑、笔记本电脑、PDA(个人数字助理)、互联网汽车等。智能家居设备可以包括智能家电设备,诸如智能电视、智能冰箱、智能摄像头等。可穿戴式设备可以包括诸如智能手表、智能眼镜、虚拟现实设备、增强现实设备、混合现实设备(即可以支持虚拟现实和增强现实的设备)等等。
本公开上述实施例实际上公开了基于双套blendshape基底组的人脸表达系统框架,充分利用了不同blendshape基底组的表达特点。例如若第一blendshape基底组具有较强表现力、对人脸进行精细刻画的特点,第二blendshape基底组具有语义化表达的特点,则本公开提供的图像处理方式能够在保证人脸重建精度的同时,扩展人脸编辑的语义灵活度。
以上是对本公开所提供方法进行的详细描述,下面结合实施例对本公开实施例提供的装置进行详细描述。
图4为本公开实施例提供的图像处理装置的结构图,如图4中所示,该装置可以包括:图像获取单元401、人脸重建单元402、系数映射单元403、调整获取单元404和编辑处理单元405,还可以进一步包括映射矩阵确定单元406。其中各组成单元的主要功能如下:
图像获取单元401,用于获取待处理人脸图像。
作为其中一种实施方式,对待处理人脸图像的获取可以是通过图像采集装置实时获取,例如用户通过诸如数码相机、智能终端的摄像头、网络摄像头等等图像采集装置实时对人脸进行拍摄,得到待处理人脸图像。
作为另一种实时方式,可以从用户终端本地获取存储的包含人脸的图像作为待处理人脸图像。例如,用户从计算机终端、智能手机、平板电脑等设备本地获取存储的待处理人脸图像。
待处理人脸图像可以是原始采集的人脸图像,也可以是进行了相关预处理之后的人脸图像。预处理可以包括诸如缩放、格式转换、图像增强、降噪滤波、图像校正等。
人脸重建单元402,用于基于待处理人脸图像进行人脸重建,得到基于第一blendshape基底组的第一混合系数向量。
其中第一混合系数向量由人脸重建得到的第一blendshape基底组中各基底的加权系数构成。
目前人脸重建的具体算法已经较为成熟,有基于人脸关键点的重建算法,也有基于深度学习的人脸重建算法。因此具体算法在此不做详述。
系数映射单元403,用于依据预先得到的第一blendshape基底组与第二blendshape基底组之间的系数映射矩阵,将第一混合系数向量映射至第二blendshape基底组,得到基于第二blendshape基底组的第二混合系数向量。
第二混合系数向量可以采用上述公式(5)的方式来确定。
调整获取单元404,用于获取输入的人脸调整信息,人脸调整信息包括第二混合形状基底信息。
编辑处理单元405,用于基于第二混合形状基底信息和第二混合系数向量,得到目标人脸图像。
作为其中一种实现方式,第二blendshape基底组为基于语义的blendshape基底组,包括一种以上语义类型的混合形状基底。其中语义类型可以包括诸如脸型、眼型、鼻型、嘴型、眉型等等。
更进一步地,该装置还可以包括映射矩阵确定单元406,用于采用如下方式预先得到系数映射矩阵:
获取预设的第一blendshape基底组和第二blendshape基底组;
获取第一blendshape基底组相比较平均脸基底的第一混合形状矩阵,以及第二blendshape基底组相比较平均脸基底的第二混合形状矩阵;
利用第一混合形状矩阵和第二混合形状矩阵,得到第一blendshape基底组与第二blendshape基底组之间的系数映射矩阵。
例如,可以采用方法实施例中公式(4)中所示的方式来得到系数映射矩阵。
作为一种优选的实施方式,调整获取单元404,具体用于通过交互界面向用户展示可选择的第二混合形状基底信息;获取用户通过交互界面输入的人脸调整信息,人脸调整信息包括用户选择的第二混合形状基底信息。
除此之外,用户也可以通过输入指令来输入人脸调整信息,例如输入代码、语句等方式设置第二blendshape基底信息。
作为其中一种实现方式,编辑处理单元405,具体用于:
确定第二混合形状基底信息的语义类型;
将第二混合系数向量中第二混合形状基底信息对应位置的系数更新为生效值,将确定出的语义类型在第二混合系数向量中对应的其他位置的系数更新为未生效值。其中生效值可以是诸如1,未生效值可以是诸如0。
利用更新后的第二混合系数向量得到目标人脸图像。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
如图5所示,是根据本公开实施例的图像处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如图像处理方法。例如,在一些实施例中,图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。
在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像处理方法。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控30制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPs,Ⅵirtual Private Server)服务中存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (13)

1.一种图像处理方法,包括:
获取待处理人脸图像;
基于所述待处理人脸图像进行人脸重建,得到基于第一混合形状基底组的第一混合系数向量;其中,所述第一混合系数向量由所有基底对应的加权系数组成,通过改变所述加权系数生成不同形状的人脸,利用第一混合形状基底组对人脸形状进行拟合实现人脸重建,所述第一混合形状基底组包括人脸的不同混合型状基底,每个基底包括人脸上多个三维关键点的坐标;
依据预先得到的第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵,将所述第一混合系数向量映射至第二混合形状基底组,得到基于第二混合形状基底组的第二混合系数向量;
获取输入的人脸调整信息,所述人脸调整信息包括第二混合形状基底信息,所述第二混合形状基底信息包括需要调整的语义信息;
基于所述第二混合形状基底信息和所述第二混合系数向量,得到目标人脸图像;其中,
所述人脸重建得到的人脸形状表示为:
Figure FDA0003884767550000011
其中,
Figure FDA0003884767550000012
指的是平均人脸基底的向量,所述第一混合形状基底组包含m个混合形状基底,对应基底的向量表示为si 1,αi 1为m个基底对应的加权系数,所有基底对应的加权系数构成所述第一混合系数向量α1
其中,所述系数映射矩阵M表示为:
Figure FDA0003884767550000013
其中,Ma为所述第一混合形状基底组对应的混合形状矩阵,Mb为所述第二混合形状基底组对应的混合形状矩阵,混合形状矩阵由混合形状基底组中各基底分别与平均人脸基底的差构成;
Figure FDA0003884767550000014
其中m为所述第一混合形状基底组的基底数量,
Figure FDA0003884767550000015
其中n为所述第二混合形状基底组的基底数量,上标1和2分别代表所述第一混合形状基底组和所述第二混合形状基底组,所述第一混合形状基底组和所述第二混合形状基底组共享同一个平均人脸基底;
其中,所述第二混合系数向量α2为:
α2=M*α1
M为所述系数映射矩阵,α1为所述第一混合系数向量。
2.根据权利要求1所述的方法,其中,所述第二混合形状基底组为基于语义的混合形状基底组,包括一种以上语义类型的混合形状基底。
3.根据权利要求2所述的方法,其中,所述系数映射矩阵采用如下方式预先得到:
获取预设的第一混合形状基底组和第二混合形状基底组;
获取第一混合形状基底组相比较平均脸基底的第一混合形状矩阵,以及第二混合形状基底组相比较所述平均脸基底的第二混合形状矩阵;
利用所述第一混合形状矩阵和所述第二混合形状矩阵,得到第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵。
4.根据权利要求1所述的方法,其中,获取输入的人脸调整信息包括:
通过交互界面向用户展示可选择的第二混合形状基底信息;
获取用户通过所述交互界面输入的人脸调整信息,所述人脸调整信息包括用户选择的第二混合形状基底信息。
5.根据权利要求2所述的方法,其中,基于所述第二混合形状基底信息和所述第二混合系数向量,得到目标人脸图像包括:
确定所述第二混合形状基底信息的语义类型;
将所述第二混合系数向量中所述第二混合形状基底信息对应位置的系数更新为生效值,将确定出的所述语义类型在所述第二混合系数向量中对应的其他位置的系数更新为未生效值;
利用更新后的第二混合系数向量得到目标人脸图像。
6.一种图像处理装置,包括:
图像获取单元,用于获取待处理人脸图像;
人脸重建单元,用于基于所述待处理人脸图像进行人脸重建,得到基于第一混合形状基底组的第一混合系数向量;其中,所述第一混合系数向量由所有基底对应的加权系数组成,通过改变所述加权系数生成不同形状的人脸,利用第一混合形状基底组对人脸形状进行拟合实现人脸重建,所述第一混合形状基底组包括人脸的不同混合型状基底,每个基底包括人脸上多个三维关键点的坐标;
系数映射单元,用于依据预先得到的第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵,将所述第一混合系数向量映射至第二混合形状基底组,得到基于第二混合形状基底组的第二混合系数向量;
调整获取单元,用于获取输入的人脸调整信息,所述人脸调整信息包括第二混合形状基底信息,所述第二混合形状基底信息包括需要调整的语义信息;
编辑处理单元,用于基于所述第二混合形状基底信息和所述第二混合系数向量,得到目标人脸图像;其中,
所述人脸重建得到的人脸形状表示为:
Figure FDA0003884767550000031
其中,
Figure FDA0003884767550000032
指的是平均人脸基底的向量,所述第一混合形状基底组包含m个混合形状基底,对应基底的向量表示为si 1,αi 1为m个基底对应的加权系数,所有基底对应的加权系数构成所述第一混合系数向量α1
其中,所述系数映射矩阵M表示为:
Figure FDA0003884767550000033
其中,Ma为所述第一混合形状基底组对应的混合形状矩阵,Mb为所述第二混合形状基底组对应的混合形状矩阵,混合形状矩阵由混合形状基底组中各基底分别与平均人脸基底的差构成;
Figure FDA0003884767550000034
其中m为所述第一混合形状基底组的基底数量,
Figure FDA0003884767550000035
其中n为所述第二混合形状基底组的基底数量,上标1和2分别代表所述第一混合形状基底组和所述第二混合形状基底组,所述第一混合形状基底组和所述第二混合形状基底组共享同一个平均人脸基底;
其中,所述第二混合系数向量α2为:
α2=M*α1
M为所述系数映射矩阵,α1为所述第一混合系数向量。
7.根据权利要求6所述的装置,其中,所述第二混合形状基底组为基于语义的混合形状基底组,包括一种以上语义类型的混合形状基底。
8.根据权利要求7所述的装置,还包括映射矩阵确定单元,用于采用如下方式预先得到所述系数映射矩阵:
获取预设的第一混合形状基底组和第二混合形状基底组;
获取第一混合形状基底组相比较平均脸基底的第一混合形状矩阵,以及第二混合形状基底组相比较所述平均脸基底的第二混合形状矩阵;
利用所述第一混合形状矩阵和所述第二混合形状矩阵,得到第一混合形状基底组与第二混合形状基底组之间的系数映射矩阵。
9.根据权利要求6所述的装置,其中,所述调整获取单元,具体用于通过交互界面向用户展示可选择的第二混合形状基底信息;获取用户通过所述交互界面输入的人脸调整信息,所述人脸调整信息包括用户选择的第二混合形状基底信息。
10.根据权利要求7所述的装置,其中,所述编辑处理单元,具体用于:
确定所述第二混合形状基底信息的语义类型;
将所述第二混合系数向量中所述第二混合形状基底信息对应位置的系数更新为生效值,将确定出的所述语义类型在所述第二混合系数向量中对应的其他位置的系数更新为未生效值;
利用更新后的第二混合系数向量得到目标人脸图像。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。
CN202110892854.5A 2021-08-04 2021-08-04 图像处理方法、装置、设备和计算机存储介质 Active CN113808249B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110892854.5A CN113808249B (zh) 2021-08-04 2021-08-04 图像处理方法、装置、设备和计算机存储介质
US17/875,519 US20230043766A1 (en) 2021-08-04 2022-07-28 Image processing method, electronic device and computer storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110892854.5A CN113808249B (zh) 2021-08-04 2021-08-04 图像处理方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN113808249A CN113808249A (zh) 2021-12-17
CN113808249B true CN113808249B (zh) 2022-11-25

Family

ID=78893240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110892854.5A Active CN113808249B (zh) 2021-08-04 2021-08-04 图像处理方法、装置、设备和计算机存储介质

Country Status (2)

Country Link
US (1) US20230043766A1 (zh)
CN (1) CN113808249B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230046286A1 (en) * 2021-08-13 2023-02-16 Lemon Inc. Asymmetric facial expression recognition
CN116405607B (zh) * 2023-06-06 2023-08-29 深圳市捷鑫华科技有限公司 3d打印机用的音频与图像智能交互方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217454B (zh) * 2014-08-21 2017-11-03 中国科学院计算技术研究所 一种视频驱动的人脸动画生成方法
EP3475920A4 (en) * 2016-06-23 2020-01-15 Loomai, Inc. SYSTEMS AND METHODS FOR GENERATING HUMAN HEAD COMPUTER-BASED ANIMATION MODELS FROM CAPTURED DATA IMAGES
US10282897B2 (en) * 2017-02-22 2019-05-07 Microsoft Technology Licensing, Llc Automatic generation of three-dimensional entities
CN108985220B (zh) * 2018-07-11 2022-11-04 腾讯科技(深圳)有限公司 一种人脸图像处理方法、装置及存储介质
CN110555796B (zh) * 2019-07-24 2021-07-06 广州视源电子科技股份有限公司 图像调整方法、装置、存储介质以及设备
CN113129425A (zh) * 2019-12-31 2021-07-16 Tcl集团股份有限公司 一种人脸图像三维重建方法、存储介质及终端设备
CN111710035B (zh) * 2020-07-16 2023-11-07 腾讯科技(深圳)有限公司 人脸重建方法、装置、计算机设备及存储介质
CN112419454B (zh) * 2020-11-25 2023-11-28 北京市商汤科技开发有限公司 一种人脸重建方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
US20230043766A1 (en) 2023-02-09
CN113808249A (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
US20240119653A1 (en) Avatar animation system
CN113643412B (zh) 虚拟形象的生成方法、装置、电子设备及存储介质
CN113327278B (zh) 三维人脸重建方法、装置、设备以及存储介质
CN110766777A (zh) 虚拟形象的生成方法、装置、电子设备及存储介质
CN115345980B (zh) 个性化纹理贴图的生成方法及装置
CN113808249B (zh) 图像处理方法、装置、设备和计算机存储介质
CN105096353B (zh) 一种图像处理方法及装置
CN114820905B (zh) 虚拟形象生成方法、装置、电子设备及可读存储介质
CN115049799B (zh) 3d模型和虚拟形象的生成方法和装置
CN109961496B (zh) 表情驱动方法及表情驱动装置
CN113362263A (zh) 变换虚拟偶像的形象的方法、设备、介质及程序产品
EP3855386B1 (en) Method, apparatus, device and storage medium for transforming hairstyle and computer program product
CN114723888B (zh) 三维发丝模型生成方法、装置、设备、存储介质及产品
CN115147265A (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN116342782A (zh) 生成虚拟形象渲染模型的方法和装置
CN114049290A (zh) 图像处理方法、装置、设备及存储介质
CN115359171B (zh) 虚拟形象处理方法、装置、电子设备和存储介质
CN113313631B (zh) 图像渲染方法和装置
CN114648601A (zh) 虚拟形象的生成方法、电子设备、程序产品及用户终端
CN113240780B (zh) 生成动画的方法和装置
CN115393488A (zh) 虚拟人物表情的驱动方法、装置、电子设备和存储介质
CN116188640B (zh) 三维虚拟形象的生成方法、装置、设备和介质
CN112764649B (zh) 虚拟形象的生成方法、装置、设备及存储介质
CN116030150B (zh) 虚拟形象生成方法、装置、电子设备和介质
CN116012666B (zh) 图像生成、模型的训练、信息重建方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant