CN113763517B - 人脸表情编辑方法及电子设备 - Google Patents
人脸表情编辑方法及电子设备 Download PDFInfo
- Publication number
- CN113763517B CN113763517B CN202010510988.1A CN202010510988A CN113763517B CN 113763517 B CN113763517 B CN 113763517B CN 202010510988 A CN202010510988 A CN 202010510988A CN 113763517 B CN113763517 B CN 113763517B
- Authority
- CN
- China
- Prior art keywords
- image
- user
- edited
- facial
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008921 facial expression Effects 0.000 title claims abstract description 168
- 238000000034 method Methods 0.000 title claims abstract description 103
- 230000001815 facial effect Effects 0.000 claims abstract description 237
- 230000000694 effects Effects 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 30
- 239000013598 vector Substances 0.000 claims description 107
- 210000001508 eye Anatomy 0.000 claims description 65
- 210000000214 mouth Anatomy 0.000 claims description 62
- 230000008569 process Effects 0.000 claims description 53
- 210000003128 head Anatomy 0.000 claims description 28
- 238000009877 rendering Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000003709 image segmentation Methods 0.000 claims description 8
- 238000013519 translation Methods 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 abstract description 26
- 230000003068 static effect Effects 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 27
- 239000010410 layer Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 238000007726 management method Methods 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 210000000697 sensory organ Anatomy 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 210000004709 eyebrow Anatomy 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000001331 nose Anatomy 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000000859 sublimation Methods 0.000 description 2
- 230000008022 sublimation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
- G06V40/176—Dynamic expression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/24—Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2021—Shape modification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Architecture (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
本申请涉及图像处理领域,具体涉及一种脸部表情编辑方法及电子设备,方法包括:获取待编辑图像,该待编辑图像中包括用户的第一脸部图像;通过摄像头获取包括用户的第二脸部图像的第一视频流;根据第一视频流中用户的第一脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到编辑后的图像,其中,编辑后的图像中用户的脸部表情与第一视频流中用户的脸部表情相关。根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,实现了表情的再编辑功能,并且效果更加地真实,提高了用户体验。
Description
技术领域
本申请涉及图像处理领域,尤其涉及一种人脸表情编辑方法及电子设备。
背景技术
随着计算机视觉技术的发展,人脸识别作为一项成熟算法被广泛应用于人证对比、手机解锁、智能隐私、门禁刷卡、远程用户认证等多种安全相关的应用。然而以上多种应用形式仅以安全为出发点。除去安全角度,人脸识别可以为更多的人脸相关应用提供效果优化的技术基础以及预防伦理道德问题的技术保障,提升用户体验的同时规范用户使用新兴的人脸技术。
随着智能手机拍照功能的逐步强大,手机端的美颜功能被广泛使用,各类插件应用层出不穷,然而这些应用大多采用基于2D人脸特征的面部美化方法,从色彩、面部二维轮廓的角度调整编辑效果。近年随着可捕捉深度信息的相机被应用到手机上,基于3D人脸的面部美化方法被提出,该方法可三维立体的修改面部的形状,细化不同面部区域的颜色美化修改方案,也效果更真实的修改面部立体结构。然而目前基于3D人脸的面部美化一方面重度依赖可捕捉深度信息的相机,另一方面其编辑的效果局限于颜色和形状的美化,并未针对已拍好的图像进行表情的再编辑。
发明内容
本申请实施例提供了一种人脸表情编辑方法及电子设备,根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,实现了表情的再编辑功能,并且效果更加地真实,提高了用户体验。
第一方面,本申请实施例提供一种人脸表情编辑方法,包括:
获取待编辑图像,待编辑图像包括用户的第一脸部图像;并通过摄像头获取包括用户的第二脸部图像的第一视频流;根据第一视频流中的用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像;初步编辑的图像包括用户的第三脸部图像;根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,特征图像为包括所述用户的眼睛和口腔的图像;将特征图像与初步编辑的图像中用户的第三脸部图像进行融合,以得到编辑后的图像;其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。
可选地,本申请中的脸部图像可以是指包含完整五官的图像,或者是可以让电子设备识别出完整五官的图像,比如正脸图像,包含部分五官的图像(比如说侧脸图像),或者相对于正脸图像旋转一定角度的图像。
可选地,特征图像可以包括用户的眼睛和口腔的图像,还可以包括除了用户的眼睛和口腔的图像之外的其他部位的图像,比如耳朵,鼻子、眉毛等。
在美颜的同时,可以根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,实现了表情的再编辑功能,并且效果更加地真实,是当前业内2D/3D美颜只改变皮肤颜色人脸轮廓的升华,同时提高了用户体验。
结合第一方面,第一脸部表情与第二脸部表情相关联,具体包括:
第一脸部表情为所述第二脸部表情,或者;第一向量与第二向量的均方误差小于第一阈值,其中,第一向量为用于表征第一脸部表情的向量,第二向量为用于表征第二脸部表情的向量。
可选地,上述第一阈值可以为0.1,0.2,0.5,0.7或者其他值,优选地,第一阈值为0.5。
结合第一方面及上述任一种可能的实现方式,根据第一视频流中的用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像,具体包括:
根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数,第一目标参数为用于描述用户的脸部形状的向量;根据第一目标参数和待编辑图像确定第二目标参数、第三目标参数和第四目标参数,其中,第二目标参数用于表征用户脸部的大小尺度,第三目标参数用于表征用户的三维人脸头部姿态的旋转矩阵或欧拉角,第四目标参数用于表征在笛卡尔坐标系下用户的三维头部映射到图像坐标系时需要的平移量;根据第一目标参数和第一视频流中的用户的第二脸部图像确定第五目标参数,第五目标参数为用于描述所述第一视频流中用户脸部表情的向量;根据第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数构建目标人脸模型;对目标人脸模型进行渲染重建,以得到初步编辑的图像。
结合第一方面及上述任一种可能的实现方式,第一视频流包括N张图像,N为大于1的整数,N张图像中的每张图像均包括用户的第二脸部图像,根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数,包括:
对N张图像中每张图像中用户的第二脸部图像进行建模,以得到每张图像的第一参数,每张图像的第一参数用于描述每张图像中用户的脸部形状的向量;对待编辑图像中用户的第一脸部图像进行建模,以得到待编辑图像的第二参数,第二参数为用于描述待编辑图像中用户的脸部形状的向量;根据N张图像中每张图像的第一参数和待编辑图像的第二参数确定第一目标参数。
通过待编辑图像和第一视频流中的人脸图像构建精准的人脸模型,再以精准的人脸模型为基准进行照片再编辑,不会增加现实中不存在的内容到照片中,达到真实还原用户人脸的效果,并且所编辑的图像质量高,不会存在生成对抗网络成品率低的问题。
结合第一方面及上述任一种可能的实现方式,根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,包括:
分别对待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,第一图像为待编辑图像中包括用户的眼睛和口腔的图像,第二图像为初步编辑的图像中包括用户的眼睛和口腔的图像,第三图像为第一视频流中包括用户的眼睛和口腔的图像;对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到用户的眼睛和口腔图像的特征向量;根据用户的眼睛和口腔图像的特征向量生成特征图像。
结合第一方面及上述任一种可能的实现方式,通过摄像头获取包括用户的第二脸部图像的第一视频流之前,本申请的方法还包括:
通过摄像头获取包括用户的第四脸部图像的第二视频流;对第二视频流中用户的第四脸部图像进行脸部特征提取,以得到第一脸部特征;对待编辑图像中用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征;当第一脸部特征与第二脸部特征相匹配时,通过摄像头获取包括用户的第二脸部图像的第一视频流。
通过判断待编辑的人脸图像包括用户的脸部图像来实现只允许用户编辑自己本人的脸部图像,避免衍生伦理问题及社会争论。
结合第一方面及上述任一种可能的实现方式,本申请的方法还包括:
在开启摄像头获取第一视频流时,判断是否录制用户的脸部表情编辑过程的视频;若判断录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存用户的脸部表情编辑过程的视频中多帧图像或者全部图像,该多帧图像或者全部图像包括编辑后的图像;若判断不录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存编辑后的图像。
其中,用户的脸部表情编辑过程的视频中多帧图像可以是连续帧图像或者非连续帧图像。
通过保存用户的脸部表情编辑过程的视频,用户在查看该视频时,既可以看到对照片中脸部表情的美化效果,同时也可以看到照片中其余人均静止,唯有用户本人脸部表情在变化的独特效果。
结合第一方面及上述任一种可能的实现方式,方法还包括:
实时显示待编辑图像、第一视频流和对待编辑图像进行实时编辑的效果图像。
通过实时显示待编辑图像、第一视频流和对待编辑图像进行实时编辑的效果图像,用户可以根据查看编辑效果,同时可通过查看第一视频流确定当前拍摄的用户脸部图像是否合格,在不合格时用户可以及时调整头部姿态和拍摄角度。
第二方面,本申请实施例提供一种电子设备,包括:
获取单元,用于获取待编辑图像,待编辑图像包括用户的第一脸部图像;并通过摄像头获取包括用户的第二脸部图像的第一视频流;
编辑单元,用于根据第一视频流中的用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像;初步编辑的图像包括用户的第三脸部图像;
特征获取单元,还用于根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,特征图像为包括所述用户的眼睛和口腔的图像;
融合单元,用于将特征图像与初步编辑的图像中用户的第三脸部图像进行融合,以得到编辑后的图像;其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。
实现了在美颜的同时,可以根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,并且效果更加地真实,是当前业内2D/3D美颜只改变皮肤颜色人脸轮廓的升华,同时提高了用户体验。
结合第二方面,第一脸部表情与第二脸部表情相关联,具体包括:
第一脸部表情为所述第二脸部表情,或者;第一向量与第二向量的均方误差小于第一阈值,其中,第一向量为用于表征第一脸部表情的向量,第二向量为用于表征第二脸部表情的向量。
可选地,上述第一阈值可以为0.1,0.2,0.5,0.7或者其他值,优选地,第一阈值为0.5。
结合第二方面及上述任一种可能的实现方式,编辑单元具体用于:
根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数,第一目标参数为用于描述用户的脸部形状的向量;根据第一目标参数和待编辑图像确定第二目标参数、第三目标参数和第四目标参数,其中,第二目标参数用于表征用户脸部的大小尺度,第三目标参数用于表征用户的三维人脸头部姿态的旋转矩阵或欧拉角,第四目标参数用于表征在笛卡尔坐标系下用户的三维头部映射到图像坐标系时需要的平移量;根据第一目标参数和第一视频流中的用户的第二脸部图像确定第五目标参数,第五目标参数为用于描述所述第一视频流中用户脸部表情的向量;根据第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数构建目标人脸模型;对目标人脸模型进行渲染重建,以得到初步编辑的图像。
结合第二方面及上述任一种可能的实现方式,第一视频流包括N张图像,N为大于1的整数,N张图像中的每张图像均包括用户的第二脸部图像,在根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数的方面,编辑单元具体用于:
对N张图像中每张图像中用户的第二脸部图像进行建模,以得到每张图像的第一参数,每张图像的第一参数用于描述每张图像中用户的脸部形状的向量;对待编辑图像中用户的第一脸部图像进行建模,以得到待编辑图像的第二参数,第二参数为用于描述待编辑图像中用户的脸部形状的向量;根据N张图像中每张图像的第一参数和待编辑图像的第二参数确定第一目标参数。
通过待编辑图像和第一视频流中的人脸图像构建精准的人脸模型,再以精准的人脸模型为基准进行照片再编辑,不会增加现实中不存在的内容到照片中,达到真实还原用户人脸的效果,并且所编辑的图像质量高,不会存在生成对抗网络成品率低的问题。
结合第二方面及上述任一种可能的实现方式,特征获取单元具体用于:
分别对待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,第一图像为待编辑图像中包括用户的眼睛和口腔的图像,第二图像为初步编辑的图像中包括用户的眼睛和口腔的图像,第三图像为第一视频流中包括用户的眼睛和口腔的图像;对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到用户的眼睛和口腔图像的特征向量;根据用户的眼睛和口腔图像的特征向量生成特征图像。
结合第二方面及上述任一种可能的实现方式,通过摄像头获取包括用户的第二脸部图像的第一视频流之前,获取单元,还用于通过摄像头获取包括用户的第四脸部图像的第二视频流;
电子设备还包括:
特征提取单元,用于对第二视频流中用户的第二脸部图像进行脸部特征提取,以得到第一脸部特征;对待编辑图像中用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征;
确定单元,用于当第一脸部特征与第二脸部特征相匹配时,则通过摄像头获取包括用户的第二脸部图像的第一视频流。
通过判断待编辑的人脸图像包括用户的脸部图像来实现只允许用户编辑自己本人的脸部图像,避免衍生伦理问题及社会争论。结合第二方面及上述任一种可能的实现方式,电子设备还包括:
判断单元,用于在开启摄像头获取第一视频流时,判断是否录制用户的脸部表情编辑过程的视频;
存储单元,用于若判断单元判断录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存用户的脸部表情编辑过程的视频中多帧图像或者全部图像,该多帧图像或者全部图像包括编辑后的图像;若判断单元判断不录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存编辑后的图像。
通过保存用户的脸部表情编辑过程的视频,用户在查看该视频时,既可以看到对照片中脸部表情的美化效果,同时也可以看到照片中其余人均静止,唯有用户本人脸部表情在变化的独特效果。
结合第二方面及上述任一种可能的实现方式,电子设备还包括:
显示单元,用于实时显示待编辑图像、第一视频流和对待编辑图像进行实时编辑的效果图像。
通过实时显示待编辑图像、第一视频流和对待编辑图像进行实时编辑的效果图像,用户可以根据查看编辑效果,同时可通过查看第一视频流确定当前拍摄的用户脸部图像是否合格,在不合格时用户可以及时调整头部姿态和拍摄角度。
第三方面,本申请实施例提供一种电子设备,包括触控屏,存储器,一个或多个处理器;其中,一个或多个程序被存储在所述存储器中;其特征在于,所述一个或多个处理器在执行所述一个或多个程序时,使得所述电子设备实现如第一方面所述方法的部分或全部。
第四方面,本申请实施例提供一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如第一方面所述方法的部分或全部。
第五方面,本申请实施例提供一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如如第一方面所述方法的部分或全部。
在本申请实施例的方案中,通过人脸识别实现用户只能对自己的脸部表情进行再编辑,避免了衍生伦理问题和社会争论;通过根据摄像头获取的第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行再编辑,实现通过待编辑图像和第一视频流中的人脸图像构建精准的人脸模型,再以精准的人脸模型为基准进行照片再编辑,不会增加现实中不存在的内容到照片中,达到真实还原用户人脸的效果;在辅助对用户脸部图像进行美颜的同时,可以根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,实现了表情的再编辑功能,并且效果更加地真实,是当前业内2D/3D美颜只改变皮肤颜色人脸轮廓的升华,同时提高了用户体验。
应理解,上述任意一种可能的实现方式,在不违背自然规律的前提下,可以自由组合,本申请中不予以赘述。
应当理解的是,本申请中对技术特征、技术方案、有益效果或类似语言的描述并不是暗示在任意的单个实施例中可以实现所有的特点和优点。相反,可以理解的是对于特征或有益效果的描述意味着在至少一个实施例中包括特定的技术特征、技术方案或有益效果。因此,本说明书中对于技术特征、技术方案或有益效果的描述并不一定是指相同的实施例。进而,还可以任何适当的方式组合本实施例中所描述的技术特征、技术方案和有益效果。本领域技术人员将会理解,无需特定实施例的一个或多个特定的技术特征、技术方案或有益效果即可实现实施例。在其他实施例中,还可在没有体现所有实施例的特定实施例中识别出额外的技术特征和有益效果。
附图说明
图1a为本申请实施例提供的应用场景示意图;
图1b为本申请实施例提供的第一电子设备的结构示意图;
图2为本申请实施例提供的一种电子设备的软件结构示意图;
图3为本申请实施例提供的一种人脸表情编辑方法的流程示意图;
图4为本申请实施例提供的另一种人脸表情编辑方法的流程示意图;
图5为本申请实施例提供的进行人脸识别的流程示意图;
图6为本申请实施例提供的提取用户的眼睛和口腔图像的流程示意图;
图7为对待编辑图像进行人脸建模的效果示意图;
图8为对第一视频流中脸部图像进行人脸建模的效果示意图;
图9为编辑后的图像的效果示意图;
图10为本申请实施例提供的第二电子设备的结构示意图;
图11为本申请实施例提供的第三电子设备的结构示意图;
图12为本申请实施例提供的第四电子设备的结构示意图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清除、详尽地描述。
以下,术语“第一”、“第二”等类似词汇在一些情形下仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
下面对本申请的应用场景进行说明。
参见图1a,图1a为本申请实施例提供的一种应用场景示意图。如图1a所示,在用户需要对存储在电子设备中包含用户脸部图像的图像的进行编辑时,电子设备获取用户选择的待编辑图像,该待编辑图像包括用户的第一脸部图像;通过摄像头获取包含用户的第二脸部图像的视频流,再根据获取的视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到编辑后的图像,编辑后的图像中用户的脸部表情与第二脸部图像中用户的脸部表情相关联。
下面介绍上述电子设备的相关结构,图1b示出了第一电子设备100的结构示意图。
应该理解的是,电子设备100可以具有比图中所示的更多的或者更少的部件,可以组合两个或多个的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
电子设备100可以包括:处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。本申请实施例中,摄像头193包括采集人脸识别所需图像的摄像头,如红外摄像头或其他摄像头。该采集人脸识别所需图像的摄像头一般位于电子设备的正面,例如触控屏的上方,也可以位于其他位置,本申请实施例对此不做限制。在一些实施例中,电子设备100可以包括其他摄像头。电子设备还可以包括点阵发射器(图中未示出),用于发射光线。摄像头采集人脸反射的光线,得到人脸图像,处理器对人脸图像进行处理和分析,通过与存储的人脸图像的信息进行比较以进行验证。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用(比如人脸识别功能,指纹识别功能、移动支付功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如人脸信息模板数据,指纹信息模板等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universalflash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。其中,该指纹传感器180H可以设置在触控屏下方,电子设备100可以接收用户在触控屏上该指纹传感器对应的区域的触摸操作,电子设备100可以响应于该触摸操作,采集用户手指的指纹信息,实现本申请实施例中所涉及的指纹识别通过后打开隐藏相册,指纹识别通过后打开隐藏应用,指纹识别通过后登录账号,指纹识别通过后完成付款等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
在本申请中,触摸传感器180K检测到启动摄像头193的触摸命令后,向处理器110发送启动摄像头193的指令,处理器110启动摄像头193,该摄像头193开始获取包含用户的第二脸部图像的第一视频流;处理器110还获取从电子设备100的内部存贮器121中获取待编辑图像,该待编辑图像中包括该用户的第一脸部图像;处理器根据第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到编辑后的图像,该编辑后的图像中用户的脸部表情与第一视频流中用户的脸部表情相关联,并在显示屏194上显示待编辑图像、显示摄像头193实时获取的第一视频流、和实时显示对待编辑图像进行编辑的实时效果图。
图2是本申请实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序(也可以称为应用)。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话界面形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包括两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包括显示驱动,摄像头驱动,音频驱动,传感器驱动。
在本申请实施例中,参见图2,可选地,系统库中还可以包括图像处理库。在启动相机应用后,相机应用可以获取到电子设备采集到的包括用户的第二脸部图像的第一视频流。图像处理库获取待编辑图像,该待编辑图像包括用户的第一脸部图像,并根据第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到编辑后的图像,该编辑后的图像中用户的脸部表情与第一视频流中用户的脸部表情相关联。通过视图系统实时显示待编辑图像、显示第一视频流、和实时显示对待编辑图像进行编辑的实时效果图,并通过媒体库保存包括编辑过程的视频或者编辑后的图像。具体过程参见以下的相关描述。
在此需要指出的是,本申请的方法的应用场景包括但不限于离线的人脸相关算法训练、以及在线的手机、PC和云端的像素到像素的实时变换应用,比如美图类、绘画类及视频直播聊天类等。
下面介上述绍电子设备100对用户的脸部图像进行编辑的具体实现过程。
参见图3,图3为本申请实施例提供一种人脸表情编辑方法的流程示意图。如图3所示,该方法包括:
S301、获取待编辑图像,该待编辑图像包括用户的第一脸部图像。
可选地,待编辑图像可以是用户从电子设备的相册中选取的包括用户的第一脸部图像的图像,还可以是通过电子设备的摄像头获取的包含用户的第一脸部图像的图像。
可选地,在从电子设备的相册中选取待编辑图像时,电子设备的显示界面显示第一提示标签,该第一提示标签用于提示用户选择待编辑图像。
进一步地,上述第一提示标签还用于提示用户选择包括用户本人脸部图像的图像作为待编辑图像。
可选地,本申请中的脸部图像(包括本申请中的第一脸部图像、第二脸部图像、第三脸部图像和第四脸部图像)可以是指包含完整五官的图像,或者是可以让电子设备识别出完整五官的图像,比如正脸图像,包含部分五官的图像(比如说侧脸图像),或者相对于正脸图像旋转一定角度的图像。
S302、通过摄像头获取包括用户的第二脸部图像的第一视频流。
为了更好的通过摄像头捕捉用户的脸部表情,在通过摄像头获取包括用户的第二脸部图像的第一视频流时,电子设备提示用于调整预览界面中用户人像的状态及相机角度。比如提示改变头部与镜头之间的距离、改变头部与镜头的相对位置等;再比如提示改变用户头部姿态、改变光线角度、强弱等;再比如提示用户将帽子、口罩、眼睛等遮挡物去掉。可选地,可以通过提示标签的文字方式提醒用户,还可以语音的方式提醒。
S303、根据第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像。
其中,初步编辑的图像包括用户的第三脸部图像,该第三脸部图像为根据用户的第二脸部图像对第二脸部图像进行编辑得到的。
在一个示例中,根据第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像,包括:
根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数,第一目标参数为用于描述用户的脸部形状的向量;根据第一目标参数和待编辑图像确定第二目标参数、第三目标参数和第四目标参数,其中,第二目标参数用于表征用户脸部的大小尺度,第三目标参数用于表征用户的三维人脸头部姿态的旋转矩阵或欧拉角,第四目标参数用于表征在笛卡尔坐标系下用户的三维头部映射到图像坐标系时需要的平移量;根据第一目标参数和第一视频流中的用户的第二脸部图像确定第五目标参数,第五目标参数为用于描述所述第一视频流中用户脸部表情的向量;根据第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数构建目标人脸模型;对目标人脸模型进行渲染重建,以得到初步编辑的图像。
在一个可能的实现方式中,人脸模型可以表征为:
其中,V用于表征三维人脸立体模型,用于表征平均三维人脸立体模型,或者可以理解成大众脸的人脸模型;s用于表征人脸的大小尺度,R为用于表征三维人脸头部姿态的旋转矩阵或者欧拉角,T用于表征在笛卡尔坐标系下三维人头映射到图像坐标系内时需要的平移量,Aid为用于描述脸部形状的正交表达基,Aexp为用于描述脸部表情的正交表达基,Alpha_id为用于描述脸部形状的向量,该向量与用户的头部姿态无关,同一人在不同表情下,该向量趋于一致;Alpha_exp为用于描述脸部表情的向量,该向量与用户的头部姿态无关,同一个人在不同表情下,该向量趋于一致。
可选地,上述第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数分别为上述alpha_id,s,R,T和alpha_exp。
在一个示例中,第一视频流包括N张图像,N为大于1的整数,N张图像中的每张图像均包括用户的第二脸部图像,根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数,包括:
对N张图像中每张图像中用户的第二脸部图像进行建模,以得到每张图像的第一参数,每张图像的第一参数用于描述每张图像中用户的脸部形状的向量;对待编辑图像中用户的第一脸部图像进行建模,以得到待编辑图像的第二参数,第二参数为用于描述待编辑图像中用户的脸部形状的向量;根据N张图像中每张图像的第一参数和待编辑图像的第二参数确定第一目标参数。可选地,对N张图像的第一参数和待编辑图像的第二参数进行求和再平均,或者加权求和再平均,以得到上述第一目标参数。
具体地,根据卷积神经网络对待编辑图像中用户的第一脸部图像进行人脸建模,以得到待编辑图像中用户的第一人脸模型,该第一人脸模型的表达系数为:(s_1,R_1,T_1,alpha_id_1,alpha_exp_1);根据卷积神经网络对上述N张图像中的每张图像中用户的第二人脸图像进行人脸建模,得到每张图像中用户的第二人脸模型,该第二人脸模型的表达系数为(s_2,R_2i,T_2i,alpha_id_2i,alpha_exp_2i),i=1,2,3,…,N;对参数alpha_id_1和参数alpha_id_21、alpha_id_22,…,alpha_id_2N进行求和或加权求和,然后对求和结果求平均,以得到第一目标参数alpha_id_x;
其中,alpha_id_x=(alpha_id_1+alpha_id_21+alpha_id_22+…+alpha_id_2N)/(N+1)或,
alpha_id_x=(w*alpha_id_1+w1*alpha_id_21+w2*alpha_id_22+…+wN*alpha_id_2N)/(N+1),w,w1,w2,…,wN分别为alpha_id_1,alpha_id_21,…,alpha_id_22和alpha_id_2N的权重。
在确定第一目标参数alpha_id_x后,根据第一目标参数alpha_id_x对待编辑图像中用户的第一脸部图像重新进行建模,以得到新的第一人脸模型,该模型的表达系数为(s_3,R_3,T_3,alpha_id_x,alpha_exp_3),并根据第一目标参数alpha_id_x对第一视频流中用户的第二脸部图像重新进行建模,以得到新的第二人脸模型,该模型的表达系数为(s_4,R_4,T_4,alpha_id_x,alpha_exp_4);根据第一目标参数alpha_id_x、第二目标参数s_3、第三目标参数R_4、第四目标参数T_3和第五目标参数alpha_exp_4构建目标人脸模型,其中,目标人脸模型可表示为:
在获取目标人脸模型后,对目标人脸模型进行渲染重建,以得到上述初步编辑的图像。
其中,对目标人脸模型进行渲染重建,以得到初步编辑的图像,具体可以包括根据目标人脸模型的三角刨分、3D顶点位置以及顶点颜色或纹理图像进行投影渲染,从而得到初步编辑后的图像。可选地,上述纹理图像可以为目标人脸模型的UV贴图。
通过以精准的人脸模型为基准进行照片再编辑,不会增加现实中不存在的内容到照片中,达到真实还原用户人脸的效果,并且所编辑的图像质量高。
S304、根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像。
可选地,特征图像可以包括用户的眼睛和口腔的图像,还可以包括除了用户的眼睛和口腔的图像之外的其他部位的图像,比如耳朵,鼻子、眉毛等。
具体地,分别对待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,第一图像为待编辑图像中包括用户的眼睛和口腔的图像,第二图像为初步编辑的图像中包括用户的眼睛和口腔的图像,第三图像为第一视频流中包括用户的眼睛和口腔的图像;对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到用户的眼睛和口腔图像的特征向量;根据用户的眼睛和口腔图像的特征向量生成特征图像。
如图6所示,分别对待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第二脸部图像和第一视频流中用户的第三脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,第一图像为待编辑图像中包括用户的眼睛和口腔的图像,第二图像为初步编辑的图像中包括用户的眼睛和口腔的图像,第三图像为第一视频流中包括用户的眼睛和口腔的图像;利用特征编码器对第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到用户的眼睛和口腔图像的特征向量;根据神经网络对该特征向量进行反卷积和上采样操作,以生成特征图像。
S305、将特征图像与初步编辑的图像中用户的第三脸部图像进行融合,以得到编辑后的图像。
可选地,可采用图像叠加、泊松编辑等图像融合算法或者神经网络算算法(比如梯度惩罚对抗生成网络,(gradient penalty-generative adversarial networks,GP-GAN)等算法)。
在获取上述特征图像后,利用图像融合器将初步编辑的图像中用户的第三脸部图像和特征图像进行融合,以得到编辑后的图像。其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。
具体地,第一脸部表情与第二脸部表情相关联,具体包括:
第一脸部表情为所述第二脸部表情,或者;第一向量与第二向量的均方误差小于第一阈值,其中,第一向量为用于表征第一脸部表情的向量,第二向量为用于表征第二脸部表情的向量。
可选地,上述第一阈值可以为0.1,0.2,0.5,0.7或者其他值,优选地,第一阈值为0.5。
在一个示例中,上述第一向量和第二向量为上述人脸模型的表达系数中的alpha_exp。
为了方便用户实时查看对待编辑图像的编辑效果,在电子设备的显示界面中三个区域分别用于显示待编辑图像、摄像头实时获取的包括用户脸部的图像及对待编辑图像进行实时编辑的效果图像。其中,显示对待编辑图像进行实时编辑的效果图像的界面可以称为预览界面。
如图7所示,图7中的a图为待编辑图像,b图为待编辑图像中用户的人脸模型,c图为对b图中的人脸模型进行稠密处理后的人脸模型示意图,c图为在稠密处理后的人脸模型增加脸部信息后得到的模型的示意图。
如图8所示,图8中的a图为第一视频流中的用户的脸部图像,b图为第一视频流中的用户的人脸模型;图为对b图中的人脸模型进行稠密处理后的人脸模型示意图,c图为在稠密处理后的人脸模型增加脸部信息后得到的模型的示意图。
如图9所示,图9中的a图为编辑后的图像,b图为目标人脸模型图,c图为对目标人脸模型进行稠密处理后的人脸模型示意图,c图为在稠密处理后的人脸模型增加脸部信息后得到的模型的示意图。
在此需要说明的是,人脸模型是由多个3d点组成的,对人脸模型进行稠密处理具体是指对人脸模型中每个点添加上对应的深度值。
为了防止用户对非本人的人脸照片进行再编辑,避免衍生伦理问题和社会争论,需要判断用户与待编辑图像中的脸部图像是否是同一个人的。
在一个示例中,在通过摄像头获取包括用户的第二脸部图像的第一视频流之前,通过摄像头获取包括用户的第四脸部图像的第二视频流;对第二视频流中用户的第四脸部图像进行脸部特征提取,以得到第一脸部特征;对待编辑图像中用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征;当第一脸部特征与第二脸部特征相匹配时,则确定待编辑图像中第一脸部图像和第二视频流中第二脸部图像是同一人的。
具体地,上述脸部特征可以为脸部特征向量,在通过摄像头获取包括用户的第四脸部图像的第二视频流后,如图5所示,从待编辑图像中确定出用户的第一脸部图像,并对用户的第一脸部图像进行关键点进行定位,并进行脸部特征提取,以得到第二脸部特征向量;可选地,在待编辑的图像中确定出用户的第一脸部图像后,通过在用户的第一脸部图像上添加边界框,以标识用户的脸部位置。对第二视频流中用户的第四脸部图像进行脸部检测,并进行脸部关键点定位和脸部特征提取,以得到第一脸部特征向量;计算第一脸部特征向量和第二脸部特征向量之间的特征距离,若该特征距离小于第二阈值时,则确定待编辑图像中第一脸部图像和第二视频流中的第四脸部图像为同一人的,并通过摄像头获取包括用户的第二脸部图像的第一视频流,即开始执行对待编辑图像中用户的第一脸部图像进行编辑的相关操作;若上述特征距离不小于第二阈值,则确定待编辑图像中第一脸部图像和第二视频流中的第二脸部图像不为同一人的,则不通过摄像头获取包括用户的第二脸部图像的第一视频流,即不执行对待编辑图像中用户的第一脸部图像进行编辑的相关操作。
可选地,在进行人脸识别时,可以通过摄像头获取静态的用户脸部图像,然后基于上述特征提取和判断过程确定摄像头获取的用户脸部图像与待编辑图像是否为同一个人的,具体过程在此不再叙述。
通过判断待编辑图像包括用户的脸部图像来实现只允许用户编辑自己本人的脸部图像,避免衍生伦理问题及社会争论。
在一个示例中,本申请的方法还包括:
在开启摄像头获取第一视频流时,判断是否录制用户的脸部表情编辑过程的视频;若判断录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存用户的脸部表情编辑过程的视频中多帧图像或者全部图像,该多帧图像或者全部图像包括编辑后的图像;若判断不录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存编辑后的图像。
可选地,用户的脸部表情编辑过程的视频中多帧图像可以是连续帧图像,该连续帧图像可以看成用户脸部表情编辑过程视频的视频片段;用户的脸部表情编辑过程的视频中多帧图像也可以不是连续帧图像,该不连续帧也可以构成一个视频片段。
在保存编辑后的图像或用户的脸部表情编辑过程的视频或者视频片段后,用户可以通过电子设备的相册来查看编辑后的图像或用户的脸部表情编辑过程的视频或者视频片段。用户在查看该视频或者视频片段时,既可以看到对照片中脸部表情的美化效果,同时也可以看到照片中其余人均静止,唯有用户本人脸部表情在变化的独特效果。
可以看出,在本申请实施例的方案中,通过人脸识别实现用户只能对自己的脸部表情进行再编辑,避免了衍生伦理问题和社会争论;通过根据摄像头获取的第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行再编辑,实现通过待编辑图像和第一视频流中的脸部图像构建精准的人脸模型,再以精准的人脸模型为基准进行照片再编辑,不会增加现实中不存在的内容到照片中,达到真实还原用户人脸的效果;在辅助对用户脸部图像进行美颜的同时,可以根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,实现了表情的再编辑功能,并且效果更加地真实,是当前业内2D/3D美颜只改变皮肤颜色人脸轮廓的升华,同时提高了用户体验。
参见图4,图4为本申请实施例提供另一种人脸表情编辑方法的流程示意图。如图4所示,该方法包括:
S401、获取待编辑图像,并启动表情编辑功能。
其中,待编辑图像包括用户的第一脸部图像。
可选地,待编辑图像可以是用户从电子设备的相册中选取的包括用户脸部的图像,还可以是通过电子设备的摄像头获取的包含用户的第一脸部图像的图像。
可选地,在从电子设备的相册中选取待编辑图像时,电子设备的显示界面显示第一提示标签,该第一提示标签用于提示用户选择待编辑图像。
进一步地,上述第一提示标签还用于提示用户选择包括用户本人脸部图像的图像作为待编辑图像。
S402、判断待编辑图像是否包括用户的脸部图像。
具体地,启动电子设备的摄像头,获取包括用户的第四脸部图像的第二视频流;并对第二视频流中用户的第四脸部图像进行脸部特征提取,以得到第一脸部特征;对待编辑图像种的第一脸部图像进行脸部特征提取,以得到第二脸部特征;当第一脸部特征和第二脸部特征相匹配时,确定待编辑图像中包括用户的脸部图像;当第一脸部特征和第二脸部特征不相匹配时,确定待编辑图像中不包括用户的脸部图像。
进一步地,上述第一脸部特征和第二脸部特征具体是指脸部特征向量,对第二视频流中用户的第四脸部图像进行脸部特征提取,以得到第一脸部特征,包括:
对第二视频流中用户的第四脸部图像进行脸部检测和脸部关键件定位,以得到第一脸部特征向量;
对待编辑图像中用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征,包括:从待编辑图像中确定用户的第一脸部图像,并对用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征向量。
判断第一脸部特征和第二脸部特征是否相匹配,具体包括:计算第一脸部特征向量和第二脸部特征向量之间的特征距离;若该特征距离小于第二阈值,则确定第一脸部特征和第二脸部特征相匹配;若上述特征距离不小于上述第二阈值,则确定第一脸部特征与第二脸部特征不相匹配。
其中,若确定待编辑图像包括用户的脸部图像,则执行步骤S404;若确定待编辑图像不包括用户的脸部图像,则执行步骤S403。
通过判断待编辑图像包括用户的脸部图像来实现只允许用户编辑自己本人的脸部图像,避免衍生伦理问题及社会争论。
S403、提示拒绝脸部表情编辑。
其中,电子设备的显示界面上显示第二提示标签,该第二提示标签用于提示用户编辑的对象非用户本人。
在执行S403后再执行步骤S410。
S404、判断是否录制用户脸部表情编辑过程的视频。
具体地,在确定待编辑图像为包括用户的脸部图像时,电子设备的显示界面上显示第三提示标签,该第三提示标签用于提示用户是否录制用户脸部表情编辑过程的视频,并显示“是”和“否”功能按键;当检测到用户点击“是”功能按键时,开始录制用户脸部表情编辑过程的视频,并执行步骤S405-S407和S409;当检测到用户点击“否”功能按键时,执行步骤S405-S408。
S405、通过摄像头获取包括用户的第二脸部图像的第一视频流,并根据该第一视频流中用户的第二脸部图像对待编辑图像中的第一脸部图像进行编辑,以得到初步编辑的图像。
其中,初步编辑的图像包括用户的第三脸部图像。
在此需要说明的是,在确定待编辑图像包括用户的脸部图像时,或者在确定对待编辑图像中用户的第一脸部图像进行编辑时,在电子设备的显示界面中三个区域分别用于显示待编辑图像、摄像头实时获取的包括用户的第二脸部图像的第一视频流及对待编辑图像中用户的第一脸部图像进行实时编辑的效果图像。其中,显示实时获取的包括用户脸部的图像的界面可以称为预览界面。
可选地,在通过摄像头获取包括用户的第二脸部图像的第一视频流时,电子设备提示用于调整预览界面中用户人像的状态及相机角度。比如提示改变头部与镜头之间的距离、改变头部与镜头的相对位置等;再比如提示改变用户头部姿态、改变光线角度、强弱等;再比如提示用户将帽子、口罩、眼睛等遮挡物去掉。可选地,可以通过提示标签的文字方式提醒用户,还可以语音的方式提醒。
其中,上述第一视频流中包括N张图像,该N张图像中的每张图像均包括用户的第二脸部图像,N为大于1的整数。
在一个可行的实施例中,人脸模型可表征为:
其中,V用于表征三维人脸立体模型,用于表征平均三维人脸立体模型,或者可以理解成大众脸的人脸模型;s用于表征人脸的大小尺度,R为用于表征三维人脸头部姿态的旋转矩阵或者欧拉角,T用于表征在笛卡尔坐标系下三维人头映射到图像坐标系内时需要的平移量,Aid为用于描述脸部形状的正交表达基,Aexp为用于描述脸部表情的正交表达基,Alpha_id为用于描述脸部形状的向量,该向量与用户的头部姿态无关,同一人在不同表情下,该向量趋于一致;Alpha_exp为用于描述脸部表情的向量,该向量与用户的头部姿态无关,同一个人在不同表情下,该向量趋于一致。
具体地,根据卷积神经网络对待编辑图像中用户的第一脸部图像进行人脸建模,以得到待编辑图像中用户的第一人脸模型,该第一人脸模型的表达系数为:(s_1,R_1,T_1,alpha_id_1,alpha_exp_1);根据卷积神经网络对上述N张图像中的每张图像中用户的第二脸部图像进行人脸建模,得到每张图像中用户的第二人脸模型,该第二人脸模型的表达系数为(s_2,R_2i,T_2i,alpha_id_2i,alpha_exp_2i),i=1,2,3,…,N;对参数alpha_id_1和参数alpha_id_21、alpha_id_22,…,alpha_id_2N进行求和或加权求和,然后对求和结果求平均,以得到第一目标参数alpha_id_x;
其中,alpha_id_x=(alpha_id_1+alpha_id_21+alpha_id_22+…+alpha_id_2N)/(N+1)或,
alpha_id_x=(w*alpha_id_1+w1*alpha_id_21+w2*alpha_id_22+…+wN*alpha_id_2N)/(N+1),w,w1,w2,…,wN分别为alpha_id_1,alpha_id_21,…,alpha_id_22和alpha_id_2N的权重。
在确定第一目标参数alpha_id_x后,根据第一目标参数alpha_id_x对待编辑图像中用户的第一脸部图像重新进行建模,以得到新的第一人脸模型,该模型的表达系数为(s_3,R_3,T_3,alpha_id_x,alpha_exp_3),并根据第一目标参数alpha_id_x对第一视频流中用户的第二人脸图像重新进行建模,以得到新的第二人脸模型,该模型的表达系数为(s_4,R_4,T_4,alpha_id_x,alpha_exp_4);根据第一目标参数alpha_id_x、第二目标参数s_3、第三目标参数R_4、第四目标参数T_3和第五目标参数alpha_exp_4构建目标人脸模型,其中,目标人脸模型可表示为:
在获取目标人脸模型后,对目标人脸模型进行渲染重建,以得到上述初步编辑的图像。
其中,对目标人脸模型进行渲染重建,以得到初步编辑的图像,具体可以包括根据目标人脸模型的三角刨分、3D顶点位置以及顶点颜色或纹理图像进行投影渲染,从而得到初步编辑后的图像。可选地,上述纹理图像可以为目标人脸模型的UV贴图。
S406、根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像。
可选地,特征图像可以包括用户的眼睛和口腔的图像,还可以包括除了用户的眼睛和口腔的图像之外的其他部位的图像,比如耳朵,鼻子、眉毛等。
具体地,分别对待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,第一图像为待编辑图像中包括用户的眼睛和口腔的图像,第二图像为初步编辑的图像中包括用户的眼睛和口腔的图像,第三图像为第一视频流中包括用户的眼睛和口腔的图像;对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到用户的眼睛和口腔图像的特征向量;对该特征向量进行反卷积和上采样操作,以得到包括用户的眼睛和口腔的图像。
S407、将特征图像与初步编辑的图像中用户的第三脸部图像进行融合,以得到编辑后的图像。
具体地,根据图像融合算法将特征图像与初步编辑的图像进行融合,以得到编辑后的图像。其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。
具体地,第一脸部表情与第二脸部表情相关联,具体包括:
第一脸部表情为所述第二脸部表情,或者;第一向量与第二向量的均方误差小于第一阈值,其中,第一向量为用于表征第一脸部表情的向量,第二向量为用于表征第二脸部表情的向量。
可选地,上述第一阈值可以为0.1,0.2,0.5,0.7或者其他值,优选地,第一阈值为0.5。
在此需要说明的是,上述第一向量和第二向量为上述人脸模型的表达系数中的alpha_exp。
S408、保存编辑后的图像。
S409、保存用户脸部表情编辑过程的视频中的多帧图像或者全部图像。
其中,该多帧图像或者全部图像包括编辑后的图像。可选地,用户的脸部表情编辑过程的视频中多帧图像可以是连续帧图像,该连续帧图像可以看成用户脸部表情编辑过程视频的视频片段;用户的脸部表情编辑过程的视频中多帧图像也可以不是连续帧图像,该不连续帧也可以构成一个视频片段。
其中,编辑后的图像的保存形式可以是:JPG,PNG、BMP、TIF等图像格式;上述视频或者视频片段的保存形式可以是GIF、FLV、RMVB等格式。
在保存编辑后的图像或用户的脸部表情编辑过程的视频或者视频片段后,用户可以通过电子设备的相册来查看编辑后的图像或用户的脸部表情编辑过程的视频或者视频片段。用户在查看该视频或者视频片段时,既可以看到对照片中脸部表情的美化效果,同时也可以看到照片中其余人均静止,唯有用户本人脸部表情在变化的独特效果。
S410、退出脸部表情编辑。
可以看出,在本申请实施例的方案中,通过人脸识别实现用户只能对自己的脸部表情进行再编辑,避免了衍生伦理问题和社会争论;通过根据摄像头获取的第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行再编辑,实现通过待编辑图像和第一视频流中的脸部图像构建精准的人脸模型,再以精准的人脸模型为基准进行照片再编辑,不会增加现实中不存在的内容到照片中,达到真实还原用户人脸的效果;在辅助对用户脸部图像进行美颜的同时,可以根据通过摄像头实时捕捉的用户脸部图像对静态照片中用户的脸部表情进行再编辑,实现了表情的再编辑功能,并且效果更加地真实,是当前业内2D/3D美颜只改变皮肤颜色人脸轮廓的升华,同时提高了用户体验。
参见图10,图10为本申请实施例提供第二电子设备的结构示意图。如图10所示,该电子设备1000包括:
获取单元1001,用于获取待编辑图像,待编辑图像包括用户的第一脸部图像;并通过摄像头获取包括用户的第二脸部图像的第一视频流;
编辑单元1002,用于根据第一视频流中的用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像;初步编辑的图像包括用户的第三脸部图像;
特征获取单元1009,还用于根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,特征图像为包括所述用户的眼睛和口腔的图像;
融合单元1003,用于将特征图像与初步编辑的图像中用户的第三脸部图像进行融合,以得到编辑后的图像;其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。
结合第二方面,第一脸部表情与第二脸部表情相关联,具体包括:
第一脸部表情为所述第二脸部表情,或者;第一向量与第二向量的均方误差小于第一阈值,其中,第一向量为用于表征第一脸部表情的向量,第二向量为用于表征第二脸部表情的向量。
可选地,上述第一阈值可以为0.1,0.2,0.5,0.7或者其他值,优选地,第一阈值为0.5。
结合第二方面及上述任一种可能的实现方式,编辑单元1002具体用于:
根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数,第一目标参数为用于描述用户的脸部形状的向量;根据第一目标参数和待编辑图像确定第二目标参数、第三目标参数和第四目标参数,其中,第二目标参数用于表征用户脸部的大小尺度,第三目标参数用于表征用户的三维人脸头部姿态的旋转矩阵或欧拉角,第四目标参数用于表征在笛卡尔坐标系下用户的三维头部映射到图像坐标系时需要的平移量;根据第一目标参数和第一视频流中的用户的第二脸部图像确定第五目标参数,第五目标参数为用于描述所述第一视频流中用户脸部表情的向量;根据第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数构建目标人脸模型;对目标人脸模型进行渲染重建,以得到初步编辑的图像。
结合第二方面及上述任一种可能的实现方式,第一视频流包括N张图像,N为大于1的整数,N张图像中的每张图像均包括用户的第二脸部图像,在根据第一视频流中用户的第二脸部图像和待编辑图像中用户的第一脸部图像确定第一目标参数的方面,编辑单元1002具体用于:
对N张图像中每张图像中用户的第二脸部图像进行建模,以得到每张图像的第一参数,每张图像的第一参数用于描述每张图像中用户的脸部形状的向量;对待编辑图像中用户的第一脸部图像进行建模,以得到待编辑图像的第二参数,第二参数为用于描述待编辑图像中用户的脸部形状的向量;根据N张图像中每张图像的第一参数和待编辑图像的第二参数确定第一目标参数。
结合第二方面及上述任一种可能的实现方式,特征获取单元1009具体用于:
分别对待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,第一图像为待编辑图像中包括用户的眼睛和口腔的图像,第二图像为初步编辑的图像中包括用户的眼睛和口腔的图像,第三图像为第一视频流中包括用户的眼睛和口腔的图像;对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到用户的眼睛和口腔图像的特征向量;根据用户的眼睛和口腔图像的特征向量生成特征图像。
结合第二方面及上述任一种可能的实现方式,通过摄像头获取包括用户的第二脸部图像的第一视频流之前,
获取单元1001,还用于通过摄像头获取包括用户的第四脸部图像的第二视频流;
电子设备1000还包括:
特征提取单元1004,用于对第二视频流中用户的第二脸部图像进行脸部特征提取,以得到第一脸部特征;对待编辑图像中用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征;
确定单元1005,用于当第一脸部特征与第二脸部特征相匹配时,则通过摄像头获取包括用户的第二脸部图像的第一视频流。
结合第二方面及上述任一种可能的实现方式,电子设备1000还包括:
判断单元1006,用于在开启摄像头获取第一视频流时,判断是否录制用户的脸部表情编辑过程的视频;
存储单元1007,用于若判断单元1006判断录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存用户的脸部表情编辑过程的视频中多帧图像或者全部图像,该多帧图像或者全部图像包括编辑后的图像;若判断单元1006判断不录制用户的脸部表情编辑过程的视频,则在获取编辑后的图像后,保存编辑后的图像。
结合第二方面及上述任一种可能的实现方式,电子设备100还包括:
显示单元1008,用于实时显示待编辑图像、第一视频流和对待编辑图像进行实时编辑的效果图像。
需要说明的是,上述各单元(获取单元1001、编辑单元1002、特征获取单元1009、融合单元1003、特征提取单元1004、确定单元1005、判断单元1006、存储单元1007和显示单元1008)用于执行上述方法的相关步骤。比如获取单元1001用于执行步骤S301、步骤S302、步骤S401、S405的相关内容,编辑单元1002用于执行步骤S302、步骤S405的相关内容、特征提取单元1009用于执行步骤S304和S406的相关内容,融合单元1003用于执行步骤S305和S407的相关内容,特征提取单元1004、确定单元1005和判断单元1006用于执行S303、S402和S404的相关内容、确定单元1005、判断单元1006、存储单元1007用于执行步骤S408和S409的相关内容,显示单元1008用于执行步骤S305的相关内容。
在本实施例中,电子设备1000是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。此外,以上获取单元1001、编辑单元1002、特征获取单元1009、融合单元1003、特征提取单元1004、确定单元1005、判断单元1006、存储单元1007可通过图12所示的第四电子设备的处理器1201来实现。
参见图11,图11为本申请实施例提供的第三电子设备的结构示意图。如图11所示,该电子设备1100包括:
系统存储模块1101,用于存储待编辑图像、编辑后的图像、通过相机模块1103获取的上述第一视频流和第二视频流,以及提供其他模块运行时的系统存储开销,其中,待编辑图像包括用户的第一脸部图像,第一视频流中包括用户的第二脸部图像,第二视频流中包括用户的第四脸部图像。
处理模块1102,用于判断第二视频流中用户的第四图像与待编辑图像中的第一脸部图像是否为同一个人的,在第二视频流中用户的第四图像与待编辑图像中的第一脸部图像是否为同一个人的时,根据第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像,初步编辑的图像包括用户的第三脸部图像;根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,该特征图像包括用户的眼睛和口腔的图像;将特征图像与初步编辑的图像进行融合,以得到编辑后的图像,其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。具体过程可参见图3或图4所示实施例的相关描述,在此不再叙述。
相机模块1103,用于获取第一视频流和第二视频流。
神经网络加速模块1104,用于根据卷积神经网络构建待待编辑图像中用户的第一脸部图像对应的人脸模型和第一视频流中用户的第二脸部图像对应的人脸模型,和根据待编辑图像中用户的第一脸部图像,初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,该特征图像包括用户的眼睛和口腔的图像。具体过程可参见图3或图4所示实施例的相关描述,在此不再叙述。
用户交互以及显示界面1105,用于显示待编辑图像、实时显示通过相机模块1103实时获取的第一视频流和对待编辑图像进行实时编辑的效果图;并用于显示图3或图4实施例中的相关标签及功能键,以实现与用户的交互。
如图12所示电子设备1200可以图12中的结构来实现,该电子设备1200包括至少一个处理器1201,至少一个存储器1202以及至少一个通信接口1203。所述处理器1201、所述存储器1202和所述通信接口1203通过所述通信总线连接并完成相互间的通信。
处理器1201可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
通信接口1203,用于与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(Wireless Local Area Networks,WLAN)等。
存储器1202可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器1202用于存储执行以上方案的应用程序代码,并由处理器1201来控制执行。所述处理器1201用于执行所述存储器1202中存储的应用程序代码。
存储器1202存储的代码可执行以上提供的一种脸部表情编辑方法,比如获取待编辑图像,该待编辑图像中包括用户的第一脸部图像;通过摄像头获取包括用户的第二脸部图像的第一视频流;根据第一视频流中用户的第二脸部图像对待编辑图像中用户的第一脸部图像进行编辑,以得到初步编辑的图像,初步编辑的图像包括用户的第三脸部图像;根据待编辑图像中用户的第一脸部图像、初步编辑的图像中用户的第三脸部图像和第一视频流中用户的第二脸部图像获取特征图像,该特征图像包括用户的眼睛和口腔的图像;将特征图像与初步编辑的图像中第三脸部图像进行融合,以得到编辑后的图像,其中,编辑后的图像包括所述用户的第一脸部表情,第二脸部图像包括用户的第二脸部表情,第一脸部表情与第二脸部表情相关联。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种人脸表情编辑方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (18)
1.一种人脸表情编辑方法,其特征在于,包括:
获取待编辑图像,所述待编辑图像包括用户的第一脸部图像;
通过摄像头获取包括所述用户的第二脸部图像的第一视频流;
根据所述第一视频流中的所述用户的第二脸部图像对所述待编辑图像中所述用户的第一脸部图像进行编辑,以得到初步编辑的图像;所述初步编辑的图像包括所述用户的第三脸部图像;
根据所述待编辑图像中所述用户的第一脸部图像、所述初步编辑的图像中所述用户的第三脸部图像和所述第一视频流中所述用户的第二脸部图像获取特征图像,所述特征图像为包括所述用户的眼睛和口腔的图像;
将所述特征图像与所述初步编辑的图像中所述用户的第三脸部图像进行融合,以得到编辑后的图像;其中,所述编辑后的图像包括所述用户的第一脸部表情,所述第二脸部图像包括所述用户的第二脸部表情,所述第一脸部表情与所述第二脸部表情相关联。
2.根据权利要求1所述的方法,其特征在于,所述第一脸部表情与所述第二脸部表情相关联,具体包括:
所述第一脸部表情为所述第二脸部表情,或者;
第一向量与第二向量的均方误差小于第一阈值,其中所述第一向量为用于表征所述第一脸部表情的向量,所述第二向量为用于表征所述第二脸部表情的向量。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一视频流中的所述用户的第二脸部图像对所述待编辑图像中所述用户的第一脸部图像进行编辑,以得到初步编辑的图像,具体包括:
根据所述第一视频流中所述用户的第二脸部图像和所述待编辑图像中所述用户的第一脸部图像确定第一目标参数,所述第一目标参数为用于描述所述用户的脸部形状的向量;
根据所述第一目标参数和所述待编辑图像确定第二目标参数、第三目标参数和第四目标参数,其中,所述第二目标参数用于表征所述用户脸部的大小尺度,所述第三目标参数用于表征所述用户的三维人脸头部姿态的旋转矩阵或欧拉角,所述第四目标参数用于表征在笛卡尔坐标系下所述用户的三维头部映射到图像坐标系时需要的平移量;
根据所述第一目标参数和所述第一视频流中的所述用户的第二脸部图像确定第五目标参数,所述第五目标参数为用于描述所述第一视频流中所述用户脸部表情的向量;
根据所述第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数构建目标人脸模型;
对所述目标人脸模型进行渲染重建,以得到所述初步编辑的图像。
4.根据权利要求3所述的方法,其特征在于,所述第一视频流包括N张图像,N为大于1的整数,所述N张图像中的每张图像均包括所述用户的第二脸部图像,所述根据所述第一视频流中所述用户的第二脸部图像和所述待编辑图像中所述用户的第一脸部图像确定第一目标参数,包括:
对所述N张图像中每张图像中所述用户的第二脸部图像进行建模,以得到所述每张图像的第一参数,所述每张图像的第一参数用于描述所述每张图像中所述用户的脸部形状的向量;
对所述待编辑图像中所述用户的第一脸部图像进行建模,以得到所述待编辑图像的第二参数,所述第二参数为用于描述所述待编辑图像中所述用户的脸部形状的向量;
根据所述N张图像中每张图像的第一参数和所述待编辑图像的第二参数确定所述第一目标参数。
5.根据权利要求4所述的方法,其特征在于,根据所述待编辑图像中所述用户的第一脸部图像、所述初步编辑的图像中所述用户的第三脸部图像和所述第一视频流中所述用户的第二脸部图像获取特征图像,包括:
分别对所述待编辑图像中所述用户的第一脸部图像、所述初步编辑的图像中所述用户的第三脸部图像和所述第一视频流中所述用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,所述第一图像为所述待编辑图像中包括所述用户的眼睛和口腔的图像,所述第二图像为所述初步编辑的图像中包括所述用户的眼睛和口腔的图像,所述第三图像为所述第一视频流中包括所述用户的眼睛和口腔的图像;
对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到所述用户的眼睛和口腔图像的特征向量;
根据所述用户的眼睛和口腔图像的特征向量生成所述特征图像。
6.根据权利要求5所述的方法,其特征在于,所述通过摄像头获取包括所述用户的第二脸部图像的第一视频流之前,所述方法还包括:
通过所述摄像头获取包括所述用户的第四脸部图像的第二视频流;
对所述第二视频流中所述用户的第四脸部图像进行脸部特征提取,以得到第一脸部特征;对所述待编辑图像中所述用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征;
当所述第一脸部特征与所述第二脸部特征相匹配时,通过所述摄像头获取包括所述用户的第二脸部图像的第一视频流。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在开启所述摄像头获取所述第一视频流时,判断是否录制所述用户的脸部表情编辑过程的视频;
若判断录制所述用户的脸部表情编辑过程的视频,则在获取所述编辑后的图像后,保存所述用户的脸部表情编辑过程的视频中多帧图像或者全部图像,所述多帧图像或者全部图像包括所述编辑后的图像;
若判断不录制所述用户的脸部表情编辑过程的视频,则在获取所述编辑后的图像后,保存所述编辑后的图像。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
实时显示所述待编辑图像、所述第一视频流和对所述待编辑图像进行实时编辑的效果图像。
9.一种电子设备,其特征在于,包括:
获取单元,用于获取待编辑图像,所述待编辑图像包括用户的第一脸部图像;并通过摄像头获取包括所述用户的第二脸部图像的第一视频流;
编辑单元,用于根据所述第一视频流中的所述用户的第二脸部图像对所述待编辑图像中所述用户的第一脸部图像进行编辑,以得到初步编辑的图像;所述初步编辑的图像包括所述用户的第三脸部图像;
特征获取单元,还用于根据所述待编辑图像中所述用户的第一脸部图像、所述初步编辑的图像中所述用户的第三脸部图像和所述第一视频流中所述用户的第二脸部图像获取特征图像,所述特征图像为包括所述用户的眼睛和口腔的图像;
融合单元,用于将所述特征图像与所述初步编辑的图像中所述用户的第三脸部图像进行融合,以得到编辑后的图像;其中,所述编辑后的图像包括所述用户的第一脸部表情,所述第二脸部图像包括所述用户的第二脸部表情,所述第一脸部表情与所述第二脸部表情相关联。
10.根据权利要求9所述的电子设备,其特征在于,所述第一脸部表情与所述第二脸部表情相关联,具体包括:
所述第一脸部表情为所述第二脸部表情,或者;
第一向量与第二向量的均方误差小于第一阈值,其中所述第一向量为用于表征所述第一脸部表情的向量,所述第二向量为用于表征所述第二脸部表情的向量。
11.根据权利要求9或10所述的电子设备,其特征在于,所述编辑单元具体用于:
根据所述第一视频流中所述用户的第二脸部图像和所述待编辑图像中所述用户的第一脸部图像确定第一目标参数,所述第一目标参数为用于描述所述用户的脸部形状的向量;
根据所述第一目标参数和所述待编辑图像确定第二目标参数、第三目标参数和第四目标参数,其中,所述第二目标参数用于表征所述用户脸部的大小尺度,所述第三目标参数用于表征所述用户的三维人脸头部姿态的旋转矩阵或欧拉角,所述第四目标参数用于表征在笛卡尔坐标系下所述用户的三维头部映射到图像坐标系时需要的平移量;
根据所述第一目标参数和所述第一视频流中的所述用户的第二脸部图像确定第五目标参数,所述第五目标参数为用于描述所述第一视频流中所述用户脸部表情的向量;
根据所述第一目标参数、第二目标参数、第三目标参数、第四目标参数和第五目标参数构建目标人脸模型;
对所述目标人脸模型进行渲染重建,以得到所述初步编辑的图像。
12.根据权利要求11所述的电子设备,其特征在于,所述第一视频流包括N张图像,N为大于1的整数,所述N张图像中的每张图像均包括所述用户的第二脸部图像,在所述根据所述第一视频流中所述用户的第二脸部图像和所述待编辑图像中所述用户的第一脸部图像确定第一目标参数的方面,所述编辑单元具体用于:
对所述N张图像中每张图像中所述用户的第二脸部图像进行建模,以得到所述每张图像的第一参数,所述每张图像的第一参数用于描述所述每张图像中所述用户的脸部形状的向量;
对所述待编辑图像中所述用户的第一脸部图像进行建模,以得到所述待编辑图像的第二参数,所述第二参数为用于描述所述待编辑图像中所述用户的脸部形状的向量;
根据所述N张图像中每张图像的第一参数和所述待编辑图像的第二参数确定所述第一目标参数。
13.根据权利要求12所述的电子设备,其特征在于,所述特征获取单元具体用于:
分别对所述待编辑图像中所述用户的第一脸部图像、所述初步编辑的图像中所述用户的第三脸部图像和所述第一视频流中所述用户的第二脸部图像进行图像分割,以得到第一图像、第二图像和第三图像,所述第一图像为所述待编辑图像中包括所述用户的眼睛和口腔的图像,所述第二图像为所述初步编辑的图像中包括所述用户的眼睛和口腔的图像,所述第三图像为所述第一视频流中包括所述用户的眼睛和口腔的图像;
对所述第一图像,第二图像和第三图像中的眼睛和口腔的特征进行编码,以得到所述用户的眼睛和口腔图像的特征向量;
根据所述用户的眼睛和口腔图像的特征向量生成所述特征图像。
14.根据权利要求13所述的电子设备,其特征在于,所述通过摄像头获取包括所述用户的第二脸部图像的第一视频流之前,
所述获取单元,还用于通过所述摄像头获取包括所述用户的第四脸部图像的第二视频流;
所述电子设备还包括:
特征提取单元,用于对所述第二视频流中所述用户的第四脸部图像进行脸部特征提取,以得到第一脸部特征;对所述待编辑图像中所述用户的第一脸部图像进行脸部特征提取,以得到第二脸部特征;
确定单元,用于当所述第一脸部特征与所述第二脸部特征相匹配时,通过所述摄像头获取包括所述用户的第二脸部图像的第一视频流。
15.根据权利要求14所述的电子设备,其特征在于,所述电子设备还包括:
判断单元,用于在开启所述摄像头获取所述第一视频流时,判断是否录制所述用户的脸部表情编辑过程的视频;
存储单元,用于若所述判断单元判断录制所述用户的脸部表情编辑过程的视频,则在获取所述编辑后的图像后,保存所述用户的脸部表情编辑过程的视频中多帧图像或者全部图像,所述多帧图像或者全部图像包括所述编辑后的图像;若所述判断单元判断确定不录制所述用户的脸部表情编辑过程的视频,则在获取所述编辑后的图像后,保存所述编辑后的图像。
16.根据权利要求15所述的电子设备,其特征在于,所述电子设备还包括:
显示单元,用于实时显示所述待编辑图像、所述第一视频流和对所述待编辑图像进行实时编辑的效果图像。
17.一种电子设备,包括触控屏,存储器,一个或多个处理器;其中,所述存储器存储有一个或多个程序;其特征在于,所述一个或多个处理器在执行所述一个或多个程序时,使得所述电子设备实现如权利要求1至8任一项所述的方法。
18.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1至8任一项所述的方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010510988.1A CN113763517B (zh) | 2020-06-05 | 2020-06-05 | 人脸表情编辑方法及电子设备 |
EP21817634.5A EP4152268A4 (en) | 2020-06-05 | 2021-01-22 | FACIAL EXPRESSION EDITING METHOD AND ELECTRONIC DEVICE |
KR1020227046067A KR20230017298A (ko) | 2020-06-05 | 2021-01-22 | 얼굴 표정 편집 방법 및 전자 디바이스 |
PCT/CN2021/073361 WO2021244040A1 (zh) | 2020-06-05 | 2021-01-22 | 人脸表情编辑方法及电子设备 |
JP2022574611A JP7497937B2 (ja) | 2020-06-05 | 2021-01-22 | 顔の表情編集方法、電子デバイス、コンピュータストレージ媒体、及びコンピュータプログラム |
US18/073,992 US20230107555A1 (en) | 2020-06-05 | 2022-12-02 | Facial Expression Editing Method and Electronic Device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010510988.1A CN113763517B (zh) | 2020-06-05 | 2020-06-05 | 人脸表情编辑方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113763517A CN113763517A (zh) | 2021-12-07 |
CN113763517B true CN113763517B (zh) | 2024-04-12 |
Family
ID=78785400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010510988.1A Active CN113763517B (zh) | 2020-06-05 | 2020-06-05 | 人脸表情编辑方法及电子设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230107555A1 (zh) |
EP (1) | EP4152268A4 (zh) |
JP (1) | JP7497937B2 (zh) |
KR (1) | KR20230017298A (zh) |
CN (1) | CN113763517B (zh) |
WO (1) | WO2021244040A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115170441B (zh) * | 2022-08-30 | 2023-02-07 | 荣耀终端有限公司 | 一种图像处理方法及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056650A (zh) * | 2016-05-12 | 2016-10-26 | 西安电子科技大学 | 基于快速表情信息提取和泊松融合的人脸表情合成方法 |
CN108985241A (zh) * | 2018-07-23 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN109816759A (zh) * | 2019-01-25 | 2019-05-28 | 维沃移动通信有限公司 | 一种表情生成方法及装置 |
CN110163054A (zh) * | 2018-08-03 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种人脸三维图像生成方法和装置 |
CN111127378A (zh) * | 2019-12-23 | 2020-05-08 | Oppo广东移动通信有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170046140A (ko) * | 2014-08-29 | 2017-04-28 | 톰슨 라이센싱 | 얼굴 이미지 편집 방법 및 디바이스 |
US20180068178A1 (en) | 2016-09-05 | 2018-03-08 | Max-Planck-Gesellschaft Zur Förderung D. Wissenschaften E.V. | Real-time Expression Transfer for Facial Reenactment |
US10504267B2 (en) * | 2017-06-06 | 2019-12-10 | Adobe Inc. | Generating a stylized image or stylized animation by matching semantic features via an appearance guide, a segmentation guide, and/or a temporal guide |
CN107993216B (zh) * | 2017-11-22 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 一种图像融合方法及其设备、存储介质、终端 |
US11010944B2 (en) * | 2017-12-28 | 2021-05-18 | Facebook, Inc. | Systems and methods for swapping faces and face components based on facial recognition |
EP3912092A1 (en) * | 2019-01-18 | 2021-11-24 | Snap Inc. | Systems and methods for realistic head turns and face animation synthesis on mobile device |
CN112580400B (zh) * | 2019-09-29 | 2022-08-05 | 荣耀终端有限公司 | 图像选优方法及电子设备 |
-
2020
- 2020-06-05 CN CN202010510988.1A patent/CN113763517B/zh active Active
-
2021
- 2021-01-22 KR KR1020227046067A patent/KR20230017298A/ko active Search and Examination
- 2021-01-22 WO PCT/CN2021/073361 patent/WO2021244040A1/zh unknown
- 2021-01-22 EP EP21817634.5A patent/EP4152268A4/en active Pending
- 2021-01-22 JP JP2022574611A patent/JP7497937B2/ja active Active
-
2022
- 2022-12-02 US US18/073,992 patent/US20230107555A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056650A (zh) * | 2016-05-12 | 2016-10-26 | 西安电子科技大学 | 基于快速表情信息提取和泊松融合的人脸表情合成方法 |
CN108985241A (zh) * | 2018-07-23 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN110163054A (zh) * | 2018-08-03 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种人脸三维图像生成方法和装置 |
CN109816759A (zh) * | 2019-01-25 | 2019-05-28 | 维沃移动通信有限公司 | 一种表情生成方法及装置 |
CN111127378A (zh) * | 2019-12-23 | 2020-05-08 | Oppo广东移动通信有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR20230017298A (ko) | 2023-02-03 |
EP4152268A4 (en) | 2023-11-15 |
WO2021244040A1 (zh) | 2021-12-09 |
CN113763517A (zh) | 2021-12-07 |
EP4152268A1 (en) | 2023-03-22 |
JP2023529642A (ja) | 2023-07-11 |
US20230107555A1 (en) | 2023-04-06 |
JP7497937B2 (ja) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748957B2 (en) | Generating 3D data in a messaging system | |
US11961189B2 (en) | Providing 3D data for messages in a messaging system | |
US11783556B2 (en) | Augmented reality content generators including 3D data in a messaging system | |
US11410401B2 (en) | Beautification techniques for 3D data in a messaging system | |
KR102624635B1 (ko) | 메시징 시스템에서의 3d 데이터 생성 | |
US11825065B2 (en) | Effects for 3D data in a messaging system | |
CN116048244B (zh) | 一种注视点估计方法及相关设备 | |
US20230162529A1 (en) | Eye bag detection method and apparatus | |
US20230107555A1 (en) | Facial Expression Editing Method and Electronic Device | |
CN114399622A (zh) | 图像处理方法和相关装置 | |
CN115170441B (zh) | 一种图像处理方法及电子设备 | |
US20240069637A1 (en) | Touch-based augmented reality experience | |
CN114140314A (zh) | 一种人脸图像处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |