CN113393544A - 一种图像处理方法、装置、设备及介质 - Google Patents
一种图像处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113393544A CN113393544A CN202011064705.1A CN202011064705A CN113393544A CN 113393544 A CN113393544 A CN 113393544A CN 202011064705 A CN202011064705 A CN 202011064705A CN 113393544 A CN113393544 A CN 113393544A
- Authority
- CN
- China
- Prior art keywords
- face image
- cartoon
- image
- loss
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/80—2D [Two Dimensional] animation, e.g. using sprites
Abstract
本申请公开了一种图像处理方法、装置、设备及介质,其中的方法包括:获取样本数据,调用图像处理模型将标注真实人脸图像Ai转换为重构卡通人脸图像B'i,将非标注真实人脸图像Ci转换为重构卡通人脸图像B”i;将重构卡通人脸图像B”i逆转换为重构真实人脸图像C”i;将标注卡通人脸图像Bi逆转换为重构真实人脸图像C'i;根据B'i与Bi之间的差异性获取第一损失;根据B'i、B”i及Bi获取第二损失;根据Ci与C'i获取第三损失;以及根据Ci与C”i之间的差异性获取第四损失;基于第一损失、第二损失、第三损失和第四损失,训练图像处理模型。本申请可以提升模型训练效果,提升训练好的图像处理模型的通用性和稳定性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及人工智能技术领域,具体涉及一种图像处理方法、一种图像处理装置、一种图像处理设备以及一种计算机可读存储介质。
背景技术
二次元文化在年轻群体中的发展非常迅猛,随着越来越多Z世代(即互联网世代)步入社会,二次元文化将逐渐成为主流,因此,为互联网用户提供二次元定制服务在泛娱乐场景下具有重要意义。二次元定制服务是指向互联网用户提供将真实人脸图像转换为卡通人脸图像的服务。
基于二次元定制服务的需求,可通过对常规的图像处理模型进行训练,并采用训练好的图像处理模型来响应需求。实践发现,目前针对用于实现二次元定制服务的图像处理模型的训练包括无监督训练和监督训练两种主流方案,无监督训练方案是指从互联网中获取大量的无标注训练数据作为样本数据来对模型进行训练的方案,这种方案训练得到的模型的通用性较差,无法实现卡通风格的定制;而监督训练方案是指通过大量的标注数据作为样本数据进行模型训练的方案,但目前卡通域空间的标注数据需要通过画师绘制,绘制成本较高,这使得监督训练方案的成本较高,通用性较差。由此可见,目前针对二次元定制服务的模型训练效果较差,训练好的模型并不能较好地实现二次元定制服务。
发明内容
本申请实施例提供了一种图像处理方法、装置、设备及介质,可以提升模型训练效果,提升训练好的图像处理模型的通用性和稳定性。
一方面,本申请实施例提供一种图像处理方法,该图像处理方法包括:
获取用于模型训练的样本数据,样本数据包括标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;
调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;并调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C'i;
根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失;
基于第一损失、第二损失、第三损失和第四损失,更新图像处理模型的参数以训练图像处理模型。
另一方面,本申请实施例提供一种图像处理装置,该图像处理装置包括:
获取单元,用于获取用于模型训练的样本数据,样本数据包括标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;
处理单元,用于调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C'i;
获取单元,还用于根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性获取图像处理模型的第四损失;
处理单元,用于基于第一损失、第二损失、第三损失和第四损失,更新图像处理模型的参数以训练图像处理模型。
在一种实现方式中,获取单元具体用于:
获取训练数据集,并从训练数据集中采样出用于模型训练的样本数据;
其中,训练数据集包括标注真实人脸图像集A、标注卡通人脸图像集B及非标注真实人脸图像集C;标注真实人脸图像集A中包括属于真人域空间的N个标注真实人脸图像;标注卡通人脸图像集B中包括属于卡通域空间的N个标注卡通人脸图像;N个标注真实人脸图像与N个标注卡通人脸图像一一配对;非标注真实人脸图像集C中包括属于真人域空间的M个非标注真实人脸图像,M、N均为正整数,且N<<M;
标注真实人脸图像Ai是标注真实人脸图像集A中的任一个或多个图像;标注卡通人脸图像Bi是标注卡通人脸图像集B中的一个或多个图像;非标注真实人脸图像Ci是非标注真实人脸图像集C中的任一个或多个图像,i为正整数且i≤N。
在一种实现方式中,图像处理模型包括第一生成器;处理单元具体用于:
调用第一生成器对标注真实人脸图像Ai进行转换处理,得到重构卡通人脸图像B'i;以及调用第一生成器对非标注真实人脸图像Ci进行转换处理,得到重构卡通人脸图像B”i;
其中,转换处理是指将真人域空间的图像转换至卡通域空间的处理。
在一种实现方式中,图像处理模型包括第二生成器;处理单元具体用于:
调用第二生成器对重构卡通人脸图像B”i进行逆转换处理,得到重构真实人脸图像C”i;以及调用第二生成器对标注卡通人脸图像Bi进行逆转换处理,得到重构真实人脸图像C'i;
其中,逆转换处理是指将卡通域空间的图像转换至真人域空间的处理。
在一种实现方式中,第一损失包括像素重构损失和视觉重构损失中的至少一种;像素重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在像素维度上的差异性;视觉重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在视觉维度上的差异性;图像处理模型包括第一生成器和第二生成器,第四损失用于衡量第一生成器与第二生成器的循环一致性损失。
在一种实现方式中,获取单元具体用于:
获取重构卡通人脸图像B'i的第一像素值,以及获取标注卡通人脸图像Bi的第二像素值;
对第一像素值与第二像素值进行计算,得到第一像素值与第二像素值之间的像素差值;
对像素差值进行均值运算,得到像素重构损失。
在一种实现方式中,获取单元具体用于:
提取重构卡通人脸图像B'i的第一视觉特征值,以及提取标注卡通人脸图像Bi的第二视觉特征值;
对第一视觉特征值与第二视觉特征值进行计算,得到第一视觉特征值与第二视觉特征值之间的视觉特征差值;
对视觉特征差值进行均值运算,得到视觉重构损失。
在一种实现方式中,图像处理模型包括第一判别器;获取单元具体用于:
调用第一判别器对重构卡通人脸图像B'i进行判别处理,得到第一判别结果;调用重构卡通人脸图像B”i进行判别处理,得到第二判别结果;以及,调用第一判别器对标注卡通人脸图像Bi进行判别处理,得到第三判别结果;
根据第一判别结果、第二判别结果及第三判别结果,计算第二损失;第二损失用于衡量第一判别器的对抗损失。
在一种实现方式中,图像处理模型包括第二判别器;获取单元具体用于:
调用第二判别器对重构真实人脸图像C'i进行判别处理,得到第四判别结果;以及调用第二判别器对非标注真实人脸图像Ci进行判别处理,得到第五判别结果;
根据第四判别结果和第五判别结果,计算第三损失;该第三损失用于衡量第二判别器的对抗损失。
在一种实现方式中,处理单元具体用于:
基于第一损失、第二损失、第三损失和第四损失,构建图像处理模型的损失函数;
按照最小化损失函数的值的原则,更新图像处理模型的参数以训练图像处理模型。
在一种实现方式中,获取单元还用于:从训练数据集中循环采样出用于模型训练的样本数据,并采用样本数据对图像处理模型进行迭代训练,得到训练好的目标图像处理模型。
在一种实现方式中,处理单元还用于:当接收到待处理的目标真实人脸图像时,调用目标图像处理模型对目标真实人脸图像进行转换处理,得到目标真实人脸图像对应的重构卡通人脸图像。
另一方面,本申请实施例提供一种图像处理设备,该图像处理设备包括:
处理器,适于实现计算机指令;以及,
计算机可读存储介质,存储有计算机指令,计算机指令适于由处理器加载并执行上述的图像处理方法。
另一方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,该计算机指令被计算机设备的处理器读取并执行时,使得计算机设备执行上述的图像处理方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的图像处理方法。
本申请实施例中,用于进行模型训练的样本数据包括标注样本数据(即标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi)和非标注样本数据(即非标注真实人脸图像Ci),采用标注样本数据(即监督数据)和非标注样本数据(即非监督数据)形成的混合数据对图像处理模型进行训练,在保证样本数据量的情况下,降低训练成本,提升模型训练性能;此外,图像处理模型能够将标注真实人脸图像Ai转换为重构卡通人脸图像B'i,将非标注真实人脸图像Ci转换为重构卡通人脸图像B”i,将重构卡通人脸图像B”i逆转换为重构真实人脸图像C”i,以及将标注卡通人脸图像Bi逆转换为重构真实人脸图像C'i;并根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失;通过图像处理模型的第一损失更新图像处理模型的参数,能够在图像处理模型的训练过程中对卡通域空间的结构形变进行强约束,这既能有效提升模型训练性能,又可保证训练好的图像处理模型具备通用性及满足卡通定制的需求,提升训练好的图像处理模型针对卡通图像的生成质量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一个示例性实施例提供的一种真人域空间与卡通域空间之间的转换关系示意图;
图2示出了本申请一个示例性实施例提供的一种图像处理系统的架构示意图;
图3示出了本申请一个示例性实施例提供的一种图像处理方法的流程示意图;
图4示出了本申请一个示例性实施例提供的一种训练数据集的结构示意图;
图5示出了本申请一个示例性实施例提供的一种图像处理模型的训练过程的示意图;
图6示出了本申请另一个示例性实施例提供的一种图像处理方法的流程示意图;
图7示出了本申请另一个示例性实施例提供的一种图像处理方法的流程示意图;
图8示出了本申请一个示例性实施例提供的一种图像处理装置的结构示意图;
图9示出了本申请一个示例性实施例提供的一种图像处理设备的结构示意图。
具体实施
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提出一种图像处理方案,该方案涉及人工智能的计算机视觉、机器学习等技术,其中:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OC R(Optical Character Recognition,光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D(3-dimension,三维)技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例涉及图像处理模型,该图像处理模型可以实现真人域空间内的图像与卡通域空间内的图像之间的互相转换。其中,真人域(Domain)空间是指容纳真实人脸图像的空间,即任一真实人脸图像均属于真人域空间,而真人域空间内的任一图像均为真实人脸图像。同理,卡通域空间是指容纳卡通人脸图像的空间,即任一卡通人脸图像均属于卡通域空间,而卡通域空间内的任一图像均为卡通人脸图像。该图像处理模型可以包括但不限于以下任一种:生成对抗网络(Generative Adversarial Networks,GAN)模型、循环生成对抗网络(Cycle Generative Adversarial Networks,CycleGAN)模型等等。除特别说明外,本申请后续实施例以图像处理模型是循环生成对抗网络模型为例进行说明。图1示出了本申请一个示例性实施例提供的一种真人域空间与卡通域空间之间的转换关系的示意图,如图1所示,目标真实人脸图像1属于真人域空间,调用图像处理模型对目标真实人脸图像1进行转换处理后得到目标真实人脸图像1对应的重构卡通人脸图像1,重构卡通人脸图像1属于卡通域空间;目标真实人脸图像2属于真人域空间,调用图像处理模型对目标真实人脸图像2进行转换处理后得到目标真实人脸图像2对应的重构卡通人脸图像2,重构卡通人脸图像2属于卡通域空间。
为了提升图像处理模型的性能,使得图像处理模型既具备通用性以满足各种卡通定制的需求,又能生成较高质量的卡通图像;本申请实施例提出一种图像处理方案来对图像处理模型进行训练,该方案主要具备以下几个特点:(1)用于进行模型训练的样本数据包括标注样本数据(即标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi)和非标注样本数据(即非标注真实人脸图像Ci)。也就是说,采用标注样本数据(即监督数据)和非标注样本数据(即非监督数据)形成的混合数据来对图像处理模型进行训练,这既能降低对监督数据的强依赖性,降低训练成本;又可有效保证样本数据量,保证模型训练的效果。(2)在模型训练过程中,调用图像处理模型能够将标注真实人脸图像Ai转换为重构卡通人脸图像B'i,将非标注真实人脸图像Ci转换为重构卡通人脸图像B”i,将重构卡通人脸图像B”i逆转换为重构真实人脸图像C”i,以及将标注卡通人脸图像Bi逆转换为重构真实人脸图像C'i;并根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失;以及根据第一损失、第二损失、第三损失、第四损失来训练该图像处理模型;通过图像处理模型的第一损失来训练图像处理模型,能够在图像处理模型的训练过程中对卡通域空间的结构形变进行强约束,这能有效提升模型训练性能。(3)从真实人脸图像转换为卡通人脸图像的过程中,除了图像纹理会发生改变以外,通常脸型和五官也会发生形变,根据真实人脸图像发生形变的大小,可以将卡通人脸图像分为写实风格和卡通风格,通常来说写实风格,结构基本不发生形变,卡通风格结构形变比较大;那么本申请提出的图像处理方案,可基于卡通定制的需求来挑选满足需求的标注卡通人脸图像Bi来进行模型训练,例如,挑选写实风格的标注卡通人脸图像Bi来进行模型训练,以使得训练好的目标图像处理模型满足写实风格的卡通定制需求,挑选卡通风格的标注卡通人脸图像Bi来进行模型训练,以使得训练好的目标图像处理模型满足卡通风格的卡通定制需求等,这样既保证了通用性,又可使得训练好的图像处理模型能够满足多种风格、多种类型的卡通定制的需求,提升训练好的图像处理模型针对卡通图像的生成质量。另外,用于模型训练的标注样本数据(即监督数据)的数量可以远小于非标注样本数据(即非监督数据)的数量,这就使得模型训练采用小样本、弱监督的方式,只需要少量(例如几百张)标注样本数据便可以训练出适用于卡通域空间的较佳的图像处理模型,从而生成较好的卡通图像效果;这种小样本、弱监督的方式解决了现有监督方案需要大量标注样本数据的痛点,同时本申请训练出来的图像处理模型还具有一定的通用性,适用于不同风格卡通图像的生成,解决了无监督方案无法实现风格定制的问题。
基于上述描述,请参见图2,图2示出了本申请一个示例性实施例提供的一种图像处理系统的架构示意图。如图2所示,该图像处理系统20包括终端201和服务器202。其中,终端201可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能车载、智能电视等,但并不局限于此。终端201可以支持各种应用程序的安装及运行,此处的应用程序可包括但不限于社交应用程序(例如即时通信应用程序、视频会话应用程序等)、音视频应用程序(例如音视频点播应用程序、音视频播放器等)、游戏应用程序等;服务器202可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器,本申请实施例在此不作限制。终端201与服务器202之间可以通过有线通信或者无线通信方式进行直接或间接地连接,本申请在此不做限制。
图像处理模型可以部署于终端201中,终端201采用样本数据对图像处理模型进行训练,得到训练好的目标图像处理模型,并使用该目标图像处理模型为用户实现诸如二次元定制服务、卡通定制服务等服务。图像处理模型也可以部署于服务器202中时,服务器202采用样本数据对图像处理模型进行训练,得到训练好的目标图像处理模型;终端201向服务器202发送服务获取请求,请求获得诸如二次元定制服务、卡通定制服务等服务,由服务器202基于目标图像处理模型对此服务获取请求进行响应。可以理解的是,图像处理模型也可以同时部署于终端201和服务器202中,例如服务器202采用样本数据对图像处理模型进行训练,得到训练好的目标图像处理模型之后,可以将目标图像处理模型同步给终端201,终端201使用该目标图像处理模型为用户实现诸如二次元定制服务、卡通定制服务等等。关于图像处理模型的训练过程可参见如下图3所示实施例的具体描述。
可以理解的是,本申请实施例描述的图像处理系统是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
请参见图3,图3示出了本申请一个示例性实施例提供的一种图像处理方法的流程示意图,该图像处理方法可以由图2所示的图像处理系统20中的终端201或服务器202执行,以终端201执行该图像处理方法为例,该图像处理方法包括以下步骤S301至步骤S304:
步骤S301,获取用于模型训练的样本数据。
用于模型训练的样本数据是从训练数据集中采样得到。图4示出了本申请一个示例性实施例提供的一种训练数据集的结构示意图;如图4所示,训练数据集包括标注真实人脸图像集A、标注卡通人脸图像集B及非标注真实人脸图像集C。其中,标注真实人脸图像集A中包括属于真人域空间的N个标注真实人脸图像;标注卡通人脸图像集B中包括属于卡通域空间的N个标注卡通人脸图像;N个标注真实人脸图像与N个标注卡通人脸图像一一配对,N为正整数。所谓配对是指标注真实人脸图像与配对的标注卡通人脸图像是属于两个不同空间但指代同一人的两个图像;具体地,标注真实人脸图像Ai是标注真实人脸图像集A中的任一个或多个标注真实人脸图像;标注卡通人脸图像Bi是标注卡通人脸图像集B中的一个或多个标注卡通人脸图像。设标注真实人脸图像Ai是某个用户在真实域空间中的图像,标注真实人脸图像Ai与标注卡通人脸图像Bi配对,则标注卡通人脸图像Bi则是同一用户在卡通域空间中的图像,标注真实人脸图像Ai与标注卡通人脸图像Bi均用于指代该用户。非标注真实人脸图像集C中包括属于所述真人域空间的M个非标注真实人脸图像,M为正整数。样本数据包括标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;非标注真实人脸图像Ci是非标注真实人脸图像集C中的任一个或多个非标注真实人脸图像,i为正整数且i≤N。在一种实现方式中,标注训练数据(即标注真实人脸图像集A、标注卡通人脸图像集B)的数量远小于非标注训练数据(即非标注真实人脸图像集C)的数量,即N<<M;此处的远小于可以是指:非标注训练数据的数量与标注训练数据的数量之间的差异可能跨越数量级,例如:非标注训练数据的数量为上万个,而标注训练数据的数量可能只有几百个;由于卡通域空间的标注训练数据通常需要进行绘制,成本较高,本申请设置N<<M,这就使得模型训练采用小样本、弱监督的方式,即只需要少量(例如几百张)标注样本数据就可以有效提升模型训练性能,训练出适用于卡通域空间的较佳的图像处理模型,从而生成较好的卡通图像效果;这种小样本、弱监督的方式解决了现有监督方案需要大量标注样本数据的痛点;另外,可基于卡通定制的需求来挑选满足需求的标注卡通人脸图像Bi来进行模型训练,这使得本申请训练出来的图像处理模型还具有一定的通用性,适用于不同风格卡通图像的生成,解决了无监督方案无法实现风格定制的问题。
步骤S302,调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C’i。
本申请实施例提及的图像处理模型可以是循环生成网络模型。图5示出了本申请一个示例性实施例提供的一种图像处理模型的训练过程的示意图,如图5所示,图像处理模型可以包括第一生成器503和第二生成器508;第一生成器503用于对图像进行转换处理,转换处理是指将真人域空间的图像转换至卡通域空间的处理;第二生成器508用于对图像进行逆转换处理,逆转换处理是指将卡通域空间的图像转换至真人域空间的处理。
如图5所示,调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i是指:调用第一生成器503对标注真实人脸图像Ai501进行转换处理,得到重构卡通人脸图像B'i502。调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i是指:调用第一生成器503对非标注真实人脸图像Ci506进行转换处理,得到重构卡通人脸图像B”i507。调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i是指:调用第二生成器508对重构卡通人脸图像B”i507进行逆转换处理,得到重构真实人脸图像C”i511。调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C'i是指:调用第二生成器508对标注卡通人脸图像Bi504进行逆转换处理,得到重构真实人脸图像C’i509。
步骤S303,根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失。
如图5所示,图像处理模型还可以包括第一判别器505和第二判别器510;第一判别器505用于对输入该第一判别器的图像进行判别处理,判别该图像是否属于卡通域空间,并输出判别结果,该判别结果用于指示该图像属于卡通域空间,或者用于指示该图像不属于卡通域空间;第二判别器510用于对输入该第二判别器的图像进行判别处理,判别该图像是否属于真人域空间,并输出判别结果,该判别结果用于指示该图像属于真人域空间,或者用于指示该图像不属于真人域空间。
下面结合图5对图像处理模型的第一损失、第二损失、第三损失以及第四损失分别进行介绍:
(1)图像处理模型的第一损失。
图像处理模型的第一损失包括以下至少一种:像素重构损失和视觉重构损失。
①像素重构损失。
像素重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在像素维度上的差异性。像素重构损失的具体计算方式如下:获取重构卡通人脸图像B'i的第一像素值,以及获取标注卡通人脸图像Bi的第二像素值;对第一像素值与第二像素值进行计算,得到第一像素值与第二像素值之间的像素差值;对像素差值的绝对值进行均值运算,得到重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的像素重构损失。上述计算过程可采用下述公式1表示:
上述公式1中,X表示真人域空间,Y表示卡通域空间,表示重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的像素重构损失;Ai表示标注真实人脸图像Ai,Ai~A表示标注真实人脸图像Ai属于标注真实人脸图像集A;Bi表示标注卡通人脸图像Bi,Bi~B表示标注卡通人脸图像Bi属于标注真实卡通人脸图像集B;P(Bi)表示标注卡通人脸图像Bi的第二像素值;GXY表示第一生成器,GXY(Ai)表示调用第一生成器对标注真实人脸图像Ai进行转换处理得到的重构卡通人脸图像B'i,P(GXY(Ai))表示重构卡通人脸图像B'i的第一像素值;E表示均值运算。
②视觉重构损失。
视觉重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在视觉维度上的差异性。视觉重构损失的具体计算方式如下:提取重构卡通人脸图像B’i的第一视觉特征值,以及提取标注卡通人脸图像Bi的第二视觉特征值;对第一视觉特征值与第二视觉特征值进行计算,得到第一视觉特征值与第二视觉特征值之间的视觉特征差值;对视觉特征差值的绝对值进行均值运算,得到重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的视觉重构损失。上述计算过程可采用下述公式2表示:
上述公式2中,X表示真人域空间,Y表示卡通域空间,表示重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的视觉重构损失;Ai表示标注真实人脸图像Ai,Ai~A表示标注真实人脸图像Ai属于标注真实人脸图像集A,Bi表示标注卡通人脸图像Bi,Bi~B表示标注卡通人脸图像Bi属于标注真实卡通人脸图像集B;Evgg(Bi)表示调用特征提取模型提取到的标注卡通人脸图像Bi的第二视觉特征值,本申请实施例提及的特征提取模型可以是VGG(Visual Geometry Group Network,视觉几何组网络)模型;GXY表示第一生成器,GXY(Ai)表示调用第一生成器对标注真实人脸图像Ai进行转换处理得到的重构卡通人脸图像B'i;Evgg(GXY(Ai))表示调用特征提取模型提取到的重构卡通人脸图像B’i的第一视觉特征值;E表示均值运算。
基于此,图像处理模型的第一损失可包括标注真实人脸图像Ai对应的重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在像素维度上差异性、在视觉维度上的差异性,图像处理模型的第一损失能够在图像处理模型的训练过程中对图像卡通域空间的结构形变进行强约束,提升模型性能。
(2)图像处理模型的第二损失。
图像处理模型的第二损失用于衡量第一判别器的对抗损失。图像处理模型的第二损失包括以下至少一种:根据重构卡通人脸图像B'i与标注卡通人脸图像Bi获取到的第一对抗损失、根据重构卡通人脸图像B”i与标注卡通人脸图像Bi获取到的第二对抗损失。
①第一对抗损失。
根据重构卡通人脸图像B'i与标注卡通人脸图像Bi获取第一对抗损失的具体实施方式可以为:调用第一判别器对重构卡通人脸图像B’i进行判别处理,得到第一判别结果;调用第一判别器对标注卡通人脸图像Bi进行判别处理,得到第三判别结果;根据第一判别结果和第三判别结果,计算第一对抗损失。上述计算过程可采用下述公式3表示:
上述公式3中,X表示真人域空间,Y表示卡通域空间,表示根据重构卡通人脸图像B'i与标注卡通人脸图像Bi获取到的第一对抗损失;Bi表示标注卡通人脸图像Bi,Bi~B表示标注卡通人脸图像Bi属于标注真实卡通人脸图像集B;DY表示第一判别器,DY(Bi)表示调用第一判别器对标注卡通人脸图像Bi进行判别处理得到的第三判别结果;Ai表示标注真实人脸图像Ai,Ai~A表示标注真实人脸图像Ai属于标注真实人脸图像集A;GXY表示第一生成器,GXY(Ai)表示调用第一生成器对标注真实人脸图像Ai进行转换处理得到的重构卡通人脸图像B'i;DY(GXY(Ai))表示调用第一判别器对重构卡通人脸图像B’i进行判别处理得到的第一判别结果;E表示均值运算。
②第二对抗损失。
根据重构卡通人脸图像B”i与标注卡通人脸图像Bi获取第二对抗损失的具体实施方式可以为:调用第一判别器对重构卡通人脸图像B”i进行判别处理,得到第二判别结果;调用第一判别器对标注卡通人脸图像Bi进行判别处理,得到第三判别结果;根据第二判别结果和第三判别结果,计算第二对抗损失。上述计算过程可采用下述公式4表示:
上述公式4中,X表示真人域空间,Y表示卡通域空间,表示根据重构卡通人脸图像B”i与标注卡通人脸图像Bi获取到的第二对抗损失;Bi表示标注卡通人脸图像Bi,Bi~B表示标注卡通人脸图像Bi属于标注真实卡通人脸图像集B;DY表示第一判别器,DY(Bi)表示调用第一判别器对标注卡通人脸图像Bi进行判别处理得到的第三判别结果;Ci表示非标注真实人脸图像Ci,Ci~C表示非标注真实人脸图像Ci属于非标注真实人脸图像集C;GXY表示第一生成器,GXY(Ci)表示调用第一生成器对非标注真实人脸图像Ci进行转换处理得到的重构卡通人脸图像B”i;DY(GXY(Ci))标识调用第一判别器对重构卡通人脸图像B”i进行判别处理得到的第二判别结果;E表示均值运算。
(3)图像处理模型的第三损失。
图像处理模型的第三损失用于衡量第二判别器的对抗损失。根据非标注真实人脸图像Ci与重构真实人脸图像C'i获取图像处理模型的第三损失的具体实施方式可以为:调用第二判别器对重构真实人脸图像C’i进行判别处理,得到第四判别结果;调用第二判别器对非标注真实人脸图像Ci进行判别处理,得到第五判别结果;根据第四判别结果和第五判别结果,计算第三损失。上述计算过程可采用下述公式5表示:
上述公式5中,X表示真人域空间,Y表示卡通域空间,表示图像处理模型的第三损失;Ci表示非标注真实人脸图像Ci,Ci~C表示非标注真实人脸图像Ci属于非标注真实人脸图像集C;Bi表示标注卡通人脸图像Bi,Bi~B表示标注卡通人脸图像Bi属于标注真实卡通人脸图像集B;GYX表示第二生成器,GYX(Bi)表示调用第二生成器对标注卡通人脸图像Bi进行逆转换处理得到的重构真实人脸图像C’i;DX表示第二判别器,DX(GYX(Bi))表示调用第二判别器对重构真实人脸图像C'i进行判别处理得到的第四判别结果,DX(Ci)表示调用第二判别器对非标注真实人脸图像Ci进行判别处理得到的第五判别结果;E表示均值运算。
(4)图像处理模型的第四损失。
图像处理模型的第四损失用于衡量第一生成器与第二生成器的循环一致性损失。根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性获取图像处理模型的第四损失的具体计算方式可采用下述公式6表示:
上述公式6中,X表示真人域空间,Y表示卡通域空间,表示图像处理模型的第四损失;Ci表示非标注真实人脸图像Ci,Ci~C表示非标注真实人脸图像Ci属于非标注真实人脸图像集C;GXY表示第一生成器,GXY(Ci)表示调用第一生成器对非标注真实人脸图像Ci进行转换处理得到的重构卡通人脸图像B”i;GYX表示第二生成器,GYX(GXY(Ci))表示调用第二生成器对重构卡通人脸图像B”i进行逆转换处理得到的重构真实人脸图像C”i;E表示均值运算。
步骤S504,基于第一损失、第二损失、第三损失和第四损失,更新图像处理模型的参数以训练图像处理模型。
终端基于第一损失、第二损失、第三损失和第四损失,构建图像处理模型的损失函数,并按照最小化损失函数的值的原则,更新图像处理模型的参数以训练图像处理模型;最小化损失函数的值的原则可以是指损失函数的值小于损失函数阈值,损失函数阈值可以时根据经验设定的一个经验值;或者,最小化损失函数的值的原则还可以是指损失函数的值到达极限值(例如0值或最小值)时停止训练。如图5所示的训练过程中,图像处理模型的损失函数可采用下述公式7表示:
上述公式7中,图像处理模型的损失函数Loss是图像处理模型的第一损失(包括重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的像素重构损失重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的视觉重构损失)、图像处理模型的第二损失(包括第一对抗损失第二对抗损失)、图像处理模型的第三损失()、图像处理模型的第四损失(循环一致损失)的和。
终端从训练数据集中循环采样出用于模型训练的样本数据,并采用样本数据对图像处理模型进行迭代训练,得到训练好的目标图像处理模型。例如,在第一次训练中,终端从训练数据集中采样出的用于模型训练的样本数据包括标注真实人脸图像A1、与标注真实人脸图像A1相匹配的标注卡通人脸图像B1,以及非标注真实人脸图像C1,终端采用该样本数据对图像处理模型进行训练,更新图像处理模型的参数,得到第一图像处理模型;在第二次训练中,终端从训练数据集中采样出的用于模型训练的样本数据包括标注真实人脸图像A2、与标注真实人脸图像A2相匹配的标注卡通人脸图像B2,以及非标注真实人脸图像C2,终端采用该样本数据对第一图像处理模型进行训练,更新第一图像处理模型的参数,得到第二图像处理模型;以此类推,终端从训练数据集中循环采样出用于模型训练的样本数据,并采用样本数据对图像处理模型进行迭代训练,直到图像处理模型的损失函数的值小于损失函数阈值,或图像处理模型的损失函数的值到达极限值(例如0值,或最小值)时停止训练,此时训练得到的图像处理模型即为训练好的目标图像处理模型。
终端对图像处理模型进行训练,得到训练好的目标图像处理模型之后,当终端接收到待处理的目标真实人脸图像时,调用目标图像处理模型对目标真实人脸图像进行转换处理,得到目标真实人脸图像对应的重构卡通人脸图像。目标真实人脸图像可以是即时通信场景中的用户的真实人脸表情图像、用户的真实人脸头像;目标真实人脸图像还可以是视频会话场景中的目标真实人脸视频中的任一个真实人脸视频帧。
本申请实施例中,用于进行模型训练的样本数据包括标注样本数据(即标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi)和非标注样本数据(即非标注真实人脸图像Ci),采用标注样本数据(即监督数据)和非标注样本数据(即非监督数据)形成的混合数据对图像处理模型进行训练,在保证样本数据量的情况下,降低训练成本,提升模型训练性能;此外,用于模型训练的样本数据是从训练数据集中采样得到,训练数据集包括标注训练数据(即标注真实人脸图像集A、标注卡通人脸图像集B)和非标注训练数据(即非标注真实人脸图像集C),并且标注训练数据(即监督数据)的数量远小于非标注训练数据(即非监督数据)的数量,这既能降低对监督数据的强依赖性,降低训练成本,又可有效保证样本数据量,保证模型训练的效果。另外,图像处理模型能够将标注真实人脸图像Ai转换为重构卡通人脸图像B'i,将非标注真实人脸图像Ci转换为重构卡通人脸图像B”i,将重构卡通人脸图像B”i逆转换为重构真实人脸图像C”i,以及将标注卡通人脸图像Bi逆转换为重构真实人脸图像C'i;并根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失;通过图像处理模型的第一损失来训练图像处理模型更新图像处理模型的参数,能够在图像处理模型的训练过程中对卡通域空间的结构形变进行强约束,这既能有效提升模型训练性能,又可保证训练好的图像处理模型具备通用性及满足卡通定制的需求,提升训练好的图像处理模型针对卡通图像的生成质量。
训练好的目标图像处理模型可以应用于各种互联网场景中,当在这些互联网场景中接收到待处理的目标真实人脸图像时,训练好的目标图像处理模型可以对目标真实人脸图像进行转换处理,得到目标真实人脸图像对应的重构卡通人脸图像。此处的互联网场景可包括但不限于即时通信场景、视频会话场景等等。
下面结合图6和图7,对目标图像处理模型的应用场景进行介绍。
图6示出了本申请实施例提供的图像处理方案在即时通信场景下的处理流程。请参见图6,目标图像处理模型部署于终端201中,终端201基于目标图像处理模型在即时通信场景下的处理流程包括步骤S601至步骤S604:
步骤S601,显示即时通信应用程序的即时通信会话页面。
即时通信应用程序是指终端中安装并运行的任一个用于进行即时通信交流的应用程序,该即时通信应用程序可包括但不限于QQ、微信等等。即时通信应用程序中可以包括多个服务页面,例如,即时通信应用程序包括即时通信功能页面、配置服务页面、即时通信会话页面、图像处理页面等等。图6中的即时通信会话页面60是即时通信应用程序中的一个服务页面,即时通信应用程序的即时通信会话页面显示于终端中,即时通信会话页面中包含图像处理入口(例如图6中的图像处理入口601)。
步骤S602,若图像处理入口被选中,则显示图像处理页面。
若图像处理入口被选中(例如终端用户点击图6中的图像处理入口601),终端显示图像处理页面(例如图6所示的图像处理页面61),图像处理页面是即时通信应用程序中除即时通信会话页面之外的另一个服务页面;图像处理页面中包括至少一个卡通风格选项(例如图6中的风格1、风格2、风格3和风格4),每一个卡通风格选项对应一种卡通风格,也就是说,终端可以将目标真实人脸图像转换成多种卡通风格的重构卡通人脸图像。
步骤S603,若图像处理选项被选中,则调用图像采集应用程序采集目标真实人脸图像,并调用目标图像处理模型对目标真实人脸图像进行处理,得到目标真实人脸图像对应的重构卡通人脸图像。
图像处理页面中还包括图像处理选项(例如图6中的图像处理选项602),若图像处理选项被选中(例如终端用户点击图6中的图像处理选项602),终端调用图像采集应用程序(例如相机应用程序)采集目标真实人脸图像(例如图6中的目标真实人脸图像603),并调用目标图像处理模型对目标真实人脸图像进行处理,得到目标真实人脸图像对应的重构卡通人脸图像(例如图6中的重构卡通人脸图像604),重构卡通人脸图像显示于图像处理页面中;图像采集应用程序是终端中安装并运行的除即时通信应用程序之外的另一个应用程序。
目标真实人脸图像可以是采集到的终端用户的真实人脸表情图像,终端调用目标图像处理模型对终端用户的真实人脸表情图像进行处理,处理得到的重构卡通人脸图像可以是终端用户的卡通人脸表情图像;也就是说,目标图像处理模型可以将终端用户的真实人脸表情图像转换为终端用户的卡通人脸表情图像。目标真实人脸图像还可以是采集到的终端用户的真实人脸头像,终端调用目标图像处理模型对终端用户的真实人脸头像进行处理,处理得到的重构卡通人脸图像可以是终端用户的卡通人脸头像;也就是说,目标图像处理模型可以将终端用户的真实人脸头像转换为终端用户的卡通人脸头像。
步骤S604,若确认标识被选中,则在即时通信应用程序的即时通信会话页面中显示重构卡通人脸图像。
图像处理页面中还包括确认标识(例如图6中的确认标识605),若确认标识被选中(例如终端用户点击图6中的确认标识605),终端在即时通信应用程序的即时通信会话页面中显示重构人脸图像。
可以理解的是,目标图像处理模型还可以部署于服务器202中,当目标图像处理模型部署于服务器202时,与图6所示实施例中步骤S603所描述的内容的区别在于:若图像处理选项被选中,终端调用图像采集应用程序采集目标真实人脸图像,终端向服务器发送服务获取请求,服务获取请求中携带采集到的目标真实人脸图像;服务器响应服务获取请求,调用目标图像处理模型对目标真实人脸图像进行处理,得到目标真实人脸图像对应的重构卡通人脸图像,并将处理得到的重构卡通人脸图像发送至终端。其他步骤与图6所示实施例相同,在此不再赘述。
本申请实施例中,在即时通信场景下可以调用目标图像处理模型对采集到的目标真实人脸图像进行处理,得到目标真实人脸图像对应的重构卡通人脸图像,并在即时通信应用程序的即时通信会话页面中显示该重构卡通人脸图像,满足即时通信场景下的图像处理需求以及图像互动需求,提升图像处理效率,提升生成的重构卡通人脸图像的质量;此外,图像处理页面中提供至少一个卡通风格选项,目标真实人脸图像可以被定制为多种不同风格的重构卡通人脸图像,满足即时通信场景下的图像定制需求。
图7示出了本申请实施例提供的图像处理方案在视频会话场景下的处理流程请参见图7,目标图像处理模型部署于终端201中,图像处理方案在视频会话场景下的处理流程包括步骤S701至步骤S703:
步骤S701,显示视频会话应用程序的视频会话页面。
视频会话应用程序是终端中安装并运行的一个应用程序,视频会话应用程序中可以包括多个服务页面,视频会话页面(例如图7中的视频会话页面70)是视频会话应用程序中的一个服务页面,例如,视频会话应用程序包括视频会话功能页面、配置服务页面、视频会话页面等等;在进行视频会话的过程中,视频会话应用程序的视频会话页面显示于终端中;视频会话页面中包含正在进行视频会话的多个视频窗口(例如图7所示的第一视频窗口701和第二视频窗口702,第一视频窗口701用于显示发起视频会话的终端用户的第一实时会话视频,第二视频窗口用于显示响应视频会话的终端用户的第二实时会话视频,视频会话页面中还包括视频处理选项(例如图7中的视频处理选项703)。
步骤S702,若视频处理选项被选中,则在视频会话中采集目标真实人脸视频,并调用目标图像处理模型对目标真实人脸视频中的每个真实人脸视频帧进行处理,得到目标真实人脸视频对应的重构卡通人脸视频。
在一种实现方式中,若视频处理选项被选中(例如终端用户点击图7中的视频处理选项703),终端在视频会话中采集目标真实人脸视频,目标真实人脸视频可以包括第一实时会话视频,第一实时会话视频中包括多个真实人脸视频帧;终端调用目标图像处理模型对每个真实人脸视频帧进行处理,得到每个真实人脸视频帧对应的重构卡通人脸视频帧,多个真实人脸视频帧对应的重构卡通人脸视频帧组成重构卡通人脸视频。视频会话页面中还包括至少一个卡通风格选项(例如图4中的风格1、风格2和风格3),每一个卡通风格选项对应一种卡通风格,也就是说终端可以将目标真实人脸视频转换为多种风格的重构卡通人脸视频。在一种实现方式中,若视频处理选项再次被选中(例如终端用户点击图7中的视频处理选项703后,间隔目标时间段(例如1分钟)后再次点击视频处理选项703),终端停止采集目标真实人脸视频、停止对目标真实人脸视频进行处理。在此实现方式中,终端可以调用目标图像处理模型对发起视频会话的终端用户的实时会话视频进行处理,满足视频会话场景下的视频处理需求,提升视频处理效率,提升生成的重构卡通人脸视频的质量。
在另一种实现方式中,若视频处理选项被选中(例如终端用户点击图7中的视频处理选项703),终端在视频会话中采集目标真实人脸视频,目标真实人脸视频可以包括第一实时会话视频和第二实时会话视频,第一实时会话视频中包括多个第一真实人脸视频帧,第二实时会话视频中包括多个第二真实人脸视频帧;终端调用目标图像处理模型对每个第一真实人脸视频帧进行处理,得到每个第一真实人脸视频帧对应的第一重构卡通人脸视频帧,多个第一真实人脸视频帧对应的第一重构卡通人脸视频帧组成第一重构卡通人脸视频;终端调用目标图像处理模型对每个第二真实人脸视频帧进行处理,得到每个第二真实人脸视频帧对应的第二重构卡通人脸视频帧,多个第二真实人脸视频帧对应的第二重构卡通人脸视频帧组成第二重构卡通人脸视频。在此实现方式中,终端可以调用目标图像处理模型对参与视频会话的多个终端用户(包括发起视频会话的终端用户和至少一个响应视频会话的终端用户)的实时会话视频进行处理,满足视频会话场景下的视频处理需求以及互动需求,提升生成的重构卡通人脸视频的质量。
步骤S703,在视频会话页面中实时显示重构卡通真实人脸视频。
在一种实现方式中,若目标真实人脸视频包括第一实时会话视频,则终端在视频会话页面的第一视频窗口701中实时显示第一实时会话视频对应的重构卡通人脸视频。在另一种实现方式中,若目标真实人脸视频包括第一实时会话视频和第二实时会话视频,则终端在视频会话页面的第一视频窗口701中实时显示第一实时会话视频对应的第一重构卡通人脸视频,在视频会话页面的第二视频窗口702中实时显示第二实时会话视频对应的第二重构卡通人脸视频。
可以理解的是,目标图像处理模型还可以部署于服务器202中,当目标图像处理模型部署于服务器202时,与图7所示实施例中步骤S702所描述的内容的区别在于:若视频处理选项被选中,终端在视频会话中采集目标真实人脸视频,并将采集到的目标真实人脸视频发送至服务器;服务器调用目标图像处理模型对目标真实人脸视频中的每个真实人脸视频帧进行处理,得到目标真实人脸视频对应的重构卡通人脸视频,并将处理得到的重构卡通人脸视频发送至终端。其他步骤与图7所示实施例相同,在此不再赘述。
本申请实施例中,在视频会话场景下可以调用目标图像处理模型对采集到的目标真实人脸视频中的每个真实人脸视频帧进行处理,得到目标真实人脸视频对应的重构卡通人脸视频,并在视频会话应用程序的视频会话页面中实时显示该重构卡通人脸视频,满足视频会话场景下的视频处理需求,提升视频处理效率,提升生成的重构卡通人脸视频的质量;此外,视频会话页面中提供至少一个卡通风格选项,目标真实人脸视频可以被定制为多种不同风格的重构卡通人脸视频,满足视频会话场景下的视频会话互动需求。
请参见图8,图8示出了本申请一个示例性实施例提供的一种图像处理装置的结构示意图,该图像处理装置80可以用于执行图3、图6或图7所示的图像处理方法中的相应步骤,该图像处理装置80包括如下单元:
获取单元801,用于获取用于模型训练的样本数据,样本数据包括标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;
处理单元802,用于调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C'i;
获取单元801,还用于根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性获取图像处理模型的第四损失;
处理单元802,还用于基于第一损失、第二损失、第三损失和第四损失,更新图像处理模型的参数以训练图像处理模型。
在一种实现方式中,获取单元801具体用于:
获取训练数据集,并从训练数据集中采样出用于模型训练的样本数据;
其中,训练数据集包括标注真实人脸图像集A、标注卡通人脸图像集B及非标注真实人脸图像集C;标注真实人脸图像集A中包括属于真人域空间的N个标注真实人脸图像;标注卡通人脸图像集B中包括属于卡通域空间的N个标注卡通人脸图像;N个标注真实人脸图像与N个标注卡通人脸图像一一配对;非标注真实人脸图像集C中包括属于真人域空间的M个非标注真实人脸图像,M、N均为正整数,且N<<M;
标注真实人脸图像Ai是标注真实人脸图像集A中的任一个或多个图像;标注卡通人脸图像Bi是标注卡通人脸图像集B中的一个或多个图像;非标注真实人脸图像Ci是非标注真实人脸图像集C中的任一个或多个图像,i为正整数且i≤N。
在一种实现方式中,图像处理模型包括第一生成器;处理单元802具体用于:
调用第一生成器对标注真实人脸图像Ai进行转换处理,得到重构卡通人脸图像B'i;以及调用第一生成器对非标注真实人脸图像Ci进行转换处理,得到重构卡通人脸图像B”i;
其中,转换处理是指将真人域空间的图像转换至卡通域空间的处理。
在一种实现方式中,图像处理模型包括第二生成器;处理单元802具体用于:
调用第二生成器对重构卡通人脸图像B”i进行逆转换处理,得到重构真实人脸图像C”i;以及调用第二生成器对标注卡通人脸图像Bi进行逆转换处理,得到重构真实人脸图像C'i;
其中,逆转换处理是指将卡通域空间的图像转换至真人域空间的处理。
在一种实现方式中,第一损失包括像素重构损失和视觉重构损失中的至少一种;像素重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在像素维度上的差异性;视觉重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在视觉维度上的差异性;图像处理模型包括第一生成器和第二生成器,第四损失用于衡量第一生成器与第二生成器的循环一致性损失。
在一种实现方式中,获取单元801具体用于:
获取重构卡通人脸图像B'i的第一像素值,以及获取标注卡通人脸图像Bi的第二像素值;
对第一像素值与第二像素值进行计算,得到第一像素值与第二像素值之间的像素差值;
对像素差值进行均值运算,得到像素重构损失。
在一种实现方式中,获取单元具体用于:
提取重构卡通人脸图像B'i的第一视觉特征值,以及提取标注卡通人脸图像Bi的第二视觉特征值;
对第一视觉特征值与第二视觉特征值进行计算,得到第一视觉特征值与第二视觉特征值之间的视觉特征差值;
对视觉特征差值进行均值运算,得到视觉重构损失。
在一种实现方式中,图像处理模型包括第一判别器;获取单元801具体用于:
调用第一判别器对重构卡通人脸图像B'i进行判别处理,得到第一判别结果;调用重构卡通人脸图像B”i进行判别处理,得到第二判别结果;以及,调用第一判别器对标注卡通人脸图像Bi进行判别处理,得到第三判别结果;
根据第一判别结果、第二判别结果及第三判别结果,计算第二损失;第二损失用于衡量第一判别器的对抗损失。
在一种实现方式中,图像处理模型包括第二判别器;获取单元802具体用于:
调用第二判别器对重构真实人脸图像C'i进行判别处理,得到第四判别结果;以及调用第二判别器对非标注真实人脸图像Ci进行判别处理,得到第五判别结果;
根据第四判别结果和第五判别结果,计算第三损失;该第三损失用于衡量第二判别器的对抗损失。
在一种实现方式中,处理单元802具体用于:
基于第一损失、第二损失、第三损失和第四损失,构建图像处理模型的损失函数;
按照最小化损失函数的值的原则,更新图像处理模型的参数以训练图像处理模型。
在一种实现方式中,获取单元801还用于:从训练数据集中循环采样出用于模型训练的样本数据,并采用样本数据对图像处理模型进行迭代训练,得到训练好的目标图像处理模型。
在一种实现方式中,处理单元802还用于:当接收到待处理的目标真实人脸图像时,调用目标图像处理模型对目标真实人脸图像进行转换处理,得到目标真实人脸图像对应的重构卡通人脸图像。
根据本申请的一个实施例,图8所示的图像处理装置80中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,该图像处理装置80也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。根据本申请的另一个实施例,可以通过在包括例如中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的通用计算机的通用计算设备上运行能够执行如图3、图6或图7中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图8中所示的图像处理装置80,以及来实现本申请实施例的图像处理方法。计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质装载于图2所示图像处理系统的终端201或服务器202中,并在其中运行。
本申请实施例中,用于进行模型训练的样本数据包括标注样本数据(即标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi)和非标注样本数据(即非标注真实人脸图像Ci),采用标注样本数据(即监督数据)和非标注样本数据(即非监督数据)形成的混合数据对图像处理模型进行训练,在保证样本数据量的情况下,降低训练成本,提升模型训练性能;此外,图像处理模型能够将标注真实人脸图像Ai转换为重构卡通人脸图像B'i,将非标注真实人脸图像Ci转换为重构卡通人脸图像B”i,将重构卡通人脸图像B”i逆转换为重构真实人脸图像C”i,以及将标注卡通人脸图像Bi逆转换为重构真实人脸图像C'i;并通过重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的第一差异性、重构卡通人脸图像B”i与标注卡通人脸图像Bi之间的第二差异性,非标注真实人脸图像Ci与重构真实人脸图像C”i之间的第三差异性,以及重构真实人脸图像C'i与非标注真实人脸图像Ci之间的第四差异性来训练该图像处理模型;通过重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的第一差异性更新图像处理模型的参数,能够在图像处理模型的训练过程中对卡通域空间的结构形变进行强约束,这既能有效提升模型训练性能,又可保证训练好的图像处理模型具备通用性及满足卡通定制的需求,提升训练好的图像处理模型针对卡通图像的生成质量。
请参见图9,图9示出了本申请一个示例性实施例提供的一种图像处理设备的结构示意图,该图像处理设备90至少包括处理器901以及计算机可读存储介质902。其中,处理器901以及计算机可读存储介质902可通过总线或者其它方式连接。计算机可读存储介质902可以存储在存储器中,计算机可读存储介质902用于存储计算机程序,计算机程序包括计算机指令,处理器901用于执行计算机可读存储介质902存储的计算机指令。处理器901(或称CPU(CentralPro cessingUnit,中央处理器))是图像处理设备90的计算核心以及控制核心,其适于实现一条或多条计算机指令,具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。
本申请实施例还提供了一种计算机可读存储介质(Memory),计算机可读存储介质是图像处理设备90中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质902既可以包括图像处理设备90中的内置存储介质,当然也可以包括图像处理设备90所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了图像处理设备90的操作系统。并且,在该存储空间中还存放了适于被处理器901加载并执行的一条或多条的计算机指令,这些计算机指令可以是一个或多个的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质902可以是高速RAM存储器,也可以是非不稳定的存储器(Non-VolatileMemory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器901的计算机可读存储介质。
在一种实现方式中,该图像处理设备90可以是图2所示的图像处理系统中的终端201或服务器202;该计算机可读存储介质902中存储有计算机指令;由处理器901加载并执行计算机可读存储介质902中存放的计算机指令,以实现图3、图6或图7所示方法实施例中的相应步骤;具体实现中,计算机可读存储介质902中的计算机指令由处理器901加载并执行如下步骤:
获取用于模型训练的样本数据,样本数据包括标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;
调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;并调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C'i;
根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失;
基于第一损失、第二损失、第三损失和第四损失,更新图像处理模型的参数以训练图像处理模型。
在一种实现方式中,计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
获取训练数据集,并从训练数据集中采样出用于模型训练的样本数据;
其中,训练数据集包括标注真实人脸图像集A、标注卡通人脸图像集B及非标注真实人脸图像集C;标注真实人脸图像集A中包括属于真人域空间的N个标注真实人脸图像;标注卡通人脸图像集B中包括属于卡通域空间的N个标注卡通人脸图像;N个标注真实人脸图像与N个标注卡通人脸图像一一配对;非标注真实人脸图像集C中包括属于真人域空间的M个非标注真实人脸图像,M、N均为正整数,且N<<M;
标注真实人脸图像Ai是标注真实人脸图像集A中的任一个或多个图像;标注卡通人脸图像Bi是标注卡通人脸图像集B中的一个或多个图像;非标注真实人脸图像Ci是非标注真实人脸图像集C中的任一个或多个图像,i为正整数且i≤N。
在一种实现方式中,图像处理模型包括第一生成器;计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
调用图像处理模型对标注真实人脸图像Ai进行转换处理,得到标注真实人脸图像Ai对应的重构卡通人脸图像B'i,包括:调用第一生成器对标注真实人脸图像Ai进行转换处理,得到重构卡通人脸图像B'i;
调用图像处理模型对非标注真实人脸图像Ci进行转换处理,得到非标注真实人脸图像Ci对应的重构卡通人脸图像B”i,包括:调用第一生成器对非标注真实人脸图像Ci进行转换处理,得到重构卡通人脸图像B”i;
其中,转换处理是指将真人域空间的图像转换至卡通域空间的处理。
在一种实现方式中,图像处理模型包括第二生成器;计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
调用图像处理模型对重构卡通人脸图像B”i进行逆转换处理,得到非标注真实人脸图像Ci对应的重构真实人脸图像C”i,包括:调用第二生成器对重构卡通人脸图像B”i进行逆转换处理,得到重构真实人脸图像C”i;
调用图像处理模型对标注卡通人脸图像Bi进行逆转换处理,得到标注卡通人脸图像Bi对应的重构真实人脸图像C'i,包括:调用第二生成器对标注卡通人脸图像Bi进行逆转换处理,得到重构真实人脸图像C'i;
其中,逆转换处理是指将卡通域空间的图像转换至真人域空间的处理。
在一种实现方式中,第一损失包括像素重构损失和视觉重构损失中的至少一种;
像素重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在像素维度上的差异性;视觉重构损失用于衡量重构卡通人脸图像B'i与标注卡通人脸图像Bi之间在视觉维度上的差异性;
图像处理模型包括第一生成器和第二生成器,第四损失用于衡量第一生成器与第二生成器的循环一致性损失。
在一种实现方式中,图像处理模型包括第一判别器;计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
获取重构卡通人脸图像B'i的第一像素值,以及获取标注卡通人脸图像Bi的第二像素值;
对第一像素值与第二像素值进行计算,得到第一像素值与第二像素值之间的像素差值;
对像素差值进行均值运算,得到像素重构损失。
在一种实现方式中,计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
提取重构卡通人脸图像B'i的第一视觉特征值,以及提取标注卡通人脸图像Bi的第二视觉特征值;
对第一视觉特征值与第二视觉特征值进行计算,得到第一视觉特征值与第二视觉特征值之间的视觉特征差值;
对视觉特征差值进行均值运算,得到视觉重构损失。
在一种实现方式中,图像处理模型包括第一判别器;计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
调用第一判别器对重构卡通人脸图像B'i进行判别处理,得到第一判别结果;调用重构卡通人脸图像B”i进行判别处理,得到第二判别结果;以及,调用第一判别器对标注卡通人脸图像Bi进行判别处理,得到第三判别结果;
根据第一判别结果、第二判别结果及第三判别结果,计算第二损失;第二损失用于衡量第一判别器的对抗损失。
在一种实现方式中,图像处理模型包括第二判别器;计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
调用第二判别器对重构真实人脸图像C'i进行判别处理,得到第四判别结果;以及调用第二判别器对非标注真实人脸图像Ci进行判别处理,得到第五判别结果;
根据第四判别结果和第五判别结果,计算第三损失;第三损失用于衡量第二判别器的对抗损失。
在一种实现方式中,计算机可读存储介质902中的计算机指令由处理器901加载具体执行如下步骤:
基于第一损失、第二损失、第三损失和第四损失,构建图像处理模型的损失函数;
按照最小化损失函数的值的原则,更新图像处理模型的参数以训练图像处理模型。
在一种实现方式中,计算机可读存储介质902中的计算机指令由处理器901加载还执行如下步骤:从训练数据集中循环采样出用于模型训练的样本数据,并采用样本数据对图像处理模型进行迭代训练,得到训练好的目标图像处理模型。
在一种实现方式中,计算机可读存储介质902中的计算机指令由处理器901加载还执行如下步骤:当接收到待处理的目标真实人脸图像时,调用目标图像处理模型对目标真实人脸图像进行转换处理,得到目标真实人脸图像对应的重构卡通人脸图像。
本申请实施例中,用于进行模型训练的样本数据包括标注样本数据(即标注真实人脸图像Ai、与标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi)和非标注样本数据(即非标注真实人脸图像Ci),采用标注样本数据(即监督数据)和非标注样本数据(即非监督数据)形成的混合数据对图像处理模型进行训练,在保证样本数据量的情况下,降低训练成本,提升模型训练性能;此外,用于模型训练的样本数据是从训练数据集中采样得到,训练数据集包括标注训练数据(即标注真实人脸图像集A、标注卡通人脸图像集B)和非标注训练数据(即非标注真实人脸图像集C),并且标注训练数据(即监督数据)的数量远小于非标注训练数据(即非监督数据)的数量,这既能降低对监督数据的强依赖性,降低训练成本,又可有效保证样本数据量,保证模型训练的效果。另外,图像处理模型能够将标注真实人脸图像Ai转换为重构卡通人脸图像B'i,将非标注真实人脸图像Ci转换为重构卡通人脸图像B”i,将重构卡通人脸图像B”i逆转换为重构真实人脸图像C”i,以及将标注卡通人脸图像Bi逆转换为重构真实人脸图像C'i;并根据重构卡通人脸图像B'i与标注卡通人脸图像Bi之间的差异性获取图像处理模型的第一损失;根据重构卡通人脸图像B'i、重构卡通人脸图像B”i及标注卡通人脸图像Bi,获取图像处理模型的第二损失;根据非标注真实人脸图像Ci与重构真实人脸图像C'i,获取图像处理模型的第三损失;以及根据非标注真实人脸图像Ci与重构真实人脸图像C”i之间的差异性,获取图像处理模型的第四损失;通过图像处理模型的第一损失来训练图像处理模型更新图像处理模型的参数,能够在图像处理模型的训练过程中对卡通域空间的结构形变进行强约束,这既能有效提升模型训练性能,又可保证训练好的图像处理模型具备通用性及满足卡通定制的需求,提升训练好的图像处理模型针对卡通图像的生成质量。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选方式中提供的图像处理方法。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (15)
1.一种图像处理方法,其特征在于,所述方法包括:
获取用于模型训练的样本数据,所述样本数据包括标注真实人脸图像Ai、与所述标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;
调用图像处理模型对所述标注真实人脸图像Ai进行转换处理,得到所述标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用所述图像处理模型对所述非标注真实人脸图像Ci进行转换处理,得到所述非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;并调用所述图像处理模型对所述重构卡通人脸图像B”i进行逆转换处理,得到所述非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用所述图像处理模型对所述标注卡通人脸图像Bi进行逆转换处理,得到所述标注卡通人脸图像Bi对应的重构真实人脸图像C'i;
根据所述重构卡通人脸图像B'i与所述标注卡通人脸图像Bi之间的差异性获取所述图像处理模型的第一损失;根据所述重构卡通人脸图像B'i、所述重构卡通人脸图像B”i及所述标注卡通人脸图像Bi,获取所述图像处理模型的第二损失;根据所述非标注真实人脸图像Ci与所述重构真实人脸图像C'i,获取所述图像处理模型的第三损失;以及根据所述非标注真实人脸图像Ci与所述重构真实人脸图像C”i之间的差异性,获取所述图像处理模型的第四损失;
基于所述第一损失、所述第二损失、所述第三损失和所述第四损失,更新所述图像处理模型的参数以训练所述图像处理模型。
2.如权利要求1所述的方法,其特征在于,所述获取用于模型训练的样本数据,包括:
获取训练数据集,并从所述训练数据集中采样出用于模型训练的所述样本数据;
其中,所述训练数据集包括标注真实人脸图像集A、标注卡通人脸图像集B及非标注真实人脸图像集C;所述标注真实人脸图像集A中包括属于真人域空间的N个标注真实人脸图像;所述标注卡通人脸图像集B中包括属于卡通域空间的N个标注卡通人脸图像;所述N个标注真实人脸图像与所述N个标注卡通人脸图像一一配对;所述非标注真实人脸图像集C中包括属于所述真人域空间的M个非标注真实人脸图像,M、N均为正整数,且N<<M;
所述标注真实人脸图像Ai是所述标注真实人脸图像集A中的任一个或多个图像;所述标注卡通人脸图像Bi是所述标注卡通人脸图像集B中的一个或多个图像;所述非标注真实人脸图像Ci是所述非标注真实人脸图像集C中的任一个或多个图像,i为正整数且i≤N。
3.如权利要求1或2所述的方法,其特征在于,所述图像处理模型包括第一生成器;
所述调用图像处理模型对所述标注真实人脸图像Ai进行转换处理,得到所述标注真实人脸图像Ai对应的重构卡通人脸图像B'i,包括:调用所述第一生成器对所述标注真实人脸图像Ai进行转换处理,得到所述重构卡通人脸图像B'i;
所述调用所述图像处理模型对所述非标注真实人脸图像Ci进行转换处理,得到所述非标注真实人脸图像Ci对应的重构卡通人脸图像B”i,包括:调用所述第一生成器对所述非标注真实人脸图像Ci进行转换处理,得到所述重构卡通人脸图像B”i;
其中,所述转换处理是指将所述真人域空间的图像转换至所述卡通域空间的处理。
4.如权利要求1或2所述的方法,其特征在于,所述图像处理模型包括第二生成器;
所述调用所述图像处理模型对所述重构卡通人脸图像B”i进行逆转换处理,得到所述非标注真实人脸图像Ci对应的重构真实人脸图像C”i,包括:调用所述第二生成器对所述重构卡通人脸图像B”i进行逆转换处理,得到所述重构真实人脸图像C”i;
所述调用所述图像处理模型对所述标注卡通人脸图像Bi进行逆转换处理,得到所述标注卡通人脸图像Bi对应的重构真实人脸图像C'i,包括:调用所述第二生成器对所述标注卡通人脸图像Bi进行逆转换处理,得到所述重构真实人脸图像C'i;
其中,所述逆转换处理是指将所述卡通域空间的图像转换至所述真人域空间的处理。
5.如权利要求1或2所述的方法,其特征在于,所述第一损失包括像素重构损失和视觉重构损失中的至少一种;
所述像素重构损失用于衡量所述重构卡通人脸图像B'i与所述标注卡通人脸图像Bi之间在像素维度上的差异性;所述视觉重构损失用于衡量所述重构卡通人脸图像B'i与所述标注卡通人脸图像Bi之间在视觉维度上的差异性;
所述图像处理模型包括第一生成器和第二生成器,所述第四损失用于衡量所述第一生成器与所述第二生成器的循环一致性损失。
6.权利要求5所述的方法,其特征在于,所述根据所述重构卡通人脸图像B'i与所述标注卡通人脸图像Bi之间的差异性获取所述图像处理模型的第一损失,包括:
获取所述重构卡通人脸图像B'i的第一像素值,以及获取所述标注卡通人脸图像Bi的第二像素值;
对所述第一像素值与所述第二像素值进行计算,得到所述第一像素值与所述第二像素值之间的像素差值;
对所述像素差值进行均值运算,得到所述像素重构损失。
7.如权利要求5所述的方法,其特征在于,所述根据所述重构卡通人脸图像B'i与所述标注卡通人脸图像Bi之间的差异性获取所述图像处理模型的第一损失,包括:
提取所述重构卡通人脸图像B'i的第一视觉特征值,以及提取所述标注卡通人脸图像Bi的第二视觉特征值;
对所述第一视觉特征值与所述第二视觉特征值进行计算,得到所述第一视觉特征值与所述第二视觉特征值之间的视觉特征差值;
对所述视觉特征差值进行均值运算,得到所述视觉重构损失。
8.如权利要求1或2所述的方法,其特征在于,所述图像处理模型包括第一判别器;
所述根据所述重构卡通人脸图像B'i、所述重构卡通人脸图像B”i及所述标注卡通人脸图像Bi,获取所述图像处理模型的第二损失,包括:
调用所述第一判别器对所述重构卡通人脸图像B'i进行判别处理,得到第一判别结果;调用所述重构卡通人脸图像B”i进行判别处理,得到第二判别结果;以及,调用所述第一判别器对所述标注卡通人脸图像Bi进行判别处理,得到第三判别结果;
根据所述第一判别结果、所述第二判别结果及所述第三判别结果,计算所述第二损失;所述第二损失用于衡量所述第一判别器的对抗损失。
9.如权利要求1或2所述的方法,其特征在于,所述图像处理模型包括第二判别器;
所述根据所述非标注真实人脸图像Ci与所述重构真实人脸图像C'i,获取所述图像处理模型的第三损失,包括:
调用所述第二判别器对所述重构真实人脸图像C'i进行判别处理,得到第四判别结果;以及调用所述第二判别器对所述非标注真实人脸图像Ci进行判别处理,得到第五判别结果;
根据所述第四判别结果和所述第五判别结果,计算所述第三损失;所述第三损失用于衡量所述第二判别器的对抗损失。
10.如权利要求1所述的方法,其特征在于,所述基于所述第一损失、所述第二损失、所述第三损失和所述第四损失,更新所述图像处理模型的参数以训练所述图像处理模型,包括:
基于所述第一损失、所述第二损失、所述第三损失和所述第四损失,构建所述图像处理模型的损失函数;
按照最小化所述损失函数的值的原则,更新所述图像处理模型的参数以训练所述图像处理模型。
11.如权利要求2所述的方法,其特征在于,所述方法还包括:
从所述训练数据集中循环采样出用于模型训练的所述样本数据,并采用所述样本数据对所述图像处理模型进行迭代训练,得到训练好的目标图像处理模型。
12.如权利要求11所述的方法,其特征在于,所述方法还包括:
当接收到待处理的目标真实人脸图像时,调用所述目标图像处理模型对所述目标真实人脸图像进行转换处理,得到所述目标真实人脸图像对应的重构卡通人脸图像。
13.一种图像处理装置,其特征在于,所述图像处理装置包括:
获取单元,用于获取用于模型训练的样本数据,所述样本数据包括标注真实人脸图像Ai、与所述标注真实人脸图像Ai相匹配的标注卡通人脸图像Bi,以及非标注真实人脸图像Ci;
处理单元,用于调用图像处理模型对所述标注真实人脸图像Ai进行转换处理,得到所述标注真实人脸图像Ai对应的重构卡通人脸图像B'i;调用所述图像处理模型对所述非标注真实人脸图像Ci进行转换处理,得到所述非标注真实人脸图像Ci对应的重构卡通人脸图像B”i;调用所述图像处理模型对所述重构卡通人脸图像B”i进行逆转换处理,得到所述非标注真实人脸图像Ci对应的重构真实人脸图像C”i;以及调用所述图像处理模型对所述标注卡通人脸图像Bi进行逆转换处理,得到所述标注卡通人脸图像Bi对应的重构真实人脸图像C'i;
所述获取单元,还用于根据所述重构卡通人脸图像B'i与所述标注卡通人脸图像Bi之间的差异性获取所述图像处理模型的第一损失;根据所述重构卡通人脸图像B'i、所述重构卡通人脸图像B”i及所述标注卡通人脸图像Bi,获取所述图像处理模型的第二损失;根据所述非标注真实人脸图像Ci与所述重构真实人脸图像C'i,获取所述图像处理模型的第三损失;以及根据所述非标注真实人脸图像Ci与所述重构真实人脸图像C”i之间的差异性获取所述图像处理模型的第四损失;
所述处理单元,还用于基于所述第一损失、所述第二损失、所述第三损失和所述第四损失,更新所述图像处理模型的参数以训练所述图像处理模型。
14.一种图像处理设备,其特征在于,所述图像处理设备包括:
处理器,适于实现计算机指令;以及,
计算机可读存储介质,存储有计算机指令,所述计算机指令适于由所述处理器加载并执行如权利要求1至12任一项所述的图像处理方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机指令,所述计算机指令适于由所述处理器加载并执行如权利要求1至12任一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011064705.1A CN113393544A (zh) | 2020-09-30 | 2020-09-30 | 一种图像处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011064705.1A CN113393544A (zh) | 2020-09-30 | 2020-09-30 | 一种图像处理方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113393544A true CN113393544A (zh) | 2021-09-14 |
Family
ID=77616503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011064705.1A Pending CN113393544A (zh) | 2020-09-30 | 2020-09-30 | 一种图像处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113393544A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023143118A1 (zh) * | 2022-01-25 | 2023-08-03 | 北京字跳网络技术有限公司 | 图像处理方法、装置、设备及介质 |
CN116862803A (zh) * | 2023-07-13 | 2023-10-10 | 北京中科闻歌科技股份有限公司 | 逆转图像重建方法、装置、设备及可读存储介质 |
-
2020
- 2020-09-30 CN CN202011064705.1A patent/CN113393544A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023143118A1 (zh) * | 2022-01-25 | 2023-08-03 | 北京字跳网络技术有限公司 | 图像处理方法、装置、设备及介质 |
CN116862803A (zh) * | 2023-07-13 | 2023-10-10 | 北京中科闻歌科技股份有限公司 | 逆转图像重建方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898696A (zh) | 伪标签及标签预测模型的生成方法、装置、介质及设备 | |
CN110532996B (zh) | 视频分类的方法、信息处理的方法以及服务器 | |
US20220028031A1 (en) | Image processing method and apparatus, device, and storage medium | |
US20210224601A1 (en) | Video sequence selection method, computer device, and storage medium | |
EP3889912B1 (en) | Method and apparatus for generating video | |
WO2021208601A1 (zh) | 基于人工智能的图像处理方法、装置、设备及存储介质 | |
CN112287820A (zh) | 人脸检测神经网络及训练方法、人脸检测方法、存储介质 | |
CN111553267B (zh) | 图像处理方法、图像处理模型训练方法及设备 | |
US20230072627A1 (en) | Gaze correction method and apparatus for face image, device, computer-readable storage medium, and computer program product face image | |
CN113139628B (zh) | 样本图像的识别方法、装置、设备及可读存储介质 | |
CN114339409B (zh) | 视频处理方法、装置、计算机设备及存储介质 | |
CN111582342B (zh) | 一种图像识别方法、装置、设备以及可读存储介质 | |
CN111539290A (zh) | 视频动作识别方法、装置、电子设备及存储介质 | |
CN113821668A (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
CN113393544A (zh) | 一种图像处理方法、装置、设备及介质 | |
CN112307947A (zh) | 用于生成信息的方法和装置 | |
CN114611720A (zh) | 联邦学习模型训练方法、电子设备及存储介质 | |
CN113095206A (zh) | 虚拟主播生成方法、装置和终端设备 | |
CN113011387A (zh) | 网络训练及人脸活体检测方法、装置、设备及存储介质 | |
CN114282059A (zh) | 视频检索的方法、装置、设备及存储介质 | |
CN113657272B (zh) | 一种基于缺失数据补全的微视频分类方法及系统 | |
CN110516153B (zh) | 视频的智能推送方法和装置、存储介质及电子装置 | |
WO2022105117A1 (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN113822114A (zh) | 一种图像处理方法、相关设备及计算机可读存储介质 | |
CN113822117B (zh) | 一种数据处理方法、设备以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40053133 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |