WO2023168903A1

WO2023168903A1 - 模型训练和身份匿名化方法、装置、设备、存储介质及程序产品

Info

Publication number: WO2023168903A1
Application number: PCT/CN2022/111704
Authority: WO
Inventors: 罗宇辰; 朱俊伟; 贺珂珂; 储文青; 邰颖; 汪铖杰
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2022-03-10
Filing date: 2022-08-11
Publication date: 2023-09-14
Also published as: CN114936377A

Abstract

本申请提供了一种模型训练和身份匿名化方法、装置、设备、存储介质及程序产品，可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。该方法包括：在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量；通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量；通过所述目标网络模型的融合模块，基于N个虚拟身份向量和M个属性向量进行图像生成，得到待处理图像的身份匿名化图像。

Description

模型训练和身份匿名化方法、装置、设备、存储介质及程序产品

相关申请的交叉引用

本申请基于申请号为202210234385.2、申请日为2022年03月10日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种模型训练和身份匿名化方法、装置、设备、存储介质及程序产品。

背景技术

身份匿名化又叫做去身份化(De-Identification)，指去除图像或视频中可识别的身份特征(Identity)，但同时保留其他与身份无关的属性不变，并保证匿名化的图片或视频必须在视觉上仍然真实的。

相关技术中，使用条件生成式对抗网络(Generative Adversarial Networks，GAN)生成匿名化的图片，通过提取原始图片的姿态关键点，并将原始图片的姿态关键点和去除面部区域之后的背景图片作为条件输入模型中，以生成新的虚拟身份来填补空缺的面部区域。但是，该方法，以去除面部区域之后的背景图片作为模型输入，使得模型生成的图片质量差。

发明内容

本申请实施例提供一种模型训练方法和身份匿名化方法、装置、计算设备、计算机可读存储介质及计算机程序产品，能够提高身份匿名化图像的生成质量。

本申请实施例提供了一种模型训练方法，包括：

通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，所述N为正整数；

通过所述目标网络模型中的属性模块，对第二训练图像进行属性向量提取，得到M个属性向量，所述M为正整数；

通过所述目标网络模型的融合模块，基于所述N个第一虚拟身份向量和所述M个属性向量进行图像生成，得到所述第二训练图像的身份匿名化图像；

根据所述身份匿名化图像，确定所述目标网络模型的损失，并根据所述损失对所述目标网络模型进行训练。

本申请实施例还提供了一种身份匿名化方法，包括：

在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，所述N为正整数；

通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，所述M为正整数；

通过所述目标网络模型的融合模块，基于所述N个虚拟身份向量和所述M个属性向量进行图像生成，得到所述待处理图像的身份匿名化图像。

本申请实施例还提供了一种模型训练装置，包括：

投影单元，配置为通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，所述N为正整数；

属性单元，配置为通过所述目标网络模型中的属性模块，对第二训练图像进行属性向量提取，得到M个属性向量，所述M为正整数；

融合单元，配置为通过所述目标网络模型的融合模块，基于所述N个第一虚拟身份向量和所述M个属性向量进行图像生成，得到所述第二训练图像的身份匿名化图像；

训练单元，配置为根据所述身份匿名化图像，确定所述目标网络模型的损失，并根据所述损失对所述目标网络模型进行训练。

本申请实施例还提供了一种身份匿名化装置，包括：

采样单元，配置为在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，所述N为正整数；

属性单元，配置为通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，所述M为正整数；

匿名化单元，配置为通过所述目标网络模型的融合模块，基于所述N个虚拟身份向量和所述M个属性向量进行图像生成，得到所述待处理图像的身份匿名化图像。

本申请实施例还提供了一种计算设备，包括处理器和存储器。所述存储器，配置为存储计算机程序，所述处理器，配置为调用并运行所述存储器中存储的计算机程序，以执行本申请实施例提供的上述模型训练方法或身份匿名化方法。

本申请实施例还提供了一种芯片，配置为实现本申请实施例提供的上述模型训练方法或身份匿名化方法法。所述芯片包括：处理器，配置为从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行本申请实施例提供的上述模型训练方法或身份匿名化方法。

本申请实施例还提供了一种计算机可读存储介质，配置为存储计算机程序，所述计算机程序被执行时，实现本申请实施例提供的上述模型训练方法或身份匿名化方法。

本申请实施例还提供了一种计算机程序产品，包括计算机程序指令，所述计算机程序指令被计算机执行时，实现本申请实施例提供的上述模型训练方法或身份匿名化方法。

本申请实施例还提供了一种计算机程序，当其在计算机上运行时，实现本申请实施例提供的上述模型训练方法或身份匿名化方法。

本申请实施例具有以下有益效果：

在目标网络模型训练过程中，通过将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，使得目标网络模型能够对图像中的身份信息进行充分学习，而通过对第二训练图像进行属性向量提取，得到M个属性向量，实现了目标网络模型对图像中属性信息的充分学习，基于将N个第一虚拟身份向量和M个属性向量进行图像生成，得到第二训练图像的身份匿名化图像，如此，使得训练得到的模型能够在保证原始图像的属性信息不变的情况下，生成携带虚拟身份信息的图像；

在目标网络模型的应用过程中，通过在投影模块的目标空间上进行采样，得到N个虚拟身份向量，实现了虚拟身份信息的生成，通过对待处理图像进行属性向量提取，得到M个属性向量，保证待处理图像中属性特征的不丢失，进而保证所生成身份匿名化图像的质量，基于N个虚拟身份向量和M个属性向量进行图像生成，得到待处理图像的身份匿名化图像，实现了在保证待处理图像的属性信息不变的情况下，生成携带虚拟身份信息、即隐藏真实身份的身份匿名化图像，即本申请实施例在身份匿名化时，通过目标网络模型生成独立虚拟身份，无需去除图像中面部区域，进而提高身份匿名化的保真度和分辨率。

附图说明

图1A为本申请实施例提供的真实图像示意图；

图1B-图1D为本申请实施例提供的图1A对应的身份匿名化图像示意图；

图2为本申请实施例提供的一种系统架构示意图；

图3为本申请实施例提供的模型训练方法的流程示意图；

图4至图6为本申请实施例提供的目标网络模型的结构示意图；

图7为本申请实施例提供的融合模块结构示意图；

图8为本申请实施例提供的目标网络模型的结构示意图；

图9及图10为本申请实施例提供的对比损失确定的示意图；

图11为本申请实施例提供的身份匿名化方法流程示意图；

图12为本申请实施例提供的投影模块示意图；

图13为本申请施例提供的身份匿名化图像确定示意图；

图14为本申请实施例提供的模型训练装置的示意性框图；

图15为本申请实施例提供的身份匿名化装置的示意性框图；

图16为本申请实施例提供的计算设备的示意性框图。

具体实施方式

为使下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

应理解，在本发明实施例中，“与A对应的B”表示B与A相关联。在一种实现方式中，可以根据A确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其它信息确定B。

在本申请实施例的描述中，除非另有说明，“多个”是指两个或多于两个。

另外，为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”、“第三”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”、“第三”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”、“第三”等字样也并不限定一定不同。

为了便于理解本申请的实施例，首先对本申请实施例涉及到的相关概念进行如下简单介绍：

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例的方法，可以应用于任意需要对图像进行匿名化处理的场景。例如，图1A至图1D所示，图1A为真实图像，图1B至图1D为图1A的身份匿名化图像。对比图1A和图1B至图1D可知，图1B至图1D去除图1A中可识别的身份特征(Identity)，同时保留其他与身份无关的属性不变，并保证在视觉上仍然真实。

场景1，本申请实施例可以应用于隐私保护场景，例如对于人脸相关的图片或视频，可以使用本申请实施例的方法将真实身份替换为虚拟身份，这样后续的检测等任务可以继续执行而不会泄露隐私。另外，用户在发布图片或视频时也可使用本申请实施例的方法隐去自己的身份特征，避免真实信息泄露。

场景2，本申请实施例可以应用于生成虚拟形象场景，例如本申请实施例的技术方案可被用于生成虚拟身份，例如固定身份隐变量，替换背景图片，可以生成某个特定虚拟形象在不同场景下的图片或视频。

需要说明的是，上述场景1和场景2以目标为人脸为例进行说明，本申请实施例的方法还可以应用于非人脸的其他目标的身份匿名化的场景中，例如对待处理图像中动物、车辆等任意目标进行身份匿名化。

在一些实施例中，本申请实施例的方法可以应用于智能交通系统，智能交通系统(Intelligent Traffic System，ITS)又称智能运输系统(Intelligent Transportation System)，是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造，加强车辆、道路、使用者三者之间的联系，从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。示例性的，本申请与智能交通相结合的方案可以是，车载设备采集用户的人脸图像，并采用本申请实施例的方法，对采集的人脸图像进行身份匿名化处理后，发送给其他设备进行任务分析等，例如进行非法驾驶分析、或智能驾驶分析等。

图2为本申请实施例涉及的一种系统架构示意图，包括用户设备101、数据采集设备102、训练设备103、执行设备104、数据库105、内容库106、I/O接口107和目标网络模型108。

其中，数据采集设备102，配置为从内容库106中读取训练数据，并将读取的训练数据存储至数据库105中。本申请实施例涉及的训练数据包括第一训练图像、第二训练图像和第三训练图像，第一训练图像、第二训练图像和第三训练均用于训练目标网络模型。

在一些实施例中，用户设备101，配置为对数据库105中的数据进行标注操作。

训练设备103基于数据库105中维护的训练数据，对目标网络模型108进行训练，使得训练后的目标网络模型108可以生成待处理图像的身份匿名化图像。在一些实施例中，训练设备103得到的目标网络模型108可以应用到不同的系统或设备中。

在附图2中，执行设备104配置有I/O接口107，与外部设备进行数据交互。比如通过I/O接口接收用户设备101发送的待处理图像。执行设备104中的计算模块109使用训练好的目标网络模型108对输入的待处理图像进行处理，输出身份匿名化图像，并将生成的身份匿名化图像输出给用户设备101进行显示，或者输入其他任务模型中进行其他任务处理。

其中，用户设备101可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device，MID)或其他具有安装浏览器功能的终端设备。

执行设备104可以为服务器。服务器可以是一台或多台。服务器是多台时，可以存在如下情况至少之一：至少两台服务器配置为提供不同的服务，至少两台服务器配置为提供相同的服务；比如以负载均衡方式提供同一种服务，本申请实施例对此不加以限定。其中，上述服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器也可以成为区块链的节点。

本实施例中，执行设备104通过网络与用户设备101连接。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。

需要说明的是，附图2仅是本申请实施例提供的一种系统架构的示意图，图中所示设备、器件、模块等之间的位置关系不构成任何限制。在一些实施例中，上述数据采集设备102与用户设备101、训练设备103和执行设备104可以为同一个设备。上述数据库105可以分布在一个服务器上也可以分布在多个服务器上，上述的内容库106可以分布在一个服务器上也可以分布在多个服务器上。

下面通过一些实施例对本申请实施例的技术方案进行详细说明。下面这几个实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

本申请提供一种目标网络模型，该目标网络模型用于对待处理图像中的目标(例如面部)进行身份匿名化处理，生成待处理图像的身份匿名化图像。因此，在一些实施例中，可以将目标网络模型称为身份匿名化模型，或者身份匿名化器。

首先，对目标网络模型的训练过程进行介绍。

图3为本申请实施例提供的模型训练方法的流程示意图。本申请实施例的执行主体为具有模型训练功能的装置，例如模型训练装置，该模型训练装置可以为计算设备，或者为计算设备中的一部分。下面以执行主体为计算设备为例进行说明。如图3所示，本申请实施例的方法包括：

S301、计算设备通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，N为正整数。

本申请实施例的第一训练图像为训练数据中的一张训练图像。需要说明的是，若上述第一训练图像为人脸图像，则上述第一训练图像为经过用户许可同意后得到的，且相关图像数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本申请实施例中，使用各第一训练图像对模型进行训练的过程基本相似，为了便于描述，以一张第一训练图像为例进行说明。

本申请实施例通过目标网络模型，将第一训练图像投影到目标空间中，得到第一训练图像的一个或多个虚拟身份向量，使得目标网络模型对第一训练图像的身份信息进行学习。在目标网络模型对身份信息充分学习后，在实际进行身份匿名化处理时，可以直接对目标网络模型的目标空间进行采样，生成虚拟身份向量。

本申请实施例主要涉及属性向量和虚拟身份向量这几个概念。

其中，虚拟身份向量为虚拟身份信息对应的向量，虚拟身份信息为隐藏可识别身份特征后的身份信息，例如隐藏面部可识别的身份特征后的面部信息。

属性向量为属性信息对应的向量，将图像中除可识别身份特征外的其他特征信息称为属性信息，例如背景信息等。

本申请实施例的目标网络模型可以生成独立的虚拟身份向量。

图4为本申请实施例提供的目标网络模型的结构示意图，如图4所示，本申请实施例的目标网络模型包括投影模块、属性模块和融合模块。

其中，投影模块，配置为将第一训练图像投影到目标空间中，得到第一训练图像的N个第一虚拟身份向量。N为正整数，本申请实施例对N的取值不做限制，可根据实际需要进行设定。

属性模块，配置为对第二训练图像进行属性向量提取，以提取第二训练图像的M个属性向量。M为正整数，本申请实施例对M的取值不做限制，可根据实际需要进行设定。在一些实施例中，M等于N。

融合模块，配置为基于上述N个第一虚拟身份向量和M个属性向量进行图像生成，得到第二训练图像的身份匿名化图像。

若上述N为大于1的正整数时，则N个第一虚拟身份向量分别对应不同的分辨率。

由上述可知，本申请实施例的目标网络模型，其中投影模块配置为生成第二训练图像中目标的虚拟身份向量，该虚拟身份向量隐藏了第二训练图像中目标的真实身份特性，属性模块配置为提取第二训练图像的属性向量，该属性向量保留了第二训练图像中目标的真实身份特性外的其他特征。这样，融合模块基于上述虚拟身份向量和属性向量进行图像生成后，可得到隐藏第二训练图像中目标身份的匿名化图像，即身份匿名化图像。

在一些实施例中，如图5所示，投影模块包括第一投影单元和第二投影单元，目标空间包括第一空间Z和第二空间W，此时，上述计算设备通过目标网络模型中的投影模块，可采用如下方式实现将第一训练图像投影至目标空间，得到N个第一虚拟身份向量：

提取第一训练图像的先验身份信息；通过第一投影单元，将先验身份信息投影至第一空间Z，得到N个身份隐向量；通过第二投影单元，将N个身份隐向量投影至第二空间W，得到N个第一虚拟身份向量。

如图5所示，首先提取第一训练图像的先验身份信息，例如通过预先训练好的识别模型，提取第一训练图像的先验身份信息。接着，通过第一投影单元，将第一训练图像的先验身份信息投影到第一空间Z中，得到N个身份隐向量，再通过第二投影单元，将N个身份隐向量投影至第二空间W，得到N个第一虚拟身份向量。

上述第一空间Z与第二空间W可以为不同的隐空间。本申请实施例对第一空间Z和第二空间W不做限制。

在一些实施例中，第一空间为隐空间Z，该隐空间Z符合标准高斯分布。

此时，上述第一投影单元，可采用如下方式将先验身份信息投影至第一空间Z，得到N个身份隐向量：

通过第一投影单元将先验身份信息，投影为所述第一空间的均值和方差；基于第一空间的均值和方差进行采样，得到N个身份隐向量。

在一些实施例中，第一投影单元为变分自编码器(variational autoencoder，VAE)，例如为条件变分自编码器(conditional variational autoencoder，CVAE)，条件变分自编码器是一种生成网络，通过编码器学习数据的分布，得到隐变量，然后通过解码器将隐变量恢复到数据的原始形式。条件变分自编码器可以学习到数据的分布，然后抽样生成新的数据，通常用于图像生成。

这样，可以通过将第一训练图像的先验身份信息输入该VAE中，该VAE将先验身份信息投影为第一空间的均值和方差。接着，基于第一空间的均值和方差进行采样，得到第一训练图像的N个身份隐向量。

该示例中，上述第一空间为符合标准高斯分布的隐空间Z，因此，为了增强隐空间的表达能力，本申请实施例在不同的分辨率层次上，生成不同的隐向量，例如生成N个身份隐向量，这等价于构建一个包含多个身份隐向量的Z+空间。

在一些实施例中，第二空间W为由隐空间Z得到，例如，由隐空间Z进行线性或非线性映射得到。

本申请实施例对第二投影单元的网络结构不做限制，例如为映射网络(Mapping Network)，该映射网络由多个全连接层组成。

本申请实施例，通过将第一训练图像的先验身份信息投影到投影模块的影空间(即目标空间)，以使投影模块对第一训练图像的身份信息进行充分学习，以便后续生成符合实际的虚拟身份向量。

S302、通过目标网络模型中的属性模块，对第二训练图像进行属性向量提取，得到M个属性向量，M为正整数。

其中，第二训练图像为训练数据集中的任一图像，该第二训练图像与上述第一训练图像可以为同一张图像，也可以是不同图像。

本申请实施例的属性模块配置为学习第二训练图像的属性信息，以生成M个属性向量。

本申请实施例对属性模块的网络模型不做限制。

在一些实施例中，如图6所示，属性模块包括编码单元和解码单元，此时，通过目标网络模型中的属性模块，可采用如下方式对第二训练图像进行属性向量提取，得到M个属性向量：

将第二训练图像输入编码单元，得到第二训练图像的特征信息；将特征信息输入解码单元，得到M个属性向量。

在一些实施例中，编码单元包括多个特征提取层，解码单元也包括多个特性提取单元，编码单元中的至少一个特征提取层与解码单元中的至少一个特征提取层之间跳跃连接。

根据上述步骤，生成N个第一虚拟身份向量和M个属性向量后，执行如下S303。

S303、通过目标网络模型的融合模块，基于N个第一虚拟身份向量和M个属性向量进行图像生成，得到第二训练图像的身份匿名化图像。

示例1，对N个第一虚拟身份向量进行拼接，得到拼接后的第一虚拟身份向量，对M个属性向量进行拼接，拼接后的属性向量，将拼接后的第一虚拟身份向量和拼接后的属性向量进行图像生成后，输入融合模块中，以进行身份匿名化图像的生成。

例如，将拼接后的第一虚拟身份向量和接后的属性向量进行级联后，输入融合模块中，以进行身份匿名化图像的生成。

再例如，将拼接后的第一虚拟身份向量和接后的属性向量进行相加后，输入融合模块中，以进行身份匿名化图像的生成。

示例2，融合模块包括多个不同的分辨率层，此时，融合模块，可采用如下方式，基于N个第一虚拟身份向量和M个属性向量进行图像生成，得到第二训练图像的身份匿名化图像：

根据N个第一虚拟身份向量所对应的分辨率，将N个第一虚拟身份向量作为样式，将M个属性向量作为噪音，输入对应的分辨率层中，得到第二训练图像的身份匿名化图像。

举例说明，N为3，M为4，融合模块包括4个不同的分辨率层，其中3个第一虚拟身份向量记为第一虚拟身份向量1、第一虚拟身份向量2和第一虚拟身份向量3，4个属性向量记为属性向量1、属性向量2、属性向量3和属性向量4。4个分辨率层根据分辨率的大小依次记为分辨率层1、分辨率层2、分辨率层3和分辨率层4。第一虚拟身份向量1对应分辨率较低的分辨率层1和分辨率层2，第一虚拟身份向量2对应分辨率中等的分辨率层3，虚拟身份向,3对应分辨率最高的分辨率层4。4个属性向量与4个分辨率层按照分辨率大小依次对应。

示例性的，将第一虚拟身份向量1输入分辨率层1，得到特征信息1，属性向量1与特征信息1合并后，与第一虚拟身份向量1同时输入分辨率层2，得到特征信息2。属性向量2与特征信息2合并后，与第一虚拟身份向量3同时输入分辨率层3，得到特征信息3。属性向量3与特征信息3合并后，与第一虚拟身份向量4同时输入分辨率层4，得到特征信息4。最后，特征信息4和属性向量4进行合并等处理后，生成第二训练图像的身份匿名化图像。

在一些实施例中，融合模块为基于样式的生成器(Style-based generator，StyleGAN2)。如图7所示，在融合模块相邻两个分辨率层之间包括AdaIN层，例如，对第一虚拟身份向量i+1进行仿射变换(Affine transform，AT)，将第i个分辨率层的输出的特征信息i与属性向量i合并后，与仿射变换后的第一虚拟身份向量i+1输入AdaIN层，执行AdaIN操作，并将AdaIN操作结果输入第i+1个分辨率层。

本申请实施例的融合模块还可以是StyleGAN3和ProGAN等对抗模型，当融合模块采用不同的对抗模型时，确定第二训练图像的身份匿名化图像的方式可以不相同，本申请实施例对此不做限制。

在一些实施例中，以第一投影单元为VAE，第二投影单元为映射网络，属性模块为自编码器，融合模块为StyleGAN2为例，对本申请实施例的模型训练过程进行介绍。

示例性地，如图8所示，将第一训练图像Xs通过预训练人脸识别模型，生成先验身份信息。接着。将先验身份信息输入VAE，通过VAE将先验身份信息投影至第一空间Z中，得到N个身份隐向量，例如，得到3个N个身份隐向量，这3个N个身份隐向量分别对应低、中、高3个不同的分辨率。接着，将N个身份隐向量输入映射网络，通过映射网络将N个身份隐向量从第一空间Z投影到第二空间W中，得到N个第一虚拟身份向量。另外，将第二训练图像Xt输入自编码器中，通过自编码器对第二训练图像Xt进行处理后，生成M个属性向量。最后，将M个属性向量作为噪声，将N个第一虚拟身份向量作为样式，输入StyleGAN2的各层中，得到StyleGAN2输出的第二训练图像的身份匿名化图像Ys,t。

根据上述步骤，将第一训练图像和第二训练图像输入目标网络模型中，得到目标网络模型输出的第二训练图像的身份匿名化图像，接着，执行如下S304，以对目标网络模型进行训练。

S304、根据身份匿名化图像，确定目标网络模型的损失，并根据损失对目标网络模型进行训练。

根据上述步骤，目标网络模型输出第二训练图像的身份匿名化图像，根据该身份匿名化图像，确定目标网络模型的损失。

在一些实施例中，将身份匿名化图像输入判断模型中，该判断模型为预先训练的，可以预测身份匿名化图像的匿名化程度的模型。例如，将该身份匿名化图像输入该判断模型，该判断模型对该身份匿名化图像进行身份识别，将识别结果确定为该目标网络模型的损失。若识别准确性高，则说明当前目标网络模型的匿名化效果不理想，此时，根据目标网络模型的损失，对该目标网络模型中的参数进行调整。接着，选择新的第一训练图像和第二训练图像执行上述S301至S304的步骤，对目标网络模型继续进行训练，直到该目标网络模型达到训练结束条件。其中，训练结束条件至少包括训练次数达到预设次数，或者模型的匿名化程度到底预期效果。

在一些实施例中，若图5所示的第一空间Z为符合标准高斯分布的隐空间，则本申请实施例对第一空间Z中的N个身份隐向量加以KL散度约束L _kl，以保证身份信息被投影到标准高斯分布。

基于此，本申请实施例还可确定N个身份隐向量的散度约束，此时，根据身份匿名化图像，确定目标网络模型的损失可以包括：根据身份匿名化图像和散度约束，确定目标网络模型的损失。

示例性的，可以通过如下公式(1)，确定N个身份隐向量的散度约束L _kl：

其中，μ _i为N个身份隐向量中第i个身份隐向量对应的均值，σ _i为N个身份隐向量中第i个身份隐向量对应的方差。

需要说明的是，上述公式(1)只是一种示例，本申请实施例确定N个身份隐向量的散度约束的方式包括但不限于上述公式(1)，例如可以是对上述公式(1)进行变形等其他计算散度约束的方式。

本申请实施例，在N个身份隐向量的散度约束L _kl，这样经过训练，不仅使得投影模块对身份信息进行充分学习，且使得投影模块的第一空间满足标准高斯分布，这样在后期匿名化处理时，可以直接对第一空间进行采样，生成符合标准高斯分布N个身份隐向量，用于生成虚拟身份向量。

在一些实施例中，上述第二空间是由第一空间经过非线性映射得到，是一个复杂的非高斯分布。如图5所示，在将身份信息映射到第一空间后，发现此时的中间隐空间第二空间W分布并不均匀，真实的身份向量聚集到多个不同的中心，且与生成的虚拟身份向量没有重合，因此虚拟的身份向量无法产生合理的人脸身份。因此，本申请实施例提出了使用一个对比损失来对第二空间W空间的隐向量(即第一虚拟身份向量)进行约束，使来自同一身份的隐向量聚合到一起，而与不同身份的隐向量相斥，并使所有的隐向量均匀分布到整个空间。

基于此，本申请实施例还可通过如下方式确定身份损失：

步骤1，获取第三训练图像；

步骤2，通过投影参考模块对第三训练图像进行处理，得到N个第二虚拟身份向量；

步骤3，根据N个第一虚拟身份向量和N个第二虚拟身份向量，确定身份损失。

上述第三训练图像和第一训练图像均为第一目标的两张不同的图像。例如，第三训练图像和第一训练图像为同一个用户的两张不同人脸图像。

上述投影参考模块与投影模块的网络结构相同，且根据投影模块进行更新。例如，投影参考模块根据投影模块动量更新，即投影参考模块随着投影模块的更新进行缓慢更新。

示例性的，投影参考模块可以根据如下公式(2)进行更新：

Pθ’(t)＝(1-Δ)*Pθ’(t-1)+Δ*Pθ(t) (2)

其中，Pθ’(t)为第t次更新后的投影参考模块参数，Pθ’(t-1)为第t-1次更新后的投影参考模块参数，Pθ(t)为第t次更新后的投影模块参数，Δ为较小值，例如为0.01。

如图9所示，在模型训练过程中，为了确定身份损失，则本申请实施例设定一个与投影模块的网络结构完全一致的投影参考模块，以对投影模块输出的第一虚拟身份向量进行约束。示例性地，将第一训练图像输入投影模块，得到第一训练图像的N个第一虚拟身份向量，将第三训练图像输入投影参考模块，得到第三训练图像的N个第二虚拟身份向量。由于第一训练图像和第三训练图像为同一个目标的图像，且投影模块与投影参考模块网络结构一致，这样若模型训练结束后，第一训练图像对应的N个第一虚拟身份向量与N个第二虚拟身份向量之间的差异较小，基于此，可以根据第一训练图像对应的N个第一虚拟身份向量与N个第二虚拟身份向量对目标网络模型中的投影模块进行训练，以使投影模块可以生成符合要求的虚拟身份向量。

上述步骤1中，确定根据N个第一虚拟身份向量和N个第二虚拟身份向量，确定身份损失的方式包括但不限于如下几种：

方式1，确定N个第一虚拟身份向量和N个第二虚拟身份向量关于不同分辨率上的差值，将差值的和值，或差值的平均值，确定为身份损失。例如，N为3，确定第一虚拟身份向量1与第二虚拟身份向量1的差值1，确定第一虚拟身份向量2与第二虚拟身份向量2的差值2，确定第一虚拟身份向量3与第二虚拟身份向量3的差值3。将差值1、差值2和差值3的和值确定为身份损失，或者，将差值1、差值2和差值3的平均值，确定为身份损失。

方式2，本申请实施例设计了N个动态列表K，该动态列表存储了整个训练集中所有不同目标身份(例如人脸身份)在第二空间W+空间的表示。此时，根据N个第一虚拟身份向量和N个第二虚拟身份向量，可采用如下方式确定身份损失：

步骤31、针对N个第一虚拟身份向量中的第i个第一虚拟身份向量，使用第i个第二虚拟身份向量更新第i个动态列表中，第一目标对应的虚拟身份向量。

其中，第i个动态列表中包括第i个分辨率下不同目标的虚拟身份向量，i为从1到N的正整数。

本申请实施例中，N个第二虚拟身份向量中，每个N个第二虚拟身份向量对应的一个动态列表，例如N为3，分别对应低分辨率、中分辨率和高分辨率，这样动态列表也包括3个，分别为低分辨率对应的第一动态列表，中分辨率对应的第二动态列表和高分辨率对应的第三动态列表。

假设i＝1，使用第一个第二虚拟身份向量更新第一动态列表中，第一目标对应的虚拟身份向量。

假设i＝2，使用第二个第二虚拟身份向量更新第二动态列表中，第一目标对应的虚拟身份向量。

假设i＝3，使用第三个第二虚拟身份向量更新第三动态列表中，第一目标对应的虚拟身份向量。

步骤32、根据第i个第一虚拟身份向量和更新后的第i个动态列表，确定第i个第一虚拟身份向量对应的身份子损失。

示例性的，如图10所示，第一训练图像和第三训练图像为第一目标j的两张不同图像，将第一训练图像Xj输入投影模块，得到N个第一虚拟身份向量Wj，将第三训练图像Xj’输入投影参考模块，得到N个第二虚拟身份向量Wj’。针对N个分辨率中的第i个分辨率，第i个动态列表Ki中包括不同目标在第i个分辨率下的第二虚拟身份向量，且该第i个动态列表Ki实时更新。示例性地，使用第i个第二虚拟身份向量更新第i个动态列表Ki中，第一目标j对应的虚拟身份向量kj，即将kj更新为Wj’。接着，根据第i个第二虚拟身份向量和更新后的第i个动态列表，确定第i个第一虚拟身份向量对应的身份子损失i。

本申请实施例中确定第i个第一虚拟身份向量对应的身份子损失的方式不做限制。

例如，使用中心损失(Center loss)、三元损失(Triplet loss)等损失方式，根据第i个第一虚拟身份向量和更新后的第i个动态列表，确定第i个第一虚拟身份向量对应的身份子损失。

在一些实施例中，上述确定N个第一虚拟身份向量中，第i个第一虚拟身份向量对应的身份子损失，可包括如下步骤：

步骤321、获取第i个第二虚拟身份向量与第一预设值的第一比值，将第一比值与第i个第一虚拟身份向量相乘，得到第一结果，并对第一结果进行指数运算，得到第一运算值；

步骤322、获取更新后的第i个动态列表中，每个第二虚拟身份向量与第一预设值的第二比值，针对各所述第二比值，将所述第二比值与对应的第i个第一虚拟身份向量相乘，得到第二结果，并对所述第二结果进行指数运算，得到每个第二虚拟身份向量对应的第二运算值；

步骤323、确定每个第二虚拟身份向量对应的第二运算值的和，获取所述第一运算值与该和的第三比值，并对第三比值进行对数运算，得到第三运算值；

步骤324、将第三运算值的负数，确定为第i个第一虚拟身份向量对应的身份子损失。

示例性的，以w ^j为锚点，K _i中的第j项为正样本，其余为负样本，使用InfoNCE(Information Noise Contrastive Noise，信息噪声对比估计)形式下的对比损失确定身份子损失L _c，其中InfoNCE一种基于互信息(Mutual Information)修改自回归的损失函数。

示例性的，根据如下公式(3)确定第i个第一虚拟身份向量对应的身份子损失L _c(i)：

其中，w ^j为第一目标j的第i个第一虚拟身份向量，K[j]为第一目标j的第i个第二虚拟身份向量，τ为第一预设值，K[k]为第i个动态列表中第k个目标对应的第i个第二虚拟身份向量，w ^k为第k个目标对应的第一虚拟身份向量，K为第i个动态列表所包括的目标的总数。

步骤33、将N个第一虚拟身份向量分别对应的身份子损失之和，确定为目标网络模型的身份损失。

根据上述步骤32，确定出第i个第一虚拟身份向量对应的身份子损失后，将N个第一虚拟身份向量分别对应的身份子损失之和，确定为身份损失。例如N为3，根据上述方法确定出3个第一虚拟身份向量中每个第一虚拟身份向量对应的身份子损失，再将这3个第一虚拟身份向量对应的身份子损失之和，确定为模型的身份损失。

本申请实施例，根据上述方法确定出模型训练过程中的身份损失后，根据身份匿名化图像和散度约束，确定目标网络模型的损失，包括如下步骤：

根据身份匿名化图像、散度约束和身份损失，确定目标网络模型的损失。

示例性地，确定所述身份匿名化图像和第二训练图像之间的重建损失，根据重建损失、散度约束和身份损失，确定目标网络模型的损失。

在一种示例中，将身份匿名化图像和第二训练图像之间差值，确定为重建损失。例如，将身份匿名化图像各像素点与第二训练图像对应像素点之间的差值之和，确定为重建损失。

在另一种示例中，根据如下公式(4)，确定重建损失L _rec：

L _rec＝|Y _s，t-X _t| ₁ (4)

其中，Y _s，t为身份匿名化图像，X _t为第二训练图像，|| ₁为1范数运算。

根据上述步骤，确定出重建损失L _rec后，根据重建损失、散度约束和身份损失，确定目标网络模型的损失。例如，将重建损失、散度约束和身份损失的加权和，确定为目标网络模型的最终损失。

在一些实施例中，为了提高模型的训练准确性，本申请实施例还包括确定身份匿名化图像的身份对比损失，示例性地，包括如下步骤：

步骤A、确定身份匿名化图像和第一训练图像的第一距离，身份匿名化图像和第二训练图像的第二距离，以及第一训练图像和第二训练图像之间的第三距离；

步骤B、根据第一距离、第二距离和第三距离，确定对比损失；

其中，上述第一距离、第二距离和第三距离可以是余弦距离等任意距离方式确定得到。

示例1，根据步骤A确定出第一距离、第二距离和第三距离后，将第一距离、第二距离和第三距离之和，确定为对比损失。

示例2，确定所述第二距离与所述第三距离差的平方，与所述第一距离的和值；将预设值与所述和值的差值，确定为所述对比损失。

在一种示例中，根据如下公式(5)，确定对比损失L _ICL：

L _ICL＝

1-cos(z _id(Y _s，t)，z _id(X _s))+

(cos(z _id(Y _s，t)，z _id(X _t))-cos(z _id(X _s)，z _id(X _t))) ²

(5)

其中，z _id表示从预训练人脸识别模型中提取的关于图像X的512维身份向量表示，cos(z _id(Y _s，t)，z _id(X _s))为身份匿名化图像和第一训练图像的第一距离，cos(z _id(Y _s，t)，z _id(X _t))为身份匿名化图像和第二训练图像的第二距离，cos(z _id(X _s)，z _id(X _t))为第一训练图像和第二训练图像之间的第三距离。

根据上述步骤，确定出对比损失L _ICL后，根据重建损失、散度约束、身份损失和对比损失，确定目标网络模型的损失，例如，将重建损失、散度约束、身份损失和对比损失的加权和，确定为目标网络模型的损失。

在一些实施例中，若融合模块为对抗网络，则在模型训练过程中，还确定模型的对抗损失，例如，根据身份匿名化图像和第一训练图像，确定对抗损失。

示例性，根据如下公式(6)，确定对抗损失L _GAN：

L _GAN＝min _Gmax _DE[log(D(X _s))]+E[log(1-D(Y _s，t))] (6)

其中，D为判别器，G为生成器，E(*)表示分布函数的期望值，D(X _s)为鉴别器对第一训练图像X _s的鉴别结果，D(Y _s，t)为鉴别器对身份匿名化图像Y _s，t的鉴别结果。

根据上述步骤，确定出对抗损失L _GAN后，可以根据重建损失、散度约束、身份损失、对比损失和对抗损失，确定目标网络模型的损失，例如，将重建损失、散度约束、身份损失、对比损失和对抗损失的加权和，确定为目标网络模型的损失。

需要说明的是，本申请实施例对重建损失、散度约束、身份损失、对比损失和对抗损失对应的权重值的大小不做限制，可根据实际需要进行确定。

在一些实施例中，根据如下公式(7)，对重建损失、散度约束、身份损失、对比损失和对抗损失进行加权运算，得到目标网络模型的损失L _total：

L _total＝L _GAN+10*L _rec+5*L _ICL+L _c+0.0001*L _kl (7)

上述公式(7)中各损失对应的权重为一种示例，本申请实施例中各损失对应的权重包括但不限于上述公式(7)所示，可根据需要确定。

在一些实施例中，为了提高目标网络模型的训练准确性，则可以确定除上述实施例所述的各损失之外的其他损失，本申请实施例对此不做限制，可根据实际需要确定。

由上述可知，本申请实施例通过生成不同分辨率对应的第一虚拟身份向量来实现身份匿名化，可以提高匿名化的分辨率，例如可以生成1024 ²分辨率的匿名化结果，同时产生较少的图片伪影，具有较高的保真度。另外，本申请实施例在模型训练时，不依赖关键回归模型和分割模型，即没有对图像中人脸区域进行去除，保留原始图片中的姿态、细节和遮挡。

本申请实施例，在目标网络模型的应用过程中，通过投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，使得目标网络模型能够对图像中的身份信息进行充分学习，通过对第二训练图像进行属性向量提取，得到M个属性向量，实现了目标网络模型对图像中属性信息的充分学习，基于N个第一虚拟身份向量和M个属性向量进行图像生成，得到第二训练图像的身份匿名化图像，如此，使得训练得到的模型能够在保证原始图像的属性信息不变的情况下，生成携带虚拟身份信息的图像。即本申请提供一种新的目标网络模型，通过上述训练方法，使得目标网络模型对第一训练图像中的身份信息进行学习，这样目标网络模型可以独立生成虚拟身份，同时让目标网络模型对第二训练图像中的属性信息进行充分学习，在整个学习的过程中无需去除图像中面部区域，也无需使用真实身份信息进行指导，并通过利用换脸任务中明确的监督目标对目标网络模型进行训练，提高目标网络模型的身份匿名化生成的保真度和分辨率，使得训练后的目标网络模型可以生成高质量的身份匿名化图像。

上文结合图3至图10，详细描述了本申请的模型训练方法进行介绍，下文结合图11至图13，详细描述本申请的身份匿名化方法进行介绍。

图11为本申请一实施例提供的身份匿名化方法流程示意图。图11所示的身份匿名化方法是使用上述训练好的目标网络模型进行身份匿名化处理。如图11所示，该方法包括：

S401、在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，N为正整数。

由上述实施例可知，本申请实施例使用第一训练图像对投影模块进行训练，使得投影模块对第一训练图像中的身份信息进行充分学习。这样在实际使用时，可以通过对投影模块的目标空间进行采样，得到N个虚拟身份向量。

上述S401的实现方式包括但不限于如下几种：

方式1，基于训练后的投影模块的目标空间的均值和方差进行采样，得到N个虚拟身份向量。例如，在目标空间的方差中进行随机采样，然后加到目标空间的均值上，得到一个虚拟身份向量，重复执行上述步骤，可以得到N个虚拟身份向量。

方式2，目标空间包括第一空间和第二空间，目标网络模型包括第二投影单元，此时，可采用如下方式，在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量：

在第一空间上进行采样，得到N个身份隐向量；通过第二投影单元，将N个身份隐向量投影至第二空间，得到N个虚拟身份向量。

本申请实施例，在实际匿名化时，投影模块中的第一投影单元不再使用，只使用投影模块中的第二投影单元进行投影。示例性地，如图12所示，在符合标准高斯分布的第一空间Z中进行采样，得到N个身份隐向量，接着将N个身份隐向量输入第二投影单元中。第二投影单元将N个身份隐向量投影到W空间中，得到N个虚拟身份向量。图12中以N为3，第二投影单元为映射网络为例，但是本申请实施例的投影模块不局限于图12所示。

由上述可知，使用第一训练图像对第一空间进行训练，使得第一空间的方差和均值符合标准高斯分布。这样，首先在第一空间上进行采样，生成N个身份隐向量，例如，基于第一空间的均值和方差进行采样，得到N个身份隐向量，在第一空间的方差中进行随机采样，然后加到第一空间的均值上，得到一个身份隐向量，重复执行上述步骤，可以得到N个身份隐向量。接着，通过第二投影单元，将N个身份隐向量投影至第二空间，得到N个虚拟身份向量。

在一些实施例中，上述N个虚拟身份向量分别对应不同的分辨率，例如N＝3，其中，第一个虚拟身份向量对应低分辨率，第二个虚拟身份向量对应中分辨率，第三个虚拟身份向量对应高分辨率。

根据上述方法，得到N个虚拟身份向量后，执行如下S402和S403的步骤，得到待处理图像的身份匿名化图像。

S402、通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，M为正整数。

本申请实施例的属性模块配置为提取待处理图像中的属性信息。

在一些实施例中，属性模块包括编码单元和解码单元，此时，可采用如下方式对待处理图像进行属性向量提取，得到M个属性向量：

将待处理图像输入编码单元，得到待处理图像的特征信息；将特征信息输入解码单元，得到M个属性向量。

在一些实施例中，上述编码单元可以包括多个特征提取层，同理，上述解码单元也可以包括多个特征提取层；其中，特征提取层可以包括卷积层等。

在一些实施例中，编码单元中的至少一个特征提取层与解码单元中的至少一个特征提取层之间跳跃连接。

上述生成的M个属性向量可以对应不同的分辨率。

在一些实施例中，上述目标网络模型为自编码器。

S403、通过目标网络模型的融合模块，基于N个虚拟身份向量和M个属性向量进行图像生成，得到待处理图像的身份匿名化图像。

根据上述步骤，生成N个虚拟身份向量和M个属性向量输入融合模块中，得到待处理图像的身份匿名化图像。

上述S403的实现方式包括但不限于如下几种示例：

示例1，对N个虚拟身份向量进行拼接，同时对M个属性向量进行拼接，将拼接后的虚拟身份向量和属性向量进行融合后，输入融合模块中。

例如，将拼接后的虚拟身份向量和属性向量进行级联后，输入融合模块中。

再例如，将拼接后的虚拟身份向量和属性向量进行相加后，输入融合模块中。

示例2，融合模块包括多个不同的分辨率层，此时，可以根据N个虚拟身份向量所对应的分辨率，将N个虚拟身份向量作为样式，将M个属性向量作为噪音，输入对应的分辨率层中，得到待处理图像的身份匿名化图像。

在一些实施例中，融合模块为StyleGAN2。此时，如图7所示，在融合模块相邻两个分辨率层之间包括AdaIN层，例如，对虚拟身份向量i+1进行仿射变换，将第i个分辨率层的输出的特征信息i与属性向量i合并后，与仿射变换后的虚拟身份向量i+1输入AdaIN层，执行AdaIN操作，并将AdaIN操作结果输入第i+1个分辨率层。

本申请实施例的融合模块还可以是StyleGAN3和ProGAN等对抗模型。在一些实施例中，以第二投影单元为映射网络，属性模块为自编码器，融合模块为StyleGAN2为例，对本申请实施例的身份匿名化过程进行介绍。

示例性地，如图13所示，在投影模块的第一空间Z中进行采样，得到N个身份隐向量，例如，得到3个N个身份隐向量，这3个N个身份隐向量分别对应低、中、高3个不同的分辨率。接着，将N个身份隐向量输入映射网络，通过映射网络将N个身份隐向量从第一空间Z投影到第二空间W中，得到N个虚拟身份向量。另外，将待处理图像Xt输入自编码器中，通过自编码器对待处理图像Xt进行处理后，生成M个属性向量。最后，将M个属性向量作为噪声，将N个虚拟身份向量作为样式，输入StyleGAN2的各层中，得到StyleGAN2输出的待处理图像的身份匿名化图像Ys,t。

本申请实施例提供的身份匿名化方法，在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，通过目标网络模型的融合模块，基于N个虚拟身份向量和M个属性向量进行图像生成，得到待处理图像的身份匿名化图像。即本申请实施例的目标网络模型可以独立生成虚拟身份，在对待处理图像进行身份匿名化时，无需去除待处理图像中的面部区域，进而提高身份匿名化的保真度。

上文结合图3至图13，详细描述了本申请的方法实施例，下文结合图14至图15，详细描述本申请的装置实施例。图14是本申请实施例提供的模型训练装置的示意性框图。该训练装置10可以为计算设备或者为计算设备中的一部分。如图14所示，模型训练装置10包括：

投影单元11，配置为通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，所述N为正整数；

属性单元12，配置为通过所述目标网络模型中的属性模块，对第二训练图像进行属性向量提取，得到M个属性向量，所述M为正整数；

融合单元13，配置为通过所述目标网络模型的融合模块，基于所述N个第一虚拟身份向量和所述M个属性向量进行图像生成，得到所述第二训练图像的身份匿名化图像；

训练单元14，配置为根据所述身份匿名化图像，确定所述目标网络模型的损失，并根据所述损失对所述目标网络模型进行训练。

在一些实施例中，所述投影模块包括第一投影单元和第二投影单元，所述目标空间包括第一空间和第二空间，投影单元11，还配置为提取所述第一训练图像的先验身份信息；通过所述第一投影单元，将所述先验身份信息投影至第一空间，得到N个身份隐向量；通过所述第二投影单元，将所述N个身份隐向量投影至第二空间，得到所述N个第一虚拟身份向量。

在一些实施例中，投影单元11，还配置为通过所述第一投影单元将先验身份信息，投影为所述第一空间的均值和方差；基于所述第一空间的均值和方差进行采样，得到所述N个身份隐向量。

在一些实施例中，训练单元14还配置为确定所述N个身份隐向量的散度约束；并根据所述身份匿名化图像和所述散度约束，确定所述目标网络模型的损失。

在一些实施例中，N个第一虚拟身份向量分别对应不同的分辨率。

在一些实施例中，所述第一投影单元为变分自编码器。

在一些实施例中，训练单元14，还配置为获取第三训练图像，所述第三训练图像和所述第一训练图像均为第一目标的两张不同的图像；通过所述目标网络模型中的投影参考模块，将所述第三训练图像投影至目标空间，得到N个第二虚拟身份向量，所述投影参考模块与所述投影模块的网络结构相同，且根据所述投影模块进行更新；根据所述N个第一虚拟身份向量和所述N个第二虚拟身份向量，确定身份损失；根据所述身份匿名化图像、所述散度约束和所述身份损失，确定所述目标网络模型的损失。

在一些实施例中，训练单元14，还配置为针对所述N个第二虚拟身份向量中的第i个第二虚拟身份向量，使用所述第i个第二虚拟身份向量更新第i个动态列表中，所述第一目标对应的虚拟身份向量，其中，所述第i个动态列表中包括第i个分辨率下不同目标的虚拟身份向量，所述i为从1到N的正整数；根据第i个第一虚拟身份向量和更新后的所述第i个动态列表，确定所述第i个第一虚拟身份向量对应的身份子损失；将所述N个第一虚拟身份向量分别对应的身份子损失之和，确定为所述身份损失。

在一些实施例中，训练单元14，还配置为获取所述第i个第二虚拟身份向量与第一预设值的第一比值，将所述第一比值与所述第i个第一虚拟身份向量相乘，得到第一结果，并对所述第一结果进行指数运算，得到第一运算值；获取更新后的所述第i个动态列表中，每个第二虚拟身份向量与第一预设值的第二比值，针对各所述第二比值，将所述第二比值与对应的第i个第一虚拟身份向量相乘，，得到第二结果，并对所述第二结果进行指数运算，得到所述每个第二虚拟身份向量对应的第二运算值；确定每个第二虚拟身份向量对应的第二运算值的和，获取所述第一运算值与所述和的第三比值，并对所述第三比值进行对数运算，得到第三运算值；将所述第三运算值的负数，确定为所述第i个第一虚拟身份向量对应的身份子损失。

在一些实施例中，所述属性模块包括编码单元和解码单元，属性单元12，还配置为通过所述编码单元对所述第二训练图像进行特征提取，得到所述第二训练图像的特征信息；通过所述解码单元对所述特征信息进行解码，得到M个属性向量。

在一些实施例中，所述编码单元中的至少一个特征提取层与所述解码单元中的至少一个特征提取层之间跳跃连接。

在一些实施例中，所述融合模块包括多个不同的分辨率层，融合单元13，还配置为根据所述N个第一虚拟身份向量所对应的分辨率，将所述N个第一虚拟身份向量作为样式，将所述M个属性向量作为噪音，输入对应的分辨率层中，得到所述第二训练图像的身份匿名化图像。

在一些实施例中，训练单元14，还配置为确定所述身份匿名化图像和所述第二训练图像之间的重建损失；根据所述重建损失、所述散度约束和所述身份损失，确定所述目标网络模型的损失。

在一些实施例中，训练单元14，还配置为确定所述身份匿名化图像和所述第一训练图像的第一距离，所述身份匿名化图像和所述第二训练图像的第二距离，以及所述第一训练图像和所述第二训练图像之间的第三距离；根据所述第一距离、所述第二距离和所述第三距离，确定对比损失；根据所述重建损失、所述散度约束、所述身份损失和所述对比损失，确定所述目标网络模型的损失。

在一些实施例中，训练单元14，还配置为确定所述第二距离与所述第三距离差的平方，与所述第一距离的和值；将预设值与所述和值的差值，确定为所述对比损失。

在一些实施例中，若所述融合模块为对抗网络，训练单元14，还配置为根据所述身份匿名化图像和所述第一训练图像，确定对抗损失；将所述重建损失、所述散度约束、所述身份损失、所述对比损失和所述对抗损失的加权和，确定为所述目标网络模型的损失。

应理解的是，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。示例性地，图14所示的装置可以执行上述图3所示的模型训练方法的实施例，并且装置中的各个模块的前述和其它操作和/或功能分别为了实现计算设备对应的方法实施例，为了简洁，在此不再赘述。

图15是本申请实施例提供的身份匿名化装置的示意性框图。该身份匿名化装置20可以为计算设备或者为计算设备中的一部分。如图15所示，身份匿名化装置20包括：

采样单元21，配置为在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，所述N为正整数；

属性单元22，配置为通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，所述M为正整数；

匿名化单元23，配置为通过所述目标网络模型的融合模块，基于所述N个虚拟身份向量和所述M个属性向量进行图像生成，得到所述待处理图像的身份匿名化图像。

在一些实施例中，所述目标空间包括第一空间和第二空间，所述目标网络模型包括第二投影单元，采样单元21，还配置为在所述第一空间上进行采样，得到N个身份隐向量；通过所述第二投影单元，将所述N个身份隐向量投影至第二空间，得到所述N个虚拟身份向量。

在一些实施例中，所述第一空间的均值和方差满足标准高斯分布，采样单元21，还配置为基于所述第一空间的均值和方差进行采样，得到所述N个身份隐向量。

在一些实施例中，所述N个虚拟身份向量分别对应不同的分辨率。

在一些实施例中，所述属性模块包括编码单元和解码单元，属性单元22，还配置为通过所述编码单元，对所述待处理图像进行特征提取，得到所述待处理图像的特征信息；通过所述解码单元对所述特征信息进行解码，得到M个属性向量。

在一些实施例中，所述融合模块包括多个不同的分辨率层，匿名化单元23，还配置为根据所述N个虚拟身份向量所对应的分辨率，将所述N个虚拟身份向量作为样式，将所述M个属性向量作为噪音，输入对应的分辨率层中，得到所述待处理图像的身份匿名化图像。

应理解的是，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。示例性地，图15所示的装置可以执行上述图11所示的身份匿名化方法的实施例，并且装置中的各个模块的前述和其它操作和/或功能分别为了实现计算设备对应的方法实施例，为了简洁，在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置。应理解，该功能模块可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过硬件和软件模块组合实现。例如，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。可选地，软件模块可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图16是本申请实施例提供的计算设备的示意性框图，该计算设备配置为执行上述方法实施例。如图16所示，该计算设备30可包括：

存储器31和处理器32，该存储器31配置为存储计算机程序33，并将该程序代码33传输给该处理器32。换言之，该处理器32可以从存储器31中调用并运行计算机程序33，以实现本申请实施例中的方法。

例如，该处理器32可配置为根据该计算机程序33中的指令执行上述方法步骤。

在本申请的一些实施例中，该处理器32可以包括但不限于：

通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

在本申请的一些实施例中，该存储器31包括但不限于：

易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在本申请的一些实施例中，该计算机程序33可以被分割成一个或多个模块，该一个或者多个模块被存储在该存储器31中，并由该处理器32执行，以完成本申请提供的录制页面的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述该计算机程序33在该计算设备中的执行过程。

如图16所示，该计算设备30还可包括：

收发器34，该收发器34可连接至该处理器32或存储器31。

其中，处理器32可以控制该收发器34与其他设备进行通信，例如，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。收发器34可以包括发射机和接收机。收发器34还可以包括天线，天线的数量可以为一个或多个。

应当理解，该计算设备30中的各个组件通过总线系统相连，其中，总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。

本申请实施例提供了一种计算机存储介质，其上存储有计算机程序，该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说，本申请实施例还提供一种包含指令的计算机程序产品，该指令被计算机执行时使得计算机执行上述方法实施例的方法。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算设备执行上述方法实施例的方法。

以上内容，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以该权利要求的保护范围为准。

Claims

一种模型训练方法，所述方法由计算设备执行，包括：

通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，所述N为正整数；

通过所述目标网络模型中的属性模块，对第二训练图像进行属性向量提取，得到M个属性向量，所述M为正整数；

通过所述目标网络模型的融合模块，基于所述N个第一虚拟身份向量和所述M个属性向量进行图像生成，得到所述第二训练图像的身份匿名化图像；

根据所述身份匿名化图像，确定所述目标网络模型的损失，并根据所述损失对所述目标网络模型进行训练。
根据权利要求1所述的方法，其中，所述投影模块包括第一投影单元和第二投影单元，所述目标空间包括第一空间和第二空间，所述通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，包括：

提取所述第一训练图像的先验身份信息；

通过所述第一投影单元，将所述先验身份信息投影至第一空间，得到N个身份隐向量；

通过所述第二投影单元，将所述N个身份隐向量投影至第二空间，得到所述N个第一虚拟身份向量。
根据权利要求2所述的方法，其中，所述通过所述第一投影单元，将所述先验身份信息投影至第一空间，得到N个身份隐向量，包括：

通过所述第一投影单元将所述先验身份信息，投影为所述第一空间的均值和方差；

基于所述第一空间的均值和方差进行采样，得到所述N个身份隐向量。
根据权利要求2或3所述的方法，其中，所述方法还包括：

确定所述N个身份隐向量的散度约束；

所述根据所述身份匿名化图像，确定所述目标网络模型的损失，包括：

根据所述身份匿名化图像和所述散度约束，确定所述目标网络模型的损失。
根据权利要求4所述的方法，其中，所述方法还包括：

获取第三训练图像，所述第三训练图像和所述第一训练图像均为第一目标的两张不同的图像；

通过所述目标网络模型中的投影参考模块，将所述第三训练图像投影至目标空间，得到N个第二虚拟身份向量，所述投影参考模块与所述投影模块的网络结构相同，且根据所述投影模块进行更新；

根据所述N个第一虚拟身份向量和所述N个第二虚拟身份向量，确定身份损失；

所述根据所述身份匿名化图像和所述散度约束，确定所述目标网络模型的损失，包括：

根据所述身份匿名化图像、所述散度约束和所述身份损失，确定所述目标网络模型的损失。
根据权利要求5所述的方法，其中，所述根据所述N个第一虚拟身份向量和所述N个第二虚拟身份向量，确定身份损失，包括：

针对所述N个第二虚拟身份向量中的第i个第二虚拟身份向量，使用所述第i个第二虚拟身份向量更新第i个动态列表中，所述第一目标对应的虚拟身份向量，其中，所述第i个动态列表中包括第i个分辨率下不同目标的虚拟身份向量，所述i为从1到N的正整数；

根据第i个第一虚拟身份向量和更新后的所述第i个动态列表，确定所述第i个第一虚拟身份向量对应的身份子损失；

将所述N个第一虚拟身份向量分别对应的身份子损失之和，确定为所述身份损失。
根据权利要求6所述的方法，其中，所述根据第i个第一虚拟身份向量和更新后的所述第i个动态列表，确定所述第i个第一虚拟身份向量对应的身份子损失，包括：

获取所述第i个第二虚拟身份向量与第一预设值的第一比值，将所述第一比值与所述第i个第一虚拟身份向量相乘，得到第一结果，并对所述第一结果进行指数运算，得到第一运算值；

获取更新后的所述第i个动态列表中，每个第二虚拟身份向量与第一预设值的第二比值，针对各所述第二比值，将所述第二比值与对应的第i个第一虚拟身份向量相乘，得到第二结果，并对所述第二结果进行指数运算，得到所述每个第二虚拟身份向量对应的第二运算值；

确定每个第二虚拟身份向量对应的第二运算值的和，获取所述第一运算值与所述和的第三比值，并对所述第三比值进行对数运算，得到第三运算值；

将所述第三运算值的负数，确定为所述第i个第一虚拟身份向量对应的身份子损失。
根据权利要求1-7任一项所述的方法，其中，所述属性模块包括编码单元和解码单元，所述通过所述目标网络模型中的属性模块，对第二训练图像进行属性向量提取，得到M个属性向量，包括：

通过所述编码单元对所述第二训练图像进行特征提取，得到所述第二训练图像的特征信息；

通过所述解码单元对所述特征信息进行解码，得到M个属性向量。
根据权利要求1-7任一项所述的方法，其中，所述融合模块包括多个不同的分辨率层，所述通过所述目标网络模型的融合模块，基于所述N个第一虚拟身份向量和所述M个属性向量进行图像生成，得到所述第二训练图像的身份匿名化图像，包括：

根据所述N个第一虚拟身份向量所对应的分辨率，将所述N个第一虚拟身份向量作为样式，将所述M个属性向量作为噪音，输入对应的分辨率层中，得到所述第二训练图像的身份匿名化图像。
根据权利要求5所述的方法，其中，所述根据所述身份匿名化图像、所述散度约束和所述身份损失，确定所述目标网络模型的损失，包括：

确定所述身份匿名化图像和所述第二训练图像之间的重建损失；

根据所述重建损失、所述散度约束和所述身份损失，确定所述目标网络模型的损失。
根据权利要求10所述的方法，其中，所述方法还包括：

确定所述身份匿名化图像和所述第一训练图像的第一距离、所述身份匿名化图像和所述第二训练图像的第二距离，以及所述第一训练图像和所述第二训练图像之间的第三距离；

根据所述第一距离、所述第二距离和所述第三距离，确定对比损失；

所述根据所述重建损失、所述散度约束和所述身份损失，确定所述目标网络模型的损失，包括：

根据所述重建损失、所述散度约束、所述身份损失和所述对比损失，确定所述目标网络模型的损失。
根据权利要求11所述的方法，其中，所述根据所述第一距离、所述第二距离和所述第三距离，确定对比损失，包括：

确定所述第二距离与所述第三距离差的平方，与所述第一距离的和值；

将预设值与所述和值的差值，确定为所述对比损失。
根据权利要求11所述的方法，其中，若所述融合模块为对抗网络，则所述根据所述重建损失、所述散度约束、所述身份损失和所述对比损失，确定所述目标网络模型的损失，包括：

根据所述身份匿名化图像和所述第一训练图像，确定对抗损失；

将所述重建损失、所述散度约束、所述身份损失、所述对比损失和所述对抗损失的加权和，确定为所述目标网络模型的损失。
一种身份匿名化方法，所述方法由计算设备执行，包括：

在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，所述N为正整数；

通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，所述M为正整数；

通过所述目标网络模型的融合模块，基于所述N个虚拟身份向量和所述M个属性向量进行图像生成，得到所述待处理图像的身份匿名化图像。
根据权利要求14所述的方法，其中，所述目标空间包括第一空间和第二空间，所述目标网络模型包括第二投影单元，所述在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，包括：

在所述第一空间上进行采样，得到N个身份隐向量；

通过所述第二投影单元，将所述N个身份隐向量投影至第二空间，得到所述N个虚拟身份向量。
根据权利要求15所述的方法，其中，所述第一空间的均值和方差满足标准高斯分布，所述在所述第一空间上进行采样，得到N个身份隐向量，包括：

基于所述第一空间的均值和方差进行采样，得到所述N个身份隐向量。
一种模型训练装置，所述装置包括：

投影单元，配置为通过目标网络模型中的投影模块，将第一训练图像投影至目标空间，得到N个第一虚拟身份向量，所述N为正整数；

属性单元，配置为通过所述目标网络模型中的属性模块对第二训练图像进行属性向量提取，得到M个属性向量，所述M为正整数；

融合单元，配置为通过所述目标网络模型的融合模块，基于所述N个虚拟身份向量和所述M个属性向量进行图像生成，得到所述第二训练图像的身份匿名化图像；

训练单元，配置为根据所述身份匿名化图像，确定所述目标网络模型的损失，并根据所述损失对所述目标网络模型进行训练。
一种身份匿名化装置，所述装置包括：

采样单元，配置为在目标网络模型中投影模块的目标空间上进行采样，得到N个虚拟身份向量，所述N为正整数；

属性单元，配置为通过目标网络模型中的属性模块，对待处理图像进行属性向量提取，得到M个属性向量，所述M为正整数；

匿名化单元，配置为通过所述目标网络模型的融合模块，基于所述N个虚拟身份向量和所述M个属性向量进行图像生成，得到所述待处理图像的身份匿名化图像。
一种计算设备，所述计算设备包括处理器和存储器；

所述存储器，配置为存储计算机程序；

所述处理器，配置为执行所述计算机程序以实现如上述权利要求1至13任一项所述的方法，或者实现如上述权利要求14至16任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质配置为存储计算机程序，所述计算机程序使得计算机执行时，实现如上述权利要求1至13任一项所述的方法，或者实现如上述权利要求或14至16任一项所述的方法。
一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时，实现权利要求14至16任一项所述的方法，或者实现权利要求1至13任一项所述的方法。