CN117689562B

CN117689562B - 一种基于人工智能扩散模型的虚拟换装方法

Info

Publication number: CN117689562B
Application number: CN202311710470.2A
Authority: CN
Inventors: 李现波; 黄乐轩; 胡浩俊; 杨宏阳; 刘龙飞
Original assignee: Beijing Sinodata Technology Co ltd
Current assignee: Beijing Sinodata Technology Co ltd
Priority date: 2023-12-13
Filing date: 2023-12-13
Publication date: 2024-06-07
Anticipated expiration: 2043-12-13
Also published as: CN117689562A

Abstract

本发明提供一种基于人工智能扩散模型的虚拟换装方法，包括以下步骤：接收模特图像M和服装图像C；采用服装图像预测模块，得到预测分割图S；采用变形估计网络，将服装图像C变形，得到与模特图像M中的模特姿态匹配贴合的服装变形图像F；将服装变形图像F和预测分割图S进行叠加，将服装变形图像F贴于预测分割图S的贴图区域，再经过扩散模型的修正去噪处理，得到服装图像C穿于模特图像M中的模特后的最终效果图。本发明提供一种基于人工智能扩散模型的虚拟换装方法，采用服装图像预测模块和外观流估计模型，能够准确快速的将服装图像中的服装变形为与模型图像中的模特姿态贴合的服装变形图，从而提高虚拟换装的准确性和效率。

Description

一种基于人工智能扩散模型的虚拟换装方法

技术领域

本发明属于计算机科学技术领域，具体涉及一种基于人工智能扩散模型的虚拟换装方法。

背景技术

随着互联网的蓬勃发展，电子商务已成为全球服装行业的重要驱动力，改变了人们购物的方式和购物习惯。电商平台成为消费者购买服装的首选渠道之一。然而，消费者通过电商平台购买服装时，主要存在以下问题：电商平台采用特定模特展示服装，但消费者的体形与特定模特存在差异，因此，消费者难以直观预见自身穿着该服装的效果，从而不利于消费者快速决策是否购买该服装。

发明内容

针对现有技术存在的缺陷，本发明提供一种基于人工智能扩散模型的虚拟换装方法，可有效解决上述问题。

本发明采用的技术方案如下：

本发明提供一种基于人工智能扩散模型的虚拟换装方法，包括以下步骤：

步骤1，接收模特图像M和服装图像C；

步骤2，采用服装图像预测模块，预测得到所述服装图像C穿于所述模特图像M中的模特后的预测图，并将所述预测图中属于所述服装图像C的服装图案去除，得到预测分割图S；其中，所述预测分割图S中，去除的所述服装图像C的服装图案的区域，称为贴图区域；

步骤3，采用变形估计网络，将所述服装图像C变形，得到与所述模特图像M中的模特姿态匹配贴合的服装变形图像F；

步骤4，将所述服装变形图像F和所述预测分割图S进行叠加，将所述服装变形图像F贴于所述预测分割图S的贴图区域，再经过扩散模型的修正去噪处理，得到所述服装图像C穿于所述模特图像M中的模特后的最终效果图。

优选的，步骤2具体为：

步骤2.1，对所述服装图像C的服装类型进行识别，得到服装类型；根据所述服装类型，得到影响该种服装类型的服装穿着效果的人体关键部位；

步骤2.2，对所述模特图像M进行人体部位解析，在所述模特图像M中识别出所有的人体部位，得到模特人体部位分割图M1；对所述模特图像M进行人体姿态解析，得到人体姿态图M2；

步骤2.3，在所述模特人体部位分割图M1中，去除步骤2.1识别到的所述人体关键部位，得到人体关键部位去除后的模特人体部位分割图M3；

步骤2.4，对所述人体关键部位去除后的模特人体部位分割图M3、人体姿态图M2和服装图像C进行融合处理，得到预测分割图S，具体为：

根据所述人体姿态图M2，对所述服装图像C进行粗变形处理，得到与所述人体姿态图M2反映的人体姿态对应的服装粗变形图像C1；

所述人体关键部位去除后的模特人体部位分割图M3包括背景区域和前景区域，前景区域保持不变；将所述背景区域和所述服装粗变形图像C1进行交集运算，从而在背景区域中，填充对应的所述服装粗变形图像C1，并将填充内容用单一颜色填充，得到预测分割图S；其中，所述预测分割图S填充的单一颜色的区域为所述贴图区域。

优选的，步骤3具体为：

步骤3.1，所述变形估计网络包括第一通道特征提取网络、第二通道特征提取网络、第三通道特征提取网络和渐进式外观流估计网络；

步骤3.2，多通道特征提取：

所述第一通道特征提取网络对所述模特图像M进行n个不同尺度的特征提取，按尺度从大到小的方向，依次得到模特图像特征图M₁，模特图像特征图M₂,…,模特图像特征图M_n；

所述第二通道特征提取网络对所述服装图像C进行n个不同尺度的特征提取，按尺度从大到小的方向，依次得到服装图像特征图C₁，服装图像特征图C₂,…,服装图像特征图C_n；

所述第三通道特征提取网络对所述预测分割图S进行n个不同尺度的特征提取，按尺度从大到小的方向，依次得到预测分割特征图S₁，预测分割特征图S₂,…,预测分割特征图S_n；

步骤3.3，拼接融合：

将模特图像特征图与对应尺度的预测分割特征图进行拼接融合及特征提取，得到n个不同尺度的模特图像融合特征图，按尺度从大到小的方向，依次为模特图像融合特征图E₁,模特图像融合特征图E₂,…,模特图像融合特征图E_n；具体方法为：将模特图像特征图M₁和预测分割特征图S₁进行拼接操作，再通过卷积层进行特征提取，得到模特图像融合特征图E₁,将模特图像特征图M₂和预测分割特征图S₂进行拼接操作，再通过卷积层进行特征提取，得到模特图像融合特征图E₂,…,将模特图像特征图M_n和预测分割特征图S_n进行拼接操作，再通过卷积层进行特征提取，得到模特图像融合特征图E_n；

将服装图像特征图与对应尺度的预测分割特征图进行拼接融合，得到n个不同尺度的模特图像融合特征图，按尺度从大到小的方向，依次为服装图像融合特征图K₁,服装图像融合特征图K₂,…,服装图像融合特征图K_n；

步骤3.4，所述渐进式外观流估计网络，包括n层，分别为：第1层渐进式外观流估计网络，第2层渐进式外观流估计网络,…,第n层渐进式外观流估计网络；

所述第1层渐进式外观流估计网络的输入为模特图像融合特征图E_n和服装图像融合特征图K_n，对所述模特图像融合特征图E_n和服装图像融合特征图K_n进行逐像素匹配，根据每个像素的位置差异，对服装图像融合特征图K_n的每个像素进行变形，得到第1级服装图像变形特征图f₁；

所述第2层渐进式外观流估计网络的输入为模特图像融合特征图E_n-1、服装图像融合特征图K_n-1和第1级服装图像变形特征图f₁，采用外观流估计算法，根据模特图像融合特征图E_n-1和第1级服装图像变形特征图f₁，对服装图像融合特征图K_n-1进行变形，得到第2级服装图像变形特征图f₂；

所述第3层渐进式外观流估计网络的输入为模特图像融合特征图E_n-2、服装图像融合特征图K_n-2和第2级服装图像变形特征图f₂，输出第3级服装图像变形特征图f₃；

依此类推

所述第n层渐进式外观流估计网络的输入为模特图像融合特征图E₁、服装图像融合特征图K₁和第n-1级服装图像变形特征图f_n-1，输出第n级服装图像变形特征图f_n，即为与所述模特图像M中的模特姿态匹配贴合的服装变形图像F。

优选的，所述第2层渐进式外观流估计网络的输入为模特图像融合特征图E_n-1、服装图像融合特征图K_n-1和第1级服装图像变形特征图f₁，采用外观流估计算法，根据模特图像融合特征图E_n-1和第1级服装图像变形特征图f₁，对服装图像融合特征图K_n-1进行变形，得到第2级服装图像变形特征图f₂，具体为：

步骤3.4.1，对第1级服装图像变形特征图f₁进行自适应上采样，得到与所述服装图像融合特征图K_n-1尺度相同的特征图，表示为：第1级服装图像变形放大特征图f₁'；

步骤3.4.2，以第1级服装图像变形放大特征图f₁'作为变换矩阵，对所述服装图像融合特征图K_n-1进行第一次扭曲操作，得到第一服装图像融合特征扭曲图K'_n-1；

步骤3.4.3，对第一服装图像融合特征扭曲图K'_n-1和模特图像融合特征图E_n-1进行通道维度的拼接，并计算第一服装图像融合特征扭曲图K'_n-1和模特图像融合特征图E_n-1的相关性，生成相关图R1；

步骤3.4.4，将所述相关图R1输入到残差预测模块，得到第一残差流预测值f₁”；

步骤3.4.5，将第一残差流预测值f₁”和第1级服装图像变形放大特征图f₁'进行相加，得到粗略的变形估计f₁”'；

步骤3.4.6，以粗略的变形估计f₁”'作为变换矩阵，对所述服装图像融合特征图K_n-1进行第二次扭曲操作，得到第二服装图像融合特征扭曲图K”_n-1；

步骤3.4.7，将第二服装图像融合特征扭曲图K”_n-1和模特图像融合特征图E_n-1连接起来，输入到残差预测模块，得到第二残差流预测值u；

将第二残差流预测值u加到粗略的变形估计f₁”'，得到最终的第2级服装图像变形特征图f₂。

优选的，步骤3.4.1中，对第1级服装图像变形特征图f₁进行自适应上采样具体为：

对第1级服装图像变形特征图f₁进行多尺度特征提取，按尺度从大到小的方向，依次得到第1尺度特征图F₁,第2尺度特征图F₂,…,第m尺度特征图F_m，其中，m为尺度的数量；

分别计算第1尺度特征图F₁,第2尺度特征图F₂,…,第m尺度特征图F_m的梯度值，再将得到的所有梯度值进行融合，生成第1级服装图像变形特征图f₁的局部特征响应图LR；

使用高斯滤波器对局部特征响应图LR进行平滑处理，得到平滑后局部特征响应图LR1；

将平滑后局部特征响应图LR1中的每个像素点作为采样权重，对第1级服装图像变形特征图f₁进行上采样。

优选的，步骤3.4.3具体为：

对第一服装图像融合特征扭曲图K'_n-1和模特图像融合特征图E_n-1进行通道维度的拼接，得到拼接后的特征图cat1；

所述拼接后的特征图cat1经过仿射变换层，提取多个不同大小的局部区域；所述局部区域包括属于第一服装图像融合特征扭曲图K'_n-1的局部区域Ia和属于模特图像融合特征图E_n-1的局部区域Ib；分别计算局部区域Ia和局部区域Ib的相关性，得到局部区域相关图；

所述局部区域相关图通过多个卷积层，将各个局部区域相关图融合，得到最终的相关图R1。

优选的，步骤3.4.4具体为：

所述残差预测模块使用注意力机制增强残差流预测过程，具体为：对相关图R1计算注意力权重，使用卷积神经网络提取相关图R1的特征表示，结合所述注意力权重，得到每个位置的特征表示的自注意力得分，将所述自注意力得分归一化为注意力权重，根据所述归一化的注意力权重，调整每个位置上的残差流预测值。

本发明提供的一种基于人工智能扩散模型的虚拟换装方法具有以下优点：

本发明提供一种基于人工智能扩散模型的虚拟换装方法，采用服装图像预测模块、外观流估计模型和人工智能扩散模型，能够准确快速的将服装图像中的服装变形为与模型图像中的模特姿态贴合的服装变形图，从而提高虚拟换装的准确性和效率。

附图说明

图1为本发明提供的一种基于人工智能扩散模型的虚拟换装方法的流程示意图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明提供一种基于人工智能扩散模型的虚拟换装方法，采用服装图像预测模块和外观流估计模型，能够准确快速的将服装图像中的服装变形为与模型图像中的模特姿态贴合的服装变形图，从而提高虚拟换装的准确性和效率。

本发明提供一种基于人工智能扩散模型的虚拟换装方法，参考图1，包括以下步骤：

步骤1，接收模特图像M和服装图像C；

步骤2具体为：

步骤3具体为：

其中，第一通道特征提取网络、第二通道特征提取网络、第三通道特征提取网络均为经过加深的金字塔特征提取网络。

步骤3.2，多通道特征提取：

采用三个独立的通道，各自对模特图像M、服装图像C和预测分割图S进行多尺度特征提取，一方面，提高特征提取效率；另一方面，分离的三个通道，可提取到更细节的特征。

步骤3.3，拼接融合：

所述第2层渐进式外观流估计网络的输入为模特图像融合特征图E_n-1、服装图像融合特征图K_n-1和第1级服装图像变形特征图f₁，采用外观流估计算法，根据模特图像融合特征图E_n-1和第1级服装图像变形特征图f₁，对服装图像融合特征图K_n-1进行变形，得到第2级服装图像变形特征图f₂；所述第2层渐进式外观流估计网络具体用于：

本步骤中，对第1级服装图像变形特征图f₁进行自适应上采样具体为：

本发明中，采用以上的自适应上采样算法，根据当前的输入特征和上下文信息动态地调整采样位置和权重，提高采样精度和鲁棒性，能够减少采样的噪声，从而提高虚拟试衣的准确性。

本步骤具体为：

本步骤中，为了提高残差流预测的准确性，采用注意力机制增强残差流预测过程。这种架构可以帮助模型更好地学习残差流之间的复杂关系，并减少预测误差。

本步骤具体为：

依此类推

本发明提供的渐进式外观流估计网络，包括递进的n层，每一层均输出服装图像变形特征外观流估计，并将该服装图像变形特征外观流估计输入到下一层，指示服装图像中需要进行变形的像素，此种方式，一方面，通过层层递进的方式，提高服装图像变形特征的精度，得到更贴合模特图像中模特姿态的服装；另一方面，可提高服装图像变形处理的效率。

本发明中，扩散模型采用人工智能扩散模型，服装变形图像F与所述预测分割图S进行像素级别的合并，得到粗略的对齐结果O1，将粗略的对齐结果O1输入到在衣服类数据集上微调过的人工智能扩散模型中的编码器中，得到粗略的对齐结果O1的向量形式编码Emb1，向向量形式编码Emb1中添加随机高斯噪声，并输入到人工智能扩散模型中的解码器中，经过解码器的多次去噪过程，得到所述服装图像C穿于所述模特图像M中的模特后的最终效果图。本发明的人工智能扩散模型可以实现精细的图像生成与重建。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种基于人工智能扩散模型的虚拟换装方法，其特征在于，包括以下步骤：

步骤1，接收模特图像M和服装图像C；

步骤3具体为：

步骤3.2，多通道特征提取：

步骤3.3，拼接融合：

依此类推

所述第n层渐进式外观流估计网络的输入为模特图像融合特征图E₁、服装图像融合特征图K₁和第n-1级服装图像变形特征图f_n-1，输出第n级服装图像变形特征图f_n，即为与所述模特图像M中的模特姿态匹配贴合的服装变形图像F；

2.根据权利要求1所述的一种基于人工智能扩散模型的虚拟换装方法，其特征在于，步骤2具体为：

3.根据权利要求1所述的一种基于人工智能扩散模型的虚拟换装方法，其特征在于，所述第2层渐进式外观流估计网络的输入为模特图像融合特征图E_n-1、服装图像融合特征图K_n-1和第1级服装图像变形特征图f₁，采用外观流估计算法，根据模特图像融合特征图E_n-1和第1级服装图像变形特征图f₁，对服装图像融合特征图K_n-1进行变形，得到第2级服装图像变形特征图f₂，具体为：

4.根据权利要求3所述的一种基于人工智能扩散模型的虚拟换装方法，其特征在于，步骤3.4.1中，对第1级服装图像变形特征图f₁进行自适应上采样具体为：

5.根据权利要求3所述的一种基于人工智能扩散模型的虚拟换装方法，其特征在于，步骤3.4.3具体为：

6.根据权利要求3所述的一种基于人工智能扩散模型的虚拟换装方法，其特征在于，步骤3.4.4具体为：