CN116862943A

CN116862943A - 一种商品照片自动化替换背景的方法及装置

Info

Publication number: CN116862943A
Application number: CN202311033496.8A
Authority: CN
Inventors: 施哲彬
Original assignee: Shanghai Huanze Information Technology Co ltd
Current assignee: Shanghai Huanze Information Technology Co ltd
Priority date: 2023-08-16
Filing date: 2023-08-16
Publication date: 2023-10-10

Abstract

本发明属于图像处理技术领域，具体地说是一种商品照片自动化替换背景的方法及装置，所述包括以下步骤：输入带有目标商品的图像和目标商品描述，自动检测出商品位置，根据目标检测的锚框信息，分割目标商品，扣除原有背景；对扣除原始背景后的目标商品进行边缘提取，生成目标商品的边缘检测图，将边缘检测图作为图像生成的条件；用户选择生成风格并输入生成描述，图像生成模型生成一个与输入图像中目标商品具有相同位置和相同轮廓的物品图像，最后将目标商品在原始位置上贴于生成图像上方；本发明无需过多的手动操作，实现高度自动化，且生成背景与商品贴合度高，解决了操作过程复杂耗时，以及生成背景与目标商品风格不搭，光影、亮度匹配等问题。

Description

一种商品照片自动化替换背景的方法及装置

[技术领域]

本发明属于图像处理技术领域，具体地说是一种商品照片自动化替换背景的方法及装置。

[背景技术]

随着互联网技术的发展，电子商务在全球范围内快速增长。而商品展示的重要性在电子商务中尤为突出，能够吸引消费者注意传达产品信息。通常一个商品会有多个不同展示场景，高效的商品背景替换方法能够提高电商卖家的工作效率，以及更好地向消费者传达产品信息。

目前，商品背景替换多以利用PhotoShop等图像编辑软件手动抠图操作，该过程较为复杂耗时，且依赖相关专业技术。尽管已有一些自动化商品背景替换方案，但却存在生成背景与目标商品风格不搭，光影、亮度匹配的问题。

因此，若能提供一种能让生成背景与目标商品高度贴合的自动化替换背景方法及装置，将具有非常重要的意义。

[发明内容]

本发明的目的就是要解决上述的不足而提供一种商品照片自动化替换背景的方法，无需过多的手动操作，实现高度自动化，且生成背景与商品贴合度高，解决了传统的背景替换方法所存在的操作过程复杂耗时，以及生成背景与目标商品风格不搭，光影、亮度匹配等问题。

为实现上述目的，本发明提供以下技术方案：

一方面，本发明提供一种商品照片自动化替换背景的方法，所述方法包括以下步骤：

输入带有目标商品的图像和目标商品描述，自动检测出商品位置，根据目标检测的锚框信息，分割目标商品，扣除原有背景；

对扣除原始背景后的目标商品进行边缘提取，生成目标商品的边缘检测图，将边缘检测图作为图像生成的条件；

用户选择生成风格并输入生成描述，图像生成模型生成一个与输入图像中目标商品具有相同位置和相同轮廓的物品图像，最后将目标商品在原始位置上贴于生成图像上方。

在一些实施例中，商品位置检测时，通过目标检测算法算出目标在图像中的位置，根据文字描述定位图像中的目标，实现通过输入商品的描述来检测商品在图像中的位置。

在一些实施例中，目标商品分割时，通过语义分割将图像中的每个像素分配到特定的语义类别中，实现对图像的像素级别理解和分割，通过语义分割算法保留目标商品在图像中的像素点，并剔除背景。

在一些实施例中，图像生成时，采用Stable Diffusion生成符合要求的图像，Stable Diffusion为基于潜空间扩散模型的图像生成模型，可根据提示词生成相应的图像；并采用ControlNet通讯协议进行条件控制，使Stable Diffusion图像生成模型生成据有相同姿势或边缘的图像。

在一些实施例中，采用Canny边缘提取算法进行边缘检测，并使用LoRA低秩适应模型进行图像生成风格控制，LoRA低秩适应模型是一种模型参数微调技术。

在一些实施例中，通过直方图匹配算法，使生成的背景与目标商品在光影、亮暗程度上保持一致，直方图匹配是通过比较图像的直方图分布来进行匹配和调整，从而实现图像之间的颜色和亮度的一致性。

另一方面，本发明提供一种商品照片自动化替换背景的装置，所述装置包括：

目标检测模块，用于算出目标在图像中的位置，根据文字描述定位图像中的目标，通过输入商品的描述来检测商品在图像中的位置；

语义分割模块，用于将图像中的每个像素分配到特定的语义类别中，对图像的像素级别理解和分割，保留目标商品在图像中的像素点，并剔除背景；

图像生成模块，用于根据提示词生成相应的图像，是一种基于潜空间扩散模型的图像生成模型，并采用ControlNet通讯协议进行条件控制；

边缘检测模块，采用Canny边缘提取算法，将目标边缘检测图作为条件，让图像生成模型生成一个带有与目标商品具有相同位置相同轮廓物品的图像。

在一些实施例中，所述图像生成模块使用LoRA低秩适应模型进行图像生成风格控制，并通过直方图匹配算法使生成的背景与目标商品在光影、亮暗程度上保持一致。

第三方面，本发明提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有程序，所述程序被处理器执行时，能够实现如上所述的商品照片自动化替换背景的方法。

第四方面，本发明还提供了一种终端设备，所述终端设备包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的程序，当所述程序被所述处理器执行时，使得所述终端设备能够实现如上所述的商品照片自动化替换背景的方法。

本发明同现有技术相比，具有如下优点：

(1)本发明能够实现高度自动化：基于本发明方法，用户只需要输入商品图像、目标商品描述、选择风格、背景描述，即可得到替换背景后的图像输入，无需过多的手动操作。

(2)本发明能够生成风格自定义：用户可自定义生成背景风格，如中国风、北欧风、田园风。

(3)本发明生成背景与商品贴合度高：本发明得益于ControlNet的条件控制方法和直方图匹配算法，能够让生成的图像与目标商品有很好的贴合，并且在光影上有较好的一致性。

(4)本发明解决了传统的背景替换方法所存在的操作过程复杂耗时，须依赖相关专业技术，以及生成背景与目标商品风格不搭，光影、亮度匹配等问题。

[附图说明]

图1是本发明商品照片自动化替换背景的方法流程图；

图2是本发明商品背景替换示意图；

图3是本发明实施例输入图像示意图；

图4是本发明实施例给定目标检测提示词示意图；

图5是本发明实施例分割目标商品示意图；

图6是本发明实施例生成目标商品的边缘检测图的示意图；

图7是本发明实施例根据边缘检测和背景提示生成图像示意图；

图8是本发明实施例原始目标商品替换背景示意图。

[具体实施方式]

本发明提供了一种商品照片自动化替换背景的方法，该方法流程为输入带有目标商品的图像和目标商品描述，自动检测出商品位置，根据目标检测的锚框信息，细化商品的分割，扣除原有背景。然后，对扣除原始背景后的目标进行边缘提取，将边缘图作为图像生成的条件，用户选择生成风格并输入生成描述，图像生成模型便生成一个与输入图像中目标商品具有相同位置和相同轮廓的物品图像，最后将目标商品在原始位置上贴于生成图像上方。

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图和具体实施例，对本发明作以下进一步说明：

实施例一

如附图1所示，为本发明商品照片自动化替换背景的方法的整体流程图，该方法包括以下步骤，

目标检测：目标检测算法能够算出目标在图像中的位置，其定位功能能够为目标商品更精确的分割奠定基础，GoundingDino模型可以根据文字描述来定位图像中的目标。本方法利用此模型，可实现通过输入商品的描述来检测商品在图像中的位置。

语义分割：语义分割旨在将图像中的每个像素分配到特定的语义类别中，从而实现对图像的像素级别理解和分割，通过语义分割算法可以保留目标商品在图像中的像素点，并剔除背景。

图像生成：Stable Diffusion(SD)是一种基于潜空间扩散模型的图像生成模型，可根据提示词生成相应的图像。

条件控制生成：为了让SD生成符合要求的图像，本发明使用ControlNet进行条件控制；ControlNet可以根据特定的条件如姿势、边缘等，让SD生成据有相同姿势或边缘的图像。

边缘检测：将目标边缘检测图作为条件，能让图像生成模型生成一个带有与目标商品具有相同位置相同轮廓物品的图像，以此为后续让目标商品在该生成图上贴合奠定基础。本发明方法采用的是Canny边缘提取算法。

低秩适应模型：低秩适应(Low-Rank Adaptation,LoRA)是一种模型参数微调技术，通过LoRA可以让模型学习用户指定的风格或对象，本方法中使用LoRA进行图像生成风格控制。

直方图匹配：直方图匹配是通过比较图像的直方图分布来进行匹配和调整，从而实现图像之间的颜色和亮度的一致性。通过直方图匹配算法，可以使生成的背景与目标商品在光影、亮暗程度上保持一致。

实施例二

使用本发明方法，用户只需输入图像、目标商品描述、选择风格、背景描述，即可得到替换背景后的图像输入，如附图2所示。

具体地，从算法的视角，每个过程图像的输入输出如附图3至附图8所示。步骤(1)为输入图像，如附图3所示；步骤(2)为给定目标检测提示词：Bathtub and faucet，如附图4所示；步骤(3)为分割目标商品，如附图5所示；步骤(4)为生成目标商品的边缘检测图，如附图6所示；步骤(5)为选定风格后，根据边缘检测图和背景提示词生成图像，如附图7所示；步骤(6)为将原始目标商品与生成图像直方图匹配后，在原始位置贴图覆盖生成的浴缸，如附图8所示。

实施例三

本发明提供一种商品照片自动化替换背景的装置，该装置包括：

实施例四

在本发明的另一些实施例中，本发明公开了一种终端设备，所述终端设备包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的程序，当所述程序被所述处理器执行时，使得所述终端设备能够实现如上所述的商品照片自动化替换背景的方法。具体地，该终端设备的硬件组成可包括：一个或多个处理器；存储器；显示器；一个或多个应用程序；以及一个或多个计算机程序，上述各器件可以通过一个或多个通信总线连接。其中所述的一个或多个计算机程序被存储在上述存储器中并被配置为被该一个或多个处理器执行，该一个或多个计算机程序包括指令。

在本发明提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有程序，所述程序被处理器执行时，能够实现如上所述的商品照片自动化替换背景的方法。所述的存储介质包括：快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

以上实施例仅用以说明本发明的技术方案，而并非对其进行限制；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化；尽管参照前述实施例对本发明进行了详细的说明，但本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

本发明不受上述实施方式的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种商品照片自动化替换背景的方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于：商品位置检测时，通过目标检测算法算出目标在图像中的位置，根据文字描述定位图像中的目标，实现通过输入商品的描述来检测商品在图像中的位置。

3.如权利要求1所述的方法，其特征在于：目标商品分割时，通过语义分割将图像中的每个像素分配到特定的语义类别中，实现对图像的像素级别理解和分割，通过语义分割算法保留目标商品在图像中的像素点，并剔除背景。

4.如权利要求1所述的方法，其特征在于：图像生成时，采用Stable Diffusion生成符合要求的图像，Stable Diffusion为基于潜空间扩散模型的图像生成模型，可根据提示词生成相应的图像；并采用ControlNet通讯协议进行条件控制，使Stable Diffusion图像生成模型生成据有相同姿势或边缘的图像。

5.如权利要求1所述的方法，其特征在于：采用Canny边缘提取算法进行边缘检测，并使用LoRA低秩适应模型进行图像生成风格控制，LoRA低秩适应模型是一种模型参数微调技术。

6.如权利要求1所述的方法，其特征在于：通过直方图匹配算法，使生成的背景与目标商品在光影、亮暗程度上保持一致，直方图匹配是通过比较图像的直方图分布来进行匹配和调整，从而实现图像之间的颜色和亮度的一致性。

7.一种商品照片自动化替换背景的装置，其特征在于，包括：

8.如权利要求7所述的装置，其特征在于：所述图像生成模块使用LoRA低秩适应模型进行图像生成风格控制，并通过直方图匹配算法使生成的背景与目标商品在光影、亮暗程度上保持一致。

9.一种计算机可读存储介质，所述计算机可读存储介质内存储有程序，其特征在于：所述程序被处理器执行时，实现如权利要求1至6中任一项所述的方法。

10.一种终端设备，其特征在于，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的程序，当所述程序被所述处理器执行时，使得所述终端设备实现如权利要求1至6中任一项所述的方法。