WO2024040767A1

WO2024040767A1 - 一种图像数据增强方法及装置

Info

Publication number: WO2024040767A1
Application number: PCT/CN2022/133392
Authority: WO
Inventors: 孙立奋
Original assignee: 天翼数字生活科技有限公司
Priority date: 2022-08-22
Filing date: 2022-11-22
Publication date: 2024-02-29
Also published as: CN115631118A

Abstract

本申请公开了一种图像数据增强方法及装置，方法包括：将预置目标图像的背景图调整到与前景图的大小一致，预置目标图像包括前景图和背景图；采用预设掩模对前景图进行掩模计算，得到掩模前景图；采用取反后的预设掩模对背景图进行掩模计算，得到掩模背景图；将掩模前景图与掩模背景图相加，得到融合图像；根据前景图对应的前景标签为融合图像配置融合标签。本申请能够解决现有技术容易改变数据集的分布状态，或者增加图像识别难度，导致模型不易收敛的技术问题。

Description

一种图像数据增强方法及装置

技术领域

本申请涉及图像处理技术领域，尤其涉及一种图像数据增强方法及装置。

背景技术

深度学习是一项通过模型参数拟合数据样本的技术。完备的数据集对于模型的拟合至关重要。但在实际的业务场景中，如图片内容审核，数据由于隐私或敏感性等因素难以大量收集，从而导致收集的样本缺乏多样性，存在类别不平衡问题，如何通过已有数据集训练符合业务需求的模型成为AI模型产业落地的一个基础问题。数据增强正是一门通过增加样本的多样性以提高模型的泛化能力，从而提高模型的识别准确度的技术。

传统的图像增强方法大概可以分为两类，一类是基于区域填充的图像数据增强，另一类是基于图片融合的数据增强；前者的填充方式可能会改变图像的分布，导致测试集与训练集分布不一致，且模型难以收敛；后者的融合方式虽然不改变数据集的分布，但是识别难度因为噪声的带入有所提升，且融合图像的质量较差，不利于模型收敛。

发明内容

本申请提供了一种图像数据增强方法及装置，用于解决现有技术容易改变数据集的分布状态，或者增加图像识别难度，导致模型不易收敛的技术问题。

有鉴于此，本申请第一方面提供了一种图像数据增强方法，包括：

将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图；

采用预设掩模对所述前景图进行掩模计算，得到掩模前景图；

采用取反后的预设掩模对所述背景图进行掩模计算，得到掩模背景图；

将所述掩模前景图与所述掩模背景图相加，得到融合图像；

根据所述前景图对应的前景标签为所述融合图像配置融合标签。

优选地，所述将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图，包括：

分别获取前景图与背景图的高和宽，得到前景高、前景宽、背景高和背景宽；

若所述背景高大于所述前景高，且所述背景宽大于前景宽，则从所述背景图中裁剪一张与所述前景图大小一致的图片作为调整大小后的背景图，若否，则将所述背景图的大小调整至与所述前景图大小一致。

优选地，所述将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图，之前还包括：

获取初始目标图像后作预处理操作，得到预置目标图像；

将所述预置目标图像进行图像分割操作，得到前景图和背景图；

分别为所述前景图和背景图配置图像标签，得到前景标签和背景标签。

优选地，所述采用预设掩模对所述前景图进行掩模计算，得到掩模前景图，包括：

将所述预设掩模划分为多个研究单元；

为每个所述研究单元进行赋值操作，得到赋值后的预设掩模；

采用所述赋值后的预设掩模对所述前景图进行掩模计算，得到掩模前景图。

优选地，所述采用预设掩模对所述前景图进行掩模计算，得到掩模前景图，之前还包括：

基于预置目标图像创建预设掩模，所述预设掩模包括预设高和预设宽。

本申请第二方面提供了一种图像数据增强装置，包括：

大小调整模块，用于将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图；

前景计算模块，用于采用预设掩模对所述前景图进行掩模计算，得到掩模前景图；

背景计算模块，用于采用取反后的预设掩模对所述背景图进行掩模计算，得到掩模背景图；

图像融合模块，用于将所述掩模前景图与所述掩模背景图相加，得到融合图像；

标签配置模块，用于根据所述前景图对应的前景标签为所述融合图像配置融合标签。

优选地，所述大小调整模块，具体用于：

优选地，还包括：

准备模块，用于获取初始目标图像后作预处理操作，得到预置目标图像；

优选地，所述前景计算模块，具体用于：

将所述预设掩模划分为多个研究单元；

优选地，还包括：

掩模创建模块，用于基于预置目标图像创建预设掩模，所述预设掩模包括预设高和预设宽。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请中，提供了一种图像数据增强方法，包括：将预置目标图像的背景图调整到与前景图的大小一致，预置目标图像包括前景图和背景图；采用预设掩模对前景图进行掩模计算，得到掩模前景图；采用取反后的预设掩模对背景图进行掩模计算，得到掩模背景图；将掩模前景图与掩模背景图相加，得到融合图像；根据前景图对应的前景标签为融合图像配置融合标签。

本申请提供的图像数据增强方法，结合了GridMask和Mixup两种图像增强算法，将预置目标图像的背景图和前景图进行掩模计算，然后进行融合处理，得到新增的融合图像；在此过程中提升了图像样本的多样性，而且不会改变图像数据集的分布状态，而掩模计算过程可以权衡噪声与主要信息的去留，能够避免模型局部最优，可以提升模型的泛化能力。因此，本申请能够解决现有技术容易改变数据集的分布状态，或者增加图像识别难度，导致模型不易收敛的技术问题。

附图说明

图1为本申请实施例提供的一种图像数据增强方法的一个流程示意图；

图2为本申请实施例提供的一种图像数据增强装置的结构示意图；

图3为本申请实施例提供的预设掩模的研究单元示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供的一种图像数据增强方法的实施例，包括：

步骤101、将预置目标图像的背景图调整到与前景图的大小一致，预置目标图像包括前景图和背景图。

进一步地，步骤101，包括：

预置目标图像是本实施例中主要处理的待增强图片，其中的前景图和背景图并不一定是对应关系的，即前景图和背景图可能来自不同图像，并不影响本实施例方法的执行。

若背景高大于前景高，且背景宽大于前景宽，则从背景图中裁剪一张与前景图大小一致的图片作为调整大小后的背景图，若否，则将背景图的大小调整至与前景图大小一致。

若背景图的背景高与背景宽表示为w_b，h_b，前景图的前景高与前景宽表示为w，h；那么判断过程即为：若w_b＞w，且h_b＞h，说明背景图比前景图大，直接从背景图中裁剪一块与前景图大小一致的图片作为背景图，即完成了背景图的大小调整；若是否，则说明背景图比前景图小，无法裁剪得到与前景图大小一致的背景区域，所以需要直接调整背景图的大小，将其宽和高重置到与前景图大小一致，得到与前景图大小一致的背景图。

进一步地，步骤101，之前还包括：

获取初始目标图像后作预处理操作，得到预置目标图像；

将预置目标图像进行图像分割操作，得到前景图和背景图；

分别为前景图和背景图配置图像标签，得到前景标签和背景标签。

可以理解，初始图像可以是不同应用领域的图像，且前景图与背景图可以是来自同一张图像，也可以来自不同图像；即前景图可以在隐私信息识别任务中的图像，例如身份证、银行卡和驾驶证等，而背景图则可以是不包含隐私信息的图片，这就意味着本实施例中的前景图和背景图除了通过分割的方式得到，也可以是各自独立采样得到，具体的方式不作限定。

初始目标图像作基本预处理操作后可以提高图像质量，减少噪声干扰，便于后续图像处理。预置目标图像进行前景背景分割后可以得到前景图和背景图，也可以通过其他方式获取前景和背景，具体的方式不作限定，本实施例仅给出一种获取前景图和背景图的示例。而配置前景标签和背景标签则是便于后续的融合图像的标签配置操作；背景图的标签可表示为background，前景图的标签可以表示为foreground。

步骤102、采用预设掩模对前景图进行掩模计算，得到掩模前景图。

进一步地，步骤102，包括：

将预设掩模划分为多个研究单元；

为每个研究单元进行赋值操作，得到赋值后的预设掩模；

采用赋值后的预设掩模对前景图进行掩模计算，得到掩模前景图。

请参阅图3，图中虚线框出的区域为一个研究单元，该研究单元需要配置信息系数r，若r＝0.2，则表示研究单元中至少要保留0.2的图片信息；这个参数可以根据实际情况设置，在此不作限定。图3中还有一些参数，其中d为一个研究单元的边长，1为前景与前景之间的间隔，st_h为纵轴初始偏移量，st_w为横轴初始偏移量。划分研究单元的目的是给掩膜相应的研究单元进行赋值(0或1)；此外需要说明的是，掩膜的大小要比前景图要大，后续旋转掩膜后依然能截取出一块与前景图大小一样的子掩膜。在一个研究单元内，信息系数r与前景间的间隔1之间的关系可以表示为：

其中，d为研究单元边长。

预设掩模需要作一些预处理操作，高宽分别进行坐标计算，即将掩模的高划分为hh/d个研究单元，hh为正方形预设掩模边长，然后遍历每个研究单元，定义s为第i个研究单元的起始坐标，那么s＝d×i+st _h，其中，t _h为第i个研究单元内前景与背景掩模的分割线，即t _h＝s+1，将mask相应的值置0。然后，将掩模的宽也划分为hh/d个研究单元，并遍历每个研究单元；s为第i个研究单元的起始坐标，所以有s＝d×i+st _w，将mask相应的值置0。

预设掩模需要进行随机旋转，产生一个预置旋转角度，得到旋转的掩模。具体执行过程中，旋转后的预设掩模需要截取一个高宽与前景图高宽一致的子区域，以此更新预设掩模，即：

mask＝mask[(hh-h)//2：(hh-h)//2+h，(hh-w)//2：(hh-w)//2+w]

处理好预设掩模与研究单元后，将掩模与前景图进行乘计算就可以得到掩模前景图p1，即p1＝mask*img_f，其中，mask为掩模，img_f为前景图。

进一步地，步骤102，之前还包括：

基于预置目标图像创建预设掩模，预设掩模包括预设高和预设宽。

创建的预设掩模为正方形掩模，边长设置为

即预设高与预设宽设置为相同大小，形成正方形掩模，还可以根据需要设置其他大小的预设掩模，具体的不作限定。此外，掩模中所有值赋值为1；而初始创建的掩模值也可以设置为0。

步骤103、采用取反后的预设掩模对背景图进行掩模计算，得到掩模背景图。

以上处理好的预设掩模直接取反，在于背景图相乘计算，就可以得到掩模背景图p2，即p2＝(1-mask)*img_b，其中img_b为背景图。

步骤104、将掩模前景图与掩模背景图相加，得到融合图像。

掩模前景图p1与掩模背景图p2相加可以得到融合图像p，即p＝p1+p2。

步骤105、根据前景图对应的前景标签为融合图像配置融合标签。

背景标签为background，前景标签为foreground，那么融合标签可以表达为：label＝0*background+1*foreground。

本实施例中的图像增强方法不改变整体数据的分布状态，可以提升模型的泛化能力，而掩模背景图与掩模前景图的硬融合可以平衡背景图的噪声与前景图的主要信息，确保融合后的图像保留主要信息；而融合标签也进行硬融合处理，直接使用业务类别作为标签，避免了标签软融合不准确导致模型难以收敛的问题；此外，本实施例中的方法通过目标非填充区域的特征学习可以避免模型陷入局部最优，提高模型识别准确率。

本申请实施例提供的图像数据增强方法，结合了GridMask和Mixup两种图像增强算法，将预置目标图像的背景图和前景图进行掩模计算，然后进行融合处理，得到新增的融合图像；在此过程中提升了图像样本的多样性，而且不会改变图像数据集的分布状态，而掩模计算过程可以权衡噪声与主要信息的去留，能够避免模型局部最优，可以提升模型的泛化能力。因此，本申请实施例能够解决现有技术容易改变数据集的分布状态，或者增加图像识别难度，导致模型不易收敛的技术问题。

为了便于理解，请参阅图2，本申请提供了一种图像数据增强装置的实施例，包括：

大小调整模块201，用于将预置目标图像的背景图调整到与前景图的大小一致，预置目标图像包括前景图和背景图；

前景计算模块202，用于采用预设掩模对前景图进行掩模计算，得到掩模前景图；

背景计算模块203，用于采用取反后的预设掩模对背景图进行掩模计算，得到掩模背景图；

图像融合模块204，用于将掩模前景图与掩模背景图相加，得到融合图像；

标签配置模块205，用于根据前景图对应的前景标签为融合图像配置融合标签。

进一步地，大小调整模块201，具体用于：

进一步地，还包括：

准备模块206，用于获取初始目标图像后作预处理操作，得到预置目标图像；

将预置目标图像进行图像分割操作，得到前景图和背景图；

进一步地，前景计算模块202，具体用于：

将预设掩模划分为多个研究单元；

为每个研究单元进行赋值操作，得到赋值后的预设掩模；

进一步地，还包括：

掩模创建模块207，用于基于预置目标图像创建预设掩模，预设掩模包括预设高和预设宽。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以通过一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-Only Memory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种图像数据增强方法，其特征在于，包括：

将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图；

采用预设掩模对所述前景图进行掩模计算，得到掩模前景图；

采用取反后的预设掩模对所述背景图进行掩模计算，得到掩模背景图；

将所述掩模前景图与所述掩模背景图相加，得到融合图像；

根据所述前景图对应的前景标签为所述融合图像配置融合标签。
根据权利要求1所述的图像数据增强方法，其特征在于，所述将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图，包括：

分别获取前景图与背景图的高和宽，得到前景高、前景宽、背景高和背景宽；

若所述背景高大于所述前景高，且所述背景宽大于前景宽，则从所述背景图中裁剪一张与所述前景图大小一致的图片作为调整大小后的背景图，若否，则将所述背景图的大小调整至与所述前景图大小一致。
根据权利要求1所述的图像数据增强方法，其特征在于，所述将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图，之前还包括：

获取初始目标图像后作预处理操作，得到预置目标图像；

将所述预置目标图像进行图像分割操作，得到前景图和背景图；

分别为所述前景图和背景图配置图像标签，得到前景标签和背景标签。
根据权利要求1所述的图像数据增强方法，其特征在于，所述采用预设掩模对所述前景图进行掩模计算，得到掩模前景图，包括：

将所述预设掩模划分为多个研究单元；

为每个所述研究单元进行赋值操作，得到赋值后的预设掩模；

采用所述赋值后的预设掩模对所述前景图进行掩模计算，得到掩模前景图。
根据权利要求1所述的图像数据增强方法，其特征在于，所述采用预设掩模对所述前景图进行掩模计算，得到掩模前景图，之前还包括：

基于预置目标图像创建预设掩模，所述预设掩模包括预设高和预设宽。
一种图像数据增强装置，其特征在于，包括：

大小调整模块，用于将预置目标图像的背景图调整到与前景图的大小一致，所述预置目标图像包括前景图和背景图；

前景计算模块，用于采用预设掩模对所述前景图进行掩模计算，得到掩模前景图；

背景计算模块，用于采用取反后的预设掩模对所述背景图进行掩模计算，得到掩模背景图；

图像融合模块，用于将所述掩模前景图与所述掩模背景图相加，得到融合图像；

标签配置模块，用于根据所述前景图对应的前景标签为所述融合图像配置融合标签。
根据权利要求6所述的图像数据增强装置，其特征在于，所述大小调整模块，具体用于：

分别获取前景图与背景图的高和宽，得到前景高、前景宽、背景高和背景宽；

若所述背景高大于所述前景高，且所述背景宽大于前景宽，则从所述背景图中裁剪一张与所述前景图大小一致的图片作为调整大小后的背景图，若否，则将所述背景图的大小调整至与所述前景图大小一致。
根据权利要求6所述的图像数据增强装置，其特征在于，还包括：

准备模块，用于获取初始目标图像后作预处理操作，得到预置目标图像；

将所述预置目标图像进行图像分割操作，得到前景图和背景图；

分别为所述前景图和背景图配置图像标签，得到前景标签和背景标签。
根据权利要求6所述的图像数据增强装置，其特征在于，所述前景计算模块，具体用于：

将所述预设掩模划分为多个研究单元；

为每个所述研究单元进行赋值操作，得到赋值后的预设掩模；

采用所述赋值后的预设掩模对所述前景图进行掩模计算，得到掩模前景图。
根据权利要求6所述的图像数据增强装置，其特征在于，还包括：

掩模创建模块，用于基于预置目标图像创建预设掩模，所述预设掩模包括预设高和预设宽。