CN114529788A

CN114529788A - 工业检测中的样本生成方法、样本生成装置

Info

Publication number: CN114529788A
Application number: CN202210436230.7A
Authority: CN
Inventors: 张焱; 张志琦; 赵何
Original assignee: Jiangsu Zhiyun Tiangong Technology Co ltd
Current assignee: Jiangsu Zhiyun Tiangong Technology Co ltd
Priority date: 2022-04-25
Filing date: 2022-04-25
Publication date: 2022-05-24

Abstract

本发明涉及工业检测技术领域，提供一种工业检测中的样本生成方法、样本生成装置，所述方法包括：控制绘制工具在待绘制图像上以第一笔触绘制背景图像，以得到第一图像；获取目标图像的语义图，控制绘制工具根据语义图采用第二笔触在第一图像的基础上绘制前景图像，以得到第二图像；通过第一图像对第一CGAN网络进行训练，以输出背景奖励；通过第二图像对第二CGAN网络进行训练，以输出前景奖励；背景奖励与前景奖励满足设定要求，则完成智能体的训练；通过训练后的智能体生成样本。本发明通过不同的笔触分别绘制前景图像和背景图像，增强了前景中实例的关注，使每次绘制的结果更加接近真实的目标图像，进而可以准确生成所需的工业样本数据。

Description

工业检测中的样本生成方法、样本生成装置

技术领域

本发明涉及工业检测技术领域，具体涉及一种工业检测中的样本生成方法、一种工业检测中的样本生成装置。

背景技术

工业计算机视觉任务主要有：定位、检测、分割、分类，通常是软硬件相结合的方式。以工业质检为例，硬件部分通过机械臂或者其他抓取工具将待检测物体放在固定位置，然后通过光学相机进行图像采集，再通过训练后的模型进行目标识别。

其中，样本数量是整个模型训练中的关键问题，然而工业现场中样本的数量本身就少，且类型单一，从而导致训练后的模型识别效果不佳的问题，所以样本生成技术在工业质检领域也有广泛的应用。

相关技术中，样本生成技术一般采用人工伪造的方法，人工伪造就是利用工具，通过物理方法，去模拟生成带缺陷的样本，但这种方法，极大的消耗人力，物力，同时仿造出来的缺陷数量有限。另外，虽然有利用GAN（Generative Adversarial Networks，生成对抗网络）的方式进行样本生成，但是该方式生成的图像不够真实，从而带来工业质检效果差、准确度低的问题。

发明内容

为解决上述技术问题，本发明的第一个目的在于提出一种工业检测中的样本生成方法，在样本生成中使用语义图来区别前景和背景之间的特征，通过不同的笔触分别绘制前景图像和背景图像，为每个笔触分配一个特殊的奖励，每绘制一次都会受到CGAN（Conditional Generative Adversarial Networks，条件生成式对抗网络）的奖励与惩罚，增强了对每个前景中实例的关注，使每次绘制的结果更加接近真实的目标图像，进而可以高效地进行大规模的样本生成任务，有利于提高工业质检的准确度，保证质检效果。

本发明的第二个目的在于提出一种工业检测中的样本生成装置。

本发明采用的技术方案如下：

本发明第一方面的实施例提出了一种工业检测中的样本生成方法，包括以下步骤：步骤S1，输入待绘制图像和目标图像，所述待绘制图像初始状态为空白图像，所述目标图像包括标签和位置；步骤S2，控制绘制工具在所述待绘制图像上以第一笔触绘制背景图像，以得到第一图像；步骤S3，获取所述目标图像的语义图，控制所述绘制工具根据所述语义图采用第二笔触在所述第一图像的基础上绘制前景图像，以得到第二图像；步骤S4，根据所述第一图像对第一CGAN网络进行训练，以使所述第一CGAN网络根据第一奖惩机制输出所述第一图像与所述目标图像之间的背景奖励；步骤S5，根据所述第二图像对第二CGAN网络进行训练，以使所述第二CGAN网络根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励；步骤S6，判断所述背景奖励与所述前景奖励是否满足设定要求；步骤S7，如果所述背景奖励与所述前景奖励满足设定要求，则完成所述绘制工具、所述第一CGAN网络和所述第二CGAN网络构成的智能体的训练；步骤S8，通过训练后的智能体生成样本。

本发明上述提出的工业检测中的样本生成方法还可以具有如下附加技术特征：

根据本发明的一个实施例，所述第二图像的表达式如下：

；

其中，

表示第二图像的背景，

表示所述第二图像的向量，

表示目标图像的语义图，

表示第二笔触，

表示采用第二笔触进行绘制，

表示矩阵对应元素相乘，

表示彩色绘制，

表示第一笔触，

表示第一图像的向量，

表示采用第一笔触进行绘制。

根据本发明的一个实施例，所述背景奖励和所述前景奖励分别为：

；

其中，

代表背景奖励，

代表前景奖励，

表示通过第一CGAN网络的判别器分数计算奖励，

表示通过第二CGAN网络的判别器分数计算奖励，

表示目标图像。

根据本发明的一个实施例，上述的样本生成方法还包括：将所述目标图像的语义图和所述第二图像输入神经网络模型中，以提取第二图像的前景图像和目标图像的语义图的前景图像；将所述第二图像的前景图像、目标图像的语义图的前景图像输入所述第二CGAN网络进行训练，以使所述第二CGAN网络根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励。

根据本发明的一个实施例，所述第一CGAN网络和所述第二CGAN网络通过反向传播算法进行梯度下降，且所述第二CGAN网络采用特征引导反向传播图缩放的方式进行反向传播。

本发明第二方面的实施例提出了一种工业检测中的样本生成装置，包括：绘制工具，所述绘制工具用于在待绘制图像上以第一笔触绘制背景图像，以得到第一图像，以及，根据目标图像的语义图采用第二笔触在所述第一图像的基础上绘制前景图像，以得到第二图像，所述待绘制图像初始状态为空白图像，所述目标图像包括标签和位置；第一CGAN网络，所述第一CGAN网络用于根据所述第一图像进行训练，以根据第一奖惩机制输出所述第一图像与所述目标图像之间的背景奖励；第二CGAN网络，所述第二CGAN网络用于根据所述第二图像进行训练，以根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励；判断模块，所述判断模块用于判断所述背景奖励与所述前景奖励是否满足设定要求；生成模块，所述生成模块用于在所述背景奖励与所述前景奖励满足设定要求时，完成所述绘制工具、所述第一CGAN网络和所述第二CGAN网络构成的智能体的训练，并通过训练后的智能体生成样本。

本发明上述提出的工业检测中的样本生成装置还可以具有如下附加技术特征：

根据本发明的一个实施例，所述第二图像的表达式如下：

其中，

表示第二图像的背景，

表示所述第二图像的向量，

表示目标图像的语义图，

表示第二笔触，

表示采用第二笔触进行绘制，

表示矩阵对应元素相乘，

表示彩色绘制，

表示第一笔触，

表示第一图像的向量，

表示采用第一笔触进行绘制。

根据本发明的一个实施例，第一CGAN网络和第二CGAN网络分别根据以下公式输出所述背景奖励和所述前景奖励：

；

其中，

代表背景奖励，

代表前景奖励，

表示通过第一CGAN网络的判别器分数计算奖励，

表示通过第二CGAN网络的判别器分数计算奖励，

表示目标图像。

根据本发明的一个实施例，上述的样本生成装置还包括：神经网络模型，所述神经网络模型用于根据所述目标图像的语义图和所述第二图像，提取第二图像的前景图像和目标图像的语义图的前景图像，并将所述第二图像的前景图像、目标图像的语义图的前景图像输入所述第二CGAN网络进行训练，以使所述第二CGAN网络根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励。

本发明的有益效果：

1、本发明在样本生成中使用语义图来区别前景和背景之间的特征，通过不同的笔触分别绘制前景图像和背景图像，为每个笔触分配一个特殊的奖励，每绘制一次都会受到CGAN的奖励与惩罚，增强了对每个前景中实例的关注，使每次绘制的结果更加接近真实的目标图像，进而可以高效地进行大规模的样本生成任务，有利于提高工业质检的准确度，保证质检效果。

2、在绘制过程引入了神经网络模型来减少模型，该模型联合了目标位置和空间转换网络，将真实图像中的前景与绘制图像的前景提取出来进行计算相似程度，并计算相应前景奖励，从而为判别器提供更加标准化的输入，减少模型的计算量的同时增加了生成图像的精确度。

3、在反向传播过程中加入了特征导向反向传播，它可以更加关注前景实例和图像特征，使得智能体在提取全局信息的基础上更加注重局部信息，生成具有较强细节的图像。

附图说明

图1是根据本发明一个实施例的工业检测中的样本生成方法的流程图；

图2是根据本发明一个实施例的工业检测中的样本生成方法的原理示意图；

图3是根据本发明一个实施例的工业检测中的样本生成装置的方框示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是根据本发明一个实施例的工业检测中的样本生成方法的流程图。如图1所示，该方法包括以下步骤：

步骤S1，输入待绘制图像和目标图像，待绘制图像初始状态为空白图像，目标图像包括标签和位置。

具体地，待绘制图像的初始状态为空白图像，目标图像为真实标签图像，为想要绘制成的图像。

步骤S2，控制绘制工具在待绘制图像上以第一笔触绘制背景图像，以得到第一图像。

步骤S3，获取目标图像的语义图，控制绘制工具根据语义图采用第二笔触在第一图像的基础上绘制前景图像，以得到第二图像。

根据本发明的一个实施例，第二图像的表达式如下：

其中，

表示第二图像的背景，

表示第二图像的向量，

表示目标图像的语义图，

表示第二笔触，

表示采用第二笔触进行绘制，

表示矩阵对应元素相乘，

表示彩色绘制，

表示第一笔触，

表示第一图像的向量，

表示采用第一笔触进行绘制。

步骤S4，根据第一图像对第一CGAN网络进行训练，以使第一CGAN网络根据第一奖惩机制输出第一图像与目标图像之间的背景奖励。

进一步地，在本发明的一个实施例中，背景奖励和前景奖励分别为：

其中，

代表背景奖励，

代表前景奖励，

表示通过第一CGAN网络的判别器分数计算奖励，

表示通过第二CGAN网络的判别器分数计算奖励，

表示目标图像。

步骤S5，根据第二图像对第二CGAN网络进行训练，以使第二CGAN网络根据第二奖惩机制输出第二图像与目标图像的语义图之间前景奖励。

步骤S6，判断背景奖励与前景奖励是否满足设定要求。如果背景奖励与前景奖励满足设定要求，则执行步骤S7；如果背景奖励或前景奖励不满足设定要求，则返回步骤S2。

步骤S7，完成绘制工具、第一CGAN网络和第二CGAN网络构成的智能体的训练。

步骤S8，通过训练后的智能体生成样本。

具体地，如图2所示，输入一张待绘制图像和对应的目标图像，然后控制绘制工具（网络

）采取绘制动作（相当于一个action），绘制工具通过不同的笔触关注不同的语义区域，用于绘制图像背景与前景的笔触会有不同的分布，笔触在网络是通过一个1*13的向量实现的，前十个变量分别是位置、形状、透明度等，后三个变量表示rgb（红-绿-蓝）颜色信息。

本发明中，先采用第一笔触

在待绘制图像进行一次绘制动作绘制背景图像，待绘制图像的背景图像的状态发生改变，待绘制图像变为第一图像，第一图像的状态（向量）为

，将第一图像输入第一CGAN网络，第一CGAN网络可以根据第一图像和目标图像进行训练，第一CGAN网络的判别器根据第一奖惩机制计算目标图像与第一图像之间的相似程度以输出第一图像与目标图像之间的背景奖励

。

在采用第一笔触

在待绘制图像进行一次绘制动作绘制背景图像后，还需控制绘制工具在第一图像的基础上进行第二次绘制，具体先获取目标图像的语义图，以根据语义图区别前景和背景之间的特征，然后根据目标图像的语义图在第一图像的基础上采用第二笔触

在第一图像上进行一次绘制动作绘制前景图像，第一图像的状态发生改变，生成第二图像，第二图像的状态（向量）为

，然后将第二图像输入至第二CGAN网络进行训练，第二CGAN网络的判别器根据第二奖惩机制计算目标图像语义图的前景图像与第二图像之间的相似程度以输出第二图像与目标图像的语义图之间前景奖励

。

前景奖励

与背景奖励

可以为【0，10】之间的数值，每绘制一次，都会受到CGAN 的奖励与惩罚，并输出相应的奖励值。整个网络（绘制工具、第一CGAN网络和第二CGAN网络）相当于一个智能体，深度强化学习在训练智能体的过程中学习的是policyπ函数，该函数可以指导智能体在当前环境中做下一步动作，并与环境进行交互，得到下一步的奖励。训练停止时间通常通过设置指定的步数来确定，当奖励最终收敛到一定程度也可以停止训练。

本发明的一个具体实施例中，根据背景奖励与前景奖励是否满足设定要求判断是否完成训练，如果背景奖励与前景奖励满足设定要求，说明绘制的图像与目标图像的相似度达到要求，完成智能体的训练，如果背景奖励或前景奖励不满足设定要求，则继续控制绘制工具进行双层绘制，直至达到设定要求。

完成智能体训练后，通过自然样本或者良品进行测试，即可生成所需的样本数据。对于工业检测中的缺陷样本生成，可以对收集的不均衡缺陷样本数据集进行智能体训练与测试，并通过得到的智能体推理出良品生成的缺陷样本结果。

由此，在样本生成中使用语义图来区别前景和背景之间的特征，通过不同的笔触分别绘制前景图像和背景图像，为每个笔触分配一个特殊的奖励，每绘制一次都会受到CGAN的奖励与惩罚，增强了对每个前景中实例的关注，使每次绘制的结果更加接近真实的目标图像，进而可以高效地进行大规模的样本生成任务，有利于提高工业质检的准确度，保证质检效果。

根据本发明的一个实施例，上述的工业检测中的样本生成方法还可以包括：将目标图像的语义图和第二图像输入神经网络模型中，以提取第二图像的前景图像和目标图像的语义图的前景图像；将第二图像的前景图像、目标图像的语义图的前景图像输入第二CGAN网络进行训练，以使第二CGAN网络根据第二奖惩机制输出第二图像与目标图像的语义图之间前景奖励。

具体地，在计算前景奖励

时，其准确性在很大程度上取决于第二CGAN的判别器获取目标图像的语义图中前景图像与当待绘制图像状态之间的相似程度。然而，输入到 CGAN判别器的标签位置和大小不同，那么判定的方差就会很大，对真实世界更为复杂的数据集有更大的挑战。为此，本发明提出在智能体中加入一个神经网络模型，该模型联合了目标位置和空间转换网络，将第二图像的前景图像和目标图像的语义图的前景图像提取出来再计算相似程度，并计算相应前景奖励，从而为判别器提供更加标准化的输入，减少模型的计算量的同时增加了生成图像的精确度。

根据本发明的一个实施例，第一CGAN网络和第二CGAN网络通过反向传播算法进行梯度下降，且第二CGAN网络采用特征引导反向传播图缩放的方式进行反向传播。

具体地，使用CGAN的奖惩机制会让生成的图像变得更加抽象，这是由于CGAN的分数由奖励功能训练引起的，而对面积较小且有区别的物体特征没有给予足够的注意。例如，当我们的笔触捕获到缺陷样本的全局特征时，如形状和颜色等，就会对重要的缺陷样本特征描绘的不充分，比如刮伤的深度信息，凹坑的凹陷感，以及砂痕印中每个小刮痕的细节信息等等。为了解决这一问题，本发明在反向传播算法的基础上，增加了特征引导反向传播图缩放的方式进行反向传播，以放大对每个前景实例显著特征的关注，可以引导反向传播图来缩放，体现出绘制过程中不同图像区域的相对重要性。因此，通过最大化奖励，让笔触在绘制过程中，可以增强对每个前景实例和背景特征的关注，从而来权衡绘画过程中不同图像区域特征的相对重要性。因此，智能体就会生成具有较强细节的图像。

综上，根据本发明实施例的工业检测中的样本生成方法，在样本生成中使用语义图来区别前景和背景之间的特征，通过不同的笔触分别绘制前景图像和背景图像，为每个笔触分配一个特殊的奖励，每绘制一次都会受到CGAN的奖励与惩罚，增强了对每个前景中实例的关注，使每次绘制的结果更加接近真实的目标图像，进而可以高效地进行大规模的样本生成任务，有利于提高工业质检的准确度，保证质检效果；在绘制过程引入了神经网络模型来减少模型，该模型联合了目标位置和空间转换网络，将真实图像中的前景与绘制图像的前景提取出来进行计算相似程度，并计算相应前景奖励，从而为判别器提供更加标准化的输入，减少模型的计算量的同时增加了生成图像的精确度；在反向传播过程中加入了特征导向反向传播，它可以更加关注前景实例和图像特征，使得智能体在提取全局信息的基础上更加注重局部信息，生成具有较强细节的图像。

与上述的工业检测中的样本生成方法相对应，本发明还提出一种工业检测中的样本生成装置。由于本发明的装置实施例与上述的方法实施例相对应，对于装置实施例中未披露的细节可参照上述的方法实施例，本发明中不再进行赘述。

图3是根据本发明一个实施例的工业检测中的样本生成装置的方框示意图，如图3所示，该装置包括：绘制工具1、第一CGAN网络2、第二CGAN网络3、判断模块4和生成模块5。

其中，绘制工具1用于在待绘制图像上以第一笔触绘制背景图像，以得到第一图像，以及，根据目标图像的语义图采用第二笔触在第一图像的基础上绘制前景图像，以得到第二图像，待绘制图像初始状态为空白图像，目标图像包括标签和位置；第一CGAN网络2用于根据第一图像进行训练，以根据第一奖惩机制输出第一图像与目标图像之间的背景奖励；第二CGAN网络3用于根据第二图像进行训练，以根据第二奖惩机制输出第二图像与目标图像的语义图之间前景奖励；判断模块4用于判断背景奖励与前景奖励是否满足设定要求；生成模块5用于在背景奖励与前景奖励满足设定要求时，完成绘制工具、第一CGAN网络和第二CGAN网络构成的智能体的训练，并通过训练后的智能体生成样本。

根据本发明的一个实施例，第二图像的表达式如下：

其中，

表示第二图像的背景，

表示第二图像的向量，

表示目标图像的语义图，

表示第二笔触，

表示采用第二笔触进行绘制，

表示矩阵对应元素相乘，

表示彩色绘制，

表示目标图像的语义图，

表示第一笔触，

表示第一图像的向量，

表示采用第一笔触进行绘制。

根据本发明的一个实施例，第一CGAN网络2和第二CGAN网络3分别根据以下公式输出背景奖励和前景奖励：

其中，

代表背景奖励，

代表前景奖励，

表示通过第一CGAN网络的判别器分数计算奖励，

表示通过第二CGAN网络的判别器分数计算奖励，

表示目标图像。

根据本发明的一个实施例，上述的样本生成装置还包括：神经网络模型，神经网络模型用于根据目标图像的语义图和第二图像，提取第二图像的前景图像和目标图像的语义图的前景图像，并将第二图像的前景图像、目标图像的语义图的前景图像输入第二CGAN网络3进行训练，以使第二CGAN网络3根据第二奖惩机制输出第二图像与目标图像的语义图之间前景奖励。

根据本发明的一个实施例，第一CGAN网络2和第二CGAN网络3通过反向传播算法进行梯度下降，且第二CGAN网络3采用特征引导反向传播图缩放的方式进行反向传播。

综上，根据本发明实施例的工业检测中的样本生成装置，在样本生成中使用语义图来区别前景和背景之间的特征，通过不同的笔触分别绘制前景图像和背景图像，为每个笔触分配一个特殊的奖励，每绘制一次都会受到CGAN的奖励与惩罚，增强了对每个前景中实例的关注，使每次绘制的结果更加接近真实的目标图像，进而可以高效地进行大规模的样本生成任务，有利于提高工业质检的准确度，保证质检效果；在绘制过程引入了神经网络模型来减少模型，该模型联合了目标位置和空间转换网络，将真实图像中的前景与绘制图像的前景提取出来进行计算相似程度，并计算相应前景奖励，从而为判别器提供更加标准化的输入，减少模型的计算量的同时增加了生成图像的精确度；在反向传播过程中加入了特征导向反向传播，它可以更加关注前景实例和图像特征，使得智能体在提取全局信息的基础上更加注重局部信息，生成具有较强细节的图像。

在本发明的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必针对相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置），便携式计算机盘盒（磁装置），随机存取存储器（RAM），只读存储器（ROM），可擦除可编辑只读存储器（EPROM或闪速存储器），光纤装置，以及便携式光盘只读存储器（CDROM）。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种工业检测中的样本生成方法，其特征在于，包括以下步骤：

步骤S1，输入待绘制图像和目标图像，所述待绘制图像初始状态为空白图像，所述目标图像包括标签和位置；

步骤S2，控制绘制工具在所述待绘制图像上以第一笔触绘制背景图像，以得到第一图像；

步骤S3，获取所述目标图像的语义图，控制所述绘制工具根据所述语义图采用第二笔触在所述第一图像的基础上绘制前景图像，以得到第二图像；

步骤S4，根据所述第一图像对第一CGAN网络进行训练，以使所述第一CGAN网络根据第一奖惩机制输出所述第一图像与所述目标图像之间的背景奖励；

步骤S5，根据所述第二图像对第二CGAN网络进行训练，以使所述第二CGAN网络根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励；

步骤S6，判断所述背景奖励与所述前景奖励是否满足设定要求；

步骤S7，如果所述背景奖励与所述前景奖励满足设定要求，则完成所述绘制工具、所述第一CGAN网络和所述第二CGAN网络构成的智能体的训练；

步骤S8，通过训练后的智能体生成样本。

2.根据权利要求1所述的工业检测中的样本生成方法，其特征在于，所述第二图像的表达式如下：

；

其中，

表示第二图像的背景，

表示所述第二图像的向量，

表示目标图像的语义图，

表示第二笔触，

表示采用第二笔触进行绘制，

表示矩阵对应元素相乘，

表示彩色绘制，

表示第一笔触，

表示第一图像的向量，

表示采用第一笔触进行绘制。

3.根据权利要求2所述的工业检测中的样本生成方法，其特征在于，所述背景奖励和所述前景奖励分别为：

；

其中，

代表背景奖励，

代表前景奖励，

表示通过第一CGAN网络的判别器分数计算奖励，

表示通过第二CGAN网络的判别器分数计算奖励，

表示目标图像。

4.根据权利要求1所述的工业检测中的样本生成方法，其特征在于，还包括：

将所述目标图像的语义图和所述第二图像输入神经网络模型中，以提取第二图像的前景图像和目标图像的语义图的前景图像；

将所述第二图像的前景图像、目标图像的语义图的前景图像输入所述第二CGAN网络进行训练，以使所述第二CGAN网络根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励。

5.根据权利要求3所述的工业检测中的样本生成方法，其特征在于，所述第一CGAN网络和所述第二CGAN网络通过反向传播算法进行梯度下降，且所述第二CGAN网络采用特征引导反向传播图缩放的方式进行反向传播。

6.一种工业检测中的样本生成装置，其特征在于，包括：

绘制工具，所述绘制工具用于在待绘制图像上以第一笔触绘制背景图像，以得到第一图像，以及，根据目标图像的语义图采用第二笔触在所述第一图像的基础上绘制前景图像，以得到第二图像，所述待绘制图像初始状态为空白图像，所述目标图像包括标签和位置；

第一CGAN网络，所述第一CGAN网络用于根据所述第一图像进行训练，以根据第一奖惩机制输出所述第一图像与所述目标图像之间的背景奖励；

第二CGAN网络，所述第二CGAN网络用于根据所述第二图像进行训练，以根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励；

判断模块，所述判断模块用于判断所述背景奖励与所述前景奖励是否满足设定要求；

生成模块，所述生成模块用于在所述背景奖励与所述前景奖励满足设定要求时，完成所述绘制工具、所述第一CGAN网络和所述第二CGAN网络构成的智能体的训练，并通过训练后的智能体生成样本。

7.根据权利要求6所述的工业检测中的样本生成装置，其特征在于，所述第二图像的表达式如下：

；

其中，

表示第二图像的背景，

表示所述第二图像的向量，

表示目标图像的语义图，

表示第二笔触，

表示采用第二笔触进行绘制，

表示矩阵对应元素相乘，

表示彩色绘制，

表示第一笔触，

表示第一图像的向量，

表示采用第一笔触进行绘制。

8.根据权利要求7所述的工业检测中的样本生成装置，其特征在于，第一CGAN网络和第二CGAN网络分别根据以下公式输出所述背景奖励和所述前景奖励：

其中，

代表背景奖励，

代表前景奖励，

表示通过第一CGAN网络的判别器分数计算奖励，

表示通过第二CGAN网络的判别器分数计算奖励，

表示目标图像。

9.根据权利要求6所述的工业检测中的样本生成装置，其特征在于，还包括：

神经网络模型，所述神经网络模型用于根据所述目标图像的语义图和所述第二图像，提取第二图像的前景图像和目标图像的语义图的前景图像，并将所述第二图像的前景图像、目标图像的语义图的前景图像输入所述第二CGAN网络进行训练，以使所述第二CGAN网络根据第二奖惩机制输出所述第二图像与所述目标图像的语义图之间前景奖励。

10.根据权利要求8所述的工业检测中的样本生成装置，其特征在于，所述第一CGAN网络和所述第二CGAN网络通过反向传播算法进行梯度下降，且所述第二CGAN网络采用特征引导反向传播图缩放的方式进行反向传播。