CN114677541B

CN114677541B - 一种基于目标提取黏合样本集的方法及系统

Info

Publication number: CN114677541B
Application number: CN202210287804.9A
Authority: CN
Inventors: 连天友; 张利; 姜旭; 黄锐; 赵玲; 何强; 邓秋雄; 欧华平
Original assignee: Chengdu Zhiyuanhui Information Technology Co Ltd
Current assignee: Chengdu Zhiyuanhui Information Technology Co Ltd
Priority date: 2022-03-23
Filing date: 2022-03-23
Publication date: 2023-04-28
Anticipated expiration: 2042-03-23
Also published as: CN114677541A

Abstract

本发明公开了基于目标提取黏合样本集的方法及系统，具体包括以下步骤：S1、获取X光机发送的原始图片；S2、根据所述原始图片生成多个不同的对象样本集库；S3、获取包含目标对象参数信息列表的请求；S4、根据包含目标对象参数信息列表的请求，从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理，获得与目标对象参数信息对应的样本图片，将所有样本图片确定为输出的样本集。本发明通过对训练样本中的数量较少的对象类别生成对象样本集库，不但解决了训练集数量较少的对象类型危险无法识别和判断的问题，并且还不会过多的占用计算机运算和存储资源。

Description

一种基于目标提取黏合样本集的方法及系统

技术领域

本发明涉及智能安检领域，具体涉及一种基于目标提取黏合样本集的方法及系统。

背景技术

随着安检领域的发展，可以通过X光安检机等设备对于目标进行拍摄及识别，以实现对不同类别的目标进行快速准确识别与检测，以及时发现并确定危险品。在目标识别过程中，深度学习可以代替人工来检测目标的类别、目标各零部件位置、形貌特征等。目前一般通过X光等对目标进行拍摄，将拍摄到的多张目标图像输入至服务器等处理设备，由嵌有检测模型的处理设备对目标进行深度学习的检测。但是，现有的检测模型的检测效果并不理想，容易发生漏掉目标的情况。经研究发现，漏掉目标的情况主要是由于使用样本集对检测模型进行训练时，每个目标的类别对应的数量不均衡，如枪支、弹药的训练集样本数量较少，而水杯、手机等训练集的样本数量庞大，从而导致训练得到的检测模型识别对训练集样本数量较少的类别无法准确识别的问题。

发明内容

本发明的目的在于提供一种基于目标提取黏合样本集的方法及系统，通过采集X光机的原始图片，提取对象图片并生成对应对象样本集库，并根据目标对象参数信息列表，生成与目标对象参数信息列表对应的样本集，用以解决现有各类别训练样本数量不均衡导致漏检、误检的问题。

一种基于目标提取黏合样本集的方法，具体包括以下步骤：

S1、获取X光机发送的原始图片；

S2、根据所述原始图片生成多个不同的对象样本集库；

S3、获取包含目标对象参数信息列表的请求；

S4、根据包含目标对象参数信息列表的请求，从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理，获得与目标对象参数信息对应的样本图片，将所有样本图片确定为输出的样本集。

进一步地，根据所述原始图片生成对象样本集库，具体包括以下步骤：

将所述原始图片输入到目标识别模型中，以通过所述目标识别模型对从所述原始图片中识别出的对象进行标注；

获取所述目标识别模型输出的标注结果，其中，所述标注结果中携带有对所述原始图片中包括的对象进行标注后的标签；

根据所述标注结果在原始图片中进行提取处理，获得至少一张对象图片及对应的标签；

根据所述标签，分别将所述至少一张对象图片存入标签对应的对象样本集库。

进一步地，所述步骤S4具体包括以下步骤：

重复执行以下步骤，直至提取完包含目标对象参数信息列表中的全部元素，所述元素包括对象的标签、对象对应的对象图片的数量K、对象对应的图像数据增强处理类别集合、对象对应的可调参量a以及对象对应的样本图片的预设数量：

从所述目标对象参数信息列表中提取一个对象的标签确定为当前目标对象的标签；

根据所述当前目标对象的标签，确定所述标签对应的对象样本集库作为当前对象样本集库；

从所述当前对象样本集库中随机提取数量为K的对象图片生成对象图片数据集M1；

根据所述对象图片数据集M1进行图像数据增强与合成处理，获得当前目标对象对应的预设数量的样本图片。

进一步地，所述当前目标对象对应的样本图片，具体通过以下步骤获得:

启动计数器Index，重复执行以下步骤，直至得到当前目标对象对应的预设数量的样本图片：

每遍历一张对象图片计数器Index＝Index+1，将所述Index与可调参量a进行整除运算，若Index能被可调参量a整除，则从业务场景背景图片库中随机读取一张场景背景图片，所述可调参量a为与场景背景图片进行合成的对象图片的最大数值；

根据所述场景背景图片分辨率的大小，将场景背景图片划分为a个区域块,每个区域块以1,2，…，a进行标识；

将当前遍历的对象图片黏贴至区域块i，所示i为Index与a进行取余运算得到的余数值，将合成有a张对象图片的场景背景图片确定为一张样本图片。

进一步地，所述将场景背景图片划分为a个区域块,每个区域块以1,2，…，a进行标识，具体包括以下步骤：

场景背景图片进行水平方向和垂直方向的N等分操作，划分得到N*N个等大小的区域块，每个区域块i以xi行yi列进行标识，其中a＝N*N。

进一步地，所述将当前遍历的对象图片黏贴至区域块i，所述区域块i的标识为(xi,yi),其中：

xi为将Index与N进行整除运算得到的商值，即xi＝Index//N；

yi为将Index与N进行取余运算得到的余数值，即yi＝Index％N。

进一步地，将当前遍历的对象图片黏贴至区域块i，具体包括以下步骤：

判断当前遍历的对象图片与区域块i的大小；

若当前遍历的对象图片与区域块i的大小不匹配，则将当前遍历的对象图片按照适配比率进行缩放处理，以获得与区域块i大小匹配的图片。

进一步地，若当前遍历的对象图片大于区域块i的大小，则将当前遍历的对象图片按照适配比率进行缩小处理，以获得与区域块i大小匹配的图片，其中区域块i的大小为K*K,当前遍历的对象图片大小为w*h，

根据所述前遍历的对象图片与区域块i的大小，获得：

长变换比率：wr＝K/w；

高变换比率：hr＝K/h；

所述适配比率具体包括以下几种情形：

情形一：当w*hr>K时，所述适配比率为wr；

情形二：当h*wr>K时，所述适配比率为hr。

进一步地，将当前遍历的对象图片黏贴至区域块i之前，根据所述对象对应的图像数据增强处理类别集合按照预设规则对所述当前遍历的对象图片进行图像数据增强处理，所述图像数据增强处理类别包括：平移，旋转，亮度变换，翻转，添加高斯噪声，所述预设规则为随机抽取一个图像数据增强处理类别或对所述图像数据增强处理类别集合进行类别加载，用以将所述对象图片按照特定的顺序集进行图像数据增强处理类。

一种基于目标提取黏合样本集的系统，包括：

一个或多个处理器；

存储单元，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，能使得所述一个或多个处理器实现一种基于目标提取黏合样本集的方法，所述一个或多个程序包括：

接收模块，用于获取X光机发送的原始图片；

对象样本集模块，用于根据所述原始图片生成多个不同的对象样本集库；

目标对象模块，用于获取包含目标对象参数信息列表的请求；

样本集模块，用于根据包含目标对象参数信息列表的请求，从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理，获得与目标对象参数信息对应的样本图片，将所有样本图片确定为输出的样本集。

本发明具有的有益效果：

1、通过对训练样本中的数量较少的对象类别生成对象样本集库，不但解决了训练集数量较少的对象类型危险无法识别和判断的问题，并且还不会过多的占用计算机运算和存储资源，可有效降低计算机运算及存储设备的配置成本；

2、通过图像数据增强与合成处理，获得当前目标对象对应的预设数量的样本图片，从而生成目标对象参数信息列表对应的多个样本集，从而丰富样本集、均衡样本数量，基于该多个样本集对检测模型进行训练，进一步优化检测模型，降低漏检、误检的概率。

附图说明

图1为本发明的基于目标提取黏合样本集的方法示意图；

图2为本发明的基于目标提取黏合样本集的系统示意图；

图3为本发明的样本集数据流程示意图；

图4为本发明的样本图片示意图；

图5为本发明的目标对象参数信息列表示意图；

具体实施方式

下面结合实施例及附图，对本发明作进一步的详细说明，但本发明的实施方式不限于此。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖向”、“纵向”、“侧向”、“水平”、“内”、“外”、“前”、“后”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，还需要说明的是，除非另有明确的规定和限定，术语“设置”、“开有”、“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

实施例1

一种基于目标提取黏合样本集的方法，具体包括以下步骤：

S1、获取X光机发送的原始图片；

S2、根据所述原始图片生成多个不同的对象样本集库；

S3、获取包含目标对象参数信息列表的请求；

根据所述原始图片生成对象样本集库，具体包括以下步骤：

在一种实施例中，上述原始图片中包括至少一个待识别的对象；将上述原始图片输入到目标识别模型中，以通过上述目标识别模型对从上述原始图片中识别出的对象进行标注，其中，上述目标识别模型为利用样本图片集进行训练后所得到的用于识别并标注图片中的对象的模型，上述样本图片集包括初始样本图片和标注样本图片，上述标注样本图片为在上述初始样本图片对应的训练结果中确定出目标图片后，对上述目标图片中的对象进行纠正后得到的标注图片；获取上述目标识别模型输出的标注结果，其中，上述标注结果中携带有对上述原始图片中包括的对象标注后的标签。

用户与X光安检机之间可以进行人机交互。X光安检机中包含有存储器，用于存储交互数据、处理器，用于处理交互数据。X光安检机可以通过网络与服务器之间进行数据交互。服务器中包含有数据库，用于存储交互数据、处理引擎，用于处理交互数据。X光安检机可以将待标注的原始图片发送给服务器，服务器可以接收待标注的原始图片，并将待标注的原始图片输入到目标识别模型中。目标识别模型对待标注的原始图片进行标注，输出标注结果，标注结果中包括待标注的原始图片中每一个对象的位置与类型。服务器可以将标注结果返回给X光安检机，使X光安检机进行显示。

通过本实施例，由于目标识别模型是使用样本图片集进行训练的模型，而样本图片集中包括初始样本图片和标注样本图片，标注样本图片为从初始样本图片中确定出目标图片后，对目标图片中的对象进行纠正后得到的标注图片。从而采用上述方法训练的目标识别模型的准确度要高。因此，采用本方案识别待标注的原始图片得到的标注结果为准确的结果，提高了对待标注的原始图片进行标注的准确性。

可选地，上述网络可以包括但不限于无线网络或有线网络。其中，该无线网络包括：WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于：广域网、城域网、局域网。上述服务器可以包括但不限于任何可以进行计算的硬件设备。

所述步骤S4具体包括以下步骤：

具体的，所述数量K与样本图片的预设数量相匹配。

所述当前目标对象对应的样本图片，具体通过以下步骤获得:

本领域技术人员可以理解的是，所述a个区域块大小可以随机选取，并对所述a个区域块进行随机标号，从而将当前遍历的对象图片根据标号黏贴至场景背景图片的区域块。

本方案中，将各个区域块的大小均匀设置，并且区域块的标识依据行列的顺序进行标号。

在一种实施例中，所述将场景背景图片划分为a个区域块,每个区域块以1,2，…，a进行标识，具体包括以下步骤：

场景背景图片进行水平方向和垂直方向的N等分操作，划分得到N*N个等大小的区域块，每个区域块i以xi行yi列进行标识，其中a＝N*N；

所述将当前遍历的对象图片黏贴至区域块i，所述区域块i的标识为(xi,yi),其中：

xi为将Index与N进行整除运算得到的商值，即xi＝Index//N；

yi为将Index与N进行取余运算得到的余数值，即yi＝Index％N。

将当前遍历的对象图片黏贴至区域块i，具体包括以下步骤：

判断当前遍历的对象图片与区域块i的大小；

若当前遍历的对象图片大于区域块i的大小，则将当前遍历的对象图片按照适配比率进行缩小处理，以获得与区域块i大小匹配的图片，其中区域块i的大小为K*K,当前遍历的对象图片大小为w*h，

根据所述前遍历的对象图片与区域块i的大小，获得：

长变换比率：wr＝K/w；

高变换比率：hr＝K/h；

所述适配比率具体包括以下几种情形：

情形一：当w*hr>K时，所述适配比率为wr；

情形二：当h*wr>K时，所述适配比率为hr；

将当前遍历的对象图片黏贴至区域块i之前，根据所述对象对应的图像数据增强处理类别集合按照预设规则对所述当前遍历的对象图片进行图像数据增强处理，所述图像数据增强处理类别包括：平移，旋转，亮度变换，翻转，添加高斯噪声，所述预设规则为随机抽取一个图像数据增强处理类别或对所述图像数据增强处理类别集合进行类别加载，用以将所述对象图片按照特定的顺序集进行图像数据增强处理类。

在一个实施例中，所述类别标签加载为平移+亮度转换+亮度；

在一个实施例中，所述类别标签加载为长宽扭曲+亮度转换+图像翻转。

在一个实施例中：基于目标提取的黏合样本集的方法主要分成两个步骤：1、生成对象样本集库；2、根据对象样本集库生成需要的样本集

1、生成对象样本集库

1)对原始图片进行数据标注；

2)根据1中的标注结果，把对象从原始图片中提取出来；

3)提取出来的对象图片根据对象的类别和库类型，生成对应的小目标库进行存储；

4)获得对象样本集库

2、生成样本集

1)输入需要的目标列表Q，Q为列表，Q中每个元素包含对象的名称a，提取对象的对象样本集库地址d和需要的对象数量n。其中：

Q＝{q0,q1,q2,…,qn}；

qn＝{a,d,n}

2)根据1中指定的对象类别，对象样本集库地址d和数量n提取出所有的对象图片数据集为M；

M＝{e0,e1,e2,…},e为对象数据，

ei＝{id,a,dI},id表示对象的类别ID,dI表示id对象的地址，

3)对M中的元素打乱顺序,得到M1，M1的数据个数为N；

4)设定计数参数Index＝0，坐标数据参数S，S为字符串；

5)遍历M1中的元素，遍历到ei，i表示第i个元素；

6)若Index％9＝＝0,则从业务场景背景图片库中随机读取一张场景背景图片，记为G，图片大小设定到600*600。一张背景图片上最多放9张小目标，所以G被均分为9个200*200的区域；

7)Index＝Index+1

8)根据ei的图片地址dI读取出图片，对ei图片进行水平翻转、垂直翻转、旋转90度，旋转270度、转灰度、加入高斯噪声等操作中的随机一种操作，得到图像ei’。

9)计算图片ei’在G中存放的位置。

横坐标：xi＝Index//3*200,//表示整除；

纵坐标：yi＝Index％3*200，％表示取余；

10)判断图片ei’需要如何的填充到200*200的方格中，记ei’的长和高分别为w,h。

记w’和h’为ei’变换后的长和高；

长的变换比率为：wr＝200/w；

高的变换比率为：hr＝200/h；

若长按照高的变换比率，出现w*hr>200，那么w’＝200,h’＝h*wr；否则，w’＝w*hr,h’＝200；

ei’通过变换后，得到图片ei”，长为w’,高为h’，左上顶点的坐标为(xi,yi)；

11)计算ei’的中心点坐标的比率和长宽的比率，如下：

中心点cx的比率为：cxri＝(xi+w’/2)/600；

中心点cy的比率为：cyri＝(yi+h’/2)/600；

长w’的比率为：w’r＝w’/600

高h’的比率为：h’r＝h’/600

12)更新坐标数据参数S：

S＝S+idi+”+cxri+”+cyri+”+w’r+”+h’r+’/n’(idi为第i个对象的ID)

13)若Index％9＝＝0，保存G和S，并清空S；

14)若Index<n,继续步骤5。

15)若Index＝＝n，结束。

实施例2

一种基于目标提取黏合样本集的系统，包括：

一个或多个处理器；

接收模块，用于获取X光机发送的原始图片；

实施例3，一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时能实现所述的基于目标提取黏合样本集的方法。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，依据本发明的技术实质，在本发明的精神和原则之内，对以上实施例所作的任何简单的修改、等同替换与改进等，均仍属于本发明技术方案的保护范围之内。

Claims

1.一种基于目标提取黏合样本集的方法，其特征在于，具体包括以下步骤：

S1、获取X光机发送的原始图片；

S2、根据所述原始图片生成多个不同的对象样本集库；

根据所述原始图片生成对象样本集库，具体包括以下步骤：

根据所述标签，分别将所述至少一张对象图片存入标签对应的对象样本集库；

S3、获取包含目标对象参数信息列表的请求；

S4、根据包含目标对象参数信息列表的请求，从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理，获得与目标对象参数信息对应的样本图片，将所有样本图片确定为输出的样本集；

所述步骤S4具体包括以下步骤：

重复执行以下步骤，直至提取完包含目标对象参数信息列表中的全部元素，所述元素包括对象的标签、对象对应的对象图片的数量K1、对象对应的图像数据增强处理类别集合、对象对应的可调参量a以及对象对应的样本图片的预设数量：

从所述当前对象样本集库中随机提取数量为K1的对象图片生成对象图片数据集M1；

根据所述对象图片数据集M1进行图像数据增强与合成处理，获得当前目标对象对应的预设数量的样本图片；

当前目标对象对应的样本图片，具体通过以下步骤获得:

遍历对象图片数据集M1，每遍历一张对象图片计数器Index=Index+1，将所述Index与可调参量a进行整除运算，若Index能被可调参量a整除，则从业务场景背景图片库中随机读取一张场景背景图片，所述可调参量a为与场景背景图片进行合成的对象图片的最大数值；

2.根据权利要求1所述的一种基于目标提取黏合样本集的方法，其特征在于，所述将场景背景图片划分为a个区域块,每个区域块以1,2，…，a进行标识，具体包括以下步骤：

场景背景图片进行水平方向和垂直方向的N等分操作，划分得到N*N个等大小的区域块，每个区域块i以xi行yi列进行标识，其中a=N*N。

3.根据权利要求2所述的一种基于目标提取黏合样本集的方法，其特征在于，所述将当前遍历的对象图片黏贴至区域块i，所述区域块i的标识为（xi,yi）,其中：

xi为将Index与N进行整除运算得到的商值，即xi=Index//N；

yi为将Index与N进行取余运算得到的余数值，即yi=Index%N。

4.根据权利要求1所述的一种基于目标提取黏合样本集的方法，其特征在于，将当前遍历的对象图片黏贴至区域块i，具体包括以下步骤：

判断当前遍历的对象图片与区域块i的大小；

5.根据权利要求1所述的一种基于目标提取黏合样本集的方法，其特征在于，若当前遍历的对象图片大于区域块i的大小，则将当前遍历的对象图片按照适配比率进行缩小处理，以获得与区域块i大小匹配的图片，其中区域块i的大小为K*K,当前遍历的对象图片大小为w*h，

根据所述当前遍历的对象图片与区域块i的大小，获得：

长变换比率：wr=K/w；

高变换比率：hr=K/h；

所述适配比率具体包括以下几种情形：

情形一：当w*hr>K时，所述适配比率为wr；

情形二：当h*wr>K时，所述适配比率为hr。

6.根据权利要求1所述的一种基于目标提取黏合样本集的方法，其特征在于，将当前遍历的对象图片黏贴至区域块i之前，根据所述对象对应的图像数据增强处理类别集合按照预设规则对所述当前遍历的对象图片进行图像数据增强处理，所述图像数据增强处理类别包括：平移，旋转，亮度变换，翻转，添加高斯噪声，所述预设规则为随机抽取一个图像数据增强处理类别或对所述图像数据增强处理类别集合进行类别加载，用以将所述对象图片按照特定的顺序集进行图像数据增强处理。

7.一种基于目标提取黏合样本集的系统，其特征在于，包括：

一个或多个处理器；

存储单元，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，能使得所述一个或多个处理器实现根据权利要求1至6中任意一项所述的一种基于目标提取黏合样本集的方法，所述一个或多个程序包括：

接收模块，用于获取X光机发送的原始图片；