CN114677541B - 一种基于目标提取黏合样本集的方法及系统 - Google Patents

一种基于目标提取黏合样本集的方法及系统 Download PDF

Info

Publication number
CN114677541B
CN114677541B CN202210287804.9A CN202210287804A CN114677541B CN 114677541 B CN114677541 B CN 114677541B CN 202210287804 A CN202210287804 A CN 202210287804A CN 114677541 B CN114677541 B CN 114677541B
Authority
CN
China
Prior art keywords
picture
sample set
target
sample
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210287804.9A
Other languages
English (en)
Other versions
CN114677541A (zh
Inventor
连天友
张利
姜旭
黄锐
赵玲
何强
邓秋雄
欧华平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Zhiyuanhui Information Technology Co Ltd
Original Assignee
Chengdu Zhiyuanhui Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Zhiyuanhui Information Technology Co Ltd filed Critical Chengdu Zhiyuanhui Information Technology Co Ltd
Priority to CN202210287804.9A priority Critical patent/CN114677541B/zh
Publication of CN114677541A publication Critical patent/CN114677541A/zh
Application granted granted Critical
Publication of CN114677541B publication Critical patent/CN114677541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于目标提取黏合样本集的方法及系统,具体包括以下步骤:S1、获取X光机发送的原始图片;S2、根据所述原始图片生成多个不同的对象样本集库;S3、获取包含目标对象参数信息列表的请求;S4、根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集。本发明通过对训练样本中的数量较少的对象类别生成对象样本集库,不但解决了训练集数量较少的对象类型危险无法识别和判断的问题,并且还不会过多的占用计算机运算和存储资源。

Description

一种基于目标提取黏合样本集的方法及系统
技术领域
本发明涉及智能安检领域,具体涉及一种基于目标提取黏合样本集的方法及系统。
背景技术
随着安检领域的发展,可以通过X光安检机等设备对于目标进行拍摄及识别,以实现对不同类别的目标进行快速准确识别与检测,以及时发现并确定危险品。在目标识别过程中,深度学习可以代替人工来检测目标的类别、目标各零部件位置、形貌特征等。目前一般通过X光等对目标进行拍摄,将拍摄到的多张目标图像输入至服务器等处理设备,由嵌有检测模型的处理设备对目标进行深度学习的检测。但是,现有的检测模型的检测效果并不理想,容易发生漏掉目标的情况。经研究发现,漏掉目标的情况主要是由于使用样本集对检测模型进行训练时,每个目标的类别对应的数量不均衡,如枪支、弹药的训练集样本数量较少,而水杯、手机等训练集的样本数量庞大,从而导致训练得到的检测模型识别对训练集样本数量较少的类别无法准确识别的问题。
发明内容
本发明的目的在于提供一种基于目标提取黏合样本集的方法及系统,通过采集X光机的原始图片,提取对象图片并生成对应对象样本集库,并根据目标对象参数信息列表,生成与目标对象参数信息列表对应的样本集,用以解决现有各类别训练样本数量不均衡导致漏检、误检的问题。
一种基于目标提取黏合样本集的方法,具体包括以下步骤:
S1、获取X光机发送的原始图片;
S2、根据所述原始图片生成多个不同的对象样本集库;
S3、获取包含目标对象参数信息列表的请求;
S4、根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集。
进一步地,根据所述原始图片生成对象样本集库,具体包括以下步骤:
将所述原始图片输入到目标识别模型中,以通过所述目标识别模型对从所述原始图片中识别出的对象进行标注;
获取所述目标识别模型输出的标注结果,其中,所述标注结果中携带有对所述原始图片中包括的对象进行标注后的标签;
根据所述标注结果在原始图片中进行提取处理,获得至少一张对象图片及对应的标签;
根据所述标签,分别将所述至少一张对象图片存入标签对应的对象样本集库。
进一步地,所述步骤S4具体包括以下步骤:
重复执行以下步骤,直至提取完包含目标对象参数信息列表中的全部元素,所述元素包括对象的标签、对象对应的对象图片的数量K、对象对应的图像数据增强处理类别集合、对象对应的可调参量a以及对象对应的样本图片的预设数量:
从所述目标对象参数信息列表中提取一个对象的标签确定为当前目标对象的标签;
根据所述当前目标对象的标签,确定所述标签对应的对象样本集库作为当前对象样本集库;
从所述当前对象样本集库中随机提取数量为K的对象图片生成对象图片数据集M1;
根据所述对象图片数据集M1进行图像数据增强与合成处理,获得当前目标对象对应的预设数量的样本图片。
进一步地,所述当前目标对象对应的样本图片,具体通过以下步骤获得:
启动计数器Index,重复执行以下步骤,直至得到当前目标对象对应的预设数量的样本图片:
每遍历一张对象图片计数器Index=Index+1,将所述Index与可调参量a进行整除运算,若Index能被可调参量a整除,则从业务场景背景图片库中随机读取一张场景背景图片,所述可调参量a为与场景背景图片进行合成的对象图片的最大数值;
根据所述场景背景图片分辨率的大小,将场景背景图片划分为a个区域块,每个区域块以1,2,…,a进行标识;
将当前遍历的对象图片黏贴至区域块i,所示i为Index与a进行取余运算得到的余数值,将合成有a张对象图片的场景背景图片确定为一张样本图片。
进一步地,所述将场景背景图片划分为a个区域块,每个区域块以1,2,…,a进行标识,具体包括以下步骤:
场景背景图片进行水平方向和垂直方向的N等分操作,划分得到N*N个等大小的区域块,每个区域块i以xi行yi列进行标识,其中a=N*N。
进一步地,所述将当前遍历的对象图片黏贴至区域块i,所述区域块i的标识为(xi,yi),其中:
xi为将Index与N进行整除运算得到的商值,即xi=Index//N;
yi为将Index与N进行取余运算得到的余数值,即yi=Index%N。
进一步地,将当前遍历的对象图片黏贴至区域块i,具体包括以下步骤:
判断当前遍历的对象图片与区域块i的大小;
若当前遍历的对象图片与区域块i的大小不匹配,则将当前遍历的对象图片按照适配比率进行缩放处理,以获得与区域块i大小匹配的图片。
进一步地,若当前遍历的对象图片大于区域块i的大小,则将当前遍历的对象图片按照适配比率进行缩小处理,以获得与区域块i大小匹配的图片,其中区域块i的大小为K*K,当前遍历的对象图片大小为w*h,
根据所述前遍历的对象图片与区域块i的大小,获得:
长变换比率:wr=K/w;
高变换比率:hr=K/h;
所述适配比率具体包括以下几种情形:
情形一:当w*hr>K时,所述适配比率为wr;
情形二:当h*wr>K时,所述适配比率为hr。
进一步地,将当前遍历的对象图片黏贴至区域块i之前,根据所述对象对应的图像数据增强处理类别集合按照预设规则对所述当前遍历的对象图片进行图像数据增强处理,所述图像数据增强处理类别包括:平移,旋转,亮度变换,翻转,添加高斯噪声,所述预设规则为随机抽取一个图像数据增强处理类别或对所述图像数据增强处理类别集合进行类别加载,用以将所述对象图片按照特定的顺序集进行图像数据增强处理类。
一种基于目标提取黏合样本集的系统,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现一种基于目标提取黏合样本集的方法,所述一个或多个程序包括:
接收模块,用于获取X光机发送的原始图片;
对象样本集模块,用于根据所述原始图片生成多个不同的对象样本集库;
目标对象模块,用于获取包含目标对象参数信息列表的请求;
样本集模块,用于根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集。
本发明具有的有益效果:
1、通过对训练样本中的数量较少的对象类别生成对象样本集库,不但解决了训练集数量较少的对象类型危险无法识别和判断的问题,并且还不会过多的占用计算机运算和存储资源,可有效降低计算机运算及存储设备的配置成本;
2、通过图像数据增强与合成处理,获得当前目标对象对应的预设数量的样本图片,从而生成目标对象参数信息列表对应的多个样本集,从而丰富样本集、均衡样本数量,基于该多个样本集对检测模型进行训练,进一步优化检测模型,降低漏检、误检的概率。
附图说明
图1为本发明的基于目标提取黏合样本集的方法示意图;
图2为本发明的基于目标提取黏合样本集的系统示意图;
图3为本发明的样本集数据流程示意图;
图4为本发明的样本图片示意图;
图5为本发明的目标对象参数信息列表示意图;
具体实施方式
下面结合实施例及附图,对本发明作进一步的详细说明,但本发明的实施方式不限于此。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖向”、“纵向”、“侧向”、“水平”、“内”、“外”、“前”、“后”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“开有”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
一种基于目标提取黏合样本集的方法,具体包括以下步骤:
S1、获取X光机发送的原始图片;
S2、根据所述原始图片生成多个不同的对象样本集库;
S3、获取包含目标对象参数信息列表的请求;
S4、根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集。
根据所述原始图片生成对象样本集库,具体包括以下步骤:
将所述原始图片输入到目标识别模型中,以通过所述目标识别模型对从所述原始图片中识别出的对象进行标注;
获取所述目标识别模型输出的标注结果,其中,所述标注结果中携带有对所述原始图片中包括的对象进行标注后的标签;
根据所述标注结果在原始图片中进行提取处理,获得至少一张对象图片及对应的标签;
根据所述标签,分别将所述至少一张对象图片存入标签对应的对象样本集库。
在一种实施例中,上述原始图片中包括至少一个待识别的对象;将上述原始图片输入到目标识别模型中,以通过上述目标识别模型对从上述原始图片中识别出的对象进行标注,其中,上述目标识别模型为利用样本图片集进行训练后所得到的用于识别并标注图片中的对象的模型,上述样本图片集包括初始样本图片和标注样本图片,上述标注样本图片为在上述初始样本图片对应的训练结果中确定出目标图片后,对上述目标图片中的对象进行纠正后得到的标注图片;获取上述目标识别模型输出的标注结果,其中,上述标注结果中携带有对上述原始图片中包括的对象标注后的标签。
用户与X光安检机之间可以进行人机交互。X光安检机中包含有存储器,用于存储交互数据、处理器,用于处理交互数据。X光安检机可以通过网络与服务器之间进行数据交互。服务器中包含有数据库,用于存储交互数据、处理引擎,用于处理交互数据。X光安检机可以将待标注的原始图片发送给服务器,服务器可以接收待标注的原始图片,并将待标注的原始图片输入到目标识别模型中。目标识别模型对待标注的原始图片进行标注,输出标注结果,标注结果中包括待标注的原始图片中每一个对象的位置与类型。服务器可以将标注结果返回给X光安检机,使X光安检机进行显示。
通过本实施例,由于目标识别模型是使用样本图片集进行训练的模型,而样本图片集中包括初始样本图片和标注样本图片,标注样本图片为从初始样本图片中确定出目标图片后,对目标图片中的对象进行纠正后得到的标注图片。从而采用上述方法训练的目标识别模型的准确度要高。因此,采用本方案识别待标注的原始图片得到的标注结果为准确的结果,提高了对待标注的原始图片进行标注的准确性。
可选地,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器可以包括但不限于任何可以进行计算的硬件设备。
所述步骤S4具体包括以下步骤:
重复执行以下步骤,直至提取完包含目标对象参数信息列表中的全部元素,所述元素包括对象的标签、对象对应的对象图片的数量K、对象对应的图像数据增强处理类别集合、对象对应的可调参量a以及对象对应的样本图片的预设数量:
从所述目标对象参数信息列表中提取一个对象的标签确定为当前目标对象的标签;
根据所述当前目标对象的标签,确定所述标签对应的对象样本集库作为当前对象样本集库;
从所述当前对象样本集库中随机提取数量为K的对象图片生成对象图片数据集M1;
具体的,所述数量K与样本图片的预设数量相匹配。
根据所述对象图片数据集M1进行图像数据增强与合成处理,获得当前目标对象对应的预设数量的样本图片。
所述当前目标对象对应的样本图片,具体通过以下步骤获得:
启动计数器Index,重复执行以下步骤,直至得到当前目标对象对应的预设数量的样本图片:
每遍历一张对象图片计数器Index=Index+1,将所述Index与可调参量a进行整除运算,若Index能被可调参量a整除,则从业务场景背景图片库中随机读取一张场景背景图片,所述可调参量a为与场景背景图片进行合成的对象图片的最大数值;
根据所述场景背景图片分辨率的大小,将场景背景图片划分为a个区域块,每个区域块以1,2,…,a进行标识;
将当前遍历的对象图片黏贴至区域块i,所示i为Index与a进行取余运算得到的余数值,将合成有a张对象图片的场景背景图片确定为一张样本图片。
本领域技术人员可以理解的是,所述a个区域块大小可以随机选取,并对所述a个区域块进行随机标号,从而将当前遍历的对象图片根据标号黏贴至场景背景图片的区域块。
本方案中,将各个区域块的大小均匀设置,并且区域块的标识依据行列的顺序进行标号。
在一种实施例中,所述将场景背景图片划分为a个区域块,每个区域块以1,2,…,a进行标识,具体包括以下步骤:
场景背景图片进行水平方向和垂直方向的N等分操作,划分得到N*N个等大小的区域块,每个区域块i以xi行yi列进行标识,其中a=N*N;
所述将当前遍历的对象图片黏贴至区域块i,所述区域块i的标识为(xi,yi),其中:
xi为将Index与N进行整除运算得到的商值,即xi=Index//N;
yi为将Index与N进行取余运算得到的余数值,即yi=Index%N。
将当前遍历的对象图片黏贴至区域块i,具体包括以下步骤:
判断当前遍历的对象图片与区域块i的大小;
若当前遍历的对象图片与区域块i的大小不匹配,则将当前遍历的对象图片按照适配比率进行缩放处理,以获得与区域块i大小匹配的图片。
若当前遍历的对象图片大于区域块i的大小,则将当前遍历的对象图片按照适配比率进行缩小处理,以获得与区域块i大小匹配的图片,其中区域块i的大小为K*K,当前遍历的对象图片大小为w*h,
根据所述前遍历的对象图片与区域块i的大小,获得:
长变换比率:wr=K/w;
高变换比率:hr=K/h;
所述适配比率具体包括以下几种情形:
情形一:当w*hr>K时,所述适配比率为wr;
情形二:当h*wr>K时,所述适配比率为hr;
将当前遍历的对象图片黏贴至区域块i之前,根据所述对象对应的图像数据增强处理类别集合按照预设规则对所述当前遍历的对象图片进行图像数据增强处理,所述图像数据增强处理类别包括:平移,旋转,亮度变换,翻转,添加高斯噪声,所述预设规则为随机抽取一个图像数据增强处理类别或对所述图像数据增强处理类别集合进行类别加载,用以将所述对象图片按照特定的顺序集进行图像数据增强处理类。
在一个实施例中,所述类别标签加载为平移+亮度转换+亮度;
在一个实施例中,所述类别标签加载为长宽扭曲+亮度转换+图像翻转。
在一个实施例中:基于目标提取的黏合样本集的方法主要分成两个步骤:1、生成对象样本集库;2、根据对象样本集库生成需要的样本集
1、生成对象样本集库
1)对原始图片进行数据标注;
2)根据1中的标注结果,把对象从原始图片中提取出来;
3)提取出来的对象图片根据对象的类别和库类型,生成对应的小目标库进行存储;
4)获得对象样本集库
2、生成样本集
1)输入需要的目标列表Q,Q为列表,Q中每个元素包含对象的名称a,提取对象的对象样本集库地址d和需要的对象数量n。其中:
Q={q0,q1,q2,…,qn};
qn={a,d,n}
2)根据1中指定的对象类别,对象样本集库地址d和数量n提取出所有的对象图片数据集为M;
M={e0,e1,e2,…},e为对象数据,
ei={id,a,dI},id表示对象的类别ID,dI表示id对象的地址,
3)对M中的元素打乱顺序,得到M1,M1的数据个数为N;
4)设定计数参数Index=0,坐标数据参数S,S为字符串;
5)遍历M1中的元素,遍历到ei,i表示第i个元素;
6)若Index%9==0,则从业务场景背景图片库中随机读取一张场景背景图片,记为G,图片大小设定到600*600。一张背景图片上最多放9张小目标,所以G被均分为9个200*200的区域;
7)Index=Index+1
8)根据ei的图片地址dI读取出图片,对ei图片进行水平翻转、垂直翻转、旋转90度,旋转270度、转灰度、加入高斯噪声等操作中的随机一种操作,得到图像ei’。
9)计算图片ei’在G中存放的位置。
横坐标:xi=Index//3*200,//表示整除;
纵坐标:yi=Index%3*200,%表示取余;
10)判断图片ei’需要如何的填充到200*200的方格中,记ei’的长和高分别为w,h。
记w’和h’为ei’变换后的长和高;
长的变换比率为:wr=200/w;
高的变换比率为:hr=200/h;
若长按照高的变换比率,出现w*hr>200,那么w’=200,h’=h*wr;否则,w’=w*hr,h’=200;
ei’通过变换后,得到图片ei”,长为w’,高为h’,左上顶点的坐标为(xi,yi);
11)计算ei’的中心点坐标的比率和长宽的比率,如下:
中心点cx的比率为:cxri=(xi+w’/2)/600;
中心点cy的比率为:cyri=(yi+h’/2)/600;
长w’的比率为:w’r=w’/600
高h’的比率为:h’r=h’/600
12)更新坐标数据参数S:
S=S+idi+”+cxri+”+cyri+”+w’r+”+h’r+’/n’(idi为第i个对象的ID)
13)若Index%9==0,保存G和S,并清空S;
14)若Index<n,继续步骤5。
15)若Index==n,结束。
实施例2
一种基于目标提取黏合样本集的系统,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现一种基于目标提取黏合样本集的方法,所述一个或多个程序包括:
接收模块,用于获取X光机发送的原始图片;
对象样本集模块,用于根据所述原始图片生成多个不同的对象样本集库;
目标对象模块,用于获取包含目标对象参数信息列表的请求;
样本集模块,用于根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集。
实施例3,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时能实现所述的基于目标提取黏合样本集的方法。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。

Claims (7)

1.一种基于目标提取黏合样本集的方法,其特征在于,具体包括以下步骤:
S1、获取X光机发送的原始图片;
S2、根据所述原始图片生成多个不同的对象样本集库;
根据所述原始图片生成对象样本集库,具体包括以下步骤:
将所述原始图片输入到目标识别模型中,以通过所述目标识别模型对从所述原始图片中识别出的对象进行标注;
获取所述目标识别模型输出的标注结果,其中,所述标注结果中携带有对所述原始图片中包括的对象进行标注后的标签;
根据所述标注结果在原始图片中进行提取处理,获得至少一张对象图片及对应的标签;
根据所述标签,分别将所述至少一张对象图片存入标签对应的对象样本集库;
S3、获取包含目标对象参数信息列表的请求;
S4、根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集;
所述步骤S4具体包括以下步骤:
重复执行以下步骤,直至提取完包含目标对象参数信息列表中的全部元素,所述元素包括对象的标签、对象对应的对象图片的数量K1、对象对应的图像数据增强处理类别集合、对象对应的可调参量a以及对象对应的样本图片的预设数量:
从所述目标对象参数信息列表中提取一个对象的标签确定为当前目标对象的标签;
根据所述当前目标对象的标签,确定所述标签对应的对象样本集库作为当前对象样本集库;
从所述当前对象样本集库中随机提取数量为K1的对象图片生成对象图片数据集M1;
根据所述对象图片数据集M1进行图像数据增强与合成处理,获得当前目标对象对应的预设数量的样本图片;
当前目标对象对应的样本图片,具体通过以下步骤获得:
启动计数器Index,重复执行以下步骤,直至得到当前目标对象对应的预设数量的样本图片:
遍历对象图片数据集M1,每遍历一张对象图片计数器Index=Index+1,将所述Index与可调参量a进行整除运算,若Index能被可调参量a整除,则从业务场景背景图片库中随机读取一张场景背景图片,所述可调参量a为与场景背景图片进行合成的对象图片的最大数值;
根据所述场景背景图片分辨率的大小,将场景背景图片划分为a个区域块,每个区域块以1,2,…,a进行标识;
将当前遍历的对象图片黏贴至区域块i,所示i为Index与a进行取余运算得到的余数值,将合成有a张对象图片的场景背景图片确定为一张样本图片。
2.根据权利要求1所述的一种基于目标提取黏合样本集的方法,其特征在于,所述将场景背景图片划分为a个区域块,每个区域块以1,2,…,a进行标识,具体包括以下步骤:
场景背景图片进行水平方向和垂直方向的N等分操作,划分得到N*N个等大小的区域块,每个区域块i以xi行yi列进行标识,其中a=N*N。
3.根据权利要求2所述的一种基于目标提取黏合样本集的方法,其特征在于,所述将当前遍历的对象图片黏贴至区域块i,所述区域块i的标识为(xi,yi),其中:
xi为将Index与N进行整除运算得到的商值,即xi=Index//N;
yi为将Index与N进行取余运算得到的余数值,即yi=Index%N。
4.根据权利要求1所述的一种基于目标提取黏合样本集的方法,其特征在于,将当前遍历的对象图片黏贴至区域块i,具体包括以下步骤:
判断当前遍历的对象图片与区域块i的大小;
若当前遍历的对象图片与区域块i的大小不匹配,则将当前遍历的对象图片按照适配比率进行缩放处理,以获得与区域块i大小匹配的图片。
5.根据权利要求1所述的一种基于目标提取黏合样本集的方法,其特征在于,若当前遍历的对象图片大于区域块i的大小,则将当前遍历的对象图片按照适配比率进行缩小处理,以获得与区域块i大小匹配的图片,其中区域块i的大小为K*K,当前遍历的对象图片大小为w*h,
根据所述当前遍历的对象图片与区域块i的大小,获得:
长变换比率:wr=K/w;
高变换比率:hr=K/h;
所述适配比率具体包括以下几种情形:
情形一:当w*hr>K时,所述适配比率为wr;
情形二:当h*wr>K时,所述适配比率为hr。
6.根据权利要求1所述的一种基于目标提取黏合样本集的方法,其特征在于,将当前遍历的对象图片黏贴至区域块i之前,根据所述对象对应的图像数据增强处理类别集合按照预设规则对所述当前遍历的对象图片进行图像数据增强处理,所述图像数据增强处理类别包括:平移,旋转,亮度变换,翻转,添加高斯噪声,所述预设规则为随机抽取一个图像数据增强处理类别或对所述图像数据增强处理类别集合进行类别加载,用以将所述对象图片按照特定的顺序集进行图像数据增强处理。
7.一种基于目标提取黏合样本集的系统,其特征在于,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现根据权利要求1至6中任意一项所述的一种基于目标提取黏合样本集的方法,所述一个或多个程序包括:
接收模块,用于获取X光机发送的原始图片;
对象样本集模块,用于根据所述原始图片生成多个不同的对象样本集库;
目标对象模块,用于获取包含目标对象参数信息列表的请求;
样本集模块,用于根据包含目标对象参数信息列表的请求,从所述对象样本集库中提取对象图片进行与目标对象参数信息对应的图像数据增强与合成处理,获得与目标对象参数信息对应的样本图片,将所有样本图片确定为输出的样本集。
CN202210287804.9A 2022-03-23 2022-03-23 一种基于目标提取黏合样本集的方法及系统 Active CN114677541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210287804.9A CN114677541B (zh) 2022-03-23 2022-03-23 一种基于目标提取黏合样本集的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210287804.9A CN114677541B (zh) 2022-03-23 2022-03-23 一种基于目标提取黏合样本集的方法及系统

Publications (2)

Publication Number Publication Date
CN114677541A CN114677541A (zh) 2022-06-28
CN114677541B true CN114677541B (zh) 2023-04-28

Family

ID=82074499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210287804.9A Active CN114677541B (zh) 2022-03-23 2022-03-23 一种基于目标提取黏合样本集的方法及系统

Country Status (1)

Country Link
CN (1) CN114677541B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633426A (zh) * 2021-03-11 2021-04-09 腾讯科技(深圳)有限公司 处理数据类别不均衡的方法、装置、电子设备及存储介质
CN112712535A (zh) * 2021-01-18 2021-04-27 长安大学 基于模拟困难样本的Mask-RCNN滑坡分割方法
CN113408482A (zh) * 2021-07-13 2021-09-17 杭州联吉技术有限公司 一种训练样本的生成方法及生成装置
CN113591892A (zh) * 2021-01-14 2021-11-02 腾讯科技(深圳)有限公司 一种训练数据的处理方法及装置
CN113610787A (zh) * 2021-07-27 2021-11-05 广东省科技基础条件平台中心 图像缺陷检测模型的训练方法、装置、计算机设备
CN114037637A (zh) * 2022-01-10 2022-02-11 苏州浪潮智能科技有限公司 一种图像数据增强方法、装置、计算机设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610169B (zh) * 2019-09-20 2023-12-15 腾讯科技(深圳)有限公司 图片标注方法和装置、存储介质及电子装置
CN111079841A (zh) * 2019-12-17 2020-04-28 深圳奇迹智慧网络有限公司 目标识别的训练方法、装置、计算机设备和存储介质
CN111612089A (zh) * 2020-05-29 2020-09-01 浙江大华技术股份有限公司 一种在安检机中危险品的标注方法及设备
CN111814589A (zh) * 2020-06-18 2020-10-23 浙江大华技术股份有限公司 部位识别方法以及相关设备、装置
CN112529116B (zh) * 2021-02-07 2021-06-25 腾讯科技(深圳)有限公司 场景元素融合处理方法、装置和设备及计算机存储介质
CN113642576B (zh) * 2021-08-24 2024-05-24 凌云光技术股份有限公司 一种目标检测及语义分割任务中训练图像集合的生成方法及装置
CN113673541B (zh) * 2021-10-21 2022-02-11 广州微林软件有限公司 一种用于目标检测的图像样本生成方法及应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591892A (zh) * 2021-01-14 2021-11-02 腾讯科技(深圳)有限公司 一种训练数据的处理方法及装置
CN112712535A (zh) * 2021-01-18 2021-04-27 长安大学 基于模拟困难样本的Mask-RCNN滑坡分割方法
CN112633426A (zh) * 2021-03-11 2021-04-09 腾讯科技(深圳)有限公司 处理数据类别不均衡的方法、装置、电子设备及存储介质
CN113408482A (zh) * 2021-07-13 2021-09-17 杭州联吉技术有限公司 一种训练样本的生成方法及生成装置
CN113610787A (zh) * 2021-07-27 2021-11-05 广东省科技基础条件平台中心 图像缺陷检测模型的训练方法、装置、计算机设备
CN114037637A (zh) * 2022-01-10 2022-02-11 苏州浪潮智能科技有限公司 一种图像数据增强方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陶红兴 ; 莫凌飞 ; 严如强 ; .基于车载传感信息融合的电动汽车驾驶行为辨识.传感技术学报.2018,(第03期),全文. *

Also Published As

Publication number Publication date
CN114677541A (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
CN110390269B (zh) Pdf文档表格提取方法、装置、设备及计算机可读存储介质
Xu et al. Detecting tiny objects in aerial images: A normalized Wasserstein distance and a new benchmark
CN111476227B (zh) 基于ocr的目标字段识别方法、装置及存储介质
CN111340126B (zh) 物品识别方法、装置、计算机设备和存储介质
CN103955694B (zh) 图像识别抄表系统及方法
Clausner et al. Scenario driven in-depth performance evaluation of document layout analysis methods
CN110110726A (zh) 电力设备铭牌识别方法、装置、计算机设备和存储介质
CN110717366A (zh) 文本信息的识别方法、装置、设备及存储介质
CN112699775A (zh) 基于深度学习的证件识别方法、装置、设备及存储介质
CN109271910A (zh) 一种文字识别、文字翻译方法和装置
CN113283355A (zh) 一种表格图像的识别方法、装置、计算机设备及存储介质
CN114511718B (zh) 一种建筑施工用物料智能管理方法及系统
CN113920117B (zh) 一种面板缺陷区域检测方法、装置、电子设备及存储介质
CN111651361A (zh) 一种基于可视化页面的无脚本自动化测试方法
CN113239227A (zh) 图像数据结构化方法、装置、电子设备及计算机可读介质
KR20220098315A (ko) 화상 처리 방법과 장치, 전자 디바이스 및 기록 매체
CN117115569B (zh) 基于机器学习的物像自动识别分类方法及系统
CN114998432A (zh) 一种基于YOLOv5的电路板检测点定位方法
CN112990792B (zh) 一种侵权风险自动化检测方法、装置和电子设备
CN114677541B (zh) 一种基于目标提取黏合样本集的方法及系统
CN116580390A (zh) 价签内容获取方法、装置、存储介质和计算机设备
CN113642582B (zh) 电表读数识别方法、装置、电子设备和存储介质
CN114240928A (zh) 板卡质量的分区检测方法、装置、设备及可读存储介质
CN112036465A (zh) 图像识别方法、装置、设备及存储介质
CN114758259B (zh) 一种基于x光物体图像识别的包裹检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant