CN115035352A - 基于智能识图盒子性能的验证方法及系统 - Google Patents

基于智能识图盒子性能的验证方法及系统 Download PDF

Info

Publication number
CN115035352A
CN115035352A CN202210897088.6A CN202210897088A CN115035352A CN 115035352 A CN115035352 A CN 115035352A CN 202210897088 A CN202210897088 A CN 202210897088A CN 115035352 A CN115035352 A CN 115035352A
Authority
CN
China
Prior art keywords
picture
category
category label
identification
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210897088.6A
Other languages
English (en)
Other versions
CN115035352B (zh
Inventor
宋志国
杨锐
连天友
胡靖�
张利
薛丽容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Zhiyuanhui Information Technology Co Ltd
Original Assignee
Chengdu Zhiyuanhui Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Zhiyuanhui Information Technology Co Ltd filed Critical Chengdu Zhiyuanhui Information Technology Co Ltd
Publication of CN115035352A publication Critical patent/CN115035352A/zh
Application granted granted Critical
Publication of CN115035352B publication Critical patent/CN115035352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于智能识图盒子性能的验证方法及系统,包括:S1、获得由样本数据集合训练后的目标识别模型以及测试图片;S2、将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片;S3、根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;S4、如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并循环步骤S1本发明有效地克服了现有技术在复杂场景下违禁品检测率低、误检率高等缺点。

Description

基于智能识图盒子性能的验证方法及系统
技术领域
本发明涉及智慧安检技术领域,具体涉及基于智能识图盒子性能的验证方法及系统。
背景技术
安检在保障飞机、火车、地铁等交通工具安全运行和乘客人身安全中起到至关重要的作用,安检的目的是检查乘客及其携带物品中是否包含枪支、管制刀具、易燃易爆等危险品。传统的以人工的方式实现的违禁品判定手段,因效率低且需要投入大量人力而不适用于目前安检识别。因此,通过采集大量安检包裹相关数据用于数据建模,通过大数据构建的数据模型进行违禁品控制和违禁品提示,相比传统的人工经验风险控制方式更科学,效率更高。
然而现有的现有安检识别模型评估方法,采用标注框和识别框在单一交并比(IoU)阈值下的平均精度(AP)作为模型好坏的评估标准。然后现有安检识别模型存在无法针对因遮挡、角度、光线、模糊等特殊因素下的判定,使得部分标注信息难以判定是否是违禁品,从而无法有效利用评估方法对安检识别模型进行循环训练,以增加特殊因素下违禁品的识别率,从而减少包裹漏检率。
发明内容
本发明的目的在于提供基于智能识图盒子性能的验证方法及系统,通过每一次模型评估,获得未识别成功的类别标签及对应的标签数量,从而在样本数据集合中增加对应的类别标签的测试图片,有效地克服了现有技术在复杂场景下违禁品检测率低、误检率高等缺点,增强了检测模型的鲁棒性,提升该模型在复杂场景下的违禁品检测性能。
基于智能识图盒子性能的验证方法,具体包括以下步骤:
S1、获得由样本数据集合训练后的目标识别模型以及测试图片,所述测试图片包括标注框及每个标注框的类别标签;
S2、将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片,所述识别后的测试图片还包括识别框以及每个识别框的类别标签;
S3、根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;
S4、根据每个类别标签的识别参数值,判断所述每个类别标签的识别参数值是否大于预设阈值;及
如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并循环步骤S1。
进一步地,所述样本数据集合,通过以下步骤得到:
根据预设的多个类别标签,从目标数据库中分别提取对应于每个类别标签的原始图片集合;
对每个类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个类别标签的样本图片集合,将所有类别标签的样本图片集合归集为样本数据集合。
进一步地,所述增强与合成处理具体包括以下步骤:
启动计数器Index,重复执行以下步骤,直至得到当前类别标签对应的预设数量D的样本图片,将所述预设数量D的样本图片归集为当前类别标签的样本图片集合:
遍历当前类别标签的原始图片集合,每遍历一张原始图片计数器Index=Index+1,将所述Index与可调参量a进行整除运算,若Index能被可调参量a整除,则从业务场景背景图片库中随机读取一张场景背景图片,所述可调参量a为与场景背景图片进行合成的原始图片的最大数值;
根据所述场景背景图片分辨率的大小,将场景背景图片进行水平方向和垂直方向的N等分操作,划分得到N*N个等大小的区域块,每个区域块i以xi行yi列进行标识,其中a=N*N;
将当前遍历的原始图片进行增强处理,获得增强原始图片;
将所述增强原始图片粘贴至区域块i,所示i为Index与a进行取余运算得到的余数值,将合成有a张增强原始图片的场景背景图片确定为当前类别标签的的一张样本图片。
进一步地,将所述增强原始图片粘贴至区域块i,具体包括以下步骤:
判断所述增强原始图片与区域块i的大小;
若所述增强原始图片与区域块i的大小不匹配,则将增强原始图片按照适配比率进行缩放处理,以获得与区域块i大小匹配的增强原始图片,将大小匹配的增强原始图片粘贴至区域块i。
进一步地,所述增强原始图片大小为w*h,所述区域块i的大小为K*K,则所述适配比率具体包括以下几种情形:
情形一:当w*hr>K时,所述适配比率为wr;
情形二:当h*wr>K时,所述适配比率为hr;
其中,wr为长变换比率:wr=K/w;
Hr为高变换比率:hr=K/h;
若所述增强原始图片的大小大于区域块i,则将所述增强原始图片按照适配比率进行缩小处理,以获得与区域块i大小匹配的图片。
进一步地,所述增强处理包括以下步骤:根据所述预设的图像数据增强处理集合按照预设规则对所述当前遍历的原始图片进行图像数据增强处理,所述图像数据增强处理集合包括:平移,旋转,亮度变换,翻转,添加高斯噪声,所述预设规则为随机抽取一个图像数据增强处理或对所述图像数据增强处理集合进行类别标签加载,所述类别标签加载是将图像数据增强处理按照特定的顺序集进行加载构成图像数据增强处理模型。
进一步地,所述识别参数值包括识别率,所述预设阈值包括识别率阈值,所述识别率通过以下步骤获得:
遍历所述标注框的类别标签,以当前遍历的类别标签为基准类别标签,在所有识别框的类别标签中进行匹配判定,判定是否存在与当前遍历的类别标签相同的类别标签;
若存在,则获取基准类别标签对应的一张或多张测试图片,分别计算所述测试图片中基准类别标签对应的标注框与基准类别标签对应的标注框之间的IoU值,并判定所述IoU值是否大于预设标准值:
若大于,则将所述测试图片标记为识别成功的测试图片;
若小于,则将所述测试图片标记为未识别成功的测试图片,将当前遍历的类别标签记录为未识别成功的类别标签;
计算基准类别标签对应的识别成功的测试图片数量与对应的测试图片数量的比值,所述比值为当前遍历的类别标签对应的识别率。
进一步地,从所述测试图片中提取出所有未识别成功的测试图片,统计所述未识别成功的类别标签信息,所述类别标签信息包括:未识别成功的类别标签及对应的标签数量;
根据所述未识别成功的类别标签及对应的数量,生成对应的参数信息列表;
根据所述参数信息列表,从目标数据库中分别提取对应于每个未识别成功的类别标签的原始图片集合;
对每个未识别成功的类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个未识别成功的类别标签的的样本图片集合,将所有未识别成功的类别标签的的样本图片集合添加至样本数据集合。
基于智能识图盒子性能的验证系统,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现所述的基于智能识图盒子性能的验证方法,所述一个或多个程序包括:
获取模块,用于获得由样本数据集合训练后的目标识别模型以及测试图片,所述测试图片包括标注框及每个标注框的类别标签;
识别模块,用于将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片,所述识别后的测试图片还包括识别框以及每个识别框的类别标签;
计算模块,用于根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;
增加模块,用于根据每个类别标签的识别参数值,判断所述每个类别标签的识别参数值是否大于预设阈值;及
如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并执行获取模块。
本发明具有的有益效果:
1、通过图像数据增强与合成处理,获得当前类别标签对应的样本图片,从而生成类别标签对应的多个样本图片结合,进而获得所有类别标签的样本数据结合,通过丰富样本集、均衡样本数量,基于该多个样本集对检测模型进行训练,进一步优化检测模型,降低漏检、误检的概率;
2、通过每一次模型评估,获得未识别成功的类别标签及对应的标签数量,从而在样本数据集合中增加对应的类别标签的测试图片,不但解决了特殊情况下违禁品无法识别和判断的问题,并且还不会过多的占用计算机运算和存储资源,可有效降低计算机运算及存储设备的配置成本;
3、根据要求自动获取样本进行训练;根据自动化验证结果,重新平衡训练样本,自动触发再次训练,直至满足条件;优化自动化验证算法,减少算法的时间复杂度,提升算法执行效率。
附图说明
图1为本发明的方法流程示意图;
图2为本发明的样本图片集合流程示意图;
图3为本发明的样本图片示意图;
图4为本发明的系统结构示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
另外,为了清楚和简洁起见,可能省略了对公知的结构、功能和配置的描述。本领域普通技术人员将认识到,在不脱离本公开的精神和范围的情况下,可以对本文描述的示例进行各种改变和修改。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
实施例1
基于智能识图盒子性能的验证方法,具体包括以下步骤:
S1、获得由样本数据集合训练后的目标识别模型以及测试图片,所述测试图片包括标注框及每个标注框的类别标签;
具体的,所述样本数据集合,通过以下步骤得到:
根据预设的多个类别标签,从目标数据库中分别提取对应于每个类别标签的原始图片集合;
对每个类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个类别标签的样本图片集合,将所有类别标签的样本图片集合归集为样本数据集合。
所述每个类别标签的原始图片集合中原始图片的数量可调,但是远大于生成对应的样本图片集合所需要的数量。
所述增强与合成处理具体包括以下步骤:
启动计数器Index,重复执行以下步骤,直至得到当前类别标签对应的预设数量D的样本图片,将所述预设数量D的样本图片归集为当前类别标签的样本图片集合:
遍历当前类别标签的原始图片集合,每遍历一张原始图片计数器Index=Index+1,将所述Index与可调参量a进行整除运算,若Index能被可调参量a整除,则从业务场景背景图片库中随机读取一张场景背景图片,所述可调参量a为与场景背景图片进行合成的原始图片的最大数值;
根据所述场景背景图片分辨率的大小,将场景背景图片进行水平方向和垂直方向的N等分操作,划分得到N*N个等大小的区域块,每个区域块i以xi行yi列进行标识,其中a=N*N;
将当前遍历的原始图片进行增强处理,获得增强原始图片;
将所述增强原始图片粘贴至区域块i,所示i为Index与a进行取余运算得到的余数值,将合成有a张增强原始图片的场景背景图片确定为当前类别标签的的一张样本图片。
将所述增强原始图片粘贴至区域块i,具体包括以下步骤:
判断所述增强原始图片与区域块i的大小;
若所述增强原始图片与区域块i的大小不匹配,则将增强原始图片按照适配比率进行缩放处理,以获得与区域块i大小匹配的增强原始图片,将大小匹配的增强原始图片粘贴至区域块i。
具体的,将所述增强原始图片粘贴至区域块i,所述区域块i的标识为(xi,yi),其中:
xi为将Index与N进行整除运算得到的商值,即xi=Index//N;
yi为将Index与N进行取余运算得到的余数值,即yi=Index%N。
所述适配比率具体包括以下几种情形:
情形一:当w*hr>K时,所述适配比率为wr;
情形二:当h*wr>K时,所述适配比率为hr;
其中,wr为长变换比率:wr=K/w;
Hr为高变换比率:hr=K/h;
若所述增强原始图片大于区域块i的大小,则将所述增强原始图片按照适配比率进行缩小处理,以获得与区域块i大小匹配的图片,其中区域块i的大小为K*K,所述增强原始图片大小为w*h。
所述增强处理包括以下步骤:根据所述预设的图像数据增强处理集合按照预设规则对所述当前遍历的原始图片进行图像数据增强处理,所述图像数据增强处理集合包括:平移,旋转,亮度变换,翻转,添加高斯噪声,所述预设规则为随机抽取一个图像数据增强处理或对所述图像数据增强处理集合进行类别标签加载,所述类别标签加载是将图像数据增强处理按照特定的顺序集进行加载构成图像数据增强处理模型。
在一个实施例中,所述类别标签加载为平移+亮度转换+亮度;
在一个实施例中,所述类别标签加载为长宽扭曲+亮度转换+图像翻转。
在一种实施例中,本实施例中首先获取了样本数据集合,测试集包含15个场景,共3562张图片、45210个标注框,标注框中目标对象参差不齐。上述目标对象包括但不限于日常物品、违禁品,具体根据实际应用场景需要确定,违禁品包括但不限于枪支、弹药、易燃、易爆、有毒、放射性等危险物品。
具体而言,所述目标数据库为根据安检危险品标准所规定的场景危险品名录,包括危险品的图像、危险品所在位置坐标和危险品标签等。根据所述目标数据库,获得各类危险品的图像数据集,所述场景背景图片为对危险品检测的应用场景,需对危险品图像进行不同角度、尺度、亮度目标的泛化转换。按照所述图像数据增强处理如尺度缩放、长宽扭曲、亮度转换、图像翻转等进行图像转换增强,并通过图像处理算法对所述危险品图像数据集进行数据扩增,获得增强增后的危险品图像数据集。根据所述增强危险品图像数据集,生成样本数据集合,进而提高对不同角度、尺度、亮度目标检测的泛化能力,降低外界因素和目标多样性对评估模型精度的影响的技术效果。
安检中的目标识别模型对包裹中的物品进行识别,标注出物品的类别标签及其在行李箱中的位置,包括违禁品,所述违禁品的类别标签包括:枪支、刀具、打火机、管制器具、工具、易燃易爆物、液体、电子设备、充电宝、雨伞,以及生活用品,如衣物、鞋帽等。
在一张实施例中,所述测试图片中包括所有标注框以及每个标注框的预测框信息;所述标注框信息包括标注框的坐标、标注框的宽、标注框的高。
S2、将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片,所述识别后的测试图片还包括识别框以及每个识别框的类别标签;
在本实施例中,目标识别模型通过非极大值抑制算法获得对应于每一个违禁品的最优是识别框。所述测试图片中还包括所有识别框以及每个识别框的识别框信息;所述识别框信息包括识别框的坐标、识别框的宽、识别框的高。
S3、根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;
S4、根据每个类别标签的识别参数值,判断所述每个类别标签的识别参数值是否大于预设阈值;及
如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并循环步骤S1。
在一种实施方式中,所述识别参数值包括识别率,所述预设阈值包括识别率阈值,所述识别率通过以下步骤获得:
遍历所述标注框的类别标签,以当前遍历的类别标签为基准类别标签,在所有识别框的类别标签中进行匹配判定,判定是否存在与当前遍历的类别标签相同的类别标签;
若存在,则获取基准类别标签对应的一张或多张测试图片,分别计算所述测试图片中基准类别标签对应的标注框与基准类别标签对应的标注框之间的IoU值,并判定所述IoU值是否大于预设标准值:
若大于,则将所述测试图片标记为识别成功的测试图片;
若小于,则将所述测试图片标记为未识别成功的测试图片,将当前遍历的类别标签记录为未识别成功的类别标签;
计算基准类别标签对应的识别成功的测试图片数量与对应的测试图片数量的比值,所述比值为当前遍历的类别标签对应的识别率。
分别判断所有类别标签对应的识别率与识别率阈值的大小,若识别率小于识别率阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并循环步骤S1,具体包括以下步骤:
从所述测试图片中提取出所有未识别成功的测试图片,统计所述未识别成功的类别标签信息,所述类别标签信息包括:未识别成功的类别标签及对应的标签数量;
根据所述未识别成功的类别标签及对应的数量,生成对应的参数信息列表;
根据所述参数信息列表,从目标数据库中分别提取对应于每个未识别成功的类别标签的原始图片集合;
具体的所述参数信息列表包括对象的类别标签、类别标签对应的数量K1、对象对应的图像数据增强处理预设规则、对象对应的可调参量a1以及对象对应的样本图片的预设数量D1。
对每个未识别成功的类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个未识别成功的类别标签的的样本图片集合,将所有未识别成功的类别标签的的样本图片集合添加至样本数据集合。
所述每个未识别成功的类别标签的原始图片集合中原始图片的数量可调,但是远大于生成对应的样本图片集合所需要的数量。
在一种实施方式中,所述识别参数值还包括漏检率,所述预设阈值还包括漏检率阈值,所述漏检率通过以下步骤获得:
遍历所述标注框的类别标签,以当前遍历的类别标签为基准类别标签,在所有识别框的类别标签中进行匹配判定,判定是否存在与当前遍历的类别标签相同的类别标签;
若不存在,则获取基准类别标签对应的一张或多张测试图片视为当前遍历的类别标签的漏检测试图片,统计所述漏检测试图片的数量,将当前遍历的类别标签记录为漏检的类别标签;
计算当前遍历的类别标签对应的漏检测试图片数量与对应的测试图片数量的比值,所述比值为当前遍历的类别标签对应的漏检率。
分别判断所有类别标签对应的漏检率与漏检率阈值的大小,若漏检率小于漏检率阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并循环步骤S1,具体包括以下步骤:
从所述测试图片中提取出所有漏检测试图片,统计所述漏检的类别标签信息,所述类别标签信息包括:漏检的标签及对应的标签数量;
根据所述漏检的类别标签及对应的数量,生成对应的参数信息列表;
根据所述参数信息列表,从目标数据库中分别提取对应于每个漏检的类别标签的原始图片集合;
具体的所述参数信息列表包括对象的类别标签、类别标签对应的数量K2、对象对应的图像数据增强处理预设规则、对象对应的可调参量a2以及对象对应的样本图片的预设数量D2。
对每个漏检的类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个漏检的类别标签的样本图片集合,将所有漏检的类别标签的样本图片集合添加至样本数据集合。
所述每个漏检的类别标签的原始图片集合中原始图片的数量可调,但是远大于生成对应的样本图片集合所需要的数量。
在一种实施例中,还可以根据漏检测试图片、漏检的类别标签与未识别成功的测试图片、未识别成功的类别标签,在样本数据集合中增加对应的该类别标签的样本图片。
在一种具体的实施例中:
测试集Q={q1,q2,q3,…,qi,…qn},qi表示第i个测试数据,测试数据指的是一张测试图片,里面包含了多个需要识别的类别标签。所以qi={QLB1,QLB2,…,QLBj…,QLBn},QLBj表示测试数据的第j个需要识别类别标签的信息。QLBj={index,id,x0,y0,w,h,x1,y1,status}表示需要识别类别标签的信息包含:id-类别标签ID,index-表示序号,x0-类别标签左上顶点的x坐标,y0表示类别标签左上顶点的y坐标,w-表示类别标签的框,h-表示类别标签的高,x1-类别标签右下顶点的x坐标,y1-类别标签右下顶点的坐标,x1=x0+0.5*w,y1=y0+0.5*h,status-类别标签是否识别成功的状态,status=0表示未匹配,status=1表示匹配成功,status=2表示匹配错误
对于第i个测试数据qi,假设qi中QLBj有m个。用QMi{id,QL}存放测试集,id为类别标签ID,QL为类别标签ID对应的标注结果QLB。这里的需要的时间复杂度为O(m)。
识别结果R={r1,r2,…,ri,…rn},ri表示对第i个测试数据的识别结果ri={RLB1,RLB2,…,RLBj,…RLBn},RLBj={index,id,x0,y0,x1,y1,status},index-表示序号,x0-类别标签左上顶点的x坐标,y0表示类别标签左上顶点的y坐标,status-类别标签是否识别成功的状态,status=0表示未匹配,status=1表示匹配成功,status=2表示匹配错误
用RMi(id,RL)存放识别结果。Id为识别的类别标签,RL存放识别类别标签id对应的识别结果RLB.
遍历QMi的id
ForidinQMi:
QL=QMi[id]
IfidnotinRMi:
QL的中的所有元素QLBi的status=0;
Else:
RL=RMi[id]
通过计算QL中元素和RL中元素的iou,当iou满足设置的阈值时,则匹配成功,status设置为1。
计算测试集Q和识别结果R中每个类别标签的识别率。
自动训练
根据步骤二中最后的识别率,对样本进行重新分配。
1、如果识别率都不够理想,则类别标签增加样本数据和样本多样性,然后自动重新训练。
2、如果部分类别标签识别率不够理想,则保持识别率通过的样本不变,增加识别率不够立项的样本的多样性和样本数目,然后再重新训练。
3、如果识别率通过,则可以停止。
实施例2
基于智能识图盒子性能的验证系统,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现所述的基于智能识图盒子性能的验证方法,所述一个或多个程序包括:
获取模块,用于获得由样本数据集合训练后的目标识别模型以及测试图片,所述测试图片包括标注框及每个标注框的类别标签;
识别模块,用于将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片,所述识别后的测试图片还包括识别框以及每个识别框的类别标签;
计算模块,用于根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;
增加模块,用于根据每个类别标签的识别参数值,判断所述每个类别标签的识别参数值是否大于预设阈值;及
如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并执行获取模块。
实施例3,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时能实现所述的基于智能识图盒子性能的验证方法。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。

Claims (9)

1.基于智能识图盒子性能的验证方法,其特征在于,具体包括以下步骤:
S1、获得由样本数据集合训练后的目标识别模型以及测试图片,所述测试图片包括标注框及每个标注框的类别标签;
S2、将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片,所述识别后的测试图片还包括识别框以及每个识别框的类别标签;
S3、根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;
S4、根据每个类别标签的识别参数值,判断所述每个类别标签的识别参数值是否大于预设阈值;及
如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并循环步骤S1。
2.根据权利要求1所述的基于智能识图盒子性能的验证方法,其特征在于,所述样本数据集合,通过以下步骤得到:
根据预设的多个类别标签,从目标数据库中分别提取对应于每个类别标签的原始图片集合;
对每个类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个类别标签的样本图片集合,将所有类别标签的样本图片集合归集为样本数据集合。
3.根据权利要求2所述的智能识图盒子性能的验证方法,其特征在于,所述增强与合成处理具体包括以下步骤:
启动计数器Index,重复执行以下步骤,直至得到当前类别标签对应的预设数量D的样本图片,将所述预设数量D的样本图片归集为当前类别标签的样本图片集合:
遍历当前类别标签的原始图片集合,每遍历一张原始图片计数器Index=Index+1,将所述Index与可调参量a进行整除运算,若Index能被可调参量a整除,则从业务场景背景图片库中随机读取一张场景背景图片,所述可调参量a为与场景背景图片进行合成的原始图片的最大数值;
根据所述场景背景图片分辨率的大小,将场景背景图片进行水平方向和垂直方向的N等分操作,划分得到N*N个等大小的区域块,每个区域块i以xi行yi列进行标识,其中a=N*N;
将当前遍历的原始图片进行增强处理,获得增强原始图片;
将所述增强原始图片粘贴至区域块i,所示i为Index与a进行取余运算得到的余数值,将合成有a张增强原始图片的场景背景图片确定为当前类别标签的的一张样本图片。
4.根据权利要求3所述的基于智能识图盒子性能的验证方法,其特征在于,将所述增强原始图片粘贴至区域块i,具体包括以下步骤:
判断所述增强原始图片与区域块i的大小;
若所述增强原始图片与区域块i的大小不匹配,则将增强原始图片按照适配比率进行缩放处理,以获得与区域块i大小匹配的增强原始图片,将大小匹配的增强原始图片粘贴至区域块i。
5.根据权利要求4所述的基于智能识图盒子性能的验证方法,其特征在于,所述增强原始图片大小为w*h,所述区域块i的大小为K*K,则所述适配比率具体包括以下几种情形:
情形一:当w*hr>K时,所述适配比率为wr;
情形二:当h*wr>K时,所述适配比率为hr;
其中,wr为长变换比率:wr=K/w;
Hr为高变换比率:hr=K/h;
若所述增强原始图片的大小大于区域块i,则将所述增强原始图片按照适配比率进行缩小处理,以获得与区域块i大小匹配的图片。
6.根据权利要求3所述的基于智能识图盒子性能的验证方法,其特征在于,所述增强处理包括以下步骤:根据所述预设的图像数据增强处理集合按照预设规则对所述当前遍历的原始图片进行图像数据增强处理,所述图像数据增强处理集合包括:平移,旋转,亮度变换,翻转,添加高斯噪声,所述预设规则为随机抽取一个图像数据增强处理或对所述图像数据增强处理集合进行类别标签加载,所述类别标签加载是将图像数据增强处理按照特定的顺序集进行加载构成图像数据增强处理模型。
7.根据权利要求1所述的基于智能识图盒子性能的验证方法,其特征在于,所述识别参数值包括识别率,所述预设阈值包括识别率阈值,所述识别率通过以下步骤获得:
遍历所述标注框的类别标签,以当前遍历的类别标签为基准类别标签,在所有识别框的类别标签中进行匹配判定,判定是否存在与当前遍历的类别标签相同的类别标签;
若存在,则获取基准类别标签对应的一张或多张测试图片,分别计算所述测试图片中基准类别标签对应的标注框与基准类别标签对应的标注框之间的IoU值,并判定所述IoU值是否大于预设标准值:
若大于,则将所述测试图片标记为识别成功的测试图片;
若小于,则将所述测试图片标记为未识别成功的测试图片,将当前遍历的类别标签记录为未识别成功的类别标签;
计算基准类别标签对应的识别成功的测试图片数量与对应的测试图片数量的比值,所述比值为当前遍历的类别标签对应的识别率。
8.根据权利要求7所述的基于智能识图盒子性能的验证方法,其特征在于,
从所述测试图片中提取出所有未识别成功的测试图片,统计所述未识别成功的类别标签信息,所述类别标签信息包括:未识别成功的类别标签及对应的标签数量;
根据所述未识别成功的类别标签及对应的数量,生成对应的参数信息列表;
根据所述参数信息列表,从目标数据库中分别提取对应于每个未识别成功的类别标签的原始图片集合;
对每个未识别成功的类别标签的原始图片集合分别进行增强与合成处理,获得分别对应于每个未识别成功的类别标签的的样本图片集合,将所有未识别成功的类别标签的的样本图片集合添加至样本数据集合。
9.基于智能识图盒子性能的验证系统,其特征在于,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现根据权利要求1至8中任意一项所述的基于智能识图盒子性能的验证方法,所述一个或多个程序包括:
获取模块,用于获得由样本数据集合训练后的目标识别模型以及测试图片,所述测试图片包括标注框及每个标注框的类别标签;
识别模块,用于将所述测试图片输入至所述目标识别模型中,以得到识别后的测试图片,所述识别后的测试图片还包括识别框以及每个识别框的类别标签;
计算模块,用于根据所述标注框及每个标注框的类别标签、以及识别框以及每个识别框的类别标签,计算每个对应的类别标签的识别参数值;
增加模块,用于根据每个类别标签的识别参数值,判断所述每个类别标签的识别参数值是否大于预设阈值;及
如果存在类别标签的识别参数值小于所述预设阈值,则在样本数据集合中增加对应的该类别标签的样本图片,并执行获取模块。
CN202210897088.6A 2022-03-23 2022-07-28 基于智能识图盒子性能的验证方法及系统 Active CN115035352B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022102877544 2022-03-23
CN202210287754.4A CN114693968A (zh) 2022-03-23 2022-03-23 基于智能识图盒子性能的验证方法及系统

Publications (2)

Publication Number Publication Date
CN115035352A true CN115035352A (zh) 2022-09-09
CN115035352B CN115035352B (zh) 2023-08-04

Family

ID=82139998

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210287754.4A Withdrawn CN114693968A (zh) 2022-03-23 2022-03-23 基于智能识图盒子性能的验证方法及系统
CN202210897088.6A Active CN115035352B (zh) 2022-03-23 2022-07-28 基于智能识图盒子性能的验证方法及系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202210287754.4A Withdrawn CN114693968A (zh) 2022-03-23 2022-03-23 基于智能识图盒子性能的验证方法及系统

Country Status (1)

Country Link
CN (2) CN114693968A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019071662A1 (zh) * 2017-10-09 2019-04-18 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN109948562A (zh) * 2019-03-25 2019-06-28 浙江啄云智能科技有限公司 一种基于x射线图像的安检系统深度学习样本生成方法
CN111223099A (zh) * 2020-04-17 2020-06-02 浙江啄云智能科技有限公司 违禁品检测方法、一种计算设备及存储介质
WO2021203618A1 (zh) * 2020-04-08 2021-10-14 浙江啄云智能科技有限公司 图像样本生成方法及系统、目标检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019071662A1 (zh) * 2017-10-09 2019-04-18 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN109948562A (zh) * 2019-03-25 2019-06-28 浙江啄云智能科技有限公司 一种基于x射线图像的安检系统深度学习样本生成方法
WO2021203618A1 (zh) * 2020-04-08 2021-10-14 浙江啄云智能科技有限公司 图像样本生成方法及系统、目标检测方法
CN111223099A (zh) * 2020-04-17 2020-06-02 浙江啄云智能科技有限公司 违禁品检测方法、一种计算设备及存储介质

Also Published As

Publication number Publication date
CN114693968A (zh) 2022-07-01
CN115035352B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN108416279B (zh) 文档图像中的表格解析方法及装置
US8983200B2 (en) Object segmentation at a self-checkout
CN106203539B (zh) 识别集装箱箱号的方法和装置
JP5413501B1 (ja) 画像処理装置、画像処理システム及びプログラム
CN111813997A (zh) 入侵分析方法、装置、设备及存储介质
CN110929626A (zh) 确定库存货物件数的方法、仓库盘点方法、装置及设备
CN110210297A (zh) 报关单图像中文字定位与提取的方法
CA2815591A1 (en) Method for detecting and recognising an object in an image, and an apparatus and a computer program therefor
Farahnakian et al. Towards autonomous industrial warehouse inspection
CN104079798B (zh) 图像检测方法、装置及一种视频监控系统
CN115984662A (zh) 一种多模态数据预训练及识别方法、装置、设备及介质
Araar et al. Traffic sign recognition using a synthetic data training approach
CN111985269A (zh) 检测模型构建方法、检测方法、装置、服务器及介质
CN115035352A (zh) 基于智能识图盒子性能的验证方法及系统
CN111507177A (zh) 一种用于计量周转柜的识别方法及装置
CN114648720A (zh) 神经网络训练方法、图像检测方法、装置、设备及介质
CN114418951A (zh) 一种焊盘检测方法、装置、计算机设备及存储介质
Heydarzadeh et al. Utilizing skin mask and face organs detection for improving the Viola face detection method
Wu et al. Express parcel detection based on improved faster regions with CNN features
CN117854211B (zh) 一种基于智能视觉的目标对象识别方法及装置
CN111191575A (zh) 一种基于火苗跳动建模的明火检测方法及系统
CN116468974B (zh) 一种基于图像生成的烟雾检测方法、装置及存储介质
CN112070135B (zh) 电力设备图像检测方法、装置、电力设备及存储介质
Wu et al. Key methods of recognizing container number automatically using video stream in intelligent tally
CN117746314B (zh) 一种基于多级联合判定ood物体的方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant