CN115205619A - 检测模型的训练方法、检测方法、装置和存储介质 - Google Patents

检测模型的训练方法、检测方法、装置和存储介质 Download PDF

Info

Publication number
CN115205619A
CN115205619A CN202210634709.1A CN202210634709A CN115205619A CN 115205619 A CN115205619 A CN 115205619A CN 202210634709 A CN202210634709 A CN 202210634709A CN 115205619 A CN115205619 A CN 115205619A
Authority
CN
China
Prior art keywords
sample
training
samples
positive
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210634709.1A
Other languages
English (en)
Inventor
曾真
吴子平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Labsci Medical Robot Co ltd
Original Assignee
Hunan Labsci Medical Robot Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Labsci Medical Robot Co ltd filed Critical Hunan Labsci Medical Robot Co ltd
Priority to CN202210634709.1A priority Critical patent/CN115205619A/zh
Publication of CN115205619A publication Critical patent/CN115205619A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种检测模型的训练方法、检测方法、装置和存储介质。该检测模型的训练方法包括:获取训练集;训练集包括N个正样本和M个负样本;对目标样本进行数据增强处理,得到训练样本;将训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。上述检测模型的训练过程中,通过对训练集中的正样本和/或负样本进行数据增强处理,增加了样本的多样性,提高了标注数据的利用率。这样,在图像检测过程中,可以将多个待检测图像进行叠加,目标检测模型通过对叠加后的多个待检测图像进行图像检测,提高检测速度。

Description

检测模型的训练方法、检测方法、装置和存储介质
技术领域
本发明涉及深度学习技术领域,尤其涉及一种检测模型的训练方法、检测方法、装置和存储介质。
背景技术
目前,通常使用基于深度学习技术的相关模型,例如SSD模型和YOLO模型,对图像进行检测,以识别得到图像中特定的标注。例如,识别医疗影像中的特定细胞。
然而,现有的检测模型在维持一定检测精度的情况下,对标注数据有较高的要求,这增加了标注数据的数据量和计算时长,进而降低了检测模型的检测速度。综上所述,如何在图像检测过程中保持高检测精度的同时,提高检测效率,是本领域待以解决的技术问题。
发明内容
本发明实施例的目的在于提供一种检测模型的训练方法、检测方法、装置和存储介质,解决如何在图像检测过程中保持高检测精度的同时,提高检测效率的技术问题。具体技术方案如下:
在本发明实施例的第一方面,首先提供了一种检测模型的训练方法,包括:
获取训练集;所述训练集包括N个正样本和M个负样本,所述正样本为包括目标标注的图像,所述负样本为不包括目标标注的图像,N和M均为大于1的正整数;
对目标样本进行数据增强处理,得到训练样本;所述目标样本为所述训练集中的所述正样本或所述负样本;
将所述训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
在本发明实施例的第二方面,还提供了一种检测方法,包括:
获取多个待检测图像;
将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像;
将所述目标图像输入至如第一方面所述的目标检测模型,生成检测结果;
其中,所述检测结果用于表征所述目标图像是否为包括目标标注的图像。
在本发明实施例的第三方面,还提供了一种检测模型的训练装置,包括:
第一获取模块,用于获取训练集;所述训练集包括N个正样本和M个负样本,所述正样本为包括目标标注的图像,所述负样本为不包括目标标注的图像,N和M均为大于1的正整数;
第一处理模块,用于对目标样本进行数据增强处理,得到训练样本;所述目标样本为所述训练集中的所述正样本或所述负样本;
训练模块,用于将所述目标样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
在本发明实施例的第四方面,还提供了一种检测装置,包括:
获取模块,用于获取多个待检测图像;
处理模块,用于将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像;
生成模块,用于将所述目标图像输入至如第一方面所述的目标检测模型,生成检测结果;
其中,所述检测结果用于表征所述目标图像是否为包括目标标注的图像。
在本发明实施例的第五方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一实施例所述的检测模型的训练方法,或者执行上述任一实施例所述的检测方法。
在本发明实施的第六方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一实施例所述的检测模型的训练方法,或者执行上述任一实施例所述的检测方法。
本发明实施例中,获取训练集;训练集包括N个正样本和M个负样本;对目标样本进行数据增强处理,得到训练样本;将训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。上述检测模型的训练过程中,通过对训练集中的正样本和/或负样本进行数据增强处理,增加了样本的多样性,提高了标注数据的利用率。这样,在图像检测过程中,可以将多个待检测图像进行叠加,目标检测模型通过对叠加后的多个待检测图像进行图像检测,提高检测速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中检测模型的训练方法的流程示意图;
图2为本发明实施例提供的正样本的示意图;
图3为本发明实施例提供的负样本的示意图之一;
图4为本发明实施例提供的负样本的示意图之二;
图5为本发明实施例提供的训练样本的示意图;
图6为本发明实施例提供的训练样本的示意图;
图7为本发明实施例中检测方法的流程示意图;
图8为本发明实施例中检测模型的训练装置的结构示意图;
图9为本发明实施例中检测装置的结构示意图;
图10为本发明实施例中一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
请参阅图1,图1为本发明实施例中检测模型的训练方法的流程图。本发明实施例提供的检测模型的训练方法包括:
S101,获取训练集。
对预设的多帧图像进行标注,将标注后的图像划分为正样本和负样本,将上述正样本和负样本放入预设的样本集合中。其中,正样本为包括目标标注的图像,负样本为不包括目标标注的图像。上述标注可以理解为特定的图像特征,例如,图像为交通场景图像,上述目标表征可以是汽车。应理解,可以通过人工标注的方式对图像进行标注,或者使用图像识别模型,例如基于神经网络的图像特征提取模型,对图像进行标注,在此不做具体限定。
本步骤中,获取样本集合N个正样本和M个负样本,得到训练集,其中,N和M均为大于1的正整数,可选地,上述N和M可以相同。
一种可选地实施方式为:按照样本集合中正样本的比例,形成训练集、验证集和测试集,其中,训练集中正样本的数量占样本集合中全部正样本的70%,验证集中正样本的数量占样本集合中全部正样本的15%,测试集中正样本的数量占样本集合中全部正样本的15%,可选地,训练集、验证集和测试集中负样本的数量均与正样本的数量相同。例如,正样本的总数量为100,则训练集包括70个正样本和70个负样本。
应理解,上述训练集用于训练检测模型,上述验证集用于验证检测模型的检测精度,上述测试集用于进行目标标记的验证。
S102,对目标样本进行数据增强处理,得到训练样本。
本步骤中,训练集包括目标样本,目标样本为所述训练集中的所述正样本或所述负样本。
可选地,上述数据增强处理可以对目标样本执行叠加操作。
一种可选地实施方式为:对正样本和负样本进行叠加处理,得到训练样本。
另一种可选地实施方式为:对至少两个正样本进行叠加处理,得到训练样本。
另一种可选地实施方式为:对至少两个负样本进行叠加处理,得到训练样本。
S103,将所述训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
可选地,上述检测模型可以是YOLOv4模型,也可以是其他图像检测模型,在此不做具体限定。
可选地,当检测模型迭代训练达到预测次数后,确定该检测模型训练完成,将训练完成的检测模型称为目标检测模型。
本发明实施例中,获取训练集;训练集包括N个正样本和M个负样本;对目标样本进行数据增强处理,得到训练样本;将训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。上述检测模型的训练过程中,通过对训练集中的正样本和/或负样本进行数据增强处理,增加了样本的多样性,提高了标注数据的利用率。这样,在图像检测过程中,可以将多个待检测图像进行叠加,目标检测模型通过对叠加后的多个待检测图像进行图像检测,提高检测速度。
本实施例中,可以基于对正样本和负样本进行叠加处理得到训练样本:
可选地,在所述目标样本为正样本的情况下,基于所述N个正样本和M个负样本,对所述正样本进行叠加处理,得到所述训练样本;
在所述目标样本为负样本的情况下,基于所述N个正样本和M个负样本,对所述负样本进行叠加处理,得到所述训练样本。
可选地,所述基于所述N个正样本和M个负样本,对所述正样本进行叠加处理,得到所述训练样本包括:
以P1%的概率将所述正样本与所述M个负样本中的任意一个负样本进行叠加,得到所述训练样本;
以P2%的概率将所述正样本与所述M个负样本中的任意多个负样本进行叠加,得到所述训练样本;
以P3%的概率将所述正样本与所述N个正样本中的其他任意一个正样本进行叠加,得到所述训练样本;
以P4%的概率将所述正样本与所述N个正样本中的其他任意多个正样本进行叠加,得到所述训练样本;
以P5%的概率将所述正样本与所述M个负样本中的多个负样本,以及与所述N个正样本中的其他至少一个正样本进行叠加,得到所述训练样本。
本实施例中,在目标样本为正样本的情况下,以P1%的概率将上述正样本与一个负样本进行叠加,得到训练样本。也就是说,上述训练样本为一个正样本和一个负样本叠加后的样本数据。
示例性的,请参阅图2至图5,其中,图2和图5中标记D1的指向区域为目标标注所处图像区域,将图2中的正样本与图3中的负样本进行叠加,得到图5示出的训练样本。
可选地,以P2%的概率将上述正样本与多个负样本进行叠加,得到训练样本。也就是说,上述训练样本为一个正样本和多个负样本叠加后的样本数据。
示例性的,请参阅图2至图6,其中,图2和图6中标记D1的指向区域为目标标注所处图像区域,将图2中的正样本与图3中的负样本以及图4中的负样本进行叠加,得到图6示出的训练样本。
可选地,以P3%的概率将上述正样本与其他任意一个正样本进行叠加,得到训练样本。也就是说,上述训练样本为一个正样本和一个正样本叠加后的样本数据。
可选地,以P4%的概率将上述正样本与其他多个正样本进行叠加,得到训练样本。也就是说,上述训练样本为一个正样本和多个正样本叠加后的样本数据。
可选地,以P5%的概率将上述正样本与多个负样本,以及至少一个其他正样本进行叠加,得到训练样本。也就是说,上述训练样本为多个正样本和多个负样本叠加后的样本数据。
在其他实施例中,以P6%的概率对正样本不执行叠加操作。
其中,P1、P2、P3、P4、P5和P6的和值为预设数值,可选地,该预设数值为100,可选地,P1、P2、P3、P4、P5和P6各自对应的数值小于或等于100,且大于或等于0。
可选地,可以对每个正样本使用随机数生成算法,确定该正样本对应的随机数,基于该正样本对应的随机数,确定该正样本是否进行叠加,以及是叠加一个负样本、叠加多个负样本、叠加一个正样本、叠加多个正样本、还是叠加至少一个正样本和多个负样本。
示例性的,限定随机数0表示不叠加负样本,随机数1表示叠加一个负样本。若一正样本对应的随机数为0,则该正样本不叠加负样本;另一正样本对应的随机数为1,则将该正样本与任一负样本进行叠加处理。
本实施例通过对正样本和负样本进行叠加处理,增加了训练样本的多样性,提高了标注数据的利用率。
可选地,所述基于所述N个正样本和M个负样本,对所述负样本进行叠加处理,得到所述训练样本包括:
以L1%的概率将所述负样本与所述N个正样本中的任意一个正样本进行叠加,得到所述训练样本;
以L2%的概率将所述负样本与所述N个正样本中的任意多个正样本进行叠加,得到所述训练样本;
以L3%的概率将所述负样本与所述M个负样本中的其他任意一个负样本进行叠加,得到所述训练样本;
以L4%的概率将所述负样本与所述M个负样本中的其他任意多个负样本进行叠加,得到所述训练样本;
以L5%的概率将所述负样本与所述N个正样本中的多个正样本,以及与所述M个负样本中的其他至少一个负样本进行叠加,得到所述训练样本。
本实施例中,在目标样本为负样本的情况下,以L1%的概率将上述负样本与一个正样本进行叠加,得到训练样本。也就是说,上述训练样本为一个负样本和一个正样本叠加后的样本数据。
可选地,以L2%的概率将上述负样本与多个正样本进行叠加,得到训练样本。也就是说,上述训练样本为一个负样本和多个正样本叠加后的样本数据。
可选地,以L3%的概率将上述负样本与其他一个负样本进行叠加,得到训练样本。也就是说,上述训练样本为一个负样本和一个负样本叠加后的样本数据。
可选地,以L4%的概率将上述负样本与其他多个负样本进行叠加,得到训练样本。也就是说,上述训练样本为一个负样本和多个负样本叠加后的样本数据。
可选地,以L5%的概率将上述负样本与多个正样本,以及至少一个其他负样本进行叠加,得到训练样本。也就是说,上述训练样本为多个正样本和多个负样本叠加后的样本数据。
在其他实施例中,以L6%的概率对该负样本不执行叠加操作。
其中,L1、L2、L3、L4、L5和L6的和值为预设数值,可选地,该预设数值为100,可选地,L1、L2、L3、L4、L5和L6各自对应的数值小于或等于100,且大于或等于0。
本实施例通过对正样本和负样本进行叠加处理,增加了训练样本的多样性,提高了标注数据的利用率。
可选地,上述正样本和负样本在进行叠加之前,进行样本数据增强处理,该样本数据增强处理包括但不限于水平翻转,垂直翻转,旋转,缩放。在样本数据叠加的过程中,将叠加的正样本的目标标注进行相应的变换,例如,水平翻转后正样本中的目标标注应当随着水平翻转进行相应的处理。
可选地,所述得到目标检测模型之后,所述方法包括:
获取验证集;
使用所述目标检测模型对所述验证集进行推理,得到推理结果;
基于所述推理结果和所述验证结果,生成模型评估结果。
验证集包括K个正样本和I个负样本,K和I均为大于1的正整数。如上所述,可以将验证集包括的正样本和负样本称为验证样本,这样,可以将单独的正样本和负样本标记为1,将一个正样本叠加一个负样本标记为2,将一个正样本叠加两个负样本标记为3,不限定正样本叠加的负样本个数,将上述标记确定为验证结果。
使用目标检测模型对验证集进行推理,得到验证集中每个验证样本对应的推理结果,进一步的,基于推理结果和验证结果,生成用于评价目标检测模型的检测精度的模型评估结果。
其中,验证结果用于表征验证集中每个样本对应的第一样本类型,推理结果用于表征验证集中每个样本对应的第二样本类型,模型评估结果用于评价目标检测模型的检测精度。
例如,验证集包括1个单独的正样本和1个与一个负样本叠加的正样本,则验证结果为[1,2];若目标检测模型检测到验证集包括1个单独的正样本和1个与一个负样本叠加的正样本,则生成的推理结果也为[1,2],以此确定模型的训练效果较佳。
在可选地实施例中,还可以使用测试集对目标检测模型进行目标标记的验证,得到包括目标标记的图像。具体而言,将测试集输入至目标检测模型中,目标检测模型对输入的图像进行预处理,得到包括目标标记的图像。其中,上述预处理过程包括图像缩放处理和图像正则化处理。
请参阅图7,图7为本发明实施例中检测方法的流程图。本发明实施例提供的检测方法包括:
S201,获取多个待检测图像。
上述待检测图像可以是用户输入的图像,也可以是用户输入的视频中的多帧图像,也可以是通过互联网下载到的图像,在此不做具体限定。
S202,将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像。
一种可选地实施方式为:可以选取待检测图像中的部分图像进行叠加,另一部分图像不进行叠加。另一种可选地实施方式为:对多个待检测图像中的每个图像均进行叠加。通过上述两种方式得到目标图像。
其中,一张待检测图像可以叠加另一张待检测图像,或者,一张待检测图像可以叠加多张待检测图像。
S203,将所述目标图像输入至目标检测模型,生成检测结果。
本步骤中,将目标图像输入至目标检测模型,使用该目标检测模型对目标检测图像进行检测,筛选出包括目标标注的图像,以此得到检测结果,其中,上述检测结果用于表征目标图像是否为包括目标标注的图像。
应理解,本步骤中的目标检测模型为基于上述检测模型的训练方法得到的检测模型。可选地,目标检测模型可以是YOLOv4模型。
本实施例中,对多个待检测图像进行叠加,得到目标图像;进而使用目标检测模型对目标图像进行检测,对目标检测模型而言,对一个目标图像进行检测可以实现对多帧待检测图像进行检测的效果,以此提高了检测速度。
如图8所示,本发明实施例还提供了一种检测模型的训练装置300,所述检测模型的训练装置300包括:
第一获取模块301,用于获取训练集;所述训练集包括N个正样本和M个负样本,所述正样本为包括目标标注的图像,所述负样本为不包括目标标注的图像,N和M均为大于1的正整数;
第一处理模块302,用于对目标样本进行数据增强处理,得到训练样本;所述目标样本为所述训练集中的所述正样本或所述负样本;
训练模块303,用于将所述目标样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
可选地,所述第一处理模块302,具体用于:
在所述目标样本为正样本的情况下,基于所述N个正样本和M个负样本,对所述正样本进行叠加处理,得到所述训练样本;
在所述目标样本为负样本的情况下,基于所述N个正样本和M个负样本,对所述负样本进行叠加处理,得到所述训练样本。
可选地,所述第一处理模块302,还具体用于:
对于所述N个正样本中的任一正样本,以P1%的概率将所述正样本与所述M个负样本中的任意一个负样本进行叠加,得到所述训练样本;
以P2%的概率将所述正样本与所述M个负样本中的任意多个负样本进行叠加,得到所述训练样本;
以P3%的概率将所述正样本与所述N个正样本中的其他任意一个正样本进行叠加,得到所述训练样本;
以P4%的概率将所述正样本与所述N个正样本中的其他任意多个正样本进行叠加,得到所述训练样本;
以P5%的概率将所述正样本与所述M个负样本中的多个负样本,以及与所述N个正样本中的其他至少一个正样本进行叠加,得到所述训练样本可选地,所述第一处理模块302,还具体用于:
以L1%的概率将所述负样本与所述N个正样本中的任意一个正样本进行叠加,得到所述训练样本;
以L2%的概率将所述负样本与所述N个正样本中的任意多个正样本进行叠加,得到所述训练样本;
以L3%的概率将所述负样本与所述M个负样本中的其他任意一个负样本进行叠加,得到所述训练样本;
以L4%的概率将所述负样本与所述M个负样本中的其他任意多个负样本进行叠加,得到所述训练样本;
以L5%的概率将所述负样本与所述N个正样本中的多个正样本,以及与所述M个负样本中的其他至少一个负样本进行叠加,得到所述训练样本可选地,所述检测模型的训练装置300还包括:
第二获取模块,用于获取验证集;
第二处理模块,用于使用所述目标检测模型对所述验证集进行推理,得到推理结果;
生成模块,用于基于所述推理结果和所述验证结果,生成模型评估结果;
其中,所述验证集包括K个正样本和I个负样本,K和I均为大于1的正整数所述验证结果用于表征所述验证集中每个样本对应的第一样本类型,所述推理结果用于表征所述验证集中每个样本对应的第二样本类型,所述模型评估结果用于评价所述目标检测模型的检测精度。
如图9所示,本发明实施例还提供了一种检测装置400,所述检测装置400包括:
获取模块401,用于获取多个待检测图像;
处理模块402,用于将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像;
生成模块403,用于将所述目标图像输入至目标检测模型,生成检测结果;
其中,所述检测结果用于表征所述目标图像是否为包括目标标注的图像。
本发明实施例还提供了一种电子设备,如图10所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。
其中,存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,所述计算机程序被所述处理器501执行时,用于获取训练集;
对目标样本进行数据增强处理,得到训练样本;
将所述训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
所述计算机程序被所述处理器501执行时,还用于以P1%的概率将所述正样本与所述M个负样本中的任意一个负样本进行叠加,得到所述训练样本;
以P2%的概率将所述正样本与所述M个负样本中的任意多个负样本进行叠加,得到所述训练样本;
以P3%的概率将所述正样本与所述N个正样本中的其他任意一个正样本进行叠加,得到所述训练样本;
以P4%的概率将所述正样本与所述N个正样本中的其他任意多个正样本进行叠加,得到所述训练样本;
以P5%的概率将所述正样本与所述M个负样本中的多个负样本,以及与所述N个正样本中的其他至少一个正样本进行叠加,得到所述训练样本。
所述计算机程序被所述处理器501执行时,还用于以L1%的概率将所述负样本与所述N个正样本中的任意一个正样本进行叠加,得到所述训练样本;
以L2%的概率将所述负样本与所述N个正样本中的任意多个正样本进行叠加,得到所述训练样本;
以L3%的概率将所述负样本与所述M个负样本中的其他任意一个负样本进行叠加,得到所述训练样本;
以L4%的概率将所述负样本与所述M个负样本中的其他任意多个负样本进行叠加,得到所述训练样本;
以L5%的概率将所述负样本与所述N个正样本中的多个正样本,以及与所述M个负样本中的其他至少一个负样本进行叠加,得到所述训练样本。
所述计算机程序被所述处理器501执行时,还用于获取验证集;
使用所述目标检测模型对所述验证集进行推理,得到推理结果;
基于所述推理结果和所述验证结果,生成模型评估结果。
所述计算机程序被所述处理器501执行时,还用于获取多个待检测图像;
将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像;
将所述目标图像输入至目标检测模型,生成检测结果。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一实施例所述的检测模型的训练方法,或者执行上述实施例中任一实施例所述的检测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一实施例所述的检测模型的训练方法,或者执行上述实施例中任一实施例所述的检测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种检测模型的训练方法,其特征在于,包括:
获取训练集;所述训练集包括N个正样本和M个负样本,所述正样本为包括目标标注的图像,所述负样本为不包括目标标注的图像,N和M均为大于1的正整数;
对目标样本进行数据增强处理,得到训练样本;所述目标样本为所述训练集中的所述正样本或所述负样本;
将所述训练样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
2.根据权利要求1所述的方法,其特征在于,所述对目标样本进行数据增强处理,得到训练样本包括:
在所述目标样本为正样本的情况下,基于所述N个正样本和M个负样本,对所述正样本进行叠加处理,得到所述训练样本;
在所述目标样本为负样本的情况下,基于所述N个正样本和M个负样本,对所述负样本进行叠加处理,得到所述训练样本。
3.根据权利要求2所述的方法,其特征在于,所述基于所述N个正样本和M个负样本,对所述正样本进行叠加处理,得到所述训练样本包括:
以P1%的概率将所述正样本与所述M个负样本中的任意一个负样本进行叠加,得到所述训练样本;
以P2%的概率将所述正样本与所述M个负样本中的任意多个负样本进行叠加,得到所述训练样本;
以P3%的概率将所述正样本与所述N个正样本中的其他任意一个正样本进行叠加,得到所述训练样本;
以P4%的概率将所述正样本与所述N个正样本中的其他任意多个正样本进行叠加,得到所述训练样本;
以P5%的概率将所述正样本与所述M个负样本中的多个负样本,以及与所述N个正样本中的其他至少一个正样本进行叠加,得到所述训练样本。
4.根据权利要求2所述的方法,其特征在于,所述基于所述N个正样本和M个负样本,对所述负样本进行叠加处理,得到所述训练样本包括:
以L1%的概率将所述负样本与所述N个正样本中的任意一个正样本进行叠加,得到所述训练样本;
以L2%的概率将所述负样本与所述N个正样本中的任意多个正样本进行叠加,得到所述训练样本;
以L3%的概率将所述负样本与所述M个负样本中的其他任意一个负样本进行叠加,得到所述训练样本;
以L4%的概率将所述负样本与所述M个负样本中的其他任意多个负样本进行叠加,得到所述训练样本;
以L5%的概率将所述负样本与所述N个正样本中的多个正样本,以及与所述M个负样本中的其他至少一个负样本进行叠加,得到所述训练样本。
5.根据权利要求1所述的方法,其特征在于,所述得到目标检测模型之后,所述方法包括:
获取验证集;
使用所述目标检测模型对所述验证集进行推理,得到推理结果;
基于所述推理结果和所述验证结果,生成模型评估结果;
其中,所述验证集包括K个正样本和I个负样本,K和I均为大于1的正整数所述验证结果用于表征所述验证集中每个样本对应的第一样本类型,所述推理结果用于表征所述验证集中每个样本对应的第二样本类型,所述模型评估结果用于评价所述目标检测模型的检测精度。
6.一种检测方法,其特征在于,包括:
获取多个待检测图像;
将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像;
将所述目标图像输入至如权利要求1-5中任一项所述的目标检测模型,生成检测结果;
其中,所述检测结果用于表征所述目标图像是否为包括目标标注的图像。
7.一种检测模型的训练装置,其特征在于,包括:
第一获取模块,用于获取训练集;所述训练集包括N个正样本和M个负样本,所述正样本为包括目标标注的图像,所述负样本为不包括目标标注的图像,N和M均为大于1的正整数;
第一处理模块,用于对目标样本进行数据增强处理,得到训练样本;所述目标样本为所述训练集中的所述正样本或所述负样本;
训练模块,用于将所述目标样本输入至待训练的检测模型中进行迭代训练,得到目标检测模型。
8.一种检测装置,其特征在于,包括:
获取模块,用于获取多个待检测图像;
处理模块,用于将所述多个待检测图像中的至少部分图像进行叠加,得到目标图像;
生成模块,用于将所述目标图像输入至如权利要求1-5中任一项所述的目标检测模型,生成检测结果;
其中,所述检测结果用于表征所述目标图像是否为包括目标标注的图像。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5中任一项所述的检测模型的训练方法,或者实现权利要求6所述的检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现权利要求1-5中任一项所述的检测模型的训练方法,或者实现权利要求6所述的检测方法。
CN202210634709.1A 2022-06-06 2022-06-06 检测模型的训练方法、检测方法、装置和存储介质 Pending CN115205619A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210634709.1A CN115205619A (zh) 2022-06-06 2022-06-06 检测模型的训练方法、检测方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210634709.1A CN115205619A (zh) 2022-06-06 2022-06-06 检测模型的训练方法、检测方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN115205619A true CN115205619A (zh) 2022-10-18

Family

ID=83576609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210634709.1A Pending CN115205619A (zh) 2022-06-06 2022-06-06 检测模型的训练方法、检测方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN115205619A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115797270A (zh) * 2022-11-15 2023-03-14 正泰集团研发中心(上海)有限公司 漏光检测模型的训练方法、检测方法、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115797270A (zh) * 2022-11-15 2023-03-14 正泰集团研发中心(上海)有限公司 漏光检测模型的训练方法、检测方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111931731B (zh) 判题方法、装置、电子设备及存储介质
CN114155244B (zh) 缺陷检测方法、装置、设备及存储介质
CN112052813B (zh) 染色体间易位识别方法、装置、电子设备及可读存储介质
US20220189008A1 (en) Method for detecting data defects and computing device utilizing method
CN110570390B (zh) 一种图像检测方法及装置
CN110968689A (zh) 罪名及法条预测模型的训练方法以及罪名及法条预测方法
CN112308069A (zh) 一种软件界面的点击测试方法、装置、设备及存储介质
CN112419268A (zh) 一种输电线路图像缺陷检测方法、装置、设备及介质
CN111144215A (zh) 图像处理方法、装置、电子设备及存储介质
CN112765402A (zh) 一种敏感信息识别方法、装置、设备及存储介质
CN111507483A (zh) 返修板检测装置、方法及计算机可读存储介质
CN115205619A (zh) 检测模型的训练方法、检测方法、装置和存储介质
CN113076961B (zh) 一种图像特征库更新方法、图像检测方法和装置
CN111753729B (zh) 一种假脸检测方法、装置、电子设备及存储介质
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN117115823A (zh) 一种篡改识别方法、装置、计算机设备和存储介质
CN112199569A (zh) 一种违禁网址识别方法、系统、计算机设备及存储介质
CN115018783A (zh) 一种视频水印检测方法和装置、电子设备和存储介质
CN114638304A (zh) 图像识别模型的训练方法、图像识别方法及装置
CN110715799B (zh) 断路器机械状态检测方法、装置及终端设备
CN110851349B (zh) 页面异常显示的检测方法、终端设备及存储介质
CN112929458B (zh) App应用的服务端地址确定方法、装置以及存储介质
CN113239075A (zh) 一种施工数据自检方法及系统
CN112434717A (zh) 一种模型训练方法及装置
CN109376739B (zh) 一种编组方式确定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination