CN110020664A - 一种深度学习目标检测的正负样本平衡方法 - Google Patents

一种深度学习目标检测的正负样本平衡方法 Download PDF

Info

Publication number
CN110020664A
CN110020664A CN201910099959.8A CN201910099959A CN110020664A CN 110020664 A CN110020664 A CN 110020664A CN 201910099959 A CN201910099959 A CN 201910099959A CN 110020664 A CN110020664 A CN 110020664A
Authority
CN
China
Prior art keywords
sample
positive
negative sample
deep learning
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910099959.8A
Other languages
English (en)
Inventor
计时鸣
蔡超鹏
郑启明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910099959.8A priority Critical patent/CN110020664A/zh
Publication of CN110020664A publication Critical patent/CN110020664A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种深度学习目标检测的正负样本平衡方法,包括以下步骤:S01:生成候选区域;S02:计算候选区域A与ground truth B之间的交并比,SA∩B为A和B交集的面积,SA∪B为A和B并集的面积,交并比IoU的计算公式为IoU=SA∩B/SA∪B;S03:同时降低正样本和负样本的交并比IoU筛选阈值;S04:筛选正样本和负样本,选择较大的候选框,抛弃较小的候选框;S05:将步骤S04中筛选获得的正样本和负样本送入分类器进行训练。可有效的应用于所有的深度学习目标检测模型中,使得正样本的量得到明显的提升,同时能减少正样本数量提升时产生的假正样本的量,能在一定程度上提升目标检测模型的精度。

Description

一种深度学习目标检测的正负样本平衡方法
技术领域
本发明涉及人工智能和目标检测领域,更具体的说,尤其涉及一种深度学习目标检测的正负样本平衡方法。
背景技术
近年来随着人工智能领域硬件和软件的不断提升,深度学习技术得到了飞速发展。深度学习技术可以运用在各个领域,比如计算机视觉、自然语言处理、音频分析等,深度学习目标检测技术属于深度学习在计算机视觉领域的一个应用。深度学习目标检测的关键在于样本的平衡,包括正负样本和难易分样本等,通常在一幅图像里检测目标属于正样本,背景类属于负样本,正负样本的判定依据为IoU(交并比),候选框和ground truth(事先标注的样本集中的目标框),交并比大于一个阈值为正样本,小于一个阈值为负样本。在对小目标的检测上,负样本的数量往往比正样本多得多,样本的失衡将会影响训练出来的分类器性能,降低目标检测的精度。
本发明的目标在于设计一种正负样本平衡算法,可有效的应用于所有的深度学习目标检测模型中,使得正样本的量得到明显的提升,同时能减少正样本数量提升时产生的假正样本的量,能在一定程度上提升目标检测模型的精度。
发明内容
本发明的目的在于解决现有深度学习目标检测模型正负样本不平衡问题、正样本数量提升产生的假正样本数量过多的问题,提出了一种深度学习目标检测的正负样本平衡方法,可有效的应用于所有的深度学习目标检测模型中,使得正样本的量得到明显的提升,同时能减少正样本数量提升时产生的假正样本的量,能在一定程度上提升目标检测模型的精度。
本发明通过以下技术方案来实现上述目的:一种深度学习目标检测的正负样本平衡方法,包括以下步骤:
S01:生成多个候选区域;
S02:对每个候选区域计算和实际标注框的交并比,假设计算候选区域A与实际标注框B之间的交并比,SA∩B为候选区域A和实际标注框B交集的面积,SA∪B为候选区域A和实际标注框B并集的面积,交并比IoU的计算公式为IoU=SA∩B/SA∪B
S03:同时降低正样本和负样本的交并比IoU筛选阈值,通常正样本和负样本的筛选依据和实际标注框之间的交并比的大小来筛选,若交并比大于某一阈值就说明和实际标注框重合度越高,正样本的可能性越大;若交并比小于某一阈值就说明和实际标注框重合度越低,负样本的可能性越大;阈值为0~1之间,将正负样本的筛选阈值都下降能有效的提升正样本的数量。
S04:筛选正样本和负样本,此时由于正样本的交并比IoU阈值下降出现了大量的假正样本,由于在交并比相同的情况下,较小候选框为假正样本的可能性更大,因此选择较大的候选框,抛弃较小的候选框;
S05:将步骤S04中筛选获得的正样本和负样本送入深度学习分类器进行训练。
进一步的,分类器包括任何深度学习的分类模型。分类器用于对类别进行分类,比如在项目里需要宇测项目缺陷类别,直接通过分类器识别出来类别。
本发明的有益效果在于:本发明设计了一种深度学习目标检测的正负样本平衡算法,能提升深度学习目标检测模型提取的正样本的量,同时在一定程度上能抑制假正样本,提升目标检测模型的识别精度。
附图说明
图1是本发明一种深度学习目标检测的正负样本平衡方法的流程示意图。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,一种深度学习目标检测的正负样本平衡方法,以RPN即区域建议网络为例,RPN产生的正负样本提供给分类器网络训练,包括以下步骤:
S01:由RPN候选区域建议网络生成多个候选区域;
S02:对每个候选区域计算和实际标注框的交并比,假设计算候选区域A与实际标注框B之间的交并比,SA∩B为候选区域A和实际标注框B交集的面积,SA∪B为候选区域A和实际标注框B并集的面积,交并比IoU的计算公式为IoU=SA∩B/SA∪B
S03:同时降低正样本和负样本的交并比IoU筛选阈值,通常正样本和负样本的筛选依据和实际标注框之间的交并比的大小来筛选,若交并比大于某一阈值就说明和实际标注框重合度越高,正样本的可能性越大;若交并比小于某一阈值就说明和实际标注框重合度越低,负样本的可能性越大;阈值为0~1之间,将正负样本的筛选阈值都下降能有效的提升正样本的数量。
S04:筛选正样本和负样本,此时由于正样本的交并比IoU阈值下降出现了大量的假正样本,由于在交并比相同的情况下,较小候选框为假正样本的可能性更大,因此选择较大的候选框,抛弃较小的候选框;
S05:将步骤S04中筛选获得的正样本和负样本送入深度学习分类器进行训练。
候选区域由two-stage模型中的RPN模块生成或由one-stage模型直接生成。
分类器包括任何深度学习的分类模型。分类器用于对类别进行分类,比如在项目里需要宇测项目缺陷类别,直接通过分类器识别出来类别。
上述实施例只是本发明的较佳实施例,并不是对本发明技术方案的限制,只要是不经过创造性劳动即可在上述实施例的基础上实现的技术方案,均应视为落入本发明专利的权利保护范围内。

Claims (3)

1.一种深度学习目标检测的正负样本平衡方法,其特征在于:包括以下步骤:
S01:生成多个候选区域;
S02:对每个候选区域计算和实际标注框的交并比,假设计算候选区域A与实际标注框B之间的交并比,SA∩B为候选区域A和实际标注框B交集的面积,SA∪B为候选区域A和实际标注框B并集的面积,交并比IoU的计算公式为IoU=SA∩B/SA∪B
S03:同时降低正样本和负样本的交并比IoU筛选阈值,通常正样本和负样本的筛选依据和实际标注框之间的交并比的大小来筛选,若交并比大于某一阈值就说明和实际标注框重合度越高,正样本的可能性越大;若交并比小于某一阈值就说明和实际标注框重合度越低,负样本的可能性越大;阈值为0~1之间,将正负样本的筛选阈值都下降能有效的提升正样本的数量。
S04:筛选正样本和负样本,此时由于正样本的交并比IoU阈值下降出现了大量的假正样本,由于在交并比相同的情况下,较小候选框为假正样本的可能性更大,因此选择较大的候选框,抛弃较小的候选框;
S05:将步骤S04中筛选获得的正样本和负样本送入深度学习分类器进行训练。
2.根据权利要求1所述的一种深度学习目标检测的正负样本平衡方法,其特征在于:候选区域由two-stage模型中的RPN候选区域建议网络模块生成或由one-stage端对端模型直接生成。
3.根据权利要求1所述的一种深度学习目标检测的正负样本平衡方法,其特征在于:分类器包括任何深度学习的分类模型。
CN201910099959.8A 2019-01-31 2019-01-31 一种深度学习目标检测的正负样本平衡方法 Pending CN110020664A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910099959.8A CN110020664A (zh) 2019-01-31 2019-01-31 一种深度学习目标检测的正负样本平衡方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910099959.8A CN110020664A (zh) 2019-01-31 2019-01-31 一种深度学习目标检测的正负样本平衡方法

Publications (1)

Publication Number Publication Date
CN110020664A true CN110020664A (zh) 2019-07-16

Family

ID=67188979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910099959.8A Pending CN110020664A (zh) 2019-01-31 2019-01-31 一种深度学习目标检测的正负样本平衡方法

Country Status (1)

Country Link
CN (1) CN110020664A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443212A (zh) * 2019-08-12 2019-11-12 睿魔智能科技(深圳)有限公司 用于目标检测的正样本获取方法、装置、设备及存储介质
CN111310660A (zh) * 2020-02-14 2020-06-19 开易(北京)科技有限公司 用于adas场景的目标检测虚警抑制方法及装置
CN111598175A (zh) * 2020-05-19 2020-08-28 南京甄视智能科技有限公司 一种基于在线难例挖掘方式的检测器训练优化方法
CN112906789A (zh) * 2021-02-19 2021-06-04 阳光保险集团股份有限公司 区域生成网络负例选择方法、装置和计算机设备
CN113221970A (zh) * 2021-04-25 2021-08-06 武汉工程大学 基于深度卷积神经网络的提升式多标签语义分割方法
CN114092698A (zh) * 2021-11-09 2022-02-25 北京百度网讯科技有限公司 目标信息处理方法、装置、设备和存储介质
CN114219936A (zh) * 2021-10-28 2022-03-22 中国科学院自动化研究所 目标检测方法、电子设备、存储介质和计算机程序产品
CN114612799A (zh) * 2022-03-11 2022-06-10 应急管理部国家自然灾害防治研究院 基于滑坡/非滑坡面积比的空间自适应正负样本生成方法及系统
CN115690524A (zh) * 2023-01-05 2023-02-03 中国科学院空天信息创新研究院 语义信息指导的点云目标检测正样本筛选方法
CN116758429A (zh) * 2023-08-22 2023-09-15 浙江华是科技股份有限公司 一种基于正负样本候选框动态选择船舶检测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355188A (zh) * 2015-07-13 2017-01-25 阿里巴巴集团控股有限公司 图像检测方法及装置
CN106778737A (zh) * 2016-11-24 2017-05-31 北京文安智能技术股份有限公司 一种车牌矫正方法、装置和一种视频采集装置
CN108537775A (zh) * 2018-03-02 2018-09-14 浙江工业大学 一种基于深度学习检测的癌细胞跟踪方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355188A (zh) * 2015-07-13 2017-01-25 阿里巴巴集团控股有限公司 图像检测方法及装置
CN106778737A (zh) * 2016-11-24 2017-05-31 北京文安智能技术股份有限公司 一种车牌矫正方法、装置和一种视频采集装置
CN108537775A (zh) * 2018-03-02 2018-09-14 浙江工业大学 一种基于深度学习检测的癌细胞跟踪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHIFENG ZHANG,ET AL.: "S3FD:Single Shot Scale-invariant Face Detector", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 *
ZHAOWEI CAI,ET AL.: "Cascade R-CNN: Delving into High Quality Object Detection", 《ARXIV》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443212B (zh) * 2019-08-12 2022-03-11 睿魔智能科技(深圳)有限公司 用于目标检测的正样本获取方法、装置、设备及存储介质
CN110443212A (zh) * 2019-08-12 2019-11-12 睿魔智能科技(深圳)有限公司 用于目标检测的正样本获取方法、装置、设备及存储介质
CN111310660A (zh) * 2020-02-14 2020-06-19 开易(北京)科技有限公司 用于adas场景的目标检测虚警抑制方法及装置
CN111310660B (zh) * 2020-02-14 2024-05-17 开易(北京)科技有限公司 用于adas场景的目标检测虚警抑制方法及装置
CN111598175B (zh) * 2020-05-19 2022-09-02 南京甄视智能科技有限公司 一种基于在线难例挖掘方式的检测器训练优化方法
CN111598175A (zh) * 2020-05-19 2020-08-28 南京甄视智能科技有限公司 一种基于在线难例挖掘方式的检测器训练优化方法
CN112906789A (zh) * 2021-02-19 2021-06-04 阳光保险集团股份有限公司 区域生成网络负例选择方法、装置和计算机设备
CN113221970A (zh) * 2021-04-25 2021-08-06 武汉工程大学 基于深度卷积神经网络的提升式多标签语义分割方法
CN114219936A (zh) * 2021-10-28 2022-03-22 中国科学院自动化研究所 目标检测方法、电子设备、存储介质和计算机程序产品
CN114092698A (zh) * 2021-11-09 2022-02-25 北京百度网讯科技有限公司 目标信息处理方法、装置、设备和存储介质
CN114612799A (zh) * 2022-03-11 2022-06-10 应急管理部国家自然灾害防治研究院 基于滑坡/非滑坡面积比的空间自适应正负样本生成方法及系统
CN114612799B (zh) * 2022-03-11 2022-09-16 应急管理部国家自然灾害防治研究院 基于滑坡/非滑坡面积比的空间自适应正负样本生成方法及系统
CN115690524A (zh) * 2023-01-05 2023-02-03 中国科学院空天信息创新研究院 语义信息指导的点云目标检测正样本筛选方法
CN116758429A (zh) * 2023-08-22 2023-09-15 浙江华是科技股份有限公司 一种基于正负样本候选框动态选择船舶检测方法及系统
CN116758429B (zh) * 2023-08-22 2023-11-07 浙江华是科技股份有限公司 一种基于正负样本候选框动态选择船舶检测方法及系统

Similar Documents

Publication Publication Date Title
CN110020664A (zh) 一种深度学习目标检测的正负样本平衡方法
CN105740712B (zh) 基于贝叶斯网络的Android恶意行为检测方法
CN106529293B (zh) 一种用于恶意软件检测的样本类别判定方法
CN112734775B (zh) 图像标注、图像语义分割、模型训练方法及装置
JP7266674B2 (ja) 画像分類モデルの訓練方法、画像処理方法及び装置
CN111275688A (zh) 基于注意力机制的上下文特征融合筛选的小目标检测方法
CN110222686B (zh) 物体检测方法、装置、计算机设备和存储介质
US11335110B2 (en) Systems and methods for processing a table of information in a document
CN108205685A (zh) 视频分类方法、视频分类装置及电子设备
CN110599463B (zh) 一种基于轻量级联神经网络的舌像检测及定位算法
CN109684446A (zh) 文本语义相似度计算方法及装置
Li et al. Upper body motion recognition based on key frame and random forest regression
Ivanov et al. Adaptive moving object segmentation algorithms in cluttered environments
CN107145778A (zh) 一种入侵检测方法及装置
US20160085857A1 (en) Grouping data using dynamic thresholds
CN108460277A (zh) 一种自动化恶意代码变种检测方法
JP7341962B2 (ja) 学習データ収集装置、学習装置、学習データ収集方法およびプログラム
CN108460320A (zh) 基于改进单元分析的监控视频异常事件检测方法
CN105868269A (zh) 基于区域卷积神经网络的精确图像检索方法
CN114581702A (zh) 图像分类方法、装置、计算机设备及计算机可读存储介质
CN112206541A (zh) 游戏外挂识别方法、装置、存储介质及计算机设备
KR20110067373A (ko) 영상 인식 장치 및 방법
CN107092679A (zh) 一种特征词向量获得方法、文本分类方法及装置
CN110197375A (zh) 一种相似用户识别方法、装置、相似用户识别设备和介质
CN113887431A (zh) 基于ai的厨房场景下人员不带手套识别的检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190716