CN112613564A - 一种剔除重叠框的目标检测后处理方法 - Google Patents
一种剔除重叠框的目标检测后处理方法 Download PDFInfo
- Publication number
- CN112613564A CN112613564A CN202011559158.4A CN202011559158A CN112613564A CN 112613564 A CN112613564 A CN 112613564A CN 202011559158 A CN202011559158 A CN 202011559158A CN 112613564 A CN112613564 A CN 112613564A
- Authority
- CN
- China
- Prior art keywords
- target detection
- frames
- bounding boxes
- boundary
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种剔除重叠框的目标检测后处理方法,属于目标检测技术领域。包括如下步骤:使用目标检测算法在测试集上执行推断;将网络预测的边界框按照不同类别进行分组;计算每一类别与其他类别所有边界框的交并比,根据交并比与置信度剔除掉重叠度高且类别不同的边界框。本发明能够通过计算不同类别的预测框之间的交并比,结合置信度可以有效剔除重叠度高且类别不同的边界框。
Description
技术领域
本发明属于目标检测技术领域,尤其是一种剔除重叠框的目标检测后处理方法。
背景技术
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
随着计算机视觉技术的快速发展,目标检测算法在越来越多的场景中得到了应用。现有的目标检测算法在执行前向推断时,大多使用非极大值抑制(NMS)剔除掉重叠度高且预测类别相同的边界框。而一些目标检测算法(如CenterNet)在执行推断时会预测出重叠度高且类别不同的边界框,目前还没有能够有效剔除重叠度高且类别不同的边界框的解决方案。
发明内容
本发明的发明目的是提供一种剔除重叠框的目标检测后处理方法,其能够通过计算不同类别的预测框之间的交并比,结合置信度可以有效剔除重叠度高且类别不同的边界框。
为达到上述目的,本发明所采用的技术方案是:
一种剔除重叠框的目标检测后处理方法,包括如下步骤:
步骤1:使用目标检测算法在测试集上执行推断;
步骤2:将网络预测的边界框按照不同类别进行分组;
步骤3:计算每一类别与其他类别所有边界框的交并比,根据交并比与置信度剔除掉重叠度高且类别不同的边界框。
进一步的,所述步骤1的推断方法包括:搭建深度学习开发环境,加载目标检测算法训练好的模型;在测试集上执行推断,输出所有边界框的置信度、类别、位置坐标。
进一步的,所述步骤2的分组方法包括:记类别总数为n,则将边界框分为A1,A2,A3...An共n组,A1内的所有边界框可以表示为:{A11,A12,A13...},A2内的所有边界框可以表示为:{A21,A22,A23...},依次类推。
进一步的,所述步骤3的剔除方法包括:对于Ai(i<=n-1),计算组内所有边界框{Ai1,Ai2,Ai3...}与其后类别(从Ai+1到Ai)所有边界框{A(i+1)1,A(i+1)2,A(i+1)3...Ai1,Ai2,Ai3...}的交并比,若某对边界框的交并比大于阈值,则比较两个边界框的置信度,剔除置信度较小的边界框,依次对Ai到Ai-1执行上述操作,最后剔除掉所有重叠度高且类别不同的边界框。
由于采用上述技术方案,本发明具有以下有益效果:
以往的目标检测后处理方法多采用非极大值抑制(NMS)剔除掉重合度高且预测类别相同的边界框,但是某些网络(例如CenterNet)在前向推断过程不需要NMS,其会预测出重合度高且类别不同的边界框,本发明能够通过计算不同类别的预测框之间的交并比,结合置信度可以有效剔除重叠度高且类别不同的边界框,提高识别效率。
附图说明
图1是本发明的流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
在本发明的描述中,需要理解的是,术语“中心”、“长度”、“宽度”、“上”、“下”、“竖直”、“水平”、“顶”、“底”、“内”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。
如图1所示,一种剔除重叠框的目标检测后处理方法,包括如下步骤:
步骤1:使用目标检测算法CenterNet(Objects as Points)在测试集上执行推断;(本实施例中的目标检测算法可以替换为其他算法);搭建深度学习开发环境,CPU为i7-9700,GPU为GTX 1060,Ubuntu16.04LT,CUDA9.0,Pytorch0.4.1。加载CenterNet网络的训练好的模型,在测试集上执行推断,输出所有边界框的置信度、类别、位置坐标。
步骤2:将网络预测的边界框按照不同类别进行分组;记类别总数为n,则将边界框分为A1,A2,A3...An共n组,A1内的所有边界框可以表示为:{A11,A12,A13...},A2内的所有边界框可以表示为:{A21,A22,A23...},依次类推。
步骤3:计算每一类别与其他类别所有边界框的交并比,根据交并比与置信度剔除掉重叠度高且类别不同的边界框。对于Ai(i<=n-1),计算组内所有边界框{Ai1,Ai2,Ai3...}与其后类别(从Ai+1到Ai)所有边界框{A(i+1)1,A(i+1)2,A(i+1)3...Ai1,Ai2,Ai3...}的交并比,若某对边界框的交并比大于阈值,则比较两个边界框的置信度,剔除置信度较小的边界框,依次对Ai到Ai-1执行上述操作,最后剔除掉所有重叠度高且类别不同的边界框。
以往的目标检测后处理方法多采用非极大值抑制(NMS)剔除掉重合度高且预测类别相同的边界框,但是某些网络(例如CenterNet)在前向推断过程不需要NMS,其会预测出重合度高且类别不同的边界框,本发明能够通过计算不同类别的预测框之间的交并比,结合置信度可以有效剔除重叠度高且类别不同的边界框,从而提高图片的识别效率。
上述说明是针对本发明较佳实施例的详细说明,但实施例并非用以限定本发明的专利申请范围,凡本发明所提示的技术精神下所完成的同等变化或修饰变更,均应属于本发明所涵盖专利范围。
Claims (4)
1.一种剔除重叠框的目标检测后处理方法,其特征在于,包括如下步骤:
步骤1:使用目标检测算法在测试集上执行推断;
步骤2:将网络预测的边界框按照不同类别进行分组;
步骤3:计算每一类别与其他类别所有边界框的交并比,根据交并比与置信度剔除掉重叠度高且类别不同的边界框。
2.一种如权利要求1的剔除重叠框的目标检测后处理方法的实现方法,其特征在于,所述步骤1的推断方法包括:搭建深度学习开发环境,加载目标检测算法训练好的模型;在测试集上执行推断,输出所有边界框的置信度、类别、位置坐标。
3.如权利要求2所述的剔除重叠框的目标检测后处理方法的实现方法,其特征在于,所述步骤2的分组方法包括:记类别总数为n,则将边界框分为A1,A2,A3...An共n组,A1内的所有边界框可以表示为:{A11,A12,A13...},A2内的所有边界框可以表示为:{A21,A22,A23...},依次类推。
4.如权利要求3所述的剔除重叠框的目标检测后处理方法的实现方法,其特征在于,所述步骤3的剔除方法包括:对于Ai(i<=n-1),计算组内所有边界框{Ai1,Ai2,Ai3...}与其后类别(从Ai+1到Ai)所有边界框{A(i+1)1,A(i+1)2,A(i+1)3...Ai1,Ai2,Ai3...}的交并比,若某对边界框的交并比大于阈值,则比较两个边界框的置信度,剔除置信度较小的边界框,依次对Ai到Ai-1执行上述操作,最后剔除掉所有重叠度高且类别不同的边界框。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011559158.4A CN112613564A (zh) | 2020-12-25 | 2020-12-25 | 一种剔除重叠框的目标检测后处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011559158.4A CN112613564A (zh) | 2020-12-25 | 2020-12-25 | 一种剔除重叠框的目标检测后处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112613564A true CN112613564A (zh) | 2021-04-06 |
Family
ID=75245029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011559158.4A Pending CN112613564A (zh) | 2020-12-25 | 2020-12-25 | 一种剔除重叠框的目标检测后处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112613564A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113643228A (zh) * | 2021-05-26 | 2021-11-12 | 四川大学 | 一种基于改进的CenterNet网络的核电站设备表面缺陷检测方法 |
CN113743261A (zh) * | 2021-08-23 | 2021-12-03 | 河南牧原智能科技有限公司 | 一种猪体外伤的检测方法、装置和可读存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846826A (zh) * | 2018-04-24 | 2018-11-20 | 深圳大学 | 物体检测方法、装置、图像处理设备及存储介质 |
CN109101859A (zh) * | 2017-06-21 | 2018-12-28 | 北京大学深圳研究生院 | 使用高斯惩罚检测图像中行人的方法 |
CN110414417A (zh) * | 2019-07-25 | 2019-11-05 | 电子科技大学 | 一种基于多层次融合多尺度预测的交通标志牌识别方法 |
CN110781819A (zh) * | 2019-10-25 | 2020-02-11 | 浪潮电子信息产业股份有限公司 | 一种图像目标检测方法、系统、电子设备及存储介质 |
CN110837870A (zh) * | 2019-11-12 | 2020-02-25 | 东南大学 | 基于主动学习的声呐图像目标识别方法 |
CN110852258A (zh) * | 2019-11-08 | 2020-02-28 | 北京字节跳动网络技术有限公司 | 物体检测方法、装置、设备及存储介质 |
GB202004114D0 (en) * | 2020-03-20 | 2020-05-06 | Imagination Tech Ltd | Apparatus and method for processing detection boxes |
CN111310759A (zh) * | 2020-02-13 | 2020-06-19 | 中科智云科技有限公司 | 双模式协作的目标检测抑制优化方法及设备 |
CN111476827A (zh) * | 2019-01-24 | 2020-07-31 | 曜科智能科技(上海)有限公司 | 目标跟踪方法、系统、电子装置及存储介质 |
CN111612002A (zh) * | 2020-06-04 | 2020-09-01 | 广州市锲致智能技术有限公司 | 一种基于神经网络的多目标物体运动追踪方法 |
CN111986125A (zh) * | 2020-07-16 | 2020-11-24 | 浙江工业大学 | 一种用于多目标任务实例分割的方法 |
-
2020
- 2020-12-25 CN CN202011559158.4A patent/CN112613564A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101859A (zh) * | 2017-06-21 | 2018-12-28 | 北京大学深圳研究生院 | 使用高斯惩罚检测图像中行人的方法 |
CN108846826A (zh) * | 2018-04-24 | 2018-11-20 | 深圳大学 | 物体检测方法、装置、图像处理设备及存储介质 |
CN111476827A (zh) * | 2019-01-24 | 2020-07-31 | 曜科智能科技(上海)有限公司 | 目标跟踪方法、系统、电子装置及存储介质 |
CN110414417A (zh) * | 2019-07-25 | 2019-11-05 | 电子科技大学 | 一种基于多层次融合多尺度预测的交通标志牌识别方法 |
CN110781819A (zh) * | 2019-10-25 | 2020-02-11 | 浪潮电子信息产业股份有限公司 | 一种图像目标检测方法、系统、电子设备及存储介质 |
CN110852258A (zh) * | 2019-11-08 | 2020-02-28 | 北京字节跳动网络技术有限公司 | 物体检测方法、装置、设备及存储介质 |
CN110837870A (zh) * | 2019-11-12 | 2020-02-25 | 东南大学 | 基于主动学习的声呐图像目标识别方法 |
CN111310759A (zh) * | 2020-02-13 | 2020-06-19 | 中科智云科技有限公司 | 双模式协作的目标检测抑制优化方法及设备 |
GB202004114D0 (en) * | 2020-03-20 | 2020-05-06 | Imagination Tech Ltd | Apparatus and method for processing detection boxes |
CN111612002A (zh) * | 2020-06-04 | 2020-09-01 | 广州市锲致智能技术有限公司 | 一种基于神经网络的多目标物体运动追踪方法 |
CN111986125A (zh) * | 2020-07-16 | 2020-11-24 | 浙江工业大学 | 一种用于多目标任务实例分割的方法 |
Non-Patent Citations (2)
Title |
---|
付永康: "光学遥感影像多尺度稠密目标检测方法研究与实现", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
码农教程: "NMS模块", Retrieved from the Internet <URL:http://www.manongjc.com/detail/7-pkfacvupsiybhit.html> * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113643228A (zh) * | 2021-05-26 | 2021-11-12 | 四川大学 | 一种基于改进的CenterNet网络的核电站设备表面缺陷检测方法 |
CN113643228B (zh) * | 2021-05-26 | 2024-01-19 | 四川大学 | 一种基于改进的CenterNet网络的核电站设备表面缺陷检测方法 |
CN113743261A (zh) * | 2021-08-23 | 2021-12-03 | 河南牧原智能科技有限公司 | 一种猪体外伤的检测方法、装置和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Inter/intra-category discriminative features for aerial image classification: A quality-aware selection model | |
CN108846826B (zh) | 物体检测方法、装置、图像处理设备及存储介质 | |
US20200005022A1 (en) | Method, terminal, and storage medium for tracking facial critical area | |
Huang et al. | Highly accurate moving object detection in variable bit rate video-based traffic monitoring systems | |
CN110008806B (zh) | 信息处理装置、学习处理方法、学习装置及物体识别装置 | |
CN110796051B (zh) | 基于货柜场景下的实时存取行为检测方法和系统 | |
CN109543760B (zh) | 基于图像滤镜算法的对抗样本检测方法 | |
US8538079B2 (en) | Apparatus capable of detecting location of object contained in image data and detection method thereof | |
CN110390308B (zh) | 一种基于时空对抗生成网络的视频行为识别方法 | |
CN112613564A (zh) | 一种剔除重叠框的目标检测后处理方法 | |
KR20180109658A (ko) | 영상 처리 방법과 장치 | |
Luo et al. | Traffic analytics with low-frame-rate videos | |
CN113221768A (zh) | 识别模型训练方法、识别方法、装置、设备及存储介质 | |
CN112200056A (zh) | 人脸活体检测方法、装置、电子设备及存储介质 | |
CN115861210A (zh) | 一种基于孪生网络的变电站设备异常检测方法和系统 | |
CN112149664A (zh) | 一种优化分类与定位任务的目标检测方法 | |
CN115272917A (zh) | 一种基于输电线路的导线舞动预警方法、装置、设备及介质 | |
CN112907972B (zh) | 基于无人机的道路车流量检测方法、系统及计算机可读存储介质 | |
CN114170686A (zh) | 一种基于人体关键点的屈肘行为检测方法 | |
CN103489201A (zh) | 基于运动模糊信息的目标跟踪方法 | |
CN111027482B (zh) | 基于运动向量分段分析的行为分析方法及装置 | |
CN110717441B (zh) | 视频目标检测方法、装置、设备及介质 | |
CN116363535A (zh) | 基于卷积神经网络的无人机航拍影像中的船舶检测方法 | |
CN115346169B (zh) | 一种睡岗行为检测方法及系统 | |
CN113762027B (zh) | 一种异常行为的识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |