CN112801934A - 一种基于图像序列上下文信息的候选框选择方法 - Google Patents
一种基于图像序列上下文信息的候选框选择方法 Download PDFInfo
- Publication number
- CN112801934A CN112801934A CN202011391596.4A CN202011391596A CN112801934A CN 112801934 A CN112801934 A CN 112801934A CN 202011391596 A CN202011391596 A CN 202011391596A CN 112801934 A CN112801934 A CN 112801934A
- Authority
- CN
- China
- Prior art keywords
- frame
- candidate
- frames
- current frame
- confidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于图像序列上下文信息的候选框选择方法,包括以下步骤:首先对于当前帧及其相邻的前后帧得到的所有候选框按类别标签进行分类,然后遍历当前帧中的每一个候选框,对当前帧的每一个候选框分别在其前一帧和后一帧中找到所有与其类别相同的候选框,计算它与这些候选框的交并比,并根据交并比的结果对其置信度进行重新评分,如果交并比大于预设阈值,则相应提高其置信度得分。反之,则降低其置信度评分。最后根据新的置信度得分来选择候选框。通过这种基于图像序列上下文信息对当前帧候选框重新打分的方法选择候选框,可以有效地降低目标检测过程中漏检和错检的发生,提高了检测的准确率。
Description
技术领域
本发明属于图像目标检测领域,特别是一种基于图像序列上下文信息的候选框选择方法。
背景技术
基于深度学习方法的图像目标检测方法通过对单张图像进行检测时会产生很多候选框,这些候选框通过网络预测得到的置信度进行筛选,大于置信度阈值的保留,小于置信度阈值的则删除,最终得到目标候选框。但是对于图像序列而言,相邻帧之间存在时空上下文关系,如果对于图像序列进行逐帧的检测,则没有用到这种丰富的上下文信息,容易造成漏检和错检。
发明内容
本发明的目的在于提供一种基于图像序列上下文信息的候选框选择方法,能够较好的利用图像序列之间的时空关系解决目标检测过程中预测候选框的选择问题。
实现本发明目的的技术解决方案为:
一种基于图像序列上下文信息的候选框选择方法,包括以下步骤:
1、对当前帧及其相邻的前一帧、后一帧检测得到的候选框分别按类别进行分类;
2、遍历当前帧中的每一个候选框,对当前帧的每一个候选框与前一帧和后一帧中同类别的候选框匹配,计算交并比;
3、根据当前帧候选框与前后帧候选框的匹配情况,对当前帧的候选框的置信度进行重打分;
4、对重新评分后的当前帧的候选框按置信度选择保留或去除,输出当前帧的所有的保留下来的候选框。
本发明与现有技术相比,其显著优点为:
1、利用了图像序列的上下文信息,基于相邻帧间的时空关系,对当前帧图像的候选框置信度进行更为合理的重新评分。
2、计算量少,不需要引入额外的信息,仅需要计算当前帧候选框与前一帧和后一帧候选框的交并比,就可以根据公式转换得到新的置信度评分。
附图说明
图1为本发明一种基于图像序列上下文信息的候选框选择方法流程图。
具体实施方式
本发明的主要过程是,在图像序列目标检测的候选框选择过程中,根据图像序列中当前帧与邻近的前后帧之间预测候选框的交并比,对当前候选框的置信度进行重新评分并对根据得分对候选框进行选择。
下面结合说明书附图对本发明作进一步说明。
如图1所示,本发明一种基于图像序列上下文信息的候选框选择方法,包括以下步骤:
步骤1、对当前帧及其相邻的前一帧、后一帧检测得到的候选框分别按类别进行分类。设图像序列每一帧检测的所有候选框的集合对应一个特征矩阵,
W=[x1,y1,x2,y2,s1,s2,…sC]因为候选框为矩形框,左上角顶点和右下角顶点对应的直角坐标分别为(x1,y1),(x2,y2),s1,s2,s3,...sC为该候选框对应的C个类别的置信度得分,大小范围[0,1]。从C个类别中选择置信度得分最高的类别作为其对应的预测类别,则每个候选框对应的形式为 [x1,y1,x2,y2,i,si],1≤i≤C,然后将这一帧的所有候选框按照预测类别进行分类,并按照类别顺序排列。
步骤2、设候选框w1对应的坐标为(a1.b1)和(a2,b2),候选框w2对应的坐标为 (a3,b3)和(a4,b4),则两个框的交并比IoU计算公式如下:
对当前帧的每一个候选框,分别根据公式计算它与前一帧及后一帧每一个同类别候选框的交并比,并记录与前一帧及后帧候选框交并比的最大值,记为μ1,μ2;
步骤3、根据当前帧候选框与前后帧候选框的匹配情况,对当前帧的所有候选框的置信度进行重打分。设当前帧候选框对应的置信度为conf1,重新评分后的置信度为conf2,计算公式如下
conf2=conf1*(1+max(0,u1)*max(0,u2))
步骤4、设置信度阈值为λ(0.4≤λ≤0.6),若当前帧候选框的置信度 conf2≥λ,则将候选框保留;反之,将候选框删除。最后输出当前帧所有保留下来的候选框集合对应的特征矩阵。
Claims (5)
1.一种基于图像序列上下文信息的候选框选择方法,其特征在于,包括以下步骤:
1、对当前帧及其相邻的前一帧、后一帧检测得到的候选框分别按类别进行分类;
2、遍历当前帧中的每一个候选框,将当前帧的每一个候选框与前一帧和后一帧中同类别的候选框匹配,计算交并比;
3、根据当前帧候选框与前后帧候选框的匹配情况,对当前帧的候选框的置信度进行重打分;
4、对重新评分后的当前帧的候选框按置信度选择保留或去除,输出当前帧的所有的保留下来的候选框。
2.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法,其特征在于,步骤1中,设图像序列每一帧检测的所有候选框的集合对应一个特征矩阵,设特征矩阵的形式为其大小为N*(C+4),N为特征图包含的候选框个数,C为检测的类别总数,特征矩阵每一行对应一个候选框,每个候选框形式为:
W=[x1,y1,x2,y2,s1,s2,…sC],候选框为矩形框,左上角顶点和右下角顶点对应的直角坐标分别为(x1,y1),(x2,y2),s1,s2,s3,…sC为该候选框对应的C个类别的置信度得分,大小范围[0,1];从C个类别中选择置信度得分最高的类别作为其对应的预测类别,则每个候选框对应的形式为[x1,y1,x2,y2,i,si],1≤i≤C,然后将这一帧的所有候选框按照预测类别进行分类,并按照类别顺序排列。
4.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法,其特征在于,步骤3中,根据当前帧候选框与前后帧候选框的匹配情况,对当前帧的候选框的置信度进行重打分:设当前帧候选框对应的置信度为conf1,重新评分后的置信度为conf2,计算公式如下
conf2=conf1*(1+max(0,u1)*max(0,u2))。
5.根据权利要求1所述的基于图像序列上下文信息的候选框选择方法,其特征在于:步骤4中,设置信度阈值为λ(0.4≤λ≤0.6),若当前帧候选框的置信度conf2≥λ,则将候选框保留;反之,将候选框删除;最后输出当前帧所有保留下来的候选框。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391596.4A CN112801934A (zh) | 2020-12-02 | 2020-12-02 | 一种基于图像序列上下文信息的候选框选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391596.4A CN112801934A (zh) | 2020-12-02 | 2020-12-02 | 一种基于图像序列上下文信息的候选框选择方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112801934A true CN112801934A (zh) | 2021-05-14 |
Family
ID=75806399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011391596.4A Withdrawn CN112801934A (zh) | 2020-12-02 | 2020-12-02 | 一种基于图像序列上下文信息的候选框选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112801934A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030272A (zh) * | 2023-03-30 | 2023-04-28 | 之江实验室 | 一种基于信息抽取的目标检测方法、系统和装置 |
-
2020
- 2020-12-02 CN CN202011391596.4A patent/CN112801934A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030272A (zh) * | 2023-03-30 | 2023-04-28 | 之江实验室 | 一种基于信息抽取的目标检测方法、系统和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3740065B2 (ja) | 領域分割された映像の領域特徴値整合に基づいた客体抽出装置およびその方法 | |
CN113239813B (zh) | 一种基于三阶级联架构的YOLOv3的远景目标检测方法 | |
CN108961235A (zh) | 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法 | |
CN111666938A (zh) | 一种基于深度学习的两地双车牌检测识别方法及系统 | |
CN111626145B (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
CN111914720B (zh) | 一种输电线路绝缘子爆裂识别方法及装置 | |
CN111274964B (zh) | 一种基于无人机视觉显著性分析水面污染物的检测方法 | |
WO2023108933A1 (zh) | 一种基于聚类算法的车辆检测方法 | |
CN113034511A (zh) | 基于高分辨率遥感影像与深度学习的乡村建筑识别算法 | |
KR102285269B1 (ko) | 빅데이터 기반 Geo AI를 활용한 이미지 분석 장치 및 방법 | |
CN112801934A (zh) | 一种基于图像序列上下文信息的候选框选择方法 | |
CN113076889B (zh) | 集装箱铅封识别方法、装置、电子设备和存储介质 | |
CN114387454A (zh) | 一种基于区域筛选模块和多层次对比的自监督预训练方法 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN113657225A (zh) | 一种目标检测方法 | |
CN112215266A (zh) | 一种基于小样本学习的x光图像违禁物品检测方法 | |
CN111539390A (zh) | 一种基于Yolov3的小目标图像识别方法、设备和系统 | |
CN111126173A (zh) | 一种高精度人脸检测方法 | |
CN111738088B (zh) | 一种基于单目摄像头的行人距离预测方法 | |
CN114639013A (zh) | 基于改进Orient RCNN模型的遥感图像飞机目标检测识别方法 | |
CN112380970A (zh) | 基于局部区域搜索的视频目标检测方法 | |
CN115410196B (zh) | 一种基于复杂背景下的小目标识别系统 | |
CN112766181B (zh) | 一种提高线图识别准确率的方法 | |
CN113378876B (zh) | 一种自适应确定目标尺寸和感受野大小的方法 | |
CN112907605B (zh) | 用于实例分割的数据增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210514 |
|
WW01 | Invention patent application withdrawn after publication |