CN107563387A - 一种基于循环神经网络的图像目标检测选框方法 - Google Patents

一种基于循环神经网络的图像目标检测选框方法 Download PDF

Info

Publication number
CN107563387A
CN107563387A CN201710828393.9A CN201710828393A CN107563387A CN 107563387 A CN107563387 A CN 107563387A CN 201710828393 A CN201710828393 A CN 201710828393A CN 107563387 A CN107563387 A CN 107563387A
Authority
CN
China
Prior art keywords
characteristic vector
candidate frame
frame
sequence
confidence level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710828393.9A
Other languages
English (en)
Inventor
马良庄
蔡毅
朱奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Hand Sight Information Technology Co Ltd
Original Assignee
Chengdu Hand Sight Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Hand Sight Information Technology Co Ltd filed Critical Chengdu Hand Sight Information Technology Co Ltd
Priority to CN201710828393.9A priority Critical patent/CN107563387A/zh
Publication of CN107563387A publication Critical patent/CN107563387A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于循环神经网络的图像目标检测选框方法,将待测图片输入卷积神经网络,得到N个候选框和所述候选框的预测结果及特征向量;对各个候选框的特征向量和预测结果进行处理,得到一个特征向量序列;将所述特征向量序列中的特征向量依次输入RNN网络,得到所述特征向量序列中各特征向量的置信度d;根据设定的置信度阈值对所述特征向量序列中的特征向量进行筛选,得到最终的目标框,该发明能有效地从大量候选框中挑选出比非极大值抑制法输出更精确的目标框,提高了目标检测器的整体性能。

Description

一种基于循环神经网络的图像目标检测选框方法
技术领域
本发明属于目标检测领域,具体涉及一种基于循环神经网络的图像目标检测选框方法,用于在目标检测时对目标框进行筛选。
背景技术
近几年,由于大数据和GPU,FPGA等并行计算硬件的出现,使得基于数据驱动的深度学习应用成为可能。计算机视觉作为人工智能的重要应用领域,最早将深度学习结合到具体的任务当中,包括图像分类、目标检测、目标分割等。目标检测作为计算机视觉的经典问题之一,其任务目标是给定一张图片,输出图片中一个或多个目标的具体位置和形状(一般用矩形框显示)以及目标对应的类别。在目标检测算法中经常会采用一种过完备的策略来生成候选框,即生成大量可能含有目标的矩形框。面对多余的候选矩阵框,常用非极大值抑制的方式进行筛选,从而输出最终的目标框。
非极大值抑制方法具有实现简单,效果明显的优点,但其缺点也十分明显。缺点主要有如下几点:(1)该方法需要人工设定一个阈值去判定某个框是否为冗余,阈值的值由具体的应用场景所决定,极大地限制了目标检测算法的应用;(2)该方法实现时假定了所有的目标候选框都是独立的个体,忽略了框与框之间存在的逻辑联系,从而无法利用这种联系生成更好的输出结果。
非极大值抑制方法较大地限制了目标检测器的应用范围,因为它默认两个方框重叠率数值较高时证明两框中的目标是重复的,但框内特征信息也具有很强的指示作用。因此,光从选框面积的重叠程度来判定是否发生了目标冗余过于简单,而且极容易发生漏检测现象。
发明内容
本发明的目的在于:提供了一种基于循环神经网络的图像目标检测选框方法,解决了非极大值抑制方法将候选框作为独立个体进行检测,并利用面积重叠度来判断目标是否冗余,从而导致目标检测正确率低、容易发生漏检现象的技术问题。
本发明采用的技术方案如下:
一种基于循环神经网络的图像目标检测选框方法,包括以下步骤:
步骤1:将待测图片输入卷积神经网络进行特征提取,得到N个候选框的预测结果及特征向量;
步骤2:对各个候选框的特征向量和预测结果进行处理,得到一个特征向量序列;
步骤3:将所述特征向量序列中的特征向量依次输入RNN网络,得到所述特征向量序列中各特征向量的置信度d;
步骤4:根据设定的置信度阈值对所述特征向量序列中的特征向量进行筛选,得到最终的目标框。
进一步的,所述预测结果包括候选框左上角的横坐标x、左上角的纵坐标y、候选框的宽度w、候选框的高度h和候选框的置信度c。
进一步的,所述步骤2的具体步骤如下:
S201:将各个候选框的特征向量、预测结果、x2、y2、xy、w2、h2和wh按通道轴堆叠,得到各个候选框对应的新的特征向量;
S202:将N个候选框按置信度c的大小进行排序,选出置信度c大的前M个候选框;
S303:将所述M个候选框按置信度c的大小重新排序,所述候选框对应的特征向量按排列顺序形成一个特征向量序列。
进一步的,所述步骤S303中,所述M个候选框排序后置信度c形成的包络线为类高斯形状,所述类高斯形状中置信度c最大的候选框位于序列中间,其余候选框按置信度c依次向两侧递减的顺序排列。
进一步的,所述RNN网络为双向RNN网络,将所述特征向量序列中的特征向量按正序输入网络后,按反序再次输入网络。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明借助神经网络的“记忆”能力,将相邻候选框中的内容作为重要的筛选依据,同时候选框相互辅助增强了筛选能力,克服了非极大值抑制法每个候选目标框各自独立、互不关联的不足,提高了筛选的正确率。
2.将N个特征向量、N个预测结果、x2、y2、xy、w2、h2和wh按通道轴堆叠,增加了输入RNN网络的特征向量包含的信息,使所述双向RNN成为更好的分类器,提高分类的准确率。
3.由于置信度高的候选框为目标框的可能性高于置信度低的候选框,排序采用类高斯形状,将置信度高的候选框置于序列中间,保证该置信度高的候选框能接受最多周围的信息,从而更好的筛选出正确的目标框。
4.该发明能有效地从大量候选框中挑选出比非极大值抑制法输出更精确的目标框,提高了目标检测器的整体性能。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明的流程图;
图2是本发明类高斯形状图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面结合图1、图2对本发明作详细说明。
一种基于循环神经网络的图像目标检测选框方法,包括以下步骤:
步骤1:将待测图片输入卷积神经网络进行特征提取,得到N个候选框和所述候选框的预测结果及特征向量;所述预测结果包括候选框左上角的横坐标x、左上角的纵坐标y、候选框的宽度w、候选框的高度h和候选框的置信度c。
步骤2:将各个候选框的特征向量、预测结果、x2、y2、xy、w2、h2和wh按通道轴堆叠(concat),得到各个候选框对应的新的特征向量;将N个候选框按置信度c的大小进行排序,选出置信度c大的前M个候选框;将所述M个候选框按置信度c的大小重新排序,所述M个候选框排序后置信度c形成的包络线为类高斯形状,所述类高斯形状中置信度c最大的候选框位于序列中间,其余候选框按置信度c依次向两侧递减的顺序排列,所述候选框对应的特征向量按排列顺序形成一个特征向量序列。
步骤3:将所述特征向量序列中的特征向量按正序依次输入双向RNN网络(Recurrent Neural Networks),再按反序依次输入双向RNN网络,得到所述特征向量序列中各特征向量的置信度d;
步骤4:根据设定的置信度阈值对所述特征向量序列中的特征向量进行筛选,筛选出的特征向量对应的候选框为最终的目标框。
具体实施例
一种基于循环神经网络的图像目标检测选框方法,包括以下步骤:
步骤1:将一张含有一个或多个待测目标的待测图片输入卷积神经网络进行特征提取,所述卷积神经网络的目标检测器采用基于DarkNet-19的YOLO,所述卷积神经网络最后一层隐藏层输出845个候选框,并输出述候选框的预测结果和特征向量,所述特征向量的维度为1024;所述预测结果包括候选框左上角的横坐标x、左上角的纵坐标y、候选框的宽度w、候选框的高度h和候选框的置信度c。
步骤2:将各个候选框的特征向量、预测结果、x2、y2、xy、w2、h2和wh按通道轴堆叠(concat),得到各个候选框对应的新的特征向量,所述新的特征向量的维度为1024+5+6=1035;
将845个候选框按置信度c的大小进行排序,选出置信度c大的前200个候选框;将所述200个候选框按置信度c的大小重新排序,所述200个候选框排序后置信度c形成的包络线为类高斯形状,所述类高斯形状中置信度c最大的候选框位于序列中间,其余候选框按置信度c依次向两侧递减的顺序排列,所述200个候选框对应的特征向量按排列顺序形成一个特征向量序列(如图2所示)。
步骤3:将所述特征向量序列中的特征向量按正序依次输入双向RNN网络,再按反序依次输入双向RNN网络,双向RNN网络会自动将目标框的置信度c调高,而冗余候选框的置信度c调低,实现类似置信度归一化的功能,所述双向RNN网络输出所述特征向量序列中各特征向量的置信度d;
步骤4:设定的置信度阈值为0.8,置信度d小于该阈值的候选框被去除,留下的为最终的目标框。

Claims (5)

1.一种基于循环神经网络的图像目标检测选框方法,其特征在于:包括以下步骤:
步骤1:将待测图片输入卷积神经网络进行特征提取,得到N个候选框的预测结果及特征向量;
步骤2:对各个候选框的特征向量和预测结果进行处理,得到一个特征向量序列;
步骤3:将所述特征向量序列中的特征向量依次输入RNN网络,得到所述特征向量序列中各特征向量的置信度d;
步骤4:根据设定的置信度阈值对所述特征向量序列中的特征向量进行筛选,得到最终的目标框。
2.根据权利要求1所述的一种基于循环神经网络的图像目标检测选框方法,其特征在于:所述预测结果包括候选框左上角的横坐标x、左上角的纵坐标y、候选框的宽度w、候选框的高度h和候选框的置信度c。
3.根据权利要求1和2所述的一种基于循环神经网络的图像目标检测选框方法,其特征在于:所述步骤2的具体步骤如下:
S201:将各个候选框的特征向量、预测结果、x2、y2、xy、w2、h2和wh按通道轴堆叠,得到各个候选框对应的新的特征向量;
S202:将N个候选框按置信度c的大小进行排序,选出置信度c大的前M个候选框;
S303:将所述M个候选框按置信度c的大小重新排序,所述候选框对应的特征向量按排列顺序形成一个特征向量序列。
4.根据权利要求3所述的一种基于循环神经网络的图像目标检测选框方法,其特征在于:所述步骤S303中,所述M个候选框排序后置信度c形成的包络线为类高斯形状,所述类高斯形状中置信度c最大的候选框位于序列中间,其余候选框按置信度c依次向两侧递减的顺序排列。
5.根据权利要求1所述的一种基于循环神经网络的图像目标检测选框方法,其特征在于:所述RNN网络为双向RNN网络,将所述特征向量序列中的特征向量按正序输入网络后,按反序再次输入网络。
CN201710828393.9A 2017-09-14 2017-09-14 一种基于循环神经网络的图像目标检测选框方法 Pending CN107563387A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710828393.9A CN107563387A (zh) 2017-09-14 2017-09-14 一种基于循环神经网络的图像目标检测选框方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710828393.9A CN107563387A (zh) 2017-09-14 2017-09-14 一种基于循环神经网络的图像目标检测选框方法

Publications (1)

Publication Number Publication Date
CN107563387A true CN107563387A (zh) 2018-01-09

Family

ID=60981032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710828393.9A Pending CN107563387A (zh) 2017-09-14 2017-09-14 一种基于循环神经网络的图像目标检测选框方法

Country Status (1)

Country Link
CN (1) CN107563387A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229407A (zh) * 2018-01-11 2018-06-29 武汉米人科技有限公司 一种视频分析中的行为检测方法与系统
CN108259909A (zh) * 2018-02-09 2018-07-06 福州大学 基于显著性对象检测模型的图像压缩方法
CN108268869A (zh) * 2018-02-13 2018-07-10 北京旷视科技有限公司 目标检测方法、装置及系统
CN108363998A (zh) * 2018-03-21 2018-08-03 北京迈格威科技有限公司 一种对象的检测方法、装置、系统和电子设备
CN108471497A (zh) * 2018-03-02 2018-08-31 天津市亚安科技有限公司 一种基于云台摄像机的船目标实时检测方法
CN108664930A (zh) * 2018-05-11 2018-10-16 西安天和防务技术股份有限公司 一种智能的多目标检测跟踪方法
CN108765452A (zh) * 2018-05-11 2018-11-06 西安天和防务技术股份有限公司 一种复杂背景下运动目标检测与跟踪方法
CN108846379A (zh) * 2018-07-03 2018-11-20 南京览笛信息科技有限公司 面单识别方法、系统、终端设备及存储介质
CN109508630A (zh) * 2018-09-27 2019-03-22 杭州朗澈科技有限公司 一种基于人工智能识别水尺水位的方法
CN109598301A (zh) * 2018-11-30 2019-04-09 腾讯科技(深圳)有限公司 检测区域去除方法、装置、终端和存储介质
CN109788222A (zh) * 2019-02-02 2019-05-21 视联动力信息技术股份有限公司 一种视联网视频的处理方法及装置
CN109889781A (zh) * 2019-02-02 2019-06-14 视联动力信息技术股份有限公司 一种视联网视频的处理方法及装置
CN109905727A (zh) * 2019-02-02 2019-06-18 视联动力信息技术股份有限公司 一种视联网视频的处理方法及装置
WO2019233343A1 (en) * 2018-06-08 2019-12-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image processing method and electronic device
CN111339895A (zh) * 2020-02-21 2020-06-26 魔视智能科技(上海)有限公司 大类非极大值抑制方法及其系统
CN112329762A (zh) * 2019-12-12 2021-02-05 北京沃东天骏信息技术有限公司 图像处理方法、模型训练方法、装置、计算机设备和介质
CN113095183A (zh) * 2021-03-31 2021-07-09 西北工业大学 一种基于深度神经网络的微表情检测方法
CN115019146A (zh) * 2022-06-17 2022-09-06 集美大学 目标检测方法、系统及存内计算芯片

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000045317A2 (en) * 1999-01-27 2000-08-03 Richard Saunders International Method for simulation of human response to stimulus
CN106651955A (zh) * 2016-10-10 2017-05-10 北京小米移动软件有限公司 图片中目标物的定位方法及装置
CN106845377A (zh) * 2017-01-10 2017-06-13 北京小米移动软件有限公司 人脸关键点定位方法及装置
CN106960195A (zh) * 2017-03-27 2017-07-18 深圳市丰巨泰科电子有限公司 一种基于深度学习的人群计数方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000045317A2 (en) * 1999-01-27 2000-08-03 Richard Saunders International Method for simulation of human response to stimulus
CN106651955A (zh) * 2016-10-10 2017-05-10 北京小米移动软件有限公司 图片中目标物的定位方法及装置
CN106845377A (zh) * 2017-01-10 2017-06-13 北京小米移动软件有限公司 人脸关键点定位方法及装置
CN106960195A (zh) * 2017-03-27 2017-07-18 深圳市丰巨泰科电子有限公司 一种基于深度学习的人群计数方法及装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229407A (zh) * 2018-01-11 2018-06-29 武汉米人科技有限公司 一种视频分析中的行为检测方法与系统
CN108259909B (zh) * 2018-02-09 2020-09-01 福州大学 基于显著性对象检测模型的图像压缩方法
CN108259909A (zh) * 2018-02-09 2018-07-06 福州大学 基于显著性对象检测模型的图像压缩方法
CN108268869A (zh) * 2018-02-13 2018-07-10 北京旷视科技有限公司 目标检测方法、装置及系统
CN108471497A (zh) * 2018-03-02 2018-08-31 天津市亚安科技有限公司 一种基于云台摄像机的船目标实时检测方法
CN108363998A (zh) * 2018-03-21 2018-08-03 北京迈格威科技有限公司 一种对象的检测方法、装置、系统和电子设备
CN108664930A (zh) * 2018-05-11 2018-10-16 西安天和防务技术股份有限公司 一种智能的多目标检测跟踪方法
CN108765452A (zh) * 2018-05-11 2018-11-06 西安天和防务技术股份有限公司 一种复杂背景下运动目标检测与跟踪方法
WO2019233343A1 (en) * 2018-06-08 2019-12-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image processing method and electronic device
US10990825B2 (en) 2018-06-08 2021-04-27 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image processing method, electronic device and computer readable storage medium
CN108846379A (zh) * 2018-07-03 2018-11-20 南京览笛信息科技有限公司 面单识别方法、系统、终端设备及存储介质
CN109508630A (zh) * 2018-09-27 2019-03-22 杭州朗澈科技有限公司 一种基于人工智能识别水尺水位的方法
CN109598301A (zh) * 2018-11-30 2019-04-09 腾讯科技(深圳)有限公司 检测区域去除方法、装置、终端和存储介质
CN109788222A (zh) * 2019-02-02 2019-05-21 视联动力信息技术股份有限公司 一种视联网视频的处理方法及装置
CN109905727A (zh) * 2019-02-02 2019-06-18 视联动力信息技术股份有限公司 一种视联网视频的处理方法及装置
CN109889781A (zh) * 2019-02-02 2019-06-14 视联动力信息技术股份有限公司 一种视联网视频的处理方法及装置
CN112329762A (zh) * 2019-12-12 2021-02-05 北京沃东天骏信息技术有限公司 图像处理方法、模型训练方法、装置、计算机设备和介质
CN111339895A (zh) * 2020-02-21 2020-06-26 魔视智能科技(上海)有限公司 大类非极大值抑制方法及其系统
CN111339895B (zh) * 2020-02-21 2023-03-24 魔视智能科技(上海)有限公司 大类非极大值抑制方法及其系统
CN113095183A (zh) * 2021-03-31 2021-07-09 西北工业大学 一种基于深度神经网络的微表情检测方法
CN115019146A (zh) * 2022-06-17 2022-09-06 集美大学 目标检测方法、系统及存内计算芯片
CN115019146B (zh) * 2022-06-17 2024-10-15 集美大学 目标检测方法、系统及存内计算芯片

Similar Documents

Publication Publication Date Title
CN107563387A (zh) 一种基于循环神经网络的图像目标检测选框方法
CN111126472B (zh) 一种基于ssd改进的目标检测方法
CN109934200B (zh) 一种基于改进M-Net的RGB彩色遥感图像云检测方法及系统
CN109409435B (zh) 一种基于卷积神经网络的深度感知显著性检测方法
CN108898610A (zh) 一种基于mask-RCNN的物体轮廓提取方法
CN108399361A (zh) 一种基于卷积神经网络cnn和语义分割的行人检测方法
CN109816012A (zh) 一种融合上下文信息的多尺度目标检测方法
CN110991362A (zh) 一种基于注意力机制的行人检测模型
CN103824309B (zh) 一种城市建成区边界自动提取方法
CN110084131A (zh) 一种基于深度卷积网络的半监督行人检测方法
CN107123117A (zh) 一种基于深度学习的ic引脚焊点质量检测方法及装置
CN110991444B (zh) 面向复杂场景的车牌识别方法及装置
CN104408481B (zh) 基于深度小波神经网络的极化sar图像分类方法
CN103870818B (zh) 一种烟雾检测方法和装置
CN109785344A (zh) 基于特征重标定的双通路残差网络的遥感图像分割方法
CN109711295A (zh) 一种光学遥感图像近岸舰船检测方法
CN110210608A (zh) 基于注意力机制和多层次特征融合的低照度图像增强方法
CN107844795A (zh) 基于主成分分析的卷积神经网络特征提取方法
CN109101899B (zh) 一种基于卷积神经网络的人脸检测方法及系统
CN109522958A (zh) 基于跨尺度特征融合的深度卷积神经网络目标检测方法
CN109671071A (zh) 一种基于深度学习的地下管道缺陷定位及等级判定方法
CN110135446A (zh) 文本检测方法及计算机存储介质
CN111209858A (zh) 一种基于深度卷积神经网络的实时车牌检测方法
CN116524312A (zh) 一种基于注意力融合特征金字塔网络的红外小目标检测方法
CN112329861B (zh) 一种面向移动机器人多目标检测的分层特征融合方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109