CN111523530A - 一种目标检测中分数图的映射方法及目标检测方法 - Google Patents
一种目标检测中分数图的映射方法及目标检测方法 Download PDFInfo
- Publication number
- CN111523530A CN111523530A CN202010283026.7A CN202010283026A CN111523530A CN 111523530 A CN111523530 A CN 111523530A CN 202010283026 A CN202010283026 A CN 202010283026A CN 111523530 A CN111523530 A CN 111523530A
- Authority
- CN
- China
- Prior art keywords
- score
- size
- score map
- map
- receptive field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013507 mapping Methods 0.000 title claims abstract description 31
- 238000011176 pooling Methods 0.000 claims description 9
- 238000013135 deep learning Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Abstract
本发明公开了一种目标检测中分数图的映射方法及目标检测方法,根据具体的目标检测模型架构来计算分数图在原始图片中的感受野尺寸,循环标记目标的分数图中每个点的分数标签值,即目标区域在该点对应的感受野的占比,分数图标记完成,即完成了输入原始图片与该分数图的映射关系的建立。该方法考虑了感受野与目标检测之间的关系,采用感受野中目标的占比直接作为分数标签值,即使用感受野与目标的交集与感受野的比值作为分数标签值去标记,更为细化和合理的构建了图片和分数图的映射关系。
Description
技术领域
本发明涉及图像识别研究领域,尤其是目标检测领域和深度学习领域,具体涉及一种目标检测中分数图的映射方法及目标检测方法。
背景技术
目前主流的目标检测算法是深度学习方法,近年来基于深度学习的一阶段目标检测方法已在实际场景中得到应用:行人检测,人脸检测和无人机检测等。目标检测算法作为许多人工智能算法的基础部分,为后续的生物特征识别,人脸匹配和大数据分析等算法提供支持,其在安防安检中的应用有利于公共安全,在人脸支付,业务快捷办理等场景中的应用也方便了人们的生活。在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有的基于深度学习的目标检测方法,输入图片和分数图的映射关系粗糙且复杂,缺少可解释性,给检测模型的训练带来干扰,较多的模型参数也影响了检测速度,因此更为细化和可解释的映射关系的构建能够促进目标检测算法的发展,具有重要的实际应用意义和学术价值。
发明内容
为了克服现有技术的不足,本公开实施例提供了一种目标检测中分数图的映射方法及目标检测方法,该方法考虑了感受野与目标检测之间的关系,不使用anchor与目标的交并比或者感受野与目标的交并比作为阈值来粗糙的分类,而是采用感受野中目标的占比直接作为分数标签值,即使用感受野与目标的交集与感受野的比值作为分数标签值去标记,更为细化和合理的构建了图片和分数图的映射关系。
第一方面,提供了一种一种目标检测中分数图的映射方法,技术方案如下:
根据具体的目标检测模型架构来计算分数图在原始图片中的感受野尺寸,一种类别的目标对应一个分数图;
循环标记目标的分数图中每个点的分数标签值,即目标区域在该点对应的感受野的占比;
分数标签值的计算公式如下:Score(i,j)=(A∩RF(i,j))/RF(i,j),其中i,j表示分数图上某点的横坐标和纵坐标,起点的坐标为i=1,j=1,Score(i,j)表示该点的分数,RF(i,j)代表该点在原图上对应的感受野区域,A代表原图中的目标区域;
查看该分数图是否标记完成,如果没有完成,继续分数标签值的标记,如果完成,则分数图标记完成,即完成了输入原始图片与该分数图的映射关系的建立。
优选的,在基于深度学习目标检测模型中,分数图的尺寸为原始输入图片尺寸缩小n倍,感受野尺寸为n×n,n为整数。
进一步的,感受野尺寸可以通过网络架构中的卷积层和池化层得到,感受野尺寸为:
其中lk-1为第k-1层对应的感受野尺寸,si为第i层的步长,fk为第k层的卷积核大小,或者是池化层的池化尺寸大小。
优选的,若目标存在多个类别,则对多个类别的目标分别进行分数图的标记,得到多个分数图;
优选的,在检测模型中,若存在不同深度的网络层都需要做预测和输出,则对不同深度的网络层计算感受野尺寸,再分别标记该网络层上的分数图,计算其分数标签值,各分数图标记完成后,即完成了输入原始图片与所有的分数图的映射关系的建立。
第二方面,提供了一种目标检测方法,该方法在检测过程中采用了上述所有可能的实现方法中任一项所述的一种目标检测中分数图的映射方法。
与现有技术相比,上述技术方案中的一个技术方案具有如下有益效果:通过考虑了感受野与目标检测之间的关系,采用感受野中目标的占比直接作为分数标签值,即使用感受野与目标的交集与感受野的比值作为分数标签值去标记,这样更为细化和合理的构建了图片和分数图的映射关系,既考虑了目标领域的空间关联性,又增强了映射关系的可解释性,同时在检测时计算量小,速度快,在训练时利于检测模型的拟合。
附图说明
图1为本公开实施例提供的一种目标检测中分数图的映射方法的流程图。
图2为本公开实施例提供的一种目标检测中分数图的映射方法的映射关系示意图。
具体实施方式
为了阐明本发明的技术方案和工作原理,下面将结合附图对本公开实施方式做进一步的详细描述。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本公开实施例提供了一种目标检测中分数图的映射方法:
附图1为本公开实施例提供的一种目标检测中分数图的映射方法的流程图,图2为本公开实施例提供的一种目标检测中分数图的映射方法的映射关系示意图,结合这2个附图,主要包括以下步骤:
根据具体的目标检测模型架构来计算分数图在原始图片中的感受野尺寸,一种类别的目标对应一个分数图;
优选的,在基于深度学习目标检测模型中,分数图的尺寸为原始输入图片尺寸缩小n倍,感受野尺寸为n×n,n为整数。
进一步的,感受野尺寸可以通过网络架构中的卷积层和池化层得到,感受野尺寸为:
其中lk-1为第k-1层对应的感受野尺寸,si为第i层的步长,fk为第k层的卷积核大小,或者是池化层的池化尺寸大小。
循环标记目标的分数图中每个点的分数标签值,即目标区域在该点对应的感受野的占比;
分数标签值的计算公式如下:Score(i,j)=(A∩RF(i,j))/RF(i,j),其中i,j表示分数图上某点的横坐标和纵坐标,起点的坐标为i=1,j=1,Score(i,j)表示该点的分数,RF(i,j)代表该点在原图上对应的感受野区域,A代表原图中的目标区域;
查看该分数图是否标记完成,如果没有完成,继续分数标签值的标记,如果完成,则分数图标记完成,即完成了输入原始图片与该分数图的映射关系的建立。
优选的,在基于深度学习的检测模型中,可能需要检测多个类别的目标,需要对每一个类别的分数图分别进行分数标签值标记,得到多个分数图;
进一步的,在检测模型中,若存在不同深度的网络层都需要做预测和输出,则对不同深度的网络层计算感受野尺寸,再分别标记该网络层上的分数图,计算其分数标签值,各分数图标记完成后,即完成了输入原始图片与所有的分数图的映射关系的建立。
结合其他的类似检测框回归的策略,就可以进行检测模型的训练等后续工作。
本公开实施例还提供了一种目标检测方法,该方法在检测过程中采用了上述所有可能的实现方法中任一项所述的一种目标检测中分数图的映射方法。
需要说明的是,上述实施例提供的一种目标检测方法与一种目标检测中分数图的映射方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
以上结合附图对本发明进行了示例性描述,显然,本发明具体实现并不受上述方式的限制,凡是采用了本发明的方法构思和技术方案进行的各种非实质性的改进;或者未经改进、等同替换,将本发明的上述构思和技术方案直接应用于其他场合的,均在本发明的保护范围之内。
Claims (6)
1.一种目标检测中分数图的映射方法,其特征在于,包括如下步骤:
根据具体的目标检测模型架构来计算分数图在原始图片中的感受野尺寸,一种类别的目标对应一个分数图;
循环标记目标的分数图中每个点的分数标签值,即目标区域在该点对应的感受野的占比;
分数标签值的计算公式如下:Score(i,j)=(A∩RF(i,j))/RF(i,j),其中i,j表示分数图上某点的横坐标和纵坐标,起点的坐标为i=1,j=1,Score(i,j)表示该点的分数,RF(i,j)代表该点在原图上对应的感受野区域,A代表原图中的目标区域;
查看该分数图是否标记完成,如果没有完成,继续分数标签值的标记,如果完成,则分数图标记完成,即完成了输入原始图片与该分数图的映射关系的建立。
2.根据权利要求1所述的一种目标检测中分数图的映射方法,其特征在于,在基于深度学习目标检测模型中,分数图的尺寸为原始输入图片尺寸缩小n倍,感受野尺寸为n×n,n为整数。
4.根据权利要求1-3任一项所述的一种目标检测中分数图的映射方法,其特征在于,若目标存在多个类别,则对多个类别的目标分别进行分数图的标记,得到多个分数图。
5.根据权利要求4所述的一种目标检测中分数图的映射方法,其特征在于,在检测模型中,若存在不同深度的网络层都需要做预测和输出,则对不同深度的网络层计算感受野尺寸,再分别标记该网络层上的分数图,计算其分数标签值,各分数图标记完成后,即完成了输入原始图片与所有的分数图的映射关系的建立。
6.一种目标检测方法,其特征在于,该方法在检测过程中采用了权利要求1-5任一项所述的一种目标检测中分数图的映射方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010283026.7A CN111523530B (zh) | 2020-04-13 | 2020-04-13 | 一种目标检测中分数图的映射方法及目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010283026.7A CN111523530B (zh) | 2020-04-13 | 2020-04-13 | 一种目标检测中分数图的映射方法及目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111523530A true CN111523530A (zh) | 2020-08-11 |
CN111523530B CN111523530B (zh) | 2021-04-02 |
Family
ID=71902869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010283026.7A Active CN111523530B (zh) | 2020-04-13 | 2020-04-13 | 一种目标检测中分数图的映射方法及目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111523530B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160133054A1 (en) * | 2014-11-12 | 2016-05-12 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, information processing system, and storage medium |
CN107657233A (zh) * | 2017-09-28 | 2018-02-02 | 东华大学 | 基于改进型单次多目标检测器的静态手语实时识别方法 |
CN109614985A (zh) * | 2018-11-06 | 2019-04-12 | 华南理工大学 | 一种基于密集连接特征金字塔网络的目标检测方法 |
CN109829893A (zh) * | 2019-01-03 | 2019-05-31 | 武汉精测电子集团股份有限公司 | 一种基于注意力机制的缺陷目标检测方法 |
CN109886128A (zh) * | 2019-01-24 | 2019-06-14 | 南京航空航天大学 | 一种低分辨率下的人脸检测方法 |
CN110070142A (zh) * | 2019-04-29 | 2019-07-30 | 上海大学 | 一种基于yolo神经网络的海上船只目标检测方法 |
CN110211097A (zh) * | 2019-05-14 | 2019-09-06 | 河海大学 | 一种基于Faster R-CNN参数迁移的裂缝图像检测方法 |
US20200065976A1 (en) * | 2018-08-23 | 2020-02-27 | Seoul National University R&Db Foundation | Method and system for real-time target tracking based on deep learning |
CN110889332A (zh) * | 2019-10-30 | 2020-03-17 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 一种基于面试中微表情的说谎检测方法 |
-
2020
- 2020-04-13 CN CN202010283026.7A patent/CN111523530B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160133054A1 (en) * | 2014-11-12 | 2016-05-12 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, information processing system, and storage medium |
CN107657233A (zh) * | 2017-09-28 | 2018-02-02 | 东华大学 | 基于改进型单次多目标检测器的静态手语实时识别方法 |
US20200065976A1 (en) * | 2018-08-23 | 2020-02-27 | Seoul National University R&Db Foundation | Method and system for real-time target tracking based on deep learning |
CN109614985A (zh) * | 2018-11-06 | 2019-04-12 | 华南理工大学 | 一种基于密集连接特征金字塔网络的目标检测方法 |
CN109829893A (zh) * | 2019-01-03 | 2019-05-31 | 武汉精测电子集团股份有限公司 | 一种基于注意力机制的缺陷目标检测方法 |
CN109886128A (zh) * | 2019-01-24 | 2019-06-14 | 南京航空航天大学 | 一种低分辨率下的人脸检测方法 |
CN110070142A (zh) * | 2019-04-29 | 2019-07-30 | 上海大学 | 一种基于yolo神经网络的海上船只目标检测方法 |
CN110211097A (zh) * | 2019-05-14 | 2019-09-06 | 河海大学 | 一种基于Faster R-CNN参数迁移的裂缝图像检测方法 |
CN110889332A (zh) * | 2019-10-30 | 2020-03-17 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 一种基于面试中微表情的说谎检测方法 |
Non-Patent Citations (5)
Title |
---|
AKIHIRO MATSUMOTO 等: "Global Jitter Motion of the Retinal Image Dynamically Alters the Receptive Field Properties of Retinal Ganglion Cells", 《FRONTIERS IN NEUROSCIENCE》 * |
XUANANG XU 等: "Automatic bladder segmentation from CT images using deep CNN and 3D fully connected CRF-RNN", 《INTERNATIONAL JOURNAL OF COMPUTER ASSISTED RADIOLOGY AND SURGERY》 * |
唐聪 等: "基于深度学习的多视窗SSD目标检测方法", 《红外与激光工程》 * |
张慧 等: "深度学习在目标视觉检测中的应用进展与展望", 《自动化学报》 * |
秦品乐 等: "基于自适应感受野机制的颈部淋巴结自动识别算法", 《计算机应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111523530B (zh) | 2021-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11878433B2 (en) | Method for detecting grasping position of robot in grasping object | |
CN108647585B (zh) | 一种基于多尺度循环注意力网络的交通标识符检测方法 | |
CN107563372B (zh) | 一种基于深度学习ssd框架的车牌定位方法 | |
CN110163069B (zh) | 用于辅助驾驶的车道线检测方法 | |
CN107506765B (zh) | 一种基于神经网络的车牌倾斜校正的方法 | |
Ye et al. | A two-stage real-time YOLOv2-based road marking detector with lightweight spatial transformation-invariant classification | |
CN109376580B (zh) | 一种基于深度学习的电力塔架部件识别方法 | |
CN106934355A (zh) | 基于深度卷积神经网络的车内手检测方法 | |
CN107545263A (zh) | 一种物体检测方法及装置 | |
CN107808157A (zh) | 一种雷管编码定位及识别的方法及装置 | |
CN112766170B (zh) | 基于簇类无人机图像的自适应分割检测方法及装置 | |
CN111626120A (zh) | 工业环境下基于改进的yolo-6d算法的目标检测方法 | |
Hussain et al. | A simple and efficient deep learning-based framework for automatic fruit recognition | |
CN111339967B (zh) | 一种基于多视域图卷积网络的行人检测方法 | |
CN115527072A (zh) | 一种基于稀疏空间感知与元学习的芯片表面缺陷检测方法 | |
Zhang et al. | Traffic Sign Detection and Recognition Based onDeep Learning. | |
Liu et al. | Real-time traffic light recognition based on smartphone platforms | |
CN109543700B (zh) | 一种抗遮挡的服饰关键点检测方法 | |
CN111523530B (zh) | 一种目标检测中分数图的映射方法及目标检测方法 | |
CN116824330A (zh) | 一种基于深度学习的小样本跨域目标检测方法 | |
Joshi et al. | Automatic rooftop detection using a two-stage classification | |
CN113223037B (zh) | 一种面向大规模数据的无监督语义分割方法及系统 | |
CN115937492A (zh) | 一种基于特征识别的变电设备红外图像识别方法 | |
Nguyen et al. | Robust vehicle detection under adverse weather conditions using auto-encoder feature | |
CN114332814A (zh) | 一种停车框识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230506 Address after: Room 603, 6th Floor, No. 129-3 Guanghua Road, Qinhuai District, Nanjing City, Jiangsu Province, 210014 Patentee after: Nanjing inspector Intelligent Technology Co.,Ltd. Address before: 210014 1st floor, building a, building 4, Nanjing Baixia high tech Industrial Park, No.6 Yongzhi Road, Qinhuai District, Nanjing City, Jiangsu Province Patentee before: NANJING XINGZHEYI INTELLIGENT TRANSPORTATION TECHNOLOGY CO.,LTD. |