CN109035292B - 基于深度学习的运动目标检测方法及装置 - Google Patents
基于深度学习的运动目标检测方法及装置 Download PDFInfo
- Publication number
- CN109035292B CN109035292B CN201811010626.5A CN201811010626A CN109035292B CN 109035292 B CN109035292 B CN 109035292B CN 201811010626 A CN201811010626 A CN 201811010626A CN 109035292 B CN109035292 B CN 109035292B
- Authority
- CN
- China
- Prior art keywords
- image
- target detection
- sub
- ith
- height
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 165
- 238000013135 deep learning Methods 0.000 title claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000013507 mapping Methods 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000013529 biological neural network Methods 0.000 claims description 2
- 230000000306 recurrent effect Effects 0.000 claims description 2
- 238000012549 training Methods 0.000 claims description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了基于深度学习的运动目标检测方法,该方法包括:输入或者采集视频图像;对视频图像进行运动目标检测,获取前景区域;对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。与现有技术相比,本发明能快速地进行运动目标检测,且检测准确率高。
Description
技术领域
本发明涉及图像处理、视频监控,特别涉及基于深度学习的运动目标检测方法及装置。
背景技术
目标检测是指计算机和软件系统在图像/场景中定位并识别出每个目标的能力,已广泛应用于人脸检测、车辆检测、行人计数、网络图像、安全系统和无人驾驶汽车等领域。
传统的运动目标检测方法一般采用帧差法或背景减法,但这些传统的运动目标检测方法容易受光线、环境等的影响,检测的准确率较低。
近年来,基于深度学习的检测方法(例如SSD、Yolo、Faster RCNN等)对多目标具备很好的检测效果,但是为了解决多目标检测较为宽泛尺寸的问题,往往需要较大的计算量。
综上所述,目前迫切需要提出一种检测较快的基于深度学习的运动目标检测方法。
发明内容
有鉴于此,本发明的主要目的在于快速实现运动目标检测,且检测准确率较高。
为达到上述目的,按照本发明的第一个方面,提供了基于深度学习的运动目标检测方法,该方法包括:
第一步骤,输入或者采集视频图像;
第二步骤,对视频图像进行运动目标检测,获取前景区域;
第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
进一步地,所述第三步骤包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述第四步骤包括:
横向拼接步骤,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
进一步地,所述第五步骤包括:
目标检测框获取步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射步骤,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出步骤,输出所有子图像内的目标检测区域。
按照本发明的另一个方面,提供了基于深度学习的运动目标检测装置,该装置包括:
视频图像输入或采集模块,用于输入或者采集视频图像;
运动目标检测模块,用于对视频图像进行运动目标检测,获取前景区域;
外扩处理及子图像获取模块,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
横向拼接子图像获取模块,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
目标检测框和映射模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
进一步地,所述外扩处理及子图像获取模块包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述横向拼接子图像获取模块包括:
横向拼接模块,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
进一步地,所述目标检测框和映射模块包括:
目标检测框获取模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射模块,用于根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出模块,用于输出所有子图像内的目标检测区域。
与现有的运动目标检测技术相比,本发明的基于深度学习的运动目标检测方法及装置采用运动目标检测、外扩处理、固定高度缩放、横向拼接、以及深度学习目标检测模型等方法,在提高目标检测准确率的同时,有效地降低了目标检测的复杂度和算法需求。
附图说明
图1示出了按照本发明的基于深度学习的运动目标检测方法的流程图。
图2示出了按照本发明的基于深度学习的运动目标检测装置的框架图。
具体实施方式
为使本领域的技术人员能进一步了解本发明的结构、特征及其他目的,现结合所附较佳实施例详细说明如下,所说明的较佳实施例仅用于说明本发明的技术方案,并非限定本发明。
图1给出了按照本发明的基于深度学习的运动目标检测方法的流程图。如图1所示,按照本发明的基于深度学习的运动目标检测方法包括:
第一步骤S1,输入或者采集视频图像;
第二步骤S2,对视频图像进行运动目标检测,获取前景区域;
第三步骤S3,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
第四步骤S4,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
第五步骤S5,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
所述第二步骤S2中运动目标检测可以采用现有的运动目标检测或者移动目标检测方法实现,包括但不限于以下一种或者多种方法的组合:基于背景建模的运动目标检测、基于帧差法的运动目标检测、基于光流法的运动目标检测等。示例性地,采用基于混合高斯背景建模的运动目标检测方法,从视频图像中获取一个或者多个前景区域。
进一步地,所述第三步骤S3包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述α的取值范围1.04~2.16。示例性地,所述α选为1.5或者1.85。
进一步地,所述第四步骤S4包括:
横向拼接步骤S42,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
所述固定高度为H=λh,其中h为所述目标深度学习模型的最优检测尺度。进一步地,所述λ的取值范围为1.3~1.8。
所述最优检测尺度h根据目标深度学习模型,根据多次样本测试,以获取检测效果最好的样本的高度作为最优检测尺度h。
进一步地,所述最优检测尺度h的取值范围为60~100。
所述固定高度等比例缩放步骤S41中第i个缩放子图像的宽度为βi*wi′、高度为H。
示例性地,所述第四步骤S42为:当前帧图像中存在4个缩放子图像,将第1个缩放子图像的右边界与第2个缩放子图像的左边界、第2个缩放子图像的右边界与第3个缩放子图像的左边界、第3个缩放子图像的右边界与第4个缩放子图像的左边界无缝拼接在一起,获取当前帧图像中4个缩放子图像的横向拼接图像,横向拼接子图像的高度为128、宽度为4个缩放子图像的宽度和。
进一步地,所述第五步骤S5包括:
目标检测框获取步骤S51,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射步骤S52,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出步骤S53,输出所有子图像内的目标检测区域。
所述目标检测框获取步骤S51中经训练的深度学习检测模型为:根据已标注目标的样本图像,对深度学习网络进行反复训练,获取经训练的深度学习检测模型。
进一步地,所述深度学习网络为:卷积神经网络、深度信念网络、递归神经网络、或者生物神经网络,或其组合。
示例性地,所述经训练的深度学习检测模型为:根据已标注目标的样本图像,采用“Faster R-CNN:Towards Real-Time Object Detection with Region ProposalNetworks.S Ren,K He,R Girshick,J Sun.《IEEE Trans Pattern Anal Mach Intell》,2015,39(6):1137-1149”论文中的方法,对Faster R-CNN进行反复训练,获取经训练的深度学习检测模型。
图2给出了按照本发明的基于深度学习的运动目标检测装置的框架图。如图2所示,按照本发明的基于深度学习的运动目标检测装置包括:
视频图像输入或采集模块1,用于输入或者采集视频图像;
运动目标检测模块2,用于对视频图像进行运动目标检测,获取前景区域;
外扩处理及子图像获取模块3,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
横向拼接子图像获取模块4,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
目标检测框和映射模块5,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
进一步地,所述外扩处理及子图像获取模块3包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述横向拼接子图像获取模块4包括:
横向拼接模块42,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
进一步地,所述目标检测框和映射模块5包括:
目标检测框获取模块51,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射模块52,用于根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出模块53,用于输出所有子图像内的目标检测区域。
与现有的运动目标检测技术相比,本发明的基于深度学习的运动目标检测方法及装置采用运动目标检测、外扩处理、固定高度缩放、横向拼接、以及深度学习目标检测模型等方法,在提高目标检测准确率的同时,有效地降低了目标检测的复杂度和算法需求。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,应当理解,本发明并不限于这里所描述的实现方案,这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善,因此本发明只受到本发明权利要求的内容和范围的限制,其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。
Claims (7)
1.基于深度学习的运动目标检测方法,其特征在于,该方法包括:
第一步骤,输入或者采集视频图像;
第二步骤,对视频图像进行运动目标检测,获取前景区域;
第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出;
进一步地,所述第三步骤包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像;α表示外扩系数;所述第四步骤包括:
横向拼接步骤,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和;
其中所述固定高度为H=λh,所述h为所述深度学习目标检测模型的最优检测尺度;λ表示高度缩放系数。
2.如权利要求1所述的方法,进一步地,所述α的取值范围1.04~2.16。
3.如权利要求1所述的方法,进一步地,所述λ的取值范围为1.3~1.8,所述最优检测尺度h的取值范围为60~100。
5.如权利要求4所述的方法,所述经训练的深度学习检测模型为:根据已标注目标的样本图像,对深度学习网络进行反复训练,获取经训练的深度学习检测模型;
进一步地,所述深度学习网络为:卷积神经网络、深度信念网络、递归神经网络、或者生物神经网络,或其组合。
6.基于深度学习的运动目标检测装置,其特征在于,该装置包括:
视频图像输入或采集模块,用于输入或者采集视频图像;
运动目标检测模块,用于对视频图像进行运动目标检测,获取前景区域;
外扩处理及子图像获取模块,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
横向拼接子图像获取模块,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
目标检测框和映射模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出;
进一步地,所述外扩处理及子图像获取模块包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像;α表示外扩系数;
所述横向拼接子图像获取模块包括:
横向拼接模块,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和;
其中所述固定高度为H=λh,所述h为所述深度学习目标检测模型的最优检测尺度;λ表示高度缩放系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811010626.5A CN109035292B (zh) | 2018-08-31 | 2018-08-31 | 基于深度学习的运动目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811010626.5A CN109035292B (zh) | 2018-08-31 | 2018-08-31 | 基于深度学习的运动目标检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109035292A CN109035292A (zh) | 2018-12-18 |
CN109035292B true CN109035292B (zh) | 2021-01-01 |
Family
ID=64623048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811010626.5A Active CN109035292B (zh) | 2018-08-31 | 2018-08-31 | 基于深度学习的运动目标检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109035292B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347817B (zh) * | 2019-08-08 | 2022-05-17 | 魔门塔(苏州)科技有限公司 | 一种视频目标检测与跟踪方法及装置 |
CN110458090A (zh) * | 2019-08-08 | 2019-11-15 | 成都睿云物联科技有限公司 | 挖掘机工作状态检测方法、装置、设备和存储介质 |
CN110796682A (zh) * | 2019-09-25 | 2020-02-14 | 北京成峰科技有限公司 | 运动目标的检测识别方法及检测识别系统 |
CN110853353B (zh) * | 2019-11-18 | 2020-10-16 | 山东大学 | 基于视觉的密度交通车辆计数和交通流量计算方法及系统 |
CN111652111A (zh) * | 2020-05-29 | 2020-09-11 | 浙江大华技术股份有限公司 | 一种目标检测方法及相关装置 |
CN112733624B (zh) * | 2020-12-26 | 2023-02-03 | 电子科技大学 | 室内密集场景的人流密度检测方法、系统存储介质及终端 |
CN112613570B (zh) * | 2020-12-29 | 2024-06-11 | 深圳云天励飞技术股份有限公司 | 一种图像检测方法、图像检测装置、设备及存储介质 |
CN113421253B (zh) * | 2021-07-16 | 2023-04-07 | 上海微电机研究所(中国电子科技集团公司第二十一研究所) | 一种基于分块并行的目标检测方法 |
CN115049165B (zh) * | 2022-08-15 | 2022-11-22 | 北矿机电科技有限责任公司 | 基于深度学习的浮选精矿品位预测方法、装置及设备 |
CN117237418B (zh) * | 2023-11-15 | 2024-01-23 | 成都航空职业技术学院 | 一种基于深度学习的运动目标检测方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679749A (zh) * | 2013-11-22 | 2014-03-26 | 北京奇虎科技有限公司 | 一种基于运动目标跟踪的图像处理方法及装置 |
CN106791710A (zh) * | 2017-02-10 | 2017-05-31 | 北京地平线信息技术有限公司 | 目标检测方法、装置和电子设备 |
CN106845338A (zh) * | 2016-12-13 | 2017-06-13 | 深圳市智美达科技股份有限公司 | 视频流中行人检测方法与系统 |
CN107480585A (zh) * | 2017-07-06 | 2017-12-15 | 西安电子科技大学 | 基于dpm算法的目标检测方法 |
CN107491731A (zh) * | 2017-07-17 | 2017-12-19 | 南京航空航天大学 | 一种面向精确打击的地面运动目标检测与识别方法 |
-
2018
- 2018-08-31 CN CN201811010626.5A patent/CN109035292B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679749A (zh) * | 2013-11-22 | 2014-03-26 | 北京奇虎科技有限公司 | 一种基于运动目标跟踪的图像处理方法及装置 |
CN106845338A (zh) * | 2016-12-13 | 2017-06-13 | 深圳市智美达科技股份有限公司 | 视频流中行人检测方法与系统 |
CN106791710A (zh) * | 2017-02-10 | 2017-05-31 | 北京地平线信息技术有限公司 | 目标检测方法、装置和电子设备 |
CN107480585A (zh) * | 2017-07-06 | 2017-12-15 | 西安电子科技大学 | 基于dpm算法的目标检测方法 |
CN107491731A (zh) * | 2017-07-17 | 2017-12-19 | 南京航空航天大学 | 一种面向精确打击的地面运动目标检测与识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109035292A (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035292B (zh) | 基于深度学习的运动目标检测方法及装置 | |
Koch et al. | Evaluation of cnn-based single-image depth estimation methods | |
Zhuo et al. | Defocus map estimation from a single image | |
CN103325112B (zh) | 动态场景中运动目标快速检测方法 | |
US8406510B2 (en) | Methods for evaluating distances in a scene and apparatus and machine readable medium using the same | |
CN110599537A (zh) | 基于Mask R-CNN的无人机图像建筑物面积计算方法及系统 | |
CN109253722B (zh) | 融合语义分割的单目测距系统、方法、设备及存储介质 | |
CN112201078B (zh) | 一种基于图神经网络的自动泊车停车位检测方法 | |
CN107067015B (zh) | 一种基于多特征深度学习的车辆检测方法及装置 | |
Aeschliman et al. | Tracking vehicles through shadows and occlusions in wide-area aerial video | |
CN112435223B (zh) | 目标检测方法、装置及存储介质 | |
CN115375917B (zh) | 一种目标边缘特征提取方法、装置、终端及存储介质 | |
CN112634368A (zh) | 场景目标的空间与或图模型生成方法、装置及电子设备 | |
CN112634369A (zh) | 空间与或图模型生成方法、装置、电子设备和存储介质 | |
Xie et al. | Geometry-based populated chessboard recognition | |
Kocur et al. | Traffic camera calibration via vehicle vanishing point detection | |
CN111881914B (zh) | 一种基于自学习阈值的车牌字符分割方法及系统 | |
CN112446353B (zh) | 基于深度卷积神经网络的视频图像道线检测方法 | |
Revaud et al. | Robust automatic monocular vehicle speed estimation for traffic surveillance | |
Shi et al. | A method for detecting pedestrian height and distance based on monocular vision technology | |
CN111241891B (zh) | 一种人脸图像切图方法、装置及计算机可读存储介质 | |
CN111583341B (zh) | 云台像机移位检测方法 | |
CN113870307A (zh) | 一种基于帧间信息的目标检测方法及装置 | |
Monfared et al. | Optimized road lane detection through a combined Canny edge detection, Hough transform, and scaleable region masking toward autonomous driving | |
CN112837404A (zh) | 一种平面对象的三维信息的构建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |