CN109035292B - 基于深度学习的运动目标检测方法及装置 - Google Patents

基于深度学习的运动目标检测方法及装置 Download PDF

Info

Publication number
CN109035292B
CN109035292B CN201811010626.5A CN201811010626A CN109035292B CN 109035292 B CN109035292 B CN 109035292B CN 201811010626 A CN201811010626 A CN 201811010626A CN 109035292 B CN109035292 B CN 109035292B
Authority
CN
China
Prior art keywords
image
target detection
sub
ith
height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811010626.5A
Other languages
English (en)
Other versions
CN109035292A (zh
Inventor
余旭
赵雪鹏
李党
李志国
朱明�
潘晓瞳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Icetech Science & Technology Co ltd
Original Assignee
Beijing Icetech Science & Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Icetech Science & Technology Co ltd filed Critical Beijing Icetech Science & Technology Co ltd
Priority to CN201811010626.5A priority Critical patent/CN109035292B/zh
Publication of CN109035292A publication Critical patent/CN109035292A/zh
Application granted granted Critical
Publication of CN109035292B publication Critical patent/CN109035292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于深度学习的运动目标检测方法,该方法包括:输入或者采集视频图像;对视频图像进行运动目标检测,获取前景区域;对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。与现有技术相比,本发明能快速地进行运动目标检测,且检测准确率高。

Description

基于深度学习的运动目标检测方法及装置
技术领域
本发明涉及图像处理、视频监控,特别涉及基于深度学习的运动目标检测方法及装置。
背景技术
目标检测是指计算机和软件系统在图像/场景中定位并识别出每个目标的能力,已广泛应用于人脸检测、车辆检测、行人计数、网络图像、安全系统和无人驾驶汽车等领域。
传统的运动目标检测方法一般采用帧差法或背景减法,但这些传统的运动目标检测方法容易受光线、环境等的影响,检测的准确率较低。
近年来,基于深度学习的检测方法(例如SSD、Yolo、Faster RCNN等)对多目标具备很好的检测效果,但是为了解决多目标检测较为宽泛尺寸的问题,往往需要较大的计算量。
综上所述,目前迫切需要提出一种检测较快的基于深度学习的运动目标检测方法。
发明内容
有鉴于此,本发明的主要目的在于快速实现运动目标检测,且检测准确率较高。
为达到上述目的,按照本发明的第一个方面,提供了基于深度学习的运动目标检测方法,该方法包括:
第一步骤,输入或者采集视频图像;
第二步骤,对视频图像进行运动目标检测,获取前景区域;
第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
进一步地,所述第三步骤包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为
Figure BDA0001784991030000021
左上角纵坐标为
Figure BDA0001784991030000022
其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述第四步骤包括:
固定高度等比例缩放步骤,计算当前帧图像中第i个子图像的缩放比例
Figure BDA0001784991030000023
按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;
横向拼接步骤,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
进一步地,所述第五步骤包括:
目标检测框获取步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射步骤,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为
Figure BDA0001784991030000024
高度为
Figure BDA0001784991030000025
左上角坐标为
Figure BDA0001784991030000026
其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出步骤,输出所有子图像内的目标检测区域。
按照本发明的另一个方面,提供了基于深度学习的运动目标检测装置,该装置包括:
视频图像输入或采集模块,用于输入或者采集视频图像;
运动目标检测模块,用于对视频图像进行运动目标检测,获取前景区域;
外扩处理及子图像获取模块,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
横向拼接子图像获取模块,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
目标检测框和映射模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
进一步地,所述外扩处理及子图像获取模块包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为
Figure BDA0001784991030000031
左上角纵坐标为
Figure BDA0001784991030000032
其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述横向拼接子图像获取模块包括:
固定高度等比例缩放模块,用于计算当前帧图像中第i个子图像的缩放比例
Figure BDA0001784991030000033
按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;
横向拼接模块,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
进一步地,所述目标检测框和映射模块包括:
目标检测框获取模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射模块,用于根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为
Figure BDA0001784991030000041
高度为
Figure BDA0001784991030000042
左上角坐标为
Figure BDA0001784991030000043
其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出模块,用于输出所有子图像内的目标检测区域。
与现有的运动目标检测技术相比,本发明的基于深度学习的运动目标检测方法及装置采用运动目标检测、外扩处理、固定高度缩放、横向拼接、以及深度学习目标检测模型等方法,在提高目标检测准确率的同时,有效地降低了目标检测的复杂度和算法需求。
附图说明
图1示出了按照本发明的基于深度学习的运动目标检测方法的流程图。
图2示出了按照本发明的基于深度学习的运动目标检测装置的框架图。
具体实施方式
为使本领域的技术人员能进一步了解本发明的结构、特征及其他目的,现结合所附较佳实施例详细说明如下,所说明的较佳实施例仅用于说明本发明的技术方案,并非限定本发明。
图1给出了按照本发明的基于深度学习的运动目标检测方法的流程图。如图1所示,按照本发明的基于深度学习的运动目标检测方法包括:
第一步骤S1,输入或者采集视频图像;
第二步骤S2,对视频图像进行运动目标检测,获取前景区域;
第三步骤S3,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
第四步骤S4,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
第五步骤S5,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
所述第二步骤S2中运动目标检测可以采用现有的运动目标检测或者移动目标检测方法实现,包括但不限于以下一种或者多种方法的组合:基于背景建模的运动目标检测、基于帧差法的运动目标检测、基于光流法的运动目标检测等。示例性地,采用基于混合高斯背景建模的运动目标检测方法,从视频图像中获取一个或者多个前景区域。
进一步地,所述第三步骤S3包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为
Figure BDA0001784991030000051
左上角纵坐标为
Figure BDA0001784991030000052
其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述α的取值范围1.04~2.16。示例性地,所述α选为1.5或者1.85。
所述
Figure BDA0001784991030000053
表示:当
Figure BDA0001784991030000054
大于0时,xi′为
Figure BDA0001784991030000055
否则xi′为0。所述
Figure BDA0001784991030000056
表示:当
Figure BDA0001784991030000057
大于0时,yi′为
Figure BDA0001784991030000058
否则yi′为0。
进一步地,所述第四步骤S4包括:
固定高度等比例缩放步骤S41,计算当前帧图像中第i个子图像的缩放比例
Figure BDA0001784991030000059
按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;
横向拼接步骤S42,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
所述固定高度为H=λh,其中h为所述目标深度学习模型的最优检测尺度。进一步地,所述λ的取值范围为1.3~1.8。
所述最优检测尺度h根据目标深度学习模型,根据多次样本测试,以获取检测效果最好的样本的高度作为最优检测尺度h。
进一步地,所述最优检测尺度h的取值范围为60~100。
所述固定高度等比例缩放步骤S41中第i个缩放子图像的宽度为βi*wi′、高度为H。
示例性地,所述第四步骤S42为:当前帧图像中存在4个缩放子图像,将第1个缩放子图像的右边界与第2个缩放子图像的左边界、第2个缩放子图像的右边界与第3个缩放子图像的左边界、第3个缩放子图像的右边界与第4个缩放子图像的左边界无缝拼接在一起,获取当前帧图像中4个缩放子图像的横向拼接图像,横向拼接子图像的高度为128、宽度为4个缩放子图像的宽度和。
进一步地,所述第五步骤S5包括:
目标检测框获取步骤S51,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射步骤S52,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为
Figure BDA0001784991030000061
高度为
Figure BDA0001784991030000062
左上角坐标为
Figure BDA0001784991030000063
其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出步骤S53,输出所有子图像内的目标检测区域。
所述目标检测框获取步骤S51中经训练的深度学习检测模型为:根据已标注目标的样本图像,对深度学习网络进行反复训练,获取经训练的深度学习检测模型。
进一步地,所述深度学习网络为:卷积神经网络、深度信念网络、递归神经网络、或者生物神经网络,或其组合。
示例性地,所述经训练的深度学习检测模型为:根据已标注目标的样本图像,采用“Faster R-CNN:Towards Real-Time Object Detection with Region ProposalNetworks.S Ren,K He,R Girshick,J Sun.《IEEE Trans Pattern Anal Mach Intell》,2015,39(6):1137-1149”论文中的方法,对Faster R-CNN进行反复训练,获取经训练的深度学习检测模型。
图2给出了按照本发明的基于深度学习的运动目标检测装置的框架图。如图2所示,按照本发明的基于深度学习的运动目标检测装置包括:
视频图像输入或采集模块1,用于输入或者采集视频图像;
运动目标检测模块2,用于对视频图像进行运动目标检测,获取前景区域;
外扩处理及子图像获取模块3,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
横向拼接子图像获取模块4,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
目标检测框和映射模块5,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。
进一步地,所述外扩处理及子图像获取模块3包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为
Figure BDA0001784991030000071
左上角纵坐标为
Figure BDA0001784991030000072
其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。
进一步地,所述横向拼接子图像获取模块4包括:
固定高度等比例缩放模块41,用于计算当前帧图像中第i个子图像的缩放比例
Figure BDA0001784991030000073
按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;
横向拼接模块42,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。
进一步地,所述目标检测框和映射模块5包括:
目标检测框获取模块51,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射模块52,用于根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为
Figure BDA0001784991030000081
高度为
Figure BDA0001784991030000082
左上角坐标为
Figure BDA0001784991030000083
其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出模块53,用于输出所有子图像内的目标检测区域。
与现有的运动目标检测技术相比,本发明的基于深度学习的运动目标检测方法及装置采用运动目标检测、外扩处理、固定高度缩放、横向拼接、以及深度学习目标检测模型等方法,在提高目标检测准确率的同时,有效地降低了目标检测的复杂度和算法需求。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,应当理解,本发明并不限于这里所描述的实现方案,这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善,因此本发明只受到本发明权利要求的内容和范围的限制,其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims (7)

1.基于深度学习的运动目标检测方法,其特征在于,该方法包括:
第一步骤,输入或者采集视频图像;
第二步骤,对视频图像进行运动目标检测,获取前景区域;
第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出;
进一步地,所述第三步骤包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为
Figure FDA0002757480830000011
左上角纵坐标为
Figure FDA0002757480830000012
其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像;α表示外扩系数;所述第四步骤包括:
固定高度等比例缩放步骤,计算当前帧图像中第i个子图像的缩放比例
Figure FDA0002757480830000013
按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;
横向拼接步骤,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和;
其中所述固定高度为H=λh,所述h为所述深度学习目标检测模型的最优检测尺度;λ表示高度缩放系数。
2.如权利要求1所述的方法,进一步地,所述α的取值范围1.04~2.16。
3.如权利要求1所述的方法,进一步地,所述λ的取值范围为1.3~1.8,所述最优检测尺度h的取值范围为60~100。
4.如权利要求1所述的方法,其特征在于,所述第五步骤包括:
目标检测框获取步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射步骤,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为
Figure FDA0002757480830000021
高度为
Figure FDA0002757480830000022
左上角坐标为
Figure FDA0002757480830000023
其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出步骤,输出所有子图像内的目标检测区域。
5.如权利要求4所述的方法,所述经训练的深度学习检测模型为:根据已标注目标的样本图像,对深度学习网络进行反复训练,获取经训练的深度学习检测模型;
进一步地,所述深度学习网络为:卷积神经网络、深度信念网络、递归神经网络、或者生物神经网络,或其组合。
6.基于深度学习的运动目标检测装置,其特征在于,该装置包括:
视频图像输入或采集模块,用于输入或者采集视频图像;
运动目标检测模块,用于对视频图像进行运动目标检测,获取前景区域;
外扩处理及子图像获取模块,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;
横向拼接子图像获取模块,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;
目标检测框和映射模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出;
进一步地,所述外扩处理及子图像获取模块包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为
Figure FDA0002757480830000031
左上角纵坐标为
Figure FDA0002757480830000032
其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像;α表示外扩系数;
所述横向拼接子图像获取模块包括:
固定高度等比例缩放模块,用于计算当前帧图像中第i个子图像的缩放比例
Figure FDA0002757480830000033
按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;
横向拼接模块,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和;
其中所述固定高度为H=λh,所述h为所述深度学习目标检测模型的最优检测尺度;λ表示高度缩放系数。
7.如权利要求6所述的装置,其特征在于,所述目标检测框和映射模块包括:目标检测框获取模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;
目标检测框映射模块,用于根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为
Figure FDA0002757480830000034
高度为
Figure FDA0002757480830000035
左上角坐标为
Figure FDA0002757480830000036
其中(xi′,yi′)为第i个子图像的左上角坐标;
目标检测区域输出模块,用于输出所有子图像内的目标检测区域。
CN201811010626.5A 2018-08-31 2018-08-31 基于深度学习的运动目标检测方法及装置 Active CN109035292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811010626.5A CN109035292B (zh) 2018-08-31 2018-08-31 基于深度学习的运动目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811010626.5A CN109035292B (zh) 2018-08-31 2018-08-31 基于深度学习的运动目标检测方法及装置

Publications (2)

Publication Number Publication Date
CN109035292A CN109035292A (zh) 2018-12-18
CN109035292B true CN109035292B (zh) 2021-01-01

Family

ID=64623048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811010626.5A Active CN109035292B (zh) 2018-08-31 2018-08-31 基于深度学习的运动目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN109035292B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347817B (zh) * 2019-08-08 2022-05-17 魔门塔(苏州)科技有限公司 一种视频目标检测与跟踪方法及装置
CN110458090A (zh) * 2019-08-08 2019-11-15 成都睿云物联科技有限公司 挖掘机工作状态检测方法、装置、设备和存储介质
CN110796682A (zh) * 2019-09-25 2020-02-14 北京成峰科技有限公司 运动目标的检测识别方法及检测识别系统
CN110853353B (zh) * 2019-11-18 2020-10-16 山东大学 基于视觉的密度交通车辆计数和交通流量计算方法及系统
CN111652111A (zh) * 2020-05-29 2020-09-11 浙江大华技术股份有限公司 一种目标检测方法及相关装置
CN112733624B (zh) * 2020-12-26 2023-02-03 电子科技大学 室内密集场景的人流密度检测方法、系统存储介质及终端
CN112613570B (zh) * 2020-12-29 2024-06-11 深圳云天励飞技术股份有限公司 一种图像检测方法、图像检测装置、设备及存储介质
CN113421253B (zh) * 2021-07-16 2023-04-07 上海微电机研究所(中国电子科技集团公司第二十一研究所) 一种基于分块并行的目标检测方法
CN115049165B (zh) * 2022-08-15 2022-11-22 北矿机电科技有限责任公司 基于深度学习的浮选精矿品位预测方法、装置及设备
CN117237418B (zh) * 2023-11-15 2024-01-23 成都航空职业技术学院 一种基于深度学习的运动目标检测方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679749A (zh) * 2013-11-22 2014-03-26 北京奇虎科技有限公司 一种基于运动目标跟踪的图像处理方法及装置
CN106791710A (zh) * 2017-02-10 2017-05-31 北京地平线信息技术有限公司 目标检测方法、装置和电子设备
CN106845338A (zh) * 2016-12-13 2017-06-13 深圳市智美达科技股份有限公司 视频流中行人检测方法与系统
CN107480585A (zh) * 2017-07-06 2017-12-15 西安电子科技大学 基于dpm算法的目标检测方法
CN107491731A (zh) * 2017-07-17 2017-12-19 南京航空航天大学 一种面向精确打击的地面运动目标检测与识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679749A (zh) * 2013-11-22 2014-03-26 北京奇虎科技有限公司 一种基于运动目标跟踪的图像处理方法及装置
CN106845338A (zh) * 2016-12-13 2017-06-13 深圳市智美达科技股份有限公司 视频流中行人检测方法与系统
CN106791710A (zh) * 2017-02-10 2017-05-31 北京地平线信息技术有限公司 目标检测方法、装置和电子设备
CN107480585A (zh) * 2017-07-06 2017-12-15 西安电子科技大学 基于dpm算法的目标检测方法
CN107491731A (zh) * 2017-07-17 2017-12-19 南京航空航天大学 一种面向精确打击的地面运动目标检测与识别方法

Also Published As

Publication number Publication date
CN109035292A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN109035292B (zh) 基于深度学习的运动目标检测方法及装置
Koch et al. Evaluation of cnn-based single-image depth estimation methods
Zhuo et al. Defocus map estimation from a single image
CN103325112B (zh) 动态场景中运动目标快速检测方法
US8406510B2 (en) Methods for evaluating distances in a scene and apparatus and machine readable medium using the same
CN110599537A (zh) 基于Mask R-CNN的无人机图像建筑物面积计算方法及系统
CN109253722B (zh) 融合语义分割的单目测距系统、方法、设备及存储介质
CN112201078B (zh) 一种基于图神经网络的自动泊车停车位检测方法
CN107067015B (zh) 一种基于多特征深度学习的车辆检测方法及装置
Aeschliman et al. Tracking vehicles through shadows and occlusions in wide-area aerial video
CN112435223B (zh) 目标检测方法、装置及存储介质
CN115375917B (zh) 一种目标边缘特征提取方法、装置、终端及存储介质
CN112634368A (zh) 场景目标的空间与或图模型生成方法、装置及电子设备
CN112634369A (zh) 空间与或图模型生成方法、装置、电子设备和存储介质
Xie et al. Geometry-based populated chessboard recognition
Kocur et al. Traffic camera calibration via vehicle vanishing point detection
CN111881914B (zh) 一种基于自学习阈值的车牌字符分割方法及系统
CN112446353B (zh) 基于深度卷积神经网络的视频图像道线检测方法
Revaud et al. Robust automatic monocular vehicle speed estimation for traffic surveillance
Shi et al. A method for detecting pedestrian height and distance based on monocular vision technology
CN111241891B (zh) 一种人脸图像切图方法、装置及计算机可读存储介质
CN111583341B (zh) 云台像机移位检测方法
CN113870307A (zh) 一种基于帧间信息的目标检测方法及装置
Monfared et al. Optimized road lane detection through a combined Canny edge detection, Hough transform, and scaleable region masking toward autonomous driving
CN112837404A (zh) 一种平面对象的三维信息的构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant