CN109961009B - 基于深度学习的行人检测方法、系统、装置及存储介质 - Google Patents

基于深度学习的行人检测方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN109961009B
CN109961009B CN201910117952.4A CN201910117952A CN109961009B CN 109961009 B CN109961009 B CN 109961009B CN 201910117952 A CN201910117952 A CN 201910117952A CN 109961009 B CN109961009 B CN 109961009B
Authority
CN
China
Prior art keywords
model
convolutional neural
neural network
image
pedestrian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910117952.4A
Other languages
English (en)
Other versions
CN109961009A (zh
Inventor
石磊
马进
王健宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910117952.4A priority Critical patent/CN109961009B/zh
Publication of CN109961009A publication Critical patent/CN109961009A/zh
Priority to PCT/CN2019/117799 priority patent/WO2020164270A1/zh
Application granted granted Critical
Publication of CN109961009B publication Critical patent/CN109961009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明涉及深度学习技术领域,提出一种基于深度学习的行人检测方法、系统、装置及存储介质,其中的方法包括:采集行人图像数据集,并将所述图像数据集按预设比例划分为训练图像和测试图像;创建卷积神经网络模型,并通过预训练模型对所述卷积神经网络模型的参数进行初始化;将所述训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型;通过所述行人检测模型对所述测试图像进行行人检测及标注。本发明通过深度学习将训练好的模型部署到移动终端,能够实现对行人的灵活检测,通用性强、成本低。

Description

基于深度学习的行人检测方法、系统、装置及存储介质
技术领域
本发明涉及深度学习技术领域,尤其涉及一种基于深度学习的行人检测方法、系统、装置及存储介质。
背景技术
行人检测就是计算机对于给定的图像和视频,判断出其中是否有行人,如果有还需要给出行人的具体位置。行人检测是行人跟踪,行为分析,行人身份识别辅助智能驾驶、智能监控、道路行人分析、客流统计分析、智能机器人等研究的基础和前提,一个好的行人检测算法能够为后者提供有力的支持和保障。
近年来行人检测进入了快速发展阶段,深度学习算法被引入到行人检测中,利用深度学习学到的行人特征具有很强的层次表达能力和很好的鲁棒性,故越来越多地取代传统的诸如手工设计HOG、LBP特征、采用SVM或增强学习等算法而得到实际应用。
目前常用的行人检测方法包括:背景差法、帧差法、光流法、模板匹配法和基于机器学习的方法等。前述四种方法都是基于图像处理技术的人体检测方法,然而这些方法在面对人体衣着、体形、人体姿势、人体遮挡、光照问题以及复杂背景等方面的问题时,所体现出来的准确率和鲁棒性很差。此外,现有的行人检测系统,还需要使用高清摄像机及相应的网络传输及图像处理单元,导致行人检测系统庞大笨重,便携性差、成本高。
发明内容
本发明提供一种基于深度学习的行人检测方法、系统、装置及存储介质,以解决目前行人检测系统庞大笨重,便携性差、成本高等问题。
第一方面,本发明提供一种基于深度学习的行人检测方法,应用于电子装置,其特征在于,所述方法包括:
采集行人图像数据集,并将所述图像数据集按预设比例划分为训练图像和测试图像;
创建卷积神经网络模型,并通过预训练模型对所述卷积神经网络模型的参数进行初始化;
将所述训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型;
通过所述行人检测模型对所述测试图像进行行人检测及标注。
第二方面,本发明还提供一种基于深度学习的行人检测系统,其特征在于,所述系统包括:
检测模型创建单元,用于创建行人检测模型;
预处理单元,用于对待检测图像进行对象提取、尺寸归一化和色彩空间归一化处理;
图片检测单元,用于通过行人检测模型对预处理单元处理后的图像进行检测,并在检测到行人时,标注行人的坐标值和位置信息。
第三方面,本发明还提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如上所述基于深度学习的行人检测方法的步骤。
第四方面,本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述基于深度学习的行人检测方法的步骤。
本发明提出的基于深度学习的行人检测方法、系统、装置及存储介质,能够采用深度学习算法,将训练出的模型部署到安卓移动端,并开发出对应的移动app,用户通过智能安卓手机即可方便地对移动端采集到的图像或视频信息实时进行行人检测,并能够联网下载最新的算法模型;此外,用户采集的样本图片还可用于对线上模型进行更新迭代,无需额外的硬件资源,成本低、应用范围广。
附图说明
图1为本发明基于深度学习的行人检测方法的应用环境示意图;
图2为本发明基于深度学习的行人检测方法的流程图;
图3为本发明基于深度学习的行人检测系统的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于深度学习的行人检测方法,应用于一种电子装置1。
参照图1所示,为本发明述基于深度学习的行人检测方法较佳实施例的应用环境示意。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备,但并不局限于此。
该电子装置1包括:处理器12、存储器11、网络接口14及通信总线13。
存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器11等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置1的外部存储器11,例如所述电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(SecureDigital, SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的基于深度学习的行人检测程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行基于深度学习的行人检测程序10等。
网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。
通信总线13用于实现这些组件之间的连接通信。
图1仅示出了具有组件11-14的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的设备、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置1还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。
此外,该电子装置1的显示器的面积可以与所述触摸传感器的面积相同,也可以不同。可选地,将显示器与所述触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。
可选地,该电子装置1还可以包括射频(Radio Frequency,RF)电路,传感器、音频电路等等,在此不再赘述。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子装置的限定,具体的电子装置可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
图2示出了本发明实施例的基于深度学习的行人检测方法的流程,该方法可应用于上述的电子装置1中,具体包括以下步骤:
步骤S110:采集行人图像数据集,并将所述图像数据集按预设比例划分为训练图像和测试图像。
其中,行人图像数据集可通过收集公开的行人检测图像数据(例如,Caltech行人数据集、TUD 行人数据库NICTA 数据集、ETH 数据集、CVC 行人数据集等)和已有的道路卡口监控视频获取。
此外,预设比例范围可控制在7:3至4:1的范围内,优选地预设比例为4:1,在数据量一定时,训练图像和测试图像按照4:1划分能够尽可能多的利用数据训练出泛化性较佳的模型,并科学地评估所创建的网络模型的性能,可通过测试图像评估行人检测的准确率。
步骤S120:创建卷积神经网络模型,并通过预训练模型对所述卷积神经网络模型的参数进行初始化。
其中,预训练模型是一种深度学习构架,已经过训练用于执行大量数据上的特定任务(例如,识别图片中的分类问题),这种训练不容易执行,并且通常需要大量资源,超出许多可用于深度学习模型的人可用的资源。在谈论预训练模型时,通常指的是在Imagenet上训练的CNN(用于视觉相关任务的架构)。
创建卷积神经网络模型的步骤进一步包括:
S121:创建卷积神经网络模型的基础网络。
S122:将基础网络的卷积层输出的特征图送入RPN候选区域网络,确定所述特征图的候选区域。
S123:将卷积层输出的特征图和所述候选区域同时送入判别网络,获取定位行人目标的候选框,候选框用于对待检测图像中的行人进行框选定位。
作为示例,创建的卷积神经网络模型参数包括:20层卷积神经网络,具体为13个Conv卷积层、4个MaxPool池化层、2个FullConnected全连接层和1个Softmax层;并通过ImageNet数据集的预训练模型对Conv卷积层、MaxPool池化层及FullConnected全连接层的网络参数进行初始化。
卷积神经网络模型结构如下表所示:
步骤S130:将训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至卷积神经网络模型的实际输出与训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型。
具体地,将训练图像归一化处理为长宽均为224大小,然后输入两个卷积层Conv1×2(Conv1_1、Conv1_2)中,其卷积核大小均为3×3,输出特征图大小均为224×224,接着将卷积层输出的特征图输入到池化层Pool1中进行池化操作,池化核大小为2×2,输出大小为112×112的特征图,类似的后续的卷积层池化层所做运算均如上表所示,直至Fc6层(FullConnected全连接层)输入7×7的特征图,输出长度为4096的向量,Fc7输出输出大小均为4096,Softmax层输出大小为1000。
上述神经网络结构即可作为卷积神经网络模型的基础网络。
截取基础网络的一部分作为特征提取网络,特征提取网络分别与RPN候选区域网络和判别网络连接,同时RPN候选区域网络也与判别网络连接,最终由判别网络输出选定行人后的结果。
具体地,将卷积层神经网络模型的卷积层5输出的特征图送入RPN候选区域网络,确定候选区域。然后,将卷积层5输出的特征图和候选区域同时送入判别网络,得到定位行人目标的候选框。
作为示例,RPN候选区域网络包括3个Conv层,1个Softmax层、1个bbox层以及1个Proposal层。判别网络输入包括1个ROI Pooling层、4个Fc层、1个Softmax层以及1个bbox层。卷积层5输出的特征图送入RPN候选区域网络,通过RPN候选区域网络的Proposal层输出候选区域,该候选区域与卷积层5输出的特征图同时送入判别网络,通过判别网络识别得到定位的行人目标。
进一步地,RPN是由一个卷积层(256维)、relu、左右两个层(clclayer和reglayer)构成的小网络,应用在滑动窗口区域上,所有的滑动窗口共享RPN,这个卷积层对比普通的卷积层而言,第一:其能够将n×n×channels的输入通过256个n×n大小的卷积核生成1*1*256的featuremap,即最后是256维的特征。第二:它的输入就是滑动窗口n×n对应的特征图区域,经过它卷积后特征图变成1×1。第三:由于此时输出的是1*1*256,所有clslayer和reglayer是用1x1的卷积核进行进一步的特征提取,这里1x1卷积核卷积时,对各个通道都有不同的参数,因为输入又是1x1的图片,所以相当于全连接的功能,相当于把1*1*256展平成256,然后进行全连接。
将训练图像输入所述卷积神经网络模型进行训练,直至卷积神经网络模型的实际输出与待标注目标图像之间的误差小于预设值,网络训练终止,形成行人检测模型。
其中,将训练图像输入所述卷积神经网络模型进行训练,通过前向后向传播拟合参数,降低所述卷积神经网络模型的实际输出与待标注目标之间的误差,当所述误差小于预设值时,所述卷积神经网络模型训练终止,并得到所述行人检测模型。
在上述卷积神经网络模型训练过程中,一次迭代的过程包括:通过反向传播和梯度下降算法来拟合行人目标的检测,通过降低候选框坐标的误差和目标类别(行人、背景)的误差,来达到降低整个卷积神经网络误差的目的,再通过前向传播更新模型中的权重,达到10000次迭代后,训练终止。
步骤S140:通过行人检测模型对所述测试图像进行行人检测及标注。
与上述基于深度学习的行人检测方法相对应,本发明还提供一种基于深度学习的行人检测系统。
图3示出了根据本发明实施例的基于深度学习的行人检测的结构。
如图3所示,本发明实施例基于深度学习的行人检测200主要包括以下几个单元:
1、检测模型创建单元210,用于创建行人检测模型。
检测模型创建单元210进一步包括:
图像数据采集模块211,用于采集行人图像数据集,并将图像数据集按预设比例划分为所述训练图像和测试图像。
其中,行人图像数据集可通过收集公开的行人检测图像数据(例如,Caltech行人数据集、TUD 行人数据库NICTA 数据集、ETH 数据集、CVC 行人数据集等)和已有的道路卡口监控视频获取。
此外,预设比例范围可控制在7:3至4:1的范围内,优选地预设比例为4:1,在数据量一定时,训练图像和测试图像按照4:1划分能够尽可能多的利用数据训练出泛化性较佳的模型,并科学地评估所创建的网络模型的性能,可通过测试图像评估行人检测的准确率。
卷积神经网络模型创建模块212,用于创建卷积神经网络模型,并通过预训练模型对所述卷积神经网络模型的参数进行初始化。
其中,预训练模型是一种深度学习构架,已经过训练用于执行大量数据上的特定任务(例如,识别图片中的分类问题),这种训练不容易执行,并且通常需要大量资源,超出许多可用于深度学习模型的人可用的资源。在谈论预训练模型时,通常指的是在Imagenet上训练的CNN(用于视觉相关任务的架构)。
卷积神经网络模型创建模块212进一步包括:
基础网络创建模块,用于创建卷积神经网络模型的基础网络。
候选区域确定模块,用于将基础网络的卷积层输出的特征图送入RPN候选区域网络,确定所述特征图的候选区域。
定位模块,用于将卷积层输出的特征图和所述候选区域同时送入判别网络,获取定位行人目标的候选框,候选框用于对待检测图像中的行人进行框选定位。
训练模块213,用于将所述训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型。
作为具体示例,创建的卷积神经网络模型参数包括:20层卷积神经网络,具体为13个Conv卷积层、4个MaxPool池化层、2个FullConnected全连接层和1个Softmax层;并通过ImageNet数据集的预训练模型对Conv卷积层、MaxPool池化层及FullConnected全连接层的网络参数进行初始化。
将训练图像归一化处理为长宽均为224大小,然后输入两个卷积层Conv1×2(Conv1_1、Conv1_2)中,其卷积核大小均为3×3,输出特征图大小均为224×224,接着将卷积层输出的特征图输入到池化层Pool1中进行池化操作,池化核大小为2×2,输出大小为112×112的特征图,类似的后续的卷积层池化层所做运算均如上表所示,直至Fc6层(FullConnected全连接层)输入7×7的特征图,输出长度为4096的向量,Fc7输出输出大小均为4096,Softmax层输出大小为1000。
上述神经网络结构即可作为卷积神经网络模型的基础网络。
截取基础网络的一部分作为特征提取网络,特征提取网络分别与RPN候选区域网络和判别网络连接,同时RPN候选区域网络也与判别网络连接,最终由判别网络输出选定行人后的结果。
具体地,将卷积层神经网络模型的卷积层5输出的特征图送入RPN候选区域网络,确定候选区域。然后,将卷积层5输出的特征图和候选区域同时送入判别网络,得到定位行人目标的候选框。
作为示例,RPN候选区域网络包括3个Conv层,1个Softmax层、1个bbox层以及1个Proposal层。判别网络输入包括1个ROI Pooling层、4个Fc层、1个Softmax层以及1个bbox层。卷积层5输出的特征图送入RPN候选区域网络,通过RPN候选区域网络的Proposal层输出候选区域,该候选区域与卷积层5输出的特征图同时送入判别网络,通过判别网络识别得到定位的行人目标。
2、预处理单元220,用于对待检测图像进行对象提取、尺寸归一化和色彩空间归一化处理。
其中,对象提取是指通过轮廓提取,从待测图片中检测出物体的轮廓,并根据检测出的轮廓进行对应裁剪;尺寸归一化是指将裁剪出的目标图像的尺寸转换为行人检测模型预设的统一尺寸;色彩空间归一化是指将尺寸归一化后的图片的色彩空间统一转换到统一色彩空间中。
3、图片检测单元230,用于通过行人检测模型对预处理单元处理后的图像进行检测,并在检测到行人时,标注行人的坐标值和位置信息。
此外,本发明提供的基于深度学习的行人检测系统还可以包括:
视频拆解单元,用于将待检测的视频拆解为多个单帧图像数据。
例如,在用户使用电子装置进行行人检测时,可采用拍照或者录制视频的方式,当输入系统的待测信息为录制的视频信息时,可通过视频拆解单元将视频拆解为多个单帧图像,以便行人检测模型进行检测识别。
样本上传单元,用于将未识别出的图像通过无线网络上传到线上服务器,以扩充行人图像数据集。
模型更新单元,用于通过移动终端下载线上服务器利用新图像数据集训练形成的行人检测模型。
利用上述基于深度学习的行人检测方法及系统,能够将行人检测模型部署至电子装置(例如,安卓移动终端),并通过电子装置与线上服务器进行信息交互,移动终端能够反馈更多样本图片供服务器训练优化行人检测模型,而服务器也能够提供最新行人检测模型给移动终端下载使用。
在本发明的一个具体实施例中,还提供一种电子装置,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行以下步骤:采集行人图像数据集,并将图像数据集按预设比例划分为训练图像和测试图像;创建卷积神经网络模型,并通过预训练模型对卷积神经网络模型的参数进行初始化;将训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至卷积神经网络模型的实际输出与训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型;通过行人检测模型对测试图像进行行人检测及标注。
具体地,将行人检测模型部署至安卓移动终端的过程包括:将服务器端训练的行人检测模型持久化,并对生成的文件进行合并、变量值固定后保存为pb模型;然后,将pb模型重新编译为移动终端可识别的语言,并将其移植部署到移动终端,形成行人检测APP。在用户使用过程中,将拍摄的照片或者录制的视频送入移动终端进行行人检测即可。
作为示例,本发明还提供一种移动终端,包括基于深度学习的行人检测系统,以及实现行人检测系统与服务器网络连接的传输模块。
在一个具体实施方式中,处理器所执行的创建卷积神经网络模型的步骤包括:创建卷积神经网络模型的基础网络;将基础网络的卷积层输出的特征图送入RPN候选区域网络,确定特征图的候选区域;将卷积层输出的特征图和候选区域同时送入判别网络,获取定位行人目标的候选框;候选框用于对待检测图像中的行人进行框选定位。
在一个具体实施方式中,基础网络包括13个Conv卷积层、4个MaxPool池化层、2个FullConnected全连接层和1个Softmax层;并通过ImageNet数据集的预训练模型对Conv卷积层、MaxPool池化层及FullConnected全连接层的网络参数进行初始化。
在一个具体实施方式中,RPN候选区域网络包括3个Conv卷积层、1个Softmax层、1个bbox层以及1个Proposal层;判别网络包括1个ROI Pooling层、4个FullConnected全连接层、1个Softmax层以及1个bbox层。
在一个具体实施方式中,处理器执行的将训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型的步骤包括:通过前向后向传播拟合参数,降低卷积神经网络模型的实际输出与待标注目标之间的误差,当误差小于预设值时,卷积神经网络模型训练终止,并得到行人检测模型。
本发明还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:采集行人图像数据集,并将图像数据集按预设比例划分为训练图像和测试图像;创建卷积神经网络模型,并通过预训练模型对卷积神经网络模型的参数进行初始化;将训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至卷积神经网络模型的实际输出与训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型;通过行人检测模型对测试图像进行行人检测及标注。
利用上述根据本发明的基于深度学习的行人检测方法、系统、装置及存储介质,能够以APP的形式向用户提供服务,同时利用安卓智能手机已有的硬件和网络资源,实现对行人的实时快速检测,成本低、携带方便。此外,在大规模应用过程中,可提供海量样本图片供卷积神经模型训练更新,从而提高检测的准确度,并使得检测模型泛化性强、适用场景多样。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种基于深度学习的行人检测方法,应用于电子装置,其特征在于,所述方法包括:
采集行人图像数据集,并将所述图像数据集按预设比例划分为训练图像和测试图像;
创建卷积神经网络模型,并通过预训练模型对所述卷积神经网络模型的参数进行初始化;
将所述训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型;
通过所述行人检测模型对所述测试图像进行行人检测及标注;所述创建卷积神经网络模型的步骤包括:
创建所述卷积神经网络模型的基础网络;
将所述基础网络的卷积层输出的特征图送入RPN候选区域网络,确定所述特征图的候选区域;
将所述卷积层输出的特征图和所述候选区域同时送入判别网络,获取定位行人目标的候选框;
所述候选框用于对待检测图像中的行人进行框选定位。
2.根据权利要求1所述的基于深度学习的行人检测方法,其特征在于,
所述基础网络包括13个Conv卷积层、4个MaxPool池化层、2个FullConnected全连接层和1个Softmax层;
并通过ImageNet数据集的预训练模型对所述Conv卷积层、所述MaxPool池化层及所述FullConnected全连接层的网络参数进行初始化。
3.根据权利要求2所述的基于深度学习的行人检测方法,其特征在于,
所述RPN候选区域网络包括3个Conv卷积层、1个Softmax层、1个bbox层以及1个Proposal层;
所述判别网络包括1个ROI Pooling层、4个FullConnected全连接层、1个Softmax层以及1个bbox层。
4.根据权利要求1所述的基于深度学习的行人检测方法,其特征在于,
将所述训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型的步骤包括:
通过前向后向传播拟合参数,降低所述卷积神经网络模型的实际输出与待标注目标之间的误差,当所述误差小于预设值时,所述卷积神经网络模型训练终止,并得到所述行人检测模型。
5.一种基于深度学习的行人检测系统,其特征在于,所述系统包括:
检测模型创建单元,用于创建行人检测模型;
预处理单元,用于对待检测图像进行对象提取、尺寸归一化和色彩空间归一化处理;
图片检测单元,用于通过行人检测模型对预处理单元处理后的图像进行检测,并在检测到行人时,标注行人的坐标值和位置信息;
所述检测模型创建单元包括卷积神经网络模型创建模块,所述卷积神经网络模型创建模块用于创建卷积神经网络模型,并通过预训练模型对所述卷积神经网络模型的参数进行初始化,包括:
创建所述卷积神经网络模型的基础网络;
将所述基础网络的卷积层输出的特征图送入RPN候选区域网络,确定所述特征图的候选区域;
将所述卷积层输出的特征图和所述候选区域同时送入判别网络,获取定位行人目标的候选框;
所述候选框用于对待检测图像中的行人进行框选定位。
6.根据权利要求5所述的基于深度学习的行人检测系统,其特征在于,所述系统还包括:
视频拆解单元,用于将待检测的视频拆解为多个单帧图像数据;
样本上传单元,用于将未识别出的图像通过无线网络上传到线上服务器,以扩充行人图像数据集;
模型更新单元,用于通过移动终端下载线上服务器利用新图像数据集训练形成的行人检测模型。
7.根据权利要求5所述的基于深度学习的行人检测系统,其特征在于,所述检测模型创建单元还包括:
图像数据采集模块,用于采集行人图像数据集,并将所述图像数据集按预设比例划分为训练图像和测试图像;
训练模块,用于将所述训练图像输入初始化处理后的卷积神经网络模型中进行训练,直至所述卷积神经网络模型的实际输出与所述训练图像中的待标注目标之间的误差小于预设值,并形成行人检测模型。
8.一种电子装置,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至4中任一项权利要求所述基于深度学习的行人检测方法的步骤。
9.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至4中任一项权利要求所述基于深度学习的行人检测方法的步骤。
CN201910117952.4A 2019-02-15 2019-02-15 基于深度学习的行人检测方法、系统、装置及存储介质 Active CN109961009B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910117952.4A CN109961009B (zh) 2019-02-15 2019-02-15 基于深度学习的行人检测方法、系统、装置及存储介质
PCT/CN2019/117799 WO2020164270A1 (zh) 2019-02-15 2019-11-13 基于深度学习的行人检测方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910117952.4A CN109961009B (zh) 2019-02-15 2019-02-15 基于深度学习的行人检测方法、系统、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109961009A CN109961009A (zh) 2019-07-02
CN109961009B true CN109961009B (zh) 2023-10-31

Family

ID=67023811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910117952.4A Active CN109961009B (zh) 2019-02-15 2019-02-15 基于深度学习的行人检测方法、系统、装置及存储介质

Country Status (2)

Country Link
CN (1) CN109961009B (zh)
WO (1) WO2020164270A1 (zh)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961009B (zh) * 2019-02-15 2023-10-31 平安科技(深圳)有限公司 基于深度学习的行人检测方法、系统、装置及存储介质
CN110472542A (zh) * 2019-08-05 2019-11-19 深圳北斗通信科技有限公司 一种基于深度学习的红外图像行人检测方法及检测系统
CN111161292B (zh) * 2019-11-21 2023-09-05 合肥合工安驰智能科技有限公司 一种矿石尺度测量方法及应用系统
CN111291632B (zh) * 2020-01-17 2023-07-11 厦门熵基科技有限公司 一种行人状态检测方法、装置以及设备
CN111325105A (zh) * 2020-01-22 2020-06-23 上海眼控科技股份有限公司 目标检测方法、装置、设备和存储介质
CN111368688A (zh) * 2020-02-28 2020-07-03 深圳市商汤科技有限公司 行人监测方法及相关产品
CN111460895B (zh) * 2020-03-03 2023-03-28 广州大学 视觉数据中防护设备的检测方法、装置和存储介质
CN111753625B (zh) * 2020-03-18 2024-04-09 北京沃东天骏信息技术有限公司 一种行人检测方法、装置、设备及介质
CN111598226B (zh) * 2020-05-18 2023-07-25 山东浪潮科学研究院有限公司 一种用于图像识别的卷积网络可视化方法及装置
CN111709451B (zh) * 2020-05-21 2023-10-17 五邑大学 酒瓶表面缺陷检测方法、电子装置及存储介质
CN111951260B (zh) * 2020-08-21 2022-04-01 苏州大学 基于部分特征融合卷积神经网络实时目标计数系统及方法
CN112149665A (zh) * 2020-09-04 2020-12-29 浙江工业大学 一种基于深度学习的高性能多尺度目标检测方法
CN112200218B (zh) * 2020-09-10 2023-06-20 浙江大华技术股份有限公司 一种模型训练方法、装置及电子设备
CN112149535B (zh) * 2020-09-11 2023-06-27 华侨大学 一种结合SegNet和U-Net的车道线检测方法和装置
CN112052907A (zh) * 2020-09-15 2020-12-08 浙江智慧视频安防创新中心有限公司 基于图像边缘信息的目标检测方法、装置及存储介质
CN113297888A (zh) * 2020-09-18 2021-08-24 阿里巴巴集团控股有限公司 一种图像内容检测结果核查方法及装置
CN112132279B (zh) * 2020-09-23 2023-09-15 平安科技(深圳)有限公司 卷积神经网络模型压缩方法、装置、设备及存储介质
CN112183397A (zh) * 2020-09-30 2021-01-05 四川弘和通讯有限公司 基于空洞卷积神经网络的坐防护栏行为的识别方法
CN112215336B (zh) * 2020-09-30 2024-02-09 招商局金融科技有限公司 基于用户行为的数据标注方法、装置、设备及存储介质
CN112101297B (zh) * 2020-10-14 2023-05-30 杭州海康威视数字技术股份有限公司 训练数据集确定方法、行为分析方法、装置、系统及介质
CN112330550B (zh) * 2020-10-16 2023-08-08 西安工业大学 一种基于图像盲解卷积技术的图像复原方法及系统
CN112270228A (zh) * 2020-10-16 2021-01-26 西安工程大学 一种基于dcca融合特征的行人重识别方法
CN112257774B (zh) * 2020-10-20 2024-03-15 平安科技(深圳)有限公司 基于联邦学习的目标检测方法、装置、设备及存储介质
CN112733589B (zh) * 2020-10-29 2023-01-03 广西科技大学 一种基于深度学习的红外图像行人检测方法
CN112308212A (zh) * 2020-11-02 2021-02-02 佛山科学技术学院 一种基于神经网络的安防图像高清恢复方法及系统
CN112329849A (zh) * 2020-11-04 2021-02-05 中冶赛迪重庆信息技术有限公司 基于机器视觉的废钢料场卸料状态识别方法、介质及终端
CN112487911A (zh) * 2020-11-24 2021-03-12 中国信息通信科技集团有限公司 智能监控环境下基于改进yolov3的实时行人检测方法及装置
CN112507832A (zh) * 2020-11-30 2021-03-16 北京百度网讯科技有限公司 监控场景下的犬只检测方法、装置、电子设备和存储介质
CN112633074B (zh) * 2020-11-30 2024-01-30 浙江华锐捷技术有限公司 行人信息的检测方法和装置、存储介质及电子设备
CN112465786A (zh) * 2020-12-01 2021-03-09 平安科技(深圳)有限公司 模型训练方法、数据处理方法、装置、客户端及存储介质
CN112492343B (zh) * 2020-12-16 2023-11-10 浙江大华技术股份有限公司 一种视频直播监控方法及相关装置
CN112528983B (zh) * 2020-12-16 2023-12-26 国网江苏省电力有限公司检修分公司 一种暗光条件下gis隔离/接地开关视频图像采集系统
CN112597915B (zh) * 2020-12-26 2024-04-09 上海有个机器人有限公司 对室内近距离行人进行识别的方法、装置、介质和机器人
CN112733920A (zh) * 2020-12-31 2021-04-30 中国地质调查局成都地质调查中心 一种基于深度学习的图像识别方法及系统
CN112966546A (zh) * 2021-01-04 2021-06-15 航天时代飞鸿技术有限公司 一种基于无人机侦察图像的嵌入式姿态估计方法
CN112700435B (zh) * 2021-01-12 2023-04-07 华南理工大学 一种基于深度学习的墙体缺陷检测方法
CN112965081B (zh) * 2021-02-05 2023-08-01 浙江大学 基于融合行人信息的特征地图的模仿学习社交导航方法
CN112949486B (zh) * 2021-03-01 2022-05-17 八维通科技有限公司 基于神经网络的智能交通数据处理方法及装置
CN113139427A (zh) * 2021-03-12 2021-07-20 浙江智慧视频安防创新中心有限公司 基于深度学习的蒸汽管网智能监控方法、系统及设备
CN113052039B (zh) * 2021-03-16 2022-12-02 北京邮电大学 一种交通路网行人密度检测的方法、系统及服务器
CN113128563B (zh) * 2021-03-23 2023-11-17 武汉泰沃滋信息技术有限公司 一种高速工程车辆检测方法、装置、设备及存储介质
CN113067980A (zh) * 2021-03-23 2021-07-02 北京澎思科技有限公司 图像采集方法、装置、电子设备及存储介质
CN112991312B (zh) * 2021-03-29 2023-11-07 中国农业科学院果树研究所 一种基于ai深度学习的梨品种苗木鉴别方法
CN113156439B (zh) * 2021-05-08 2022-08-30 中国石油大学(华东) 一种基于数据驱动的sar风场海浪联合反演方法及系统
CN113158968A (zh) * 2021-05-10 2021-07-23 苏州大学 一种基于图像处理的嵌入式物体认知系统
CN113160062B (zh) * 2021-05-25 2023-06-06 烟台艾睿光电科技有限公司 一种红外图像目标检测方法、装置、设备及存储介质
CN113591838B (zh) * 2021-06-28 2023-08-29 北京旷视科技有限公司 目标检测方法、装置、电子设备和存储介质
CN113435336B (zh) * 2021-06-28 2022-10-04 安徽一视科技有限公司 一种基于人工智能的跑步智能计时系统及方法
CN113866571A (zh) * 2021-08-06 2021-12-31 厦门欧易奇机器人有限公司 一种局放源定位方法、装置以及设备
CN113706496B (zh) * 2021-08-23 2024-04-12 中国飞机强度研究所 一种基于深度学习模型的飞行器结构裂纹检测方法
CN113869181B (zh) * 2021-09-24 2023-05-02 电子科技大学 一种选择池化核结构的无人机目标检测方法
CN114038010A (zh) * 2021-11-05 2022-02-11 熵基科技股份有限公司 一种行人属性识别方法、设备和介质
CN114088405A (zh) * 2021-11-10 2022-02-25 中国人民解放军陆军炮兵防空兵学院 一种基于声谱图的cnn故障诊断模型的发动机故障诊断方法
CN114501329A (zh) * 2021-12-15 2022-05-13 厦门智小金智能科技有限公司 一种基于1d-cnn的室内定位模型的环境自适应训练方法及装置
CN114419330B (zh) * 2022-01-24 2024-02-09 西北大学 一种二维深度假图泛化检测方法、系统、设备及存储介质
CN114898291B (zh) * 2022-05-17 2024-02-20 国家电网有限公司 一种基于摄像头巡检路径的视觉监测方法
CN115049965A (zh) * 2022-06-29 2022-09-13 深圳市城市公共安全技术研究院有限公司 一种检测模型的训练方法、装置、电子设备及存储介质
CN115423829B (zh) * 2022-07-29 2024-03-01 江苏省水利科学研究院 一种单波段遥感影像水体快速提取方法及系统
CN115424129B (zh) * 2022-10-13 2023-08-11 哈尔滨市科佳通用机电股份有限公司 一种墙板破损的异常检测方法及检测系统
CN115493532B (zh) * 2022-11-07 2023-02-28 西安中科慧远视觉技术有限公司 测量板材表面待测量元素面积的测量系统、方法及介质
CN115482441B (zh) * 2022-11-11 2023-06-23 北京阿丘科技有限公司 训练数据筛选方法、装置及计算机可读存储介质
CN116704266B (zh) * 2023-07-28 2023-10-31 国网浙江省电力有限公司信息通信分公司 一种电力设备故障检测方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022237A (zh) * 2016-05-13 2016-10-12 电子科技大学 一种端到端的卷积神经网络的行人检测方法
CN108460407A (zh) * 2018-02-02 2018-08-28 东华大学 一种基于深度学习的行人属性精细化识别方法
CN108664838A (zh) * 2017-03-27 2018-10-16 北京中科视维文化科技有限公司 基于改进rpn深度网络的端到端的监控场景行人检测方法
CN108805070A (zh) * 2018-06-05 2018-11-13 合肥湛达智能科技有限公司 一种基于嵌入式终端的深度学习行人检测方法
US10169679B1 (en) * 2017-10-13 2019-01-01 StradVision, Inc. Learning method and learning device for adjusting parameters of CNN by using loss augmentation and testing method and testing device using the same
CN109285139A (zh) * 2018-07-23 2019-01-29 同济大学 一种基于深度学习的x射线成像焊缝检测方法
CN109284669A (zh) * 2018-08-01 2019-01-29 辽宁工业大学 基于Mask RCNN的行人检测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005520A (ja) * 2016-06-30 2018-01-11 クラリオン株式会社 物体検出装置及び物体検出方法
CN106845430A (zh) * 2017-02-06 2017-06-13 东华大学 基于加速区域卷积神经网络的行人检测与跟踪方法
CN107910061A (zh) * 2017-12-01 2018-04-13 中南大学 一种医疗数据处理方法及系统
CN108564109B (zh) * 2018-03-21 2021-08-10 天津大学 一种基于深度学习的遥感图像目标检测方法
CN108596044B (zh) * 2018-04-02 2021-05-07 中国人民解放军陆军工程大学 基于深度卷积神经网络的行人检测方法
CN109961009B (zh) * 2019-02-15 2023-10-31 平安科技(深圳)有限公司 基于深度学习的行人检测方法、系统、装置及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022237A (zh) * 2016-05-13 2016-10-12 电子科技大学 一种端到端的卷积神经网络的行人检测方法
CN108664838A (zh) * 2017-03-27 2018-10-16 北京中科视维文化科技有限公司 基于改进rpn深度网络的端到端的监控场景行人检测方法
US10169679B1 (en) * 2017-10-13 2019-01-01 StradVision, Inc. Learning method and learning device for adjusting parameters of CNN by using loss augmentation and testing method and testing device using the same
CN108460407A (zh) * 2018-02-02 2018-08-28 东华大学 一种基于深度学习的行人属性精细化识别方法
CN108805070A (zh) * 2018-06-05 2018-11-13 合肥湛达智能科技有限公司 一种基于嵌入式终端的深度学习行人检测方法
CN109285139A (zh) * 2018-07-23 2019-01-29 同济大学 一种基于深度学习的x射线成像焊缝检测方法
CN109284669A (zh) * 2018-08-01 2019-01-29 辽宁工业大学 基于Mask RCNN的行人检测方法

Also Published As

Publication number Publication date
CN109961009A (zh) 2019-07-02
WO2020164270A1 (zh) 2020-08-20

Similar Documents

Publication Publication Date Title
CN109961009B (zh) 基于深度学习的行人检测方法、系统、装置及存储介质
CN111476306B (zh) 基于人工智能的物体检测方法、装置、设备及存储介质
US10366313B2 (en) Activation layers for deep learning networks
US20210192202A1 (en) Recognizing text in image data
US9721156B2 (en) Gift card recognition using a camera
US10891465B2 (en) Methods and apparatuses for searching for target person, devices, and media
US9436883B2 (en) Collaborative text detection and recognition
CN108256479B (zh) 人脸跟踪方法和装置
US9349076B1 (en) Template-based target object detection in an image
US10534957B2 (en) Eyeball movement analysis method and device, and storage medium
US8792722B2 (en) Hand gesture detection
CN109145766B (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
US8750573B2 (en) Hand gesture detection
CN109815843B (zh) 图像处理方法及相关产品
WO2019041519A1 (zh) 目标跟踪装置、方法及计算机可读存储介质
US9639758B2 (en) Method and apparatus for processing image
US11429807B2 (en) Automated collection of machine learning training data
CN109189879B (zh) 电子书籍显示方法及装置
US20190102044A1 (en) Depth-Based Touch Detection
CN112052186B (zh) 目标检测方法、装置、设备以及存储介质
US10650234B2 (en) Eyeball movement capturing method and device, and storage medium
CN111539412B (zh) 一种基于ocr的图像分析方法、系统、设备及介质
WO2019033570A1 (zh) 嘴唇动作分析方法、装置及存储介质
WO2019033568A1 (zh) 嘴唇动作捕捉方法、装置及存储介质
CN110717407A (zh) 基于唇语密码的人脸识别方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant