CN106022237A - 一种端到端的卷积神经网络的行人检测方法 - Google Patents
一种端到端的卷积神经网络的行人检测方法 Download PDFInfo
- Publication number
- CN106022237A CN106022237A CN201610315688.1A CN201610315688A CN106022237A CN 106022237 A CN106022237 A CN 106022237A CN 201610315688 A CN201610315688 A CN 201610315688A CN 106022237 A CN106022237 A CN 106022237A
- Authority
- CN
- China
- Prior art keywords
- pedestrian detection
- convolutional neural
- layer
- pedestrian
- neural networks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种端到端的卷积神经网络的行人检测方法,用以解决现有行人检测算法检测精度不高、算法复杂和多模块融合困难等问题。采用了一种新的端到端的卷积神经网络,通过构建带有标注的训练样本集,采用端到端训练,得到一个能预测行人候选框和相应框的置信度的卷积神经网络模型。测试时,将测试图片输入训练好的模型内,即可得到相应的行人检测框和置信度。最后进行非极大值抑制和阀值筛选,得到最佳行人区域。本发明与以往发明相比,具有两大优势:一是端到端训练和测试,使整个模型训练和测试都极为容易;二是本发明通过构建候选框回归网络,解决了行人尺度和比例问题,不需要以往的发明采用的金字塔技术,极大的节约了计算资源。
Description
技术领域
本发明属于模式识别技术领域,尤其涉及一种端到端的卷积神经网络的行人检测方法。
背景技术
模式识别是人工智能和图像处理领域的一个重要交叉学科,是近年来研究热点所在。早期的任务的解决方法主要依靠人类的专业领域知识,来设计某个算法或者构建某个系统,问题解决效果受人类的知识水平所限制。随着人工智能的发展,卷积神经网络于90年代由Lecun正式提出。Hinton在2012年对原始的卷积神经网络进行了改进,在ImageNet大赛上取得了第一的成绩。从此以后,卷积神经网络开始广泛应用于计算机视觉、自然语言处理和智能搜索等领域。卷积神经网络由于其层间联系和参数共享等优势,使其广泛运用在图像处理中。
经过对现有技术的检索发现,中国专利文献号CN105335716A公开( 公告) 日2016.02.17,公开了一种基于改进UDN提取联合特征的行人检测方法,包含:图像预处理;基于卷积神经网络对预处理的图像提取人体整体特征和局部特征;对步骤整体特征和局部特征输出的类别概率进行加权得到最终概率值,根据最终概率值判断原始输入图像是否包含行人,该技术虽然实现了与以前模型相比较低的漏检率,但实际漏检率还是偏高,而且该技术并没有做到端到端的训练,必须依靠于HOG+CSS++SVM算法来获得行人的初始候选区域。该技术需要进行模块级联,使整个系统偏复杂。
发明内容
本发明的目的就在于为了解决上述问题而提供一种端到端的卷积神经网络的行人检测方法。本发明最终在加州理工测试集上实现了18.66%的漏检率。
本发明通过以下技术方案来实现上述目的:
一种端到端的卷积神经网络的行人检测方法,其包括以下步骤:
通过构建带有标注图片库作为训练样本集,直接端到端训练,得到一个能预测行人候选框和行人候选框置信度的卷积神经网络模型;
测试时,将测试图片输入卷积神经网络模型,得到相应的行人检测框和置信度;
最后进行非极大值抑制筛选,压缩重复的行人检测框;
阀值筛选,根据置信度选出最佳的行人检测框。
上述技术方案中,所述标注是指记录下行人在整张图像中的左上角点和右下角点的坐标。
上述技术方案中,所述端到端是指除了数据预处理外的所有操作,都可以包含在一个卷积神经网络的框架内。
上述技术方案中,所述的卷积神经网络模型是由16个卷积层,和一个上采样层和一个Softmax层构成,前13个卷积层按顺序依次级联,将上采样层接到第13个卷积层上,然后上采样层输出与第10个卷积层进行级联,并将级联后的特征接入到第14个卷积层上,第15个卷积层和第16个卷积层均直接连接到第14个所述卷积层上,Softmax层连接到第15个卷积层上;其中,上采样层负责对第13个卷积层进行插值放大2倍;第15个卷积层输出行人检测框包含行人的置信度,第16个卷积层输出行人检测框的位置参数,Softmax层负责对置信度进行归一化处理。
上述技术方案中,训练卷积神经网络的具体步骤如下:
A1:构建卷积神经网络;
A2:对网络进行初始化,对于18层网络架构:卷积层1到卷积层13参数finetune自ImageNet的VGG16模型,并将前4层学习率设置为0。其它层由高斯分布生成的小随机数初始化网络中待训练参数;
A3:对输入的样本图像每一点计算锚点框,并与原始的标注区域计算偏移量,将图像、图像标签和偏移量输入到网络中,进行前向传播。
A4:利用SmoothL1和SoftMaxwithLoss作为损失函数,得到误差项。使用反向传播算法,利用SGD调整网络参数,使误差项最小。
上述技术方案中,所述的非极大值抑制是指,多个互相重合的行人检测框中,按照输出的置信度,选出置信度最大的那个行人检测框,其它行人检测框舍弃。
上述技术方案中,所述的阀值选择是指,在输出的行人检测框中,选择置信度大于一定数值的行人检测框,作为最佳行人检测框。
本发明的有益效果在于:
采用了一种新的端到端的卷积神经网络,通过构建带有标注的训练样本集和端到端训练,得到一个能预测行人候选框和相应框的置信度的卷积神经网络模型。测试时,将测试图片输入训练好的模型内,即可得到相应的行人检测框和置信度。最后进行非极大值抑制和阀值筛选。本发明与以往发明相比,具有两大优势:一是端到端训练和测试,使整个模型训练测试都极为容易;二是本发明通过构建候选框回归网络,解决了行人尺度和比例问题,不需要以往的发明采用的金字塔技术,极大的节约了计算资源。本发明最终实现了较好的回召率和较低的漏检率。
附图说明
图1是本发明所述行人检测方法的流程图;
图2 为本发明所述18层网络的示意图。
具体实施方式
下面结合附图对本发明作进一步说明:
本发明中的一些术语解释如下:
术语1 :BP 算法
BP算法是一种反向传播算法,分为前向过程、反向过程两部分,其中前向过程是指将数据输入到网络中得到最终结果的过程,反向过程是指将前向过程和样本实际数值的差值作为误差,对网络权重进行更新的过程。
如图1所示,本发明通过构建带有标注图片库作为训练样本集,直接端到端训练,得到一个能预测行人候选框和相应框的置信度的卷积神经网络模型。测试时,将测试图片输入训练好的模型内,即可得到相应的行人检测框和置信度。最后进行非极大值抑制和阀值筛选。
其中,标注是指记录下行人在一整张图像中的左上角点和右下角点的坐标。
在具体操作中,采用了Caltech的训练集,不同天气情况、不同场景下,通过行车记录仪拍摄的行人照片( 包括背景),从拍摄照片中标出行人位置,通过ignore label进行训练样本选择,得到包含行人彩色图片9100 张,并做镜像变换来增大样本数量,把所得到的图像短边尺寸归一化为800,之后构建卷积神经网络,并将训练样本集送入模型进行训练。
如图2所示,卷积神经网络中的卷积层1到卷积层13串联,即Conv1-Conv13依次串联,然后将上采样层(Dconv)接到Conv13上,并将上采样层的输出和Conv10的输出级联,然后级联后的特征输入到Conv14中,卷积层15和卷积层16直接连接到卷积层14上,即将Conv15 和Conv16均直接与Conv14相连接,Softmax层直接连接到卷积层15上。其中,前13个卷积层(Conv1-Conv13)作为特征提取,上采样层负责对特征图进行放大2倍,第14个卷积层(Conv14)作为特征映射,剩余2个卷积层(Conv15 和Conv16)分别输出回归框包含行人的置信度和回归框的位置参数, Softmax层负责对置信度进行归一化调整,其中四个卷积层(Conv2 、Conv4、Conv7和Conv10)后面跟了ReLU和pool操作,其它卷积层后面跟了ReLU操作,其中pool操作的核大小为2,偏移量为2。网络参数如表1所示。
表1
构建锚点框大小为(32*32,48*48,64*64,80*80)像素和1个比较典型的行人比例(2.4)基准框,共4个基准框,具体偏移量为[-1,-15,18,32],[-11,-39,28,56],[-31,-87,48,104],[-71,-183,88,200]。
卷积神经网络训练和测试步骤:
1、样本准备,来自于caltech数据集的9000张图片并进行镜像翻转,图像插值使图像短边为800个像素点,并准备好所有图片的标注,即行人的左上角和右下角的坐标。
2、构建如图二所示的卷积神经网络的模型,参数设置如表一所示,对网络进行初始化,前四层参数finetune于ImageNet的VGG16模型,其它层用标注差为0.01的高斯分布随机初始化网络中待训练参数;
3、向初始化后的网络中输入18000个训练样本来进行训练,先对样本图像的每一个像素点赋予4个基本框,即左上点和右下点的坐标加上基本框的偏移量,然后根据基本框与标注框之间的重合比例(IOU),当大于0.5时设置标签为1,其它时候设置为0,然后进行前向传播,计算预测的置信度和标签的Softmax损失值,计算预测的框和标注框的SmoothL1损失值,使用反向传播BP算法,调整卷积神经网络参数,使SmoothL1和Softmax损失函数值和最小;
4、得到最终模型。
5、将准备好的图片输入训练模型中,图像插值使图像短边为800个像素点,即可得到行人的候选框和输出行人的候选框置信度。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围内。
Claims (7)
1.一种端到端的卷积神经网络的行人检测方法,其特征在于:
通过构建带有标注图片库作为训练样本集,直接端到端训练,得到一个能预测行人候选框和行人候选框置信度的卷积神经网络模型;
测试时,将测试图片输入卷积神经网络模型,得到相应的行人检测框和置信度;
最后进行非极大值抑制筛选,压缩重复的行人检测框;
阀值筛选,根据置信度选出最佳的行人检测框。
2.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述标注是指记录下行人在整张图像中的左上角点和右下角点的坐标。
3.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述端到端是指除了数据预处理外的所有操作,都可以包含在一个卷积神经网络的框架内。
4.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述的卷积神经网络模型是由16个卷积层,和一个上采样层和一个Softmax层构成,前13个卷积层按顺序依次级联,将上采样层接到第13个卷积层上,然后上采样层输出与第10个卷积层进行级联,并将级联后的特征接入到第14个卷积层上,第15个卷积层和第16个卷积层均直接连接到第14个所述卷积层上,Softmax层连接到第15个卷积层上;其中,上采样层负责对第13个卷积层进行插值放大2倍;第15个卷积层输出行人检测框包含行人的置信度,第16个卷积层输出行人检测框的位置参数,Softmax层负责对置信度进行归一化处理。
5.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于,训练卷积神经网络的具体步骤如下:
A1:构建卷积神经网络;
A2:对网络进行初始化,对于18层网络架构:卷积层1到卷积层13参数finetune自ImageNet的VGG16模型,并将前4层学习率设置为0;
其它层由高斯分布生成的小随机数初始化网络中待训练参数;
A3:对输入的样本图像每一点计算锚点框,并与原始的标注区域计算偏移量,将图像、图像标签和偏移量输入到网络中,进行前向传播;
A4:利用SmoothL1和SoftMaxwithLoss作为损失函数,得到误差项;
使用反向传播算法,利用SGD调整网络参数,使误差项最小。
6.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述的非极大值抑制是指,多个互相重合的行人检测框中,按照输出的置信度,选出置信度最大的那个行人检测框,其它行人检测框舍弃。
7.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述的阀值选择是指,在输出的行人检测框中,选择置信度大于一定数值的行人检测框,作为最佳行人检测框。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610315688.1A CN106022237B (zh) | 2016-05-13 | 2016-05-13 | 一种端到端的卷积神经网络的行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610315688.1A CN106022237B (zh) | 2016-05-13 | 2016-05-13 | 一种端到端的卷积神经网络的行人检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106022237A true CN106022237A (zh) | 2016-10-12 |
CN106022237B CN106022237B (zh) | 2019-07-12 |
Family
ID=57100341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610315688.1A Expired - Fee Related CN106022237B (zh) | 2016-05-13 | 2016-05-13 | 一种端到端的卷积神经网络的行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022237B (zh) |
Cited By (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529485A (zh) * | 2016-11-16 | 2017-03-22 | 北京旷视科技有限公司 | 用于获取训练数据的方法及装置 |
CN106570564A (zh) * | 2016-11-03 | 2017-04-19 | 天津大学 | 基于深度网络的多尺度行人检测方法 |
CN106682697A (zh) * | 2016-12-29 | 2017-05-17 | 华中科技大学 | 一种基于卷积神经网络的端到端物体检测方法 |
CN106686472A (zh) * | 2016-12-29 | 2017-05-17 | 华中科技大学 | 一种基于深度学习的高帧率视频生成方法及系统 |
CN106803084A (zh) * | 2017-03-02 | 2017-06-06 | 中科视拓(北京)科技有限公司 | 一种基于端到端循环网络的面部特征点定位方法 |
CN106845374A (zh) * | 2017-01-06 | 2017-06-13 | 清华大学 | 基于深度学习的行人检测方法及检测装置 |
CN106845383A (zh) * | 2017-01-16 | 2017-06-13 | 腾讯科技(上海)有限公司 | 人头检测方法和装置 |
CN107038448A (zh) * | 2017-03-01 | 2017-08-11 | 中国科学院自动化研究所 | 目标检测模型构建方法 |
CN107145900A (zh) * | 2017-04-24 | 2017-09-08 | 清华大学 | 基于一致性约束特征学习的行人再识别方法 |
CN107194418A (zh) * | 2017-05-10 | 2017-09-22 | 中国科学院合肥物质科学研究院 | 一种基于对抗特征学习的水稻蚜虫检测方法 |
CN107220618A (zh) * | 2017-05-25 | 2017-09-29 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107301376A (zh) * | 2017-05-26 | 2017-10-27 | 浙江大学 | 一种基于深度学习多层刺激的行人检测方法 |
CN107403141A (zh) * | 2017-07-05 | 2017-11-28 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107563349A (zh) * | 2017-09-21 | 2018-01-09 | 电子科技大学 | 一种基于VGGNet的人数估计方法 |
CN107563274A (zh) * | 2017-07-10 | 2018-01-09 | 安徽四创电子股份有限公司 | 一种基于对抗网络学习的视频的车辆检测方法和计数方法 |
CN107578091A (zh) * | 2017-08-30 | 2018-01-12 | 电子科技大学 | 一种基于轻量级深度网络的行人车辆实时检测方法 |
CN107742093A (zh) * | 2017-09-01 | 2018-02-27 | 国网山东省电力公司电力科学研究院 | 一种红外图像电力设备部件实时检测方法、服务器及系统 |
CN107909021A (zh) * | 2017-11-07 | 2018-04-13 | 浙江师范大学 | 一种基于单个深层卷积神经网络的路牌检测方法 |
CN108122035A (zh) * | 2016-11-29 | 2018-06-05 | 科大讯飞股份有限公司 | 端到端建模方法及系统 |
CN108229524A (zh) * | 2017-05-25 | 2018-06-29 | 北京航空航天大学 | 一种基于遥感图像的烟囱和冷凝塔检测方法 |
CN108229390A (zh) * | 2018-01-02 | 2018-06-29 | 济南中维世纪科技有限公司 | 基于深度学习的快速行人检测方法 |
CN108416250A (zh) * | 2017-02-10 | 2018-08-17 | 浙江宇视科技有限公司 | 人数统计方法及装置 |
CN108509978A (zh) * | 2018-02-28 | 2018-09-07 | 中南大学 | 基于cnn的多级特征融合的多类目标检测方法及模型 |
CN108509859A (zh) * | 2018-03-09 | 2018-09-07 | 南京邮电大学 | 一种基于深度神经网络的无重叠区域行人跟踪方法 |
CN108742679A (zh) * | 2018-06-29 | 2018-11-06 | 上海联影医疗科技有限公司 | 结节检测装置和方法 |
CN108805070A (zh) * | 2018-06-05 | 2018-11-13 | 合肥湛达智能科技有限公司 | 一种基于嵌入式终端的深度学习行人检测方法 |
CN108846344A (zh) * | 2018-06-05 | 2018-11-20 | 中南大学 | 一种融合深度学习的行人姿势多特征智能辨识方法 |
CN108846415A (zh) * | 2018-05-22 | 2018-11-20 | 长沙理工大学 | 工业分拣机器人的目标识别装置和方法 |
CN108876765A (zh) * | 2018-05-22 | 2018-11-23 | 塞伯睿机器人技术(长沙)有限公司 | 工业分拣机器人的目标定位装置和方法 |
CN108898047A (zh) * | 2018-04-27 | 2018-11-27 | 中国科学院自动化研究所 | 基于分块遮挡感知的行人检测方法及系统 |
CN108986064A (zh) * | 2017-05-31 | 2018-12-11 | 杭州海康威视数字技术股份有限公司 | 一种人流量统计方法、设备及系统 |
CN109002752A (zh) * | 2018-01-08 | 2018-12-14 | 北京图示科技发展有限公司 | 一种基于深度学习的复杂公共场景快速行人检测方法 |
CN109101859A (zh) * | 2017-06-21 | 2018-12-28 | 北京大学深圳研究生院 | 使用高斯惩罚检测图像中行人的方法 |
CN109472264A (zh) * | 2018-11-09 | 2019-03-15 | 北京字节跳动网络技术有限公司 | 用于生成物体检测模型的方法和装置 |
CN109492576A (zh) * | 2018-11-07 | 2019-03-19 | 北京旷视科技有限公司 | 图像识别方法、装置及电子设备 |
CN109558902A (zh) * | 2018-11-20 | 2019-04-02 | 成都通甲优博科技有限责任公司 | 一种快速目标检测方法 |
CN109858436A (zh) * | 2019-01-29 | 2019-06-07 | 中国科学院自动化研究所 | 基于视频动态前景掩膜的目标类别修正方法、检测方法 |
CN109886205A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研微视电子科技有限公司 | 安全带实时监测方法和系统 |
CN109886286A (zh) * | 2019-01-03 | 2019-06-14 | 武汉精测电子集团股份有限公司 | 基于级联检测器的目标检测方法、目标检测模型及系统 |
CN109961009A (zh) * | 2019-02-15 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、系统、装置及存储介质 |
CN110516529A (zh) * | 2019-07-09 | 2019-11-29 | 杭州电子科技大学 | 一种基于深度学习图像处理的投喂检测方法和系统 |
CN110507318A (zh) * | 2019-08-16 | 2019-11-29 | 武汉中旗生物医疗电子有限公司 | 一种心电信号qrs波群定位方法及装置 |
CN110598596A (zh) * | 2019-08-29 | 2019-12-20 | 深圳市中电数通智慧安全科技股份有限公司 | 一种危险行为监测方法、装置及电子设备 |
CN110807459A (zh) * | 2019-10-31 | 2020-02-18 | 深圳市捷顺科技实业股份有限公司 | 车牌矫正方法、装置以及可读存储介质 |
CN110991305A (zh) * | 2019-11-27 | 2020-04-10 | 厦门大学 | 一种遥感图像下的飞机检测方法及存储介质 |
CN111368625A (zh) * | 2019-11-08 | 2020-07-03 | 深圳北航新兴产业技术研究院 | 一种基于级联优化的行人目标检测方法 |
CN111611869A (zh) * | 2020-04-25 | 2020-09-01 | 哈尔滨理工大学 | 一种基于串行深度神经网络的端到端单目视觉避障方法 |
CN111813997A (zh) * | 2020-09-08 | 2020-10-23 | 平安国际智慧城市科技股份有限公司 | 入侵分析方法、装置、设备及存储介质 |
CN112106034A (zh) * | 2018-07-13 | 2020-12-18 | 华为技术有限公司 | 一种用于神经网络的卷积方法及装置 |
CN113688703A (zh) * | 2021-08-12 | 2021-11-23 | 上海交通大学 | 基于fpga的低延时非极大值抑制方法与装置 |
US11282389B2 (en) | 2018-02-20 | 2022-03-22 | Nortek Security & Control Llc | Pedestrian detection for vehicle driving assistance |
US11301726B2 (en) | 2018-12-29 | 2022-04-12 | Beijing Sensetime Technology Development Co., Ltd. | Anchor determination method and apparatus, electronic device, and storage medium |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187984A (zh) * | 2007-12-05 | 2008-05-28 | 北京中星微电子有限公司 | 一种图像检测方法及装置 |
US20100021010A1 (en) * | 2008-07-25 | 2010-01-28 | Gm Global Technology Operations, Inc. | System and Method for detecting pedestrians |
CN104166861A (zh) * | 2014-08-11 | 2014-11-26 | 叶茂 | 一种行人检测方法 |
CN104657724A (zh) * | 2015-03-12 | 2015-05-27 | 福建依图网络科技有限公司 | 一种交通视频行人检测方法 |
CN104881662A (zh) * | 2015-06-26 | 2015-09-02 | 北京畅景立达软件技术有限公司 | 一种单幅图像行人检测方法 |
CN105335716A (zh) * | 2015-10-29 | 2016-02-17 | 北京工业大学 | 一种基于改进udn提取联合特征的行人检测方法 |
-
2016
- 2016-05-13 CN CN201610315688.1A patent/CN106022237B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187984A (zh) * | 2007-12-05 | 2008-05-28 | 北京中星微电子有限公司 | 一种图像检测方法及装置 |
US20100021010A1 (en) * | 2008-07-25 | 2010-01-28 | Gm Global Technology Operations, Inc. | System and Method for detecting pedestrians |
CN104166861A (zh) * | 2014-08-11 | 2014-11-26 | 叶茂 | 一种行人检测方法 |
CN104657724A (zh) * | 2015-03-12 | 2015-05-27 | 福建依图网络科技有限公司 | 一种交通视频行人检测方法 |
CN104881662A (zh) * | 2015-06-26 | 2015-09-02 | 北京畅景立达软件技术有限公司 | 一种单幅图像行人检测方法 |
CN105335716A (zh) * | 2015-10-29 | 2016-02-17 | 北京工业大学 | 一种基于改进udn提取联合特征的行人检测方法 |
Cited By (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570564B (zh) * | 2016-11-03 | 2019-05-28 | 天津大学 | 基于深度网络的多尺度行人检测方法 |
CN106570564A (zh) * | 2016-11-03 | 2017-04-19 | 天津大学 | 基于深度网络的多尺度行人检测方法 |
CN106529485A (zh) * | 2016-11-16 | 2017-03-22 | 北京旷视科技有限公司 | 用于获取训练数据的方法及装置 |
CN108122035A (zh) * | 2016-11-29 | 2018-06-05 | 科大讯飞股份有限公司 | 端到端建模方法及系统 |
CN108122035B (zh) * | 2016-11-29 | 2019-10-18 | 科大讯飞股份有限公司 | 端到端建模方法及系统 |
CN106682697A (zh) * | 2016-12-29 | 2017-05-17 | 华中科技大学 | 一种基于卷积神经网络的端到端物体检测方法 |
CN106686472B (zh) * | 2016-12-29 | 2019-04-26 | 华中科技大学 | 一种基于深度学习的高帧率视频生成方法及系统 |
CN106686472A (zh) * | 2016-12-29 | 2017-05-17 | 华中科技大学 | 一种基于深度学习的高帧率视频生成方法及系统 |
CN106682697B (zh) * | 2016-12-29 | 2020-04-14 | 华中科技大学 | 一种基于卷积神经网络的端到端物体检测方法 |
CN106845374A (zh) * | 2017-01-06 | 2017-06-13 | 清华大学 | 基于深度学习的行人检测方法及检测装置 |
CN106845374B (zh) * | 2017-01-06 | 2020-03-27 | 清华大学 | 基于深度学习的行人检测方法及检测装置 |
CN106845383A (zh) * | 2017-01-16 | 2017-06-13 | 腾讯科技(上海)有限公司 | 人头检测方法和装置 |
CN108416250A (zh) * | 2017-02-10 | 2018-08-17 | 浙江宇视科技有限公司 | 人数统计方法及装置 |
CN108416250B (zh) * | 2017-02-10 | 2021-06-22 | 浙江宇视科技有限公司 | 人数统计方法及装置 |
CN107038448A (zh) * | 2017-03-01 | 2017-08-11 | 中国科学院自动化研究所 | 目标检测模型构建方法 |
CN107038448B (zh) * | 2017-03-01 | 2020-02-28 | 中科视语(北京)科技有限公司 | 目标检测模型构建方法 |
CN106803084A (zh) * | 2017-03-02 | 2017-06-06 | 中科视拓(北京)科技有限公司 | 一种基于端到端循环网络的面部特征点定位方法 |
CN106803084B (zh) * | 2017-03-02 | 2020-08-07 | 中科视拓(北京)科技有限公司 | 一种基于端到端循环网络的面部特征点定位方法 |
CN107145900B (zh) * | 2017-04-24 | 2019-07-26 | 清华大学 | 基于一致性约束特征学习的行人再识别方法 |
CN107145900A (zh) * | 2017-04-24 | 2017-09-08 | 清华大学 | 基于一致性约束特征学习的行人再识别方法 |
CN107194418B (zh) * | 2017-05-10 | 2021-09-28 | 中国科学院合肥物质科学研究院 | 一种基于对抗特征学习的水稻蚜虫检测方法 |
CN107194418A (zh) * | 2017-05-10 | 2017-09-22 | 中国科学院合肥物质科学研究院 | 一种基于对抗特征学习的水稻蚜虫检测方法 |
CN108229524A (zh) * | 2017-05-25 | 2018-06-29 | 北京航空航天大学 | 一种基于遥感图像的烟囱和冷凝塔检测方法 |
CN107220618B (zh) * | 2017-05-25 | 2019-12-24 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107220618A (zh) * | 2017-05-25 | 2017-09-29 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107301376A (zh) * | 2017-05-26 | 2017-10-27 | 浙江大学 | 一种基于深度学习多层刺激的行人检测方法 |
CN107301376B (zh) * | 2017-05-26 | 2021-04-13 | 浙江大学 | 一种基于深度学习多层刺激的行人检测方法 |
CN108986064A (zh) * | 2017-05-31 | 2018-12-11 | 杭州海康威视数字技术股份有限公司 | 一种人流量统计方法、设备及系统 |
CN109101859A (zh) * | 2017-06-21 | 2018-12-28 | 北京大学深圳研究生院 | 使用高斯惩罚检测图像中行人的方法 |
CN107403141A (zh) * | 2017-07-05 | 2017-11-28 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107563274A (zh) * | 2017-07-10 | 2018-01-09 | 安徽四创电子股份有限公司 | 一种基于对抗网络学习的视频的车辆检测方法和计数方法 |
CN107578091B (zh) * | 2017-08-30 | 2021-02-05 | 电子科技大学 | 一种基于轻量级深度网络的行人车辆实时检测方法 |
CN107578091A (zh) * | 2017-08-30 | 2018-01-12 | 电子科技大学 | 一种基于轻量级深度网络的行人车辆实时检测方法 |
CN107742093A (zh) * | 2017-09-01 | 2018-02-27 | 国网山东省电力公司电力科学研究院 | 一种红外图像电力设备部件实时检测方法、服务器及系统 |
CN107742093B (zh) * | 2017-09-01 | 2020-05-05 | 国网山东省电力公司电力科学研究院 | 一种红外图像电力设备部件实时检测方法、服务器及系统 |
CN107563349A (zh) * | 2017-09-21 | 2018-01-09 | 电子科技大学 | 一种基于VGGNet的人数估计方法 |
CN107909021A (zh) * | 2017-11-07 | 2018-04-13 | 浙江师范大学 | 一种基于单个深层卷积神经网络的路牌检测方法 |
CN108229390A (zh) * | 2018-01-02 | 2018-06-29 | 济南中维世纪科技有限公司 | 基于深度学习的快速行人检测方法 |
CN109002752A (zh) * | 2018-01-08 | 2018-12-14 | 北京图示科技发展有限公司 | 一种基于深度学习的复杂公共场景快速行人检测方法 |
US11282389B2 (en) | 2018-02-20 | 2022-03-22 | Nortek Security & Control Llc | Pedestrian detection for vehicle driving assistance |
CN108509978A (zh) * | 2018-02-28 | 2018-09-07 | 中南大学 | 基于cnn的多级特征融合的多类目标检测方法及模型 |
CN108509859A (zh) * | 2018-03-09 | 2018-09-07 | 南京邮电大学 | 一种基于深度神经网络的无重叠区域行人跟踪方法 |
CN108898047A (zh) * | 2018-04-27 | 2018-11-27 | 中国科学院自动化研究所 | 基于分块遮挡感知的行人检测方法及系统 |
CN108898047B (zh) * | 2018-04-27 | 2021-03-19 | 中国科学院自动化研究所 | 基于分块遮挡感知的行人检测方法及系统 |
CN108846415A (zh) * | 2018-05-22 | 2018-11-20 | 长沙理工大学 | 工业分拣机器人的目标识别装置和方法 |
CN108876765A (zh) * | 2018-05-22 | 2018-11-23 | 塞伯睿机器人技术(长沙)有限公司 | 工业分拣机器人的目标定位装置和方法 |
CN108846344A (zh) * | 2018-06-05 | 2018-11-20 | 中南大学 | 一种融合深度学习的行人姿势多特征智能辨识方法 |
CN108846344B (zh) * | 2018-06-05 | 2022-05-17 | 中南大学 | 一种融合深度学习的行人姿势多特征智能辨识方法 |
CN108805070A (zh) * | 2018-06-05 | 2018-11-13 | 合肥湛达智能科技有限公司 | 一种基于嵌入式终端的深度学习行人检测方法 |
CN108742679A (zh) * | 2018-06-29 | 2018-11-06 | 上海联影医疗科技有限公司 | 结节检测装置和方法 |
CN112106034B (zh) * | 2018-07-13 | 2024-05-24 | 华为技术有限公司 | 一种用于神经网络的卷积方法及装置 |
CN112106034A (zh) * | 2018-07-13 | 2020-12-18 | 华为技术有限公司 | 一种用于神经网络的卷积方法及装置 |
CN109492576A (zh) * | 2018-11-07 | 2019-03-19 | 北京旷视科技有限公司 | 图像识别方法、装置及电子设备 |
CN109472264B (zh) * | 2018-11-09 | 2020-10-27 | 北京字节跳动网络技术有限公司 | 用于生成物体检测模型的方法和装置 |
CN109472264A (zh) * | 2018-11-09 | 2019-03-15 | 北京字节跳动网络技术有限公司 | 用于生成物体检测模型的方法和装置 |
CN109558902A (zh) * | 2018-11-20 | 2019-04-02 | 成都通甲优博科技有限责任公司 | 一种快速目标检测方法 |
US11301726B2 (en) | 2018-12-29 | 2022-04-12 | Beijing Sensetime Technology Development Co., Ltd. | Anchor determination method and apparatus, electronic device, and storage medium |
CN109886286A (zh) * | 2019-01-03 | 2019-06-14 | 武汉精测电子集团股份有限公司 | 基于级联检测器的目标检测方法、目标检测模型及系统 |
CN109858436A (zh) * | 2019-01-29 | 2019-06-07 | 中国科学院自动化研究所 | 基于视频动态前景掩膜的目标类别修正方法、检测方法 |
WO2020164270A1 (zh) * | 2019-02-15 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、系统、装置及存储介质 |
CN109961009B (zh) * | 2019-02-15 | 2023-10-31 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、系统、装置及存储介质 |
CN109961009A (zh) * | 2019-02-15 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、系统、装置及存储介质 |
CN109886205A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研微视电子科技有限公司 | 安全带实时监测方法和系统 |
CN109886205B (zh) * | 2019-02-25 | 2023-08-08 | 苏州清研微视电子科技有限公司 | 安全带实时监测方法和系统 |
CN110516529A (zh) * | 2019-07-09 | 2019-11-29 | 杭州电子科技大学 | 一种基于深度学习图像处理的投喂检测方法和系统 |
CN110507318A (zh) * | 2019-08-16 | 2019-11-29 | 武汉中旗生物医疗电子有限公司 | 一种心电信号qrs波群定位方法及装置 |
CN110598596A (zh) * | 2019-08-29 | 2019-12-20 | 深圳市中电数通智慧安全科技股份有限公司 | 一种危险行为监测方法、装置及电子设备 |
CN110807459B (zh) * | 2019-10-31 | 2022-06-17 | 深圳市捷顺科技实业股份有限公司 | 车牌矫正方法、装置以及可读存储介质 |
CN110807459A (zh) * | 2019-10-31 | 2020-02-18 | 深圳市捷顺科技实业股份有限公司 | 车牌矫正方法、装置以及可读存储介质 |
CN111368625A (zh) * | 2019-11-08 | 2020-07-03 | 深圳北航新兴产业技术研究院 | 一种基于级联优化的行人目标检测方法 |
CN111368625B (zh) * | 2019-11-08 | 2024-02-27 | 深圳北航新兴产业技术研究院 | 一种基于级联优化的行人目标检测方法 |
CN110991305A (zh) * | 2019-11-27 | 2020-04-10 | 厦门大学 | 一种遥感图像下的飞机检测方法及存储介质 |
CN110991305B (zh) * | 2019-11-27 | 2023-04-07 | 厦门大学 | 一种遥感图像下的飞机检测方法及存储介质 |
CN111611869B (zh) * | 2020-04-25 | 2021-06-01 | 哈尔滨理工大学 | 一种基于串行深度神经网络的端到端单目视觉避障方法 |
CN111611869A (zh) * | 2020-04-25 | 2020-09-01 | 哈尔滨理工大学 | 一种基于串行深度神经网络的端到端单目视觉避障方法 |
CN111813997A (zh) * | 2020-09-08 | 2020-10-23 | 平安国际智慧城市科技股份有限公司 | 入侵分析方法、装置、设备及存储介质 |
CN113688703A (zh) * | 2021-08-12 | 2021-11-23 | 上海交通大学 | 基于fpga的低延时非极大值抑制方法与装置 |
CN113688703B (zh) * | 2021-08-12 | 2023-11-03 | 上海交通大学 | 基于fpga的低延时非极大值抑制方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106022237B (zh) | 2019-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022237A (zh) | 一种端到端的卷积神经网络的行人检测方法 | |
CN109711413B (zh) | 基于深度学习的图像语义分割方法 | |
Hossain et al. | Crowd counting using scale-aware attention networks | |
CN108320297B (zh) | 一种视频目标实时跟踪方法及系统 | |
CN109359519B (zh) | 一种基于深度学习的视频异常行为检测方法 | |
CN106875406B (zh) | 图像引导的视频语义对象分割方法及装置 | |
CN109241982B (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN108537824B (zh) | 基于交替反卷积与卷积的特征图增强的网络结构优化方法 | |
CN109670405B (zh) | 一种基于深度学习的复杂背景行人检测方法 | |
Wang et al. | Context modulated dynamic networks for actor and action video segmentation with language queries | |
CN108399380A (zh) | 一种基于三维卷积和Faster RCNN的视频动作检测方法 | |
CN111898432B (zh) | 一种基于改进YOLOv3算法的行人检测系统及方法 | |
CN113344932B (zh) | 一种半监督的单目标视频分割方法 | |
CN111127416A (zh) | 基于计算机视觉的混凝土结构表面缺陷自动检测方法 | |
CN111008633B (zh) | 一种基于注意力机制的车牌字符分割方法 | |
CN111401293B (zh) | 一种基于Head轻量化Mask Scoring R-CNN的手势识别方法 | |
CN110705412A (zh) | 一种基于运动历史图像的视频目标检测方法 | |
CN113076871A (zh) | 一种基于目标遮挡补偿的鱼群自动检测方法 | |
CN114092487A (zh) | 目标果实实例分割方法及系统 | |
CN107247952B (zh) | 基于深层监督的循环卷积神经网络的视觉显著性检测方法 | |
CN112686276A (zh) | 一种基于改进RetinaNet网络的火焰检测方法 | |
CN116109947A (zh) | 一种基于大核等效卷积注意力机制的无人机图像目标检测方法 | |
CN110852199A (zh) | 一种基于双帧编码解码模型的前景提取方法 | |
CN108428238A (zh) | 一种基于深度网络的多类型任务通用的检测方法 | |
CN107871315B (zh) | 一种视频图像运动检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190712 Termination date: 20200513 |
|
CF01 | Termination of patent right due to non-payment of annual fee |